2020 대한민국 소셜 미디어 벤치마크 리포트 1탄 격인 SBX(Social Media Benchmark Index), 2탄인 SVX(Share of Voice Index)에 이어, SM2Networks는 소셜 버즈 데이터를 중심으로 한 상관관계 분석(Correlation Analysis)을 시행했습니다. 앞선 보고서들이 국내 주요 브랜드들의 평균 SNS 성과, 혹은 온라인상 브랜드 버즈 점유율에 집중했다면 이번 리포트는 상관관계에 대한 통계적 분석을 통해 소셜 버즈 데이터의 유의미한 관측치를 얻어내는 것을 목표로 삼았습니다.
예를 들어, 한류스타를 모델로 기용해 대대적 온라인 해시태그 캠페인을 진행했다면, 캠페인 버즈와 브랜드 버즈는 일반적으로 양의 상관관계를 그릴 것이라 쉽게 추측할 수 있겠죠. 하지만 ‘한류스타를 통한 캠페인 버즈와 사이트 트래픽간 양의 상관관계는 매번 나타나는 것일까?’, ‘캠페인 버즈량과 제품 검색량, 캠페인 버즈량과 매출의 상관관계는 어떨까?’와 같은 물음은 단순한 사고로는 추측이 불가능합니다. 수치적이며 통계적인 조사가 선행되어야 하죠.
본 리포트는 가장 일반적으로 통용되는 Pearson 상관계수를 활용하여 소셜 버즈간의 관계성을 밝혀냈습니다. 주요 산업군 버즈간 상관계수, 그리고 Owned SNS Posts와 Consumer Buzz(Earned)간 상관계수, 이 두 유형의 변수를 가지고 조사하였으며, 가능한 한 심플한 분석대상을 설정해 리포트의 가독 편의성을 높였습니다.
참고로, ‘상관계수가 높다’는 사실은 ‘두 변수가 시계열적으로 유의미한 방향과 강도를 지니고 있다’, 즉 추가적인 탐구와 조사가 진행되어 볼 가치가 있으나 인과관계와는 상이하다는 점을 유념해 주시길 바라며 리포트를 시작합니다.
Methodology
‘상관분석’은 간단히 말해 변수 X와 Y가 얼마나 관련되어 있는지를 수치로 나타내기 위한 통계분석입니다. 이때 이 관련성을 나타내는 계수를 상관계수(R)라고 통칭하며, 이 상관계수(R)는 두 변수가 완전히 동일할 경우 +1, 완전히 다를 경우 0, 반대 방향으로 동일할 경우 -1의 값을 나타냅니다. 즉, 상관계수의 절댓값이 클수록 관련성이 높고 작을수록 낮은 관련성을 가지고 있다고 말할 수 있습니다. 이때 양수와 음수가 의미하는 바는 바로 각각 비례와 반비례입니다. 변수 X와 Y의 상관계수가 0 이상이라면 두 변수는 양의 상관관계를 지녀 비례하는 형국, X가 증가하면 Y도 증가하는 모양새를 보입니다. 반대로 X와 Y의 상관계수가 0보다 작다면, X가 증가할 시 Y가 감소하는 음의 상관관계를 나타내겠죠. 유의할 점은 앞서 밝혔듯, 이 상관계수는 단순히 선형관계일 뿐 변수간 서로가 서로에게 인과성을 지니는 인과관계를 나타내지는 못한다는 점입니다. 상관도의 정도는 [0~0.1은 거의 관련성이 없음, 0.1~0.3은 약한 관련성이 있음, 0.3~0.7은 어느 정도 관련성이 있음, 0.7~1.0은 강한 관련성을 가지고 있음]의 네 가지 영역으로 분류할 수 있습니다. 그러니 예를 들어 사과와 배의 버즈량 상관성을 분석한 결과 0.7의 상관계수가 나타났다면, 사과와 배는 꽤 강한 관련성을 지닌 채 버즈량이 비례관계에 놓여 있다고 말할 수 있습니다.
Comments