서울시장 선거가 종반을 향해 갈수록 각 후보 간의 경쟁이 점점 더 치열해지고 있습니다. 이번 서울시장 선거는 유례가 없을 정도의 네거티브 전략이 난무하고 있는 가운데.. 각 언론사에서 발표한 여론조사 결과도 오차범위 내에서 초박빙 승부를 보여주고 있네요.

이번 선거에 또 다른 의미를 두자면.. 트위터 등 SNS의 민심을 분석하는 작업입니다. 트위터 등 SNS가 확산됨에 따라 자신의 의견을 표현하는 분들이 점점 더 늘어나고 있고, 기존 여론조사처럼 표본을 뽑아서 조사하는 것이 아니라 특정 이슈에 대해 트위터 의견 전체를 분석하는 작업이 진행 중입니다. 흔히 이야기하는 '빅데이터'를 분석하는 것이죠.

국내에도 여러 업체가 빅데이터 분석에 뛰어들었습니다. 특히 이번 서울시장 선거는 짧은 시간에 수 많은 트윗이 쏟아져 나오고 대중의 관심이 집중되기 때문에 소셜분석에 있어서는 중요한 시험대가 될 전망입니다.

지난 글에서 소개해드린 것처럼 제가 일하고 있는 유저스토리랩의 트윗믹스도 트위터에서 본 서울시장선거 페이지를 만들어 트위터 내 의견을 실시간으로 분석하고 있습니다. 트윗믹스 외에도 다음소프트의 소셜매트릭스그루터의 씨날이 트위터 분석 서비스를 내놓았습니다. 국내 트위터 이용자가 400만명을 넘어섰고 앞으로도 꾸준한 성장이 예상되기 때문에, 표본이 아닌 트위터 전체 여론을 분석하는 소셜분석 서비스는 점점 더 각광을 받을 것으로 예상합니다.

저는 소셜분석에 대해 여러가지를 고민하면서 한글로 작성된 트윗 전체를 분석하는 것이 어느 정도의 정확성을 보이고, 사람들이 궁금한 점을 충족시켜 줄 것인가에 대한 고민이 많습니다. 

과연 전체 트윗을 분석할 수 있을까? 트윗 전체를 분석해서 호/불호, 찬성/반대 등을 정확하게 뽑아낼 수 있을까요?

어제는 한나라당 나경원 후보에 여러 가지 의혹이 제기되면서 트윗 내에 나경원 후보가 언급된 횟수가 정말 많았습니다. 전체 건수로 보면 박원순 후보에 비해 두 배 가까이 많더군요.

아래는 소셜매트릭스에서 본 화면인데.. 이것만 보면 트위터에서 나경원 후보가 대세로 느낄 수도 있을 것 같습니다.


<소셜매트릭스>

트윗믹스에서도 트윗건수를 보면 나경원 후보가 압도적인데, 실제로 트윗에 많이 공유된 내용을 살펴보면 결과가 다릅니다. 나경원 후보를 언급하면서 반대하는 여론이 지배적이라는 것이죠. 이는 각 후보를 언급할 때 포함되어 있는 링크가 얼마나 많이 공유되었는지를 통해 확인할 수 있는데.. 가장 많이 공유된 링크는 여기입니다. 나경원 후보를 언급하고 있지만.. 실제로는 부정적인 의미로 많이 언급되고 있다는 것입니다. 즉, 언급이 많이 되었다고 좋은 것만 아니고.. 한국어 특유의 비꼬는 말투 등으로 인해 특정 문구를 분석해서 '긍정/부정'을 해석하기가 애매하다는 점입니다.

트윗믹스는 특정 키워드에 대한 전체 트윗을 수집해서 추세를 살펴보긴 하지만, 많이 공유된 링크가 무엇이고 얼마나 공유되었는지를 통해 트위터 내 여론을 더 정확하게 읽어낼 수 있다고 생각합니다. 링크가 포함된 트윗은 전체 트윗 중 10~15% 정도지만.. 링크가 포함된 트윗을 리트윗(RT)하는 경우가 압도적으로 많습니다. 리트윗된 트윗이 많을수록 특정 링크(신문기사, 블로그 등)에 대한 관심이 많다는 것이고.. 링크의 내용을 보면 긍정/부정을 바로 알 수가 있습니다.

물론 링크가 포함되지 않은 트윗을 제대로 분석하기 위한 노력도 계속되어야 합니다. 제 생각엔 트위터 공유 버튼이 웹페이지와 모바일앱에 계속 보급될수록 링크 포함 트윗은 점점 늘어나기 때문에.. 사람들의 의도를 정확하게 읽을 수 있는 링크 포함 트윗 분석을 메인으로 하면서 전체 트윗 분석을 통해 추세를 살피는 것이 효과적일 것 같습니다.

한가지 더. 기업 입장에서 보면 트위터 내 영향력자가 어떤 생각을 하고 있는지 파악하는 것도 중요합니다. 400만명이 넘는 이용자의 생각을 모두 분석하는 것이 비효율적이고, 영향력자가 다른 사람에게 끼치는 영향도 크기 때문에.. 트위터 영향력자는 특정 이슈에 대해 어떻게 이야기하고 있는지도 잘 분석해야 할 것 같습니다. 특히 수많은 사람들과 모두 트위터를 통해 소통하는 것은 불가능하므로, 우선 소통해야 할 대상과 그 분들의 생각을 분석하는 것이 중요할 것 같습니다.

이번 서울시장 선거가 지나면 소셜분석 서비스도 많은 것을 배울 것으로 예상되는데, 유저스토리랩을 포함해서 다른 분석 서비스도 좀 더 정확하고 유의미한 소셜 분석으로 업그레이드되길 기대해 봅니다. 모 방송사에서 3600명 표본으로 여론조사를 했는데, 다른 곳에 비해 표본 수가 2~5배가 많아서 신뢰도가 높다고 하더군요. 트위터 소셜분석 서비스는 최소한 100만명을 대상으로 하는데.. 이용자들이 자발적으로 올린 글을 잘 분석한다면 기존 여론조사가 필요없을지도 모르겠군요. 소셜분석 서비스의 내년 모습이 기대됩니다.^^

 

PS> 트윗믹스에서 제공하는 서울시장선거 페이지를 쉽게 접속할 수 있도록 홈페이지/블로그용 배너를 만들었습니다. 서울시장선거가 며칠 남지 않았지만.. 다른 분들에게도 객관적인 트위터 여론을 알려주실 분은 배너를 달아주시면 감사하겠습니다. 제 블로그 사이드바에도 달았어요.


이 글에 대한 의견을 페이스북 댓글로 남겨주세요!!!