국내 연구진이 트위터 등 SNS(소셜네트워크서비스)에 나도는 루머의 진위여부를 가려낼 수 있는 기술을 개발했다.
KAIST 문화기술대학원 차미영 교수와 권세정 연구원, 서울대 및 마이크로소프트 아시아 연구소 공동 연구진은 트위터 내에서 광범위하게 전파되는 정보의 진위 여부를 90%까지 정확하게 구분해낼 수 있는 기술을 개발했다고 9일 밝혔다.
연구진은 2006년에서 2009년 사이, 미국 트위터에서 광범위하게 전파된 100여 개의 사건 사고를 표현한 트윗 1백만 건 이상을 수집해 분석했다. 100여 개의 사건 사고에는 정치IT.건강.연예인 등 다양한 분야가 포함됐다. 트위터에서 관련 사건 사고를 표시한 글의 사실 여부를 조사, 거짓인 글의 특성을 찾아낸 것이다.
연구팀이 루머로 구분한 사례 중에는 미국 대선 당시 버락 오바마 대통령 후보가 무슬림이며 반기독교적 성향이 있고 미국 시민권을 부당 취득했다는 내용 등 그를 음해하는 사례, 또 영화배우 니콜 키드먼이 성전환 수술을 했으며 그녀가 양성애자라고 언급한 사례 등이 포함됐다.
사례 조사를 통해 연구팀은 일반 정보의 전파와는 확연히 다른 루머 전파의 특징을 세 가지로 분류했다. 우선 루머는 일반 정보와는 달리 지속적으로 전파되는 경향을 보인다. 뉴스와 같은 일반 정보의 경우 한 번의 광범위한 전파 이후 미디어 내에서 거의 언급되지 않지만 루머는 수년간의 긴 기간 동안 지속적으로 언급된다. 둘째로 루머의 전파는 서로 연관이 없는 임의 사용자들의 산발적인 참여로 이뤄진다. 일반 정보는 온라인 내의 친구관계를 통해 전파 되지만 루머는 연결되지 않은 개개인의 참여로 이루어지는 특징을 보였다. 아울러 루머는 인지도가 낮은 사용자들로부터 시작돼 유명인에게로 전파됐는데 이 현상은 연예인이나 정치인과 관련된 루머에서 주로 관찰됐다.
마지막으로 루머는 일반 정보와 다른 언어적 특성을 보였다. 루머는 정보의 진위 여부를 의심.부정.유추하는 심리학적 과정과 연관된 단어인 '아니다', '사실일지는 모르겠지만', '확실치는 않지만', '내 생각에는' 등의 사용이 월등히 높게 나타났다.
차 교수는 "루머의 특성을 풍부한 데이터를 통해 도출했다"며 "루머 전파 극초기에 해당 정보의 진위여부를 판별하는 것은 아직 어렵지만 일정시간 경과 혹은 정보확산이 이루어질 경우 해당 빅데이터를 기반으로 하여 진위여부를 판단하는 것이 가능하다"고 밝혔다. 연구결과는 지난해 12월 미국 텍사스주에서 열린 데이터마이닝 분야 최고 학술대회인 'IEEE 데이터마이닝' 국제 회의에서 발표됐다.
[원호섭 기자]
[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]
기사에 대해 의견을 남겨주세요.