정치
국정 운영의 포인트, 빅데이터는 알고 있다
입력 2017-05-17 16:15 

빅데이터는 지난 대선에서 당선자 예측 뿐 아니라 일부 후보의 경우 득표률까지 정확하게 예측하면서 선거결과를 예측하는 가늠자 역할을 했다. 선거 결과 예측에 있어 빅데이터의 중요성에 대한 정치권과 유권자의 인식은 높아졌지만, 선거가 끝났다고 빅데이터 역할이 끝난 것은 아니다.
빅데이터 안에는 민심의 방향을 읽는 단서가 있고, 검색어 상관관계를 통해 유권자들의 기대와 걱정을 함께 파악할 수 있기 때문에 이를 국정운영의 포인트로 삼는다면 성공가능성이 그만큼 높아진다. 기업 마케팅은 물론이고 모든 생활 영역에서 활용되는 빅데이터를 국정운영에도 적극적으로 이용할 필요가 있다는 것이다.
구글 트렌드로 대표되는 빅데이터를 해석하는 데는 많은 주의와 추가 작업이 필요하지만, 적절한 분석기법을 활용하면 국정을 이끌어 가는데 꼭 참고해야 할 숨어있는 부분들을 찾아낼 수 있다.
문재인 대통령(검색 기간 당시 대선 후보)은 다른 후보에 비해 '공약' 이라는 단어와 매우 높은 상관(.803)을 보였다. 이는 많은 유권자들이 '문재인'을 검색할 때 '공약'을 압도적으로 많이 검색했다는 것을 의미하는 것으로, 당시 문 후보 공약이 유권자들의 관심을 불러일으키는 데 성공했다고 볼 수 있다. 상관관계 계수는 -1에서 1사이로 정(正)적 상관(positive correlation)은 플러스(+), 부(負)적 상관(negative correlation)은 마이너스(-)로 표시된다. 절대값 1에 가까울수록 높은 상관을 나타내고 0에 가까울수록 무상관에 가깝다.

공약과 후보간 상관관계는 문 대통령에 이어 유승민(.565), 홍준표(.485), 안철수(.432), 심상정(.214) 후보 순으로 나타났다. 유승민 후보의 경우 지지율은 낮았지만 선거기간 동안 공약 만큼은 유권자들의 호응과 관심을 얻었음을 수치로 확인할 수 있다.
이번 선거에서 관심이 매우 높았던 또 다른 이슈는 '일자리'였다. 이 역시 구글 트렌드를 분석해보면 문재인 대통령이 이슈를 선점하고 이끌어갔음을 알 수 있다. 문 대통령과 일자리 상관은 (.415)로 타 후보들에 비해 높았다.
결국 '공약'과 '일자리' 이슈를 문재인 대통령이 다른 대선 후보들보다 유권자들에게 더 효과적으로 전달했다고 해석할 수 있다.
이밖에 '토론'의 경우 심상정 후보가 독보적인 수치(.641)를 보여 TV토론의 승자임을 확인했고, 안철수 후보는 '기대'(.432)와 관련해 높은 수치를 보였다.
그렇다면, 지난 대선 기간 문재인 대통령과 상관이 낮았던 검색어는 어떤 것들이었을까?
대표적인 단어는 바로 '국방'(-.070)과 '사드'(-.304)였다. 향후 심층 분석이 필요하긴 하지만, 과거 구글 트렌드를 통한 분석을 토대로 보면 약점으로 작용할 수도 있는 부분이다. 또한, '경제'(.207), '대기업'(.278) 검색어 역시 타 후보에 비해 상관관계가 높지 않았다.
물론 모든 분야에서 높은 상관관계 기대하는 것은 '슈퍼맨 대통령'을 요구하는 것일 수 있다. 그리고 검색어와의 상관관계가 각 후보의 강점과 약점이라고 단언할 수도 없다.
하지만 '공약'과 '일자리'에 대한 이슈 선점으로 대선에서 승리한 만큼 이 부분을 정책으로 잘 연결시키면서, 상관이 높지 않은 분야에 대해서도 향후 국민들의 눈높이에 맞는 방향으로 국정을 운영한다면 국민들의 지지가 더 높아질 것으로 예상할 수 있다.
문재인 대통령은 지난 11일 아베 신조 일본 총리와 통화하면서 위안부 문제의 재협상이 필요하다는 의지를 밝혔다. 또 지난 12일에는 인천공항을 찾아 "임기내에 비정규직 제로시대를 이루겠다"고 선언했다. 문 대통령의 이같은 행보 이후 지난 12일부터 15일 오전까지 문 대통령과 관련된 검색어 상관에 변화가 나타나기 시작했다. 대선 기간 부적 상관이었던 위안부(.074), 비정규직(-.255)의 상관이 각각 (0.297) (0.294)로 상승했다는 점이다. 이같은 결과를 보면 위안부 재협상과 비정규직 제로 시대 발언이 국민들의 부정적 인식을 긍정적으로 돌려놓았다는 해석이 가능하다.
빅데이터는 박근혜 전 대통령의 운명도 어느 정도 예상했다.
데이터 분석기법의 하나인 구조방정식 모델을 바탕으로 2012년 대선 당시 박 전 대통령과 검색어를 분석한 결과 부정적 요인으로 가장 높은 비중을 차지한 것이 '소통없는 권위주의'(0.82) 였다. 그 뒤를 잇는 부정요인은 '서민의 삶 이해 부족'(0.74), '역사의식 문제'(0.74)였다.
반면 긍정요인으로는 '경제발전에 대한 기대'(0.94)와 '최초 여성 대통령'(0.84), '박정희 대통령의 딸'(0.78) 등이 꼽혔다.
실제로 박 전 대통령은 빅데이터가 지적한 약점인 '불통'으로 인해 재임 기간 내내 국정 운영 등에서 어려움을 겪었고, 결국 탄핵이라는 비극적 운명을 맞았다. 빅데이터를 활용해 약점을 보완하려 노력했다면 결과는 달라질 수도 있었을 것이다.
새 대통령과 정부가 선거와 정치를 넘어, 국정운영에 있어서도 빅데이터를 활용할 여지가 있음을 암시하는 대표적인 사례다.
[우종필 세종대 빅데이터 MBA 주임교수 / 도움 = 이윤재 기자 / 김정범 기자]

[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]


MBN APP 다운로드