"홍대와 가로수길 여성의류 판매를 보면 가로수길 매장이 더 비싼데 잘팔립니다. 카드 매출을 분석해보니 홍대에서는 여성들의 카드 사용이 많은 반면 가로수길에서는 남성들의 카드 결제가 많았습니다. 여자친구에게 선물하기 위해서인 것이죠. 즉 가로수길에서는 싸다고 팔리는 게 아니라는 통찰을 얻을 수 있습니다."
23일 부산 벡스코에서 열린 '빅데이터 월드 컨벤션(BWC) 2014'에서 최재원 다음소프트 이사는 빅데이터 분석을 통해 의미있는 결과를 얻으려면 이같은 데이터 필터링이 필요하다고 밝혔다.
현재 빅데이터 분석이 가장 잘 활용되는 분야 중 하나가 바로 유통업계다. 롯데, 신세계 등 유통업계 강자들은 유동인구 파악 등 상권 분석에 빅데이터를 폭넓게 도입하고 있다. 그러나 부모나 남편, 남자친구 등 타인 명의의 카드를 사용하는 경우는 빅데이터 분석에 있어 오류를 불러일으킨다. 구매 주체와 결제 주체가 다르기 때문이다.
빅데이터로 의미있는 맥락을 집어내려면 이같은 '노이즈'를 잘 제거해야 한다고 최 이사는 강조했다. 그는 "이동통신에 기반해 유동인구를 측정할 때도 현재 기지국 단위 측정은 정확한 동선을 파악하지 못하는 한계가 있다"며 "빅데이터 분석에도 질로 평가받는 기술이 필요하다"고 말했다.
다음소프트는 이를 극복하기 위해 기계적인 필터링에 사람을 통한 필터링을 결합한 '다이나믹 필터링'을 제안했다. 최 이사는 "류현진 선수의 경기날 방송 프로그램을 모니터링해보면 모든 프로그램에 류현진이 연관 프로그램으로 나온다"며 "그렇다고 류현진을 제거하면 놓치는 데이터가 있을지 우려가 되기 때문에 빅데이터 분석가가 한번 더 필터링하는 방법을 택하고 있다"고 말했다.
[부산 = 김용영 매경닷컴 기자]
[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]
기사에 대해 의견을 남겨주세요.