인공지능(AI) 기술이 급속도로 발전하면서 사람들과 자연스러운 대화를 나누는 AI 서비스가 나오고 있지만 사람의 말을 온전히 이해하지는 못하는 한계가 지적되고 있다.
페이스북 AI 연구소는 AI가 거리로 나와 실제 사회와 상호작용을 통해 '인텔리전스(지성)'을 습득하는 기술을 연구하고 있다고 최근 밝혔다. 페이스북은 사람과 너무 흡사해 놀라움을 안겼던 '구글 듀플렉스(Duplex)'가 자연스럽게 이야기하는 것처럼 보이지만 의미를 이해하지 못한 채 사람을 흉내내는 것이라고 지적한 바 있다. 앞서 구글 듀플렉스에게 기자들이 고의로 엉뚱한 대답을 내놓자 그 뜻을 파악하지 못해 전혀 대응하지 못한 모습을 보였기 때문이다. 페이스북 AI 연구소는 다른 사람과 교제를 하며 말을 배움으로써 단어의 의미를 이해하고 말을 이해할 수 있다는 입장이다.
페이스북 AI 연구소는 이와 관련한 논문을 발표하고 길거리에서 관광객을 안내해주는 '토크 더 워크(Talk the Walk)’라는 교육 모델을 소개했다. 논문에 따르면 AI가 거리에 나와 실제 사회와 상호작용을 통해 지능을 습득하는 기법을 보여주고 있으며, 두 개의 AI(에이전트)를 생성하는데 첫 번째 AI는 '가이드 에이전트'이고, 두 번째 AI는 '관광객 에이전트'며 두 AI는 서로 떨어져 있다.
실험에서 두 에이전트는 뉴욕 시내에서 대화를 나누게 되는데 가이드는 지도를 보며 목적지를 파악할 수 있지만 관광객의 위치를 모른다. 반면 관광객은 지도를 볼 수는 없지만 자신이 처한 곳의 사방 풍경을 보고 말할 수 있다. 가이드는 길을 잃은 관광객과 대화를 통해 관광객이 가고자 하는 목적지에 갈 수 있도록 유도해준다. 연구팀은 실험을 위해 지도를 생성 후 카메라를 통해 거리를 에이전트에게 보여줬다. 가이드와 관광객은 정보들을 단서로 대화를 해 길 안내를 한다.
페이스북 AI 연구팀은 가이드 에이전트의 길 안내 정확도는 88.33%로 실제 사람이 안내했을 때 정확도 76.64%를 넘어선다고 발표했다. 다만 이런 높은 정확도는 인간의 말이 아닌 특별한 언어모델(Emergent Communication)을 사용한 것이다. 이번 연구는 AI가 불완전한 커뮤니케이션 도구인 사람의 언어를 정확하게 이해하기 위해서는 사람들이 그러한 것처럼 실제 환경 속에서 언어를 배울 필요가 있음을 보여준다.
페이스북 AI 연구소는 세 가지 측면에서 로봇을 교육하는데, 로봇이 각각의 교육을 통해 학습한 것을 토대로 추론함으로써 질문에 대한 답을 찾을 수 있게 하는 것이 목표로 하고 있다. 첫 번째 교육은 로봇이 가상 환경에서 물건을 보고 단어의 의미를 학습하게 하는 ▲'언어 기초교육(Language Grounding)', 두 번째 교육은 로봇이 집안에서 지정된 위치로 이동하게 하는 ▲'비주얼 내비게이션(Visual Navigation)', 마지막은 로봇이 어떤 질문을 받으면 집안을 돌아다니며 그 답을 알아내도록 하는 '임바디드QA(Embodied QA)' 등이다.
페이스북의 지능형 로봇 개발은 지금까지의 AI 개발 방식을 탈피한 것으로 가상 환경에서 AI를 교육하고 복잡한 작업을 스스로 배워 나가게 할 계획이다.
[디지털뉴스국 김제이 기자]
[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]
기사에 대해 의견을 남겨주세요.