자신만의 톤으로 차분하게 의견을 전하는 사람. 그런 사람을 들어 '말 잘하는 사람'이라고 한다. 반면 감정 없이 책을 읽듯 말하거나 목소리 톤이 일관되지 않으면 '말을 못 한다'고 한다. 결국 얼마나 말을 잘하는 지는 언어의 전달력을 높이는 요소들, 목소리 톤과 말투, 표정에 달려있는 셈이다.
16일 IT업계에 따르면 그동안 인공지능(AI)이 높은 수준의 지능을 갖추고도 가상인간보다는 기계 취급을 받아왔던 이유도 여기에 있다. 문자를 소리로 읽어 주긴 하지만, 사람의 표정이나 뉘앙스를 따라 할 수 없어 활용에 제약이 있었던 것. 네오사피엔스는 이런 한계를 뛰어넘으며 주목받는 AI 스타트업이다. 최근 256억원 규모의 시리즈B 투자 유치에 성공하며 기술력과 확장성을 인정받았다.
김태수 네오사피엔스 대표는 "콘텐츠가 비즈니스의 중심이 되는 시대가 오면서 신테틱 미디어(Synthetic Media)에 대한 관심이 높아지고 있다"며 "크리에이터 이코노미 시장 규모가 104조원에 달하는 만큼 함께 기술력만 뒷받침된다면 빠른 속도로 성장할 수 있다"고 말했다.
신테틱 미디어는 'AI 제너레이티드 미디어', '딥페이크' 등으로 불리는 AI 기술 기반 콘텐츠다. 이미지 합성과 음성 합성 등의 기술을 이용해 사람의 말과 행동을 모방, 실존 인물처럼 느끼게 한다. 구글 등 미국 기술 기업을 중심으로 개발에 집중하는 분야다.
네오사피엔스 로고
김 대표는 음성 전문 엔지니어다. KAIST(한국과학기술원)에서 주변 소리 분석으로 박사학위를 받았다. 졸업 후 LG전자에서 통화 시 주변 소음을 제거하는 기능을 구현했다. 퀄컴에서는 버튼을 누르지 않고 이름을 불러 깨어나게 하는 '스냅드래곤 보이스 액티베이션' 개발에 참여했다. 이는 마이크로소프트의 음성비서인 코타나에 적용됐고, 이후 이 기술이 대중화 돼 시리, 알렉사 등에서 접할 수 있는 기술이 됐다.그는 "2016년 건강이 안 좋아지면서 내가 죽으면 내 묘비에 어떤 말이 쓰일까 생각하게 됐다"며 "세상을 바꿀 수 있는 임팩트를 가진 기술을 개발하고 싶어 창업했다"고 설명했다.
지난 2017년 김 대표는 퀄컴에서 함께 일했던 동료, KAIST 연구실 후배와 함께 네오사피엔스를 창업했다.
국내 신테틱 미디어 대표 주자로 꼽히는 네오사피엔스는 AI 연기자로 음성과 영상 콘텐츠를 만들어주는 '타입캐스트' 서비스를 운영 중이다. 지난해 유료가입자가 전년 대비 4배 늘고 결제액은 5배 늘었다. 누적 가입자는 최근 100만명을 돌파했다.
김 대표는 "가상인간이 등장하면서 신테틱 미디어도 주목을 받는 분위기"라며 "현재 가상인간의 한계는 대역 연기자가 필요하다는 건데 우리는 기획자가 쓴 텍스트와 클릭 몇 번으로 대역 연기자 없이 가상인간을 구현하는 게 목표"라고 말했다.
[자료 제공 = 네오사피엔스]
네오사피엔스는 현재 모바일 예능프로그램 SNL코리아의 주현영 인턴기자를 본뜬 AI의 쇼케이스를 준비 중이다. 네오사피엔스가 가진 기술력을 총동원해 만든 AI 예능인을 대중 앞에 처음 선보이는 것. 앞서 네오사피엔스는 한국어로 말하는 트럼프 전 미국 대통령을 만들어 주목받은 바 있다.그는 "주기자는 당황했을 때 파르르 떠는 게 포인트로 이러한 디테일까지 구현해낼 예정"이라며 "감정적인 디테일을 보완해 콘텐츠로서의 재미와 기술로서의 가치를 높일 것"이라고 설명했다.
한편 네오사피엔스는 이번 투자금을 활용해 기술과 서비스를 고도화, 해외 진출도 노린다는 방침이다. 김 대표는 "우리 팀의 강점은 AI 원천기술을 보유하고 있고 고객 피드백을 기반으로 제품을 개발하는 앤드투앤드 풀 서클을 갖추고 있다는 것"이라며 "기술을 모르는 사람도 활용할 수 있는 쉬운 제품, 디테일이 다른 완성도 높은 제품으로 글로벌 시장을 공략할 것"이라고 밝혔다.
[배윤경 매경닷컴 기자]
[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]
기사에 대해 의견을 남겨주세요.