2016년 3월, 딥마인드의 알파고(AlphaGo)가 딥러닝 기반의 학습 능력을 무기로 세계 최고의 바둑기사 이세돌을 4대1로 꺾으며 충격을 던져준 지도 벌써 8년이 지났다. 그간 딥러닝 기술은 비약적인 성장을 보이며 과학기술과 산업 분야의 곳곳을 장악했다. 사람 수준의 기계번역, 시스템이 차량을 제어하는 레벨3 자율주행, 신약개발연구를 지원하는 단백질 예측 모델까지, 인공지능은 딥러닝 이전과 이후로 나뉜다고 할 정도로 딥러닝은 인공지능의 확산에 큰 역할을 해왔으며 지금도 빠르게 발전하고 있다. 최근 발간된 미국 스탠퍼드대학 인간중심인공지능연구소(HAI)의 AI 인덱스 연간 보고서에 따르면 인공지능은 2021년을 기점으로 성숙기술로 도약했으며, 딥러닝을 발판으로 다음 단계로 진입하고 있다고 한다. 그것은 바로 '학습하는 인공지능'에서 '창조하는 인공지능'으로의 진화이다.
'창조하는 인공지능'의 발판으로서 딥러닝의 미래는 가짜데이터를 생성하는 딥페이크(Deepfakes)와 이를 탐지하는 안티스푸핑(Anti-spoofing), 제로샷 러닝(Zero-shot learning, 데이터 없이도 학습하는 인공지능) 등의 키워드로 설명할 수 있다. 이 키워드들은 지난 2021년 KISTI에서 미래기술 위크시그널(Weak Signal)로 선정한 것으로, 이들의 공통점은 실제로 존재하지 않는 것을 만들어 내거나, 구별하거나 학습한다는 것이다. 그리고 그 바탕에는 보통 딥페이크로 대표되는 생성적 적대 신경망(GAN, Generative Adversarial Network)이라는 딥러닝 알고리즘이 있다. 딥페이크는 최근 대표적인 악용 사례가 된 가짜뉴스, 디지털 성범죄 영상 등 사회적 문제를 촉발하기도 했지만 다른 한편으로는 영화, 엔터테인먼트 분야의 고품질·고해상도 합성 영상, 디지털 휴먼 기반의 가상 모델, 가상 인플루언서 등 여러 분야에서 긍정적으로 활용되고 있다.
한편 미래 딥러닝 기술이 가진 창조 능력이 더욱 기여할 분야는 과학기술과 산업 분야 인공지능을 위한 '데이터 증강'이 될 것으로 보인다. 최근 딥페이크 기반 데이터 증강 관련 전 세계 특허가 빠르게 증가(5년간 135%)하고 있고, MIT도 '인공지능을 위한 합성데이터'를 2022년 10대 기술로 선정하며 주목했는데, 그 이유는 데이터의 확보가 인공지능 성능의 핵심이자 가장 어려운 부분이기 때문이다. 특히, 데이터의 절대량이 부족한 의료영상데이터나 프라이버시 측면에서 활용이 어려운 개인정보 기반 인공지능의 경우, 딥러닝 과정에서 데이터 부족으로 '차원의 저주'에 빠질 수 있다. 그러나 딥페이크 기술은 값싸고(데이터 획득 비용 절감), 빠르고(획득과 라벨링 시간 절약), 정확하게(목표에 맞는 데이터 합성) 학습데이터를 생성하여 활용할 수 있게 해준다. 이렇게 딥페이크 기술은 인공지능의 '데이터 병목'을 해결해주어 관련 산업의 비즈니스 기회를 폭발적으로 증가하게 해줄 것으로 기대된다.
딥러닝의 미래, 창조하는 인공지능이 가져올 과학과 산업에서의 눈부신 발전을 온전히 향유하기 위해서는 딥페이크의 악용, 인공지능의 편향성과 불투명성 등 기술의 부정적 영향을 미리 내다보고 대응방안을 마련하는 것이 중요하다. 그러나 기술 발전 이후 이에 대한 규제를 만드는 것으로는 언제나 한발 늦는 법이다. 따라서 기술과 제도 양 측면에서 미래를 대비하는 균형 있는 정책 마련이 중요하다. 한국은 세계 6위의 AI 국가(스탠퍼드대 보고서 기준)로 인재풀과 잠재력은 충분하지만 깊이 있는 학술연구와 AI 기업에 대한 민간 투자가 상대적으로 부족한 것으로 평가받고 있다. 인공지능 학술연구에서 수월성을 추구하고, AI 기업에 대한 투자 활성화 방안을 마련하는 등 글로벌 AI 주도권을 강화하기 위한 균형 있는 정책이 필요한 시점이다.
[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]