경제
삼성 AI 번역 기술, 글로벌 경진대회서 잇따라 1위 `쾌거`
입력 2020-08-14 14:52 
DCASE 경진대회에 참가한 폴란드 연구소팀. [사진 출처 = 삼성전자 뉴스룸]

삼성전자의 인공지능(AI) 번역 기술이 각종 글로벌 경진대회에서 잇따라 성과를 내고 있다.
14일 삼성전자 뉴스룸에 따르면 삼성전자 세트 부문 선행 연구개발(R&D) 조직인 삼성리서치 산하 폴란드연구소와 베이징연구소는 지난달 구술 언어 번역 국제워크숍(IWSLT)에 참가해 두 개의 개별 과제에서 1위를 차지했다.
IWSLT는 올해 자연어 처리 분야 최고 수준의 국제학술대회인 전산언어학협회(ACL) 콘퍼런스에 포함돼 권위를 인정받은 워크숍이다.
폴란드연구소는 이번 워크숍에서 영어로 된 테드 강연을 독일어로 번역하는 과제를 수행해 '오디오-텍스트 번역' 부문 1위에 올랐다.

연구소는 입력된 음성을 곧바로 번역하는 엔드 투 엔드(E2E) 시스템을 사용해 여러 단계를 거칠 때 발생할 수 있는 오류를 줄였다.
E2E 음성 번역 시스템은 아직 연구 기간도 3년에 불과하고 주목도 덜한 방식이다. 폴란드연구소는 E2E 시스템을 사용해 전통적 방식을 능가하는 성과를 내며 음성 번역 연구의 선두 주자로 떠올랐다.
더불어 폴란드연구소는 국제전기전자공학회(IEEE)가 개최한 DCASE 2020 경진대회에서 기술을 선도하는 팀으로 인정받기도 했다. DCASE는 첨단 AI 기술을 활용해 오디오 신호를 이해·해석하는 것을 목표로 하는 대회다.
CVPR 경진대회에 참가한 북경연구소팀. [사진 출처 = 삼성전자 뉴스룸]
베이징연구소는 일본어와 중국어 간 번역 능력을 평가하는 '오픈 도메인 번역' 부문에서 우승했다.
채택한 방식은 대형 번역 모델 설계를 기반으로 한 '상대적 위치 어텐션'으로 사전 데이터 처리의 정교함을 높여 번역의 정확도를 끌어올렸다.
뿐만 아니라 바이트 페어 인코딩(Byte Pair Encoding)을 통해 단어를 의미 있는 단위로 쪼갠 결과물과, 문장을 구성한 조각들을 비교했다. 신경망 기계 번역(NMT) 성능을 향상시키기 위해 단일 언어 말뭉치를 본래 언어로 역번역하는 과정도 포함됐다.
이 밖에도 폴란드연구소는 국제전기전자공학회(IEEE)가 지난달 개최한 DCASE 2020에 참가해 정상적인 샘플 사이에서 이례적인 소리를 감지하는 과제에서 2위를 차지했다.
이에 앞서 베이징연구소도 지난 6월 컴퓨터 비전 분야 학회 CVPR 2020에서 3개 부문 2위를 차지했다.
삼성리서치는 전 세계 13개국에 15개의 연구소와 7개의 글로벌 AI 센터를 두고 있다.
[김승한 기자 winone@mkinternet.com]

[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]


MBN APP 다운로드