‘1대 1202
이세돌은 혼자이고, 저들은 1202이다. 인공지능 바둑 프로그램 알파고에 탑재된 1202개 컴퓨터 중앙처리장치(CPU)를 말하는 것이다. 알파고는 총 1202개 CPU, 176개 그래픽처리장치(GPU)를 탑재하고 1000대 서버를 활용하는 시스템으로 움직인다. CPU 한 대당 1초에 1000회 이상 시뮬레이션을 한다. 서버는 여러 대가 하나의 네트워크로 연결돼 분산 처리하는 방식(클러스터)을 따른다. 인텔과 엔비디아 부품을 썼지만 최종 구현을 위한 설계는 딥마인드가 직접 했다. 대기업 연구소에서나 볼 수 있는 ‘슈퍼 컴퓨터와 맞먹는 성능이다. 알파고가 천년의 기보를 외운 것도 이 덕분이다. 이세돌 9단은 프로와 준 프로 바둑기사를 합쳐 모두 1202명의 협업 플레이를 상대하고 있다고 보면 된다.
주요 글로벌 IT기업이나 명문 사학에서도 바둑 프로그램을 만들지만 그 수준은 아마츄어를 넘지 못한다. 이들과 알파고의 근본적 차이는 배우는 시간의 차이다. 네이처에 발표된 논문에 따르면 감독 학습에 의한 고수의 ‘다음 수 맞히기 학습과정에서 알파고는 55% 정확도를 보였다. 이것에 동원된 문제가 3000만 개라고 하니, 따져보면 250수짜리 대국을 첫 수부터 맞히기로 했다면 이미 12만 판에 대한 학습을 마친 것이다. 대국 한판을 20분에 끝내는 셈인데 하루 종일 대국을 둔다면 72판 대국을 둔다. 판후이와 경기를 치르고 5개월 동안 이세돌 9단과 대국을 준비하면서 알파고는 1만800건을 기존 12만판에 더했다. 추가된 부분만 인간 프로기사 1년 이상 대국 횟수에 버금간다. 알파고 초기 CPU는 48개였다. 이때도 방대한 양의 기보를 외우고 다른 인공지능 바둑 프로그램과 500번 이상 실력 겨루기를 마친 후였다. 하사비스는 지난 8일 간담회에서 알파고는 크레이지스톤, 젠 등 다른 바둑 프로그램과 4수나 접어두고 경기를 할 때도 승률 75% 이상을 기록했다”고 자랑했다. 물론 대등한 위치에서 경기를 하면 승률은 99.8%로 오른다.
인간과 대결을 준비하면서는 컴퓨팅 파워를 획기적으로 늘렸다. 1900개 CPU를 달아봤는데, 오히려 계산 능력이 떨어졌다. 수많은 시행착오를 거쳐 1202이라는 최적의 숫자가 나왔다. 지난해 10월 판후이 2단을 완패시킨, 그리고 지금 이세돌 9단을 궁지로 몰아넣고 있는 지금의 알파고다. 알파고는 바둑판 위에서 1초당 10만개 수를 고려한다. 그게 평균 1~2분 정도 걸린다. 바둑을 두는 사람보다 월등히 빠르다.
176개 GPU도 괴물 알파고를 만든 중요 요소다. 데이비드 실버 구글 딥마인드 개발총책임은 이를 알파고 브레인이라고까지 했다. CPU에 GPU를 함께 구성하면 CPU만 탑재한 것보다 수십배 연산 속도가 빨라지고 발열도 적다. GPU 기능은 구글이 앞서 있는데, 아마도 알파고 CPU 능력을 폭발적으로 향상시켰을 것이다.
딥마인드 팀이 알파고를 데려왔지만 실물로 데려온 것은 아니다. 모든 인프라는 미국 서부 마운틴뷰 구글 데이터센터에 마련돼 있다. 알파고는 ‘구글 클라우드 플랫폼을 통해 서울 대국장 랩탑과 모니터에 연결됐다. 구글 관계자는 세계 어디에 가더라도 하드웨어를 가져갈 필요가 없다”며 한국에선 인터넷 인프라가 잘 작동하는지만 확인했다”고 말했다.
구글 딥마인드는 알파고 작동 원리를 설명하긴 했지만 세부적 기술은 철저히 비밀에 부쳤다. 감동근 아주대 전자공학과 교수는 알파고 논문에는 알맹이가 빠져있다”며 알파고 인공지능을 작동시키는 정책망과 신경망을 어떤 식으로 연결했는지 재현이 불가능하다”고 말했다. 감 교수는 알파고 알고리즘은 구글만이 알고 있을 것”이라며 판후이과 대결했던 지난해 10월에 비해 얼마나 더 진화했는지, 어떤 알고리즘이 추가됐는지 우리는 알 수 없다”고 덧붙였다.
[원호섭 기자 / 이경진 기자]
[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]