'최강의 인공지능' 알파고가 가진 치명적 약점 2가지

중앙일보

입력

업데이트

기사 이미지

알파고와 이세돌의 승부

이세돌 9단, 불계패했다고 낙심할 것 없다. 알파고는 겉보기엔 기계지만, 사실 인간이다. 피도 눈물도 없이 바둑판만 들여다보는 최강의 두뇌를 가진 인간이다. 하지만 인간이기에 분명한 약점이 존재한다.

일단 약점을 알기 전에 알파고가 왜 인간인지, 알파고의 뇌가 어떻게 작동하는지부터 보자.

1. 스타가 된 알파고의 이전 직업

알파고가 지금은 언론의 주목을 받는 스타가 됐지만, 사실 그 전엔 허드렛일을 하는 짐꾼이나 마찬가지였다. 가수 허각이 에어컨수리를 하다 스타가 된 것에 비견될 만하다.

알파고의 인공 지능이 바둑 기사로 데뷔하기 전 먼저 한 일은 사진을 구분하는 일이었다. 알파고는 강아지ㆍ고양이의 사진을 구분하고, 자동차ㆍ배를 구분하는 인공 지능과 작동 방식이 같다.

기사 이미지

[사진 = 구글이미지]

사람은 강아지와 고양이를 보면 순식간에 판별한다. 그러나 컴퓨터는 이건 일단 이런 모양을 가졌고, 이런 특징이 있고, 그 특징 중에 또 이런 특징을 더 갖고 있고…이런 과정을 거쳐 답을 내놓는다.

2. 알파고의 두뇌는 2개

이렇게만 보면 알파고란 작자가 그리 똑똑해 보이지는 않는다. 바둑 한판의 경우의 수는
1,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000. 우주 원자의 수보다 많다. 알파고가 아무리 두뇌 회전이 빨라도 이걸 다 계산하는 건 무리다.

기사 이미지

[사진 = 구글이미지]

그래서 장착한 게 2개의 두뇌다. 이 두뇌는 그냥 무식하게 계산만 하는 예전 바둑 인공지능과 달리 생각을 한다. 그렇기에 두렵다.

첫번째 뇌는 다음 수를 어디에 둘지만 생각한다. 어려운 말로 정책 네트워크라고 한다. 일단 알파고는 인간이 둔 바둑을 기반으로 한다. 바둑대국네트워크인 KGS에 저장된 고수들의 바둑의 수 3000만개를 외웠다.

기사 이미지

[사진 = 구글이미지]

인간의 기보로 학습했으니 알파고의 수가 인간처럼 보이는 것이다. 이 두뇌는 57%의 확률로 인간 고수의 선택을 예측한다. 57%밖에 안 된다고 안도할 수 없다. 알파고가 선택한 나머지 43%는 인간이 둔 수보다 나을 가능성이 높다.

이걸 다 학습해놓고 난 뒤엔 자기 자신과 대국하기 시작한다. 그래서 이긴 자기 자신과 또 붙고, 또 붙고, 또 붙어서 점점 강해진다. 일단 이 두뇌만으로도 현존하는 최강의 바둑 프로그램을 이기는 아마 고수 수준이다.

기사 이미지

[사진 = 구글이미지]

그런데 이 두뇌의 문제점은 수가 무한한 바둑에 적용될 때, 너무 오래 걸린다는 것. 그래서 장착한 게 다른 하나의 두뇌다.

두번째 뇌는 이길지 질지를 판단하는 뇌다. 어려운 말로 가치 네트워크라고 한다. 두터움ㆍ맛 같은 바둑의 추상적 개념은 모른다. 딱 하나만 목표로 삼는다, 승리. 한 놈만 잡고 패는 게 제일 무서운 법이다.

실로 놀라운 점은 승리 하나만 바라보는데도 인간의 직관을 빼다 박았다는 것. 고수들은 경험에 기반을 두어 바둑판 전체의 형세를 한눈에 읽고 직관적인 수를 찾아낸다. 이 두뇌 역시 무수한 시뮬레이션을 기반으로 승률을 파악해 다음 수에 적용한다. 형세를 한눈에 굽어보는 고수의 직관을 장착한 것이나 다름없다.

간략히 말하면 첫번째 뇌는 고수들이 둔 바둑을 학습해 다음 수만 생각하고(정책 네트워크), 두번째 뇌는 형세를 읽어서 승리에 가까운 쪽을 택한다(가치 네트워크).

3. 고전기법 몬테카를로

몬테카를로 시뮬레이션은 모든 인공지능이 거의 다 쓰는 방식이다. 이름은 그럴 듯해 보이지만 더할 나위 없이 단순하다.

서울에서 부산까지 가는 가장 빠른 길을 찾는다고 치자. 사람이라면 경부고속도로를 바로 떠올릴 것이다. 하지만 몬테카를로 시뮬레이션은 서울에서 부산까지 가는 모든 길의 걸리는 시간을 다 따져본 뒤 가장 빠른 길을 택한다. 컴퓨터의 엄청난 처리 속도가 있기에 강력해진 방법이다.

기사 이미지

[사진 = 구글이미지]

알파고도 이 방식을 써서 경우의 수를 찾는다. 다만 두 개의 두뇌가 바삐 생각해 무한한 경우의 수 중 가장 그럴듯한 수만 찾아낸다. 이 때문에 알파고의 실력은 단숨에 프로 수준까지 올라간다.

뛰어난 인공지능이지만, 태생적으로 생길 수 있는 약점 2가지가 있다. 작은 틈새지만 공략하면 승산이 보일 수 있다.

기사 이미지

알파고의 눈물

1. 알파고의 기반은 인간이 둔 기보. 3000만개의 패턴이 다 다르지만, 어느 정도 유사한 면을 보이기 마련이다. 알파고가 자체 학습을 통해 실력을 키워왔지만, 그 바탕은 인간이다. 따라서 알파고는 평범한 수순을 따른 바둑보다 변칙적인 휘둘림에 약점을 보일 수 있다.

2. 대마의 생사를 결정하는 위험한 수는 알파고에게도 부담이다. 알파고의 연산 능력은 무한하지만, 대국은 시간의 제약이 있다. 알파고는 생각하는 시간을 단축시키기 위해 반상 위 19×19 모든 곳을 고려하기보다 상대방이 이전에 둔 곳을 중심으로 사고하는 것으로 알려진다. 따라서 반상 위 모든 곳을 고려해야 하는 수를 둔다면 착오할 수 있다.

이세돌 9단과 알파고의 1국에서 알파고가 둔 몇 번의 실수는, 어쩌면 보는 그대로 실수일 수 있다. 이세돌 9단이 초반 매우 변칙적인 수를 뒀던 것이 효과를 나타냈을 가능성이 있다는 말이다.

물론 변칙적인 수 때문에 초반 형세가 불리해졌고, 이것이 결국 승패에 영향을 미쳤지만, 알파고의 특징을 고려할 때 시도는 나쁘지 않았던 것으로 보인다. 이미 알파고는 판후이와의 대국에서도 몇 차례 실수를 한 적이 있다.

기사 이미지

들소 같은 알파고 때려잡을 이세돌 [사진 = 구글이미지]

하지만 한편으로 알파고는 승리를 향해 뒤도 안 돌아보고 달려가는 들소 같은 인공지능이다. 압도적으로 이기는 것이 아니라 그냥 이기면 되는 것이 목표다. 그래서 승리할 것으로 보이는 여러 수 중 둔 곳이 하필 사람이 보기엔 실수였을 수 있다. 인간은 한 수 한 수에 일희일비하지만 알파고는 최종 승리 여부만 따지니까. 이것이 꺼림칙한 지점이다.

이번 대국은 어쩌면 인류가 바둑으로 인공지능을 이길 수 있는 마지막 기회다. 이세돌은 인공지능에게 진 첫번째 기사가 아니라, 인공지능에게 마지막 승리를 거둔 기사로 역사에 남을지 모른다. 알파고가 아마고수 수준의 유럽챔피언 판후이를 꺾은 뒤 5개월 만에 프로 최고 수준으로 성장한 걸 보면 말이다.

이세돌은 사실, 인류의 마지막 희망이다.

※참고ㆍ도움말
‘Mastering the game of Go with deep neural networks and tree search’(Nature): 알파고 인공지능의 기반이 된 논문
구글 공식 블로그(https://googleblog.blogspot.kom)
서울대 로봇연구소 T-Robotics 블로그(http://t-robotics.blogspot.kr)
게임엔진개발자 Dan Maas 블로그(https://www.dcine.com/)
김명완 9단의 알파고-판후이 대국 해설 영상
(https://www.youtube.com/watch?v=NHRHUHW6HQE)
허지행 CERN 펠로우(물리학 박사)

이정봉 기자 mole@joongang.co.kr

ADVERTISEMENT
ADVERTISEMENT