모두의 알파고

모두의 알파고
이동헌
donghun2014@gmail.com

시작하면서
• 많은 분들이 “알파고”를 더 잘 이해하시는데 도움이 되고자
• 최대한 노력했습니다
• 피드백 환영합니다
• 스스로가 다음에 해당된다면,
• 컴퓨터 프로그래머
• 빅데이터 전문가
• 딥러닝 전문가
• 강화학습 전문가
• 이미 다 알고계신 내용일수도 있습니다
3/14/2016 모두의 알파고 © 2016 이동헌 2

목차
• 알파고 약력 등 인적사항
• 알파고 – 이세돌9단의 대국
• 알파고 본체의 정체와 대국 실상
• 알파고 소프트웨어의 정체
• 알파고는 어떻게 훈련되었나?
• 알파고는 (당연하지만) 사람이 아닙니다
• 알파고의 무엇이 새로운 것인가요?
3/14/2016 모두의 알파고 © 2016 이동헌 3

목차
3/14/2016 모두의 알파고 © 2016 이동헌 4

알파고 약력
• 출생
• 2014~2015년경, Google Deepmind 회사, 알파고 팀
• 컴퓨터와의 전적
• 2015년 기준 5종의 유명 바둑 프로그램들을 상대로 495전 494승
• 세계 최초 기록
• 프로 바둑기사 상대로 호선바둑 공식전 승리 (5경기 모두 승리)
• 프로 바둑기사 9단 상대로 호선바둑 공식전 중 1경기 이상 승리 (진행중)
• 호선바둑: 접바둑이 아닌, 맞바둑의 공식용어입니다
3/14/2016 모두의 알파고 © 2016 이동헌 5

알파고 팀
• 제작진 16명
• 제작 1팀: Aja Huang, George van den Driessche, Ioannis Antonoglou, Marc
Lanctot, Arthur Guez, Thore Graepel, David Silver
• 제작 2팀: Chris J. Maddison, Arthur Guez, Laurent Sifre, Aja Huang, Ioannis
Antonoglou, Veda Panneershelvam, Sander Dieleman, Dominik Grewe, Nal
Kalchbrenner, Ilya Sutskever, Koray Kavukcuoglu, David Silver
• 평가팀 Julian Schrittwieser, John Nham, Aja Huang, David Silver
• 관리팀
• David Silver, Madeleine Leach, Timothy Lillicrap, Thore Graepel, Koray
Kavukcuoglu, Demis Hassabis
3/14/2016 모두의 알파고 © 2016 이동헌 6

목차
3/14/2016 모두의 알파고 © 2016 이동헌 7

알파고 – 이세돌9단의 대국
• 총 5번, 서울에서 시합 예정
• 3월 9, 10, 12, 13, 15일
• 중국 프로바둑 제도를 그대로 가져옴
• 호선바둑 (맞바둑), 흑 7집반 공제
• 시간은 조금 여유있게
• 2시간, 1분 초읽기 3회
3/14/2016 모두의 알파고 © 2016 이동헌 8

알파고 – 이세돌9단의 대국 전망 (경기전)
• 한국
• 이세돌 9단 본인: 승리 예측
• 전문가 여론: 첫 경기 승리 예측에는 대개 동의, 다음 경기들은 알 수 없음
• 일반 여론: 이세돌 9단의 승리 예측
• 외국
• 트위터 계정 비공인투표 50:50 [링크]
• 비트코인 도박사이트 이세돌 9단 승리에 51.7% (가중투표치) [링크]
• 독일 웹사이트 이세돌 9단 승리에 69.7% [링크]
3/14/2016 모두의 알파고 © 2016 이동헌 9

목차
3/14/2016 모두의 알파고 © 2016 이동헌 10

알파고의 정체?
3/14/2016 모두의 알파고 © 2016 이동헌 11

알파고의 정체?
• 이 사진에는 알파고 본체가 없습니다
Aja Huang
이세돌 9단
알파고 화면
(화상통화)
3/14/2016 모두의 알파고 © 2016 이동헌 12

알파고 본체 기계의 정체
• 2015년 기준
• CPU 1202개, GPU 176개
• 참고로,
• 가정용 PC 1대 = CPU 1개
• 게임용 1대 = CPU 1개+GPU 1개
3/14/2016 모두의 알파고 © 2016 이동헌 13

알파고 본체 기계의 정체
• 2015년 기준
• CPU 1202개, GPU 176개
• 참고로,
• 가정용 PC 1대 = CPU 1개
• 게임용 1대 = CPU 1개+GPU 1개
• 이번 이세돌9단 경기에는
• “미국 중서부지역에 있는
구글 데이터센터”
• 예를 들면
• 자세한 컴퓨터 사양은 미공개
구글 데이터센터 자료사진
3/14/2016 모두의 알파고 © 2016 이동헌 14

미국 중서부 어딘가의
구글 데이터센터
서울 포시즌스 호텔 대국장
알파고 대국의 실상
이세돌 9단
현재 바둑판
Aja Huang
자료사진
상황 파악
3/14/2016 모두의 알파고 © 2016 이동헌 15

이세돌 9단
현재 바둑판
Aja Huang
자료사진
다음 수 결정
3/14/2016 모두의 알파고 © 2016 이동헌 16

이세돌 9단
현재 바둑판
Aja Huang
자료사진
그대로 실행
3/14/2016 모두의 알파고 © 2016 이동헌 17

이세돌 9단
현재 바둑판
Aja Huang
자료사진
3/14/2016 모두의 알파고 © 2016 이동헌 18

목차
• 알파고 본체의 정체와 대국 상황
3/14/2016 모두의 알파고 © 2016 이동헌 19

알파고 소프트웨어의 정체?
이세돌 9단
현재 바둑판
Aja Huang
자료사진
3/14/2016 모두의 알파고 © 2016 이동헌 20

알파고 바둑 프로그램
알파고 소프트웨어의 정체
상대 바둑기사
다음 수
예측 프로그램
알파고의
다음 수
결정 프로그램
바둑경기
상황
유/불리
분석
프로그램
바둑판 미래
예측 시도
여러 번 미래예측 후 가장 많이 둔 수로 선택
현재 바둑판
바둑판 현상황 인식 프로그램
이세돌 9단
현재 바둑판 그림에서
지금 상황을 인식하자
3/14/2016 모두의 알파고 © 2016 이동헌 21

상대 바둑기사
다음 수
예측 프로그램
알파고의
다음 수
결정 프로그램
바둑경기
상황
유/불리
분석
프로그램
바둑판 미래
예측 시도
현재 바둑판
이세돌 9단
내가 승리에 얼마나
가까운지 생각해보자
3/14/2016 모두의 알파고 © 2016 이동헌 22

상대 바둑기사
다음 수
예측 프로그램
알파고의
다음 수
결정 프로그램
바둑경기
상황
유/불리
분석
프로그램
바둑판 미래
예측 시도
현재 바둑판
이세돌 9단
상대가 먼저 뒀으니
이제 내 차례네.
현재 대국상황에서 볼때
어디에 둬야할까?
3/14/2016 모두의 알파고 © 2016 이동헌 23

상대 바둑기사
다음 수
예측 프로그램
알파고의
다음 수
결정 프로그램
바둑경기
상황
유/불리
분석
프로그램
바둑판 미래
예측 시도
현재 바둑판
이세돌 9단
내가 여기 두면
상대방은 어디에 둘까?
3/14/2016 모두의 알파고 © 2016 이동헌 24

상대 바둑기사
다음 수
예측 프로그램
알파고의
다음 수
결정 프로그램
바둑경기
상황
유/불리
분석
프로그램
바둑판 미래
예측 시도
현재 바둑판
이세돌 9단
그러면 내 상황은?
그러면 나는 어디 둘까?
3/14/2016 모두의 알파고 © 2016 이동헌 25

상대 바둑기사
다음 수
예측 프로그램
알파고의
다음 수
결정 프로그램
바둑경기
상황
유/불리
분석
프로그램
바둑판 미래
예측 시도
현재 바둑판
이세돌 9단
그 다음은???
3/14/2016 모두의 알파고 © 2016 이동헌 26

상대 바둑기사
다음 수
예측 프로그램
알파고의
다음 수
결정 프로그램
바둑경기
상황
유/불리
분석
프로그램
바둑판 미래
예측 시도
현재 바둑판
이세돌 9단
다시 처음으로 돌아가서
생각해보자.
만약 내가 다른 곳에
둔다면…?
3/14/2016 모두의 알파고 © 2016 이동헌 27

상대 바둑기사
다음 수
예측 프로그램
알파고의
다음 수
결정 프로그램
바둑경기
상황
유/불리
분석
프로그램
바둑판 미래
예측 시도
현재 바둑판
이세돌 9단
또다시 한번 더 해보자
3/14/2016 모두의 알파고 © 2016 이동헌 28

상대 바둑기사
다음 수
예측 프로그램
알파고의
다음 수
결정 프로그램
바둑경기
상황
유/불리
분석
프로그램
바둑판 미래
예측 시도
현재 바둑판
이세돌 9단
여러번 해봤는데 역시
이게 제일 많이
해본거야.
이걸로 가자.
3/14/2016 모두의 알파고 © 2016 이동헌 29

상대 바둑기사
다음 수
예측 프로그램
알파고의
다음 수
결정 프로그램
바둑경기
상황
유/불리
분석
프로그램
바둑판 미래
예측 시도
현재 바둑판
이세돌 9단
Aja Huang
3/14/2016 모두의 알파고 © 2016 이동헌 30

이세돌 9단
현재 바둑판
Aja Huang
자료사진
다음 수 결정
3/14/2016 모두의 알파고 © 2016 이동헌 31

목차
3/14/2016 모두의 알파고 © 2016 이동헌 32

알파고는 어떻게 훈련되었나?
• 개인교습 예제 문제
• 바둑판 돌 놓인 상황을 보여줄께
• 다음에 바둑판 어디에 돌이 놓일지 맞춰봐?
• 이런 문제를 3천만개 먼저 풀어봄
• 57% 맞추는 상태까지 도달
3/14/2016 모두의 알파고 © 2016 이동헌 33

• 개인교습 예제 문제 통과후,
• 자체 연습 대국
• 실전 룰 (7집반 공제) 사용
• 한수 두는 데 2초로 시간제한
3/14/2016 모두의 알파고 © 2016 이동헌 34

• 연습 대국은 실전보다 혹독하게
• 실전 룰 (7집반 공제) 사용
• 한수 두는 데 2초로 시간제한
• 상대방은 바로 나 자신
• 옛날버전 또는 최신버전의 알파고 프로그램과 시합
• 대국을 통한 경험으로 자체 프로그램 버전 업그레이드
3/14/2016 모두의 알파고 © 2016 이동헌 35

• 자신과의 무한연습 데쓰매치
• 시합승률이 제일 높은 버전이 생존하는 데쓰매치
• 연습은 그만하라 할때까지 계속된다
• 1달에 1,000,000 시합 완료
• (사람이 백만 시합을 해보려면 약 10년이 걸린다고 합니다)
3/14/2016 모두의 알파고 © 2016 이동헌 36

알파고는 사람이 아닙니다
• 막대한 양의 개인교습 예제
• 바둑판 돌 놓인 상황을 보고, 다음에 어디에 둘지 맞춰봐?
• 이런 문제를 3천만개 풀어보고 57% 맞추는 상태
• 실전보다 혹독한 자신과의 무한 데쓰매치
• 실전 룰 (7집반 공제) 사용 + 한수 두는 데 2초 시간제한
• 1,000,000 시합 완료 (1달만에)
• 과거의 스스로와 경기해서 살아남은 것이 최종판 “알파고”
3/14/2016 모두의 알파고 © 2016 이동헌 38

• 이 영화와 유사점이 있지요
• 기본기술부터 스승에게 배워나감
• 실전 무한반복으로 성장
• 절대강자 스승에게 도전
• 알파고가 더 나은 점이라면..
• 수많은 프로 바둑기사에게서 기본기를 배움
• 실전 무한반복해도 옛일을 잊어먹지 않음
• 실전 투입시에도 지치지 않음
• 감정이 없는 기계 멘탈
3/14/2016 모두의 알파고 © 2016 이동헌 40

알파고 – 이세돌9단 간단 비교
알파고 이세돌 9단
최소 300대 이상의 컴퓨터 (추정) 물리적 실체 인간 1명
위의 컴퓨터를 가동하는 데
들어가는 전력
대국시 소모품 1일 대사량 많이 잡아도 2500kcal
+ 커피
안가도 됩니다 화장실 갈 수 있습니다
실패하면 세이브&로드 가능 컨디션 조절 -
없습니다 피로도 쌓입니다
기계입니다 기억력 인간 최고 수준 (추정)
초당 백만 수 이상 (추정) 다음 수 시뮬레이션 능력 초당 백만 수는 힘들 것 같습니다
기계는 한눈같은거 못팝니다 집중력 인간 최고 수준 (추정)
• 절대 같은 체급의 경기가 아닙니다
3/14/2016 모두의 알파고 © 2016 이동헌 41

알파고의 무엇이 새로운 것인가요?
상대 바둑기사
다음 수
예측 프로그램
알파고의
다음 수
결정 프로그램
바둑경기
상황
유/불리
분석
프로그램
바둑판 미래
예측 시도
3/14/2016 모두의 알파고 © 2016 이동헌 43

1. 바둑기사들의 실제 기록을
과외받을 때 효율적으로
사용합니다
상대 바둑기사
다음 수
예측 프로그램
알파고의
다음 수
결정 프로그램
바둑경기
상황
유/불리
분석
프로그램
바둑판 미래
예측 시도
3/14/2016 모두의 알파고 © 2016 이동헌 44

사용합니다
2. 바둑판 미래예측을 매우
효율적인 방법으로 합니다
상대 바둑기사
다음 수
예측 프로그램
알파고의
다음 수
결정 프로그램
바둑경기
상황
유/불리
분석
프로그램
바둑판 미래
예측 시도
3/14/2016 모두의 알파고 © 2016 이동헌 45

사용합니다
3. 상대 바둑기사 행동 예측과
현재 경기 상황분석에
딥러닝을 사용합니다
상대 바둑기사
다음 수
예측 프로그램
알파고의
다음 수
결정 프로그램
바둑경기
상황
유/불리
분석
프로그램
바둑판 미래
예측 시도
3/14/2016 모두의 알파고 © 2016 이동헌 46

요약
• 알파고는 복잡하고 새로운 바둑프로그램입니다
• 알파고는 컴퓨터 수백대의 능력을 쏟아붓습니다
• 알파고는 혹독한 훈련을 통해 실력을 쌓을 수 있습니다
• 알파고는 경험을 통해 강해져가는 프로그램입니다
• 그래서 더, 이세돌9단의 승리를 응원합니다
3/14/2016 모두의 알파고 © 2016 이동헌 50

수고하셨습니다
• 알파고의 바둑에 대해 더 자세한 내용을 알고 싶으시다면
• “바둑인을 위한 알파고” 를 읽어주세요
• 피드백/오류 제보 이메일이 필요하시면 여기로 보내주세요
• donghun2014@gmail.com
3/14/2016 모두의 알파고 © 2016 이동헌 51

모두의 알파고

Recommended

Recommended

More Related Content

Viewers also liked

Viewers also liked (20)

모두의 알파고