SlideShare a Scribd company logo
1 of 51
Download to read offline
모두의 알파고
이동헌
donghun2014@gmail.com
시작하면서
• 많은 분들이 “알파고”를 더 잘 이해하시는데 도움이 되고자
• 최대한 노력했습니다
• 피드백 환영합니다
• 스스로가 다음에 해당된다면,
• 컴퓨터 프로그래머
• 빅데이터 전문가
• 딥러닝 전문가
• 강화학습 전문가
• 이미 다 알고계신 내용일수도 있습니다
3/14/2016 모두의 알파고 © 2016 이동헌 2
목차
• 알파고 약력 등 인적사항
• 알파고 – 이세돌9단의 대국
• 알파고 본체의 정체와 대국 실상
• 알파고 소프트웨어의 정체
• 알파고는 어떻게 훈련되었나?
• 알파고는 (당연하지만) 사람이 아닙니다
• 알파고의 무엇이 새로운 것인가요?
3/14/2016 모두의 알파고 © 2016 이동헌 3
목차
• 알파고 약력 등 인적사항
• 알파고 – 이세돌9단의 대국
• 알파고 본체의 정체와 대국 실상
• 알파고 소프트웨어의 정체
• 알파고는 어떻게 훈련되었나?
• 알파고는 (당연하지만) 사람이 아닙니다
• 알파고의 무엇이 새로운 것인가요?
3/14/2016 모두의 알파고 © 2016 이동헌 4
알파고 약력
• 출생
• 2014~2015년경, Google Deepmind 회사, 알파고 팀
• 컴퓨터와의 전적
• 2015년 기준 5종의 유명 바둑 프로그램들을 상대로 495전 494승
• 세계 최초 기록
• 프로 바둑기사 상대로 호선바둑 공식전 승리 (5경기 모두 승리)
• 프로 바둑기사 9단 상대로 호선바둑 공식전 중 1경기 이상 승리 (진행중)
• 호선바둑: 접바둑이 아닌, 맞바둑의 공식용어입니다
3/14/2016 모두의 알파고 © 2016 이동헌 5
알파고 팀
• 제작진 16명
• 제작 1팀: Aja Huang, George van den Driessche, Ioannis Antonoglou, Marc
Lanctot, Arthur Guez, Thore Graepel, David Silver
• 제작 2팀: Chris J. Maddison, Arthur Guez, Laurent Sifre, Aja Huang, Ioannis
Antonoglou, Veda Panneershelvam, Sander Dieleman, Dominik Grewe, Nal
Kalchbrenner, Ilya Sutskever, Koray Kavukcuoglu, David Silver
• 평가팀 Julian Schrittwieser, John Nham, Aja Huang, David Silver
• 관리팀
• David Silver, Madeleine Leach, Timothy Lillicrap, Thore Graepel, Koray
Kavukcuoglu, Demis Hassabis
3/14/2016 모두의 알파고 © 2016 이동헌 6
목차
• 알파고 약력 등 인적사항
• 알파고 – 이세돌9단의 대국
• 알파고 본체의 정체와 대국 실상
• 알파고 소프트웨어의 정체
• 알파고는 어떻게 훈련되었나?
• 알파고는 (당연하지만) 사람이 아닙니다
• 알파고의 무엇이 새로운 것인가요?
3/14/2016 모두의 알파고 © 2016 이동헌 7
알파고 – 이세돌9단의 대국
• 총 5번, 서울에서 시합 예정
• 3월 9, 10, 12, 13, 15일
• 중국 프로바둑 제도를 그대로 가져옴
• 호선바둑 (맞바둑), 흑 7집반 공제
• 시간은 조금 여유있게
• 2시간, 1분 초읽기 3회
3/14/2016 모두의 알파고 © 2016 이동헌 8
알파고 – 이세돌9단의 대국 전망 (경기전)
• 한국
• 이세돌 9단 본인: 승리 예측
• 전문가 여론: 첫 경기 승리 예측에는 대개 동의, 다음 경기들은 알 수 없음
• 일반 여론: 이세돌 9단의 승리 예측
• 외국
• 트위터 계정 비공인투표 50:50 [링크]
• 비트코인 도박사이트 이세돌 9단 승리에 51.7% (가중투표치) [링크]
• 독일 웹사이트 이세돌 9단 승리에 69.7% [링크]
3/14/2016 모두의 알파고 © 2016 이동헌 9
목차
• 알파고 약력 등 인적사항
• 알파고 – 이세돌9단의 대국
• 알파고 본체의 정체와 대국 실상
• 알파고 소프트웨어의 정체
• 알파고는 어떻게 훈련되었나?
• 알파고는 (당연하지만) 사람이 아닙니다
• 알파고의 무엇이 새로운 것인가요?
3/14/2016 모두의 알파고 © 2016 이동헌 10
알파고의 정체?
3/14/2016 모두의 알파고 © 2016 이동헌 11
알파고의 정체?
• 이 사진에는 알파고 본체가 없습니다
Aja Huang
이세돌 9단
알파고 화면
(화상통화)
3/14/2016 모두의 알파고 © 2016 이동헌 12
알파고 본체 기계의 정체
• 2015년 기준
• CPU 1202개, GPU 176개
• 참고로,
• 가정용 PC 1대 = CPU 1개
• 게임용 1대 = CPU 1개+GPU 1개
3/14/2016 모두의 알파고 © 2016 이동헌 13
알파고 본체 기계의 정체
• 2015년 기준
• CPU 1202개, GPU 176개
• 참고로,
• 가정용 PC 1대 = CPU 1개
• 게임용 1대 = CPU 1개+GPU 1개
• 이번 이세돌9단 경기에는
• “미국 중서부지역에 있는
구글 데이터센터”
• 예를 들면
• 자세한 컴퓨터 사양은 미공개
구글 데이터센터 자료사진
3/14/2016 모두의 알파고 © 2016 이동헌 14
미국 중서부 어딘가의
구글 데이터센터
서울 포시즌스 호텔 대국장
알파고 대국의 실상
이세돌 9단
현재 바둑판
Aja Huang
구글 데이터센터
자료사진
상황 파악
3/14/2016 모두의 알파고 © 2016 이동헌 15
미국 중서부 어딘가의
구글 데이터센터
서울 포시즌스 호텔 대국장
알파고 대국의 실상
이세돌 9단
현재 바둑판
Aja Huang
구글 데이터센터
자료사진
다음 수 결정
3/14/2016 모두의 알파고 © 2016 이동헌 16
미국 중서부 어딘가의
구글 데이터센터
서울 포시즌스 호텔 대국장
알파고 대국의 실상
이세돌 9단
현재 바둑판
Aja Huang
구글 데이터센터
자료사진
그대로 실행
3/14/2016 모두의 알파고 © 2016 이동헌 17
미국 중서부 어딘가의
구글 데이터센터
서울 포시즌스 호텔 대국장
알파고 대국의 실상
이세돌 9단
현재 바둑판
Aja Huang
구글 데이터센터
자료사진
3/14/2016 모두의 알파고 © 2016 이동헌 18
목차
• 알파고 약력 등 인적사항
• 알파고 – 이세돌9단의 대국
• 알파고 본체의 정체와 대국 상황
• 알파고 소프트웨어의 정체
• 알파고는 어떻게 훈련되었나?
• 알파고는 (당연하지만) 사람이 아닙니다
• 알파고의 무엇이 새로운 것인가요?
3/14/2016 모두의 알파고 © 2016 이동헌 19
미국 중서부 어딘가의
구글 데이터센터
서울 포시즌스 호텔 대국장
알파고 소프트웨어의 정체?
이세돌 9단
현재 바둑판
Aja Huang
구글 데이터센터
자료사진
3/14/2016 모두의 알파고 © 2016 이동헌 20
알파고 바둑 프로그램
알파고 소프트웨어의 정체
상대 바둑기사
다음 수
예측 프로그램
알파고의
다음 수
결정 프로그램
바둑경기
상황
유/불리
분석
프로그램
바둑판 미래
예측 시도
여러 번 미래예측 후 가장 많이 둔 수로 선택
현재 바둑판
바둑판 현상황 인식 프로그램
이세돌 9단
현재 바둑판 그림에서
지금 상황을 인식하자
3/14/2016 모두의 알파고 © 2016 이동헌 21
알파고 바둑 프로그램
알파고 소프트웨어의 정체
상대 바둑기사
다음 수
예측 프로그램
알파고의
다음 수
결정 프로그램
바둑경기
상황
유/불리
분석
프로그램
바둑판 미래
예측 시도
여러 번 미래예측 후 가장 많이 둔 수로 선택
현재 바둑판
바둑판 현상황 인식 프로그램
이세돌 9단
내가 승리에 얼마나
가까운지 생각해보자
3/14/2016 모두의 알파고 © 2016 이동헌 22
알파고 바둑 프로그램
알파고 소프트웨어의 정체
상대 바둑기사
다음 수
예측 프로그램
알파고의
다음 수
결정 프로그램
바둑경기
상황
유/불리
분석
프로그램
바둑판 미래
예측 시도
여러 번 미래예측 후 가장 많이 둔 수로 선택
현재 바둑판
바둑판 현상황 인식 프로그램
이세돌 9단
상대가 먼저 뒀으니
이제 내 차례네.
현재 대국상황에서 볼때
어디에 둬야할까?
3/14/2016 모두의 알파고 © 2016 이동헌 23
알파고 바둑 프로그램
알파고 소프트웨어의 정체
상대 바둑기사
다음 수
예측 프로그램
알파고의
다음 수
결정 프로그램
바둑경기
상황
유/불리
분석
프로그램
바둑판 미래
예측 시도
여러 번 미래예측 후 가장 많이 둔 수로 선택
현재 바둑판
바둑판 현상황 인식 프로그램
이세돌 9단
내가 여기 두면
상대방은 어디에 둘까?
3/14/2016 모두의 알파고 © 2016 이동헌 24
알파고 바둑 프로그램
알파고 소프트웨어의 정체
상대 바둑기사
다음 수
예측 프로그램
알파고의
다음 수
결정 프로그램
바둑경기
상황
유/불리
분석
프로그램
바둑판 미래
예측 시도
여러 번 미래예측 후 가장 많이 둔 수로 선택
현재 바둑판
바둑판 현상황 인식 프로그램
이세돌 9단
그러면 내 상황은?
그러면 나는 어디 둘까?
3/14/2016 모두의 알파고 © 2016 이동헌 25
알파고 바둑 프로그램
알파고 소프트웨어의 정체
상대 바둑기사
다음 수
예측 프로그램
알파고의
다음 수
결정 프로그램
바둑경기
상황
유/불리
분석
프로그램
바둑판 미래
예측 시도
여러 번 미래예측 후 가장 많이 둔 수로 선택
현재 바둑판
바둑판 현상황 인식 프로그램
이세돌 9단
그 다음은???
3/14/2016 모두의 알파고 © 2016 이동헌 26
알파고 바둑 프로그램
알파고 소프트웨어의 정체
상대 바둑기사
다음 수
예측 프로그램
알파고의
다음 수
결정 프로그램
바둑경기
상황
유/불리
분석
프로그램
바둑판 미래
예측 시도
여러 번 미래예측 후 가장 많이 둔 수로 선택
현재 바둑판
바둑판 현상황 인식 프로그램
이세돌 9단
다시 처음으로 돌아가서
생각해보자.
만약 내가 다른 곳에
둔다면…?
3/14/2016 모두의 알파고 © 2016 이동헌 27
알파고 바둑 프로그램
알파고 소프트웨어의 정체
상대 바둑기사
다음 수
예측 프로그램
알파고의
다음 수
결정 프로그램
바둑경기
상황
유/불리
분석
프로그램
바둑판 미래
예측 시도
여러 번 미래예측 후 가장 많이 둔 수로 선택
현재 바둑판
바둑판 현상황 인식 프로그램
이세돌 9단
또다시 한번 더 해보자
3/14/2016 모두의 알파고 © 2016 이동헌 28
알파고 바둑 프로그램
알파고 소프트웨어의 정체
상대 바둑기사
다음 수
예측 프로그램
알파고의
다음 수
결정 프로그램
바둑경기
상황
유/불리
분석
프로그램
바둑판 미래
예측 시도
여러 번 미래예측 후 가장 많이 둔 수로 선택
현재 바둑판
바둑판 현상황 인식 프로그램
이세돌 9단
여러번 해봤는데 역시
이게 제일 많이
해본거야.
이걸로 가자.
3/14/2016 모두의 알파고 © 2016 이동헌 29
알파고 바둑 프로그램
알파고 소프트웨어의 정체
상대 바둑기사
다음 수
예측 프로그램
알파고의
다음 수
결정 프로그램
바둑경기
상황
유/불리
분석
프로그램
바둑판 미래
예측 시도
여러 번 미래예측 후 가장 많이 둔 수로 선택
현재 바둑판
바둑판 현상황 인식 프로그램
이세돌 9단
Aja Huang
3/14/2016 모두의 알파고 © 2016 이동헌 30
미국 중서부 어딘가의
구글 데이터센터
서울 포시즌스 호텔 대국장
알파고 소프트웨어의 정체
이세돌 9단
현재 바둑판
Aja Huang
구글 데이터센터
자료사진
다음 수 결정
3/14/2016 모두의 알파고 © 2016 이동헌 31
목차
• 알파고 약력 등 인적사항
• 알파고 – 이세돌9단의 대국
• 알파고 본체의 정체와 대국 상황
• 알파고 소프트웨어의 정체
• 알파고는 어떻게 훈련되었나?
• 알파고는 (당연하지만) 사람이 아닙니다
• 알파고의 무엇이 새로운 것인가요?
3/14/2016 모두의 알파고 © 2016 이동헌 32
알파고는 어떻게 훈련되었나?
• 개인교습 예제 문제
• 바둑판 돌 놓인 상황을 보여줄께
• 다음에 바둑판 어디에 돌이 놓일지 맞춰봐?
• 이런 문제를 3천만개 먼저 풀어봄
• 57% 맞추는 상태까지 도달
3/14/2016 모두의 알파고 © 2016 이동헌 33
알파고는 어떻게 훈련되었나?
• 개인교습 예제 문제 통과후,
• 자체 연습 대국
• 실전 룰 (7집반 공제) 사용
• 한수 두는 데 2초로 시간제한
3/14/2016 모두의 알파고 © 2016 이동헌 34
알파고는 어떻게 훈련되었나?
• 연습 대국은 실전보다 혹독하게
• 실전 룰 (7집반 공제) 사용
• 한수 두는 데 2초로 시간제한
• 상대방은 바로 나 자신
• 옛날버전 또는 최신버전의 알파고 프로그램과 시합
• 대국을 통한 경험으로 자체 프로그램 버전 업그레이드
3/14/2016 모두의 알파고 © 2016 이동헌 35
알파고는 어떻게 훈련되었나?
• 자신과의 무한연습 데쓰매치
• 시합승률이 제일 높은 버전이 생존하는 데쓰매치
• 연습은 그만하라 할때까지 계속된다
• 1달에 1,000,000 시합 완료
• (사람이 백만 시합을 해보려면 약 10년이 걸린다고 합니다)
3/14/2016 모두의 알파고 © 2016 이동헌 36
목차
• 알파고 약력 등 인적사항
• 알파고 – 이세돌9단의 대국
• 알파고 본체의 정체와 대국 상황
• 알파고 소프트웨어의 정체
• 알파고는 어떻게 훈련되었나?
• 알파고는 (당연하지만) 사람이 아닙니다
• 알파고의 무엇이 새로운 것인가요?
3/14/2016 모두의 알파고 © 2016 이동헌 37
알파고는 사람이 아닙니다
• 막대한 양의 개인교습 예제
• 바둑판 돌 놓인 상황을 보고, 다음에 어디에 둘지 맞춰봐?
• 이런 문제를 3천만개 풀어보고 57% 맞추는 상태
• 실전보다 혹독한 자신과의 무한 데쓰매치
• 실전 룰 (7집반 공제) 사용 + 한수 두는 데 2초 시간제한
• 1,000,000 시합 완료 (1달만에)
• 과거의 스스로와 경기해서 살아남은 것이 최종판 “알파고”
3/14/2016 모두의 알파고 © 2016 이동헌 38
알파고는 사람이 아닙니다
• 이 영화와 유사점이 있지요
• 기본기술부터 스승에게 배워나감
• 실전 무한반복으로 성장
• 절대강자 스승에게 도전
3/14/2016 모두의 알파고 © 2016 이동헌 39
알파고는 사람이 아닙니다
• 이 영화와 유사점이 있지요
• 기본기술부터 스승에게 배워나감
• 실전 무한반복으로 성장
• 절대강자 스승에게 도전
• 알파고가 더 나은 점이라면..
• 수많은 프로 바둑기사에게서 기본기를 배움
• 실전 무한반복해도 옛일을 잊어먹지 않음
• 실전 투입시에도 지치지 않음
• 감정이 없는 기계 멘탈
3/14/2016 모두의 알파고 © 2016 이동헌 40
알파고 – 이세돌9단 간단 비교
알파고 이세돌 9단
최소 300대 이상의 컴퓨터 (추정) 물리적 실체 인간 1명
위의 컴퓨터를 가동하는 데
들어가는 전력
대국시 소모품 1일 대사량 많이 잡아도 2500kcal
+ 커피
안가도 됩니다 화장실 갈 수 있습니다
실패하면 세이브&로드 가능 컨디션 조절 -
없습니다 피로도 쌓입니다
기계입니다 기억력 인간 최고 수준 (추정)
초당 백만 수 이상 (추정) 다음 수 시뮬레이션 능력 초당 백만 수는 힘들 것 같습니다
기계는 한눈같은거 못팝니다 집중력 인간 최고 수준 (추정)
• 절대 같은 체급의 경기가 아닙니다
3/14/2016 모두의 알파고 © 2016 이동헌 41
목차
• 알파고 약력 등 인적사항
• 알파고 – 이세돌9단의 대국
• 알파고 본체의 정체와 대국 상황
• 알파고 소프트웨어의 정체
• 알파고는 어떻게 훈련되었나?
• 알파고는 (당연하지만) 사람이 아닙니다
• 알파고의 무엇이 새로운 것인가요?
3/14/2016 모두의 알파고 © 2016 이동헌 42
알파고의 무엇이 새로운 것인가요?
알파고 바둑 프로그램
상대 바둑기사
다음 수
예측 프로그램
알파고의
다음 수
결정 프로그램
바둑경기
상황
유/불리
분석
프로그램
바둑판 미래
예측 시도
여러 번 미래예측 후 가장 많이 둔 수로 선택
바둑판 현상황 인식 프로그램
3/14/2016 모두의 알파고 © 2016 이동헌 43
알파고의 무엇이 새로운 것인가요?
1. 바둑기사들의 실제 기록을
과외받을 때 효율적으로
사용합니다
알파고 바둑 프로그램
상대 바둑기사
다음 수
예측 프로그램
알파고의
다음 수
결정 프로그램
바둑경기
상황
유/불리
분석
프로그램
바둑판 미래
예측 시도
여러 번 미래예측 후 가장 많이 둔 수로 선택
바둑판 현상황 인식 프로그램
3/14/2016 모두의 알파고 © 2016 이동헌 44
알파고의 무엇이 새로운 것인가요?
1. 바둑기사들의 실제 기록을
과외받을 때 효율적으로
사용합니다
2. 바둑판 미래예측을 매우
효율적인 방법으로 합니다
알파고 바둑 프로그램
상대 바둑기사
다음 수
예측 프로그램
알파고의
다음 수
결정 프로그램
바둑경기
상황
유/불리
분석
프로그램
바둑판 미래
예측 시도
여러 번 미래예측 후 가장 많이 둔 수로 선택
바둑판 현상황 인식 프로그램
3/14/2016 모두의 알파고 © 2016 이동헌 45
알파고의 무엇이 새로운 것인가요?
1. 바둑기사들의 실제 기록을
과외받을 때 효율적으로
사용합니다
2. 바둑판 미래예측을 매우
효율적인 방법으로 합니다
3. 상대 바둑기사 행동 예측과
현재 경기 상황분석에
딥러닝을 사용합니다
알파고 바둑 프로그램
상대 바둑기사
다음 수
예측 프로그램
알파고의
다음 수
결정 프로그램
바둑경기
상황
유/불리
분석
프로그램
바둑판 미래
예측 시도
여러 번 미래예측 후 가장 많이 둔 수로 선택
바둑판 현상황 인식 프로그램
3/14/2016 모두의 알파고 © 2016 이동헌 46
알파고의 무엇이 새로운 것인가요?
1. 바둑기사들의 실제 기록을
과외받을 때 효율적으로
사용합니다
2. 바둑판 미래예측을 매우
효율적인 방법으로 합니다
3. 상대 바둑기사 행동 예측과
현재 경기 상황분석에
딥러닝을 사용합니다
4. 위의 과정을 수많은
컴퓨터에서 동시에
실행합니다
3/14/2016 모두의 알파고 © 2016 이동헌 47
알파고의 무엇이 새로운 것인가요?
1. 바둑기사들의 실제 기록을
과외받을 때 효율적으로
사용합니다
2. 바둑판 미래예측을 매우
효율적인 방법으로 합니다
3. 상대 바둑기사 행동 예측과
현재 경기 상황분석에
딥러닝을 사용합니다
4. 위의 과정을 수많은
컴퓨터에서 동시에
실행합니다
5. 스스로 데쓰매치를 통해
더욱 강해집니다
3/14/2016 모두의 알파고 © 2016 이동헌 48
“프로그래머를 위한 알파고”
• 각 항목들을 구체적으로
다루어볼 예정입니다
1. 바둑기사들의 실제 기록을
과외받을 때 효율적으로
사용합니다
2. 바둑판 미래예측을 매우
효율적인 방법으로 합니다
3. 상대 바둑기사 행동 예측과
현재 경기 상황분석에
딥러닝을 사용합니다
4. 위의 과정을 수많은
컴퓨터에서 동시에
실행합니다
5. 스스로 데쓰매치를 통해
더욱 강해집니다
3/14/2016 모두의 알파고 © 2016 이동헌 49
요약
• 알파고는 복잡하고 새로운 바둑프로그램입니다
• 알파고는 컴퓨터 수백대의 능력을 쏟아붓습니다
• 알파고는 혹독한 훈련을 통해 실력을 쌓을 수 있습니다
• 알파고는 경험을 통해 강해져가는 프로그램입니다
• 그래서 더, 이세돌9단의 승리를 응원합니다
3/14/2016 모두의 알파고 © 2016 이동헌 50
수고하셨습니다
• 알파고의 바둑에 대해 더 자세한 내용을 알고 싶으시다면
• “바둑인을 위한 알파고” 를 읽어주세요
• 피드백/오류 제보 이메일이 필요하시면 여기로 보내주세요
• donghun2014@gmail.com
3/14/2016 모두의 알파고 © 2016 이동헌 51

More Related Content

Viewers also liked

알파고 (바둑 인공지능)의 작동 원리
알파고 (바둑 인공지능)의 작동 원리알파고 (바둑 인공지능)의 작동 원리
알파고 (바둑 인공지능)의 작동 원리Shane (Seungwhan) Moon
 
알파고 해부하기 2부
알파고 해부하기 2부알파고 해부하기 2부
알파고 해부하기 2부Donghun Lee
 
기계학습 / 딥러닝이란 무엇인가
기계학습 / 딥러닝이란 무엇인가기계학습 / 딥러닝이란 무엇인가
기계학습 / 딥러닝이란 무엇인가Yongha Kim
 
쫄지말자딥러닝2 - CNN RNN 포함버전
쫄지말자딥러닝2 - CNN RNN 포함버전쫄지말자딥러닝2 - CNN RNN 포함버전
쫄지말자딥러닝2 - CNN RNN 포함버전Modulabs
 
딥러닝과 강화 학습으로 나보다 잘하는 쿠키런 AI 구현하기 DEVIEW 2016
딥러닝과 강화 학습으로 나보다 잘하는 쿠키런 AI 구현하기 DEVIEW 2016딥러닝과 강화 학습으로 나보다 잘하는 쿠키런 AI 구현하기 DEVIEW 2016
딥러닝과 강화 학습으로 나보다 잘하는 쿠키런 AI 구현하기 DEVIEW 2016Taehoon Kim
 
지적 대화를 위한 깊고 넓은 딥러닝 PyCon APAC 2016
지적 대화를 위한 깊고 넓은 딥러닝 PyCon APAC 2016지적 대화를 위한 깊고 넓은 딥러닝 PyCon APAC 2016
지적 대화를 위한 깊고 넓은 딥러닝 PyCon APAC 2016Taehoon Kim
 
20160409 microsoft 세미나 머신러닝관련 발표자료
20160409 microsoft 세미나 머신러닝관련 발표자료20160409 microsoft 세미나 머신러닝관련 발표자료
20160409 microsoft 세미나 머신러닝관련 발표자료JungGeun Lee
 
Ai 그까이거
Ai 그까이거Ai 그까이거
Ai 그까이거도형 임
 
빅 데이터 개요 및 활용
빅 데이터 개요 및 활용빅 데이터 개요 및 활용
빅 데이터 개요 및 활용Jin wook
 
Introduce Deep learning & A.I. Applications
Introduce Deep learning & A.I. ApplicationsIntroduce Deep learning & A.I. Applications
Introduce Deep learning & A.I. ApplicationsMario Cho
 
텐서플로우 설치도 했고 튜토리얼도 봤고 기초 예제도 짜봤다면 TensorFlow KR Meetup 2016
텐서플로우 설치도 했고 튜토리얼도 봤고 기초 예제도 짜봤다면 TensorFlow KR Meetup 2016텐서플로우 설치도 했고 튜토리얼도 봤고 기초 예제도 짜봤다면 TensorFlow KR Meetup 2016
텐서플로우 설치도 했고 튜토리얼도 봤고 기초 예제도 짜봤다면 TensorFlow KR Meetup 2016Taehoon Kim
 
[메조미디어] 2017년 미디어트렌드리포트
[메조미디어] 2017년 미디어트렌드리포트[메조미디어] 2017년 미디어트렌드리포트
[메조미디어] 2017년 미디어트렌드리포트MezzoMedia
 
Reinforcement learning v0.5
Reinforcement learning v0.5Reinforcement learning v0.5
Reinforcement learning v0.5SANG WON PARK
 
강화 학습 기초 Reinforcement Learning an introduction
강화 학습 기초 Reinforcement Learning an introduction강화 학습 기초 Reinforcement Learning an introduction
강화 학습 기초 Reinforcement Learning an introductionTaehoon Kim
 
딥러닝과 강화 학습으로 나보다 잘하는 쿠키런 AI 구현하기
딥러닝과 강화 학습으로 나보다 잘하는 쿠키런 AI 구현하기딥러닝과 강화 학습으로 나보다 잘하는 쿠키런 AI 구현하기
딥러닝과 강화 학습으로 나보다 잘하는 쿠키런 AI 구현하기NAVER D2
 
인공지능, 기계학습 그리고 딥러닝
인공지능, 기계학습 그리고 딥러닝인공지능, 기계학습 그리고 딥러닝
인공지능, 기계학습 그리고 딥러닝Jinwon Lee
 
[2A4]DeepLearningAtNAVER
[2A4]DeepLearningAtNAVER[2A4]DeepLearningAtNAVER
[2A4]DeepLearningAtNAVERNAVER D2
 
AlphaGo, 새로운 시대의 시작
AlphaGo, 새로운 시대의 시작AlphaGo, 새로운 시대의 시작
AlphaGo, 새로운 시대의 시작Young Sung Son
 

Viewers also liked (20)

알파고 (바둑 인공지능)의 작동 원리
알파고 (바둑 인공지능)의 작동 원리알파고 (바둑 인공지능)의 작동 원리
알파고 (바둑 인공지능)의 작동 원리
 
알파고 해부하기 2부
알파고 해부하기 2부알파고 해부하기 2부
알파고 해부하기 2부
 
기계학습 / 딥러닝이란 무엇인가
기계학습 / 딥러닝이란 무엇인가기계학습 / 딥러닝이란 무엇인가
기계학습 / 딥러닝이란 무엇인가
 
쫄지말자딥러닝2 - CNN RNN 포함버전
쫄지말자딥러닝2 - CNN RNN 포함버전쫄지말자딥러닝2 - CNN RNN 포함버전
쫄지말자딥러닝2 - CNN RNN 포함버전
 
딥러닝과 강화 학습으로 나보다 잘하는 쿠키런 AI 구현하기 DEVIEW 2016
딥러닝과 강화 학습으로 나보다 잘하는 쿠키런 AI 구현하기 DEVIEW 2016딥러닝과 강화 학습으로 나보다 잘하는 쿠키런 AI 구현하기 DEVIEW 2016
딥러닝과 강화 학습으로 나보다 잘하는 쿠키런 AI 구현하기 DEVIEW 2016
 
지적 대화를 위한 깊고 넓은 딥러닝 PyCon APAC 2016
지적 대화를 위한 깊고 넓은 딥러닝 PyCon APAC 2016지적 대화를 위한 깊고 넓은 딥러닝 PyCon APAC 2016
지적 대화를 위한 깊고 넓은 딥러닝 PyCon APAC 2016
 
20160409 microsoft 세미나 머신러닝관련 발표자료
20160409 microsoft 세미나 머신러닝관련 발표자료20160409 microsoft 세미나 머신러닝관련 발표자료
20160409 microsoft 세미나 머신러닝관련 발표자료
 
Ai 그까이거
Ai 그까이거Ai 그까이거
Ai 그까이거
 
빅 데이터 개요 및 활용
빅 데이터 개요 및 활용빅 데이터 개요 및 활용
빅 데이터 개요 및 활용
 
Introduce Deep learning & A.I. Applications
Introduce Deep learning & A.I. ApplicationsIntroduce Deep learning & A.I. Applications
Introduce Deep learning & A.I. Applications
 
텐서플로우 설치도 했고 튜토리얼도 봤고 기초 예제도 짜봤다면 TensorFlow KR Meetup 2016
텐서플로우 설치도 했고 튜토리얼도 봤고 기초 예제도 짜봤다면 TensorFlow KR Meetup 2016텐서플로우 설치도 했고 튜토리얼도 봤고 기초 예제도 짜봤다면 TensorFlow KR Meetup 2016
텐서플로우 설치도 했고 튜토리얼도 봤고 기초 예제도 짜봤다면 TensorFlow KR Meetup 2016
 
[메조미디어] 2017년 미디어트렌드리포트
[메조미디어] 2017년 미디어트렌드리포트[메조미디어] 2017년 미디어트렌드리포트
[메조미디어] 2017년 미디어트렌드리포트
 
Reinforcement learning v0.5
Reinforcement learning v0.5Reinforcement learning v0.5
Reinforcement learning v0.5
 
강화 학습 기초 Reinforcement Learning an introduction
강화 학습 기초 Reinforcement Learning an introduction강화 학습 기초 Reinforcement Learning an introduction
강화 학습 기초 Reinforcement Learning an introduction
 
딥러닝과 강화 학습으로 나보다 잘하는 쿠키런 AI 구현하기
딥러닝과 강화 학습으로 나보다 잘하는 쿠키런 AI 구현하기딥러닝과 강화 학습으로 나보다 잘하는 쿠키런 AI 구현하기
딥러닝과 강화 학습으로 나보다 잘하는 쿠키런 AI 구현하기
 
How AlphaGo Works
How AlphaGo WorksHow AlphaGo Works
How AlphaGo Works
 
인공지능, 기계학습 그리고 딥러닝
인공지능, 기계학습 그리고 딥러닝인공지능, 기계학습 그리고 딥러닝
인공지능, 기계학습 그리고 딥러닝
 
빅데이터
빅데이터빅데이터
빅데이터
 
[2A4]DeepLearningAtNAVER
[2A4]DeepLearningAtNAVER[2A4]DeepLearningAtNAVER
[2A4]DeepLearningAtNAVER
 
AlphaGo, 새로운 시대의 시작
AlphaGo, 새로운 시대의 시작AlphaGo, 새로운 시대의 시작
AlphaGo, 새로운 시대의 시작
 

모두의 알파고

  • 2. 시작하면서 • 많은 분들이 “알파고”를 더 잘 이해하시는데 도움이 되고자 • 최대한 노력했습니다 • 피드백 환영합니다 • 스스로가 다음에 해당된다면, • 컴퓨터 프로그래머 • 빅데이터 전문가 • 딥러닝 전문가 • 강화학습 전문가 • 이미 다 알고계신 내용일수도 있습니다 3/14/2016 모두의 알파고 © 2016 이동헌 2
  • 3. 목차 • 알파고 약력 등 인적사항 • 알파고 – 이세돌9단의 대국 • 알파고 본체의 정체와 대국 실상 • 알파고 소프트웨어의 정체 • 알파고는 어떻게 훈련되었나? • 알파고는 (당연하지만) 사람이 아닙니다 • 알파고의 무엇이 새로운 것인가요? 3/14/2016 모두의 알파고 © 2016 이동헌 3
  • 4. 목차 • 알파고 약력 등 인적사항 • 알파고 – 이세돌9단의 대국 • 알파고 본체의 정체와 대국 실상 • 알파고 소프트웨어의 정체 • 알파고는 어떻게 훈련되었나? • 알파고는 (당연하지만) 사람이 아닙니다 • 알파고의 무엇이 새로운 것인가요? 3/14/2016 모두의 알파고 © 2016 이동헌 4
  • 5. 알파고 약력 • 출생 • 2014~2015년경, Google Deepmind 회사, 알파고 팀 • 컴퓨터와의 전적 • 2015년 기준 5종의 유명 바둑 프로그램들을 상대로 495전 494승 • 세계 최초 기록 • 프로 바둑기사 상대로 호선바둑 공식전 승리 (5경기 모두 승리) • 프로 바둑기사 9단 상대로 호선바둑 공식전 중 1경기 이상 승리 (진행중) • 호선바둑: 접바둑이 아닌, 맞바둑의 공식용어입니다 3/14/2016 모두의 알파고 © 2016 이동헌 5
  • 6. 알파고 팀 • 제작진 16명 • 제작 1팀: Aja Huang, George van den Driessche, Ioannis Antonoglou, Marc Lanctot, Arthur Guez, Thore Graepel, David Silver • 제작 2팀: Chris J. Maddison, Arthur Guez, Laurent Sifre, Aja Huang, Ioannis Antonoglou, Veda Panneershelvam, Sander Dieleman, Dominik Grewe, Nal Kalchbrenner, Ilya Sutskever, Koray Kavukcuoglu, David Silver • 평가팀 Julian Schrittwieser, John Nham, Aja Huang, David Silver • 관리팀 • David Silver, Madeleine Leach, Timothy Lillicrap, Thore Graepel, Koray Kavukcuoglu, Demis Hassabis 3/14/2016 모두의 알파고 © 2016 이동헌 6
  • 7. 목차 • 알파고 약력 등 인적사항 • 알파고 – 이세돌9단의 대국 • 알파고 본체의 정체와 대국 실상 • 알파고 소프트웨어의 정체 • 알파고는 어떻게 훈련되었나? • 알파고는 (당연하지만) 사람이 아닙니다 • 알파고의 무엇이 새로운 것인가요? 3/14/2016 모두의 알파고 © 2016 이동헌 7
  • 8. 알파고 – 이세돌9단의 대국 • 총 5번, 서울에서 시합 예정 • 3월 9, 10, 12, 13, 15일 • 중국 프로바둑 제도를 그대로 가져옴 • 호선바둑 (맞바둑), 흑 7집반 공제 • 시간은 조금 여유있게 • 2시간, 1분 초읽기 3회 3/14/2016 모두의 알파고 © 2016 이동헌 8
  • 9. 알파고 – 이세돌9단의 대국 전망 (경기전) • 한국 • 이세돌 9단 본인: 승리 예측 • 전문가 여론: 첫 경기 승리 예측에는 대개 동의, 다음 경기들은 알 수 없음 • 일반 여론: 이세돌 9단의 승리 예측 • 외국 • 트위터 계정 비공인투표 50:50 [링크] • 비트코인 도박사이트 이세돌 9단 승리에 51.7% (가중투표치) [링크] • 독일 웹사이트 이세돌 9단 승리에 69.7% [링크] 3/14/2016 모두의 알파고 © 2016 이동헌 9
  • 10. 목차 • 알파고 약력 등 인적사항 • 알파고 – 이세돌9단의 대국 • 알파고 본체의 정체와 대국 실상 • 알파고 소프트웨어의 정체 • 알파고는 어떻게 훈련되었나? • 알파고는 (당연하지만) 사람이 아닙니다 • 알파고의 무엇이 새로운 것인가요? 3/14/2016 모두의 알파고 © 2016 이동헌 10
  • 11. 알파고의 정체? 3/14/2016 모두의 알파고 © 2016 이동헌 11
  • 12. 알파고의 정체? • 이 사진에는 알파고 본체가 없습니다 Aja Huang 이세돌 9단 알파고 화면 (화상통화) 3/14/2016 모두의 알파고 © 2016 이동헌 12
  • 13. 알파고 본체 기계의 정체 • 2015년 기준 • CPU 1202개, GPU 176개 • 참고로, • 가정용 PC 1대 = CPU 1개 • 게임용 1대 = CPU 1개+GPU 1개 3/14/2016 모두의 알파고 © 2016 이동헌 13
  • 14. 알파고 본체 기계의 정체 • 2015년 기준 • CPU 1202개, GPU 176개 • 참고로, • 가정용 PC 1대 = CPU 1개 • 게임용 1대 = CPU 1개+GPU 1개 • 이번 이세돌9단 경기에는 • “미국 중서부지역에 있는 구글 데이터센터” • 예를 들면 • 자세한 컴퓨터 사양은 미공개 구글 데이터센터 자료사진 3/14/2016 모두의 알파고 © 2016 이동헌 14
  • 15. 미국 중서부 어딘가의 구글 데이터센터 서울 포시즌스 호텔 대국장 알파고 대국의 실상 이세돌 9단 현재 바둑판 Aja Huang 구글 데이터센터 자료사진 상황 파악 3/14/2016 모두의 알파고 © 2016 이동헌 15
  • 16. 미국 중서부 어딘가의 구글 데이터센터 서울 포시즌스 호텔 대국장 알파고 대국의 실상 이세돌 9단 현재 바둑판 Aja Huang 구글 데이터센터 자료사진 다음 수 결정 3/14/2016 모두의 알파고 © 2016 이동헌 16
  • 17. 미국 중서부 어딘가의 구글 데이터센터 서울 포시즌스 호텔 대국장 알파고 대국의 실상 이세돌 9단 현재 바둑판 Aja Huang 구글 데이터센터 자료사진 그대로 실행 3/14/2016 모두의 알파고 © 2016 이동헌 17
  • 18. 미국 중서부 어딘가의 구글 데이터센터 서울 포시즌스 호텔 대국장 알파고 대국의 실상 이세돌 9단 현재 바둑판 Aja Huang 구글 데이터센터 자료사진 3/14/2016 모두의 알파고 © 2016 이동헌 18
  • 19. 목차 • 알파고 약력 등 인적사항 • 알파고 – 이세돌9단의 대국 • 알파고 본체의 정체와 대국 상황 • 알파고 소프트웨어의 정체 • 알파고는 어떻게 훈련되었나? • 알파고는 (당연하지만) 사람이 아닙니다 • 알파고의 무엇이 새로운 것인가요? 3/14/2016 모두의 알파고 © 2016 이동헌 19
  • 20. 미국 중서부 어딘가의 구글 데이터센터 서울 포시즌스 호텔 대국장 알파고 소프트웨어의 정체? 이세돌 9단 현재 바둑판 Aja Huang 구글 데이터센터 자료사진 3/14/2016 모두의 알파고 © 2016 이동헌 20
  • 21. 알파고 바둑 프로그램 알파고 소프트웨어의 정체 상대 바둑기사 다음 수 예측 프로그램 알파고의 다음 수 결정 프로그램 바둑경기 상황 유/불리 분석 프로그램 바둑판 미래 예측 시도 여러 번 미래예측 후 가장 많이 둔 수로 선택 현재 바둑판 바둑판 현상황 인식 프로그램 이세돌 9단 현재 바둑판 그림에서 지금 상황을 인식하자 3/14/2016 모두의 알파고 © 2016 이동헌 21
  • 22. 알파고 바둑 프로그램 알파고 소프트웨어의 정체 상대 바둑기사 다음 수 예측 프로그램 알파고의 다음 수 결정 프로그램 바둑경기 상황 유/불리 분석 프로그램 바둑판 미래 예측 시도 여러 번 미래예측 후 가장 많이 둔 수로 선택 현재 바둑판 바둑판 현상황 인식 프로그램 이세돌 9단 내가 승리에 얼마나 가까운지 생각해보자 3/14/2016 모두의 알파고 © 2016 이동헌 22
  • 23. 알파고 바둑 프로그램 알파고 소프트웨어의 정체 상대 바둑기사 다음 수 예측 프로그램 알파고의 다음 수 결정 프로그램 바둑경기 상황 유/불리 분석 프로그램 바둑판 미래 예측 시도 여러 번 미래예측 후 가장 많이 둔 수로 선택 현재 바둑판 바둑판 현상황 인식 프로그램 이세돌 9단 상대가 먼저 뒀으니 이제 내 차례네. 현재 대국상황에서 볼때 어디에 둬야할까? 3/14/2016 모두의 알파고 © 2016 이동헌 23
  • 24. 알파고 바둑 프로그램 알파고 소프트웨어의 정체 상대 바둑기사 다음 수 예측 프로그램 알파고의 다음 수 결정 프로그램 바둑경기 상황 유/불리 분석 프로그램 바둑판 미래 예측 시도 여러 번 미래예측 후 가장 많이 둔 수로 선택 현재 바둑판 바둑판 현상황 인식 프로그램 이세돌 9단 내가 여기 두면 상대방은 어디에 둘까? 3/14/2016 모두의 알파고 © 2016 이동헌 24
  • 25. 알파고 바둑 프로그램 알파고 소프트웨어의 정체 상대 바둑기사 다음 수 예측 프로그램 알파고의 다음 수 결정 프로그램 바둑경기 상황 유/불리 분석 프로그램 바둑판 미래 예측 시도 여러 번 미래예측 후 가장 많이 둔 수로 선택 현재 바둑판 바둑판 현상황 인식 프로그램 이세돌 9단 그러면 내 상황은? 그러면 나는 어디 둘까? 3/14/2016 모두의 알파고 © 2016 이동헌 25
  • 26. 알파고 바둑 프로그램 알파고 소프트웨어의 정체 상대 바둑기사 다음 수 예측 프로그램 알파고의 다음 수 결정 프로그램 바둑경기 상황 유/불리 분석 프로그램 바둑판 미래 예측 시도 여러 번 미래예측 후 가장 많이 둔 수로 선택 현재 바둑판 바둑판 현상황 인식 프로그램 이세돌 9단 그 다음은??? 3/14/2016 모두의 알파고 © 2016 이동헌 26
  • 27. 알파고 바둑 프로그램 알파고 소프트웨어의 정체 상대 바둑기사 다음 수 예측 프로그램 알파고의 다음 수 결정 프로그램 바둑경기 상황 유/불리 분석 프로그램 바둑판 미래 예측 시도 여러 번 미래예측 후 가장 많이 둔 수로 선택 현재 바둑판 바둑판 현상황 인식 프로그램 이세돌 9단 다시 처음으로 돌아가서 생각해보자. 만약 내가 다른 곳에 둔다면…? 3/14/2016 모두의 알파고 © 2016 이동헌 27
  • 28. 알파고 바둑 프로그램 알파고 소프트웨어의 정체 상대 바둑기사 다음 수 예측 프로그램 알파고의 다음 수 결정 프로그램 바둑경기 상황 유/불리 분석 프로그램 바둑판 미래 예측 시도 여러 번 미래예측 후 가장 많이 둔 수로 선택 현재 바둑판 바둑판 현상황 인식 프로그램 이세돌 9단 또다시 한번 더 해보자 3/14/2016 모두의 알파고 © 2016 이동헌 28
  • 29. 알파고 바둑 프로그램 알파고 소프트웨어의 정체 상대 바둑기사 다음 수 예측 프로그램 알파고의 다음 수 결정 프로그램 바둑경기 상황 유/불리 분석 프로그램 바둑판 미래 예측 시도 여러 번 미래예측 후 가장 많이 둔 수로 선택 현재 바둑판 바둑판 현상황 인식 프로그램 이세돌 9단 여러번 해봤는데 역시 이게 제일 많이 해본거야. 이걸로 가자. 3/14/2016 모두의 알파고 © 2016 이동헌 29
  • 30. 알파고 바둑 프로그램 알파고 소프트웨어의 정체 상대 바둑기사 다음 수 예측 프로그램 알파고의 다음 수 결정 프로그램 바둑경기 상황 유/불리 분석 프로그램 바둑판 미래 예측 시도 여러 번 미래예측 후 가장 많이 둔 수로 선택 현재 바둑판 바둑판 현상황 인식 프로그램 이세돌 9단 Aja Huang 3/14/2016 모두의 알파고 © 2016 이동헌 30
  • 31. 미국 중서부 어딘가의 구글 데이터센터 서울 포시즌스 호텔 대국장 알파고 소프트웨어의 정체 이세돌 9단 현재 바둑판 Aja Huang 구글 데이터센터 자료사진 다음 수 결정 3/14/2016 모두의 알파고 © 2016 이동헌 31
  • 32. 목차 • 알파고 약력 등 인적사항 • 알파고 – 이세돌9단의 대국 • 알파고 본체의 정체와 대국 상황 • 알파고 소프트웨어의 정체 • 알파고는 어떻게 훈련되었나? • 알파고는 (당연하지만) 사람이 아닙니다 • 알파고의 무엇이 새로운 것인가요? 3/14/2016 모두의 알파고 © 2016 이동헌 32
  • 33. 알파고는 어떻게 훈련되었나? • 개인교습 예제 문제 • 바둑판 돌 놓인 상황을 보여줄께 • 다음에 바둑판 어디에 돌이 놓일지 맞춰봐? • 이런 문제를 3천만개 먼저 풀어봄 • 57% 맞추는 상태까지 도달 3/14/2016 모두의 알파고 © 2016 이동헌 33
  • 34. 알파고는 어떻게 훈련되었나? • 개인교습 예제 문제 통과후, • 자체 연습 대국 • 실전 룰 (7집반 공제) 사용 • 한수 두는 데 2초로 시간제한 3/14/2016 모두의 알파고 © 2016 이동헌 34
  • 35. 알파고는 어떻게 훈련되었나? • 연습 대국은 실전보다 혹독하게 • 실전 룰 (7집반 공제) 사용 • 한수 두는 데 2초로 시간제한 • 상대방은 바로 나 자신 • 옛날버전 또는 최신버전의 알파고 프로그램과 시합 • 대국을 통한 경험으로 자체 프로그램 버전 업그레이드 3/14/2016 모두의 알파고 © 2016 이동헌 35
  • 36. 알파고는 어떻게 훈련되었나? • 자신과의 무한연습 데쓰매치 • 시합승률이 제일 높은 버전이 생존하는 데쓰매치 • 연습은 그만하라 할때까지 계속된다 • 1달에 1,000,000 시합 완료 • (사람이 백만 시합을 해보려면 약 10년이 걸린다고 합니다) 3/14/2016 모두의 알파고 © 2016 이동헌 36
  • 37. 목차 • 알파고 약력 등 인적사항 • 알파고 – 이세돌9단의 대국 • 알파고 본체의 정체와 대국 상황 • 알파고 소프트웨어의 정체 • 알파고는 어떻게 훈련되었나? • 알파고는 (당연하지만) 사람이 아닙니다 • 알파고의 무엇이 새로운 것인가요? 3/14/2016 모두의 알파고 © 2016 이동헌 37
  • 38. 알파고는 사람이 아닙니다 • 막대한 양의 개인교습 예제 • 바둑판 돌 놓인 상황을 보고, 다음에 어디에 둘지 맞춰봐? • 이런 문제를 3천만개 풀어보고 57% 맞추는 상태 • 실전보다 혹독한 자신과의 무한 데쓰매치 • 실전 룰 (7집반 공제) 사용 + 한수 두는 데 2초 시간제한 • 1,000,000 시합 완료 (1달만에) • 과거의 스스로와 경기해서 살아남은 것이 최종판 “알파고” 3/14/2016 모두의 알파고 © 2016 이동헌 38
  • 39. 알파고는 사람이 아닙니다 • 이 영화와 유사점이 있지요 • 기본기술부터 스승에게 배워나감 • 실전 무한반복으로 성장 • 절대강자 스승에게 도전 3/14/2016 모두의 알파고 © 2016 이동헌 39
  • 40. 알파고는 사람이 아닙니다 • 이 영화와 유사점이 있지요 • 기본기술부터 스승에게 배워나감 • 실전 무한반복으로 성장 • 절대강자 스승에게 도전 • 알파고가 더 나은 점이라면.. • 수많은 프로 바둑기사에게서 기본기를 배움 • 실전 무한반복해도 옛일을 잊어먹지 않음 • 실전 투입시에도 지치지 않음 • 감정이 없는 기계 멘탈 3/14/2016 모두의 알파고 © 2016 이동헌 40
  • 41. 알파고 – 이세돌9단 간단 비교 알파고 이세돌 9단 최소 300대 이상의 컴퓨터 (추정) 물리적 실체 인간 1명 위의 컴퓨터를 가동하는 데 들어가는 전력 대국시 소모품 1일 대사량 많이 잡아도 2500kcal + 커피 안가도 됩니다 화장실 갈 수 있습니다 실패하면 세이브&로드 가능 컨디션 조절 - 없습니다 피로도 쌓입니다 기계입니다 기억력 인간 최고 수준 (추정) 초당 백만 수 이상 (추정) 다음 수 시뮬레이션 능력 초당 백만 수는 힘들 것 같습니다 기계는 한눈같은거 못팝니다 집중력 인간 최고 수준 (추정) • 절대 같은 체급의 경기가 아닙니다 3/14/2016 모두의 알파고 © 2016 이동헌 41
  • 42. 목차 • 알파고 약력 등 인적사항 • 알파고 – 이세돌9단의 대국 • 알파고 본체의 정체와 대국 상황 • 알파고 소프트웨어의 정체 • 알파고는 어떻게 훈련되었나? • 알파고는 (당연하지만) 사람이 아닙니다 • 알파고의 무엇이 새로운 것인가요? 3/14/2016 모두의 알파고 © 2016 이동헌 42
  • 43. 알파고의 무엇이 새로운 것인가요? 알파고 바둑 프로그램 상대 바둑기사 다음 수 예측 프로그램 알파고의 다음 수 결정 프로그램 바둑경기 상황 유/불리 분석 프로그램 바둑판 미래 예측 시도 여러 번 미래예측 후 가장 많이 둔 수로 선택 바둑판 현상황 인식 프로그램 3/14/2016 모두의 알파고 © 2016 이동헌 43
  • 44. 알파고의 무엇이 새로운 것인가요? 1. 바둑기사들의 실제 기록을 과외받을 때 효율적으로 사용합니다 알파고 바둑 프로그램 상대 바둑기사 다음 수 예측 프로그램 알파고의 다음 수 결정 프로그램 바둑경기 상황 유/불리 분석 프로그램 바둑판 미래 예측 시도 여러 번 미래예측 후 가장 많이 둔 수로 선택 바둑판 현상황 인식 프로그램 3/14/2016 모두의 알파고 © 2016 이동헌 44
  • 45. 알파고의 무엇이 새로운 것인가요? 1. 바둑기사들의 실제 기록을 과외받을 때 효율적으로 사용합니다 2. 바둑판 미래예측을 매우 효율적인 방법으로 합니다 알파고 바둑 프로그램 상대 바둑기사 다음 수 예측 프로그램 알파고의 다음 수 결정 프로그램 바둑경기 상황 유/불리 분석 프로그램 바둑판 미래 예측 시도 여러 번 미래예측 후 가장 많이 둔 수로 선택 바둑판 현상황 인식 프로그램 3/14/2016 모두의 알파고 © 2016 이동헌 45
  • 46. 알파고의 무엇이 새로운 것인가요? 1. 바둑기사들의 실제 기록을 과외받을 때 효율적으로 사용합니다 2. 바둑판 미래예측을 매우 효율적인 방법으로 합니다 3. 상대 바둑기사 행동 예측과 현재 경기 상황분석에 딥러닝을 사용합니다 알파고 바둑 프로그램 상대 바둑기사 다음 수 예측 프로그램 알파고의 다음 수 결정 프로그램 바둑경기 상황 유/불리 분석 프로그램 바둑판 미래 예측 시도 여러 번 미래예측 후 가장 많이 둔 수로 선택 바둑판 현상황 인식 프로그램 3/14/2016 모두의 알파고 © 2016 이동헌 46
  • 47. 알파고의 무엇이 새로운 것인가요? 1. 바둑기사들의 실제 기록을 과외받을 때 효율적으로 사용합니다 2. 바둑판 미래예측을 매우 효율적인 방법으로 합니다 3. 상대 바둑기사 행동 예측과 현재 경기 상황분석에 딥러닝을 사용합니다 4. 위의 과정을 수많은 컴퓨터에서 동시에 실행합니다 3/14/2016 모두의 알파고 © 2016 이동헌 47
  • 48. 알파고의 무엇이 새로운 것인가요? 1. 바둑기사들의 실제 기록을 과외받을 때 효율적으로 사용합니다 2. 바둑판 미래예측을 매우 효율적인 방법으로 합니다 3. 상대 바둑기사 행동 예측과 현재 경기 상황분석에 딥러닝을 사용합니다 4. 위의 과정을 수많은 컴퓨터에서 동시에 실행합니다 5. 스스로 데쓰매치를 통해 더욱 강해집니다 3/14/2016 모두의 알파고 © 2016 이동헌 48
  • 49. “프로그래머를 위한 알파고” • 각 항목들을 구체적으로 다루어볼 예정입니다 1. 바둑기사들의 실제 기록을 과외받을 때 효율적으로 사용합니다 2. 바둑판 미래예측을 매우 효율적인 방법으로 합니다 3. 상대 바둑기사 행동 예측과 현재 경기 상황분석에 딥러닝을 사용합니다 4. 위의 과정을 수많은 컴퓨터에서 동시에 실행합니다 5. 스스로 데쓰매치를 통해 더욱 강해집니다 3/14/2016 모두의 알파고 © 2016 이동헌 49
  • 50. 요약 • 알파고는 복잡하고 새로운 바둑프로그램입니다 • 알파고는 컴퓨터 수백대의 능력을 쏟아붓습니다 • 알파고는 혹독한 훈련을 통해 실력을 쌓을 수 있습니다 • 알파고는 경험을 통해 강해져가는 프로그램입니다 • 그래서 더, 이세돌9단의 승리를 응원합니다 3/14/2016 모두의 알파고 © 2016 이동헌 50
  • 51. 수고하셨습니다 • 알파고의 바둑에 대해 더 자세한 내용을 알고 싶으시다면 • “바둑인을 위한 알파고” 를 읽어주세요 • 피드백/오류 제보 이메일이 필요하시면 여기로 보내주세요 • donghun2014@gmail.com 3/14/2016 모두의 알파고 © 2016 이동헌 51