6. 발표 내용 : 이론 70% + 사례 30%
방법론 + 구축 사례 위주의 발표
(개발자가 아닌 분석가 관점, ML 위주)
7. 전체 흐름
추천 시스템 개발
Data
Collection
Data Processing Logic (Model)
Serving
APIService
Application
8. 발표 순서
• Interpretable
• 정의
• 솔루션
• Recommender System
• 피드백과 채널
• 문제 의식
• 접근 방법 : word2vec
• 하나의 방법으로 해결할 수 없을 때 : 앙상블
• Playground
• 추천 시스템 * 리서치
• 데이터 * 리서치
13. 머신러닝(Black Box)를 설명하기가 어렵다!
Definition
1. 모델( F(x) )이 어렵다.
해결 방법 : 동작 방법 F(X)을
보여주자
사용자가 Input 넣으면
Output이 나올 수 있도록
14. 머신러닝(Black Box)를 설명하기가 어렵다!
Definition
2. 데이터가 어렵다!
Wine Data - Six Dimensions (6-D)
X, Y, Z, Shape, Size, Color
해결 방법 : 시각화
사람은 4차원 이상의
데이터를 상상하기 어려움
28. Recommender System
GroupLens : 뉴스 추천을 위한 선구적인 연구 프로토타입 (ex. Booklens, MovieLens)
Amazon.com : 5점 척도 평점, 매출 35% 이상이 추천에서 발생한다고 함
Netflix 추천시스템 대회 : 480,189명 사용자에 17,770편에 대한 영화 평점 제공한 예측 대회
Google News Personalization System : 클릭하는 행동을 긍정적인 신호, 단항 평가
Facebook 친구 추천 : 소셜 네트워크 링크 예측하여 잠재적인 친구 추천
네이버 상품 추천 시스템 AiTEMS
: 라인 쇼핑에서 상품 클릭, 검색, 구매했던 소비패턴 기반 상품 추천
SK텔레콤 플로(FLO) 음악추천
: 고객이 직접 입력한 선호 아티스트나 장르를 기반으로 음악 추천
29. Recommender System
< 오버워치 2018년 8월 업데이트 >
(게임 사례) 오버워치 : 평가 기반의 좋아할만한 팀플레이, 지휘관 추천
- “추천 시스템, 긍정적 플레이 이끌어낼 ‘당근’”
#GDC2019
#블리자드
#오버워치
#추천시스템
#유저의부정적인행동
40% 줄여!
30. Recommender System
• 데이터 (로그, DB 스냅샷)
• 메타 데이터
• 로직
• 예측 모델
• 랭킹 모델
• 시스템
• Backend API
• 컨트롤러, 대시보드
• AB 테스트
40. 문제 의식
프로젝트 : Marvel Battle Lines
(마블 코믹스의 IP를 이용해
데브캣에서 개발한 모바일 TCG)
Q : 타노스를 무찌를 멤버(덱)을
어떻게 구성할 수 있을까?
41. 문제 의식
카드
• 마블 배틀라인은 마블 코믹스의 영웅들이 카드로 구성
• 카드에는 등급이 있고,
전투에서 사용할 때 코스믹 조각이 필요
• 카드는 공격력 / 방어력 / 레벨 등
게임 플레이 하면서 효과 특성이 다름
(필요 코스믹 개수가 다름, 캐릭터/액션 카드)
43. 문제 의식
말레키스 로난
두 캐릭터(말레키스, 로난)
카드는 얼마나 다를까???
카드들의 조합 = 덱은 어떻게?
VS
44. 문제 의식
Marvel Battle Lines : 카드 조합 전략 게임
-덱: 리더 카드 + 12장의 캐릭터 or 액션 카드
-유저 개인의 플레이 성향에 따라 덱 구성이 달라짐
Deck을 어떻게 평가할 수 있지?
=> IDEA. 카드를 숫자로 표현할 수 있지 않을까?
46. word2vec
Word Embedding : 비슷한 분포를 가진 단어들은 비슷한 의미를 가질 것이라는 가정
(단어들이 같은 문맥에서 등장한다는 것)
Example
The king loves the queen
The queen loves the king
The dwarf hates the king
The queen hates the dwarf
The dwarf poisons the king
The dwarf poisons the queen
The king (주변 단어) ______ (중심 단어) the dwarf (주변 단어)
(연속적인 여러 단어로부터 한 단어를 추측하는 것.
CBOW : Continuous bag of words model)
_____ ______ dwarf (중심 단어) _____ ______
(한 단어로부터 여러 단어를 추측하는 것. Skip gram)
61. Data & Research
• 2010년에 설립된 머신러닝 경진대회 플랫폼, 2017년 구글에게 인수
• 연구를 위해, 캐글은 데이터 사이언스를 익히기 가장 좋은 플랫폼
62. Data & Research
• Kdnuggets
• Machine Learning, Data Science, Data Mining, Big Data, Analytics,
AI. Software (Suites, Text, Visualization) 관련 웹사이트
63. Data & Research
• Towards Data Science
Low-Cost Cell Biology Experiments for Data Scientists. Paper
microscopes, public data repositories, and hosted notebooks
solutions
64. 전체 요약
• Interpretable은 머신러닝 모델을 뜯어보고 살펴보기
• Recommender System은 채널과 피드백을 잘 골라보기
• Research는 공부 + 다양한 데이터 보기 + 사례를 트래킹
65. Appendix
• Interpretable Machine Learning A Guide for Making Black Box Models
Explain
• The Art of Effective Visualization of Multi-dimensional Data
• The Illustrated Word2vec
• Recommender Systems The Textbook Charu C. Aggarwal
• 블리자드 스캇 머서 “추천 시스템, 긍정적 플레이 이끌어낼 ‘당근’”
http://www.khgames.co.kr/news/articleView.html?idxno=112527
http://www.thisisgame.com/webzine/news/nboard/4/?n=92529
• Visualizing Data using t-SNE
66. Speical Thanks!!
NDC 발표를 추천해주고 모든 기획 및 개발 소스를 내어주신 황준식님
추천TF 프로젝트 관련
마블배틀라인(조정훈님, 이원동님)
UP팀(이영득님, 원주경님, 채미르님)
플랫폼분석팀 (김영훈님, 강현정님, 문명희님)