SlideShare a Scribd company logo
1 of 22
推薦システムになにができるのか
Yoshifumi Seki
Gunosy Inc. / University of Tokyo
2013.09.26 @Tech Compass Vol.4
自己紹介
• 関喜史
• 株式会社Gunosy共同創業者
• 東京大学大学院工学系研究科
技術経営戦略学専攻博士後期課
程
• 複数の大手ウェブ系企業でデータマイニングエンジニアと
してインターン・アルバイトを経験
• ソーシャルゲーム分析・リンク予測・推薦システム
• 修士1年の夏休みに大学院の同級生とGunosyを開発しリ
リース.想像以上の反響を受け昨年11月に法人化.
Gunosyとは
• その人に合わせた情報を毎日届け
るサービス
– 朝夕25件ずつ配信
– iOS, Android, Webにて提供中
• 登録ユーザ60万人
• 本日version 3.0をリリース
– 周りで話題な記事が見れる
• 自分が読んだ記事を読んでいる人が他
に呼んでいる記事
• 友人が読んだ記事
• 興味の近い人が読んだ記事
– 興味のあるキーワードをGunosyに教
えることが可能
– カラーテーマが変えられる
今日の話
1. 推薦システムとはなにか
2. 近年の推薦システム研究のトピックについて
3. Gunosyでの実例
4. まとめ
ウェブと推薦エンジン
• ECサイトへの導入
– Amazon, e-bay
– ブラジルのECサイトにおける実験では推薦システムにより8-20%の売上の
向上が見られた (Bullefet al. 2012)
• パーソナライゼーション
– Google Search
– Facebookのタイムライン
– Pandora Radio
• オンラインラジオの70%
• アメリカのラジオの7%を示す
– Youtubeの推薦システム
• ランキングと比較して協調フィルタリングを導入したときクリック数が2倍に増
加した(Davidson et al. 2010)
• スマートフォンの普及
– 画面が小さい、操作性が低い、通信速度が遅い
– 大量の情報を以下に表示するか?
– 情報を減らす
• パーソナライゼーション
推薦システムとはなにか
• 膨大な情報の中からユーザに
適した情報を探索して提供す
る
1. どのようなデータを用いる
か?
2. どのようにフィルタリングを
行うか?
3. どのようにデータを用いる
か?
4. なにを推薦するか?
J. Bobadilla et al. - Recommender System Survey(2013)
1.どのようなデータを用いるのか
ユーザがどのような人間なのかを知るための情報を得る
• 明示的
– ユーザに対するアンケート
– レビュー
• 暗黙的
– ユーザの閲覧履歴
– 視線
2.どのようにフィルタリングするか
• デモグラフィックフィルタリング
– ユーザのプロフィール情報を用いる
– 男性なら、女性なら、若者ならといったプロフィールを元に推薦を行う
• 内容ベースフィルタリング
– 推薦したいアイテムの情報とユーザの情報を用いて推薦を行う.
– 過去に高く評価した映画と同じ監督の映画を推薦する
• 協調フィルタリング
– 「この商品を買った人はこんな商品も買っています」
– 他のユーザの行動から推薦を行う
• ハイブリッドフィルタリング
– 内容ベースと協調フィルタリングを組み合わせる
• 利点・欠点
– 内容ベースフィルタリングは「その映画は俳優が好きで見たのか,監督が好きで見たのか」
といったアイテムの情報の何がユーザを引きつけたかを判別するのが難しい.協調フィルタ
リングは他のユーザの履歴を用いるためこれは内包されている.
– 協調フィルタリングは他のユーザの情報やユーザ本人の情報が十分にシステム上に存在する
ことが前提になっているため,使えない場合がある.内容ベースでは他のユーザの情報は不要
である.
– ハイブリッドフィルタリングはあまり有効ではないケースが多かったが,近年SNSの情報を
活用することで精度が高まっており注目されている.
3.どのようにデータを用いるか?
• メモリベース
– 獲得したデータをそのまま用いて推薦結果を得る手法
• モデルベース
– 獲得したデータを用いて統計モデルを構築し,モデルの結果から
推薦結果を得る手法
• SVD, LDA, Naïve Bayesなど
• 利点・欠点
– メモリベースは取り扱いやすく,結果の解釈もしやすいが,潜在的
な要素を扱えなかったり,データのスパース性という問題を抱え
る.
– モデルベースでは潜在的な要素を扱ったり,データのスパース性
を解消出来るなどの利点も多いが,計算時間が膨大になるケース
や,新規データの追加が難しいケースもあり,専門的な背景がなけ
れば扱うのが非常に困難であるという問題もある.
4.どのような基準で推薦するか?
• 一般にフィルタリングはアイテムとユーザの間の類似性を評
価する
– 過去のユーザ行動や似ているユーザと類似しているアイテムのた
め,アクションに繋がりやすいという仮定
• 過去の行動と類似している記事ばかりだとユーザ体験を損ね
るのではという議論.
– diversity
• 推薦アイテム集合内で様々なアイテムは推薦されるようにする
– novelty
• ユーザの過去の体験や知識に対して様々なアイテムが推薦されるよう
にする
• 推薦エンジンへの信頼性を高めようという議論
– satiability
• ユーザの情報が尐し変わったところで結果があまり変わらないように
する
– 日によって結果が大きく変わるとよくない
– reliability
• その予測値がどの程度信頼出来るのかを反映して推薦する
近年の推薦システムに関するトピック
1. SNS情報の利用
2. ユーザ体験を重視したシステムの評価
3. 推薦の説明性
1.SNS情報の推薦システムへの活用
• 信頼性の情報を用いてフィルタリング性能を強化する
– SNS情報によって得られるもの
• アイテムに対する信頼性
• ユーザに対する信頼性
– 協調フィルタリングをSNSに拡張すると従来の協調フィルタリ
ングより結果が改善されるとの報告 (woerndl and groh
– ネットワークのトレンドを元に推薦する
• コンテンツベース推薦と協調フィルタリングの融合
– フォークソノミー(ユーザが付けたタグ)の情報を用いたシン
プルなコンテンツベース推薦
• 協調フィルタリング的要素も内包している
– コメント、友人関係などもfeatureの一つとして扱う
2.ユーザ体験を重視したシステムの
評価
• オンライン評価とオフライン評価
– 推薦システムの評価は一般にオフライン評価で行われる
• 3年分のECサイトのデータがある.1年分のデータを使って残り2
年のユーザの行動をどの程度再現できたか?
• 新規ユーザに対して人気なアイテムと評価が別れるアイ
テムを推薦するとユーザ満足度が高くなる(Rashid et al.
2002)
– 推薦していないのにユーザはすごく精度が高いと評価する
– ユーザモデルも作りやすい
• 推薦対象でないものを結果リストに差し込む(Ziegler et
al. 2005)
– ユーザはその結果が個人に最適化されていない事を認識はする
が,差し込まれた量が全体の30%程度であれば差し込まれた方を
好む
3.推薦システムにおける説明性
• アルゴリズムが洗練されて正しいことより,近い友人が薦めているという説明の
ほうが効果がある (Herlocker et al. 2000)
• 多様性を計算するよりタグをつけて多様に見せるほうが効果がある (Vig et al.
2009)
• 説明性の7つの指標(Tintarev and Masthoff, 2007)
– Transparency
• どのようにシステムが動いているか?
– Scrutability
• どのようにすればシステムに誤りを伝えられるか?
– Trust
• ユーザのシステムに対する信頼性を高めることができるか
– Effectiveness
• ユーザの”良い”意思決定を助けることができるか?
– Persuasiveness
• ユーザの購入やアクションを促進することができるか?
– Efficiency
• ユーザの意思決定を早めることができるか?
– Satisfaction
• ユーザビリティや満足度を高めることができるか?
Gunosyでの実例
• 推薦結果への多様性の導入
– リスト内に同じような内容の記事が入る割合を減らした
• 登録時アンケートの導入と改善(明示的な情報獲得、説明性の向
上)
– SNSをあまり使わない使わないユーザが増えてきた.SNSの活性度に応じて
ユーザの継続率に差があった.
– SNSを持っていないユーザもいたため,登録しないで離脱するユーザも多
かった.
– 継続率をベースに評価し,十分に成熟した段階でメールアドレス登録を解禁
し,登録突破率を高め継続率を維持.
one_month_active_
rate
user_num
アルゴリズム変更
まとめ
• 推薦システムに関する技術進化は発展途上
– 近年diversityやnoveltyなどユーザ視点に立った評価方法が考慮され
るようになってきた
• しかし「どのぐらいのdiversityがよいか」などの指標はいまだ確率され
ていない
– 対象とするアイテムの領域によっても問題は異なる
• ニュースは最新の情報になるので,過去の情報を積み重ねた協調フィル
タリング的要素は使いにくい
• 不動産・車は一生のうちの購買回数が尐ないため参考となるデータを
ためにくい
– 基礎理論は研究領域で進歩しているので、その考えをベースにしな
がらチューニングを適切に行なっていく必要がある
• 何を指標にするかが大事.サービスによってことなる.推薦エンジンを入
れる、のではなく何を目的に推薦エンジンを入れるのか?
• 本当にその問題は推薦で解決すべき問題なのか?
• データ分析も推薦エンジンも手法ではなく目的が非常に重要.
魔法の杖があっても使い道が悪くては意味が無い
お知らせ
• Gunosy研究会
– 毎週水曜日19:00
– データマイニング領域に関する書籍の輪読
• 次回:Introduction to Information Retrieval 20章
– データマイニング領域に関する論文の発表

More Related Content

What's hot

NetworkXによる語彙ネットワークの可視化
NetworkXによる語彙ネットワークの可視化NetworkXによる語彙ネットワークの可視化
NetworkXによる語彙ネットワークの可視化Shintaro Takemura
 
[論文紹介] LSTM (LONG SHORT-TERM MEMORY)
[論文紹介] LSTM (LONG SHORT-TERM MEMORY)[論文紹介] LSTM (LONG SHORT-TERM MEMORY)
[論文紹介] LSTM (LONG SHORT-TERM MEMORY)Tomoyuki Hioki
 
Bayesian Neural Networks : Survey
Bayesian Neural Networks : SurveyBayesian Neural Networks : Survey
Bayesian Neural Networks : Surveytmtm otm
 
「深層学習」第6章 畳込みニューラルネット
「深層学習」第6章 畳込みニューラルネット「深層学習」第6章 畳込みニューラルネット
「深層学習」第6章 畳込みニューラルネットKen'ichi Matsui
 
協調フィルタリングを利用した推薦システム構築
協調フィルタリングを利用した推薦システム構築協調フィルタリングを利用した推薦システム構築
協調フィルタリングを利用した推薦システム構築Masayuki Ota
 
統計的因果推論への招待 -因果構造探索を中心に-
統計的因果推論への招待 -因果構造探索を中心に-統計的因果推論への招待 -因果構造探索を中心に-
統計的因果推論への招待 -因果構造探索を中心に-Shiga University, RIKEN
 
研究分野をサーベイする
研究分野をサーベイする研究分野をサーベイする
研究分野をサーベイするTakayuki Itoh
 
モデル高速化百選
モデル高速化百選モデル高速化百選
モデル高速化百選Yusuke Uchida
 
[DL輪読会]AutoAugment: LearningAugmentation Strategies from Data & Learning Data...
[DL輪読会]AutoAugment: LearningAugmentation Strategies from Data & Learning Data...[DL輪読会]AutoAugment: LearningAugmentation Strategies from Data & Learning Data...
[DL輪読会]AutoAugment: LearningAugmentation Strategies from Data & Learning Data...Deep Learning JP
 
因果探索: 基本から最近の発展までを概説
因果探索: 基本から最近の発展までを概説因果探索: 基本から最近の発展までを概説
因果探索: 基本から最近の発展までを概説Shiga University, RIKEN
 
ゼロから始めるレコメンダシステム
ゼロから始めるレコメンダシステムゼロから始めるレコメンダシステム
ゼロから始めるレコメンダシステムKazuaki Tanida
 
MixMatch: A Holistic Approach to Semi- Supervised Learning
MixMatch: A Holistic Approach to Semi- Supervised LearningMixMatch: A Holistic Approach to Semi- Supervised Learning
MixMatch: A Holistic Approach to Semi- Supervised Learningharmonylab
 
Newman アルゴリズムによるソーシャルグラフのクラスタリング
Newman アルゴリズムによるソーシャルグラフのクラスタリングNewman アルゴリズムによるソーシャルグラフのクラスタリング
Newman アルゴリズムによるソーシャルグラフのクラスタリングAtsushi KOMIYA
 
最近のDeep Learning (NLP) 界隈におけるAttention事情
最近のDeep Learning (NLP) 界隈におけるAttention事情最近のDeep Learning (NLP) 界隈におけるAttention事情
最近のDeep Learning (NLP) 界隈におけるAttention事情Yuta Kikuchi
 
[DL輪読会](Sequential) Variational Autoencoders for Collaborative Filtering
[DL輪読会](Sequential) Variational Autoencoders for Collaborative Filtering[DL輪読会](Sequential) Variational Autoencoders for Collaborative Filtering
[DL輪読会](Sequential) Variational Autoencoders for Collaborative FilteringDeep Learning JP
 
潜在ディリクレ配分法
潜在ディリクレ配分法潜在ディリクレ配分法
潜在ディリクレ配分法y-uti
 

What's hot (20)

NetworkXによる語彙ネットワークの可視化
NetworkXによる語彙ネットワークの可視化NetworkXによる語彙ネットワークの可視化
NetworkXによる語彙ネットワークの可視化
 
[論文紹介] LSTM (LONG SHORT-TERM MEMORY)
[論文紹介] LSTM (LONG SHORT-TERM MEMORY)[論文紹介] LSTM (LONG SHORT-TERM MEMORY)
[論文紹介] LSTM (LONG SHORT-TERM MEMORY)
 
Bayesian Neural Networks : Survey
Bayesian Neural Networks : SurveyBayesian Neural Networks : Survey
Bayesian Neural Networks : Survey
 
「深層学習」第6章 畳込みニューラルネット
「深層学習」第6章 畳込みニューラルネット「深層学習」第6章 畳込みニューラルネット
「深層学習」第6章 畳込みニューラルネット
 
協調フィルタリングを利用した推薦システム構築
協調フィルタリングを利用した推薦システム構築協調フィルタリングを利用した推薦システム構築
協調フィルタリングを利用した推薦システム構築
 
モデルベース協調フィルタリングにおける推薦の透明性に関する検討
モデルベース協調フィルタリングにおける推薦の透明性に関する検討モデルベース協調フィルタリングにおける推薦の透明性に関する検討
モデルベース協調フィルタリングにおける推薦の透明性に関する検討
 
統計的因果推論への招待 -因果構造探索を中心に-
統計的因果推論への招待 -因果構造探索を中心に-統計的因果推論への招待 -因果構造探索を中心に-
統計的因果推論への招待 -因果構造探索を中心に-
 
研究分野をサーベイする
研究分野をサーベイする研究分野をサーベイする
研究分野をサーベイする
 
モデル高速化百選
モデル高速化百選モデル高速化百選
モデル高速化百選
 
[DL輪読会]AutoAugment: LearningAugmentation Strategies from Data & Learning Data...
[DL輪読会]AutoAugment: LearningAugmentation Strategies from Data & Learning Data...[DL輪読会]AutoAugment: LearningAugmentation Strategies from Data & Learning Data...
[DL輪読会]AutoAugment: LearningAugmentation Strategies from Data & Learning Data...
 
分散表現を用いたリアルタイム学習型セッションベース推薦システム
分散表現を用いたリアルタイム学習型セッションベース推薦システム分散表現を用いたリアルタイム学習型セッションベース推薦システム
分散表現を用いたリアルタイム学習型セッションベース推薦システム
 
因果探索: 基本から最近の発展までを概説
因果探索: 基本から最近の発展までを概説因果探索: 基本から最近の発展までを概説
因果探索: 基本から最近の発展までを概説
 
ゼロから始めるレコメンダシステム
ゼロから始めるレコメンダシステムゼロから始めるレコメンダシステム
ゼロから始めるレコメンダシステム
 
MICの解説
MICの解説MICの解説
MICの解説
 
MixMatch: A Holistic Approach to Semi- Supervised Learning
MixMatch: A Holistic Approach to Semi- Supervised LearningMixMatch: A Holistic Approach to Semi- Supervised Learning
MixMatch: A Holistic Approach to Semi- Supervised Learning
 
Newman アルゴリズムによるソーシャルグラフのクラスタリング
Newman アルゴリズムによるソーシャルグラフのクラスタリングNewman アルゴリズムによるソーシャルグラフのクラスタリング
Newman アルゴリズムによるソーシャルグラフのクラスタリング
 
最近のDeep Learning (NLP) 界隈におけるAttention事情
最近のDeep Learning (NLP) 界隈におけるAttention事情最近のDeep Learning (NLP) 界隈におけるAttention事情
最近のDeep Learning (NLP) 界隈におけるAttention事情
 
[DL輪読会](Sequential) Variational Autoencoders for Collaborative Filtering
[DL輪読会](Sequential) Variational Autoencoders for Collaborative Filtering[DL輪読会](Sequential) Variational Autoencoders for Collaborative Filtering
[DL輪読会](Sequential) Variational Autoencoders for Collaborative Filtering
 
潜在ディリクレ配分法
潜在ディリクレ配分法潜在ディリクレ配分法
潜在ディリクレ配分法
 
研究効率化Tips Ver.2
研究効率化Tips Ver.2研究効率化Tips Ver.2
研究効率化Tips Ver.2
 

Similar to 推薦システムになにができるのか - Techcompass

Similar to 推薦システムになにができるのか - Techcompass (20)

Zansa0802
Zansa0802Zansa0802
Zansa0802
 
Pytorchkaggle 190321072048
Pytorchkaggle 190321072048 Pytorchkaggle 190321072048
Pytorchkaggle 190321072048
 
Vue.js
Vue.js Vue.js
Vue.js
 
Kaggle
KaggleKaggle
Kaggle
 
Ionic2
Ionic2Ionic2
Ionic2
 
5 1
5 15 1
5 1
 
Kubernetes
KubernetesKubernetes
Kubernetes
 
利根川講演 In 香川201708
利根川講演 In 香川201708利根川講演 In 香川201708
利根川講演 In 香川201708
 
1114django
1114django1114django
1114django
 
Twitterインフルエンサー影響力測定サービスの現状と課題
Twitterインフルエンサー影響力測定サービスの現状と課題Twitterインフルエンサー影響力測定サービスの現状と課題
Twitterインフルエンサー影響力測定サービスの現状と課題
 
楽天の中のわたしと勉強会
楽天の中のわたしと勉強会楽天の中のわたしと勉強会
楽天の中のわたしと勉強会
 
Itca yammer提案110615
Itca yammer提案110615Itca yammer提案110615
Itca yammer提案110615
 
Go721
Go721Go721
Go721
 
0908
09080908
0908
 
7 14
7 14 7 14
7 14
 
Scikit learn
Scikit learnScikit learn
Scikit learn
 
Pytorchkaggle
PytorchkagglePytorchkaggle
Pytorchkaggle
 
02 20170311presentation inoueeri
02 20170311presentation inoueeri02 20170311presentation inoueeri
02 20170311presentation inoueeri
 
Go414
Go414Go414
Go414
 
ウォーターフォールでカンバンやってみた!
ウォーターフォールでカンバンやってみた!ウォーターフォールでカンバンやってみた!
ウォーターフォールでカンバンやってみた!
 

推薦システムになにができるのか - Techcompass