SlideShare a Scribd company logo
1 of 9
Download to read offline
Gaussian ranking by
matrix factorization
Recsys 2015読み会
リクルートテクノロジーズ 坪坂 正志
紹介する論文
• Gaussian ranking by matrix factorization
– Harald Steck, Netflix
– Session 3 : Distinguished paperでの発表
Matrix factorization
• ユーザのアイテムに対する評価値をそれぞれに対して低次元のベクトルを割り
当ててベクトルの積として近似する
• ユーザuに対するアイテムiのスコア𝑠",$を
– 𝑠",$ = ∑ 𝑝$,( 𝑣",((	
  
– で表す
• Matrix factorizationの課題
– ユーザに対して低次元ベクトルを割り当てるのはユーザが極めて少数のアイテムしか評
価していない時、学習の精度がよくない
– 購買データや視聴データなどは買ったかやどうかの値しか得られず、レビューデータの
ように点数を得ることができない (観測されている値が1しか存在しない)
– 予測スコアについて最適化する形となるが実務上は最適化したいのはユーザにレコメン
ドするリストの上位の少数のアイテムについて最適化したい
AMF(Asymmetric matrix
factorization)
• 先行研究[Paterek, 2007]で提案されている手法
• ユーザの潜在ベクトルを直接計算せず、ユーザが評価しているアイテムの和で
表す
• 𝒗" =
,
-.
	
  ∑ 𝒒00∈2(")
• これにより、評価数が少ないユーザに対しても適切に潜在ベクトルを与えるこ
とができる、また新規ユーザに対してもモデルを計算しなおす必要がない
順位学習について
• レコメンドリストの順位を最適化するために学習時の目的関数をRMSEの最小
化ではなく、AUC,NDCGなどのリストの結果の上位に正解がくるかどうかを重
視した目的関数を利用する
• ここでNDCGは以下で表される指標となっている
• 𝑟$
6
は正解アイテムがリストの何番目の順位にきてるかを表す
– NDCGはDCGの最適な並びかえをした場合のリストのDCGとの比率を表し、0-1の値を
とる
𝐷𝐶𝐺 = :
1
log 𝑟$
6
+ 1
$
𝑁𝐷𝐶𝐺 =
𝐷𝐶𝐺
max 𝐷𝐶𝐺
スコア値による順位の近似
• ここでNDCGはリストの順位に依存するが、MFの出力はスコアで表される。
• 最適化を行う場合、
DE
DF
を計算する必要があるため、スコアから微分可能な関数
を用いて順位を近似する
• 論文ではスコアから順位を近似する手法としてプロビット関数やロジスティッ
ク関数による方法を提案している
NNとしての見方
• Neural networkとしてみた場合はユーザが評価した映画のバイナリデータから
ユーザの各アイテムに対する順位を出力するネットワークを学習している形と
なっている
(論文より引用)
評価について
• 2014年のある1日のNetflixでのビデオの視聴データをテストデータとして用いる
– その日の直前の6ヶ月のデータを訓練データとして利用する
• 手法ごとの具体的な評価値は公開せず基準からの相対的な差分を示している
– 基準の手法としては損失関数をRMSEとした通常のMFと同様(ただしMFではなくAMF)のも
のを利用する
– そのままだと評価値が全て1となるため、視聴されたアイテムの他にランダムにアイテムをサ
ンプルしてその値を0とする
• 評価結果を見るとレコメンド結果の上位1件に視聴されたデータが来る割合
(recall@1)などはAUCやnDCGを損失関数としたほうが高い値となっている
(論文より引用)
レビュー
• 新規性・独創性
– 3.8
– 順位学習において順位をスコア関数を用いて近似した点
• 有効性・実用性
– 4.2
– 実際のレコメンドの状況でよくある状況である明示的なフィードバックが得られない、
ユーザのフィードバック数が少ないという状況にうまくマッチした手法である

More Related Content

Viewers also liked

Contexual bandit @TokyoWebMining
Contexual bandit @TokyoWebMiningContexual bandit @TokyoWebMining
Contexual bandit @TokyoWebMining
正志 坪坂
 
確率モデルを使ったグラフクラスタリング
確率モデルを使ったグラフクラスタリング確率モデルを使ったグラフクラスタリング
確率モデルを使ったグラフクラスタリング
正志 坪坂
 
static index pruningについて
static index pruningについてstatic index pruningについて
static index pruningについて
正志 坪坂
 
Creator's night 05 31 2013
Creator's night 05 31 2013Creator's night 05 31 2013
Creator's night 05 31 2013
Len Matsuyama
 
PRML上巻勉強会 at 東京大学 資料 第5章5.1 〜 5.3.1
PRML上巻勉強会 at 東京大学 資料 第5章5.1 〜 5.3.1PRML上巻勉強会 at 東京大学 資料 第5章5.1 〜 5.3.1
PRML上巻勉強会 at 東京大学 資料 第5章5.1 〜 5.3.1
Len Matsuyama
 

Viewers also liked (20)

KDD 2015読み会
KDD 2015読み会KDD 2015読み会
KDD 2015読み会
 
KDD2014_study
KDD2014_study KDD2014_study
KDD2014_study
 
EMNLP2014_reading
EMNLP2014_readingEMNLP2014_reading
EMNLP2014_reading
 
Contexual bandit @TokyoWebMining
Contexual bandit @TokyoWebMiningContexual bandit @TokyoWebMining
Contexual bandit @TokyoWebMining
 
NIPS 2012 読む会
NIPS 2012 読む会NIPS 2012 読む会
NIPS 2012 読む会
 
確率モデルを使ったグラフクラスタリング
確率モデルを使ったグラフクラスタリング確率モデルを使ったグラフクラスタリング
確率モデルを使ったグラフクラスタリング
 
WSDM 2016勉強会 Geographic Segmentation via latent factor model
WSDM 2016勉強会 Geographic Segmentation via latent factor modelWSDM 2016勉強会 Geographic Segmentation via latent factor model
WSDM 2016勉強会 Geographic Segmentation via latent factor model
 
Tokyowebmining ctr-predict
Tokyowebmining ctr-predictTokyowebmining ctr-predict
Tokyowebmining ctr-predict
 
static index pruningについて
static index pruningについてstatic index pruningについて
static index pruningについて
 
PRML 5.3-5.4
PRML 5.3-5.4PRML 5.3-5.4
PRML 5.3-5.4
 
Exreme coffee brewing 2013 summer
Exreme coffee brewing 2013 summerExreme coffee brewing 2013 summer
Exreme coffee brewing 2013 summer
 
1994年頃の電子書籍(LT『本を読む人々 Vol.3』)
1994年頃の電子書籍(LT『本を読む人々 Vol.3』)1994年頃の電子書籍(LT『本を読む人々 Vol.3』)
1994年頃の電子書籍(LT『本を読む人々 Vol.3』)
 
Creator's night 05 31 2013
Creator's night 05 31 2013Creator's night 05 31 2013
Creator's night 05 31 2013
 
eXtreme Coffee Brewing 2014 summer
eXtreme Coffee Brewing 2014 summereXtreme Coffee Brewing 2014 summer
eXtreme Coffee Brewing 2014 summer
 
Hadoop World 2011: Large Scale Log Data Analysis for Marketing in NTT Communi...
Hadoop World 2011: Large Scale Log Data Analysis for Marketing in NTT Communi...Hadoop World 2011: Large Scale Log Data Analysis for Marketing in NTT Communi...
Hadoop World 2011: Large Scale Log Data Analysis for Marketing in NTT Communi...
 
PRML上巻勉強会 at 東京大学 資料 第5章5.1 〜 5.3.1
PRML上巻勉強会 at 東京大学 資料 第5章5.1 〜 5.3.1PRML上巻勉強会 at 東京大学 資料 第5章5.1 〜 5.3.1
PRML上巻勉強会 at 東京大学 資料 第5章5.1 〜 5.3.1
 
KDD2016勉強会 The Limits of Popularity-Based Recommendations, and the Role of So...
KDD2016勉強会 The Limits of Popularity-Based Recommendations, and the Role of So...KDD2016勉強会 The Limits of Popularity-Based Recommendations, and the Role of So...
KDD2016勉強会 The Limits of Popularity-Based Recommendations, and the Role of So...
 
Deeplearning輪読会
Deeplearning輪読会Deeplearning輪読会
Deeplearning輪読会
 
概要と具体例で学ぶHMM(隠れマルコフモデル)
概要と具体例で学ぶHMM(隠れマルコフモデル)概要と具体例で学ぶHMM(隠れマルコフモデル)
概要と具体例で学ぶHMM(隠れマルコフモデル)
 
リクルートのビッグデータ活用基盤とデータ活用に向けた取組み
リクルートのビッグデータ活用基盤とデータ活用に向けた取組みリクルートのビッグデータ活用基盤とデータ活用に向けた取組み
リクルートのビッグデータ活用基盤とデータ活用に向けた取組み
 

More from 正志 坪坂 (12)

Recsys2018 unbiased
Recsys2018 unbiasedRecsys2018 unbiased
Recsys2018 unbiased
 
WSDM2018Study
WSDM2018StudyWSDM2018Study
WSDM2018Study
 
OnlineMatching勉強会第一回
OnlineMatching勉強会第一回OnlineMatching勉強会第一回
OnlineMatching勉強会第一回
 
WSDM 2012 勉強会資料
WSDM 2012 勉強会資料WSDM 2012 勉強会資料
WSDM 2012 勉強会資料
 
Complex network-reading 7
Complex network-reading 7Complex network-reading 7
Complex network-reading 7
 
転置インデックスとTop k-query
転置インデックスとTop k-query転置インデックスとTop k-query
転置インデックスとTop k-query
 
EMNLP 2011 reading
EMNLP 2011 readingEMNLP 2011 reading
EMNLP 2011 reading
 
A scalable probablistic classifier for language modeling: ACL 2011 読み会
A scalable probablistic classifier for language modeling: ACL 2011 読み会A scalable probablistic classifier for language modeling: ACL 2011 読み会
A scalable probablistic classifier for language modeling: ACL 2011 読み会
 
Cvpr2011 reading-tsubosaka
Cvpr2011 reading-tsubosakaCvpr2011 reading-tsubosaka
Cvpr2011 reading-tsubosaka
 
Icml2011 reading-sage
Icml2011 reading-sageIcml2011 reading-sage
Icml2011 reading-sage
 
TokyowebminingInferNet
TokyowebminingInferNetTokyowebminingInferNet
TokyowebminingInferNet
 
Infer.NETを使ってLDAを実装してみた
Infer.NETを使ってLDAを実装してみたInfer.NETを使ってLDAを実装してみた
Infer.NETを使ってLDAを実装してみた
 

Recsys2015