12. Netflix Prize
The Netflix Prize was an open competition for the best collaborative filtering
algorithm to predict user ratings for films, based on previous ratings
— Wikipedia
協調フィルタリングアルゴリズムを競う公開コンペティション
ユーザが映画につけた点数(1-5)について、過去の点数をもとに未知の点数を予想する。
Netflix社(米国のDVDレンタル会社)はそのために一部のデータを公開
2009年に終了
11
13. 映画点数(レーティング)予想
ユーザが見た映画について点数をつけたとする
movie
user W X Y Z
A 5 4 1 4
B 4
C 2 3
D 1 4 ?
知られていないユーザ・映画の組について、点数を当てることができるか?
点数付けは疎行列として表現される
行列のゼロ要素の意味するものは実際には「ゼロ」ではなくて「不明」
12
16. レーティング vs 購入
映画の点数 ショッピングのレコメンデーション
movie item
user W X Y Z user W X Y Z
A 5 4 1 4 A 1 1 1 1
B 4 B 1
C 2 3 C 1
D 1 4 ? D 1 1 ?
ユーザと映画のペアについて点数を予想 どのくらいの確率で買ってくれそうか予想
否定的な情報を含まない
この行列は否定的な情報を含む
(不明な要素について、買わない理由はわ
(ある映画を、ある人は「つまらない(1点)」 からない)
という評価をしている) → 1の側に強く引っ張られる
知られている要素は一種類の値しかない
→ 高い自由度を与える
映画の点数予想で有効な手法が、ショッピングサイトのレコメンデーション
にそのまま役立つとは限らない。.
15
17. Solutions
• 初期ゼロ要素(=不明要素)を(不明ではなく)
ゼロとして扱う
– 付け焼刃的だが、PMFをそのまま使うよりうまくいく
• ある割合については、初期ゼロ要素が最適化後ゼ
ロであるとして扱う [Sindhwani et al. 2010]
– 初期ゼロ要素に新たな変数を割り当て緩和問題を解く
– 実験的には、上記手法よりうまくいく
V.Sindhwani et al., One-Class Matrix Completion with Low-Density Factorizations. In Proc. of ICDM
2010: 1055-1060
16