SlideShare a Scribd company logo
1 of 12
Download to read offline
Matrix Factorization を使った評価予測



株式会社サイバーエージェント
アメーバ事業本部 Ameba Technology Laboratory
服部 司
株式会社サイバーエージェント
                                          2



今日紹介する話

・ ユーザーがアイテムにつける評価を予測する。
   - 大半のレビューサイトには5星評価有
   - 典型的な推薦の問題
株式会社サイバーエージェント
                                                          3



実現方法

・ 購買履歴、評価データを使った 協調 Filtering
   - 詳細は割愛
    ( “collaborative filter “ でググるべし )
株式会社サイバーエージェント
                                                                                           4



協調 Filtering のアルゴリズム

・ Netflix Prize
    -   Netflix : オンラインの映画レンタルショップ
        * user の映画の評価データいっぱい溜まってる。

    - 推薦アルゴリズムの精度(rmse)を10%改善したら100万ドル

          rmse     r           rij  n
                                      2
                     i, j   ij                ( i : user ,   j : item )




・ 流行のアルゴリズム
    -   PLSA、SlopeOne、KNN、Matrix Factorization*
             * Koren Y, Bell R : Advances in Collaborative Filtering (2011)
株式会社サイバーエージェント
                                                     5



Matrix Factorization
 ・ 概要
      - 正則化項付きのSVDの亜種

      - 利点
          *   精度がいい
          *   計算時間が速い
          *   モデルの柔軟性が非常に高い

      - 悪点
          *   並列計算が苦手
                - MapReduceと相性が悪い
株式会社サイバーエージェント
                                                                                                      6



MF の種類 ( SVD )

・ 予測モデル
     r 'ui    buser (u )  bitem (i )  U u I i                       (0  u  n , 0  i  m )

          r'ui   : 予測評価       buser   : 個人の影響       I    : 商品の属性 ( I  R k m )

                : 全体平均       bitem   : 商品の影響       U    : 個人の属性 ( U  R uk )




・ 学習方法
   min
   bU I
           (u ,i )R rui  r 'ui 2   buser 2  bitem 2  | U uT |2  I i 2 
                   最適化法 → 独特な確率的勾配法 (SGD)*
                                           ( * 本ケースでは理論的な収束保障が全くない )
株式会社サイバーエージェント
                                                                                                                  7



MF の種類 ( SVD++ )

・ 予測モデル
                                                                                       
                                                                                0.5
   r 'ui    buser (u )  bitem (i )  (U u  R(u )                                      jR ( u )
                                                                                                       y j )Ii
          R (u )   : ユーザーU が評価したアイテム集合
                                                                 k m
             y     : 商品へのあるアクションの効果 ( y  R                             )
                       - 今回は ”あるアクション = 商品を評価したという行為”



・ 学習方法
   min
   bU I
             ( u ,i )R
                           rui  r 'ui 
                                        2
                                                
                                             1 buser  bitem
                                                      2           2
                                                                         | U
                                                                            2
                                                                                   T 2
                                                                                   u   |  Ii  y j
                                                                                               2          2
                                                                                                              
                      最適化法 → SVDの方法を改良したSGD
株式会社サイバーエージェント
                                                                              8



評価実験
 データ: MovieLens 100k              ( http://www.grouplens.org/node/73 )
        ◆ user num : 938
        ◆ item num : 1682
        ◆ record num : 100,000


 評価 : MAE、RMSE ( 5fold-cross-validation )
        mae  ij rij  rij / n ( i : user, j : item )

 環境 : os : windows7              cpu : i7 (2.7G×4HT)
      memory: 8G

 比較アルゴリズム
    ・ Random、SlopeOne、SVD、SVD++
株式会社サイバーエージェント
                                                                        9



結果
 ◆ 精度
            random       SlopeOne     SVD      SVD++

     MAE    1.71757       0.74244    0.71411   0.71098

     RMSE   2.10189       0.94264    0.90573   0.90293

                                     * 精度は値が低い方が良い



 ◆ 計算時間

            random       SlopeOne     SVD      SVD++

     time
                     -       6,843    13,187   1,724,436
     (ms)
株式会社サイバーエージェント
                                                   10



雑記 ・ TIPS

・ SlopeOne を使うのなら、SVDの方が良いかも。


・ とはいえ、
    - SlopeOneに比して0.04程度(rmse)の改善幅。
    - 学習パラメータを決めるのに時間がかかる。


・ 評価予測だけでは推薦には使えない。
    - 所詮人気の商品の評価は高い。
      ( 個人の趣向による効果は薄い )
    - 評価予測をいかに推薦に昇華させる方が結構大事。
株式会社サイバーエージェント
                                                            11




・ timeSVD++
     - 時間によるユーザーの興味の編成を考慮したモデル
     - 精度は SVD++ より更に良い。
      ( rmse で 0.02 程度改善 )
     - パラメータを決めるのに時間がかかり過ぎる


・ サンプルコード
    - mf_predictor
      http://code.google.com/p/mf-predictor/
株式会社サイバーエージェント
                               12




ご清聴ありがとうございました!

More Related Content

What's hot

第四回 全日本CV勉強会スライド(MOTS: Multi-Object Tracking and Segmentation)
第四回 全日本CV勉強会スライド(MOTS: Multi-Object Tracking and Segmentation)第四回 全日本CV勉強会スライド(MOTS: Multi-Object Tracking and Segmentation)
第四回 全日本CV勉強会スライド(MOTS: Multi-Object Tracking and Segmentation)Yasunori Ozaki
 
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...SSII
 
画像認識と深層学習
画像認識と深層学習画像認識と深層学習
画像認識と深層学習Yusuke Uchida
 
Skip Connection まとめ(Neural Network)
Skip Connection まとめ(Neural Network)Skip Connection まとめ(Neural Network)
Skip Connection まとめ(Neural Network)Yamato OKAMOTO
 
深層学習の不確実性 - Uncertainty in Deep Neural Networks -
深層学習の不確実性 - Uncertainty in Deep Neural Networks -深層学習の不確実性 - Uncertainty in Deep Neural Networks -
深層学習の不確実性 - Uncertainty in Deep Neural Networks -tmtm otm
 
【メタサーベイ】Video Transformer
 【メタサーベイ】Video Transformer 【メタサーベイ】Video Transformer
【メタサーベイ】Video Transformercvpaper. challenge
 
【DL輪読会】Visual ChatGPT: Talking, Drawing and Editing with Visual Foundation Mo...
【DL輪読会】Visual ChatGPT: Talking, Drawing and Editing with Visual Foundation Mo...【DL輪読会】Visual ChatGPT: Talking, Drawing and Editing with Visual Foundation Mo...
【DL輪読会】Visual ChatGPT: Talking, Drawing and Editing with Visual Foundation Mo...Deep Learning JP
 
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向SSII
 
Domain Adaptation 発展と動向まとめ(サーベイ資料)
Domain Adaptation 発展と動向まとめ(サーベイ資料)Domain Adaptation 発展と動向まとめ(サーベイ資料)
Domain Adaptation 発展と動向まとめ(サーベイ資料)Yamato OKAMOTO
 
全力解説!Transformer
全力解説!Transformer全力解説!Transformer
全力解説!TransformerArithmer Inc.
 
[DL輪読会]Convolutional Sequence to Sequence Learning
[DL輪読会]Convolutional Sequence to Sequence Learning[DL輪読会]Convolutional Sequence to Sequence Learning
[DL輪読会]Convolutional Sequence to Sequence LearningDeep Learning JP
 
ICML 2021 Workshop 深層学習の不確実性について
ICML 2021 Workshop 深層学習の不確実性についてICML 2021 Workshop 深層学習の不確実性について
ICML 2021 Workshop 深層学習の不確実性についてtmtm otm
 
ドメイン適応の原理と応用
ドメイン適応の原理と応用ドメイン適応の原理と応用
ドメイン適応の原理と応用Yoshitaka Ushiku
 
【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features
【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features
【論文読み会】Deep Clustering for Unsupervised Learning of Visual FeaturesARISE analytics
 
[DL輪読会]ICLR2020の分布外検知速報
[DL輪読会]ICLR2020の分布外検知速報[DL輪読会]ICLR2020の分布外検知速報
[DL輪読会]ICLR2020の分布外検知速報Deep Learning JP
 
【LT資料】 Neural Network 素人なんだけど何とかご機嫌取りをしたい
【LT資料】 Neural Network 素人なんだけど何とかご機嫌取りをしたい【LT資料】 Neural Network 素人なんだけど何とかご機嫌取りをしたい
【LT資料】 Neural Network 素人なんだけど何とかご機嫌取りをしたいTakuji Tahara
 
cvpaper.challenge 研究効率化 Tips
cvpaper.challenge 研究効率化 Tipscvpaper.challenge 研究効率化 Tips
cvpaper.challenge 研究効率化 Tipscvpaper. challenge
 
【DL輪読会】The Forward-Forward Algorithm: Some Preliminary
【DL輪読会】The Forward-Forward Algorithm: Some Preliminary【DL輪読会】The Forward-Forward Algorithm: Some Preliminary
【DL輪読会】The Forward-Forward Algorithm: Some PreliminaryDeep Learning JP
 
【DL輪読会】Scale Efficiently: Insights from Pre-training and Fine-tuning Transfor...
【DL輪読会】Scale Efficiently: Insights from Pre-training and Fine-tuning Transfor...【DL輪読会】Scale Efficiently: Insights from Pre-training and Fine-tuning Transfor...
【DL輪読会】Scale Efficiently: Insights from Pre-training and Fine-tuning Transfor...Deep Learning JP
 
Attentionの基礎からTransformerの入門まで
Attentionの基礎からTransformerの入門までAttentionの基礎からTransformerの入門まで
Attentionの基礎からTransformerの入門までAGIRobots
 

What's hot (20)

第四回 全日本CV勉強会スライド(MOTS: Multi-Object Tracking and Segmentation)
第四回 全日本CV勉強会スライド(MOTS: Multi-Object Tracking and Segmentation)第四回 全日本CV勉強会スライド(MOTS: Multi-Object Tracking and Segmentation)
第四回 全日本CV勉強会スライド(MOTS: Multi-Object Tracking and Segmentation)
 
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
 
画像認識と深層学習
画像認識と深層学習画像認識と深層学習
画像認識と深層学習
 
Skip Connection まとめ(Neural Network)
Skip Connection まとめ(Neural Network)Skip Connection まとめ(Neural Network)
Skip Connection まとめ(Neural Network)
 
深層学習の不確実性 - Uncertainty in Deep Neural Networks -
深層学習の不確実性 - Uncertainty in Deep Neural Networks -深層学習の不確実性 - Uncertainty in Deep Neural Networks -
深層学習の不確実性 - Uncertainty in Deep Neural Networks -
 
【メタサーベイ】Video Transformer
 【メタサーベイ】Video Transformer 【メタサーベイ】Video Transformer
【メタサーベイ】Video Transformer
 
【DL輪読会】Visual ChatGPT: Talking, Drawing and Editing with Visual Foundation Mo...
【DL輪読会】Visual ChatGPT: Talking, Drawing and Editing with Visual Foundation Mo...【DL輪読会】Visual ChatGPT: Talking, Drawing and Editing with Visual Foundation Mo...
【DL輪読会】Visual ChatGPT: Talking, Drawing and Editing with Visual Foundation Mo...
 
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向
 
Domain Adaptation 発展と動向まとめ(サーベイ資料)
Domain Adaptation 発展と動向まとめ(サーベイ資料)Domain Adaptation 発展と動向まとめ(サーベイ資料)
Domain Adaptation 発展と動向まとめ(サーベイ資料)
 
全力解説!Transformer
全力解説!Transformer全力解説!Transformer
全力解説!Transformer
 
[DL輪読会]Convolutional Sequence to Sequence Learning
[DL輪読会]Convolutional Sequence to Sequence Learning[DL輪読会]Convolutional Sequence to Sequence Learning
[DL輪読会]Convolutional Sequence to Sequence Learning
 
ICML 2021 Workshop 深層学習の不確実性について
ICML 2021 Workshop 深層学習の不確実性についてICML 2021 Workshop 深層学習の不確実性について
ICML 2021 Workshop 深層学習の不確実性について
 
ドメイン適応の原理と応用
ドメイン適応の原理と応用ドメイン適応の原理と応用
ドメイン適応の原理と応用
 
【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features
【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features
【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features
 
[DL輪読会]ICLR2020の分布外検知速報
[DL輪読会]ICLR2020の分布外検知速報[DL輪読会]ICLR2020の分布外検知速報
[DL輪読会]ICLR2020の分布外検知速報
 
【LT資料】 Neural Network 素人なんだけど何とかご機嫌取りをしたい
【LT資料】 Neural Network 素人なんだけど何とかご機嫌取りをしたい【LT資料】 Neural Network 素人なんだけど何とかご機嫌取りをしたい
【LT資料】 Neural Network 素人なんだけど何とかご機嫌取りをしたい
 
cvpaper.challenge 研究効率化 Tips
cvpaper.challenge 研究効率化 Tipscvpaper.challenge 研究効率化 Tips
cvpaper.challenge 研究効率化 Tips
 
【DL輪読会】The Forward-Forward Algorithm: Some Preliminary
【DL輪読会】The Forward-Forward Algorithm: Some Preliminary【DL輪読会】The Forward-Forward Algorithm: Some Preliminary
【DL輪読会】The Forward-Forward Algorithm: Some Preliminary
 
【DL輪読会】Scale Efficiently: Insights from Pre-training and Fine-tuning Transfor...
【DL輪読会】Scale Efficiently: Insights from Pre-training and Fine-tuning Transfor...【DL輪読会】Scale Efficiently: Insights from Pre-training and Fine-tuning Transfor...
【DL輪読会】Scale Efficiently: Insights from Pre-training and Fine-tuning Transfor...
 
Attentionの基礎からTransformerの入門まで
Attentionの基礎からTransformerの入門までAttentionの基礎からTransformerの入門まで
Attentionの基礎からTransformerの入門まで
 

Similar to Matrix Factorizationを使った評価予測

GCM#4 アーティストのためのプログラマブルシェーダー講座Part2
GCM#4 アーティストのためのプログラマブルシェーダー講座Part2GCM#4 アーティストのためのプログラマブルシェーダー講座Part2
GCM#4 アーティストのためのプログラマブルシェーダー講座Part2GREE/Art
 
人が注目する箇所を当てるSaliency Detectionの最新モデル UCNet(CVPR2020)
人が注目する箇所を当てるSaliency Detectionの最新モデル UCNet(CVPR2020)人が注目する箇所を当てるSaliency Detectionの最新モデル UCNet(CVPR2020)
人が注目する箇所を当てるSaliency Detectionの最新モデル UCNet(CVPR2020)Shintaro Yoshida
 
DXRubyとスプライトエディタ
DXRubyとスプライトエディタDXRubyとスプライトエディタ
DXRubyとスプライトエディタmieki256 blawat
 
【論文LT資料】 Gait Recognition via Disentangled Representation Learning (CVPR2019)
【論文LT資料】 Gait Recognition via Disentangled Representation Learning (CVPR2019)【論文LT資料】 Gait Recognition via Disentangled Representation Learning (CVPR2019)
【論文LT資料】 Gait Recognition via Disentangled Representation Learning (CVPR2019)Takuji Tahara
 
20110909 品質シンポジウム2011発表資料
20110909 品質シンポジウム2011発表資料20110909 品質シンポジウム2011発表資料
20110909 品質シンポジウム2011発表資料Kenichiro Nakajima
 
130710 02
130710 02130710 02
130710 02openrtm
 
数据挖掘竞赛经验分享 严强
数据挖掘竞赛经验分享 严强数据挖掘竞赛经验分享 严强
数据挖掘竞赛经验分享 严强Felicia Wenyi Fei
 
Analysis of Service Interface International Standardization Benefits
Analysis of Service Interface International Standardization BenefitsAnalysis of Service Interface International Standardization Benefits
Analysis of Service Interface International Standardization Benefitsnnakagoshi
 
[豆ナイト]Java small object programming
[豆ナイト]Java small object programming[豆ナイト]Java small object programming
[豆ナイト]Java small object programmingYuichi Hasegawa
 

Similar to Matrix Factorizationを使った評価予測 (12)

GCM#4 アーティストのためのプログラマブルシェーダー講座Part2
GCM#4 アーティストのためのプログラマブルシェーダー講座Part2GCM#4 アーティストのためのプログラマブルシェーダー講座Part2
GCM#4 アーティストのためのプログラマブルシェーダー講座Part2
 
M5 sinchir0
M5 sinchir0M5 sinchir0
M5 sinchir0
 
Bee Style:vol.039
Bee Style:vol.039Bee Style:vol.039
Bee Style:vol.039
 
人が注目する箇所を当てるSaliency Detectionの最新モデル UCNet(CVPR2020)
人が注目する箇所を当てるSaliency Detectionの最新モデル UCNet(CVPR2020)人が注目する箇所を当てるSaliency Detectionの最新モデル UCNet(CVPR2020)
人が注目する箇所を当てるSaliency Detectionの最新モデル UCNet(CVPR2020)
 
DXRubyとスプライトエディタ
DXRubyとスプライトエディタDXRubyとスプライトエディタ
DXRubyとスプライトエディタ
 
【論文LT資料】 Gait Recognition via Disentangled Representation Learning (CVPR2019)
【論文LT資料】 Gait Recognition via Disentangled Representation Learning (CVPR2019)【論文LT資料】 Gait Recognition via Disentangled Representation Learning (CVPR2019)
【論文LT資料】 Gait Recognition via Disentangled Representation Learning (CVPR2019)
 
20110909 品質シンポジウム2011発表資料
20110909 品質シンポジウム2011発表資料20110909 品質シンポジウム2011発表資料
20110909 品質シンポジウム2011発表資料
 
130710 02
130710 02130710 02
130710 02
 
数据挖掘竞赛经验分享 严强
数据挖掘竞赛经验分享 严强数据挖掘竞赛经验分享 严强
数据挖掘竞赛经验分享 严强
 
ADVENTURE_Solidの概要
ADVENTURE_Solidの概要ADVENTURE_Solidの概要
ADVENTURE_Solidの概要
 
Analysis of Service Interface International Standardization Benefits
Analysis of Service Interface International Standardization BenefitsAnalysis of Service Interface International Standardization Benefits
Analysis of Service Interface International Standardization Benefits
 
[豆ナイト]Java small object programming
[豆ナイト]Java small object programming[豆ナイト]Java small object programming
[豆ナイト]Java small object programming
 

More from JAVA DM

MP Joinを使った類似データ抽出
MP Joinを使った類似データ抽出MP Joinを使った類似データ抽出
MP Joinを使った類似データ抽出JAVA DM
 
芸能人推薦のしくみ
芸能人推薦のしくみ芸能人推薦のしくみ
芸能人推薦のしくみJAVA DM
 
20100930sig startups learn
20100930sig startups learn20100930sig startups learn
20100930sig startups learnJAVA DM
 
お披露目会05/2010
お披露目会05/2010お披露目会05/2010
お披露目会05/2010JAVA DM
 
双対定理
双対定理双対定理
双対定理JAVA DM
 
整数列圧縮
整数列圧縮整数列圧縮
整数列圧縮JAVA DM
 
NewPFD PForDelta
NewPFD PForDeltaNewPFD PForDelta
NewPFD PForDeltaJAVA DM
 
NaiveBayes+DAEM
NaiveBayes+DAEMNaiveBayes+DAEM
NaiveBayes+DAEMJAVA DM
 
lsh p-stable
lsh p-stablelsh p-stable
lsh p-stableJAVA DM
 

More from JAVA DM (9)

MP Joinを使った類似データ抽出
MP Joinを使った類似データ抽出MP Joinを使った類似データ抽出
MP Joinを使った類似データ抽出
 
芸能人推薦のしくみ
芸能人推薦のしくみ芸能人推薦のしくみ
芸能人推薦のしくみ
 
20100930sig startups learn
20100930sig startups learn20100930sig startups learn
20100930sig startups learn
 
お披露目会05/2010
お披露目会05/2010お披露目会05/2010
お披露目会05/2010
 
双対定理
双対定理双対定理
双対定理
 
整数列圧縮
整数列圧縮整数列圧縮
整数列圧縮
 
NewPFD PForDelta
NewPFD PForDeltaNewPFD PForDelta
NewPFD PForDelta
 
NaiveBayes+DAEM
NaiveBayes+DAEMNaiveBayes+DAEM
NaiveBayes+DAEM
 
lsh p-stable
lsh p-stablelsh p-stable
lsh p-stable
 

Recently uploaded

Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptxsn679259
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...Toru Tamaki
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイスCRI Japan, Inc.
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Gamesatsushi061452
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video UnderstandingToru Tamaki
 
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsWSO2
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルCRI Japan, Inc.
 

Recently uploaded (10)

Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
 
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 

Matrix Factorizationを使った評価予測

  • 2. 株式会社サイバーエージェント 2 今日紹介する話 ・ ユーザーがアイテムにつける評価を予測する。 - 大半のレビューサイトには5星評価有 - 典型的な推薦の問題
  • 3. 株式会社サイバーエージェント 3 実現方法 ・ 購買履歴、評価データを使った 協調 Filtering - 詳細は割愛 ( “collaborative filter “ でググるべし )
  • 4. 株式会社サイバーエージェント 4 協調 Filtering のアルゴリズム ・ Netflix Prize - Netflix : オンラインの映画レンタルショップ * user の映画の評価データいっぱい溜まってる。 - 推薦アルゴリズムの精度(rmse)を10%改善したら100万ドル rmse   r  rij  n 2 i, j ij ( i : user , j : item ) ・ 流行のアルゴリズム - PLSA、SlopeOne、KNN、Matrix Factorization* * Koren Y, Bell R : Advances in Collaborative Filtering (2011)
  • 5. 株式会社サイバーエージェント 5 Matrix Factorization ・ 概要 - 正則化項付きのSVDの亜種 - 利点 * 精度がいい * 計算時間が速い * モデルの柔軟性が非常に高い - 悪点 * 並列計算が苦手 - MapReduceと相性が悪い
  • 6. 株式会社サイバーエージェント 6 MF の種類 ( SVD ) ・ 予測モデル r 'ui    buser (u )  bitem (i )  U u I i (0  u  n , 0  i  m ) r'ui : 予測評価 buser : 個人の影響 I : 商品の属性 ( I  R k m )  : 全体平均 bitem : 商品の影響 U : 個人の属性 ( U  R uk ) ・ 学習方法 min bU I (u ,i )R rui  r 'ui 2   buser 2  bitem 2  | U uT |2  I i 2  最適化法 → 独特な確率的勾配法 (SGD)* ( * 本ケースでは理論的な収束保障が全くない )
  • 7. 株式会社サイバーエージェント 7 MF の種類 ( SVD++ ) ・ 予測モデル  0.5 r 'ui    buser (u )  bitem (i )  (U u  R(u ) jR ( u ) y j )Ii R (u ) : ユーザーU が評価したアイテム集合 k m y : 商品へのあるアクションの効果 ( y  R ) - 今回は ”あるアクション = 商品を評価したという行為” ・ 学習方法 min bU I  ( u ,i )R rui  r 'ui  2   1 buser  bitem 2 2    | U 2 T 2 u |  Ii  y j 2 2  最適化法 → SVDの方法を改良したSGD
  • 8. 株式会社サイバーエージェント 8 評価実験 データ: MovieLens 100k ( http://www.grouplens.org/node/73 ) ◆ user num : 938 ◆ item num : 1682 ◆ record num : 100,000 評価 : MAE、RMSE ( 5fold-cross-validation ) mae  ij rij  rij / n ( i : user, j : item ) 環境 : os : windows7 cpu : i7 (2.7G×4HT) memory: 8G 比較アルゴリズム ・ Random、SlopeOne、SVD、SVD++
  • 9. 株式会社サイバーエージェント 9 結果 ◆ 精度 random SlopeOne SVD SVD++ MAE 1.71757 0.74244 0.71411 0.71098 RMSE 2.10189 0.94264 0.90573 0.90293 * 精度は値が低い方が良い ◆ 計算時間 random SlopeOne SVD SVD++ time - 6,843 13,187 1,724,436 (ms)
  • 10. 株式会社サイバーエージェント 10 雑記 ・ TIPS ・ SlopeOne を使うのなら、SVDの方が良いかも。 ・ とはいえ、 - SlopeOneに比して0.04程度(rmse)の改善幅。 - 学習パラメータを決めるのに時間がかかる。 ・ 評価予測だけでは推薦には使えない。 - 所詮人気の商品の評価は高い。 ( 個人の趣向による効果は薄い ) - 評価予測をいかに推薦に昇華させる方が結構大事。
  • 11. 株式会社サイバーエージェント 11 ・ timeSVD++ - 時間によるユーザーの興味の編成を考慮したモデル - 精度は SVD++ より更に良い。 ( rmse で 0.02 程度改善 ) - パラメータを決めるのに時間がかかり過ぎる ・ サンプルコード - mf_predictor http://code.google.com/p/mf-predictor/
  • 12. 株式会社サイバーエージェント 12 ご清聴ありがとうございました!