SlideShare a Scribd company logo
1 of 18
担当は予測
できるのか?
担当予測器作成記
自己紹介 2
名前 くるーとP
副業 データサイエンティスト
担当
デレ :高森藍子
シャニ :桑山千雪
お気に入り
の一枚
2018年11月@名古屋
Agenda 3
デモ
まとめ
昔作ったもの
今回作ったもの
分析内容
Agenda 4
デモ
まとめ
昔作ったもの
今回作ったもの
分析内容
デモ
ページhttp://imas-predict-web.s3-website-ap-northeast-
1.amazonaws.comに接続
2020/12/13 まで接続可能です
5
Agenda 6
デモ
まとめ
昔作ったもの
今回作ったもの
分析内容
昔作ったもの
アイドルマスターシリーズで
担当情報から別のシリーズでの担当を予測するシステム
7
詳しくは qiita の記事にまとめてあります(よかったらLGTMシテネ)
https://qiita.com/kuru-to/items/8acbb33baedadb7ba7e1
Agenda 8
デモ
まとめ
昔作ったもの
今回作ったもの
分析内容
今回作ったもの 9
ユーザー
S3
アクセス
ユーザーデータ
・予測結果
格納
画像
予測
リクエスト
予測結果・
画像格納場所
Web page
EC2
VPC
RDS
予測器
画像格納場所
返却
バケット
画像
Agenda 10
デモ
まとめ
昔作ったもの
今回作ったもの
分析内容
対象データ
集計方法:Google アンケート
データ数:7,425 件
質問事項:
1. あなたの性別を教えてください。
2. あなたの年代を教えてください。
以下、シリーズごとに
1. 本シリーズにおいて、自身が担当するアイドルはいらっしゃいますか?
2. あなたが初めて本シリーズのアイドルを担当してから、どのくらい経ちましたか?
3. 本シリーズのアイドルのうち、あなたの担当アイドルは誰ですか?(複数選択可能)
4. 上で選択したアイドルのうち、一人だけ担当を選ぶとしたら、誰ですか?
5. 上で選択した担当アイドルについてお聞きします。その担当アイドルを担当するにいたった一番のきっ
かけはなんでしたか?
11
お答えいただいた皆様、
本当にありがとうございました
今回使用したモデル 12
1 ユーザーベース協調フィルタリング
2 アイテムベース協調フィルタリング
※ 以後、協調フィルタリングはCF(Collaborative Filtering)と略します
アイテムベースCF:概要 13
類似
?
アイテムベースCF:学習とテスト 14
Train
Test
Cosine
類似度
行列積
推定値
実績値
比較
類似度
行列
対象シリーズ
以外のデータ
Test:実際のデータを用いる 15
Train
Test
Cosine
類似度
行列積
推定値
実績値
比較
類似度
行列
対象シリーズ
以外のデータ
70%
30%
Test:precision 率 16
ユーザー アイテム
55% 56%
37% 34%
49% 53%
80% 82%
Agenda 17
デモ
まとめ
昔作ったもの
今回作ったもの
分析内容
まとめ
• もっと精度上げたい!!!
• 再学習できるようにしたい!!!
• フロントエンドわかりたい!!!
• 無限のクラウドリソースがほしい
18

More Related Content

Similar to 担当は予測できるのか? 担当予測器作成記

G検定傾向と対策2018
G検定傾向と対策2018G検定傾向と対策2018
G検定傾向と対策2018Hide Fukano
 
欅坂46のメンバーを識別するアルゴリズムを作る
欅坂46のメンバーを識別するアルゴリズムを作る欅坂46のメンバーを識別するアルゴリズムを作る
欅坂46のメンバーを識別するアルゴリズムを作るKatsuya Ishiyama
 
G検定傾向と対策_pythonguild#3LT
G検定傾向と対策_pythonguild#3LTG検定傾向と対策_pythonguild#3LT
G検定傾向と対策_pythonguild#3LTHide Fukano
 
アクションマイニングを用いた最適なアクションの導出
アクションマイニングを用いた最適なアクションの導出アクションマイニングを用いた最適なアクションの導出
アクションマイニングを用いた最適なアクションの導出Shintaro Fukushima
 
位置データもPythonで!!!
位置データもPythonで!!!位置データもPythonで!!!
位置データもPythonで!!!hide ogawa
 
20201102 postgresql unconference_debility
20201102 postgresql unconference_debility20201102 postgresql unconference_debility
20201102 postgresql unconference_debilitySatoshi Hirata
 
再考: お買い得物件を機械学習で見つける方法
再考: お買い得物件を機械学習で見つける方法再考: お買い得物件を機械学習で見つける方法
再考: お買い得物件を機械学習で見つける方法智志 片桐
 

Similar to 担当は予測できるのか? 担当予測器作成記 (7)

G検定傾向と対策2018
G検定傾向と対策2018G検定傾向と対策2018
G検定傾向と対策2018
 
欅坂46のメンバーを識別するアルゴリズムを作る
欅坂46のメンバーを識別するアルゴリズムを作る欅坂46のメンバーを識別するアルゴリズムを作る
欅坂46のメンバーを識別するアルゴリズムを作る
 
G検定傾向と対策_pythonguild#3LT
G検定傾向と対策_pythonguild#3LTG検定傾向と対策_pythonguild#3LT
G検定傾向と対策_pythonguild#3LT
 
アクションマイニングを用いた最適なアクションの導出
アクションマイニングを用いた最適なアクションの導出アクションマイニングを用いた最適なアクションの導出
アクションマイニングを用いた最適なアクションの導出
 
位置データもPythonで!!!
位置データもPythonで!!!位置データもPythonで!!!
位置データもPythonで!!!
 
20201102 postgresql unconference_debility
20201102 postgresql unconference_debility20201102 postgresql unconference_debility
20201102 postgresql unconference_debility
 
再考: お買い得物件を機械学習で見つける方法
再考: お買い得物件を機械学習で見つける方法再考: お買い得物件を機械学習で見つける方法
再考: お買い得物件を機械学習で見つける方法
 

担当は予測できるのか? 担当予測器作成記

Editor's Notes

  1. 対象とするのは、twitterで拡散して集めた7,400件のアンケートデータです。 ご協力いただいた方々に熱く温冷申し上げます 大事なのは_3, _4 ですね どのキャラが好きか、ということです。 特に、先ほど申し上げた通り「担当」という言葉の定義は人それぞれです。 人によっては一人しか担当しませんって人もいれば、たくさん担当がいる人もいらっしゃいます。 なので、特に制約を定めず、複数選択可能としました。 きっかけについても、同じきっかけでキャラを好きになったのであれば、そこで類似性が生まれると思い追加することにしました。
  2. 今回はオーソドックスな協調フィルタリングを使用しました。 協調フィルタリングについて、軽くですが説明いたします。
  3. こちらは新しいユーザーをテストする場合も計算時間が少なくて済むのが特徴です。
  4. こちらは新しいユーザーをテストする場合も計算時間が少なくて済むのが特徴です。
  5. 全体での結果を見るとこんな感じです。 シャイニーは正答率が高いですね。その分シンデレラは低い。 人数比がもろに出ているかと思います。