SlideShare a Scribd company logo
1 of 44
実ビジネスデータへのRの活用と
その限界
2013年12月7日
Japan.R 2013
@Yahoo!Japan

2013年12月9日月曜日
自己紹介
名前           
伊藤 徹郎 (@tetsuroito)
所属
株式会社ALBERT データ分析部
好きなもの
サッカー、スキー、オレオ、鰤しゃぶ
R歴
2年くらい
2013年12月9日月曜日

マサカリ投げないでください
株式会社ALBERTについて

分析力をコアとする
マーケティングソリューションカンパニー
2013年12月9日月曜日
サイトの宣伝
分析関係の読み物も豊富に用意しているので、
ぜひ遊びに来てください

2013年12月9日月曜日
主な事業領域

上記3領域でビジネス展開
2013年12月9日月曜日
ちょこっと紹介

従来のレコメンドアルゴリズムの欠点を改善した
デュアルチューニングロジックβを搭載した
レコメンド特化型DSP

2013年12月9日月曜日
ちょこっと紹介
曜

や地域、OSなどの要素を加味して配信クリエイティブを決定する。

最も効果の

媒体#地域#表示回数#時間$%&"
※'(種類の変数を加味

い

i-E ect

クリエイティブを選択

②インプレッション情報が
 配信システムへ

③最適なクリエイティブを

配信
ネットワーク
④最適なクリエイティブを
 配信システムへ

⑤配信指示

①ユーザーがサイトに訪問
 ◎平日の昼
 ◎東京から
 ◎OSはChrome

この媒体なら配信しても
効果がありそうだ。
配信決定!
どのクリエイティブを
配信しようか?

!"
配信システムと組み合わせることで、効率的かつ効果的に配信することを実現

2013年12月9日月曜日
ちょこっと紹介
短期間でベストクリエイティブを発
ALBERTでは、膨 な広告クリエイティブを実験計画法を応 した独 の 法を いて絞
り込み、最適なクリエイティブを短期間で特定するアルゴリズムを確 しております。
通常1~2ヶ 以上かかるデー
タの蓄積を2 3週間のデータ
蓄積で分析が可能に!

全てのクリエイティブを同時に配信すると
クリック数を確保するまでに時間がかかってしまう。

ALBERT独 の統計的
法を い、各要素の
全てのパーツを含むク
リエイティブを抽出。

2013年12月9日月曜日

配信クリエイティブ数を
絞り込むことで1クリエイ
ティブあたりのクリック
数を増やし効率的にデー
タを取得。

各パーツの効 値を
算出することで早期
にベストクリエイ
ティブを発 !
今、注力しているもの

3つのビジネス領域が有機的に関連
2013年12月9日月曜日
AWSとの連携もしています

出典:AWS国内導入事例

Redshift楽しいよ!
2013年12月9日月曜日
そろそろRの話

2013年12月9日月曜日
と言えば

豊富なパッケージの数々
無料なのでどこでも使える
Web上にドキュメントも豊富
メリットいっぱい!
2013年12月9日月曜日
はどこで使ってる?

アドホック分析で使ってます

は統計解析環境

2013年12月9日月曜日
実務でよく使う決定木とか

※個人的にツリーの図が
もう少しイケてるといいな
2013年12月9日月曜日
地図のマッピングとか

1000

37123
37165
37029

500

500

37007

1500

37093

2000

2500

37125

1000

1500

spatially lagged d79

37131

Local Moran's I (I values)

0

200

400

600

800

0

d74

100

200

300

400

d79

1000
800
600
400
200
0

Local Moran's I (I values)
0
0.18
0.92
2.28
18.01

1000
800
600
400
200
0

2013年12月9日月曜日

37005

0

0

spatially lagged d74

2000

37117
37153

0
0.2
0.56
1.54
8.19

500

600
機械学習とか
手法
決定木(CART)
ランダムフォレスト(RF)
Extremely Randomized Trees(ET)
ニューラルネットワーク(NN)
サポートベクターマシーン(SVM)

2013年12月9日月曜日

性能評価
回帰やロバスト回帰とか

2013年12月9日月曜日
アトリビューション分析
ALBERTのアトリビューションモデル
ALBERTのアトリビューションモデルはベイジアンネットワークを利 し、全ユーザーの 動
パターンを可視化することで、CVが最も起きやすいパターンを算出いたします。
Search クリック

純広告 View

DSP View

DSP Click

#$

未#$

!"
すべてのユーザーの行動データを可視化し、#$貢献度を算出"

2013年12月9日月曜日
ベイジアンネットワーク

2013年12月9日月曜日
ALBERT式予測モデリング

独自手法と一般的な時系列の比較など
2013年12月9日月曜日
あなたも明日から
データサイエンティスト!

そう、

2013年12月9日月曜日

ならね!
でも‥
全てにおいて万能ではない

2013年12月9日月曜日
のデメリット

基本メモリに載せちゃう
※FFパッケージなどもありますが、一般的に

他言語に比べると速度が‥
※Rcppとかも結局Cを書きますし‥

バッチ処理って‥
※できましたね

2013年12月9日月曜日
データ分析における現実

From ビジネスの現場のデータ分析における理想と現実
by TJOさん
2013年12月9日月曜日
データ分析における現実

From ビジネスの現場のデータ分析における理想と現実
by TJOさん
2013年12月9日月曜日
データ分析における現実

効率的に
前処理をこなして
統計モデルなどに入れたい

2013年12月9日月曜日
ビジネスにおけるデータ
例.アンケートデータ

情報が密

の出番!
2013年12月9日月曜日
ビジネスにおけるデータ
例.ECサイトの購買データ

スパース
大規模な
マトリクス

少し不安
2013年12月9日月曜日
ビジネスにおけるデータ
例.Apatcheの生ログ
   広告配信の生ログ など

非正規化
テキスト

大量
TB/週

.
.
2013年12月9日月曜日

無理!
前処理

C

F

Ruby

MySQL

C++

Shell

Python

Java

PHP

Perl

Postgres
SQL
etc‥

適材適所な言語の選択が重要
2013年12月9日月曜日
データ分析あるある

とりあえずパッケージに放り込む
SVMでいいんじゃない?
NEW!

ランダムフォレストでいいっしょ

2013年12月9日月曜日
データ分析あるある

とりあえずパッケージに放り込む
SVMでいいんじゃない?
NEW!

ランダムフォレストでいいっしょ

ダメ!絶対!
2013年12月9日月曜日
ビジネスにおけるデータ分析3か条

2013年12月9日月曜日
ビジネスにおけるデータ分析3か条

1,分析する対象について理解する

2013年12月9日月曜日
ビジネスにおけるデータ分析3か条

1,分析する対象について理解する
2,分析手法を適切に理解する

2013年12月9日月曜日
ビジネスにおけるデータ分析3か条

1,分析する対象について理解する
2,分析手法を適切に理解する
3,分析結果に対して適切な
アクションを行う
2013年12月9日月曜日
1,分析する対象について理解する
ドメイン知識はありますか?
なぜ分析が必要なのですか?
正しい現状認識はできていますか?
データの意味や背景を理解していますか?
問題はなんですか?

2013年12月9日月曜日
2,分析手法を適切に理解する
※1を経た上で‥
データは適切に前処理されていますか?
問題を解決するに適した手法ですか?
パラメータ調整などは適切ですか?
アウトプットを理解できますか?
正しく可視化できていますか?
2013年12月9日月曜日
3,分析結果に対して適切なアクションを行う
※1、2を経た上で‥
仮説は正しく検証されましたか?
適切なPDCAサイクルを構築できますか?
データドリブンな意思決定はできますか?
組織やビジネスを変える事はできますか?
2013年12月9日月曜日
人を動かす3か条 by デールカーネギー
1,盗人にも五分の理を認める
→非難や批判は益なしなのでやめよう
2,重要感を持たせる
→相手を尊重しよう
3,人の立場に身を置く
→相手の視点で考えよう
2013年12月9日月曜日
データ分析は
世間で騒がれているほど
格好いいものではなく、
泥臭いものです。

2013年12月9日月曜日
そんな泥臭い戦いを
各所で演じている皆様と
これから挑む皆様に
本講演が少しでも
お役に立てれば幸いです。

2013年12月9日月曜日
Enjoy!!
2013年12月9日月曜日
ご清聴
ありがとうございました!

Fin
2013年12月9日月曜日

More Related Content

Viewers also liked

可視化周辺の進化がヤヴァイ~rChartsを中心として~
可視化周辺の進化がヤヴァイ~rChartsを中心として~可視化周辺の進化がヤヴァイ~rChartsを中心として~
可視化周辺の進化がヤヴァイ~rChartsを中心として~Nagi Teramo
 
「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」
「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」
「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」Nagi Teramo
 
直感的な単変量モデルでは予測できない「ワインの味」を多変量モデルで予測する
直感的な単変量モデルでは予測できない「ワインの味」を多変量モデルで予測する直感的な単変量モデルでは予測できない「ワインの味」を多変量モデルで予測する
直感的な単変量モデルでは予測できない「ワインの味」を多変量モデルで予測するTakashi J OZAKI
 
実践で学ぶネットワーク分析
実践で学ぶネットワーク分析実践で学ぶネットワーク分析
実践で学ぶネットワーク分析Mitsunori Sato
 
はじめてのShiny
はじめてのShinyはじめてのShiny
はじめてのShinyKazuya Wada
 

Viewers also liked (6)

RでWAIC
RでWAICRでWAIC
RでWAIC
 
可視化周辺の進化がヤヴァイ~rChartsを中心として~
可視化周辺の進化がヤヴァイ~rChartsを中心として~可視化周辺の進化がヤヴァイ~rChartsを中心として~
可視化周辺の進化がヤヴァイ~rChartsを中心として~
 
「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」
「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」
「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」
 
直感的な単変量モデルでは予測できない「ワインの味」を多変量モデルで予測する
直感的な単変量モデルでは予測できない「ワインの味」を多変量モデルで予測する直感的な単変量モデルでは予測できない「ワインの味」を多変量モデルで予測する
直感的な単変量モデルでは予測できない「ワインの味」を多変量モデルで予測する
 
実践で学ぶネットワーク分析
実践で学ぶネットワーク分析実践で学ぶネットワーク分析
実践で学ぶネットワーク分析
 
はじめてのShiny
はじめてのShinyはじめてのShiny
はじめてのShiny
 

More from tetsuro ito

[Up用]rでqr
[Up用]rでqr[Up用]rでqr
[Up用]rでqrtetsuro ito
 
20170912 data analyst meetup tokyo vol.5
20170912 data analyst meetup tokyo vol.5 20170912 data analyst meetup tokyo vol.5
20170912 data analyst meetup tokyo vol.5 tetsuro ito
 
DataOps in Moneyforward
DataOps in Moneyforward DataOps in Moneyforward
DataOps in Moneyforward tetsuro ito
 
20170207 bigdata analytics_tokyo講演資料
20170207 bigdata analytics_tokyo講演資料20170207 bigdata analytics_tokyo講演資料
20170207 bigdata analytics_tokyo講演資料tetsuro ito
 
20161029 dots machine learning in money forward
20161029 dots machine learning in money forward20161029 dots machine learning in money forward
20161029 dots machine learning in money forwardtetsuro ito
 
20160906 bq sushi
20160906 bq sushi20160906 bq sushi
20160906 bq sushitetsuro ito
 
TokyoR LT Rで連続データを離散化
TokyoR LT Rで連続データを離散化TokyoR LT Rで連続データを離散化
TokyoR LT Rで連続データを離散化tetsuro ito
 
20150531分析プラットホームとその技術(bizreach) cookpad ito #dcube_analysis
20150531分析プラットホームとその技術(bizreach) cookpad ito #dcube_analysis20150531分析プラットホームとその技術(bizreach) cookpad ito #dcube_analysis
20150531分析プラットホームとその技術(bizreach) cookpad ito #dcube_analysistetsuro ito
 
20150303続パタ5章後半
20150303続パタ5章後半20150303続パタ5章後半
20150303続パタ5章後半tetsuro ito
 
PRML読書会1スライド(公開用)
PRML読書会1スライド(公開用)PRML読書会1スライド(公開用)
PRML読書会1スライド(公開用)tetsuro ito
 
20140614 tokyo r lt
20140614 tokyo r lt 20140614 tokyo r lt
20140614 tokyo r lt tetsuro ito
 
20140329 tokyo r lt 「カーネルとsvm」
20140329 tokyo r lt 「カーネルとsvm」20140329 tokyo r lt 「カーネルとsvm」
20140329 tokyo r lt 「カーネルとsvm」tetsuro ito
 
20140204はじパタlt
20140204はじパタlt20140204はじパタlt
20140204はじパタlttetsuro ito
 
はじパタ8章 svm
はじパタ8章 svmはじパタ8章 svm
はじパタ8章 svmtetsuro ito
 
Tokyo R LT 20131109
Tokyo R LT 20131109Tokyo R LT 20131109
Tokyo R LT 20131109tetsuro ito
 
はじパタ2章
はじパタ2章はじパタ2章
はじパタ2章tetsuro ito
 
第31回TokyoR LT資料
第31回TokyoR LT資料第31回TokyoR LT資料
第31回TokyoR LT資料tetsuro ito
 
集合知プログラミング5章発表
集合知プログラミング5章発表集合知プログラミング5章発表
集合知プログラミング5章発表tetsuro ito
 
集合知プログラミング11章
集合知プログラミング11章集合知プログラミング11章
集合知プログラミング11章tetsuro ito
 
集合知プログラミング勉強会キックオフMTG LT用資料
集合知プログラミング勉強会キックオフMTG LT用資料集合知プログラミング勉強会キックオフMTG LT用資料
集合知プログラミング勉強会キックオフMTG LT用資料tetsuro ito
 

More from tetsuro ito (20)

[Up用]rでqr
[Up用]rでqr[Up用]rでqr
[Up用]rでqr
 
20170912 data analyst meetup tokyo vol.5
20170912 data analyst meetup tokyo vol.5 20170912 data analyst meetup tokyo vol.5
20170912 data analyst meetup tokyo vol.5
 
DataOps in Moneyforward
DataOps in Moneyforward DataOps in Moneyforward
DataOps in Moneyforward
 
20170207 bigdata analytics_tokyo講演資料
20170207 bigdata analytics_tokyo講演資料20170207 bigdata analytics_tokyo講演資料
20170207 bigdata analytics_tokyo講演資料
 
20161029 dots machine learning in money forward
20161029 dots machine learning in money forward20161029 dots machine learning in money forward
20161029 dots machine learning in money forward
 
20160906 bq sushi
20160906 bq sushi20160906 bq sushi
20160906 bq sushi
 
TokyoR LT Rで連続データを離散化
TokyoR LT Rで連続データを離散化TokyoR LT Rで連続データを離散化
TokyoR LT Rで連続データを離散化
 
20150531分析プラットホームとその技術(bizreach) cookpad ito #dcube_analysis
20150531分析プラットホームとその技術(bizreach) cookpad ito #dcube_analysis20150531分析プラットホームとその技術(bizreach) cookpad ito #dcube_analysis
20150531分析プラットホームとその技術(bizreach) cookpad ito #dcube_analysis
 
20150303続パタ5章後半
20150303続パタ5章後半20150303続パタ5章後半
20150303続パタ5章後半
 
PRML読書会1スライド(公開用)
PRML読書会1スライド(公開用)PRML読書会1スライド(公開用)
PRML読書会1スライド(公開用)
 
20140614 tokyo r lt
20140614 tokyo r lt 20140614 tokyo r lt
20140614 tokyo r lt
 
20140329 tokyo r lt 「カーネルとsvm」
20140329 tokyo r lt 「カーネルとsvm」20140329 tokyo r lt 「カーネルとsvm」
20140329 tokyo r lt 「カーネルとsvm」
 
20140204はじパタlt
20140204はじパタlt20140204はじパタlt
20140204はじパタlt
 
はじパタ8章 svm
はじパタ8章 svmはじパタ8章 svm
はじパタ8章 svm
 
Tokyo R LT 20131109
Tokyo R LT 20131109Tokyo R LT 20131109
Tokyo R LT 20131109
 
はじパタ2章
はじパタ2章はじパタ2章
はじパタ2章
 
第31回TokyoR LT資料
第31回TokyoR LT資料第31回TokyoR LT資料
第31回TokyoR LT資料
 
集合知プログラミング5章発表
集合知プログラミング5章発表集合知プログラミング5章発表
集合知プログラミング5章発表
 
集合知プログラミング11章
集合知プログラミング11章集合知プログラミング11章
集合知プログラミング11章
 
集合知プログラミング勉強会キックオフMTG LT用資料
集合知プログラミング勉強会キックオフMTG LT用資料集合知プログラミング勉強会キックオフMTG LT用資料
集合知プログラミング勉強会キックオフMTG LT用資料
 

Japan.r 2013 「実ビジネスデータへのrの活用とその限界」