Submit Search
Upload
Japan.r 2013 「実ビジネスデータへのrの活用とその限界」
•
12 likes
•
3,095 views
tetsuro ito
Follow
20131207 Japan.R発表
Read less
Read more
Report
Share
Report
Share
1 of 44
Recommended
オンプレとクラウドのHadoopを比較して僕の思うとこ
オンプレとクラウドのHadoopを比較して僕の思うとこ
Yu Yamada
オレオレR-GUIを作りたい
オレオレR-GUIを作りたい
Masahiro Hayashi
統計を始める方へ①_データ環境Rの基本的なプログラミング|データアーティスト
統計を始める方へ①_データ環境Rの基本的なプログラミング|データアーティスト
Satoru Yamamoto
アクションマイニングを用いた最適なアクションの導出
アクションマイニングを用いた最適なアクションの導出
Shintaro Fukushima
僕の考える最強のビックデータエンジニア
僕の考える最強のビックデータエンジニア
Yu Yamada
kafkaのデータをRedshiftへ入れるパイプライン作ってみた
kafkaのデータをRedshiftへ入れるパイプライン作ってみた
Yu Yamada
20131207 Japan.R#4 LT
20131207 Japan.R#4 LT
Med_KU
20131206 japan r
20131206 japan r
Yohei Sato
Recommended
オンプレとクラウドのHadoopを比較して僕の思うとこ
オンプレとクラウドのHadoopを比較して僕の思うとこ
Yu Yamada
オレオレR-GUIを作りたい
オレオレR-GUIを作りたい
Masahiro Hayashi
統計を始める方へ①_データ環境Rの基本的なプログラミング|データアーティスト
統計を始める方へ①_データ環境Rの基本的なプログラミング|データアーティスト
Satoru Yamamoto
アクションマイニングを用いた最適なアクションの導出
アクションマイニングを用いた最適なアクションの導出
Shintaro Fukushima
僕の考える最強のビックデータエンジニア
僕の考える最強のビックデータエンジニア
Yu Yamada
kafkaのデータをRedshiftへ入れるパイプライン作ってみた
kafkaのデータをRedshiftへ入れるパイプライン作ってみた
Yu Yamada
20131207 Japan.R#4 LT
20131207 Japan.R#4 LT
Med_KU
20131206 japan r
20131206 japan r
Yohei Sato
RでWAIC
RでWAIC
Toru Imai
可視化周辺の進化がヤヴァイ~rChartsを中心として~
可視化周辺の進化がヤヴァイ~rChartsを中心として~
Nagi Teramo
「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」
「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」
Nagi Teramo
直感的な単変量モデルでは予測できない「ワインの味」を多変量モデルで予測する
直感的な単変量モデルでは予測できない「ワインの味」を多変量モデルで予測する
Takashi J OZAKI
実践で学ぶネットワーク分析
実践で学ぶネットワーク分析
Mitsunori Sato
はじめてのShiny
はじめてのShiny
Kazuya Wada
[Up用]rでqr
[Up用]rでqr
tetsuro ito
20170912 data analyst meetup tokyo vol.5
20170912 data analyst meetup tokyo vol.5
tetsuro ito
DataOps in Moneyforward
DataOps in Moneyforward
tetsuro ito
20170207 bigdata analytics_tokyo講演資料
20170207 bigdata analytics_tokyo講演資料
tetsuro ito
20161029 dots machine learning in money forward
20161029 dots machine learning in money forward
tetsuro ito
20160906 bq sushi
20160906 bq sushi
tetsuro ito
TokyoR LT Rで連続データを離散化
TokyoR LT Rで連続データを離散化
tetsuro ito
20150531分析プラットホームとその技術(bizreach) cookpad ito #dcube_analysis
20150531分析プラットホームとその技術(bizreach) cookpad ito #dcube_analysis
tetsuro ito
20150303続パタ5章後半
20150303続パタ5章後半
tetsuro ito
PRML読書会1スライド(公開用)
PRML読書会1スライド(公開用)
tetsuro ito
20140614 tokyo r lt
20140614 tokyo r lt
tetsuro ito
20140329 tokyo r lt 「カーネルとsvm」
20140329 tokyo r lt 「カーネルとsvm」
tetsuro ito
20140204はじパタlt
20140204はじパタlt
tetsuro ito
はじパタ8章 svm
はじパタ8章 svm
tetsuro ito
Tokyo R LT 20131109
Tokyo R LT 20131109
tetsuro ito
はじパタ2章
はじパタ2章
tetsuro ito
More Related Content
Viewers also liked
RでWAIC
RでWAIC
Toru Imai
可視化周辺の進化がヤヴァイ~rChartsを中心として~
可視化周辺の進化がヤヴァイ~rChartsを中心として~
Nagi Teramo
「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」
「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」
Nagi Teramo
直感的な単変量モデルでは予測できない「ワインの味」を多変量モデルで予測する
直感的な単変量モデルでは予測できない「ワインの味」を多変量モデルで予測する
Takashi J OZAKI
実践で学ぶネットワーク分析
実践で学ぶネットワーク分析
Mitsunori Sato
はじめてのShiny
はじめてのShiny
Kazuya Wada
Viewers also liked
(6)
RでWAIC
RでWAIC
可視化周辺の進化がヤヴァイ~rChartsを中心として~
可視化周辺の進化がヤヴァイ~rChartsを中心として~
「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」
「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」
直感的な単変量モデルでは予測できない「ワインの味」を多変量モデルで予測する
直感的な単変量モデルでは予測できない「ワインの味」を多変量モデルで予測する
実践で学ぶネットワーク分析
実践で学ぶネットワーク分析
はじめてのShiny
はじめてのShiny
More from tetsuro ito
[Up用]rでqr
[Up用]rでqr
tetsuro ito
20170912 data analyst meetup tokyo vol.5
20170912 data analyst meetup tokyo vol.5
tetsuro ito
DataOps in Moneyforward
DataOps in Moneyforward
tetsuro ito
20170207 bigdata analytics_tokyo講演資料
20170207 bigdata analytics_tokyo講演資料
tetsuro ito
20161029 dots machine learning in money forward
20161029 dots machine learning in money forward
tetsuro ito
20160906 bq sushi
20160906 bq sushi
tetsuro ito
TokyoR LT Rで連続データを離散化
TokyoR LT Rで連続データを離散化
tetsuro ito
20150531分析プラットホームとその技術(bizreach) cookpad ito #dcube_analysis
20150531分析プラットホームとその技術(bizreach) cookpad ito #dcube_analysis
tetsuro ito
20150303続パタ5章後半
20150303続パタ5章後半
tetsuro ito
PRML読書会1スライド(公開用)
PRML読書会1スライド(公開用)
tetsuro ito
20140614 tokyo r lt
20140614 tokyo r lt
tetsuro ito
20140329 tokyo r lt 「カーネルとsvm」
20140329 tokyo r lt 「カーネルとsvm」
tetsuro ito
20140204はじパタlt
20140204はじパタlt
tetsuro ito
はじパタ8章 svm
はじパタ8章 svm
tetsuro ito
Tokyo R LT 20131109
Tokyo R LT 20131109
tetsuro ito
はじパタ2章
はじパタ2章
tetsuro ito
第31回TokyoR LT資料
第31回TokyoR LT資料
tetsuro ito
集合知プログラミング5章発表
集合知プログラミング5章発表
tetsuro ito
集合知プログラミング11章
集合知プログラミング11章
tetsuro ito
集合知プログラミング勉強会キックオフMTG LT用資料
集合知プログラミング勉強会キックオフMTG LT用資料
tetsuro ito
More from tetsuro ito
(20)
[Up用]rでqr
[Up用]rでqr
20170912 data analyst meetup tokyo vol.5
20170912 data analyst meetup tokyo vol.5
DataOps in Moneyforward
DataOps in Moneyforward
20170207 bigdata analytics_tokyo講演資料
20170207 bigdata analytics_tokyo講演資料
20161029 dots machine learning in money forward
20161029 dots machine learning in money forward
20160906 bq sushi
20160906 bq sushi
TokyoR LT Rで連続データを離散化
TokyoR LT Rで連続データを離散化
20150531分析プラットホームとその技術(bizreach) cookpad ito #dcube_analysis
20150531分析プラットホームとその技術(bizreach) cookpad ito #dcube_analysis
20150303続パタ5章後半
20150303続パタ5章後半
PRML読書会1スライド(公開用)
PRML読書会1スライド(公開用)
20140614 tokyo r lt
20140614 tokyo r lt
20140329 tokyo r lt 「カーネルとsvm」
20140329 tokyo r lt 「カーネルとsvm」
20140204はじパタlt
20140204はじパタlt
はじパタ8章 svm
はじパタ8章 svm
Tokyo R LT 20131109
Tokyo R LT 20131109
はじパタ2章
はじパタ2章
第31回TokyoR LT資料
第31回TokyoR LT資料
集合知プログラミング5章発表
集合知プログラミング5章発表
集合知プログラミング11章
集合知プログラミング11章
集合知プログラミング勉強会キックオフMTG LT用資料
集合知プログラミング勉強会キックオフMTG LT用資料
Japan.r 2013 「実ビジネスデータへのrの活用とその限界」
1.
実ビジネスデータへのRの活用と その限界 2013年12月7日 Japan.R 2013 @Yahoo!Japan 2013年12月9日月曜日
2.
自己紹介 名前 伊藤 徹郎 (@tetsuroito) 所属 株式会社ALBERT データ分析部 好きなもの サッカー、スキー、オレオ、鰤しゃぶ R歴 2年くらい 2013年12月9日月曜日 マサカリ投げないでください
3.
株式会社ALBERTについて 分析力をコアとする マーケティングソリューションカンパニー 2013年12月9日月曜日
4.
サイトの宣伝 分析関係の読み物も豊富に用意しているので、 ぜひ遊びに来てください 2013年12月9日月曜日
5.
主な事業領域 上記3領域でビジネス展開 2013年12月9日月曜日
6.
ちょこっと紹介 従来のレコメンドアルゴリズムの欠点を改善した デュアルチューニングロジックβを搭載した レコメンド特化型DSP 2013年12月9日月曜日
7.
ちょこっと紹介 曜 や地域、OSなどの要素を加味して配信クリエイティブを決定する。 最も効果の 媒体#地域#表示回数#時間$%&" ※'(種類の変数を加味 い i-E ect クリエイティブを選択 ②インプレッション情報が 配信システムへ ③最適なクリエイティブを 配信 ネットワーク ④最適なクリエイティブを 配信システムへ ⑤配信指示 ①ユーザーがサイトに訪問 ◎平日の昼 ◎東京から ◎OSはChrome この媒体なら配信しても 効果がありそうだ。 配信決定! どのクリエイティブを 配信しようか? !" 配信システムと組み合わせることで、効率的かつ効果的に配信することを実現 2013年12月9日月曜日
8.
ちょこっと紹介 短期間でベストクリエイティブを発 ALBERTでは、膨 な広告クリエイティブを実験計画法を応 した独
の 法を いて絞 り込み、最適なクリエイティブを短期間で特定するアルゴリズムを確 しております。 通常1~2ヶ 以上かかるデー タの蓄積を2 3週間のデータ 蓄積で分析が可能に! 全てのクリエイティブを同時に配信すると クリック数を確保するまでに時間がかかってしまう。 ALBERT独 の統計的 法を い、各要素の 全てのパーツを含むク リエイティブを抽出。 2013年12月9日月曜日 配信クリエイティブ数を 絞り込むことで1クリエイ ティブあたりのクリック 数を増やし効率的にデー タを取得。 各パーツの効 値を 算出することで早期 にベストクリエイ ティブを発 !
9.
今、注力しているもの 3つのビジネス領域が有機的に関連 2013年12月9日月曜日
10.
AWSとの連携もしています 出典:AWS国内導入事例 Redshift楽しいよ! 2013年12月9日月曜日
11.
そろそろRの話 2013年12月9日月曜日
12.
と言えば 豊富なパッケージの数々 無料なのでどこでも使える Web上にドキュメントも豊富 メリットいっぱい! 2013年12月9日月曜日
13.
はどこで使ってる? アドホック分析で使ってます は統計解析環境 2013年12月9日月曜日
14.
実務でよく使う決定木とか ※個人的にツリーの図が もう少しイケてるといいな 2013年12月9日月曜日
15.
地図のマッピングとか 1000 37123 37165 37029 500 500 37007 1500 37093 2000 2500 37125 1000 1500 spatially lagged d79 37131 Local
Moran's I (I values) 0 200 400 600 800 0 d74 100 200 300 400 d79 1000 800 600 400 200 0 Local Moran's I (I values) 0 0.18 0.92 2.28 18.01 1000 800 600 400 200 0 2013年12月9日月曜日 37005 0 0 spatially lagged d74 2000 37117 37153 0 0.2 0.56 1.54 8.19 500 600
16.
機械学習とか 手法 決定木(CART) ランダムフォレスト(RF) Extremely Randomized Trees(ET) ニューラルネットワーク(NN) サポートベクターマシーン(SVM) 2013年12月9日月曜日 性能評価
17.
回帰やロバスト回帰とか 2013年12月9日月曜日
18.
アトリビューション分析 ALBERTのアトリビューションモデル ALBERTのアトリビューションモデルはベイジアンネットワークを利 し、全ユーザーの 動 パターンを可視化することで、CVが最も起きやすいパターンを算出いたします。 Search
クリック 純広告 View DSP View DSP Click #$ 未#$ !" すべてのユーザーの行動データを可視化し、#$貢献度を算出" 2013年12月9日月曜日
19.
ベイジアンネットワーク 2013年12月9日月曜日
20.
ALBERT式予測モデリング 独自手法と一般的な時系列の比較など 2013年12月9日月曜日
21.
あなたも明日から データサイエンティスト! そう、 2013年12月9日月曜日 ならね!
22.
でも‥ 全てにおいて万能ではない 2013年12月9日月曜日
23.
のデメリット 基本メモリに載せちゃう ※FFパッケージなどもありますが、一般的に 他言語に比べると速度が‥ ※Rcppとかも結局Cを書きますし‥ バッチ処理って‥ ※できましたね 2013年12月9日月曜日
24.
データ分析における現実 From ビジネスの現場のデータ分析における理想と現実 by TJOさん 2013年12月9日月曜日
25.
データ分析における現実 From ビジネスの現場のデータ分析における理想と現実 by TJOさん 2013年12月9日月曜日
26.
データ分析における現実 効率的に 前処理をこなして 統計モデルなどに入れたい 2013年12月9日月曜日
27.
ビジネスにおけるデータ 例.アンケートデータ 情報が密 の出番! 2013年12月9日月曜日
28.
ビジネスにおけるデータ 例.ECサイトの購買データ スパース 大規模な マトリクス 少し不安 2013年12月9日月曜日
29.
ビジネスにおけるデータ 例.Apatcheの生ログ 広告配信の生ログ など 非正規化 テキスト 大量 TB/週 . . 2013年12月9日月曜日 無理!
30.
前処理 C F Ruby MySQL C++ Shell Python Java PHP Perl Postgres SQL etc‥ 適材適所な言語の選択が重要 2013年12月9日月曜日
31.
データ分析あるある とりあえずパッケージに放り込む SVMでいいんじゃない? NEW! ランダムフォレストでいいっしょ 2013年12月9日月曜日
32.
データ分析あるある とりあえずパッケージに放り込む SVMでいいんじゃない? NEW! ランダムフォレストでいいっしょ ダメ!絶対! 2013年12月9日月曜日
33.
ビジネスにおけるデータ分析3か条 2013年12月9日月曜日
34.
ビジネスにおけるデータ分析3か条 1,分析する対象について理解する 2013年12月9日月曜日
35.
ビジネスにおけるデータ分析3か条 1,分析する対象について理解する 2,分析手法を適切に理解する 2013年12月9日月曜日
36.
ビジネスにおけるデータ分析3か条 1,分析する対象について理解する 2,分析手法を適切に理解する 3,分析結果に対して適切な アクションを行う 2013年12月9日月曜日
37.
1,分析する対象について理解する ドメイン知識はありますか? なぜ分析が必要なのですか? 正しい現状認識はできていますか? データの意味や背景を理解していますか? 問題はなんですか? 2013年12月9日月曜日
38.
2,分析手法を適切に理解する ※1を経た上で‥ データは適切に前処理されていますか? 問題を解決するに適した手法ですか? パラメータ調整などは適切ですか? アウトプットを理解できますか? 正しく可視化できていますか? 2013年12月9日月曜日
39.
3,分析結果に対して適切なアクションを行う ※1、2を経た上で‥ 仮説は正しく検証されましたか? 適切なPDCAサイクルを構築できますか? データドリブンな意思決定はできますか? 組織やビジネスを変える事はできますか? 2013年12月9日月曜日
40.
人を動かす3か条 by デールカーネギー 1,盗人にも五分の理を認める →非難や批判は益なしなのでやめよう 2,重要感を持たせる →相手を尊重しよう 3,人の立場に身を置く →相手の視点で考えよう 2013年12月9日月曜日
41.
データ分析は 世間で騒がれているほど 格好いいものではなく、 泥臭いものです。 2013年12月9日月曜日
42.
そんな泥臭い戦いを 各所で演じている皆様と これから挑む皆様に 本講演が少しでも お役に立てれば幸いです。 2013年12月9日月曜日
43.
Enjoy!! 2013年12月9日月曜日
44.
ご清聴 ありがとうございました! Fin 2013年12月9日月曜日