SlideShare a Scribd company logo
1 of 56
データを分析する時の 
4つの視点 
〜Rで学ぶデータマイニング1 第18章〜 
里洋平(@yokkuns) 
第42回Tokyo.R 初心者セッション 
2014.08.30
AGENDA 
 自己紹介 
 メディアにあふれるデータ 
 交通事故死亡データ 
 まとめ
AGENDA 
 自己紹介 
 メディアにあふれるデータ 
 交通事故死亡データ 
 まとめ
自己紹介 
里洋平(@yokkuns) 
 やってきたこと 
 Webアプリ開発 
 統計解析/データマイニング 
 マーケティング 
 今やってること 
 全社横断の分析 
 分析環境の整備
活動例1:やってきたこと
活動例2:TokyoR 
Tokyo.Rの主催やってます
活動例3:執筆
AGENDA 
 自己紹介 
 メディアにあふれるデータ 
 交通事故死亡データ 
 まとめ
本日のテーマ:メディア等に溢れるデータ 
■テキスト 
・Rで学ぶデータマイニング〈1〉データ解析編 
- http://amzn.to/1prDlLU 
第1部基本知識篇(Rのインストール 
Rの起動 
Rの終了 
簡単な計算方法 
R用エディタと本文の記載方法についてほか) 
第2部グラフとデータマイニング(グラフとデータマイニング 
グラフの保存 
メディア等に溢れるデータ 
合計特殊出生率と少子化) 
■Rコードと実行結果 
・TokyoR#42 テキスト 
- http://rpubs.com/yokkuns/27223
テキストの内容は 
メディアにあふれているデ 
ータについていろいろ 
言及するという内容
そのままでは面白くないので 
少しアレンジしてデータを分析 
する時の視点を考えてみる構成 
に変更しました
なので、表現とか内容が 
テキストと異なるところが 
あります
ってか、全然違います
AGENDA 
 自己紹介 
 メディアにあふれるデータ 
 交通事故死亡データ 
 まとめ
交通事故死亡者数 
飲酒運転の罰金が最大30万となったことにより 
交通事故死亡者数が減少! 
道路交通法改正
交通事故死亡者数(Rコード)
グラフに対して
交通事故死亡者数 
飲酒運転の罰金が最大30万となったことにより 
交通事故死亡者数が減少! 
道路交通法改正
交通事故死亡者数 
飲酒運転の罰金が最大30万となったことにより 
交通事故死亡者数が減少! 
0じゃない 
道路交通法改正
交通事故死亡者数 
飲酒運転の罰金が最大30万となったことにより 
交通事故死亡者数が減少! 
13年より前の傾向は?道路交通法改正 
0じゃない
交通事故死亡者数(0から始まる棒グラフ) 
0から始めると・・・ 
道路交通法改正
交通事故死亡者数(0から始まる棒グラフ) 
0から始めると・・・ 
道路交通法改正
交通事故死亡者数(棒グラフで長期間) 
平成13年よりも前から見てみると 
改正前から緩やかな減少トレンドになっている 
道路交通法改正
交通事故死亡者数(棒グラフで長期間) 
平成13年よりも前から見てみると 
改正前から緩やかな減少トレンドになっている 
道路交通法改正
【おまけ】交通事故死亡者数(折れ線グラフで長期間) 
平成13年よりも前から見てみると 
改正前から減少トレンドになっている 
道路交通法改正
【おまけ】交通事故死亡者数(折れ線グラフで長期間) 
平成13年よりも前から見てみると 
改正前から減少トレンドになっている 
道路交通法改正
【おまけ】交通事故死亡者数(棒グラフを横長にした図) 
平成13年よりも前から見てみると 
改正前から緩やかな減少トレンドになっている 
道路交通法改正
【おまけ】交通事故死亡者数(棒グラフを横長にした図) 
平成13年よりも前から見てみると 
改正前から緩やかな減少トレンドになっている 
道路交通法改正
結論に対して
交通事故死亡者数 
飲酒運転の罰金が最大30万となったことにより 
交通事故死亡者数が減少! 
道路交通法改正
交通事故死亡者数 
飲酒運転の罰金が最大30万となったことにより 
交通事故死亡者数が減少! 
道路交通法改正
交通事故死亡者数の分解 
なぜ飲酒運転の罰金増加で 
交通事故死亡者が減るのか?
交通事故死亡者数の分解 
なぜ飲酒運転の罰金増加で 
交通事故死亡者が減るのか? 
交通事故死亡者 
飲酒なしの 
交通事故死亡者 
+ 
飲酒ありの 
交通事故死亡者
交通事故死亡者数の分解 
飲酒運転の罰金増加で減少するのは、 
飲酒ありの交通事故による死亡者数 
交通事故死亡者 
飲酒運転の罰金では 
減少しない 
飲酒なしの 
交通事故死亡者 
+ 
飲酒運転の罰金で減少 
することが期待出来る 
飲酒ありの 
交通事故死亡者
改正によるインパクト 
飲酒ありによる交通事故死亡者が 
交通事故死亡者に占める割合はどれくらいか 
交通事故死亡者交通事故死亡者 
飲酒あり 
飲酒 
あり
調べてみた 
http://www.npa.go.jp/koutsuu/kikaku190906/ 
3_insyu/insyu.pdf
飲酒有無別交通事故死亡者数推移 
飲酒なしの交通事故死亡者数の方が 
飲酒ありの交通事故死亡者数と比べて多い 
交通事故死亡者数全体 
飲酒なし(第1当事者) 
飲酒あり(第1当事者)
飲酒有無別交通事故死亡者数推移(Rコード)
飲酒有無別交通事故死亡者数推移 
飲酒ありの交通事故死亡者数は最大で1,500前後 
交通事故死亡者数全体 
飲酒なし(第1当事者) 
飲酒あり(第1当事者) 
1,500
交通事故死亡者数 
飲酒ありの交通事故死亡者数は最大で1,500前後(※) 
⇒ 減少すべてを改正によるものとするのは無理がある 
道路交通法改正 
約1,900 
※正確には第1当事者なのでもう少し増える
飲酒有無別交通事故死亡者比率 
「飲酒あり」が占める割合は、12〜15%
飲酒有無別交通事故死亡者比率 
「飲酒あり」が占める割合は 
改正によって減少している(15%→12%) 
改正後に 
15%→12%に減少
飲酒有無別交通事故死亡者比率(Rコード)
飲酒ありの交通事故死亡者数推移 
飲酒ありだけの推移を見てみると 
改正から顕著に減少している 
道路交通法改正 
改正効果?
飲酒有無別交通事故死亡者数推移 
改正とは無関係の飲酒なしの交通事故死亡者数も減少している 
⇒ 改正とは別の効果が混ざっている 
交通事故死亡者数全体 
飲酒なし(第1当事者) 
飲酒あり(第1当事者)
飲酒有無での比較 
見たい効果以外の条件が同じもので比較する 
⇒ 飲酒ありと飲酒なしの差分が改正効果 
飲酒あり飲酒なし 
改正効果 
時間効果- 時間効果= 改正効果 
その他効果その他効果
改正による交通事故死亡者数減少効果 
飲酒なしの推移から改正なし想定を算出 
×β
改正による交通事故死亡者数減少効果 
改正なし想定のトレンドとの差分が 
改正による減少効果 
道路交通法改正
改正による交通事故死亡者数減少効果
AGENDA 
 自己紹介 
 メディアにあふれるデータ 
 交通事故死亡データ 
 まとめ
視点1:分解 
具体的に何に効くのかを分解して考える 
交通事故死亡者 
飲酒運転の罰金では 
減少しない 
飲酒なしの 
交通事故死亡者 
+ 
飲酒運転の罰金で減少 
することが期待出来る 
飲酒ありの 
交通事故死亡者
視点2:インパクト 
全体に対するインパクトを確認する 
交通事故死亡者交通事故死亡者 
飲酒あり 
飲酒 
あり
視点3:時系列トレンド 
長期的なトレンドを確認する
視点4:比較 
見たい効果以外の条件が同じもので比較する 
飲酒あり飲酒なし 
改正効果 
時間効果- 時間効果= 改正効果 
その他効果その他効果
AGENDA 
 自己紹介 
 メディアにあふれるデータ 
 交通事故死亡データ 
 まとめ
Enjoy!

More Related Content

Viewers also liked

R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜機会学習・データビジュアライゼーション事始め〜
R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜機会学習・データビジュアライゼーション事始め〜R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜機会学習・データビジュアライゼーション事始め〜
R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜機会学習・データビジュアライゼーション事始め〜Yasuyuki Sugai
 
RとJavaScript Visualizationを俯瞰しよう
RとJavaScript Visualizationを俯瞰しようRとJavaScript Visualizationを俯瞰しよう
RとJavaScript Visualizationを俯瞰しようYasuyuki Sugai
 
第2回関西ゼロから始めるR言語勉強会
第2回関西ゼロから始めるR言語勉強会第2回関西ゼロから始めるR言語勉強会
第2回関西ゼロから始めるR言語勉強会Iida Keisuke
 
[データマイニング+WEB勉強会][R勉強会] はじめてでもわかる R言語によるクラスター分析 - 似ているものをグループ化する-
[データマイニング+WEB勉強会][R勉強会] はじめてでもわかる R言語によるクラスター分析 - 似ているものをグループ化する-[データマイニング+WEB勉強会][R勉強会] はじめてでもわかる R言語によるクラスター分析 - 似ているものをグループ化する-
[データマイニング+WEB勉強会][R勉強会] はじめてでもわかる R言語によるクラスター分析 - 似ているものをグループ化する-Koichi Hamada
 
10分で分かるr言語入門ver2.5
10分で分かるr言語入門ver2.510分で分かるr言語入門ver2.5
10分で分かるr言語入門ver2.5Nobuaki Oshiro
 
20150303ぞくパタLT-ゆるふわ構造学習
20150303ぞくパタLT-ゆるふわ構造学習20150303ぞくパタLT-ゆるふわ構造学習
20150303ぞくパタLT-ゆるふわ構造学習Toru Imai
 
Dummiesパッケージ
DummiesパッケージDummiesパッケージ
Dummiesパッケージweda654
 
20170923 excelユーザーのためのr入門
20170923 excelユーザーのためのr入門20170923 excelユーザーのためのr入門
20170923 excelユーザーのためのr入門Takashi Kitano
 
Rで潜在ランク分析
Rで潜在ランク分析Rで潜在ランク分析
Rで潜在ランク分析Hiroshi Shimizu
 
20140625 rでのデータ分析(仮) for_tokyor
20140625 rでのデータ分析(仮) for_tokyor20140625 rでのデータ分析(仮) for_tokyor
20140625 rでのデータ分析(仮) for_tokyorTakashi Kitano
 
R入門(dplyrでデータ加工)-TokyoR42
R入門(dplyrでデータ加工)-TokyoR42R入門(dplyrでデータ加工)-TokyoR42
R入門(dplyrでデータ加工)-TokyoR42Atsushi Hayakawa
 
Mxnetで回帰 #TokyoR 53th
Mxnetで回帰 #TokyoR 53thMxnetで回帰 #TokyoR 53th
Mxnetで回帰 #TokyoR 53thAkifumi Eguchi
 
RとStanでクラウドセットアップ時間を分析してみたら #TokyoR
RとStanでクラウドセットアップ時間を分析してみたら #TokyoRRとStanでクラウドセットアップ時間を分析してみたら #TokyoR
RとStanでクラウドセットアップ時間を分析してみたら #TokyoRShuyo Nakatani
 
データサイエンティスト必見!M-1グランプリ
データサイエンティスト必見!M-1グランプリデータサイエンティスト必見!M-1グランプリ
データサイエンティスト必見!M-1グランプリSatoshi Kitajima
 
R を起動するその前に
R を起動するその前にR を起動するその前に
R を起動するその前にKosei ABE
 
マルコフ連鎖モンテカルロ法入門-1
マルコフ連鎖モンテカルロ法入門-1マルコフ連鎖モンテカルロ法入門-1
マルコフ連鎖モンテカルロ法入門-1Nagi Teramo
 
Rで代数統計 TokyoR #42 LT
Rで代数統計 TokyoR #42 LTRで代数統計 TokyoR #42 LT
Rで代数統計 TokyoR #42 LTToru Imai
 
最強のハードディスクはどれだ?
最強のハードディスクはどれだ?最強のハードディスクはどれだ?
最強のハードディスクはどれだ?Atsushi Hayakawa
 

Viewers also liked (20)

R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜機会学習・データビジュアライゼーション事始め〜
R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜機会学習・データビジュアライゼーション事始め〜R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜機会学習・データビジュアライゼーション事始め〜
R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜機会学習・データビジュアライゼーション事始め〜
 
RとJavaScript Visualizationを俯瞰しよう
RとJavaScript Visualizationを俯瞰しようRとJavaScript Visualizationを俯瞰しよう
RとJavaScript Visualizationを俯瞰しよう
 
第2回関西ゼロから始めるR言語勉強会
第2回関西ゼロから始めるR言語勉強会第2回関西ゼロから始めるR言語勉強会
第2回関西ゼロから始めるR言語勉強会
 
[データマイニング+WEB勉強会][R勉強会] はじめてでもわかる R言語によるクラスター分析 - 似ているものをグループ化する-
[データマイニング+WEB勉強会][R勉強会] はじめてでもわかる R言語によるクラスター分析 - 似ているものをグループ化する-[データマイニング+WEB勉強会][R勉強会] はじめてでもわかる R言語によるクラスター分析 - 似ているものをグループ化する-
[データマイニング+WEB勉強会][R勉強会] はじめてでもわかる R言語によるクラスター分析 - 似ているものをグループ化する-
 
10分で分かるr言語入門ver2.5
10分で分かるr言語入門ver2.510分で分かるr言語入門ver2.5
10分で分かるr言語入門ver2.5
 
20150303ぞくパタLT-ゆるふわ構造学習
20150303ぞくパタLT-ゆるふわ構造学習20150303ぞくパタLT-ゆるふわ構造学習
20150303ぞくパタLT-ゆるふわ構造学習
 
Dummiesパッケージ
DummiesパッケージDummiesパッケージ
Dummiesパッケージ
 
20170923 excelユーザーのためのr入門
20170923 excelユーザーのためのr入門20170923 excelユーザーのためのr入門
20170923 excelユーザーのためのr入門
 
Rcppのすすめ
RcppのすすめRcppのすすめ
Rcppのすすめ
 
Rで潜在ランク分析
Rで潜在ランク分析Rで潜在ランク分析
Rで潜在ランク分析
 
20140625 rでのデータ分析(仮) for_tokyor
20140625 rでのデータ分析(仮) for_tokyor20140625 rでのデータ分析(仮) for_tokyor
20140625 rでのデータ分析(仮) for_tokyor
 
R入門(dplyrでデータ加工)-TokyoR42
R入門(dplyrでデータ加工)-TokyoR42R入門(dplyrでデータ加工)-TokyoR42
R入門(dplyrでデータ加工)-TokyoR42
 
Mxnetで回帰 #TokyoR 53th
Mxnetで回帰 #TokyoR 53thMxnetで回帰 #TokyoR 53th
Mxnetで回帰 #TokyoR 53th
 
RとStanでクラウドセットアップ時間を分析してみたら #TokyoR
RとStanでクラウドセットアップ時間を分析してみたら #TokyoRRとStanでクラウドセットアップ時間を分析してみたら #TokyoR
RとStanでクラウドセットアップ時間を分析してみたら #TokyoR
 
データサイエンティスト必見!M-1グランプリ
データサイエンティスト必見!M-1グランプリデータサイエンティスト必見!M-1グランプリ
データサイエンティスト必見!M-1グランプリ
 
R を起動するその前に
R を起動するその前にR を起動するその前に
R を起動するその前に
 
TokyoR42_around_chaining
TokyoR42_around_chainingTokyoR42_around_chaining
TokyoR42_around_chaining
 
マルコフ連鎖モンテカルロ法入門-1
マルコフ連鎖モンテカルロ法入門-1マルコフ連鎖モンテカルロ法入門-1
マルコフ連鎖モンテカルロ法入門-1
 
Rで代数統計 TokyoR #42 LT
Rで代数統計 TokyoR #42 LTRで代数統計 TokyoR #42 LT
Rで代数統計 TokyoR #42 LT
 
最強のハードディスクはどれだ?
最強のハードディスクはどれだ?最強のハードディスクはどれだ?
最強のハードディスクはどれだ?
 

More from Yohei Sato

Tokyor60 r data_science_part1
Tokyor60 r data_science_part1Tokyor60 r data_science_part1
Tokyor60 r data_science_part1Yohei Sato
 
Tokyor60 opening
Tokyor60 openingTokyor60 opening
Tokyor60 openingYohei Sato
 
Tokyor45 カーネル多変量解析第2章 カーネル多変量解析の仕組み
Tokyor45 カーネル多変量解析第2章 カーネル多変量解析の仕組みTokyor45 カーネル多変量解析第2章 カーネル多変量解析の仕組み
Tokyor45 カーネル多変量解析第2章 カーネル多変量解析の仕組みYohei Sato
 
Tokyor39 yokkuns
Tokyor39 yokkunsTokyor39 yokkuns
Tokyor39 yokkunsYohei Sato
 
EasyHtmlReportの紹介
EasyHtmlReportの紹介EasyHtmlReportの紹介
EasyHtmlReportの紹介Yohei Sato
 
20131206 japan r
20131206 japan r20131206 japan r
20131206 japan rYohei Sato
 
Tokyor35 人工データの発生
Tokyor35 人工データの発生Tokyor35 人工データの発生
Tokyor35 人工データの発生Yohei Sato
 
ドリコムの分析環境とデータサイエンス活用事例
ドリコムの分析環境とデータサイエンス活用事例ドリコムの分析環境とデータサイエンス活用事例
ドリコムの分析環境とデータサイエンス活用事例Yohei Sato
 
R言語で学ぶマーケティング分析 競争ポジショニング戦略
R言語で学ぶマーケティング分析 競争ポジショニング戦略R言語で学ぶマーケティング分析 競争ポジショニング戦略
R言語で学ぶマーケティング分析 競争ポジショニング戦略Yohei Sato
 
Rでレポートメール
RでレポートメールRでレポートメール
RでレポートメールYohei Sato
 
Rで階層ベイズモデル
Rで階層ベイズモデルRで階層ベイズモデル
Rで階層ベイズモデルYohei Sato
 
Rでピボットテーブル
RでピボットテーブルRでピボットテーブル
RでピボットテーブルYohei Sato
 
第3回Japan rパネルディスカッション
第3回Japan rパネルディスカッション第3回Japan rパネルディスカッション
第3回Japan rパネルディスカッションYohei Sato
 
Tokyor26 data fusion
Tokyor26 data fusionTokyor26 data fusion
Tokyor26 data fusionYohei Sato
 
Tokyor24 yokkuns
Tokyor24 yokkunsTokyor24 yokkuns
Tokyor24 yokkunsYohei Sato
 
Tokyowebmining19 data fusion
Tokyowebmining19 data fusionTokyowebmining19 data fusion
Tokyowebmining19 data fusionYohei Sato
 
傾向スコア解析とUplift Modelling
傾向スコア解析とUplift Modelling傾向スコア解析とUplift Modelling
傾向スコア解析とUplift ModellingYohei Sato
 
Complex network ws_percolation
Complex network ws_percolationComplex network ws_percolation
Complex network ws_percolationYohei Sato
 
異常行動検出入門(改)
異常行動検出入門(改)異常行動検出入門(改)
異常行動検出入門(改)Yohei Sato
 
Tokyor22 selection bias
Tokyor22 selection biasTokyor22 selection bias
Tokyor22 selection biasYohei Sato
 

More from Yohei Sato (20)

Tokyor60 r data_science_part1
Tokyor60 r data_science_part1Tokyor60 r data_science_part1
Tokyor60 r data_science_part1
 
Tokyor60 opening
Tokyor60 openingTokyor60 opening
Tokyor60 opening
 
Tokyor45 カーネル多変量解析第2章 カーネル多変量解析の仕組み
Tokyor45 カーネル多変量解析第2章 カーネル多変量解析の仕組みTokyor45 カーネル多変量解析第2章 カーネル多変量解析の仕組み
Tokyor45 カーネル多変量解析第2章 カーネル多変量解析の仕組み
 
Tokyor39 yokkuns
Tokyor39 yokkunsTokyor39 yokkuns
Tokyor39 yokkuns
 
EasyHtmlReportの紹介
EasyHtmlReportの紹介EasyHtmlReportの紹介
EasyHtmlReportの紹介
 
20131206 japan r
20131206 japan r20131206 japan r
20131206 japan r
 
Tokyor35 人工データの発生
Tokyor35 人工データの発生Tokyor35 人工データの発生
Tokyor35 人工データの発生
 
ドリコムの分析環境とデータサイエンス活用事例
ドリコムの分析環境とデータサイエンス活用事例ドリコムの分析環境とデータサイエンス活用事例
ドリコムの分析環境とデータサイエンス活用事例
 
R言語で学ぶマーケティング分析 競争ポジショニング戦略
R言語で学ぶマーケティング分析 競争ポジショニング戦略R言語で学ぶマーケティング分析 競争ポジショニング戦略
R言語で学ぶマーケティング分析 競争ポジショニング戦略
 
Rでレポートメール
RでレポートメールRでレポートメール
Rでレポートメール
 
Rで階層ベイズモデル
Rで階層ベイズモデルRで階層ベイズモデル
Rで階層ベイズモデル
 
Rでピボットテーブル
RでピボットテーブルRでピボットテーブル
Rでピボットテーブル
 
第3回Japan rパネルディスカッション
第3回Japan rパネルディスカッション第3回Japan rパネルディスカッション
第3回Japan rパネルディスカッション
 
Tokyor26 data fusion
Tokyor26 data fusionTokyor26 data fusion
Tokyor26 data fusion
 
Tokyor24 yokkuns
Tokyor24 yokkunsTokyor24 yokkuns
Tokyor24 yokkuns
 
Tokyowebmining19 data fusion
Tokyowebmining19 data fusionTokyowebmining19 data fusion
Tokyowebmining19 data fusion
 
傾向スコア解析とUplift Modelling
傾向スコア解析とUplift Modelling傾向スコア解析とUplift Modelling
傾向スコア解析とUplift Modelling
 
Complex network ws_percolation
Complex network ws_percolationComplex network ws_percolation
Complex network ws_percolation
 
異常行動検出入門(改)
異常行動検出入門(改)異常行動検出入門(改)
異常行動検出入門(改)
 
Tokyor22 selection bias
Tokyor22 selection biasTokyor22 selection bias
Tokyor22 selection bias
 

Tokyor42_r_datamining_18