Submit Search
Upload
データ分析-の波乗り遅れた気がしてる人のための Python×データ分析の超基礎の基礎 v1.0-20160831
•
14 likes
•
4,969 views
Yusaku Kinoshita
Follow
ここで話しました。 http://python-nyumon.connpass.com/event/36487/
Read less
Read more
Engineering
Report
Share
Report
Share
1 of 100
Download now
Download to read offline
Recommended
【非エンジニアが 「明日からDevRelやってよ」って 突然言われて1年半やってきたこと ~teratailのDevRel担当、ゼロからの奮闘記~ @a...
【非エンジニアが 「明日からDevRelやってよ」って 突然言われて1年半やってきたこと ~teratailのDevRel担当、ゼロからの奮闘記~ @a...
Yusaku Kinoshita
WebVR空間の巨大スクリーンでteratailを見れるか試してみた話
WebVR空間の巨大スクリーンでteratailを見れるか試してみた話
Yusaku Kinoshita
エンジニアじゃなくても 3Dゲームが3時間できた話。 ~three.jsで3D糸通しをつくってみた~
エンジニアじゃなくても 3Dゲームが3時間できた話。 ~three.jsで3D糸通しをつくってみた~
Yusaku Kinoshita
エンジニアじゃなくてもAngularJS×milkcocoaでチャットアプリが1時間!? 非エンジニアから見たAngularJSの感動するポイント3つ
エンジニアじゃなくてもAngularJS×milkcocoaでチャットアプリが1時間!? 非エンジニアから見たAngularJSの感動するポイント3つ
Yusaku Kinoshita
師弟登壇・新米サムライの集い 2013
師弟登壇・新米サムライの集い 2013
hiboma
IT業界における伝統芸能の継承 #hachiojipm
IT業界における伝統芸能の継承 #hachiojipm
鉄次 尾形
非エンジニアが MENstackでWebアプリをつくった話 #nodejs
非エンジニアが MENstackでWebアプリをつくった話 #nodejs
Yusaku Kinoshita
再帰、漸化式、差分方程式とアルゴリズム Gx#20
再帰、漸化式、差分方程式とアルゴリズム Gx#20
鉄次 尾形
Recommended
【非エンジニアが 「明日からDevRelやってよ」って 突然言われて1年半やってきたこと ~teratailのDevRel担当、ゼロからの奮闘記~ @a...
【非エンジニアが 「明日からDevRelやってよ」って 突然言われて1年半やってきたこと ~teratailのDevRel担当、ゼロからの奮闘記~ @a...
Yusaku Kinoshita
WebVR空間の巨大スクリーンでteratailを見れるか試してみた話
WebVR空間の巨大スクリーンでteratailを見れるか試してみた話
Yusaku Kinoshita
エンジニアじゃなくても 3Dゲームが3時間できた話。 ~three.jsで3D糸通しをつくってみた~
エンジニアじゃなくても 3Dゲームが3時間できた話。 ~three.jsで3D糸通しをつくってみた~
Yusaku Kinoshita
エンジニアじゃなくてもAngularJS×milkcocoaでチャットアプリが1時間!? 非エンジニアから見たAngularJSの感動するポイント3つ
エンジニアじゃなくてもAngularJS×milkcocoaでチャットアプリが1時間!? 非エンジニアから見たAngularJSの感動するポイント3つ
Yusaku Kinoshita
師弟登壇・新米サムライの集い 2013
師弟登壇・新米サムライの集い 2013
hiboma
IT業界における伝統芸能の継承 #hachiojipm
IT業界における伝統芸能の継承 #hachiojipm
鉄次 尾形
非エンジニアが MENstackでWebアプリをつくった話 #nodejs
非エンジニアが MENstackでWebアプリをつくった話 #nodejs
Yusaku Kinoshita
再帰、漸化式、差分方程式とアルゴリズム Gx#20
再帰、漸化式、差分方程式とアルゴリズム Gx#20
鉄次 尾形
JavaScriptで出来る、あんなことこんなこと
JavaScriptで出来る、あんなことこんなこと
Mayu Kimura
iPhoneアプリを Javaで書くよ?
iPhoneアプリを Javaで書くよ?
Toshio Ehara
JavaのテストGroovyでいいのではないかという話
JavaのテストGroovyでいいのではないかという話
disc99_
20120830 DBリファクタリング読書会第三回
20120830 DBリファクタリング読書会第三回
都元ダイスケ Miyamoto
JavaFXとRoboVMを使ってiOS上で動くアプリを試してみた
JavaFXとRoboVMを使ってiOS上で動くアプリを試してみた
Satoshi Takami
本気でPythonで宛名書きした話
本気でPythonで宛名書きした話
Satoshi Yamada
SwiftのWebフレームワークVaporを触ってみる
SwiftのWebフレームワークVaporを触ってみる
Yuya Oka
簡単!Groovy入門
簡単!Groovy入門
Lee Choong Geun
30億のデバイスで走るjavaを支えるjavaエコシステム
30億のデバイスで走るjavaを支えるjavaエコシステム
Shinya Mochida
地獄Spec
地獄Spec
Tsunenori Oohara
入社1年目のプログラミング初心者がSpringを学ぶための手引き
入社1年目のプログラミング初心者がSpringを学ぶための手引き
土岐 孝平
ML system design_pattern
ML system design_pattern
yusuke shibui
GopherJS + Nashorn
GopherJS + Nashorn
Takuya Ueda
🍻(Beer Mug)の読み方を考える(mecab-ipadic-NEologdのUnicode 絵文字対応)
🍻(Beer Mug)の読み方を考える(mecab-ipadic-NEologdのUnicode 絵文字対応)
Toshinori Sato
2013 08-19 jjug
2013 08-19 jjug
sk44_
qpsutdy 201307 LT
qpsutdy 201307 LT
Tomohiro Ikeda
エンジニアが Webを学ぶために やっててよかったこと
エンジニアが Webを学ぶために やっててよかったこと
Hirata Tomoko
qpstudy3周年記念LT大会
qpstudy3周年記念LT大会
Tomohiro Ikeda
Perl で自然言語処理
Perl で自然言語処理
Toshinori Sato
「プログラミングGroovy」入門(公開用)
「プログラミングGroovy」入門(公開用)
orange clover
Rでを作る
Rでを作る
Nagi Teramo
「ゼロから構築するDev rel体制」20160316@devrelmeetup
「ゼロから構築するDev rel体制」20160316@devrelmeetup
Yusaku Kinoshita
More Related Content
What's hot
JavaScriptで出来る、あんなことこんなこと
JavaScriptで出来る、あんなことこんなこと
Mayu Kimura
iPhoneアプリを Javaで書くよ?
iPhoneアプリを Javaで書くよ?
Toshio Ehara
JavaのテストGroovyでいいのではないかという話
JavaのテストGroovyでいいのではないかという話
disc99_
20120830 DBリファクタリング読書会第三回
20120830 DBリファクタリング読書会第三回
都元ダイスケ Miyamoto
JavaFXとRoboVMを使ってiOS上で動くアプリを試してみた
JavaFXとRoboVMを使ってiOS上で動くアプリを試してみた
Satoshi Takami
本気でPythonで宛名書きした話
本気でPythonで宛名書きした話
Satoshi Yamada
SwiftのWebフレームワークVaporを触ってみる
SwiftのWebフレームワークVaporを触ってみる
Yuya Oka
簡単!Groovy入門
簡単!Groovy入門
Lee Choong Geun
30億のデバイスで走るjavaを支えるjavaエコシステム
30億のデバイスで走るjavaを支えるjavaエコシステム
Shinya Mochida
地獄Spec
地獄Spec
Tsunenori Oohara
入社1年目のプログラミング初心者がSpringを学ぶための手引き
入社1年目のプログラミング初心者がSpringを学ぶための手引き
土岐 孝平
ML system design_pattern
ML system design_pattern
yusuke shibui
GopherJS + Nashorn
GopherJS + Nashorn
Takuya Ueda
🍻(Beer Mug)の読み方を考える(mecab-ipadic-NEologdのUnicode 絵文字対応)
🍻(Beer Mug)の読み方を考える(mecab-ipadic-NEologdのUnicode 絵文字対応)
Toshinori Sato
2013 08-19 jjug
2013 08-19 jjug
sk44_
qpsutdy 201307 LT
qpsutdy 201307 LT
Tomohiro Ikeda
エンジニアが Webを学ぶために やっててよかったこと
エンジニアが Webを学ぶために やっててよかったこと
Hirata Tomoko
qpstudy3周年記念LT大会
qpstudy3周年記念LT大会
Tomohiro Ikeda
Perl で自然言語処理
Perl で自然言語処理
Toshinori Sato
「プログラミングGroovy」入門(公開用)
「プログラミングGroovy」入門(公開用)
orange clover
What's hot
(20)
JavaScriptで出来る、あんなことこんなこと
JavaScriptで出来る、あんなことこんなこと
iPhoneアプリを Javaで書くよ?
iPhoneアプリを Javaで書くよ?
JavaのテストGroovyでいいのではないかという話
JavaのテストGroovyでいいのではないかという話
20120830 DBリファクタリング読書会第三回
20120830 DBリファクタリング読書会第三回
JavaFXとRoboVMを使ってiOS上で動くアプリを試してみた
JavaFXとRoboVMを使ってiOS上で動くアプリを試してみた
本気でPythonで宛名書きした話
本気でPythonで宛名書きした話
SwiftのWebフレームワークVaporを触ってみる
SwiftのWebフレームワークVaporを触ってみる
簡単!Groovy入門
簡単!Groovy入門
30億のデバイスで走るjavaを支えるjavaエコシステム
30億のデバイスで走るjavaを支えるjavaエコシステム
地獄Spec
地獄Spec
入社1年目のプログラミング初心者がSpringを学ぶための手引き
入社1年目のプログラミング初心者がSpringを学ぶための手引き
ML system design_pattern
ML system design_pattern
GopherJS + Nashorn
GopherJS + Nashorn
🍻(Beer Mug)の読み方を考える(mecab-ipadic-NEologdのUnicode 絵文字対応)
🍻(Beer Mug)の読み方を考える(mecab-ipadic-NEologdのUnicode 絵文字対応)
2013 08-19 jjug
2013 08-19 jjug
qpsutdy 201307 LT
qpsutdy 201307 LT
エンジニアが Webを学ぶために やっててよかったこと
エンジニアが Webを学ぶために やっててよかったこと
qpstudy3周年記念LT大会
qpstudy3周年記念LT大会
Perl で自然言語処理
Perl で自然言語処理
「プログラミングGroovy」入門(公開用)
「プログラミングGroovy」入門(公開用)
Similar to データ分析-の波乗り遅れた気がしてる人のための Python×データ分析の超基礎の基礎 v1.0-20160831
Rでを作る
Rでを作る
Nagi Teramo
「ゼロから構築するDev rel体制」20160316@devrelmeetup
「ゼロから構築するDev rel体制」20160316@devrelmeetup
Yusaku Kinoshita
はじめてのテスト技法
はじめてのテスト技法
Tatsuya Saito
【A-5】(招待LT)灘校パソコン研究部とは
【A-5】(招待LT)灘校パソコン研究部とは
Satoru Cho
No018-01-suc3rum-20100929
No018-01-suc3rum-20100929
Sukusuku Scrum
ドローンをプログラミングして飛ばす!Scratch、PHP、Python、映像のプログラミング授業
ドローンをプログラミングして飛ばす!Scratch、PHP、Python、映像のプログラミング授業
株式会社 オープンソース・ワークショップ
2019年9月15日 OSC広島 ドローンをプログラミングして飛ばす!ScratchとPHPでプログラミング授業
2019年9月15日 OSC広島 ドローンをプログラミングして飛ばす!ScratchとPHPでプログラミング授業
株式会社 オープンソース・ワークショップ
Introduction
Introduction
Takeshi Akutsu
S20 t1 stapyのこれまでとこれから
S20 t1 stapyのこれまでとこれから
Takeshi Akutsu
業務系WebアプリケーションがStrutsから旅立つ日
業務系WebアプリケーションがStrutsから旅立つ日
Mitsuru Ogawa
Python による 「スクレイピング & 自然言語処理」入門
Python による 「スクレイピング & 自然言語処理」入門
Tatsuya Tojima
DBエンジニアに必要だったPythonのスキル
DBエンジニアに必要だったPythonのスキル
Satoshi Yamada
プログラミングを学ぶと何が良いのか
プログラミングを学ぶと何が良いのか
Haruo Sato
Tokyo.R女子部発表スライド「Rではじめるデータ解析の超基礎」
Tokyo.R女子部発表スライド「Rではじめるデータ解析の超基礎」
tokyorgirls
20180824 DLLab推論ナイト_深層学習モデル推論ライブラリ「Menoh」の紹介/Python以外でDeepLearning
20180824 DLLab推論ナイト_深層学習モデル推論ライブラリ「Menoh」の紹介/Python以外でDeepLearning
Preferred Networks
IoTの原点
IoTの原点
Shinichi Takahashi
PredictionIOのPython対応計画
PredictionIOのPython対応計画
Shinsuke Sugaya
20170130 Oisix勉強会LT発表資料
20170130 Oisix勉強会LT発表資料
Taisuke Fukawa
20121124 学生セミナー「基礎からわかる! IT業界とプログラミング」
20121124 学生セミナー「基礎からわかる! IT業界とプログラミング」
Takashi Uemura
S06 t1 python学習奮闘記#4
S06 t1 python学習奮闘記#4
Takeshi Akutsu
Similar to データ分析-の波乗り遅れた気がしてる人のための Python×データ分析の超基礎の基礎 v1.0-20160831
(20)
Rでを作る
Rでを作る
「ゼロから構築するDev rel体制」20160316@devrelmeetup
「ゼロから構築するDev rel体制」20160316@devrelmeetup
はじめてのテスト技法
はじめてのテスト技法
【A-5】(招待LT)灘校パソコン研究部とは
【A-5】(招待LT)灘校パソコン研究部とは
No018-01-suc3rum-20100929
No018-01-suc3rum-20100929
ドローンをプログラミングして飛ばす!Scratch、PHP、Python、映像のプログラミング授業
ドローンをプログラミングして飛ばす!Scratch、PHP、Python、映像のプログラミング授業
2019年9月15日 OSC広島 ドローンをプログラミングして飛ばす!ScratchとPHPでプログラミング授業
2019年9月15日 OSC広島 ドローンをプログラミングして飛ばす!ScratchとPHPでプログラミング授業
Introduction
Introduction
S20 t1 stapyのこれまでとこれから
S20 t1 stapyのこれまでとこれから
業務系WebアプリケーションがStrutsから旅立つ日
業務系WebアプリケーションがStrutsから旅立つ日
Python による 「スクレイピング & 自然言語処理」入門
Python による 「スクレイピング & 自然言語処理」入門
DBエンジニアに必要だったPythonのスキル
DBエンジニアに必要だったPythonのスキル
プログラミングを学ぶと何が良いのか
プログラミングを学ぶと何が良いのか
Tokyo.R女子部発表スライド「Rではじめるデータ解析の超基礎」
Tokyo.R女子部発表スライド「Rではじめるデータ解析の超基礎」
20180824 DLLab推論ナイト_深層学習モデル推論ライブラリ「Menoh」の紹介/Python以外でDeepLearning
20180824 DLLab推論ナイト_深層学習モデル推論ライブラリ「Menoh」の紹介/Python以外でDeepLearning
IoTの原点
IoTの原点
PredictionIOのPython対応計画
PredictionIOのPython対応計画
20170130 Oisix勉強会LT発表資料
20170130 Oisix勉強会LT発表資料
20121124 学生セミナー「基礎からわかる! IT業界とプログラミング」
20121124 学生セミナー「基礎からわかる! IT業界とプログラミング」
S06 t1 python学習奮闘記#4
S06 t1 python学習奮闘記#4
More from Yusaku Kinoshita
集まっTail(集まっている)#8
集まっTail(集まっている)#8
Yusaku Kinoshita
Bridging the Gap for Beginners in Developer Communities@DevRelConTokyo_20170729
Bridging the Gap for Beginners in Developer Communities@DevRelConTokyo_20170729
Yusaku Kinoshita
集まっtail#7「teratailより」
集まっtail#7「teratailより」
Yusaku Kinoshita
77枚の資料を5分で発表してみたやつ【G’s academy 卒業制作」発表資料(016.03.02) 】
77枚の資料を5分で発表してみたやつ【G’s academy 卒業制作」発表資料(016.03.02) 】
Yusaku Kinoshita
Motohashi.#3
Motohashi.#3
Yusaku Kinoshita
個人開発アプリのご紹介とあり得ない不具合に対する掲示板の活用事例
個人開発アプリのご紹介とあり得ない不具合に対する掲示板の活用事例
Yusaku Kinoshita
G'sアカデミー2期入学式資料(投影資料版)
G'sアカデミー2期入学式資料(投影資料版)
Yusaku Kinoshita
5分でわかるphalcon php
5分でわかるphalcon php
Yusaku Kinoshita
効率的かつユニークな学習法
効率的かつユニークな学習法
Yusaku Kinoshita
150612 middleman(ikuwow)
150612 middleman(ikuwow)
Yusaku Kinoshita
Google先生との付き合い方(lightwill氏)
Google先生との付き合い方(lightwill氏)
Yusaku Kinoshita
20150226 炎上を防ぐためにフロントエンドエンジニアとしてできること
20150226 炎上を防ぐためにフロントエンドエンジニアとしてできること
Yusaku Kinoshita
More from Yusaku Kinoshita
(12)
集まっTail(集まっている)#8
集まっTail(集まっている)#8
Bridging the Gap for Beginners in Developer Communities@DevRelConTokyo_20170729
Bridging the Gap for Beginners in Developer Communities@DevRelConTokyo_20170729
集まっtail#7「teratailより」
集まっtail#7「teratailより」
77枚の資料を5分で発表してみたやつ【G’s academy 卒業制作」発表資料(016.03.02) 】
77枚の資料を5分で発表してみたやつ【G’s academy 卒業制作」発表資料(016.03.02) 】
Motohashi.#3
Motohashi.#3
個人開発アプリのご紹介とあり得ない不具合に対する掲示板の活用事例
個人開発アプリのご紹介とあり得ない不具合に対する掲示板の活用事例
G'sアカデミー2期入学式資料(投影資料版)
G'sアカデミー2期入学式資料(投影資料版)
5分でわかるphalcon php
5分でわかるphalcon php
効率的かつユニークな学習法
効率的かつユニークな学習法
150612 middleman(ikuwow)
150612 middleman(ikuwow)
Google先生との付き合い方(lightwill氏)
Google先生との付き合い方(lightwill氏)
20150226 炎上を防ぐためにフロントエンドエンジニアとしてできること
20150226 炎上を防ぐためにフロントエンドエンジニアとしてできること
データ分析-の波乗り遅れた気がしてる人のための Python×データ分析の超基礎の基礎 v1.0-20160831
1.
"データ分析"の波乗り遅れた気がしてる人のための Python×データ分析の超基礎の基礎_v1.0 ~Pythonもデータ分析もまったくの素人なやつが、 データ分析に入門する前の超基礎の基礎を完全素人目線でまとめてみた~ @afroscript
2.
本日のスライド枚数
3.
100枚!!
4.
最高記録への挑戦っ!!
5.
神速でいきます
6.
まずは…
7.
自己紹介 ■名前: 木下 雄策(27歳・福岡出身) @afroscript10 ■略歴: 九州大学大学院で宇宙の研究 2013年 レバレジーズ入社 ■今のお仕事: 日本のエンジニア業界を最強にすること!! ・エンジニア特化型Q&Aサイト【teratail】のDevRel担当 ・年に50回くらいイベントやってます ■その他 ・Gs'ACADEMY2期生/WebGLスクール3期生 ・LIGブログ「0エンジニアから0.5エンジニアへ」連載中 ・元アフロ、フリースタイルバスケットボーラー ・最近は、Web3DやWebVRが好き
8.
では、始めます
9.
今回発表の目的
10.
「データ分析」って昨今やたらと言われ続けてるし、 「そのうち勉強したいな〜」なんて思ってはいるんだけど、 気づけばあと回しにしてて、乗り遅れた気がしている…
11.
そんな1ヶ月前の僕みたいな人のために、 完全に素人目線からPython×データ分析の超基礎の基礎を まとめてみました:) どんなライブラリ使う の?? どんな環境でやる の?? そもそもデータ分 析って何するの?
12.
これを機に、データ分析ちょっとやってみるか!ってゆう きっかけになればうれしいです。:)
13.
注意点
14.
めっっっっっちゃ 初心者向けです!!
15.
今回はデータ分析のための環境準備と データ可視化基礎の一部を紹介するのみです。
16.
この資料みても データ分析から何か生み出せるまでは至らないと思いますが、 そのための基礎固めくらいにはなるのではと:)
17.
より実用的なデータ分析手法やPythonでのその実現方法などは、 僕の勉強が進むにつれvol.2とかでまとめてくと思います。 (多分!!)
18.
目次
19.
●そもそもデータ分析って何なんだろう? ●Pythonでデータ分析するのに最低限必要そうなもの ●データ分析のための超基礎の基礎ワード ●データの可視化基礎の基礎 ・箱ひげ図 ・ヒストグラム ・散布図 ●代表的な分析手法 → 今後勉強すべき分析手法 ・その1:仮説検定(それって本当に関連性あるの?) ・その2:ロジスティック回帰分析(どの要素が結果にコミットしたの?) ・その3:クラスター分析(なんかいい具合にグループ分けしてくれるやつ) ・その4:決定木(機械学習の第一歩) ●まとめ 目次
20.
そもそもデータ分析って何なんだろう? (完全素人目線)
21.
■「データ分析」=「データ」+「分析」 そもそもデータ分析って何?(完全素人目線)
22.
■「データ分析」=「データ」+「分析」 ●「データ」とは? ●「分析」とは? ●「データ分析」とは? そもそもデータ分析って何?(完全素人目線)
23.
■「データ分析」=「データ」+「分析」 ●「データ」とは? →複数の事実や事象、資料、数値の集まり ●「分析」とは? ●「データ分析」とは? そもそもデータ分析って何?(完全素人目線)
24.
■「データ分析」=「データ」+「分析」 ●「データ」とは? →複数の事実や事象、資料、数値の集まり ●「分析」とは? →ある物事を分解して、それを成立させている成分・要素・側面を 明らかにすること ●「データ分析」とは? ※参考:wikipedia そもそもデータ分析って何?(完全素人目線)
25.
■「データ分析」=「データ」+「分析」 ●「データ」とは? →複数の事実や事象、資料、数値の集まり ●「分析」とは? →ある物事を分解して、それを成立させている成分・要素・側面を 明らかにすること ●「データ分析」とは? →複数の事実や事象、資料、数値の集まりを分解して、 それを成立させている成分・要素・側面を明らかにすること そもそもデータ分析って何?(完全素人目線)
26.
■「データ分析」=「データ」+「分析」 ●「データ」とは? →複数の事実や事象、資料、数値の集まり ●「分析」とは? →ある物事を分解して、それを成立させている成分・要素・側面を 明らかにすること ●「データ分析」とは? →複数の事実や事象、資料、数値の集まりを分解して、 それを成立させている成分・要素・側面を明らかにすること →「データの準備」と「分解方法」と「結果の考察」がざっくり必要そうな感じ そもそもデータ分析って何?(完全素人目線)
27.
Pythonでデータ分析するのに必要なもの
28.
■とりあえず「Python」を入れる(今回は3.5.2使った) https://www.python.org/downloads/ ※「Download Python
3.5.●」をクリック Pythonでデータ分析するのに必要なもの(1/4)
29.
■とりあえず「Python」を入れる(今回は3.5.2使った) https://www.python.org/downloads/ ※「Download Python
3.5.●」をクリック ■次に「ANACONDA」を入れる(Win/Macどっちもやったけど、やっぱMacがよさげ) →Pythonの主要ライブラリを一括でインストールできるってゆう、 なんだか便利な素敵パッケージ https://www.continuum.io/downloads ※「Download for ●●」をクリック Pythonでデータ分析するのに必要なもの(1/4)
30.
■こんなライブラリを使います(ANACONDAにすでに含まれているもの) Pythonでデータ分析するのに必要なもの(2/4)
31.
■こんなライブラリを使います(ANACONDAにすでに含まれているもの) ●「NumPy」(ナムパイ/ナンパイ) →データ整理に必要な関数がいっぱい。 array(配列)とかrandom(乱数)とか使う感じ Pythonでデータ分析するのに必要なもの(2/4)
32.
■こんなライブラリを使います(ANACONDAにすでに含まれているもの) ●「NumPy」(ナムパイ/ナンパイ) →データ整理に必要な関数がいっぱい。 array(配列)とかrandom(乱数)とか使う感じ ●「Pandas」 →データ解析を支援する機能がいっぱい入ったライブラリ。 SeriesやDataFrameとかのデータ型使える Pythonでデータ分析するのに必要なもの(2/4)
33.
■こんなライブラリを使います(ANACONDAにすでに含まれているもの) ●「NumPy」(ナムパイ/ナンパイ) →データ整理に必要な関数がいっぱい。 array(配列)とかrandom(乱数)とか使う感じ ●「Pandas」 →データ解析を支援する機能がいっぱい入ったライブラリ。 SeriesやDataFrameとかのデータ型使える ●「SciPy」(サイパイ) →Science+Python。多分NumPyよりももっと科学寄りなことまできるっぽい Pythonでデータ分析するのに必要なもの(2/4)
34.
■こんなライブラリを使います(ANACONDAにすでに含まれているもの) ●「NumPy」(ナムパイ/ナンパイ) →データ整理に必要な関数がいっぱい。 array(配列)とかrandom(乱数)とか使う感じ ●「Pandas」 →データ解析を支援する機能がいっぱい入ったライブラリ。 SeriesやDataFrameとかのデータ型使える ●「SciPy」(サイパイ) →Science+Python。多分NumPyよりももっと科学寄りなことまできるっぽい ●「matplotlib」 →PythonやNumPyのためのグラフ描画ライブラリ Pythonでデータ分析するのに必要なもの(2/4)
35.
■こんなライブラリを使います(ANACONDAにすでに含まれているもの) ●「NumPy」(ナムパイ/ナンパイ) →データ整理に必要な関数がいっぱい。 array(配列)とかrandom(乱数)とか使う感じ ●「Pandas」 →データ解析を支援する機能がいっぱい入ったライブラリ。 SeriesやDataFrameとかのデータ型使える ●「SciPy」(サイパイ) →Science+Python。多分NumPyよりももっと科学寄りなことまできるっぽい ●「matplotlib」 →PythonやNumPyのためのグラフ描画ライブラリ ●「beautifulsoup4」 →WebからとってきたHTMLファイルのデータや表データを取り扱う (僕はまだほとんど使ってないです ) Pythonでデータ分析するのに必要なもの(2/4)
36.
■その他こんなライブラリを使う (ANACONDAに入ってないので別途インストールする) Pythonでデータ分析するのに必要なもの(2/4)
37.
■その他こんなライブラリを使う (ANACONDAに入ってないので別途インストールする) ●「Seaborn」 →matplotlibよりも美しいグラフが描画できると言われているライブラリ Pythonでデータ分析するのに必要なもの(2/4)
38.
■その他こんなライブラリを使う (ANACONDAに入ってないので別途インストールする) ●「Seaborn」 →matplotlibよりも美しいグラフが描画できると言われているライブラリ ●「html5lib」 →WebからとってきたHTMLファイルのデータを取り扱う? (僕まだほとんど使ってない) Pythonでデータ分析するのに必要なもの(2/4)
39.
■その他こんなライブラリを使う (ANACONDAに入ってないので別途インストールする) ●「Seaborn」 →matplotlibよりも美しいグラフが描画できると言われているライブラリ ●「html5lib」 →WebからとってきたHTMLファイルのデータを取り扱う? (僕まだほとんど使ってない) ※ライブラリのインストール方法 (ターミナルから下記どちらかのコマンドで ) conda
install *インストールするライブラリの名前 * ←ANACONDA入ってる場合に使える pip install *インストールするライブラリの名前 * Pythonでデータ分析するのに必要なもの(2/4)
40.
■IPython notebook(Jupyter) Pythonでデータ分析するのに必要なもの(4/4)
41.
■IPython notebook(Jupyter) ●ターミナルから下記コマンドで起動(PythonとANACONDAが入ってたら起動する) $ ipython
notebook Pythonでデータ分析するのに必要なもの(4/4)
42.
■IPython notebook(Jupyter) ●ターミナルから下記コマンドで起動(PythonとANACONDAが入ってたら起動する) $ ipython
notebook ●すると、下記のようなのがブラウザで立ち上がるので、ここで作業していく。 Pythonでデータ分析するのに必要なもの(4/4)
43.
■IPython notebook(Jupyter)で新しいファイルを作成 Pythonでデータ分析するのに必要なもの(4/4)
44.
■IPython notebook(Jupyter)で新しいファイルを作成 ●「NEW▼」から「Python [Root]」をクリックすると、ファイルが生成される Pythonでデータ分析するのに必要なもの(4/4)
45.
■IPython notebook(Jupyter)で新しいファイルを作成 ●「NEW▼」から「Python [Root]」をクリックすると、ファイルが生成される Pythonでデータ分析するのに必要なもの(4/4) ●こんな画面
46.
■IPython notebook(Jupyter)で新しいファイルを作成 ●「NEW▼」から「Python [Root]」をクリックすると、ファイルが生成される Pythonでデータ分析するのに必要なもの(4/4) ●こんな画面(※「Control+Enter」or「
Shift+Enter」で実行結果を返してくれる)
47.
データ分析のための超基礎の基礎用語 今47枚!
48.
■基礎用語をひとまず並べてみる データ分析のための超基礎用語(1/4)
49.
■基礎用語をひとまず並べてみる ●最大値 ●最小値 データ分析のための超基礎用語(1/4)
50.
■基礎用語をひとまず並べてみる ●最大値 ●最小値 ●代表値 データ分析のための超基礎用語(1/4)
51.
■基礎用語をひとまず並べてみる ●最大値 ●最小値 ●代表値 ┗平均値 ┗中央値(メディアン) ┗最頻値(モード) データ分析のための超基礎用語(1/4)
52.
■基礎用語をひとまず並べてみる ●最大値 ●最小値 ●代表値 ┗平均値 ┗中央値(メディアン)→小さい順に並べた真ん中のデータの値 ┗最頻値(モード)→最も多く出てくるデータの値 データ分析のための超基礎用語(1/4)
53.
■基礎用語をひとまず並べてみる ●最大値 ●最小値 ●代表値 ┗平均値 ┗中央値(メディアン)→小さい順に並べた真ん中のデータの値 ┗最頻値(モード)→最も多く出てくるデータの値 ●四分位点 データ分析のための超基礎用語(1/4)
54.
■基礎用語をひとまず並べてみる ●最大値 ●最小値 ●代表値 ┗平均値 ┗中央値(メディアン)→小さい順に並べた真ん中のデータの値 ┗最頻値(モード)→最も多く出てくるデータの値 ●四分位点→小さい順に並べて四等分してたときの境界線 データ分析のための超基礎用語(1/4)
55.
■基礎用語をひとまず並べてみる ●最大値 ●最小値 ●代表値 ┗平均値 ┗中央値(メディアン)→小さい順に並べた真ん中のデータの値 ┗最頻値(モード)→最も多く出てくるデータの値 ●四分位点→小さい順に並べて四等分してたときの境界線 ●箱ひげ図(plot box) ●分散(標準偏差) ●ヒストグラム(度数分布図) ●散布図 データ分析のための超基礎用語(1/4)
56.
■基礎用語をひとまず並べてみる ●最大値 ●最小値 ●代表値 ┗平均値 ┗中央値(メディアン)→小さい順に並べた真ん中のデータの値 ┗最頻値(モード)→最も多く出てくるデータの値 ●四分位点→小さい順に並べて四等分してたときの境界線 ●箱ひげ図(plot box)→最小値、第1四分位点、中央値(第2四分位点)、 第3四分位点、最大値をプロットした図 ●分散(標準偏差)→データの「ひろがり」「ばらつき」を表す。 ●ヒストグラム(度数分布図) ●散布図 データ分析のための超基礎用語(1/4)
57.
■基礎用語をひとまず並べてみる ●最大値 ●最小値 ●代表値 ┗平均値 ┗中央値(メディアン)→小さい順に並べた真ん中のデータの値 ┗最頻値(モード)→最も多く出てくるデータの値 ●四分位点→小さい順に並べて四等分してたときの境界線 ●箱ひげ図(plot box)→最小値、第1四分位点、中央値(第2四分位点)、 第3四分位点、最大値をプロットした図 ●分散(標準偏差)→データの「ひろがり」「ばらつき」を表す。 ●ヒストグラム(度数分布図) ●散布図 データ分析のための超基礎用語(1/4) 図で説明していきます!
58.
■最大値/最小値/代表値(平均値/中央値/最頻値)/四分位点/箱ひげ図のイメージ データ分析のための超基礎用語(2/4) ※参考:http://www.kousotu.com/lect_math/d03.php
59.
■最大値/最小値/代表値(平均値/中央値/最頻値)/四分位点/箱ひげ図のイメージ データ分析のための超基礎用語(2/4) ※参考:http://www.kousotu.com/lect_math/d03.php 小さい順に 並べておく
60.
■最大値/最小値/代表値(平均値/中央値/最頻値)/四分位点/箱ひげ図のイメージ データ分析のための超基礎用語(2/4) ※参考:http://www.kousotu.com/lect_math/d03.php ●中央値(小さい順の真ん中のデータの値 ) →今回は「6」
61.
■最大値/最小値/代表値(平均値/中央値/最頻値)/四分位点/箱ひげ図のイメージ データ分析のための超基礎用語(2/4) ※参考:http://www.kousotu.com/lect_math/d03.php ●中央値(小さい順の真ん中のデータの値 ) →今回は「6」 ●最頻値(最も多く出てくるデータの値 ) →今回は「4」と「9」
62.
■最大値/最小値/代表値(平均値/中央値/最頻値)/四分位点/箱ひげ図のイメージ データ分析のための超基礎用語(2/4) ※参考:http://www.kousotu.com/lect_math/d03.php ●中央値(小さい順の真ん中のデータの値 ) →今回は「6」 ●最頻値(最も多く出てくるデータの値 ) →今回は「4」と「9」 ●四分位点 →小さい順に並べて四等分したときの境界線 小さい方から順に第
1、第2、第3四方分位点と呼ぶ (第2四分位点=中央値となる)
63.
■最大値/最小値/代表値(平均値/中央値/最頻値)/四分位点/箱ひげ図のイメージ データ分析のための超基礎用語(2/4) ※参考:http://www.kousotu.com/lect_math/d03.php ●中央値(小さい順の真ん中のデータの値 ) →今回は「6」 ●最頻値(最も多く出てくるデータの値 ) →今回は「4」と「9」 ●四分位点 →小さい順に並べて四等分したときの境界線 小さい方から順に第
1、第2、第3四方分位点と呼ぶ (第2四分位点=中央値となる) <箱ひげ図>
64.
■最大値/最小値/代表値(平均値/中央値/最頻値)/四分位点/箱ひげ図のイメージ データ分析のための超基礎用語(2/4) ※参考:http://www.kousotu.com/lect_math/d03.php ●中央値(小さい順の真ん中のデータの値 ) →今回は「6」 ●最頻値(最も多く出てくるデータの値 ) →今回は「4」と「9」 ●四分位点 →小さい順に並べて四等分したときの境界線 小さい方から順に第
1、第2、第3四方分位点と呼ぶ (第2四分位点=中央値となる) ●箱ひげ図 →最小値、第1四分位点、中央値(第2四分位点)、 第3四分位点、最大値を左のようにプロットした図 <箱ひげ図>
65.
■最大値/最小値/代表値(平均値/中央値/最頻値)/四分位点/箱ひげ図のイメージ データ分析のための超基礎用語(2/4) ※参考:http://www.kousotu.com/lect_math/d03.php ●中央値(小さい順の真ん中のデータの値 ) →今回は「6」 ●最頻値(最も多く出てくるデータの値 ) →今回は「4」と「9」 ●四分位点 →小さい順に並べて四等分したときの境界線 小さい方から順に第
1、第2、第3四方分位点と呼ぶ (第2四分位点=中央値となる) ●箱ひげ図 →最小値、第1四分位点、中央値(第2四分位点)、 第3四分位点、最大値を左のようにプロットした図 →なんかいろいろ見えてくる便利な図! <箱ひげ図>
66.
■分散(標準偏差)/ヒストグラム(度数分布表) データ分析のための超基礎用語(3/4)
67.
■分散(標準偏差)/ヒストグラム(度数分布表) データ分析のための超基礎用語(3/4) ※参考: http://www.ikpi.co.jp/knowledge/valuation/valuation_file100.html https://www1.doshisha.ac.jp/~mjin/R/63/fig01.PNG ●ヒストグラム(度数分布表)
68.
■分散(標準偏差)/ヒストグラム(度数分布表) データ分析のための超基礎用語(3/4) ※参考: http://www.ikpi.co.jp/knowledge/valuation/valuation_file100.html https://www1.doshisha.ac.jp/~mjin/R/63/fig01.PNG ●ヒストグラム(度数分布表) →データがどう分布するかを分かりやすく可視化する方法の中で、 最も直感的かつ手っ取り早いグラフ 。
69.
■分散(標準偏差)/ヒストグラム(度数分布表) データ分析のための超基礎用語(3/4) ※参考: http://www.ikpi.co.jp/knowledge/valuation/valuation_file100.html https://www1.doshisha.ac.jp/~mjin/R/63/fig01.PNG ●ヒストグラム(度数分布表) →データがどう分布するかを分かりやすく可視化する方法の中で、 最も直感的かつ手っ取り早いグラフ 。 ※注意:値の大小とその頻度だけを見るものなので、 時系列での順番や値同士の関係性は表せない
70.
■分散(標準偏差)/ヒストグラム(度数分布表) データ分析のための超基礎用語(3/4) ※参考: http://www.ikpi.co.jp/knowledge/valuation/valuation_file100.html https://www1.doshisha.ac.jp/~mjin/R/63/fig01.PNG ●ヒストグラム(度数分布表) →データがどう分布するかを分かりやすく可視化する方法の中で、 最も直感的かつ手っ取り早いグラフ 。 ※注意:値の大小とその頻度だけを見るものなので、 時系列での順番や値同士の関係性は表せない ●分散(標準偏差)
71.
■分散(標準偏差)/ヒストグラム(度数分布表) データ分析のための超基礎用語(3/4) ※参考: http://www.ikpi.co.jp/knowledge/valuation/valuation_file100.html https://www1.doshisha.ac.jp/~mjin/R/63/fig01.PNG ●ヒストグラム(度数分布表) →データがどう分布するかを分かりやすく可視化する方法の中で、 最も直感的かつ手っ取り早いグラフ 。 ※注意:値の大小とその頻度だけを見るものなので、 時系列での順番や値同士の関係性は表せない ●分散(標準偏差) →データの「ひろがり」「ばらつき」を表す値 。 【小】 【大】 【中】
72.
■分散(標準偏差)/ヒストグラム(度数分布表) データ分析のための超基礎用語(3/4) ※参考: http://www.ikpi.co.jp/knowledge/valuation/valuation_file100.html https://www1.doshisha.ac.jp/~mjin/R/63/fig01.PNG ●ヒストグラム(度数分布表) →データがどう分布するかを分かりやすく可視化する方法の中で、 最も直感的かつ手っ取り早いグラフ 。 ※注意:値の大小とその頻度だけを見るものなので、 時系列での順番や値同士の関係性は表せない ●分散(標準偏差) →データの「ひろがり」「ばらつき」を表す値 。 「分散」が大きければデータは散らばってるし、 小さければデータは平均値付近に集まってる。 分散の平方根をとったものが標準偏差 【小】 【大】 【中】
73.
データ分析のための超基礎用語(4/4) ■散布図
74.
データ分析のための超基礎用語(4/4) ■散布図(散布図最強説もあるとかないとか。。。)
75.
データ分析のための超基礎用語(4/4) ※参考: https://upload.wikimedia.org/wikipedia/ja/d/d5/%E6%95%A3%E5%B8%83%E5%9B%B3.png http://nekopuni.holy.jp/wp-content/uploads/2013/10/3.gif http://cdn-ak.b.st-hatena.com/entryimage/264461267-1440996366_l.jpg 普通のやつ ■散布図(散布図最強説もあるとかないとか。。。)
76.
データ分析のための超基礎用語(4/4) ※参考: https://upload.wikimedia.org/wikipedia/ja/d/d5/%E6%95%A3%E5%B8%83%E5%9B%B3.png http://nekopuni.holy.jp/wp-content/uploads/2013/10/3.gif http://cdn-ak.b.st-hatena.com/entryimage/264461267-1440996366_l.jpg 普通のやつ 色つけたやつ ■散布図(散布図最強説もあるとかないとか。。。)
77.
データ分析のための超基礎用語(4/4) ※参考: https://upload.wikimedia.org/wikipedia/ja/d/d5/%E6%95%A3%E5%B8%83%E5%9B%B3.png http://nekopuni.holy.jp/wp-content/uploads/2013/10/3.gif http://cdn-ak.b.st-hatena.com/entryimage/264461267-1440996366_l.jpg 普通のやつ 色つけたやつ ■散布図(散布図最強説もあるとかないとか。。。)
78.
データ分析のための超基礎用語(4/4) ※参考: https://upload.wikimedia.org/wikipedia/ja/d/d5/%E6%95%A3%E5%B8%83%E5%9B%B3.png http://nekopuni.holy.jp/wp-content/uploads/2013/10/3.gif http://cdn-ak.b.st-hatena.com/entryimage/264461267-1440996366_l.jpg 普通のやつ 色つけたやつ 5次元散布図!?(色、球の大き さ、色の変化とかつけたやつ ) ■散布図(散布図最強説もあるとかないとか。。。)
79.
データの可視化基礎の基礎 あと20枚くらい!
80.
データの可視化基礎の基礎 その1:箱ひげ図
81.
■箱ひげ図の書き方 →seabornライブラリのboxplot関数を使う データの可視化基礎の基礎(箱ひげ図1/3)
82.
■箱ひげ図の書き方 →seabornライブラリのboxplot関数を使う データの可視化基礎の基礎(箱ひげ図1/3) #必要なライブラリ等の import from numpy.random
import randn import matplotlib.pyplot as plt import seaborn as sns #ブラウザ内に画像を埋め込むための命令です %matplotlib inline #正規分布に従う乱数を 100個用意 data1 = randn(100) #箱ひげ図の描画 sns.boxplot(data=data1)
83.
■箱ひげ図の書き方 →2つ同時に描画はこんな感じ データの可視化基礎の基礎(箱ひげ図2/3) data2 = randn(100)
+ 2 #箱ひげ図の描画 sns.boxplot(data=[data1,data2])
84.
■箱ひげ図の書き方 →ヴァイオリンプロットってのもある データの可視化基礎の基礎(箱ひげ図3/3) #ヴァイオリンプロットってのもある sns.violinplot(data=[data1,data2])
85.
データの可視化基礎の基礎 その2:ヒストグラム
86.
■ヒストグラム(度数分布図)の書き方 →matplotlibライブラリのpyplotモジュールのhist関数を使う データの可視化基礎の基礎(ヒストグラム1/3)
87.
■ヒストグラム(度数分布図)の書き方 →matplotlibライブラリのpyplotモジュールのhist関数を使う データの可視化基礎の基礎(ヒストグラム1/3) #ライブラリのimport from numpy.random import
randn import matplotlib.pyplot as plt #ブラウザ内に画像を埋め込むための命令です %matplotlib inline #正規分布に従う乱数データを 100個生成 dataset1= randn(100) #ヒストグラムを描画 plt.hist(dataset1)
88.
■ヒストグラム(度数分布図)の書き方 →normed=Trueを指定して正規化できる データの可視化基礎の基礎(ヒストグラム2/3) #縦軸の値を、総面積を 1としたときの面積比に してくれる plt.hist(dataset1, normed=True)
89.
■ヒストグラム(度数分布図)の書き方 →正規化すると重ねて比較するときに便利 データの可視化基礎の基礎(ヒストグラム3/3) #2つ目のデータを80個用意 dataset2 = randn(80) #normed
= Trueしておくと2つ重ねたときに便利 plt.hist(dataset1, normed=True, alpha=0.5, bins=20) plt.hist(dataset2, normed=True, alpha=0.5, bins=20, color='indianred') #alpha=0.5で透明度も調整してる #bins=20は分割数
90.
データの可視化基礎の基礎 その3:散布図
91.
■散布図の書き方 →matplotlibライブラリのpyplotモジュールのplot関数を使う、("o")を指定 データの可視化基礎の基礎(散布図1/2)
92.
■散布図の書き方 →matplotlibライブラリのpyplotモジュールのplot関数を使う、("o")を指定 データの可視化基礎の基礎(散布図1/2) #必要なライブラリ/モジュールをimport import matplotlib.pyplot as
plt from numpy.random import randn #ブラウザ内に画像を埋め込むための命令です %matplotlib inline x = randn(100) y = randn(100) plt.plot(x,y,"o") #"o"はアルファベトの"オー" #「.」でも可能(点が小さくなる)
93.
■散布図の書き方 →色を変えたり、重ねたりも可能(でも本当はplt.figure()を使うっぽい) データの可視化基礎の基礎(散布図2/2) x0 = randn(100) y0
= randn(100) x1=randn(100) y1=randn(100) #roはredの丸 plt.plot(x0,y0,"ro") #goはgreenの丸 plt.plot(x1,y1,"go")
94.
代表的な分析手法紹介 次に学ぶべき分析手法紹介
95.
■仮説検定(t検定/カイ二乗検定) →A/Bテストの効果検証などに使える ■ロジスティック回帰分析 →合格/不合格など1or0で結果が表せるものや、 コンバージョン率など0〜1の範囲で結果が表せるものの原因追求などに使える ■クラスタリング →なんかいい具合にデータをグルーピングしてくれる ■決定木 →機械学習の勉強の第一歩。 発展させて、SVMやランダムフォレストを学ぶとよいらしい 次に学ぶべき分析手法
96.
https://www.amazon.co.jp/dp/477416674X この本わかりやすかった(Rですが…w)
97.
https://www.udemy.com/python-jp/ キャンペーンで安くなってたこれもよかったです。
98.
まとめ
99.
■Python×データ分析で必要なもの ・ANACONDA(NumPy、Pandas、ScuPy、matplotlib、IPythonあたり) ■データ分析の前に基礎ワードを覚えよう ・中央値/最頻値/四分位点/分散etc... ■可視化の基礎 ・箱ひげ図/ヒストグラム/散布図 ■今後勉強すべき分析手法 ・仮説検定/ロジスティック回帰分析/クラスタリング/決定木 まとめ
100.
ご清聴 ありがとうございました:) 100枚達成!!
Download now