Submit Search
Upload
Dummiesパッケージ
•
Download as PPT, PDF
•
12 likes
•
16,316 views
W
weda654
Follow
Tokyo.Rの42回にて、かんたんにダミー変数がつくれるパッケージを試してみた
Read less
Read more
Data & Analytics
Report
Share
Report
Share
1 of 11
Download now
Recommended
グラフィカル Lasso を用いた異常検知
グラフィカル Lasso を用いた異常検知
Yuya Takashina
2 6.ゼロ切断・過剰モデル
2 6.ゼロ切断・過剰モデル
logics-of-blue
【読書会資料】『StanとRでベイズ統計モデリング』Chapter12:時間や空間を扱うモデル
【読書会資料】『StanとRでベイズ統計モデリング』Chapter12:時間や空間を扱うモデル
Masashi Komori
Cmdstanr入門とreduce_sum()解説
Cmdstanr入門とreduce_sum()解説
Hiroshi Shimizu
Rで学ぶ回帰分析と単位根検定
Rで学ぶ回帰分析と単位根検定
Nagi Teramo
機械学習の理論と実践
機械学習の理論と実践
Preferred Networks
顕著性マップの推定手法
顕著性マップの推定手法
Takao Yamanaka
階層ベイズとWAIC
階層ベイズとWAIC
Hiroshi Shimizu
Recommended
グラフィカル Lasso を用いた異常検知
グラフィカル Lasso を用いた異常検知
Yuya Takashina
2 6.ゼロ切断・過剰モデル
2 6.ゼロ切断・過剰モデル
logics-of-blue
【読書会資料】『StanとRでベイズ統計モデリング』Chapter12:時間や空間を扱うモデル
【読書会資料】『StanとRでベイズ統計モデリング』Chapter12:時間や空間を扱うモデル
Masashi Komori
Cmdstanr入門とreduce_sum()解説
Cmdstanr入門とreduce_sum()解説
Hiroshi Shimizu
Rで学ぶ回帰分析と単位根検定
Rで学ぶ回帰分析と単位根検定
Nagi Teramo
機械学習の理論と実践
機械学習の理論と実践
Preferred Networks
顕著性マップの推定手法
顕著性マップの推定手法
Takao Yamanaka
階層ベイズとWAIC
階層ベイズとWAIC
Hiroshi Shimizu
グラフィカルモデル入門
グラフィカルモデル入門
Kawamoto_Kazuhiko
自動微分変分ベイズ法の紹介
自動微分変分ベイズ法の紹介
Taku Yoshioka
3分でわかる多項分布とディリクレ分布
3分でわかる多項分布とディリクレ分布
Junya Saito
社会心理学者のための時系列分析入門_小森
社会心理学者のための時系列分析入門_小森
Masashi Komori
質的変数の相関・因子分析
質的変数の相関・因子分析
Mitsuo Shimohata
今さら聞けないカーネル法とサポートベクターマシン
今さら聞けないカーネル法とサポートベクターマシン
Shinya Shimizu
【DL輪読会】時系列予測 Transfomers の精度向上手法
【DL輪読会】時系列予測 Transfomers の精度向上手法
Deep Learning JP
PRML輪読#1
PRML輪読#1
matsuolab
比例ハザードモデルはとってもtricky!
比例ハザードモデルはとってもtricky!
takehikoihayashi
線形計画法入門
線形計画法入門
Shunji Umetani
5分でわかるかもしれないglmnet
5分でわかるかもしれないglmnet
Nagi Teramo
Stan超初心者入門
Stan超初心者入門
Hiroshi Shimizu
劣モジュラ最適化と機械学習1章
劣モジュラ最適化と機械学習1章
Hakky St
マルコフ連鎖モンテカルロ法
マルコフ連鎖モンテカルロ法
Masafumi Enomoto
[DL輪読会]Neural Ordinary Differential Equations
[DL輪読会]Neural Ordinary Differential Equations
Deep Learning JP
ノンパラメトリックベイズ4章クラスタリング
ノンパラメトリックベイズ4章クラスタリング
智文 中野
ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定
Akira Masuda
心理学における「再現性」の問題とBayes Factor
心理学における「再現性」の問題とBayes Factor
Shushi Namba
PRML輪読#11
PRML輪読#11
matsuolab
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
RyuichiKanoh
R入門(dplyrでデータ加工)-TokyoR42
R入門(dplyrでデータ加工)-TokyoR42
Atsushi Hayakawa
20170923 excelユーザーのためのr入門
20170923 excelユーザーのためのr入門
Takashi Kitano
More Related Content
What's hot
グラフィカルモデル入門
グラフィカルモデル入門
Kawamoto_Kazuhiko
自動微分変分ベイズ法の紹介
自動微分変分ベイズ法の紹介
Taku Yoshioka
3分でわかる多項分布とディリクレ分布
3分でわかる多項分布とディリクレ分布
Junya Saito
社会心理学者のための時系列分析入門_小森
社会心理学者のための時系列分析入門_小森
Masashi Komori
質的変数の相関・因子分析
質的変数の相関・因子分析
Mitsuo Shimohata
今さら聞けないカーネル法とサポートベクターマシン
今さら聞けないカーネル法とサポートベクターマシン
Shinya Shimizu
【DL輪読会】時系列予測 Transfomers の精度向上手法
【DL輪読会】時系列予測 Transfomers の精度向上手法
Deep Learning JP
PRML輪読#1
PRML輪読#1
matsuolab
比例ハザードモデルはとってもtricky!
比例ハザードモデルはとってもtricky!
takehikoihayashi
線形計画法入門
線形計画法入門
Shunji Umetani
5分でわかるかもしれないglmnet
5分でわかるかもしれないglmnet
Nagi Teramo
Stan超初心者入門
Stan超初心者入門
Hiroshi Shimizu
劣モジュラ最適化と機械学習1章
劣モジュラ最適化と機械学習1章
Hakky St
マルコフ連鎖モンテカルロ法
マルコフ連鎖モンテカルロ法
Masafumi Enomoto
[DL輪読会]Neural Ordinary Differential Equations
[DL輪読会]Neural Ordinary Differential Equations
Deep Learning JP
ノンパラメトリックベイズ4章クラスタリング
ノンパラメトリックベイズ4章クラスタリング
智文 中野
ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定
Akira Masuda
心理学における「再現性」の問題とBayes Factor
心理学における「再現性」の問題とBayes Factor
Shushi Namba
PRML輪読#11
PRML輪読#11
matsuolab
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
RyuichiKanoh
What's hot
(20)
グラフィカルモデル入門
グラフィカルモデル入門
自動微分変分ベイズ法の紹介
自動微分変分ベイズ法の紹介
3分でわかる多項分布とディリクレ分布
3分でわかる多項分布とディリクレ分布
社会心理学者のための時系列分析入門_小森
社会心理学者のための時系列分析入門_小森
質的変数の相関・因子分析
質的変数の相関・因子分析
今さら聞けないカーネル法とサポートベクターマシン
今さら聞けないカーネル法とサポートベクターマシン
【DL輪読会】時系列予測 Transfomers の精度向上手法
【DL輪読会】時系列予測 Transfomers の精度向上手法
PRML輪読#1
PRML輪読#1
比例ハザードモデルはとってもtricky!
比例ハザードモデルはとってもtricky!
線形計画法入門
線形計画法入門
5分でわかるかもしれないglmnet
5分でわかるかもしれないglmnet
Stan超初心者入門
Stan超初心者入門
劣モジュラ最適化と機械学習1章
劣モジュラ最適化と機械学習1章
マルコフ連鎖モンテカルロ法
マルコフ連鎖モンテカルロ法
[DL輪読会]Neural Ordinary Differential Equations
[DL輪読会]Neural Ordinary Differential Equations
ノンパラメトリックベイズ4章クラスタリング
ノンパラメトリックベイズ4章クラスタリング
ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定
心理学における「再現性」の問題とBayes Factor
心理学における「再現性」の問題とBayes Factor
PRML輪読#11
PRML輪読#11
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
Viewers also liked
R入門(dplyrでデータ加工)-TokyoR42
R入門(dplyrでデータ加工)-TokyoR42
Atsushi Hayakawa
20170923 excelユーザーのためのr入門
20170923 excelユーザーのためのr入門
Takashi Kitano
RとStanでクラウドセットアップ時間を分析してみたら #TokyoR
RとStanでクラウドセットアップ時間を分析してみたら #TokyoR
Shuyo Nakatani
Mxnetで回帰 #TokyoR 53th
Mxnetで回帰 #TokyoR 53th
Akifumi Eguchi
Rで潜在ランク分析
Rで潜在ランク分析
Hiroshi Shimizu
20140625 rでのデータ分析(仮) for_tokyor
20140625 rでのデータ分析(仮) for_tokyor
Takashi Kitano
20150303ぞくパタLT-ゆるふわ構造学習
20150303ぞくパタLT-ゆるふわ構造学習
Toru Imai
Rcppのすすめ
Rcppのすすめ
Masaki Tsuda
データサイエンティスト必見!M-1グランプリ
データサイエンティスト必見!M-1グランプリ
Satoshi Kitajima
R を起動するその前に
R を起動するその前に
Kosei ABE
TokyoR42_around_chaining
TokyoR42_around_chaining
TokorosawaYoshio
マルコフ連鎖モンテカルロ法入門-1
マルコフ連鎖モンテカルロ法入門-1
Nagi Teramo
Rで代数統計 TokyoR #42 LT
Rで代数統計 TokyoR #42 LT
Toru Imai
最強のハードディスクはどれだ?
最強のハードディスクはどれだ?
Atsushi Hayakawa
ggplot2再入門(2015年バージョン)
ggplot2再入門(2015年バージョン)
yutannihilation
Tokyor42_r_datamining_18
Tokyor42_r_datamining_18
Yohei Sato
Tokyor42 ggplot2
Tokyor42 ggplot2
Yohei Sato
Tokyo r33 beginner
Tokyo r33 beginner
Takashi Minoda
Tokyo r30 anova
Tokyo r30 anova
Takashi Minoda
Rで学ぶ 傾向スコア解析入門 - 無作為割り当てが出来ない時の因果効果推定 -
Rで学ぶ 傾向スコア解析入門 - 無作為割り当てが出来ない時の因果効果推定 -
Yohei Sato
Viewers also liked
(20)
R入門(dplyrでデータ加工)-TokyoR42
R入門(dplyrでデータ加工)-TokyoR42
20170923 excelユーザーのためのr入門
20170923 excelユーザーのためのr入門
RとStanでクラウドセットアップ時間を分析してみたら #TokyoR
RとStanでクラウドセットアップ時間を分析してみたら #TokyoR
Mxnetで回帰 #TokyoR 53th
Mxnetで回帰 #TokyoR 53th
Rで潜在ランク分析
Rで潜在ランク分析
20140625 rでのデータ分析(仮) for_tokyor
20140625 rでのデータ分析(仮) for_tokyor
20150303ぞくパタLT-ゆるふわ構造学習
20150303ぞくパタLT-ゆるふわ構造学習
Rcppのすすめ
Rcppのすすめ
データサイエンティスト必見!M-1グランプリ
データサイエンティスト必見!M-1グランプリ
R を起動するその前に
R を起動するその前に
TokyoR42_around_chaining
TokyoR42_around_chaining
マルコフ連鎖モンテカルロ法入門-1
マルコフ連鎖モンテカルロ法入門-1
Rで代数統計 TokyoR #42 LT
Rで代数統計 TokyoR #42 LT
最強のハードディスクはどれだ?
最強のハードディスクはどれだ?
ggplot2再入門(2015年バージョン)
ggplot2再入門(2015年バージョン)
Tokyor42_r_datamining_18
Tokyor42_r_datamining_18
Tokyor42 ggplot2
Tokyor42 ggplot2
Tokyo r33 beginner
Tokyo r33 beginner
Tokyo r30 anova
Tokyo r30 anova
Rで学ぶ 傾向スコア解析入門 - 無作為割り当てが出来ない時の因果効果推定 -
Rで学ぶ 傾向スコア解析入門 - 無作為割り当てが出来ない時の因果効果推定 -
More from weda654
Juliaで前処理
Juliaで前処理
weda654
わかりやすいパターン認識_3章
わかりやすいパターン認識_3章
weda654
わかりやすいパターン認識_2章
わかりやすいパターン認識_2章
weda654
続・わかりやすいパターン認識_3章
続・わかりやすいパターン認識_3章
weda654
わかパタ 1章
わかパタ 1章
weda654
Mコマンド入門
Mコマンド入門
weda654
Data frameあれこれ
Data frameあれこれ
weda654
More from weda654
(7)
Juliaで前処理
Juliaで前処理
わかりやすいパターン認識_3章
わかりやすいパターン認識_3章
わかりやすいパターン認識_2章
わかりやすいパターン認識_2章
続・わかりやすいパターン認識_3章
続・わかりやすいパターン認識_3章
わかパタ 1章
わかパタ 1章
Mコマンド入門
Mコマンド入門
Data frameあれこれ
Data frameあれこれ
Dummiesパッケージ
1.
dummiesパッケージ 1 @weda_654
2.
自己紹介 Twitter
ID : @weda_654 勤務先: Google MapとAWSの会社 お仕事: データ分析をやっています 2 (社会人1年目) 近況: 会社の自分の席が正式になくなる (デスクレス)
3.
dummiesパッケージをつかうと 概要 かんたんにダミー変数がつくれるらしいから
とりあえず使ってみた 3
4.
ダミー変数とは 4
ある1個の変数がm個のカテゴリーを持つとき,これ をm個の変数D1,D2,…,Dmで表したもの. 例: 血液型 A,B,O,ABの4つのカテゴリー ↓ 変数A,変数B,変数O,変数ABの4つの変数 (変数A,変数B,変数Oの3つの変数でも表現は可能)
5.
いままでのダミー変数作成 data.frameから対象ベクトルを抜き出す なんやかんやする
data.frameに結合+列名の修正 _人人人人人人人_ > めんどい! <  ̄Y^Y^Y^Y^Y^Y ̄ 5
6.
なんやかんや 6 tmp
<- function(vec){ result <- NULL items <- unique(vec) for(i in items){ dummy <- ifelse(vec %in% i, 1, 0) result <- cbind(result, dummy) } return(result) }
7.
dummy関数 ベクトルからダミー変数を生成
install.packages(“dummies”) library(dummies) blood <- c("A", "AB", "B", "A", "O", "A") d.blood <- dummy(blood) 表1 : 実行結果 bloodA bloodAB bloodB bloodO 1 0 0 0 0 1 0 0 0 0 1 0 1 0 0 0 0 0 0 1 1 0 0 0 7
8.
dummy.data.frame関数(1) data.frame内の質的変数(文字列・順序なし因子)列
からダミー変数を生成 irisデータで試してみる • irisデータには質的変数Speciesがある d.iris <- dummy.data.frame(iris, sep=“:”) rdm <- sample(1:nrow(d.iris), 10) d.iris[rdm, ] 8
9.
dummy.data.frame関数(2) 表2 :
ダミー変数を追加したirisデータ Sepal.Length Sepal.Width Petal.Length Petal.Width Species:setosa Species:versicolor Species:virginica 5 3.3 1.4 0.2 1 0 0 4.9 2.4 3.3 1 0 1 0 5 2.3 3.3 1 0 1 0 5.5 2.6 4.4 1.2 0 1 0 5.6 2.8 4.9 2 0 0 1 6.7 3 5.2 2.3 0 0 1 6 2.7 5.1 1.6 0 1 0 5.4 3 4.5 1.5 0 1 0 6.7 2.5 5.8 1.8 0 0 1 5.7 3 4.2 1.2 0 1 0 生成→結合(置換)をひとまとめにできる 9
10.
get.dummy, which.dummy
get.dummy • 生成したダミー変数を表示する which.dummy • 生成したダミー変数の列番号を表示する 10
11.
11 より良いダミー変数生成ライフ?を もっとイケてる生成方法があったら
教えて下さい!
Editor's Notes
それ以上でも、それ以下でもない 無味無臭なLT
性別とかもよくきくのでは
きっと、みなさんはこんな非効率なことをしてはいないと思いますが… 忘れたそばからやってくる
関数はこれだけ もっと詳しく知りたい方はhelpをみましょう
Download now