Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
Rzパッケージ―SPSSのようなデータ管理インターフェイス<br />2011/04/23<br />Osaka.R #5 (於:ロックオン セミナー室)<br />林 真広(@phosphor_m)<br />大阪大学大学院人間科学研究科博士...
Osaka.Rへようこそ!<br />最初はほぼ内輪の勉強会になるかな,と思って始めました<br />いつのまにか内輪の人が誰もいなくなってしまいました(笑)<br />リピート率が低いのが悩み…<br />こりずにまた来てください!<br />
自己紹介<br />Osaka.Rを主催している林です<br />今日は決定「木」,ランダム「森」,主催者「林」で緑の多い勉強会です<br />専門:計量社会学,インターネット研究<br />Rで社会調査データを分析しています<br />でも…...
本題<br />いくらRを愛していても,欠点がないわけではない…<br />しかし,欠点を補ってあげてこそ,真のRユーザー!<br />
Rの不便なところ 1<br />データ管理機能が弱い<br />変数ラベル,値ラベル,ユーザー欠損値,尺度の変更などのSPSSの機能が使いたい<br />memiscパッケージ!<br />詳しくは「Rパッケージガイドブック」で<br />
Rの不便なところ 2<br />Rの不便なところ2…GUIが弱い<br />分析インターフェイスはいろいろある<br />Rcmdr,rattle,pmgなど<br />しかしこれらはデータ管理インターフェイスが弱い<br />社会調査データは...
そこで…作りました!<br />Rzパッケージ<br />バックエンドにmemiscを使い,GUIから透過的にmemiscの機能を使える<br />前身としてmemiscGUIというのを作っていたが,使い方に癖があり,かつ野良パッケージなので敷...
インストール方法<br />Rzパッケージは簡単にインストールできる<br />GUIを作るのに使っているRGtk2パッケージはインストールがちょっとめんどくさい<br />
install.packages("Rz")<br />
library(RGtk2)を実行するとエラーが出るので,OKを押す<br />
Gtk+をインストールするか聞かれるので,OKを押す<br />
Gtk2ランタイムが自動的にダウンロードされ,インストールウィザードが始まるので,適当に進めていく<br />
Translationsにチェックを入れておく<br />
準備完了!<br />
Rを再起動してから,library(Rz)を実行し,上のような出力が出たら成功!<br />
こんなwindowが立ち上がります<br />
機能説明<br />「開く」「保存」は独自形式データ(*.rzd)の読み込みと保存<br />実態はオブジェクトをsave(),load()しているだけ<br />「インポート」はSPSS,Stataのデータの読み込み<br />「大局的環境か...
<ul><li>インポートの画面
文字コードを指定して読み込むことができる
右図の形式のデータに対応</li></li></ul><li>こんな感じに読み込まれる<br />
<ul><li>内部的にはmemiscのデータセットオブジェクトで管理しているが,透過的にデータフレームに変換される
変換は片方向なので,データフレームを編集してもデータセットには反映されない</li></li></ul><li>データセットの名前を変更すると,データフレームの名前も変更される<br />
<ul><li>行にポインタを合わせると,summaryがポップアップ
「問2.結婚年齢」に合わせている
尺度がnominalになっているため,カテゴリ変数として扱われている…</li></li></ul><li><ul><li>比率尺度(ratio)に変更
連続変数として扱われるようになった
一応間隔尺度( interval )と比率尺度があるものの,R本体がこの2つの区別をしていないため,どちらでも同じ(どちらも演算のさいにはnumericとして扱われる)</li></li></ul><li><ul><li>行番号をダブルクリック...
memiscのcodebook関数を使っている
ユーザー欠損値や値ラベルなどのmemiscの独自情報が確認できる</li></li></ul><li><ul><li>行を選択中に変数名,変数ラベル,ユーザー欠損値のセルをクリックすると,それらを編集できる</li></li></ul><li>...
記法はmemiscのrecode関数と同じ
Upcoming SlideShare
Loading in …5
×
Upcoming SlideShare
Rzパッケージの紹介
Next
Download to read offline and view in fullscreen.

2

Share

Download to read offline

Rzパッケージ―spssのようなデータ管理インターフェイス

Download to read offline

Osaka.R #5 発表資料

Related Books

Free with a 30 day trial from Scribd

See all

Related Audiobooks

Free with a 30 day trial from Scribd

See all

Rzパッケージ―spssのようなデータ管理インターフェイス

  1. 1. Rzパッケージ―SPSSのようなデータ管理インターフェイス<br />2011/04/23<br />Osaka.R #5 (於:ロックオン セミナー室)<br />林 真広(@phosphor_m)<br />大阪大学大学院人間科学研究科博士後期課程<br />
  2. 2. Osaka.Rへようこそ!<br />最初はほぼ内輪の勉強会になるかな,と思って始めました<br />いつのまにか内輪の人が誰もいなくなってしまいました(笑)<br />リピート率が低いのが悩み…<br />こりずにまた来てください!<br />
  3. 3. 自己紹介<br />Osaka.Rを主催している林です<br />今日は決定「木」,ランダム「森」,主催者「林」で緑の多い勉強会です<br />専門:計量社会学,インターネット研究<br />Rで社会調査データを分析しています<br />でも…Rは手段ではなく目的です!<br />
  4. 4. 本題<br />いくらRを愛していても,欠点がないわけではない…<br />しかし,欠点を補ってあげてこそ,真のRユーザー!<br />
  5. 5. Rの不便なところ 1<br />データ管理機能が弱い<br />変数ラベル,値ラベル,ユーザー欠損値,尺度の変更などのSPSSの機能が使いたい<br />memiscパッケージ!<br />詳しくは「Rパッケージガイドブック」で<br />
  6. 6. Rの不便なところ 2<br />Rの不便なところ2…GUIが弱い<br />分析インターフェイスはいろいろある<br />Rcmdr,rattle,pmgなど<br />しかしこれらはデータ管理インターフェイスが弱い<br />社会調査データは変数が数百個あることも多い<br />大規模な全国調査は一回に数千万かかるため,頻繁にはできない->一回の調査で幅広い質問をする<br />Deducerはデータ管理インターフェイスもある<br />SPSSをかなり意識した作りでおすすめ<br />しかし,memiscパッケージのような機能はない…<br />
  7. 7. そこで…作りました!<br />Rzパッケージ<br />バックエンドにmemiscを使い,GUIから透過的にmemiscの機能を使える<br />前身としてmemiscGUIというのを作っていたが,使い方に癖があり,かつ野良パッケージなので敷居が高かった<br />全面的に書き直してCRANに登録<br />
  8. 8. インストール方法<br />Rzパッケージは簡単にインストールできる<br />GUIを作るのに使っているRGtk2パッケージはインストールがちょっとめんどくさい<br />
  9. 9. install.packages("Rz")<br />
  10. 10. library(RGtk2)を実行するとエラーが出るので,OKを押す<br />
  11. 11. Gtk+をインストールするか聞かれるので,OKを押す<br />
  12. 12. Gtk2ランタイムが自動的にダウンロードされ,インストールウィザードが始まるので,適当に進めていく<br />
  13. 13.
  14. 14. Translationsにチェックを入れておく<br />
  15. 15.
  16. 16.
  17. 17.
  18. 18. 準備完了!<br />
  19. 19. Rを再起動してから,library(Rz)を実行し,上のような出力が出たら成功!<br />
  20. 20. こんなwindowが立ち上がります<br />
  21. 21. 機能説明<br />「開く」「保存」は独自形式データ(*.rzd)の読み込みと保存<br />実態はオブジェクトをsave(),load()しているだけ<br />「インポート」はSPSS,Stataのデータの読み込み<br />「大局的環境からのインポート」は,既存のデータフレームの読み込み<br />
  22. 22. <ul><li>インポートの画面
  23. 23. 文字コードを指定して読み込むことができる
  24. 24. 右図の形式のデータに対応</li></li></ul><li>こんな感じに読み込まれる<br />
  25. 25. <ul><li>内部的にはmemiscのデータセットオブジェクトで管理しているが,透過的にデータフレームに変換される
  26. 26. 変換は片方向なので,データフレームを編集してもデータセットには反映されない</li></li></ul><li>データセットの名前を変更すると,データフレームの名前も変更される<br />
  27. 27. <ul><li>行にポインタを合わせると,summaryがポップアップ
  28. 28. 「問2.結婚年齢」に合わせている
  29. 29. 尺度がnominalになっているため,カテゴリ変数として扱われている…</li></li></ul><li><ul><li>比率尺度(ratio)に変更
  30. 30. 連続変数として扱われるようになった
  31. 31. 一応間隔尺度( interval )と比率尺度があるものの,R本体がこの2つの区別をしていないため,どちらでも同じ(どちらも演算のさいにはnumericとして扱われる)</li></li></ul><li><ul><li>行番号をダブルクリックすると,詳しい概要をコンソールに出力
  32. 32. memiscのcodebook関数を使っている
  33. 33. ユーザー欠損値や値ラベルなどのmemiscの独自情報が確認できる</li></li></ul><li><ul><li>行を選択中に変数名,変数ラベル,ユーザー欠損値のセルをクリックすると,それらを編集できる</li></li></ul><li><ul><li>行を右クリックすると,リコードのwindowが出る
  34. 34. 記法はmemiscのrecode関数と同じ
  35. 35. "値ラベル" = 新しい値 <- 古い値
  36. 36. 「テンプレートの生成」を押すと,リコードのテンプレートが出力される
  37. 37. 「リコード先」に変数名,「変数ラベル」に変数ラベルを入力</li></li></ul><li><ul><li>データの末尾にリコードした変数が加わる
  38. 38. 大局的環境のデータフレームにもちゃんと加わっている</li></li></ul><li><ul><li>検索機能。下矢印で次を検索,上矢印で前を検索
  39. 39. 検索対象は変数名と変数ラベル</li></li></ul><li><ul><li>複数データセットを管理可能
  40. 40. 大局的環境からのインポートは,こんな感じ</li></li></ul><li><ul><li>独自形式データの保存と読み込み</li></li></ul><li>まとめ<br />SPSSユーザーがRに乗り換える場合には,便利に使えるのではないでしょうか<br />SPSSユーザーでなくとも,変数が数十個ぐらいあるデータフレームをよく使うような人であれば,便利だと思います<br />自分が使いやすいように最適化しています<br />使いにくいところや機能の要望があれば,気軽に言ってください<br />
  • KatsuSakai

    Dec. 17, 2015
  • YuskeM

    Dec. 17, 2014

Osaka.R #5 発表資料

Views

Total views

4,365

On Slideshare

0

From embeds

0

Number of embeds

117

Actions

Downloads

44

Shares

0

Comments

0

Likes

2

×