More Related Content Similar to 「R for Cloud Computing」の紹介 Similar to 「R for Cloud Computing」の紹介 (20) 「R for Cloud Computing」の紹介1. 「R for Cloud Computing」の紹介
Takekatsu Hiramura
2015-01-17
TokyoR #45
1
2. 自己紹介
» 平村 健勝 (Taketatsu Hiramura)
コンサルティングファーム勤務
» seekR 管理人
» Rパッケージ RForcecom 開発者
» Twitter @hiratake55
» http://about.me/takekatsu.hiramura
2
4. RForcecom パッケージ
R から Salesforce.com, Force.com に接続するパッケージ、「RForcecom」 を開
発しました。本体は CRAN に登録済で、コードは GitHub で公開中です。
4
データマニピュレーション
統計分析(多変量解析、データマイニング等)
データビジュアリゼーション
CRM(顧客情報管理)
ダッシュボード・レポート
コラボレーション基盤(Chatter, ToDo管理等)
RSalesforce.com
データ
削除
データ
挿入
データ
更新
画面
イメージ
・
データ
連携内容
用途
データ
抽出
SOQL
クエリ
検索
http://cran.r-project.org/web/packages/RForcecom/
6. R for Cloud Computing
» UseR! 2014でRForcecomパッケージの紹介をしたのがきっかけで、「R for
Cloud Computing」という書籍をAjay氏と執筆することになりました。
6
UseR!2014@UCLA
7. 本の概要
» 目的
› Cloud Computing時代のRの使い方とし
て今までとは違った使い方を紹介する。
› 手順をスクリーンショットStep-by-Step
で紹介し、初心者でも理解しやすい内容
とする。
» 対象読者
› Rを現在、手持ちのローカル環境のPCで
使っているが、大量のデータを素早く処
理するためにクラウド上でRを試したい。
› 外部のWebサービス(SaaS, PaaS)を用いて、
機械学習やビジュアリゼーションを行い
たい
7
http://www.amazon.com/dp/1493917013
8. 本は全9章で構成されている
8
Chapter
Introduction to R for Cloud
Computing
An Approach for Data Scientists
Navigating the Choices in R and
Cloud Computing
Setting Up R on the Cloud
Using R
Using R with Data and Bigger
Data
R with Cloud APIs
Securing Your R cloud
Training Literature for Cloud
Computing and R
1
2
3
4
5
6
7
8
9
各章の概要
この本について
データサイエンティストがクラウ
ドを使うにあたっての心得
クラウドでRを使うにあたっての
様々な選択肢
クラウドでRを実行する
クラウドに特化したRの使い方
Rで大量のデータを処理する
RからクラウドのWeb APIを実行
する
セキュリティ面において注意する
こと
より詳しく知るのに役立つ情報源
技術要素
-
-
Renjin, RFiddle,
Shiny, and etc.
AWS, Google
and etc.
Rappoter, R
Service Bus
RHadoop,
NoSQL
Salesforece.com,
and etc.
-
-
次スライド
で紹介
次スライド
で紹介
次スライド
で紹介
次スライド
で紹介
9. 3. クラウドでRを使うにあたっての様々な選択肢
Rをブラウザから使う
» R-Fiddle (http://www.r-fiddle.org/)
› Datamind社が開発。JSFiddleに影響を受けて開発された。
› Chrome Appもある。
» Domino (http://www.dominodatalab.com/)
› PythonやRのコードをブラウザから実行可能。最近では、
Notebookにも対応。
» Intuitics(旧:Statace) (https://www.intuitics.com/)
› コーディングの知識が無くてもデータ分析、整形、可視化が可能
なサービス
9
10. 3. クラウドでRを使うにあたっての様々な選択肢
Rの実行環境
» Renjin (http://renjindemo.appspot.com/)
› Java VMを用いた独自のRインタプリタ。他システムと連携が容易
なのが特徴。 (現在開発中)
» pqR (http://www.pqr-project.org/)
› A pretty quick version of R。R Core Teamが高速化を目的として開
発。
› R 2.15.0がベース。
10
11. 4. クラウドでRを実行する
AWSでRを利用する
» RStudio Server
› EC2インスタンスにRStudio Serverをインストール。Webブラウザ
からアクセスして利用可能。
› http://www.rstudio.com/products/rstudio/download-server/
» RevolutionRのAMI
› Windows版, Linux版が提供
› https://aws.amazon.com/marketplace/seller-profile?id=3c6536d3-
8115-4bc0-a713-be58e257a7be
» BioconductorのAMI
› Bioconductorの他、RStudio Serverなどがインストール済。
› http://www.bioconductor.org/help/bioconductor-cloud-ami/
11
12. 4. クラウドでRを実行する
Google Cloud PlatformでRを利用する
» Big Query
› bigrqueryパッケージ。Hadley Wickham氏が開発。
› https://github.com/hadley/bigrquery
» Google Prediction API
› googlepredictionapiパッケージ。Googleが開発。
› https://code.google.com/p/google-prediction-api-r-client/
» Fusion Tables API
› GFusionTablesパッケージ
› http://gfusiontables.lopatenko.com/
12
13. 7.RからクラウドのWeb APIを実行する
» BigML
› bigml-Rパッケージ: https://github.com/bigmlcom/bigml-r
» Microsoft Azure Machine Learning
› Webインターフェース(ML Studio)からRコードを実行可能
» plot.ly
› チュートリアル:https://plot.ly/r/getting-started/
» yhat
› yhatrパッケージ: https://github.com/yhat/yhatr
» Salesforce.com
› RForcecomパッケージ: http://rforcecom.plavox.info/
13