SlideShare a Scribd company logo
1 of 15
Download to read offline
「R for Cloud Computing」の紹介
Takekatsu Hiramura
2015-01-17
TokyoR #45
1
自己紹介
» 平村 健勝 (Taketatsu Hiramura)
コンサルティングファーム勤務
» seekR 管理人
» Rパッケージ RForcecom 開発者
» Twitter @hiratake55
» http://about.me/takekatsu.hiramura
2
SeekR: Rに特化した検索エンジン
3
RForcecom パッケージ
R から Salesforce.com, Force.com に接続するパッケージ、「RForcecom」 を開
発しました。本体は CRAN に登録済で、コードは GitHub で公開中です。
4
 データマニピュレーション
 統計分析(多変量解析、データマイニング等)
 データビジュアリゼーション
 CRM(顧客情報管理)
 ダッシュボード・レポート
 コラボレーション基盤(Chatter, ToDo管理等)
RSalesforce.com
データ
削除
データ
挿入
データ
更新
画面
イメージ
・
データ
連携内容
用途
データ
抽出
SOQL
クエリ
検索
 http://cran.r-project.org/web/packages/RForcecom/
Enterprisezine連載
「意志決定のためのデータサイエンス講座」
5http://enterprisezine.jp/article/detail/6471
R for Cloud Computing
» UseR! 2014でRForcecomパッケージの紹介をしたのがきっかけで、「R for
Cloud Computing」という書籍をAjay氏と執筆することになりました。
6
UseR!2014@UCLA
本の概要
» 目的
› Cloud Computing時代のRの使い方とし
て今までとは違った使い方を紹介する。
› 手順をスクリーンショットStep-by-Step
で紹介し、初心者でも理解しやすい内容
とする。
» 対象読者
› Rを現在、手持ちのローカル環境のPCで
使っているが、大量のデータを素早く処
理するためにクラウド上でRを試したい。
› 外部のWebサービス(SaaS, PaaS)を用いて、
機械学習やビジュアリゼーションを行い
たい
7
http://www.amazon.com/dp/1493917013
本は全9章で構成されている
8
Chapter
Introduction to R for Cloud
Computing
An Approach for Data Scientists
Navigating the Choices in R and
Cloud Computing
Setting Up R on the Cloud
Using R
Using R with Data and Bigger
Data
R with Cloud APIs
Securing Your R cloud
Training Literature for Cloud
Computing and R
1
2
3
4
5
6
7
8
9
各章の概要
この本について
データサイエンティストがクラウ
ドを使うにあたっての心得
クラウドでRを使うにあたっての
様々な選択肢
クラウドでRを実行する
クラウドに特化したRの使い方
Rで大量のデータを処理する
RからクラウドのWeb APIを実行
する
セキュリティ面において注意する
こと
より詳しく知るのに役立つ情報源
技術要素
-
-
Renjin, RFiddle,
Shiny, and etc.
AWS, Google
and etc.
Rappoter, R
Service Bus
RHadoop,
NoSQL
Salesforece.com,
and etc.
-
-
次スライド
で紹介
次スライド
で紹介
次スライド
で紹介
次スライド
で紹介
3. クラウドでRを使うにあたっての様々な選択肢
Rをブラウザから使う
» R-Fiddle (http://www.r-fiddle.org/)
› Datamind社が開発。JSFiddleに影響を受けて開発された。
› Chrome Appもある。
» Domino (http://www.dominodatalab.com/)
› PythonやRのコードをブラウザから実行可能。最近では、
Notebookにも対応。
» Intuitics(旧:Statace) (https://www.intuitics.com/)
› コーディングの知識が無くてもデータ分析、整形、可視化が可能
なサービス
9
3. クラウドでRを使うにあたっての様々な選択肢
Rの実行環境
» Renjin (http://renjindemo.appspot.com/)
› Java VMを用いた独自のRインタプリタ。他システムと連携が容易
なのが特徴。 (現在開発中)
» pqR (http://www.pqr-project.org/)
› A pretty quick version of R。R Core Teamが高速化を目的として開
発。
› R 2.15.0がベース。
10
4. クラウドでRを実行する
AWSでRを利用する
» RStudio Server
› EC2インスタンスにRStudio Serverをインストール。Webブラウザ
からアクセスして利用可能。
› http://www.rstudio.com/products/rstudio/download-server/
» RevolutionRのAMI
› Windows版, Linux版が提供
› https://aws.amazon.com/marketplace/seller-profile?id=3c6536d3-
8115-4bc0-a713-be58e257a7be
» BioconductorのAMI
› Bioconductorの他、RStudio Serverなどがインストール済。
› http://www.bioconductor.org/help/bioconductor-cloud-ami/
11
4. クラウドでRを実行する
Google Cloud PlatformでRを利用する
» Big Query
› bigrqueryパッケージ。Hadley Wickham氏が開発。
› https://github.com/hadley/bigrquery
» Google Prediction API
› googlepredictionapiパッケージ。Googleが開発。
› https://code.google.com/p/google-prediction-api-r-client/
» Fusion Tables API
› GFusionTablesパッケージ
› http://gfusiontables.lopatenko.com/
12
7.RからクラウドのWeb APIを実行する
» BigML
› bigml-Rパッケージ: https://github.com/bigmlcom/bigml-r
» Microsoft Azure Machine Learning
› Webインターフェース(ML Studio)からRコードを実行可能
» plot.ly
› チュートリアル:https://plot.ly/r/getting-started/
» yhat
› yhatrパッケージ: https://github.com/yhat/yhatr
» Salesforce.com
› RForcecomパッケージ: http://rforcecom.plavox.info/
13
8. より詳しく知るのに役立つ情報源
14
情報源・コミュニティ
» R-bloggers
http://www.r-bloggers.com/
» R User Meetups
http://r-users-group.meetup.com/
オンラインコース
» Coursera
https://www.coursera.org/course/dataanalysis
» DataCamp
https://www.datacamp.com/courses
» UCLA
http://www.ats.ucla.edu/stat/r/
15
書籍には、本日紹介できなかったパッケージ、
サービスを多数紹介しています
Takekatsu Hiramura
http://thira.plavox.info/
thira@plavox.info http://www.amazon.co.jp/exec/obidos/ASIN/1493917013
» ご興味のある方はぜひ購入ください

More Related Content

What's hot

Spark Summit 2015 参加報告
Spark Summit 2015 参加報告Spark Summit 2015 参加報告
Spark Summit 2015 参加報告Katsunori Kanda
 
さくっとはじめるテキストマイニング(R言語)  スタートアップ編
さくっとはじめるテキストマイニング(R言語)  スタートアップ編さくっとはじめるテキストマイニング(R言語)  スタートアップ編
さくっとはじめるテキストマイニング(R言語)  スタートアップ編Yutaka Shimada
 
初心者のためのRとRStudio入門 vol.2
初心者のためのRとRStudio入門 vol.2初心者のためのRとRStudio入門 vol.2
初心者のためのRとRStudio入門 vol.2OWL.learn
 
QConTokyo2015「Sparkを用いたビッグデータ解析 〜後編〜」
QConTokyo2015「Sparkを用いたビッグデータ解析 〜後編〜」QConTokyo2015「Sparkを用いたビッグデータ解析 〜後編〜」
QConTokyo2015「Sparkを用いたビッグデータ解析 〜後編〜」Kazuki Taniguchi
 
最高の統計ソフトウェアはどれか? "What’s the Best Statistical Software? A Comparison of R, Py...
最高の統計ソフトウェアはどれか? "What’s the Best Statistical Software? A Comparison of R, Py...最高の統計ソフトウェアはどれか? "What’s the Best Statistical Software? A Comparison of R, Py...
最高の統計ソフトウェアはどれか? "What’s the Best Statistical Software? A Comparison of R, Py...ケンタ タナカ
 
統計を始める方へ①_データ環境Rの基本的なプログラミング|データアーティスト
統計を始める方へ①_データ環境Rの基本的なプログラミング|データアーティスト統計を始める方へ①_データ環境Rの基本的なプログラミング|データアーティスト
統計を始める方へ①_データ環境Rの基本的なプログラミング|データアーティストSatoru Yamamoto
 
Tableau + Pythonとデータのあり方
Tableau + Pythonとデータのあり方Tableau + Pythonとデータのあり方
Tableau + Pythonとデータのあり方Kazuya Araki
 
Dataflow(python)を使ってelasticsearchにデータを移行した話
Dataflow(python)を使ってelasticsearchにデータを移行した話Dataflow(python)を使ってelasticsearchにデータを移行した話
Dataflow(python)を使ってelasticsearchにデータを移行した話Ryo Yamaoka
 
Dataflow(python)を触った所感
Dataflow(python)を触った所感Dataflow(python)を触った所感
Dataflow(python)を触った所感Ryo Yamaoka
 
Hadoopことはじめ
HadoopことはじめHadoopことはじめ
HadoopことはじめKatsunori Kanda
 
TokyoR:RMarkdownでレポート作成
TokyoR:RMarkdownでレポート作成TokyoR:RMarkdownでレポート作成
TokyoR:RMarkdownでレポート作成Takashi Minoda
 
Rの導入とRStudio事始め(改訂版)
Rの導入とRStudio事始め(改訂版)Rの導入とRStudio事始め(改訂版)
Rの導入とRStudio事始め(改訂版)Takashi Yamane
 
データアナリストとログ基盤の付き合い方 DataAnalystMeetup#07
データアナリストとログ基盤の付き合い方 DataAnalystMeetup#07データアナリストとログ基盤の付き合い方 DataAnalystMeetup#07
データアナリストとログ基盤の付き合い方 DataAnalystMeetup#07Sotaro Tanaka
 
16.02.08_Hadoop Conferece Japan 2016_データサイエンスにおける一次可視化からのSpark on Elasticsear...
16.02.08_Hadoop Conferece Japan 2016_データサイエンスにおける一次可視化からのSpark on Elasticsear...16.02.08_Hadoop Conferece Japan 2016_データサイエンスにおける一次可視化からのSpark on Elasticsear...
16.02.08_Hadoop Conferece Japan 2016_データサイエンスにおける一次可視化からのSpark on Elasticsear...LINE Corp.
 
Search engineering tech talk 2019 spring
Search engineering tech talk 2019 springSearch engineering tech talk 2019 spring
Search engineering tech talk 2019 springtakahito takabayashi
 

What's hot (17)

Tableau r graph_theory
Tableau r graph_theoryTableau r graph_theory
Tableau r graph_theory
 
Spark Summit 2015 参加報告
Spark Summit 2015 参加報告Spark Summit 2015 参加報告
Spark Summit 2015 参加報告
 
さくっとはじめるテキストマイニング(R言語)  スタートアップ編
さくっとはじめるテキストマイニング(R言語)  スタートアップ編さくっとはじめるテキストマイニング(R言語)  スタートアップ編
さくっとはじめるテキストマイニング(R言語)  スタートアップ編
 
初心者のためのRとRStudio入門 vol.2
初心者のためのRとRStudio入門 vol.2初心者のためのRとRStudio入門 vol.2
初心者のためのRとRStudio入門 vol.2
 
QConTokyo2015「Sparkを用いたビッグデータ解析 〜後編〜」
QConTokyo2015「Sparkを用いたビッグデータ解析 〜後編〜」QConTokyo2015「Sparkを用いたビッグデータ解析 〜後編〜」
QConTokyo2015「Sparkを用いたビッグデータ解析 〜後編〜」
 
最高の統計ソフトウェアはどれか? "What’s the Best Statistical Software? A Comparison of R, Py...
最高の統計ソフトウェアはどれか? "What’s the Best Statistical Software? A Comparison of R, Py...最高の統計ソフトウェアはどれか? "What’s the Best Statistical Software? A Comparison of R, Py...
最高の統計ソフトウェアはどれか? "What’s the Best Statistical Software? A Comparison of R, Py...
 
統計を始める方へ①_データ環境Rの基本的なプログラミング|データアーティスト
統計を始める方へ①_データ環境Rの基本的なプログラミング|データアーティスト統計を始める方へ①_データ環境Rの基本的なプログラミング|データアーティスト
統計を始める方へ①_データ環境Rの基本的なプログラミング|データアーティスト
 
Tableau + Pythonとデータのあり方
Tableau + Pythonとデータのあり方Tableau + Pythonとデータのあり方
Tableau + Pythonとデータのあり方
 
Dataflow(python)を使ってelasticsearchにデータを移行した話
Dataflow(python)を使ってelasticsearchにデータを移行した話Dataflow(python)を使ってelasticsearchにデータを移行した話
Dataflow(python)を使ってelasticsearchにデータを移行した話
 
Dataflow(python)を触った所感
Dataflow(python)を触った所感Dataflow(python)を触った所感
Dataflow(python)を触った所感
 
Hadoopことはじめ
HadoopことはじめHadoopことはじめ
Hadoopことはじめ
 
20150128 cross2015
20150128 cross201520150128 cross2015
20150128 cross2015
 
TokyoR:RMarkdownでレポート作成
TokyoR:RMarkdownでレポート作成TokyoR:RMarkdownでレポート作成
TokyoR:RMarkdownでレポート作成
 
Rの導入とRStudio事始め(改訂版)
Rの導入とRStudio事始め(改訂版)Rの導入とRStudio事始め(改訂版)
Rの導入とRStudio事始め(改訂版)
 
データアナリストとログ基盤の付き合い方 DataAnalystMeetup#07
データアナリストとログ基盤の付き合い方 DataAnalystMeetup#07データアナリストとログ基盤の付き合い方 DataAnalystMeetup#07
データアナリストとログ基盤の付き合い方 DataAnalystMeetup#07
 
16.02.08_Hadoop Conferece Japan 2016_データサイエンスにおける一次可視化からのSpark on Elasticsear...
16.02.08_Hadoop Conferece Japan 2016_データサイエンスにおける一次可視化からのSpark on Elasticsear...16.02.08_Hadoop Conferece Japan 2016_データサイエンスにおける一次可視化からのSpark on Elasticsear...
16.02.08_Hadoop Conferece Japan 2016_データサイエンスにおける一次可視化からのSpark on Elasticsear...
 
Search engineering tech talk 2019 spring
Search engineering tech talk 2019 springSearch engineering tech talk 2019 spring
Search engineering tech talk 2019 spring
 

Viewers also liked

Jenkins によるレポートスクリプト管理
Jenkins によるレポートスクリプト管理Jenkins によるレポートスクリプト管理
Jenkins によるレポートスクリプト管理Tatsuya Tojima
 
前処理のための前処理(Tokyo.R#45)
前処理のための前処理(Tokyo.R#45)前処理のための前処理(Tokyo.R#45)
前処理のための前処理(Tokyo.R#45)Shinya Uryu
 
Estimating the effect of advertising with Machine learning
Estimating the effect of advertising with Machine learningEstimating the effect of advertising with Machine learning
Estimating the effect of advertising with Machine learningShota Yasui
 
Julia最新情報 2015
Julia最新情報 2015Julia最新情報 2015
Julia最新情報 2015Kenta Sato
 
Tokyor45 カーネル多変量解析第2章 カーネル多変量解析の仕組み
Tokyor45 カーネル多変量解析第2章 カーネル多変量解析の仕組みTokyor45 カーネル多変量解析第2章 カーネル多変量解析の仕組み
Tokyor45 カーネル多変量解析第2章 カーネル多変量解析の仕組みYohei Sato
 
DeployR使ってみた話
DeployR使ってみた話DeployR使ってみた話
DeployR使ってみた話Kazuya Wada
 
Shinyで確率分布を学ぶアプリ作った。あるいは、ShinyでD3.jsを使う方法
Shinyで確率分布を学ぶアプリ作った。あるいは、ShinyでD3.jsを使う方法Shinyで確率分布を学ぶアプリ作った。あるいは、ShinyでD3.jsを使う方法
Shinyで確率分布を学ぶアプリ作った。あるいは、ShinyでD3.jsを使う方法ksmzn
 
10分で分かるr言語入門 短縮バージョン 15-0117_upload用
10分で分かるr言語入門 短縮バージョン 15-0117_upload用10分で分かるr言語入門 短縮バージョン 15-0117_upload用
10分で分かるr言語入門 短縮バージョン 15-0117_upload用Nobuaki Oshiro
 

Viewers also liked (9)

Jenkins によるレポートスクリプト管理
Jenkins によるレポートスクリプト管理Jenkins によるレポートスクリプト管理
Jenkins によるレポートスクリプト管理
 
R45LT
R45LTR45LT
R45LT
 
前処理のための前処理(Tokyo.R#45)
前処理のための前処理(Tokyo.R#45)前処理のための前処理(Tokyo.R#45)
前処理のための前処理(Tokyo.R#45)
 
Estimating the effect of advertising with Machine learning
Estimating the effect of advertising with Machine learningEstimating the effect of advertising with Machine learning
Estimating the effect of advertising with Machine learning
 
Julia最新情報 2015
Julia最新情報 2015Julia最新情報 2015
Julia最新情報 2015
 
Tokyor45 カーネル多変量解析第2章 カーネル多変量解析の仕組み
Tokyor45 カーネル多変量解析第2章 カーネル多変量解析の仕組みTokyor45 カーネル多変量解析第2章 カーネル多変量解析の仕組み
Tokyor45 カーネル多変量解析第2章 カーネル多変量解析の仕組み
 
DeployR使ってみた話
DeployR使ってみた話DeployR使ってみた話
DeployR使ってみた話
 
Shinyで確率分布を学ぶアプリ作った。あるいは、ShinyでD3.jsを使う方法
Shinyで確率分布を学ぶアプリ作った。あるいは、ShinyでD3.jsを使う方法Shinyで確率分布を学ぶアプリ作った。あるいは、ShinyでD3.jsを使う方法
Shinyで確率分布を学ぶアプリ作った。あるいは、ShinyでD3.jsを使う方法
 
10分で分かるr言語入門 短縮バージョン 15-0117_upload用
10分で分かるr言語入門 短縮バージョン 15-0117_upload用10分で分かるr言語入門 短縮バージョン 15-0117_upload用
10分で分かるr言語入門 短縮バージョン 15-0117_upload用
 

Similar to 「R for Cloud Computing」の紹介

Force.comシステム連携のデザイン考察
Force.comシステム連携のデザイン考察Force.comシステム連携のデザイン考察
Force.comシステム連携のデザイン考察Junji Imaoka
 
初めてのSpark streaming 〜kafka+sparkstreamingの紹介〜
初めてのSpark streaming 〜kafka+sparkstreamingの紹介〜初めてのSpark streaming 〜kafka+sparkstreamingの紹介〜
初めてのSpark streaming 〜kafka+sparkstreamingの紹介〜Tanaka Yuichi
 
ビッグデータ処理データベースの全体像と使い分け
2018年version
ビッグデータ処理データベースの全体像と使い分け
2018年versionビッグデータ処理データベースの全体像と使い分け
2018年version
ビッグデータ処理データベースの全体像と使い分け
2018年versionTetsutaro Watanabe
 
Salesforce LDV(Large Data Volume) 20191018
Salesforce LDV(Large Data Volume) 20191018Salesforce LDV(Large Data Volume) 20191018
Salesforce LDV(Large Data Volume) 20191018Hiroki Iida
 
リアルタイムトレンド抽出飛び込み用
リアルタイムトレンド抽出飛び込み用リアルタイムトレンド抽出飛び込み用
リアルタイムトレンド抽出飛び込み用DMM.com
 
[serverlessconf2017]FaaSで簡単に実現する数十万RPSスパイク負荷試験
[serverlessconf2017]FaaSで簡単に実現する数十万RPSスパイク負荷試験[serverlessconf2017]FaaSで簡単に実現する数十万RPSスパイク負荷試験
[serverlessconf2017]FaaSで簡単に実現する数十万RPSスパイク負荷試験Takahiro Moteki
 
ONIC2017 プログラマブル・データプレーン時代に向けた ネットワーク・オペレーションスタック
ONIC2017 プログラマブル・データプレーン時代に向けた ネットワーク・オペレーションスタックONIC2017 プログラマブル・データプレーン時代に向けた ネットワーク・オペレーションスタック
ONIC2017 プログラマブル・データプレーン時代に向けた ネットワーク・オペレーションスタックKentaro Ebisawa
 
Microsoft Seminar: Design Optimization on Rescale
Microsoft Seminar: Design Optimization on RescaleMicrosoft Seminar: Design Optimization on Rescale
Microsoft Seminar: Design Optimization on RescaleRescale Japan株式会社
 
Implementation Approach of Artifical Intelligence
Implementation Approach of Artifical IntelligenceImplementation Approach of Artifical Intelligence
Implementation Approach of Artifical IntelligenceTakao Tetsuro
 
Microsoft Search - Microsoft Graph connector と Search Federation の概要
Microsoft Search - Microsoft Graph connector と Search Federation の概要Microsoft Search - Microsoft Graph connector と Search Federation の概要
Microsoft Search - Microsoft Graph connector と Search Federation の概要Ai Hirano
 
いまできるデータ分析を Power BI ではじめよう
いまできるデータ分析を Power BI ではじめよういまできるデータ分析を Power BI ではじめよう
いまできるデータ分析を Power BI ではじめようYugo Shimizu
 
SmartNews の Webmining を支えるプラットフォーム
SmartNews の Webmining を支えるプラットフォームSmartNews の Webmining を支えるプラットフォーム
SmartNews の Webmining を支えるプラットフォームSmartNews, Inc.
 
夏サミ2012 [A-2]ソーシャルプラットフォームを使った業務アプリ開発の現場
夏サミ2012 [A-2]ソーシャルプラットフォームを使った業務アプリ開発の現場夏サミ2012 [A-2]ソーシャルプラットフォームを使った業務アプリ開発の現場
夏サミ2012 [A-2]ソーシャルプラットフォームを使った業務アプリ開発の現場Mitch Okamoto
 
Force.com developers meetup #2 夏サミ、そしてソーシャル・エンタープライズを考える
Force.com developers meetup #2 夏サミ、そしてソーシャル・エンタープライズを考えるForce.com developers meetup #2 夏サミ、そしてソーシャル・エンタープライズを考える
Force.com developers meetup #2 夏サミ、そしてソーシャル・エンタープライズを考えるAkira Kuratani
 
SpotfireとTERRの連携
SpotfireとTERRの連携SpotfireとTERRの連携
SpotfireとTERRの連携TAKESHI KIURA
 
E-commerce企業におけるビッグデータへの挑戦と課題‐機械学習への期待について‐
E-commerce企業におけるビッグデータへの挑戦と課題‐機械学習への期待について‐E-commerce企業におけるビッグデータへの挑戦と課題‐機械学習への期待について‐
E-commerce企業におけるビッグデータへの挑戦と課題‐機械学習への期待について‐Rakuten Group, Inc.
 
20211112_jpugcon_gpu_and_arrow
20211112_jpugcon_gpu_and_arrow20211112_jpugcon_gpu_and_arrow
20211112_jpugcon_gpu_and_arrowKohei KaiGai
 
DB TechShowcase Tokyo - Intelligent Data Platform
DB TechShowcase Tokyo - Intelligent Data PlatformDB TechShowcase Tokyo - Intelligent Data Platform
DB TechShowcase Tokyo - Intelligent Data PlatformDaiyu Hatakeyama
 

Similar to 「R for Cloud Computing」の紹介 (20)

Force.comシステム連携のデザイン考察
Force.comシステム連携のデザイン考察Force.comシステム連携のデザイン考察
Force.comシステム連携のデザイン考察
 
Tableau r graph_theory
Tableau r graph_theoryTableau r graph_theory
Tableau r graph_theory
 
初めてのSpark streaming 〜kafka+sparkstreamingの紹介〜
初めてのSpark streaming 〜kafka+sparkstreamingの紹介〜初めてのSpark streaming 〜kafka+sparkstreamingの紹介〜
初めてのSpark streaming 〜kafka+sparkstreamingの紹介〜
 
ビッグデータ処理データベースの全体像と使い分け
2018年version
ビッグデータ処理データベースの全体像と使い分け
2018年versionビッグデータ処理データベースの全体像と使い分け
2018年version
ビッグデータ処理データベースの全体像と使い分け
2018年version
 
Salesforce LDV(Large Data Volume) 20191018
Salesforce LDV(Large Data Volume) 20191018Salesforce LDV(Large Data Volume) 20191018
Salesforce LDV(Large Data Volume) 20191018
 
リアルタイムトレンド抽出飛び込み用
リアルタイムトレンド抽出飛び込み用リアルタイムトレンド抽出飛び込み用
リアルタイムトレンド抽出飛び込み用
 
[serverlessconf2017]FaaSで簡単に実現する数十万RPSスパイク負荷試験
[serverlessconf2017]FaaSで簡単に実現する数十万RPSスパイク負荷試験[serverlessconf2017]FaaSで簡単に実現する数十万RPSスパイク負荷試験
[serverlessconf2017]FaaSで簡単に実現する数十万RPSスパイク負荷試験
 
ONIC2017 プログラマブル・データプレーン時代に向けた ネットワーク・オペレーションスタック
ONIC2017 プログラマブル・データプレーン時代に向けた ネットワーク・オペレーションスタックONIC2017 プログラマブル・データプレーン時代に向けた ネットワーク・オペレーションスタック
ONIC2017 プログラマブル・データプレーン時代に向けた ネットワーク・オペレーションスタック
 
Microsoft Seminar: Design Optimization on Rescale
Microsoft Seminar: Design Optimization on RescaleMicrosoft Seminar: Design Optimization on Rescale
Microsoft Seminar: Design Optimization on Rescale
 
Implementation Approach of Artifical Intelligence
Implementation Approach of Artifical IntelligenceImplementation Approach of Artifical Intelligence
Implementation Approach of Artifical Intelligence
 
Microsoft Search - Microsoft Graph connector と Search Federation の概要
Microsoft Search - Microsoft Graph connector と Search Federation の概要Microsoft Search - Microsoft Graph connector と Search Federation の概要
Microsoft Search - Microsoft Graph connector と Search Federation の概要
 
いまできるデータ分析を Power BI ではじめよう
いまできるデータ分析を Power BI ではじめよういまできるデータ分析を Power BI ではじめよう
いまできるデータ分析を Power BI ではじめよう
 
SmartNews の Webmining を支えるプラットフォーム
SmartNews の Webmining を支えるプラットフォームSmartNews の Webmining を支えるプラットフォーム
SmartNews の Webmining を支えるプラットフォーム
 
Force.com
Force.comForce.com
Force.com
 
夏サミ2012 [A-2]ソーシャルプラットフォームを使った業務アプリ開発の現場
夏サミ2012 [A-2]ソーシャルプラットフォームを使った業務アプリ開発の現場夏サミ2012 [A-2]ソーシャルプラットフォームを使った業務アプリ開発の現場
夏サミ2012 [A-2]ソーシャルプラットフォームを使った業務アプリ開発の現場
 
Force.com developers meetup #2 夏サミ、そしてソーシャル・エンタープライズを考える
Force.com developers meetup #2 夏サミ、そしてソーシャル・エンタープライズを考えるForce.com developers meetup #2 夏サミ、そしてソーシャル・エンタープライズを考える
Force.com developers meetup #2 夏サミ、そしてソーシャル・エンタープライズを考える
 
SpotfireとTERRの連携
SpotfireとTERRの連携SpotfireとTERRの連携
SpotfireとTERRの連携
 
E-commerce企業におけるビッグデータへの挑戦と課題‐機械学習への期待について‐
E-commerce企業におけるビッグデータへの挑戦と課題‐機械学習への期待について‐E-commerce企業におけるビッグデータへの挑戦と課題‐機械学習への期待について‐
E-commerce企業におけるビッグデータへの挑戦と課題‐機械学習への期待について‐
 
20211112_jpugcon_gpu_and_arrow
20211112_jpugcon_gpu_and_arrow20211112_jpugcon_gpu_and_arrow
20211112_jpugcon_gpu_and_arrow
 
DB TechShowcase Tokyo - Intelligent Data Platform
DB TechShowcase Tokyo - Intelligent Data PlatformDB TechShowcase Tokyo - Intelligent Data Platform
DB TechShowcase Tokyo - Intelligent Data Platform
 

「R for Cloud Computing」の紹介

  • 1. 「R for Cloud Computing」の紹介 Takekatsu Hiramura 2015-01-17 TokyoR #45 1
  • 2. 自己紹介 » 平村 健勝 (Taketatsu Hiramura) コンサルティングファーム勤務 » seekR 管理人 » Rパッケージ RForcecom 開発者 » Twitter @hiratake55 » http://about.me/takekatsu.hiramura 2
  • 4. RForcecom パッケージ R から Salesforce.com, Force.com に接続するパッケージ、「RForcecom」 を開 発しました。本体は CRAN に登録済で、コードは GitHub で公開中です。 4  データマニピュレーション  統計分析(多変量解析、データマイニング等)  データビジュアリゼーション  CRM(顧客情報管理)  ダッシュボード・レポート  コラボレーション基盤(Chatter, ToDo管理等) RSalesforce.com データ 削除 データ 挿入 データ 更新 画面 イメージ ・ データ 連携内容 用途 データ 抽出 SOQL クエリ 検索  http://cran.r-project.org/web/packages/RForcecom/
  • 6. R for Cloud Computing » UseR! 2014でRForcecomパッケージの紹介をしたのがきっかけで、「R for Cloud Computing」という書籍をAjay氏と執筆することになりました。 6 UseR!2014@UCLA
  • 7. 本の概要 » 目的 › Cloud Computing時代のRの使い方とし て今までとは違った使い方を紹介する。 › 手順をスクリーンショットStep-by-Step で紹介し、初心者でも理解しやすい内容 とする。 » 対象読者 › Rを現在、手持ちのローカル環境のPCで 使っているが、大量のデータを素早く処 理するためにクラウド上でRを試したい。 › 外部のWebサービス(SaaS, PaaS)を用いて、 機械学習やビジュアリゼーションを行い たい 7 http://www.amazon.com/dp/1493917013
  • 8. 本は全9章で構成されている 8 Chapter Introduction to R for Cloud Computing An Approach for Data Scientists Navigating the Choices in R and Cloud Computing Setting Up R on the Cloud Using R Using R with Data and Bigger Data R with Cloud APIs Securing Your R cloud Training Literature for Cloud Computing and R 1 2 3 4 5 6 7 8 9 各章の概要 この本について データサイエンティストがクラウ ドを使うにあたっての心得 クラウドでRを使うにあたっての 様々な選択肢 クラウドでRを実行する クラウドに特化したRの使い方 Rで大量のデータを処理する RからクラウドのWeb APIを実行 する セキュリティ面において注意する こと より詳しく知るのに役立つ情報源 技術要素 - - Renjin, RFiddle, Shiny, and etc. AWS, Google and etc. Rappoter, R Service Bus RHadoop, NoSQL Salesforece.com, and etc. - - 次スライド で紹介 次スライド で紹介 次スライド で紹介 次スライド で紹介
  • 9. 3. クラウドでRを使うにあたっての様々な選択肢 Rをブラウザから使う » R-Fiddle (http://www.r-fiddle.org/) › Datamind社が開発。JSFiddleに影響を受けて開発された。 › Chrome Appもある。 » Domino (http://www.dominodatalab.com/) › PythonやRのコードをブラウザから実行可能。最近では、 Notebookにも対応。 » Intuitics(旧:Statace) (https://www.intuitics.com/) › コーディングの知識が無くてもデータ分析、整形、可視化が可能 なサービス 9
  • 10. 3. クラウドでRを使うにあたっての様々な選択肢 Rの実行環境 » Renjin (http://renjindemo.appspot.com/) › Java VMを用いた独自のRインタプリタ。他システムと連携が容易 なのが特徴。 (現在開発中) » pqR (http://www.pqr-project.org/) › A pretty quick version of R。R Core Teamが高速化を目的として開 発。 › R 2.15.0がベース。 10
  • 11. 4. クラウドでRを実行する AWSでRを利用する » RStudio Server › EC2インスタンスにRStudio Serverをインストール。Webブラウザ からアクセスして利用可能。 › http://www.rstudio.com/products/rstudio/download-server/ » RevolutionRのAMI › Windows版, Linux版が提供 › https://aws.amazon.com/marketplace/seller-profile?id=3c6536d3- 8115-4bc0-a713-be58e257a7be » BioconductorのAMI › Bioconductorの他、RStudio Serverなどがインストール済。 › http://www.bioconductor.org/help/bioconductor-cloud-ami/ 11
  • 12. 4. クラウドでRを実行する Google Cloud PlatformでRを利用する » Big Query › bigrqueryパッケージ。Hadley Wickham氏が開発。 › https://github.com/hadley/bigrquery » Google Prediction API › googlepredictionapiパッケージ。Googleが開発。 › https://code.google.com/p/google-prediction-api-r-client/ » Fusion Tables API › GFusionTablesパッケージ › http://gfusiontables.lopatenko.com/ 12
  • 13. 7.RからクラウドのWeb APIを実行する » BigML › bigml-Rパッケージ: https://github.com/bigmlcom/bigml-r » Microsoft Azure Machine Learning › Webインターフェース(ML Studio)からRコードを実行可能 » plot.ly › チュートリアル:https://plot.ly/r/getting-started/ » yhat › yhatrパッケージ: https://github.com/yhat/yhatr » Salesforce.com › RForcecomパッケージ: http://rforcecom.plavox.info/ 13
  • 14. 8. より詳しく知るのに役立つ情報源 14 情報源・コミュニティ » R-bloggers http://www.r-bloggers.com/ » R User Meetups http://r-users-group.meetup.com/ オンラインコース » Coursera https://www.coursera.org/course/dataanalysis » DataCamp https://www.datacamp.com/courses » UCLA http://www.ats.ucla.edu/stat/r/