SlideShare a Scribd company logo
1 of 18
SciRubyプロジェクトの紹介 (@kozo2)
目的
●SciRubyプロジェクトを背景を交え紹介
●協力者を募る
アウトライン
1.Rubyとデータサイエンス
2.Pythonと比較したRubyの現状
3.SciRuby(-jp)プロジェクトから伝えたいこと
SciRuby(-jp)プロジェクトとは
科学技術計算におけるRuby環境の改善が目的の国際プロジェクト
http://sciruby.com/
最近発足した(-jp)ではデータサイエンスのための環境が主なターゲット
(-jp)の中心人物、組織
モチベーション「Rubyで書けると嬉しい(文法的なもの)、Ruby活用の領域を広
Koichi Sasada Kenta Murata
Rubyはデータサイエンスには使われていない
なぜか? Pythonを使うから。
エコシステムとしての熟成
ハイレベルからローレベルまで全てをカバーするパッケージ群
メジャーOS全てをカバーするバイナリパッケージマネージャー
実例、ドキュメントの充実
コミュニティ、資金
そもそもデータサイエンスとは?
上記をRubyで実現すればいいんじゃないの?
誰もが知っているデータサイエンスソフト
Excelでは不十分かつ必要な機能
(ビッグというより) 複雑なデータを巧みに扱う機能 (データフレーム)
テキスト(xls, csv, tsv, json, ...), RDB, HDF, … 表概念なんでも
整形, 統合, 集計 (例 ピボットテーブル)
Excelが搭載する機能より高度な データ解析 (機械学習, 統計) , 可視化
SPSS R
Matlab
Python
Excelでは不十分かつ必要な機能
(ビッグというより) 複雑なデータを巧みに扱う機能 (データフレーム)
テキスト(xls, csv, tsv, json, ...), RDB, HDF, … 表概念なんでも
整形, 統合, 集計 (例 ピボットテーブル)
Excelが搭載する機能より高度な データ解析 (機械学習, 統計) , 可視化
SPSS R
Matlab
Python
http://jakevdp.github.io/blog/2012/09/20/why-python-is-the-last/
より
Pythonのデータ解析エコシステム
メジャーOS全てをサポートする
バイナリパッケージマネージャー
コミュニティ、教育を通して研究開発を
促進、サポートする非営利団体
Pythonと比較した(Sci)Ruby の現状
● 資産が皆無という訳ではない
● ツール間の連携 統一性が乏しい
● ドッグフーディングが圧倒的に足り
ていない
○ インストールの困難
○ ドキュメント不足
● 導き出される改善策
○ 動作テスト
○ 情報整理
現在のSciRuby-jpプロジェクトが行
っていること
https://github.com/sciruby-
jp/survey/issues
SciRuby(-jp) が現在行おうとしている事
データフレーム ( pandas ) -> daru ( https://github.com/v0dro/daru ) の改善 (実
際にはドッグフーディング)
機械学習 ( scikit-learn ) -> https://github.com/sciruby-jp/survey/issues/1
統計 ( R ) -> R連携 ?, https://github.com/SciRuby/statsample ?
可視化 ( matplotlib, plotly, bokeh)
-> nyaplot ( https://github.com/domitry/nyaplot ) の改善 (実際にはドッグ
フーディング)
保留策、アイデアのみのものなど
(Nyaplotだけでなく他の) JS 可視化ソフトとの連携
Plotly, bokeh, … 用のgem
ただ前述のことが準備できてないと旨味ほぼ無し... (だからmikonが作られた)
バイナリ gem 環境の改善
現状インストールが困難, どのOSでも用意に使える環境を...
Conda の利用 ?
異言語間連携 (C[++], プロセス間通信, メッセージパッシング)
Jupyter用 ZeroMQ gemのメンテ
Rserve活用, runr への Ruby engineの追加
もしアイデアがあれば (しかし銀の弾丸は無い...?)
基本的に Python の後追い
Python も R を後追いした
車輪の再発明にも意味はある。(例 Julia)
(他言語も含んだ)既存資産の活用 ?
Rails (Active record?)
参加方法
Slack
Google group
https://sciruby-slack.herokuapp.com/
https://groups.google.com/forum/#!forum/sciruby-jp
今後の予定
サーベイミーティング (サーベイ成果報告会)
RubyKaigi 2016
???
Ruby Association助成金
Google summer of code
余談
PyData Osaka (予定)
データサイエンスについて興味があれば
現状「Rubyで」学習する、のは少し厳しい
Python に限るものでは無い。データサイエンスに関して
ならなんでも (R, Julia, もちろんRubyでも)
Slack https://pydata-jp.herokuapp.com/
こちらも協力者募集

More Related Content

Similar to Sci rubyプロジェクトの紹介

PythonとRによるデータ分析環境の構築と機械学習によるデータ認識
PythonとRによるデータ分析環境の構築と機械学習によるデータ認識PythonとRによるデータ分析環境の構築と機械学習によるデータ認識
PythonとRによるデータ分析環境の構築と機械学習によるデータ認識Katsuhiro Morishita
 
Robomec2014 rtm講習会第1部(その1)
Robomec2014 rtm講習会第1部(その1)Robomec2014 rtm講習会第1部(その1)
Robomec2014 rtm講習会第1部(その1)openrtm
 
オープンソースのビッグデータ・IoT向け スケールアウト型データベースGridDBとPython連携 〜GridDBとPythonと私〜
オープンソースのビッグデータ・IoT向け スケールアウト型データベースGridDBとPython連携 〜GridDBとPythonと私〜オープンソースのビッグデータ・IoT向け スケールアウト型データベースGridDBとPython連携 〜GridDBとPythonと私〜
オープンソースのビッグデータ・IoT向け スケールアウト型データベースGridDBとPython連携 〜GridDBとPythonと私〜griddb
 
FOSS4G 2009 Tokyo (R and Geo) in Japanese
FOSS4G 2009 Tokyo (R and Geo) in JapaneseFOSS4G 2009 Tokyo (R and Geo) in Japanese
FOSS4G 2009 Tokyo (R and Geo) in JapaneseMasafumi Okada
 
ビッグデータ活用支援フォーラム
ビッグデータ活用支援フォーラムビッグデータ活用支援フォーラム
ビッグデータ活用支援フォーラムRecruit Technologies
 
WebDB Forum 2012 基調講演資料
WebDB Forum 2012 基調講演資料WebDB Forum 2012 基調講演資料
WebDB Forum 2012 基調講演資料Recruit Technologies
 
データ分析に必要なスキルをつけるためのツール~Jupyter notebook、r連携、機械学習からsparkまで~
データ分析に必要なスキルをつけるためのツール~Jupyter notebook、r連携、機械学習からsparkまで~データ分析に必要なスキルをつけるためのツール~Jupyter notebook、r連携、機械学習からsparkまで~
データ分析に必要なスキルをつけるためのツール~Jupyter notebook、r連携、機械学習からsparkまで~The Japan DataScientist Society
 
ET2014資料: mruby プログラム言語Rubyによる組込みソト開発
ET2014資料: mruby プログラム言語Rubyによる組込みソト開発ET2014資料: mruby プログラム言語Rubyによる組込みソト開発
ET2014資料: mruby プログラム言語Rubyによる組込みソト開発Kazuaki Tanaka
 
Rubyプログラミング教育に対する取り組みと事例紹介
Rubyプログラミング教育に対する取り組みと事例紹介Rubyプログラミング教育に対する取り組みと事例紹介
Rubyプログラミング教育に対する取り組みと事例紹介Yasushi Ishikawa
 
アイデアを形にする ③3時間でアプリ公開!ゼロからのプログラミング講座
アイデアを形にする  ③3時間でアプリ公開!ゼロからのプログラミング講座アイデアを形にする  ③3時間でアプリ公開!ゼロからのプログラミング講座
アイデアを形にする ③3時間でアプリ公開!ゼロからのプログラミング講座DIVE INTO CODE Corp.
 
Bundler 2 の胎動
Bundler 2 の胎動Bundler 2 の胎動
Bundler 2 の胎動Koichi ITO
 
【入門】3時間でアプリ公開!ゼロからのプログラミングRails講座
【入門】3時間でアプリ公開!ゼロからのプログラミングRails講座【入門】3時間でアプリ公開!ゼロからのプログラミングRails講座
【入門】3時間でアプリ公開!ゼロからのプログラミングRails講座DIVE INTO CODE Corp.
 
アプリケーションエンジニアのためのクラウドインフラ再入門 (2/3)
アプリケーションエンジニアのためのクラウドインフラ再入門 (2/3)アプリケーションエンジニアのためのクラウドインフラ再入門 (2/3)
アプリケーションエンジニアのためのクラウドインフラ再入門 (2/3)Takashi Sogabe
 
情報爆発シンポジウム infoplosion
情報爆発シンポジウム infoplosion情報爆発シンポジウム infoplosion
情報爆発シンポジウム infoplosionRakuten Group, Inc.
 
mruby/c機能紹介20160329
mruby/c機能紹介20160329mruby/c機能紹介20160329
mruby/c機能紹介20160329shimane-itoc
 
130522 00
130522 00130522 00
130522 00openrtm
 
kintone REST API client package for R
kintone REST API client package for Rkintone REST API client package for R
kintone REST API client package for RRyu Yamashita
 
オープンソースデータベース GridDBとそのオープンコミュニティ活動
オープンソースデータベース GridDBとそのオープンコミュニティ活動オープンソースデータベース GridDBとそのオープンコミュニティ活動
オープンソースデータベース GridDBとそのオープンコミュニティ活動griddb
 
Ruby on Rails を用いたWEBアプリケーションの開発
Ruby on Rails を用いたWEBアプリケーションの開発Ruby on Rails を用いたWEBアプリケーションの開発
Ruby on Rails を用いたWEBアプリケーションの開発Koichi Shimozono
 

Similar to Sci rubyプロジェクトの紹介 (20)

PythonとRによるデータ分析環境の構築と機械学習によるデータ認識
PythonとRによるデータ分析環境の構築と機械学習によるデータ認識PythonとRによるデータ分析環境の構築と機械学習によるデータ認識
PythonとRによるデータ分析環境の構築と機械学習によるデータ認識
 
Robomec2014 rtm講習会第1部(その1)
Robomec2014 rtm講習会第1部(その1)Robomec2014 rtm講習会第1部(その1)
Robomec2014 rtm講習会第1部(その1)
 
オープンソースのビッグデータ・IoT向け スケールアウト型データベースGridDBとPython連携 〜GridDBとPythonと私〜
オープンソースのビッグデータ・IoT向け スケールアウト型データベースGridDBとPython連携 〜GridDBとPythonと私〜オープンソースのビッグデータ・IoT向け スケールアウト型データベースGridDBとPython連携 〜GridDBとPythonと私〜
オープンソースのビッグデータ・IoT向け スケールアウト型データベースGridDBとPython連携 〜GridDBとPythonと私〜
 
FOSS4G 2009 Tokyo (R and Geo) in Japanese
FOSS4G 2009 Tokyo (R and Geo) in JapaneseFOSS4G 2009 Tokyo (R and Geo) in Japanese
FOSS4G 2009 Tokyo (R and Geo) in Japanese
 
ビッグデータ活用支援フォーラム
ビッグデータ活用支援フォーラムビッグデータ活用支援フォーラム
ビッグデータ活用支援フォーラム
 
WebDB Forum 2012 基調講演資料
WebDB Forum 2012 基調講演資料WebDB Forum 2012 基調講演資料
WebDB Forum 2012 基調講演資料
 
データ分析に必要なスキルをつけるためのツール~Jupyter notebook、r連携、機械学習からsparkまで~
データ分析に必要なスキルをつけるためのツール~Jupyter notebook、r連携、機械学習からsparkまで~データ分析に必要なスキルをつけるためのツール~Jupyter notebook、r連携、機械学習からsparkまで~
データ分析に必要なスキルをつけるためのツール~Jupyter notebook、r連携、機械学習からsparkまで~
 
ET2014資料: mruby プログラム言語Rubyによる組込みソト開発
ET2014資料: mruby プログラム言語Rubyによる組込みソト開発ET2014資料: mruby プログラム言語Rubyによる組込みソト開発
ET2014資料: mruby プログラム言語Rubyによる組込みソト開発
 
Rubyプログラミング教育に対する取り組みと事例紹介
Rubyプログラミング教育に対する取り組みと事例紹介Rubyプログラミング教育に対する取り組みと事例紹介
Rubyプログラミング教育に対する取り組みと事例紹介
 
アイデアを形にする ③3時間でアプリ公開!ゼロからのプログラミング講座
アイデアを形にする  ③3時間でアプリ公開!ゼロからのプログラミング講座アイデアを形にする  ③3時間でアプリ公開!ゼロからのプログラミング講座
アイデアを形にする ③3時間でアプリ公開!ゼロからのプログラミング講座
 
Bundler 2 の胎動
Bundler 2 の胎動Bundler 2 の胎動
Bundler 2 の胎動
 
【入門】3時間でアプリ公開!ゼロからのプログラミングRails講座
【入門】3時間でアプリ公開!ゼロからのプログラミングRails講座【入門】3時間でアプリ公開!ゼロからのプログラミングRails講座
【入門】3時間でアプリ公開!ゼロからのプログラミングRails講座
 
アプリケーションエンジニアのためのクラウドインフラ再入門 (2/3)
アプリケーションエンジニアのためのクラウドインフラ再入門 (2/3)アプリケーションエンジニアのためのクラウドインフラ再入門 (2/3)
アプリケーションエンジニアのためのクラウドインフラ再入門 (2/3)
 
情報爆発シンポジウム infoplosion
情報爆発シンポジウム infoplosion情報爆発シンポジウム infoplosion
情報爆発シンポジウム infoplosion
 
mruby/c機能紹介20160329
mruby/c機能紹介20160329mruby/c機能紹介20160329
mruby/c機能紹介20160329
 
130522 00
130522 00130522 00
130522 00
 
kintone REST API client package for R
kintone REST API client package for Rkintone REST API client package for R
kintone REST API client package for R
 
オープンソースデータベース GridDBとそのオープンコミュニティ活動
オープンソースデータベース GridDBとそのオープンコミュニティ活動オープンソースデータベース GridDBとそのオープンコミュニティ活動
オープンソースデータベース GridDBとそのオープンコミュニティ活動
 
Ruby on Rails を用いたWEBアプリケーションの開発
Ruby on Rails を用いたWEBアプリケーションの開発Ruby on Rails を用いたWEBアプリケーションの開発
Ruby on Rails を用いたWEBアプリケーションの開発
 
Hadoop Conference Japan 2009 #2
Hadoop Conference Japan 2009 #2Hadoop Conference Japan 2009 #2
Hadoop Conference Japan 2009 #2
 

Sci rubyプロジェクトの紹介