SlideShare a Scribd company logo
1 of 48
Download to read offline
Summit
Developers
Developers Summit 2013 Summer
Hadoopを使わない独自の分散
処理環境の構築とその運用	
前橋孝広
株式会社インターネットイニシアティブ	
プラットフォームサービス部	
プラットフォーム開発課	
A3
#natsumiA3
Summit
Developers
Developers Summit 2013 Summer
自己紹介	
名前:	
  前橋孝広	
  
所属:	
  株式会社インターネットイニシアティブ(IIJ)	
  
Summit
Developers
Developers Summit 2013 Summer
本日の話	
分散システム開発の動機	
開発したものの機能と仕組みについて	
システムの構築と運用
Summit
Developers
Developers Summit 2013 Summer
分散システム開発の動機	
ISPにおいて、サービスの状態把握は必須	
  
そのために大量のログデータを扱う必要がある	
  
http://www.flickr.com/photos/ctbto/8443792513/
Summit
Developers
Developers Summit 2013 Summer
ISPにおける大規模データ	
•  ほぼすべて時系列データ	
  
•  分析したい項目や抽出条件は多岐にわたる	
例:	
  トラフィックデータ	
フィルタリングログ	
時系列Webアクセス数	
Webアクセス数割合
Summit
Developers
Developers Summit 2013 Summer
例:	
  トラフィック情報(NetFlow)のデータ	
I I J の バ ッ ク ボ ー ン を 流 れ る ト ラ フ ィ ッ ク の 情 報 は 膨 大 な 量 と な る 	
!me	
 router	
 bytes	
 pkts	
 proto	
 src	
  AS	
 dst	
  AS	
 src	
  port	
 dst	
  port	
 src	
  ip	
 dst	
  ip	
 …	
1388253400	
 172.16.100.1	
 1433	
 1	
 6	
 2497	
 9999	
 80	
 4321	
 192.168.0.1	
 192.168.9.8	
1388253400	
 172.16.0.10	
 987	
 1	
 6	
 1234	
 1000	
 25	
 2224	
 10.168.20.1	
 10.168.20.1	
1388253400	
 172.16.100.2	
 555	
 1	
 6	
 9999	
 2497	
 2345	
 80	
 192.168.0.7	
 10.18.80.1	
1388253400	
 10.16.10.1	
 12	
 1	
 1	
 1111	
 2222	
 22	
 22345	
 10.168.1.1	
 10.168.30.1	
1388253400	
 172.16.0.1	
 1490	
 2	
 17	
 2222	
 1234	
 22345	
 24	
 172.16.9.7	
 10.68.20.1	
1388253401	
 172.16.1.10	
 1309	
 1	
 6	
 3333	
 5555	
 8080	
 8765	
 192.168.0.1	
 172.16.9.79	
1388253401	
 192.168.10.1	
 538	
 1	
 6	
 1111	
 2497	
 5787	
 80	
 10.218.0.1	
 192.168.9.1	
1388253401	
 172.16.99.8	
 333	
 1	
 1	
 9999	
 1000	
 70	
 15588	
 10.68.0.1	
 172.16.9.72	
1388253401	
 10.16.98.7	
 981	
 1	
 17	
 4444	
 2222	
 80	
 11557	
 192.168.0.1	
 172.16.90.3	
1388253401	
 172.16.10.1	
 1433	
 1	
 6	
 1234	
 4321	
 7078	
 12345	
 172.16.0.1	
 172.16.4.71	
…	
約30項目	
数億	
  
/day
Summit
Developers
Developers Summit 2013 Summer
巨大なログデータの処理といえば
Summit
Developers
Developers Summit 2013 Summer
MapReduce	
  とは?	
mapとreduceの2段階にわけてデータ処理	
  
①	
  map	
  –	
  抽出・変換	
  
②	
  reduce	
  –	
  集約・集計
Summit
Developers
Developers Summit 2013 Summer
Hadoop相当のものを自作	
IIJ社内専用	
  
非公開	
オープンソース
Summit
Developers
Developers Summit 2013 Summer
Hadoopを使わず自作した理由	
•  Hadoopはバッチ処理に特化している	
  
•  自社開発でノウハウをためるため	
  
•  用途を特化して作ればより効率のよいものが
作れる	
  
•  やってみたかったから	
  
Summit
Developers
Developers Summit 2013 Summer
分散処理の原理は難しくない	
分散処理	
従来型処理	
データはあらかじめ	
  
各ノードに分散配置	
各ノードで並列実行
Summit
Developers
Developers Summit 2013 Summer
Hadoopはバッチシステム
Summit
Developers
Developers Summit 2013 Summer
Hadoopが向いている処理	
•  24秒の遅延が気にならないような巨大なバッ
チ処理	
  
•  やることが決まっている定型処理
Summit
Developers
Developers Summit 2013 Summer
やりたいこと	
•  サービス運用者は、試行錯誤により、より深い
データ分析を行う	
  	
  
•  分析に必要なパラメータは多様であり、事前に
網羅することは困難 → 定型でない	
  
データを生のまま保存し、	
  
オンデマンドで抽出・	
  
集計を行う必要がある	
  
Summit
Developers
Developers Summit 2013 Summer
開発したものの機能と仕組み
Summit
Developers
Developers Summit 2013 Summer
開発したもの(1)	
  ddd	
大量の時系列データ(例:	
  NetFlow生データ)を蓄積し	
  
要求に応じて短時間で検索・集約結果を返す	
  
Summit
Developers
Developers Summit 2013 Summer
ユーザインタフェース	
クエリパラメータ入力	
グラフ化	
  
アドホッククエリ(定型的でない、
一回限りの問い合わせ)が大半
Summit
Developers
Developers Summit 2013 Summer
dddの特徴	
•  時系列データに最適化した分散ファイルシス
テム→	
  対象データの格納位置を瞬時に特定	
  
•  自動レプリケーションによるデータ冗長化	
  
•  楽観的タスクスケジューリング	
  
– 応答待ち時間の短いMapReduce	
  
詳しくは…
電子情報通信学会論文 Vol.J93-D,No.7,pp.1072-1081,Jul. 2010.,
「大規模データ処理のための分散システムの実装とその応用」
Summit
Developers
Developers Summit 2013 Summer
MapReduceによるグラフ生成	
map:	
  複数ノードで並列に抽出・集計処理	
reduce:	
  結合	
要求があってから生データに対して分散処理を開始してグラフ化
Summit
Developers
Developers Summit 2013 Summer
応答速度	
•  極めて小さいデータを、何もせずに素通しする
のにかかる時間	
Hadoop	
 ddd	
19秒	
 0.12秒
Summit
Developers
Developers Summit 2013 Summer
2000タスクの処理時間グラフ	
•  台数が増えると処理時間が減少
Summit
Developers
Developers Summit 2013 Summer
2000タスクの処理時間グラフ(対数)	
•  台数が増えると、多少オーバーヘッドは出てくる
Summit
Developers
Developers Summit 2013 Summer
開発したもの(2)	
  pmux	
•  pipeline	
  mulPplexer	
  に由来	
  
•  オープンソースとして公開	
  
•  GitHub	
  
– hSps://github.com/iij/pmux	
  
– hSps://github.com/iij/pmux/wiki	
  
•  Gluster	
  Forge	
  
– hSps://forge.gluster.org/pmux	
  
Summit
Developers
Developers Summit 2013 Summer
pmuxとは?	
•  標準入出力を介して MapReduce するための
コマンドラインツール(Hadoop Streaming相当)	
$ pmux --mapper="grep PATTERN" *.log
例:	
  分散grep	
分散ファイルシステム	
  
上にあるファイル群
Summit
Developers
Developers Summit 2013 Summer
GlusterFSとは?	
FUSEでマウントして	
  
普通のファイルシステム	
  
として見える
Summit
Developers
Developers Summit 2013 Summer
ファイル名に応じて分散	
clientからは、ひとつの	
  
ファイルシステムとして見える
Summit
Developers
Developers Summit 2013 Summer
ちょっと宣伝	
•  IT検証ラボ	
  -­‐-­‐	
  分散ファイルシステムの
GlusterFS:こんなとき、どうなる 	
– hSp://itpro.nikkeibp.co.jp/arPcle/COLUMN/
20130104/447701/
Summit
Developers
Developers Summit 2013 Summer
pmuxの分散処理の原理	
•  例えば次のようなコマンド	
  
•  *.log が複数ノードに分散して配置されてい
れば、各ノードで並列に処理できる	
  
$ grep PATTERN *.log
Summit
Developers
Developers Summit 2013 Summer
ファイルがあるノードで処理を実行
Summit
Developers
Developers Summit 2013 Summer
結果を集める
Summit
Developers
Developers Summit 2013 Summer
実際はもう少し複雑
Summit
Developers
Developers Summit 2013 Summer
使用例:	
  ステータスコード集計	
Apache	
  ログから特定パターンの行だけ抜き出し、	
  
そのステータスコードを集計	
$ pmux --mapper='grep PAT |cut -d" " -f 9’ 
--reducer='sort|uniq -c’ /mnt/glusterfs/*.log
176331 200
106360 206
809 400
21852 403
533 404
27 406
805 416
25 500
Summit
Developers
Developers Summit 2013 Summer
使用例:	
  word	
  count	
$ pmux --mapper=map.rb --reducer=reduce.rb 
--file=map.rb –-file=reduce.rb 
/mnt/glusterfs/*.txt
#! /usr/bin/ruby -an
$F.each {|f| print "#{f}t1n"}
#! /usr/bin/ruby -an
BEGIN {$c = Hash.new 0}
$c[$F[0]] += $F[1].to_i
END {$c.each {|k, v| print "#{k} #{v}n"}}
map.rb	
reduce.rb	
コマンドライン
Summit
Developers
Developers Summit 2013 Summer
デバッグとテスト	
•  多数のノードを前提とした分散システムのデ
バッグは超大変	
  
•  ネットワークをモック化	
  
– 複数ノード環境をシミュレーション	
  
•  テストへの組み込み	
  
– 継続的インテグレーション(CI)ツールによって自動
実行
Summit
Developers
Developers Summit 2013 Summer
実環境でしかわからないこと	
•  実環境でしか再現できないトラブルもある	
  
•  ノード間通信の集中に起因	
  
– コネクション数限界	
  
•  net.core.somaxconn	
  
– パケットの消失	
  
•  スイッチのバッファの限界を超える?	
  
   ノード間の通信をキューを使って制御	
  
Summit
Developers
Developers Summit 2013 Summer
自作した甲斐はあったのか	
•  答えは、もちろん「YES」	
  
•  サービスや社内システムのバックエンドで活用
中 (定型、非定型処理両方)	
  
•  分散処理のボトルネックやトラブルシュートに
関するノウハウの蓄積ができた	
  
•  ビッグデータに関する新サービスへの応用予
定	
  
Summit
Developers
Developers Summit 2013 Summer
運用
Summit
Developers
Developers Summit 2013 Summer
分散処理プラットフォーム dplat	
•  IIJ社内に対し、分散システムの基盤を提供	
  
•  社内向けPaaSのようなもの	
  
– ddd,	
  GlusterFS,	
  pmux	
  などが使用可能	
  
•  サービスごとにクラスタを分けて運用	
  	
  
Summit
Developers
Developers Summit 2013 Summer
サービスのバックエンドとして利用	
データ	
アウトプット	
データ	
アウトプット	
dplat	
トラフィック解析システム	
 バックエンド	
セキュリティレポートサービス
Summit
Developers
Developers Summit 2013 Summer
ノードの設置場所	
東京	
大阪	
松江	
 広域分散により	
データの喪失を防ぐ
Summit
Developers
Developers Summit 2013 Summer
松江データセンターパーク	
IT	
  module	
air-­‐condiPoning	
  unit
Summit
Developers
Developers Summit 2013 Summer
ITモジュールの中身	
•  IZmo	
  S(スリム): ラックを傾斜配置	
– 他に IZmo	
  W(ワイド)もあり
Summit
Developers
Developers Summit 2013 Summer
運用の基本思想	
•  楽をする	
  
– いろいろ自動化	
  
•  機材は壊れることを前提	
  
– 適切な冗長化で壊れても良いようにする	
  
•  障害が起きても基本は放置	
  →	
  あとで修理	
  
•  監視とモニタリングは、しっかりやる	
  
Summit
Developers
Developers Summit 2013 Summer
サーバについて(1)	
•  サーバはネットワークブート	
  
– OSなどのシステムはメモリファイルシステム	
  
– 再起動すると設定はすべて消える	
  
– →	
  設定情報の外部化/バージョン管理	
  
•  起動後に	
  Chef	
  で必要な物がインストール	
  
•  サーバ仮想化技術は使っていない	
  
Summit
Developers
Developers Summit 2013 Summer
サーバについて(2)	
•  HDDは搭載しているが、データ格納用途のみ	
  
– RAIDによる冗長化はしていない	
  
•  dddやGlusterFSのレベルで冗長化	
  
– 故障時はノードごと切り離されるがデータは消失
しない	
  
•  故障はそれなりに起こる	
  
– ハードディスク、NIC、メモリ、電源、etc	
  
Summit
Developers
Developers Summit 2013 Summer
監視	
•  死活監視、ポート監視	
  
•  ディスク残量監視	
  
•  分散ファイルシステムの読み書き監視	
  
•  MapReduceジョブの実行時間監視	
  
Summit
Developers
Developers Summit 2013 Summer
モニタリング	
•  ファシリティレベル	
  
– 温度、消費電力	
  etc	
  
•  各種リソース	
  
– ディスク、メモリ使用量	
  etc	
  
•  アプリケーションレベル	
  
– 各APIコール数	
  
– タスク実行状況詳細	
  etc
Summit
Developers
Developers Summit 2013 Summer
まとめ	
•  ISPは、サービス状態の把握のため巨大なログ
データを扱う必要がある	
  
•  分散処理システムを独自に開発	
  
– 定型でない処理に対応	
  
•  運用	
  
– 今どきの普通のやり方	
  
– モニタリング重視	
  

More Related Content

What's hot

クラウドを『作る』ってどういうこと?
クラウドを『作る』ってどういうこと?クラウドを『作る』ってどういうこと?
クラウドを『作る』ってどういうこと?Kazuto Kusama
 
アカツキはどのようにAWSを活用しているか #jawsug
アカツキはどのようにAWSを活用しているか #jawsugアカツキはどのようにAWSを活用しているか #jawsug
アカツキはどのようにAWSを活用しているか #jawsugaktsk
 
Hadoopの標準GUI HUEの最新情報
Hadoopの標準GUI HUEの最新情報Hadoopの標準GUI HUEの最新情報
Hadoopの標準GUI HUEの最新情報Cloudera Japan
 
Jenkinsとhadoopを利用した継続的データ解析環境の構築
Jenkinsとhadoopを利用した継続的データ解析環境の構築Jenkinsとhadoopを利用した継続的データ解析環境の構築
Jenkinsとhadoopを利用した継続的データ解析環境の構築VOYAGE GROUP
 
Apache Drill でたしなむ セルフサービスデータ探索 - 2014/11/06 Cloudera World Tokyo 2014 LTセッション
Apache Drill でたしなむ セルフサービスデータ探索 - 2014/11/06 Cloudera World Tokyo 2014 LTセッションApache Drill でたしなむ セルフサービスデータ探索 - 2014/11/06 Cloudera World Tokyo 2014 LTセッション
Apache Drill でたしなむ セルフサービスデータ探索 - 2014/11/06 Cloudera World Tokyo 2014 LTセッションMapR Technologies Japan
 
Hive on Spark の設計指針を読んでみた
Hive on Spark の設計指針を読んでみたHive on Spark の設計指針を読んでみた
Hive on Spark の設計指針を読んでみたRecruit Technologies
 
MapReduceを使った並列化 20111212
MapReduceを使った並列化 20111212MapReduceを使った並列化 20111212
MapReduceを使った並列化 20111212marony
 
HashiCorp Terraform Enterprise 紹介
HashiCorp Terraform Enterprise 紹介HashiCorp Terraform Enterprise 紹介
HashiCorp Terraform Enterprise 紹介hashicorpjp
 
EC2に対するcloudwatchのアクション設定がポリシーで使えないときの代替策
EC2に対するcloudwatchのアクション設定がポリシーで使えないときの代替策EC2に対するcloudwatchのアクション設定がポリシーで使えないときの代替策
EC2に対するcloudwatchのアクション設定がポリシーで使えないときの代替策Daisuke Nagao
 
Spark Streaming の基本とスケールする時系列データ処理 - Spark Meetup December 2015/12/09
Spark Streaming の基本とスケールする時系列データ処理 - Spark Meetup December 2015/12/09Spark Streaming の基本とスケールする時系列データ処理 - Spark Meetup December 2015/12/09
Spark Streaming の基本とスケールする時系列データ処理 - Spark Meetup December 2015/12/09MapR Technologies Japan
 

What's hot (16)

クラウドを『作る』ってどういうこと?
クラウドを『作る』ってどういうこと?クラウドを『作る』ってどういうこと?
クラウドを『作る』ってどういうこと?
 
アカツキはどのようにAWSを活用しているか #jawsug
アカツキはどのようにAWSを活用しているか #jawsugアカツキはどのようにAWSを活用しているか #jawsug
アカツキはどのようにAWSを活用しているか #jawsug
 
Hadoopの標準GUI HUEの最新情報
Hadoopの標準GUI HUEの最新情報Hadoopの標準GUI HUEの最新情報
Hadoopの標準GUI HUEの最新情報
 
Jenkinsとhadoopを利用した継続的データ解析環境の構築
Jenkinsとhadoopを利用した継続的データ解析環境の構築Jenkinsとhadoopを利用した継続的データ解析環境の構築
Jenkinsとhadoopを利用した継続的データ解析環境の構築
 
金融機関でのHive/Presto事例紹介
金融機関でのHive/Presto事例紹介金融機関でのHive/Presto事例紹介
金融機関でのHive/Presto事例紹介
 
Apache Drill でたしなむ セルフサービスデータ探索 - 2014/11/06 Cloudera World Tokyo 2014 LTセッション
Apache Drill でたしなむ セルフサービスデータ探索 - 2014/11/06 Cloudera World Tokyo 2014 LTセッションApache Drill でたしなむ セルフサービスデータ探索 - 2014/11/06 Cloudera World Tokyo 2014 LTセッション
Apache Drill でたしなむ セルフサービスデータ探索 - 2014/11/06 Cloudera World Tokyo 2014 LTセッション
 
Jawsug hpc #2_reinvent2015
Jawsug hpc #2_reinvent2015Jawsug hpc #2_reinvent2015
Jawsug hpc #2_reinvent2015
 
Apache Hadoop HDFSの最新機能の紹介(2018)#dbts2018
Apache Hadoop HDFSの最新機能の紹介(2018)#dbts2018Apache Hadoop HDFSの最新機能の紹介(2018)#dbts2018
Apache Hadoop HDFSの最新機能の紹介(2018)#dbts2018
 
Hive on Spark の設計指針を読んでみた
Hive on Spark の設計指針を読んでみたHive on Spark の設計指針を読んでみた
Hive on Spark の設計指針を読んでみた
 
MapReduceを使った並列化 20111212
MapReduceを使った並列化 20111212MapReduceを使った並列化 20111212
MapReduceを使った並列化 20111212
 
HashiCorp Terraform Enterprise 紹介
HashiCorp Terraform Enterprise 紹介HashiCorp Terraform Enterprise 紹介
HashiCorp Terraform Enterprise 紹介
 
時系列の世界の時系列データ
時系列の世界の時系列データ時系列の世界の時系列データ
時系列の世界の時系列データ
 
OSC2014 Tokyo/Spring Hadoop
OSC2014 Tokyo/Spring HadoopOSC2014 Tokyo/Spring Hadoop
OSC2014 Tokyo/Spring Hadoop
 
EC2に対するcloudwatchのアクション設定がポリシーで使えないときの代替策
EC2に対するcloudwatchのアクション設定がポリシーで使えないときの代替策EC2に対するcloudwatchのアクション設定がポリシーで使えないときの代替策
EC2に対するcloudwatchのアクション設定がポリシーで使えないときの代替策
 
NetflixにおけるPresto/Spark活用事例
NetflixにおけるPresto/Spark活用事例NetflixにおけるPresto/Spark活用事例
NetflixにおけるPresto/Spark活用事例
 
Spark Streaming の基本とスケールする時系列データ処理 - Spark Meetup December 2015/12/09
Spark Streaming の基本とスケールする時系列データ処理 - Spark Meetup December 2015/12/09Spark Streaming の基本とスケールする時系列データ処理 - Spark Meetup December 2015/12/09
Spark Streaming の基本とスケールする時系列データ処理 - Spark Meetup December 2015/12/09
 

Viewers also liked

The power of mobile advertising on Facebook
The power of mobile advertising on FacebookThe power of mobile advertising on Facebook
The power of mobile advertising on Facebookhttpool russia
 
D.condicion juridica procesal de los extranjeros
D.condicion juridica procesal de los extranjerosD.condicion juridica procesal de los extranjeros
D.condicion juridica procesal de los extranjerosUniversidad de Sonora
 
Populationgrowthand 111204073827-phpapp01
Populationgrowthand 111204073827-phpapp01Populationgrowthand 111204073827-phpapp01
Populationgrowthand 111204073827-phpapp01josetranquiloxp
 
CUNY Academic Commons Brochure
CUNY Academic Commons BrochureCUNY Academic Commons Brochure
CUNY Academic Commons Brochurebrooklyntechie
 
Чего хотят люди // What people wants
Чего хотят люди // What people wantsЧего хотят люди // What people wants
Чего хотят люди // What people wantsSegrey Nikishov - @n_grey
 
Creating compelling videos one day workshop
Creating compelling videos one day workshopCreating compelling videos one day workshop
Creating compelling videos one day workshopGregTuke
 
游戏运营(第二讲)
游戏运营(第二讲)游戏运营(第二讲)
游戏运营(第二讲)www.emean.com
 
Как бизнесу эффективно продвигаться в условиях кризиса.
Как бизнесу эффективно продвигаться в условиях кризиса. Как бизнесу эффективно продвигаться в условиях кризиса.
Как бизнесу эффективно продвигаться в условиях кризиса. Fert
 
Trying to cancel your va loan
Trying to cancel your va loanTrying to cancel your va loan
Trying to cancel your va loanEric Kandell
 

Viewers also liked (20)

Duurzame ambities - Liggen we op koers
Duurzame ambities - Liggen we op koersDuurzame ambities - Liggen we op koers
Duurzame ambities - Liggen we op koers
 
The power of mobile advertising on Facebook
The power of mobile advertising on FacebookThe power of mobile advertising on Facebook
The power of mobile advertising on Facebook
 
Gist2011
Gist2011Gist2011
Gist2011
 
12 agatha smmf
12 agatha smmf12 agatha smmf
12 agatha smmf
 
D.condicion juridica procesal de los extranjeros
D.condicion juridica procesal de los extranjerosD.condicion juridica procesal de los extranjeros
D.condicion juridica procesal de los extranjeros
 
“Verdien geld met Betere Verlichting” - renovatie en financiering
“Verdien geld met Betere Verlichting” - renovatie en financiering“Verdien geld met Betere Verlichting” - renovatie en financiering
“Verdien geld met Betere Verlichting” - renovatie en financiering
 
Populationgrowthand 111204073827-phpapp01
Populationgrowthand 111204073827-phpapp01Populationgrowthand 111204073827-phpapp01
Populationgrowthand 111204073827-phpapp01
 
Installing ms office 2010
Installing ms office 2010Installing ms office 2010
Installing ms office 2010
 
CUNY Academic Commons Brochure
CUNY Academic Commons BrochureCUNY Academic Commons Brochure
CUNY Academic Commons Brochure
 
Чего хотят люди // What people wants
Чего хотят люди // What people wantsЧего хотят люди // What people wants
Чего хотят люди // What people wants
 
Creating compelling videos one day workshop
Creating compelling videos one day workshopCreating compelling videos one day workshop
Creating compelling videos one day workshop
 
Employer based - simon - day 1 - session1
Employer based - simon - day 1 - session1Employer based - simon - day 1 - session1
Employer based - simon - day 1 - session1
 
游戏运营(第二讲)
游戏运营(第二讲)游戏运营(第二讲)
游戏运营(第二讲)
 
Skyworth
SkyworthSkyworth
Skyworth
 
Jiuzhou
JiuzhouJiuzhou
Jiuzhou
 
Как бизнесу эффективно продвигаться в условиях кризиса.
Как бизнесу эффективно продвигаться в условиях кризиса. Как бизнесу эффективно продвигаться в условиях кризиса.
Как бизнесу эффективно продвигаться в условиях кризиса.
 
Tenow
TenowTenow
Tenow
 
Trying to cancel your va loan
Trying to cancel your va loanTrying to cancel your va loan
Trying to cancel your va loan
 
에코바자회
에코바자회에코바자회
에코바자회
 
14 zen glove_pitch_deck
14 zen glove_pitch_deck14 zen glove_pitch_deck
14 zen glove_pitch_deck
 

Similar to 夏サミ2013 Hadoopを使わない独自の分散処理環境の構築とその運用

Devsumi2013 Ruby開発者のみなさん、mrubyで楽しく快適な組み込みアプリ開発を始めませんか?
Devsumi2013 Ruby開発者のみなさん、mrubyで楽しく快適な組み込みアプリ開発を始めませんか?Devsumi2013 Ruby開発者のみなさん、mrubyで楽しく快適な組み込みアプリ開発を始めませんか?
Devsumi2013 Ruby開発者のみなさん、mrubyで楽しく快適な組み込みアプリ開発を始めませんか?Takashi Sogabe
 
デブサミ2013【15-D-4】Opsから挑むDevOps
デブサミ2013【15-D-4】Opsから挑むDevOpsデブサミ2013【15-D-4】Opsから挑むDevOps
デブサミ2013【15-D-4】Opsから挑むDevOpsDevelopers Summit
 
デブサミ2013【15-E-2】Ruby開発者のみなさん、mrubyで楽しく快適な組み込みアプリ開発を始めませんか?
デブサミ2013【15-E-2】Ruby開発者のみなさん、mrubyで楽しく快適な組み込みアプリ開発を始めませんか?デブサミ2013【15-E-2】Ruby開発者のみなさん、mrubyで楽しく快適な組み込みアプリ開発を始めませんか?
デブサミ2013【15-E-2】Ruby開発者のみなさん、mrubyで楽しく快適な組み込みアプリ開発を始めませんか?Developers Summit
 
Db2 Warehouse Spark利用ガイド チュートリアル編
Db2 Warehouse Spark利用ガイド チュートリアル編Db2 Warehouse Spark利用ガイド チュートリアル編
Db2 Warehouse Spark利用ガイド チュートリアル編IBM Analytics Japan
 
Data Engineering at VOYAGE GROUP #jawsdays
Data Engineering at VOYAGE GROUP #jawsdaysData Engineering at VOYAGE GROUP #jawsdays
Data Engineering at VOYAGE GROUP #jawsdaysKenta Suzuki
 
Data Engineering at VOYAGE GROUP #jawsdays
Data Engineering at VOYAGE GROUP #jawsdaysData Engineering at VOYAGE GROUP #jawsdays
Data Engineering at VOYAGE GROUP #jawsdaysVOYAGE GROUP
 
サーバーレスの今とこれから
サーバーレスの今とこれからサーバーレスの今とこれから
サーバーレスの今とこれから真吾 吉田
 
ビッグデータ活用支援フォーラム
ビッグデータ活用支援フォーラムビッグデータ活用支援フォーラム
ビッグデータ活用支援フォーラムRecruit Technologies
 
de:code 2019 Cloud トラック 総まとめ! 完全版
de:code 2019 Cloud トラック 総まとめ! 完全版de:code 2019 Cloud トラック 総まとめ! 完全版
de:code 2019 Cloud トラック 総まとめ! 完全版Minoru Naito
 
マルチテナント Hadoop クラスタのためのモニタリング Best Practice
マルチテナント Hadoop クラスタのためのモニタリング Best Practiceマルチテナント Hadoop クラスタのためのモニタリング Best Practice
マルチテナント Hadoop クラスタのためのモニタリング Best PracticeHadoop / Spark Conference Japan
 
Azure Websites で作るスケーラブルな PHP アプリケーション
Azure Websites で作るスケーラブルな PHP アプリケーションAzure Websites で作るスケーラブルな PHP アプリケーション
Azure Websites で作るスケーラブルな PHP アプリケーションMasashi Shinbara
 
サーバー管理よ、サヨウナラ。サーバーレス アーキテクチャの意義と実践
サーバー管理よ、サヨウナラ。サーバーレス アーキテクチャの意義と実践サーバー管理よ、サヨウナラ。サーバーレス アーキテクチャの意義と実践
サーバー管理よ、サヨウナラ。サーバーレス アーキテクチャの意義と実践真吾 吉田
 
Bluemixの概要とアプリの作り方
Bluemixの概要とアプリの作り方Bluemixの概要とアプリの作り方
Bluemixの概要とアプリの作り方BMXUG
 
de:code 2019 Cloud トラック 総まとめ!
de:code 2019 Cloud トラック 総まとめ!de:code 2019 Cloud トラック 総まとめ!
de:code 2019 Cloud トラック 総まとめ!Minoru Naito
 
[db tech showcase Tokyo 2017] E35: 12台でやってみた!DWHソフトウェアアプライアンス Db2 Warehouse ~...
[db tech showcase Tokyo 2017] E35: 12台でやってみた!DWHソフトウェアアプライアンス Db2 Warehouse ~...[db tech showcase Tokyo 2017] E35: 12台でやってみた!DWHソフトウェアアプライアンス Db2 Warehouse ~...
[db tech showcase Tokyo 2017] E35: 12台でやってみた!DWHソフトウェアアプライアンス Db2 Warehouse ~...Insight Technology, Inc.
 
デブサミ2013【14-E-2】パフォーマンス・チューニングに革命をもたらす最新テクノロジー - トランザクショントレース
デブサミ2013【14-E-2】パフォーマンス・チューニングに革命をもたらす最新テクノロジー - トランザクショントレースデブサミ2013【14-E-2】パフォーマンス・チューニングに革命をもたらす最新テクノロジー - トランザクショントレース
デブサミ2013【14-E-2】パフォーマンス・チューニングに革命をもたらす最新テクノロジー - トランザクショントレースDevelopers Summit
 
既存システムへの新技術活用法 ~fluntd/MongoDB~
既存システムへの新技術活用法 ~fluntd/MongoDB~既存システムへの新技術活用法 ~fluntd/MongoDB~
既存システムへの新技術活用法 ~fluntd/MongoDB~じゅん なかざ
 
実践!AWSクラウドデザインパターン
実践!AWSクラウドデザインパターン実践!AWSクラウドデザインパターン
実践!AWSクラウドデザインパターンHiroyasu Suzuki
 

Similar to 夏サミ2013 Hadoopを使わない独自の分散処理環境の構築とその運用 (20)

Devsumi2013 Ruby開発者のみなさん、mrubyで楽しく快適な組み込みアプリ開発を始めませんか?
Devsumi2013 Ruby開発者のみなさん、mrubyで楽しく快適な組み込みアプリ開発を始めませんか?Devsumi2013 Ruby開発者のみなさん、mrubyで楽しく快適な組み込みアプリ開発を始めませんか?
Devsumi2013 Ruby開発者のみなさん、mrubyで楽しく快適な組み込みアプリ開発を始めませんか?
 
Devsumi summer 2013_b2_share
Devsumi summer 2013_b2_shareDevsumi summer 2013_b2_share
Devsumi summer 2013_b2_share
 
デブサミ2013【15-D-4】Opsから挑むDevOps
デブサミ2013【15-D-4】Opsから挑むDevOpsデブサミ2013【15-D-4】Opsから挑むDevOps
デブサミ2013【15-D-4】Opsから挑むDevOps
 
デブサミ2013【15-E-2】Ruby開発者のみなさん、mrubyで楽しく快適な組み込みアプリ開発を始めませんか?
デブサミ2013【15-E-2】Ruby開発者のみなさん、mrubyで楽しく快適な組み込みアプリ開発を始めませんか?デブサミ2013【15-E-2】Ruby開発者のみなさん、mrubyで楽しく快適な組み込みアプリ開発を始めませんか?
デブサミ2013【15-E-2】Ruby開発者のみなさん、mrubyで楽しく快適な組み込みアプリ開発を始めませんか?
 
Db2 Warehouse Spark利用ガイド チュートリアル編
Db2 Warehouse Spark利用ガイド チュートリアル編Db2 Warehouse Spark利用ガイド チュートリアル編
Db2 Warehouse Spark利用ガイド チュートリアル編
 
Data Engineering at VOYAGE GROUP #jawsdays
Data Engineering at VOYAGE GROUP #jawsdaysData Engineering at VOYAGE GROUP #jawsdays
Data Engineering at VOYAGE GROUP #jawsdays
 
Data Engineering at VOYAGE GROUP #jawsdays
Data Engineering at VOYAGE GROUP #jawsdaysData Engineering at VOYAGE GROUP #jawsdays
Data Engineering at VOYAGE GROUP #jawsdays
 
サーバーレスの今とこれから
サーバーレスの今とこれからサーバーレスの今とこれから
サーバーレスの今とこれから
 
ビッグデータ活用支援フォーラム
ビッグデータ活用支援フォーラムビッグデータ活用支援フォーラム
ビッグデータ活用支援フォーラム
 
de:code 2019 Cloud トラック 総まとめ! 完全版
de:code 2019 Cloud トラック 総まとめ! 完全版de:code 2019 Cloud トラック 総まとめ! 完全版
de:code 2019 Cloud トラック 総まとめ! 完全版
 
マルチテナント Hadoop クラスタのためのモニタリング Best Practice
マルチテナント Hadoop クラスタのためのモニタリング Best Practiceマルチテナント Hadoop クラスタのためのモニタリング Best Practice
マルチテナント Hadoop クラスタのためのモニタリング Best Practice
 
Azure Websites で作るスケーラブルな PHP アプリケーション
Azure Websites で作るスケーラブルな PHP アプリケーションAzure Websites で作るスケーラブルな PHP アプリケーション
Azure Websites で作るスケーラブルな PHP アプリケーション
 
サーバー管理よ、サヨウナラ。サーバーレス アーキテクチャの意義と実践
サーバー管理よ、サヨウナラ。サーバーレス アーキテクチャの意義と実践サーバー管理よ、サヨウナラ。サーバーレス アーキテクチャの意義と実践
サーバー管理よ、サヨウナラ。サーバーレス アーキテクチャの意義と実践
 
Bluemixの概要とアプリの作り方
Bluemixの概要とアプリの作り方Bluemixの概要とアプリの作り方
Bluemixの概要とアプリの作り方
 
SAIS/SIGMOD参加報告 in SAIS/DWS2018報告会@Yahoo! JAPAN
SAIS/SIGMOD参加報告 in SAIS/DWS2018報告会@Yahoo! JAPANSAIS/SIGMOD参加報告 in SAIS/DWS2018報告会@Yahoo! JAPAN
SAIS/SIGMOD参加報告 in SAIS/DWS2018報告会@Yahoo! JAPAN
 
de:code 2019 Cloud トラック 総まとめ!
de:code 2019 Cloud トラック 総まとめ!de:code 2019 Cloud トラック 総まとめ!
de:code 2019 Cloud トラック 総まとめ!
 
[db tech showcase Tokyo 2017] E35: 12台でやってみた!DWHソフトウェアアプライアンス Db2 Warehouse ~...
[db tech showcase Tokyo 2017] E35: 12台でやってみた!DWHソフトウェアアプライアンス Db2 Warehouse ~...[db tech showcase Tokyo 2017] E35: 12台でやってみた!DWHソフトウェアアプライアンス Db2 Warehouse ~...
[db tech showcase Tokyo 2017] E35: 12台でやってみた!DWHソフトウェアアプライアンス Db2 Warehouse ~...
 
デブサミ2013【14-E-2】パフォーマンス・チューニングに革命をもたらす最新テクノロジー - トランザクショントレース
デブサミ2013【14-E-2】パフォーマンス・チューニングに革命をもたらす最新テクノロジー - トランザクショントレースデブサミ2013【14-E-2】パフォーマンス・チューニングに革命をもたらす最新テクノロジー - トランザクショントレース
デブサミ2013【14-E-2】パフォーマンス・チューニングに革命をもたらす最新テクノロジー - トランザクショントレース
 
既存システムへの新技術活用法 ~fluntd/MongoDB~
既存システムへの新技術活用法 ~fluntd/MongoDB~既存システムへの新技術活用法 ~fluntd/MongoDB~
既存システムへの新技術活用法 ~fluntd/MongoDB~
 
実践!AWSクラウドデザインパターン
実践!AWSクラウドデザインパターン実践!AWSクラウドデザインパターン
実践!AWSクラウドデザインパターン
 

More from Developers Summit

【18-A-2】ゲーミフィケーション・エバンジェリストが見る「あなたの技術力が“ワクワクするサービス”に変わる未来」
【18-A-2】ゲーミフィケーション・エバンジェリストが見る「あなたの技術力が“ワクワクするサービス”に変わる未来」【18-A-2】ゲーミフィケーション・エバンジェリストが見る「あなたの技術力が“ワクワクするサービス”に変わる未来」
【18-A-2】ゲーミフィケーション・エバンジェリストが見る「あなたの技術力が“ワクワクするサービス”に変わる未来」Developers Summit
 
【C-2・小林様】AIとAPIがITインフラにもたらす変化 ~プログラマブルなクラウド型Wi-Fi~
【C-2・小林様】AIとAPIがITインフラにもたらす変化 ~プログラマブルなクラウド型Wi-Fi~【C-2・小林様】AIとAPIがITインフラにもたらす変化 ~プログラマブルなクラウド型Wi-Fi~
【C-2・小林様】AIとAPIがITインフラにもたらす変化 ~プログラマブルなクラウド型Wi-Fi~Developers Summit
 
【C-2・醍醐様】AIとAPIがITインフラにもたらす変化 ~プログラマブルなクラウド型Wi-Fi~
【C-2・醍醐様】AIとAPIがITインフラにもたらす変化 ~プログラマブルなクラウド型Wi-Fi~【C-2・醍醐様】AIとAPIがITインフラにもたらす変化 ~プログラマブルなクラウド型Wi-Fi~
【C-2・醍醐様】AIとAPIがITインフラにもたらす変化 ~プログラマブルなクラウド型Wi-Fi~Developers Summit
 
【B-4】オープンソース開発で、フリー静的解析ツールを使ってみる
【B-4】オープンソース開発で、フリー静的解析ツールを使ってみる【B-4】オープンソース開発で、フリー静的解析ツールを使ってみる
【B-4】オープンソース開発で、フリー静的解析ツールを使ってみるDevelopers Summit
 
【B-6】Androidスマホの生体認証の脆弱性、調べてみたらよくある話だった。
【B-6】Androidスマホの生体認証の脆弱性、調べてみたらよくある話だった。【B-6】Androidスマホの生体認証の脆弱性、調べてみたらよくある話だった。
【B-6】Androidスマホの生体認証の脆弱性、調べてみたらよくある話だった。Developers Summit
 
【13-B-6】Hondaの生産技術屋さんがソフトウェア開発でアジャイルを初導入し組織変革に挑戦
【13-B-6】Hondaの生産技術屋さんがソフトウェア開発でアジャイルを初導入し組織変革に挑戦【13-B-6】Hondaの生産技術屋さんがソフトウェア開発でアジャイルを初導入し組織変革に挑戦
【13-B-6】Hondaの生産技術屋さんがソフトウェア開発でアジャイルを初導入し組織変革に挑戦Developers Summit
 
【15-E-7】セキュアな環境でDevOpsを実現する厳選ツール
【15-E-7】セキュアな環境でDevOpsを実現する厳選ツール【15-E-7】セキュアな環境でDevOpsを実現する厳選ツール
【15-E-7】セキュアな環境でDevOpsを実現する厳選ツールDevelopers Summit
 
【15-E-7】セキュアな環境でDevOpsを実現する厳選ツール
【15-E-7】セキュアな環境でDevOpsを実現する厳選ツール【15-E-7】セキュアな環境でDevOpsを実現する厳選ツール
【15-E-7】セキュアな環境でDevOpsを実現する厳選ツールDevelopers Summit
 
【14-E-3】セキュリティ・テストの自動化によるDevSecOpsの実現 (デモ有)
【14-E-3】セキュリティ・テストの自動化によるDevSecOpsの実現 (デモ有)【14-E-3】セキュリティ・テストの自動化によるDevSecOpsの実現 (デモ有)
【14-E-3】セキュリティ・テストの自動化によるDevSecOpsの実現 (デモ有)Developers Summit
 
【15-D-2】デンソーのMaaS開発~アジャイル開発で顧客との協調・チームビルディング・実装概要~
【15-D-2】デンソーのMaaS開発~アジャイル開発で顧客との協調・チームビルディング・実装概要~【15-D-2】デンソーのMaaS開発~アジャイル開発で顧客との協調・チームビルディング・実装概要~
【15-D-2】デンソーのMaaS開発~アジャイル開発で顧客との協調・チームビルディング・実装概要~Developers Summit
 
【14-C-8】みんなの暮らしを支えるAmazon S3の裏側、お伝えします
【14-C-8】みんなの暮らしを支えるAmazon S3の裏側、お伝えします【14-C-8】みんなの暮らしを支えるAmazon S3の裏側、お伝えします
【14-C-8】みんなの暮らしを支えるAmazon S3の裏側、お伝えしますDevelopers Summit
 
【14-C-7】コンピュータビジョンを支える深層学習技術の新潮流
【14-C-7】コンピュータビジョンを支える深層学習技術の新潮流【14-C-7】コンピュータビジョンを支える深層学習技術の新潮流
【14-C-7】コンピュータビジョンを支える深層学習技術の新潮流Developers Summit
 
【15-B-7】無意味なアラートからの脱却 ~ Datadogを使ってモダンなモニタリングを始めよう ~
【15-B-7】無意味なアラートからの脱却 ~ Datadogを使ってモダンなモニタリングを始めよう ~【15-B-7】無意味なアラートからの脱却 ~ Datadogを使ってモダンなモニタリングを始めよう ~
【15-B-7】無意味なアラートからの脱却 ~ Datadogを使ってモダンなモニタリングを始めよう ~Developers Summit
 
【15-A-1】ドラゴンクエストXを支える失敗事例
【15-A-1】ドラゴンクエストXを支える失敗事例【15-A-1】ドラゴンクエストXを支える失敗事例
【15-A-1】ドラゴンクエストXを支える失敗事例Developers Summit
 
【15-A-5】ゲーミフィケーションエバンジェリストが説く、アプリ開発で見落としがちな「おもてなし」とは~面白さを伝える × 面白く魅せる~
【15-A-5】ゲーミフィケーションエバンジェリストが説く、アプリ開発で見落としがちな「おもてなし」とは~面白さを伝える × 面白く魅せる~【15-A-5】ゲーミフィケーションエバンジェリストが説く、アプリ開発で見落としがちな「おもてなし」とは~面白さを伝える × 面白く魅せる~
【15-A-5】ゲーミフィケーションエバンジェリストが説く、アプリ開発で見落としがちな「おもてなし」とは~面白さを伝える × 面白く魅せる~Developers Summit
 
【B-2】福岡発Node.jsで支える大規模システム!〜「誰ガ為のアルケミスト」と歩んだ三年〜
【B-2】福岡発Node.jsで支える大規模システム!〜「誰ガ為のアルケミスト」と歩んだ三年〜【B-2】福岡発Node.jsで支える大規模システム!〜「誰ガ為のアルケミスト」と歩んだ三年〜
【B-2】福岡発Node.jsで支える大規模システム!〜「誰ガ為のアルケミスト」と歩んだ三年〜Developers Summit
 
【B-5】モダンな開発を実現するツールチェーンのご紹介
【B-5】モダンな開発を実現するツールチェーンのご紹介【B-5】モダンな開発を実現するツールチェーンのご紹介
【B-5】モダンな開発を実現するツールチェーンのご紹介Developers Summit
 
【C-2】メモリも、僕のキャパシティも溢れっぱなし。。2年目エンジニアが実現した機械学習
【C-2】メモリも、僕のキャパシティも溢れっぱなし。。2年目エンジニアが実現した機械学習【C-2】メモリも、僕のキャパシティも溢れっぱなし。。2年目エンジニアが実現した機械学習
【C-2】メモリも、僕のキャパシティも溢れっぱなし。。2年目エンジニアが実現した機械学習Developers Summit
 
【A-2】とあるマーケティング部隊とデータエンジニアのデータドリブンへの道
【A-2】とあるマーケティング部隊とデータエンジニアのデータドリブンへの道【A-2】とあるマーケティング部隊とデータエンジニアのデータドリブンへの道
【A-2】とあるマーケティング部隊とデータエンジニアのデータドリブンへの道Developers Summit
 
【B-2】AI時代におけるエンジニアの生存戦略
【B-2】AI時代におけるエンジニアの生存戦略【B-2】AI時代におけるエンジニアの生存戦略
【B-2】AI時代におけるエンジニアの生存戦略Developers Summit
 

More from Developers Summit (20)

【18-A-2】ゲーミフィケーション・エバンジェリストが見る「あなたの技術力が“ワクワクするサービス”に変わる未来」
【18-A-2】ゲーミフィケーション・エバンジェリストが見る「あなたの技術力が“ワクワクするサービス”に変わる未来」【18-A-2】ゲーミフィケーション・エバンジェリストが見る「あなたの技術力が“ワクワクするサービス”に変わる未来」
【18-A-2】ゲーミフィケーション・エバンジェリストが見る「あなたの技術力が“ワクワクするサービス”に変わる未来」
 
【C-2・小林様】AIとAPIがITインフラにもたらす変化 ~プログラマブルなクラウド型Wi-Fi~
【C-2・小林様】AIとAPIがITインフラにもたらす変化 ~プログラマブルなクラウド型Wi-Fi~【C-2・小林様】AIとAPIがITインフラにもたらす変化 ~プログラマブルなクラウド型Wi-Fi~
【C-2・小林様】AIとAPIがITインフラにもたらす変化 ~プログラマブルなクラウド型Wi-Fi~
 
【C-2・醍醐様】AIとAPIがITインフラにもたらす変化 ~プログラマブルなクラウド型Wi-Fi~
【C-2・醍醐様】AIとAPIがITインフラにもたらす変化 ~プログラマブルなクラウド型Wi-Fi~【C-2・醍醐様】AIとAPIがITインフラにもたらす変化 ~プログラマブルなクラウド型Wi-Fi~
【C-2・醍醐様】AIとAPIがITインフラにもたらす変化 ~プログラマブルなクラウド型Wi-Fi~
 
【B-4】オープンソース開発で、フリー静的解析ツールを使ってみる
【B-4】オープンソース開発で、フリー静的解析ツールを使ってみる【B-4】オープンソース開発で、フリー静的解析ツールを使ってみる
【B-4】オープンソース開発で、フリー静的解析ツールを使ってみる
 
【B-6】Androidスマホの生体認証の脆弱性、調べてみたらよくある話だった。
【B-6】Androidスマホの生体認証の脆弱性、調べてみたらよくある話だった。【B-6】Androidスマホの生体認証の脆弱性、調べてみたらよくある話だった。
【B-6】Androidスマホの生体認証の脆弱性、調べてみたらよくある話だった。
 
【13-B-6】Hondaの生産技術屋さんがソフトウェア開発でアジャイルを初導入し組織変革に挑戦
【13-B-6】Hondaの生産技術屋さんがソフトウェア開発でアジャイルを初導入し組織変革に挑戦【13-B-6】Hondaの生産技術屋さんがソフトウェア開発でアジャイルを初導入し組織変革に挑戦
【13-B-6】Hondaの生産技術屋さんがソフトウェア開発でアジャイルを初導入し組織変革に挑戦
 
【15-E-7】セキュアな環境でDevOpsを実現する厳選ツール
【15-E-7】セキュアな環境でDevOpsを実現する厳選ツール【15-E-7】セキュアな環境でDevOpsを実現する厳選ツール
【15-E-7】セキュアな環境でDevOpsを実現する厳選ツール
 
【15-E-7】セキュアな環境でDevOpsを実現する厳選ツール
【15-E-7】セキュアな環境でDevOpsを実現する厳選ツール【15-E-7】セキュアな環境でDevOpsを実現する厳選ツール
【15-E-7】セキュアな環境でDevOpsを実現する厳選ツール
 
【14-E-3】セキュリティ・テストの自動化によるDevSecOpsの実現 (デモ有)
【14-E-3】セキュリティ・テストの自動化によるDevSecOpsの実現 (デモ有)【14-E-3】セキュリティ・テストの自動化によるDevSecOpsの実現 (デモ有)
【14-E-3】セキュリティ・テストの自動化によるDevSecOpsの実現 (デモ有)
 
【15-D-2】デンソーのMaaS開発~アジャイル開発で顧客との協調・チームビルディング・実装概要~
【15-D-2】デンソーのMaaS開発~アジャイル開発で顧客との協調・チームビルディング・実装概要~【15-D-2】デンソーのMaaS開発~アジャイル開発で顧客との協調・チームビルディング・実装概要~
【15-D-2】デンソーのMaaS開発~アジャイル開発で顧客との協調・チームビルディング・実装概要~
 
【14-C-8】みんなの暮らしを支えるAmazon S3の裏側、お伝えします
【14-C-8】みんなの暮らしを支えるAmazon S3の裏側、お伝えします【14-C-8】みんなの暮らしを支えるAmazon S3の裏側、お伝えします
【14-C-8】みんなの暮らしを支えるAmazon S3の裏側、お伝えします
 
【14-C-7】コンピュータビジョンを支える深層学習技術の新潮流
【14-C-7】コンピュータビジョンを支える深層学習技術の新潮流【14-C-7】コンピュータビジョンを支える深層学習技術の新潮流
【14-C-7】コンピュータビジョンを支える深層学習技術の新潮流
 
【15-B-7】無意味なアラートからの脱却 ~ Datadogを使ってモダンなモニタリングを始めよう ~
【15-B-7】無意味なアラートからの脱却 ~ Datadogを使ってモダンなモニタリングを始めよう ~【15-B-7】無意味なアラートからの脱却 ~ Datadogを使ってモダンなモニタリングを始めよう ~
【15-B-7】無意味なアラートからの脱却 ~ Datadogを使ってモダンなモニタリングを始めよう ~
 
【15-A-1】ドラゴンクエストXを支える失敗事例
【15-A-1】ドラゴンクエストXを支える失敗事例【15-A-1】ドラゴンクエストXを支える失敗事例
【15-A-1】ドラゴンクエストXを支える失敗事例
 
【15-A-5】ゲーミフィケーションエバンジェリストが説く、アプリ開発で見落としがちな「おもてなし」とは~面白さを伝える × 面白く魅せる~
【15-A-5】ゲーミフィケーションエバンジェリストが説く、アプリ開発で見落としがちな「おもてなし」とは~面白さを伝える × 面白く魅せる~【15-A-5】ゲーミフィケーションエバンジェリストが説く、アプリ開発で見落としがちな「おもてなし」とは~面白さを伝える × 面白く魅せる~
【15-A-5】ゲーミフィケーションエバンジェリストが説く、アプリ開発で見落としがちな「おもてなし」とは~面白さを伝える × 面白く魅せる~
 
【B-2】福岡発Node.jsで支える大規模システム!〜「誰ガ為のアルケミスト」と歩んだ三年〜
【B-2】福岡発Node.jsで支える大規模システム!〜「誰ガ為のアルケミスト」と歩んだ三年〜【B-2】福岡発Node.jsで支える大規模システム!〜「誰ガ為のアルケミスト」と歩んだ三年〜
【B-2】福岡発Node.jsで支える大規模システム!〜「誰ガ為のアルケミスト」と歩んだ三年〜
 
【B-5】モダンな開発を実現するツールチェーンのご紹介
【B-5】モダンな開発を実現するツールチェーンのご紹介【B-5】モダンな開発を実現するツールチェーンのご紹介
【B-5】モダンな開発を実現するツールチェーンのご紹介
 
【C-2】メモリも、僕のキャパシティも溢れっぱなし。。2年目エンジニアが実現した機械学習
【C-2】メモリも、僕のキャパシティも溢れっぱなし。。2年目エンジニアが実現した機械学習【C-2】メモリも、僕のキャパシティも溢れっぱなし。。2年目エンジニアが実現した機械学習
【C-2】メモリも、僕のキャパシティも溢れっぱなし。。2年目エンジニアが実現した機械学習
 
【A-2】とあるマーケティング部隊とデータエンジニアのデータドリブンへの道
【A-2】とあるマーケティング部隊とデータエンジニアのデータドリブンへの道【A-2】とあるマーケティング部隊とデータエンジニアのデータドリブンへの道
【A-2】とあるマーケティング部隊とデータエンジニアのデータドリブンへの道
 
【B-2】AI時代におけるエンジニアの生存戦略
【B-2】AI時代におけるエンジニアの生存戦略【B-2】AI時代におけるエンジニアの生存戦略
【B-2】AI時代におけるエンジニアの生存戦略
 

Recently uploaded

[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略Ryo Sasaki
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A surveyToru Tamaki
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Yuma Ohgami
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)Hiroki Ichikura
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものですiPride Co., Ltd.
 
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By DanielPostman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Danieldanielhu54
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNetToru Tamaki
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdftaisei2219
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...Toru Tamaki
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムsugiuralab
 

Recently uploaded (10)

[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
 
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By DanielPostman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Daniel
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
 

夏サミ2013 Hadoopを使わない独自の分散処理環境の構築とその運用

  • 1. Summit Developers Developers Summit 2013 Summer Hadoopを使わない独自の分散 処理環境の構築とその運用 前橋孝広 株式会社インターネットイニシアティブ プラットフォームサービス部 プラットフォーム開発課 A3 #natsumiA3
  • 2. Summit Developers Developers Summit 2013 Summer 自己紹介 名前:  前橋孝広   所属:  株式会社インターネットイニシアティブ(IIJ)  
  • 3. Summit Developers Developers Summit 2013 Summer 本日の話 分散システム開発の動機 開発したものの機能と仕組みについて システムの構築と運用
  • 4. Summit Developers Developers Summit 2013 Summer 分散システム開発の動機 ISPにおいて、サービスの状態把握は必須   そのために大量のログデータを扱う必要がある   http://www.flickr.com/photos/ctbto/8443792513/
  • 5. Summit Developers Developers Summit 2013 Summer ISPにおける大規模データ •  ほぼすべて時系列データ   •  分析したい項目や抽出条件は多岐にわたる 例:  トラフィックデータ フィルタリングログ 時系列Webアクセス数 Webアクセス数割合
  • 6. Summit Developers Developers Summit 2013 Summer 例:  トラフィック情報(NetFlow)のデータ I I J の バ ッ ク ボ ー ン を 流 れ る ト ラ フ ィ ッ ク の 情 報 は 膨 大 な 量 と な る !me router bytes pkts proto src  AS dst  AS src  port dst  port src  ip dst  ip … 1388253400 172.16.100.1 1433 1 6 2497 9999 80 4321 192.168.0.1 192.168.9.8 1388253400 172.16.0.10 987 1 6 1234 1000 25 2224 10.168.20.1 10.168.20.1 1388253400 172.16.100.2 555 1 6 9999 2497 2345 80 192.168.0.7 10.18.80.1 1388253400 10.16.10.1 12 1 1 1111 2222 22 22345 10.168.1.1 10.168.30.1 1388253400 172.16.0.1 1490 2 17 2222 1234 22345 24 172.16.9.7 10.68.20.1 1388253401 172.16.1.10 1309 1 6 3333 5555 8080 8765 192.168.0.1 172.16.9.79 1388253401 192.168.10.1 538 1 6 1111 2497 5787 80 10.218.0.1 192.168.9.1 1388253401 172.16.99.8 333 1 1 9999 1000 70 15588 10.68.0.1 172.16.9.72 1388253401 10.16.98.7 981 1 17 4444 2222 80 11557 192.168.0.1 172.16.90.3 1388253401 172.16.10.1 1433 1 6 1234 4321 7078 12345 172.16.0.1 172.16.4.71 … 約30項目 数億   /day
  • 7. Summit Developers Developers Summit 2013 Summer 巨大なログデータの処理といえば
  • 8. Summit Developers Developers Summit 2013 Summer MapReduce  とは? mapとreduceの2段階にわけてデータ処理   ①  map  –  抽出・変換   ②  reduce  –  集約・集計
  • 9. Summit Developers Developers Summit 2013 Summer Hadoop相当のものを自作 IIJ社内専用   非公開 オープンソース
  • 10. Summit Developers Developers Summit 2013 Summer Hadoopを使わず自作した理由 •  Hadoopはバッチ処理に特化している   •  自社開発でノウハウをためるため   •  用途を特化して作ればより効率のよいものが 作れる   •  やってみたかったから  
  • 11. Summit Developers Developers Summit 2013 Summer 分散処理の原理は難しくない 分散処理 従来型処理 データはあらかじめ   各ノードに分散配置 各ノードで並列実行
  • 12. Summit Developers Developers Summit 2013 Summer Hadoopはバッチシステム
  • 13. Summit Developers Developers Summit 2013 Summer Hadoopが向いている処理 •  24秒の遅延が気にならないような巨大なバッ チ処理   •  やることが決まっている定型処理
  • 14. Summit Developers Developers Summit 2013 Summer やりたいこと •  サービス運用者は、試行錯誤により、より深い データ分析を行う     •  分析に必要なパラメータは多様であり、事前に 網羅することは困難 → 定型でない   データを生のまま保存し、   オンデマンドで抽出・   集計を行う必要がある  
  • 15. Summit Developers Developers Summit 2013 Summer 開発したものの機能と仕組み
  • 16. Summit Developers Developers Summit 2013 Summer 開発したもの(1)  ddd 大量の時系列データ(例:  NetFlow生データ)を蓄積し   要求に応じて短時間で検索・集約結果を返す  
  • 17. Summit Developers Developers Summit 2013 Summer ユーザインタフェース クエリパラメータ入力 グラフ化   アドホッククエリ(定型的でない、 一回限りの問い合わせ)が大半
  • 18. Summit Developers Developers Summit 2013 Summer dddの特徴 •  時系列データに最適化した分散ファイルシス テム→  対象データの格納位置を瞬時に特定   •  自動レプリケーションによるデータ冗長化   •  楽観的タスクスケジューリング   – 応答待ち時間の短いMapReduce   詳しくは… 電子情報通信学会論文 Vol.J93-D,No.7,pp.1072-1081,Jul. 2010., 「大規模データ処理のための分散システムの実装とその応用」
  • 19. Summit Developers Developers Summit 2013 Summer MapReduceによるグラフ生成 map:  複数ノードで並列に抽出・集計処理 reduce:  結合 要求があってから生データに対して分散処理を開始してグラフ化
  • 20. Summit Developers Developers Summit 2013 Summer 応答速度 •  極めて小さいデータを、何もせずに素通しする のにかかる時間 Hadoop ddd 19秒 0.12秒
  • 21. Summit Developers Developers Summit 2013 Summer 2000タスクの処理時間グラフ •  台数が増えると処理時間が減少
  • 22. Summit Developers Developers Summit 2013 Summer 2000タスクの処理時間グラフ(対数) •  台数が増えると、多少オーバーヘッドは出てくる
  • 23. Summit Developers Developers Summit 2013 Summer 開発したもの(2)  pmux •  pipeline  mulPplexer  に由来   •  オープンソースとして公開   •  GitHub   – hSps://github.com/iij/pmux   – hSps://github.com/iij/pmux/wiki   •  Gluster  Forge   – hSps://forge.gluster.org/pmux  
  • 24. Summit Developers Developers Summit 2013 Summer pmuxとは? •  標準入出力を介して MapReduce するための コマンドラインツール(Hadoop Streaming相当) $ pmux --mapper="grep PATTERN" *.log 例:  分散grep 分散ファイルシステム   上にあるファイル群
  • 25. Summit Developers Developers Summit 2013 Summer GlusterFSとは? FUSEでマウントして   普通のファイルシステム   として見える
  • 26. Summit Developers Developers Summit 2013 Summer ファイル名に応じて分散 clientからは、ひとつの   ファイルシステムとして見える
  • 27. Summit Developers Developers Summit 2013 Summer ちょっと宣伝 •  IT検証ラボ  -­‐-­‐  分散ファイルシステムの GlusterFS:こんなとき、どうなる – hSp://itpro.nikkeibp.co.jp/arPcle/COLUMN/ 20130104/447701/
  • 28. Summit Developers Developers Summit 2013 Summer pmuxの分散処理の原理 •  例えば次のようなコマンド   •  *.log が複数ノードに分散して配置されてい れば、各ノードで並列に処理できる   $ grep PATTERN *.log
  • 29. Summit Developers Developers Summit 2013 Summer ファイルがあるノードで処理を実行
  • 30. Summit Developers Developers Summit 2013 Summer 結果を集める
  • 31. Summit Developers Developers Summit 2013 Summer 実際はもう少し複雑
  • 32. Summit Developers Developers Summit 2013 Summer 使用例:  ステータスコード集計 Apache  ログから特定パターンの行だけ抜き出し、   そのステータスコードを集計 $ pmux --mapper='grep PAT |cut -d" " -f 9’ --reducer='sort|uniq -c’ /mnt/glusterfs/*.log 176331 200 106360 206 809 400 21852 403 533 404 27 406 805 416 25 500
  • 33. Summit Developers Developers Summit 2013 Summer 使用例:  word  count $ pmux --mapper=map.rb --reducer=reduce.rb --file=map.rb –-file=reduce.rb /mnt/glusterfs/*.txt #! /usr/bin/ruby -an $F.each {|f| print "#{f}t1n"} #! /usr/bin/ruby -an BEGIN {$c = Hash.new 0} $c[$F[0]] += $F[1].to_i END {$c.each {|k, v| print "#{k} #{v}n"}} map.rb reduce.rb コマンドライン
  • 34. Summit Developers Developers Summit 2013 Summer デバッグとテスト •  多数のノードを前提とした分散システムのデ バッグは超大変   •  ネットワークをモック化   – 複数ノード環境をシミュレーション   •  テストへの組み込み   – 継続的インテグレーション(CI)ツールによって自動 実行
  • 35. Summit Developers Developers Summit 2013 Summer 実環境でしかわからないこと •  実環境でしか再現できないトラブルもある   •  ノード間通信の集中に起因   – コネクション数限界   •  net.core.somaxconn   – パケットの消失   •  スイッチのバッファの限界を超える?      ノード間の通信をキューを使って制御  
  • 36. Summit Developers Developers Summit 2013 Summer 自作した甲斐はあったのか •  答えは、もちろん「YES」   •  サービスや社内システムのバックエンドで活用 中 (定型、非定型処理両方)   •  分散処理のボトルネックやトラブルシュートに 関するノウハウの蓄積ができた   •  ビッグデータに関する新サービスへの応用予 定  
  • 38. Summit Developers Developers Summit 2013 Summer 分散処理プラットフォーム dplat •  IIJ社内に対し、分散システムの基盤を提供   •  社内向けPaaSのようなもの   – ddd,  GlusterFS,  pmux  などが使用可能   •  サービスごとにクラスタを分けて運用    
  • 39. Summit Developers Developers Summit 2013 Summer サービスのバックエンドとして利用 データ アウトプット データ アウトプット dplat トラフィック解析システム バックエンド セキュリティレポートサービス
  • 40. Summit Developers Developers Summit 2013 Summer ノードの設置場所 東京 大阪 松江 広域分散により データの喪失を防ぐ
  • 41. Summit Developers Developers Summit 2013 Summer 松江データセンターパーク IT  module air-­‐condiPoning  unit
  • 42. Summit Developers Developers Summit 2013 Summer ITモジュールの中身 •  IZmo  S(スリム): ラックを傾斜配置 – 他に IZmo  W(ワイド)もあり
  • 43. Summit Developers Developers Summit 2013 Summer 運用の基本思想 •  楽をする   – いろいろ自動化   •  機材は壊れることを前提   – 適切な冗長化で壊れても良いようにする   •  障害が起きても基本は放置  →  あとで修理   •  監視とモニタリングは、しっかりやる  
  • 44. Summit Developers Developers Summit 2013 Summer サーバについて(1) •  サーバはネットワークブート   – OSなどのシステムはメモリファイルシステム   – 再起動すると設定はすべて消える   – →  設定情報の外部化/バージョン管理   •  起動後に  Chef  で必要な物がインストール   •  サーバ仮想化技術は使っていない  
  • 45. Summit Developers Developers Summit 2013 Summer サーバについて(2) •  HDDは搭載しているが、データ格納用途のみ   – RAIDによる冗長化はしていない   •  dddやGlusterFSのレベルで冗長化   – 故障時はノードごと切り離されるがデータは消失 しない   •  故障はそれなりに起こる   – ハードディスク、NIC、メモリ、電源、etc  
  • 46. Summit Developers Developers Summit 2013 Summer 監視 •  死活監視、ポート監視   •  ディスク残量監視   •  分散ファイルシステムの読み書き監視   •  MapReduceジョブの実行時間監視  
  • 47. Summit Developers Developers Summit 2013 Summer モニタリング •  ファシリティレベル   – 温度、消費電力  etc   •  各種リソース   – ディスク、メモリ使用量  etc   •  アプリケーションレベル   – 各APIコール数   – タスク実行状況詳細  etc
  • 48. Summit Developers Developers Summit 2013 Summer まとめ •  ISPは、サービス状態の把握のため巨大なログ データを扱う必要がある   •  分散処理システムを独自に開発   – 定型でない処理に対応   •  運用   – 今どきの普通のやり方   – モニタリング重視