SlideShare a Scribd company logo
1 of 62
Download to read offline
1	©	Cloudera,	Inc.	All	rights	reserved.	
Apache	Kudu	構成とテーブル設計	
矢野 智聡	/	Cloudera株式会社	
2016/11/08
2	©	Cloudera,	Inc.	All	rights	reserved.	
自己紹介	
• 矢野 智聡(やの ともあき)	
• Customer Operations Engineer(テクニカルサポート)	
• お客様がクラスタを運用する上での懸念や問題の解消を支援
©	Cloudera,	Inc.	All	rights	reserved.	
アジェンダ	
• What’s Apache Kudu?	
• ユースケース	
• 構成要素と動作	
• テーブルとパーティションの設計	
• Kuduの関連情報
4	©	Cloudera,	Inc.	All	rights	reserved.	
What’s	Apache	Kudu?	
4
5	©	Cloudera,	Inc.	All	rights	reserved.	
Apache	Kudu	
Storage	for	Fast	AnalyHcs	on	Fast	Data	
• 更新可能なカラムナ	
ストレージ	
	
• Apache	FoundaHonの	
オープンソースプロジェクト	
	
• Cloudera Managerで	
管理可能(ベータ版)	
Columnar Store
Kudu
6	©	Cloudera,	Inc.	All	rights	reserved.	
HDFS with Parquet:
•  入力はバッチ処理に特化
•  分析時などの大規模データの	
スキャンが高速
HBase :
•  個別のデータの入出力が高速	
•  データのアップデートが可能
更新可能なデータを高速に分析す
る基盤の不在
Hadoop	エコシステムのストレージ関係図
7	©	Cloudera,	Inc.	All	rights	reserved.	
スケーラブルで高速なテーブル指向のストレージ	
• Scalable	
•  デザインとしては	数千ノード,	数十PBまでの拡張が可能	
• Fast	
•  クラスタ上で百万単位のI/O処理が可能	
•  ノードあたり秒間数GB程度の読み込み性能	
• Tabular	
•  SQL-like	schema:	有限の型のある列(数十程度)の表(HBaseとは異なる)	
•  SQL	(Impala/Spark/etc)	と “NoSQL” APIs: Java/C++/Python でのアクセス	
•  ALTER TABLEによる高速なメタデータの変更
©	Cloudera,	Inc.	All	rights	reserved.	©	Cloudera,	Inc.	All	rights	reserved.	
他のエコシステムとのインテグレーション	
Kudu	は計算処理のためのフレームワークと協調して動作します	
	
•  インテグレーションのあるエコシステム	
•  Impala	
•  Spark	
•  MapReduce	
•  Flume	
•  Drill
9	©	Cloudera,	Inc.	All	rights	reserved.	
ユースケース
10	©	Cloudera,	Inc.	All	rights	reserved.	
Kuduのユースケース	
Kudu	はシーケンシャルな読み込みとランダムな読み込み、書き込み	
処理が同時に発生するような状況に適している	
● 時系列データ	
○ 例:	センサーデータ、連続的な市場データ、、	
ネットワークモニタリング、不正検知/抑止など	
○ 想定ワークロード:	Insert,	updates,	scans,	lookups	
	
● オンラインレポーティング	
○ 例:	OperaHonal	Data	Store	
○ 想定ワークロード:	Inserts,	updates,	scans,	lookups
11	©	Cloudera,	Inc.	All	rights	reserved.	
Hadoop上でのストリーミングデータ分析の現状

不正検知システムでのストレージの複雑性	
考慮点:
●  Parquetへの変換処理の頻度
●  レポート作成時の変換処理の完
了していないデータの扱い
●  メンテナンスに対する可用性
新しいパーティション
最近のパーティション
過去のパーティション
HBase
Parquet
File
データの蓄積
を待機して
HBaseデータ
のParquetへの
変換
•  現在実行中の処理の待機
•  新しいParquetファイルを参照する
Impalaのパーティションの作成
入力データ
(Messaging)
Reporting
Impala on HDFS
12	©	Cloudera,	Inc.	All	rights	reserved.	
Hadoop上でのストリーミングデータ分析とKudu	
改善点:
●  単一システムでの処理	
●  Cronなどでのバックグラウンド処
理が不要	
●  新しいデータが即時分析処理に
使用可能
過去のデータと	
新しいデータ
入力データ
(Messaging)
Reporting
Request
Storage in Kudu
13	©	Cloudera,	Inc.	All	rights	reserved.	
Xiaomiのユースケース	
•  世界4位のスマートフォンメーカー	
•  モバイルアプリケーションとバックグラウンドサービスのイベント情報の収集	
•  サービスの監視とトラブルシューティング	
◆  高い書き込み要求	
•  >200億	records/day からさらに増大する流量	
◆  最新のデータに対するクエリ要件と応答速度	
•  問題の特定と速やかな解決	
◆  トラブルシューティングを容易にするための各行検索
14	©	Cloudera,	Inc.	All	rights	reserved.	
Xiaomiのビッグデータ解析パイプライン
Kudu 導入前
•  処理の長時間化
データ変換における高レイテンシ(1 時間 ~ 1 日)
•  時系列でないデータ
ログの到着順は生成順とは異なることがある
例: 一日分のログのために2,3日分のログを処理する必要
がある
15	©	Cloudera,	Inc.	All	rights	reserved.	
Xiaomiのビッグデータ解析パイプライン	
Kudu導入後
•  ETL 高速化(0~10s のレイテンシ)
アプリのためにデータの変換が必要な処理も高速化
•  Kuduへの直接格納(no latency)
格納後即時処理可能
OLAP scan
Side table
lookup
Result store
©	Cloudera,	Inc.	All	rights	reserved.	 16
構成要素と動作
17	©	Cloudera,	Inc.	All	rights	reserved.	
テーブル	
•  テーブルは複数のカラムから構成される	
•  カラムは下記のいずれかの型を取る必要がある	
•  BOOL,	INT8,	INT16,	INT32,	INT64,	UNIXTIME_MICROS,	FLOAT,	DOUBLE,	
STRING,	BINARYカラムはNull値を取りうる	
•  カラムはbitshuffleなどでエンコーディングおよび圧縮が可能	
•  圧縮形式はlz4, snappy, gzipが使用可能	
•  エンコーディングおよび圧縮は適用できない組み合わせがあるので注意
18	©	Cloudera,	Inc.	All	rights	reserved.	
プライマリキー	
•  全ての表でプライマリキーは必須	
•  プライマリキーは一つ以上の列の組み合わせ	
•  プライマリキーの値はユニークである必要がある	
•  プライマリキーには下記は使用できない	
•  Boolean	または浮動小数点型	
•  Nullが含まれる列	
•  プライマリキーの値は更新できない	
•  プライマリキーのカラムは表のはじめの列に定義する
©	Cloudera,	Inc.	All	rights	reserved.	 19
タブレット/タブレットサーバ	
• タブレットは表をパーティションで分割したもの	
• 各タブレットはタブレットサーバによって管理される	
• タブレットの分割にはプライマリキーの値を使用する	
• 各列のハッシュ、レンジおよびその組み合わせを分割に使用可能	
• タブレット毎にRad	consensusによるN個のレプリカを持つ(default=3)	
• レプリカのタブレットサーバは一つのリーダーと複数のフォロワーからなる	
• 書き込みはリーダーに対してリクエストされる	
• 各タブレットサーバのデータはローカルディスクにあり、他のレプリカとは独立し
ている
©	Cloudera,	Inc.	All	rights	reserved.	
ImpalaでのCreate tableの例 	
BIGINTのハッシュとSTRINGのRANGE
によるパーティショニング	
Kuduの表とのマッピング
©	Cloudera,	Inc.	All	rights	reserved.	 21
Metadata/Master	Server	
• MetadataはMaster	Serverに管理される	
•  表の構成情報	
•  タブレットの構成情報	
•  タブレットサーバの死活監視やレプリケーション管理	
• メタデータはメモリ上にキャッシュされる	
• クライアントはマスターにアクセスし、アクセスするタブレットの情報を得る
©	Cloudera,	Inc.	All	rights	reserved.	 22
Client
‘tlipcon’ は table “T”に存在するか?
Tablet2(Tablet ServerはX,Y,Z)にある	
そのうちリーダーはZ…
UPDATE tlipcon
SET col=foo
where id=‘tlipcon’
Updateの動作例
©	Cloudera,	Inc.	All	rights	reserved.	 23	
TS	A	
	
	
	
Tablet	1	
(LEADER)	
Client	
TS	B	
	
	
	
Tablet	1	
(FOLLOWER)	
TS	C	
	
	
	
Tablet	1	
(FOLLOWER)	
WAL	
WAL	WAL	
1a.	Client->Leader:	Write()	RPC	
Rad	Consensus
©	Cloudera,	Inc.	All	rights	reserved.	 24	
TS	A	
	
	
	
Tablet	1	
(LEADER)	
Client	
TS	B	
	
	
	
Tablet	1	
(FOLLOWER)	
TS	C	
	
	
	
Tablet	1	
(FOLLOWER)	
WAL	
WAL	WAL	
Rad	Consensus	
TS	A	
	
	
	
Tablet	1	
(LEADER)	
Client	
TS	B	
	
	
	
Tablet	1	
(FOLLOWER)	
TS	C	
	
	
	
Tablet	1	
(FOLLOWER)	
WAL	
WAL	WAL	
2a.	Leader	writes	local	WAL	
2b.	Leader->Followers:	
UpdateConsensus()	RPC
©	Cloudera,	Inc.	All	rights	reserved.	 25	
Rad	Consensus	
TS	A	
	
	
	
Tablet	1	
(LEADER)	
Client	
TS	B	
	
	
	
Tablet	1	
(FOLLOWER)	
TS	C	
	
	
	
Tablet	1	
(FOLLOWER)	
WAL	
WAL	WAL	
TS	A	
	
	
	
Tablet	1	
(LEADER)	
Client	
TS	B	
	
	
	
Tablet	1	
(FOLLOWER)	
TS	C	
	
	
	
Tablet	1	
(FOLLOWER)	
WAL	
WAL	WAL	
3.	Follower:	write	WAL	 3.	Follower:	write	WAL
©	Cloudera,	Inc.	All	rights	reserved.	 26	
TS	A	
	
	
	
Tablet	1	
(LEADER)	
Client	
TS	B	
	
	
	
Tablet	1	
(FOLLOWER)	
TS	C	
	
	
	
Tablet	1	
(FOLLOWER)	
WAL	
WAL	WAL	
Rad	Consensus	
TS	A	
	
	
	
Tablet	1	
(LEADER)	
Client	
TS	B	
	
	
	
Tablet	1	
(FOLLOWER)	
TS	C	
	
	
	
Tablet	1	
(FOLLOWER)	
WAL	
WAL	WAL	
4.	Follower->Leader:	success
©	Cloudera,	Inc.	All	rights	reserved.	 27	
TS	A	
	
	
	
Tablet	1	
(LEADER)	
Client	
TS	B	
	
	
	
Tablet	1	
(FOLLOWER)	
TS	C	
	
	
	
Tablet	1	
(FOLLOWER)	
WAL	
WAL	WAL	
Rad	Consensus	
TS	A	
	
	
	
Tablet	1	
(LEADER)	
Client	
TS	B	
	
	
	
Tablet	1	
(FOLLOWER)	
TS	C	
	
	
	
Tablet	1	
(FOLLOWER)	
WAL	
WAL	WAL	
5.	Leader	has	achieved	majority
©	Cloudera,	Inc.	All	rights	reserved.	 28	
TS	A	
	
	
	
Tablet	1	
(LEADER)	
Client	
TS	B	
	
	
	
Tablet	1	
(FOLLOWER)	
TS	C	
	
	
	
Tablet	1	
(FOLLOWER)	
WAL	
WAL	WAL	
Rad	Consensus	
TS	A	
	
	
	
Tablet	1	
(LEADER)	
Client	
TS	B	
	
	
	
Tablet	1	
(FOLLOWER)	
TS	C	
	
	
	
Tablet	1	
(FOLLOWER)	
WAL	
WAL	WAL	
6.	Leader->Client:	Success!
©	Cloudera,	Inc.	All	rights	reserved.	©	Cloudera,	Inc.	All	rights	reserved.	 29
書き込み	(insert	/	update)	
• Insertはメモリ上のrow storeに格納される	
•  フラッシュ時にParquetに似たカラムナフォーマットのBase Imageとして	
ディスクに格納される	
• Updateはメモリ上のdelta	storeに格納される	
•  フラッシュ時にディスクにdelta	filesとして格納される	
•  コンパクションにより以前に書き出されたBase Imageに適用される
©	Cloudera,	Inc.	All	rights	reserved.	 30	
Kudu	storage	–	Inserts	and	Flushes	
MemRowSet	
name	 pay	 role	
DiskRowSet	1	
name	 pay	 role	
DiskRowSet	2	
INSERT	(“doug”,	“$1B”,	“Hadoop	man”)	
flush
©	Cloudera,	Inc.	All	rights	reserved.	 31
Kudu	storage	-	Updates	
MemRowSet
name pay role
DiskRowSet 1
name pay role
DiskRowSet 2
Delta MS
Delta MS
DiskRowSetはそれぞれ専
用のDeltaMemStoreをもち
updateはこちらで処理する
base data
base data
©	Cloudera,	Inc.	All	rights	reserved.	 32
Kudu	storage	–	Updates	
MemRowSet
name pay role
DiskRowSet 1
name pay role
DiskRowSet 2
Delta MS
Delta MS
UPDATE set pay=“$1M”
WHERE name=“todd”
Bloom says: no!
Bloom says: maybe!
150: col 1=$1M
base data
Bloom Filterを利用し
た絞り込み
©	Cloudera,	Inc.	All	rights	reserved.	 33	
TS	A	
	
	
	
Tablet	1	
(LEADER)	
TS	B	
	
	
	
Tablet	1	
(FOLLOWER)	
TS	C	
	
	
	
Tablet	1	
(FOLLOWER)	
WAL	
WAL	WAL	
耐障害性	
TS	A	
	
	
	
Tablet	1	
(LEADER)	
Client	
TS	B	
	
	
	
Tablet	1	
(FOLLOWER)	
TS	C	
	
	
	
Tablet	1	
(FOLLOWER)	
WAL	
WAL	WAL
©	Cloudera,	Inc.	All	rights	reserved.	 34	
TS	A	
	
	
	
Tablet	1	
(LEADER)	
TS	B	
	
	
	
Tablet	1	
(FOLLOWER)	
WAL	
WAL	
耐障害性	
?	
TS	A	
	
	
	
Tablet	1	
(LEADER)	
Client	
TS	B	
	
	
	
Tablet	1	
(FOLLOWER)	
WAL	
WAL
©	Cloudera,	Inc.	All	rights	reserved.	©	Cloudera,	Inc.	All	rights	reserved.	 35
耐障害性(一時停止)	
• フォロワーの一時的な停止:	
1.  リーダーは依然過半数の取得が可能なのでサービスを継続	
2.  5分以内に起動すれば透過的に再度フォロワーとして加入	
• リーダーの一時的な停止:	
1.  フォロワーは1.5秒毎のリーダーからのハートビートを待機	
2.  3	回ハートビートがなかった場合:	リーダーの再選出	
新しいリーダーは数秒の内に選出される	
3.  停止した元リーダーが5分以内に起動した場合はフォロワーとして加入		
•  N個のレプリカは	(N-1)/2	までのタブレットサーバ停止に対応可
©	Cloudera,	Inc.	All	rights	reserved.	©	Cloudera,	Inc.	All	rights	reserved.	 36
耐障害性(永続停止)	
	
1.  リーダーが5分を閾値に検知	
2.  該当のフォロワーを排除	
3.  マスターが新しいタブレットサーバーを選択	
4.  リーダーが新しいタブレットサーバーにデータをコピー	
5.  新しいタブレットサーバーがフォロワーとして参加
©	Cloudera,	Inc.	All	rights	reserved.	©	Cloudera,	Inc.	All	rights	reserved.	
チューニングガイドライン	
•  タブレットサーバー毎のタブレットの数	
•  HWにもよるが、10-40程度	
•  タブレットのサイズ数百GiB程度	
•  SSDが使える場合はWALを優先的に割り当てる	
•  Diskが多く使えたり、SSDが使える場合はMaintenanceManagerのThread数
を増加させる(MaintenanceManager=Delta RowSetのコンパクションなどを
行うスレッド)	
•  パーティションは分割されないので設計が重要
©	Cloudera,	Inc.	All	rights	reserved.	 38
表とパーティションの設計
©	Cloudera,	Inc.	All	rights	reserved.	 39
時系列データの例	
Series	 Time	 Value	
us-east.appserver01.loadavg.1min	 2016-05-09T15:14:30Z	 0.44	
us-east.appserver01.loadavg.1min	 2016-05-09T15:14:40Z	 0.53	
us-west.dbserver03.rss	 2016-05-09T15:14:30Z	 1572864	
us-west.dbserver03.rss	 2016-05-09T15:15:00Z	 2097152
©	Cloudera,	Inc.	All	rights	reserved.	 40
想定状況	
• データ流入は各ソースの最新のtimestampのもの	
	
• 読み込みは特定のシリーズの広範囲のtimestamp	
SELECT time, value FROM timeseries
WHERE series = "us-west.dbserver03.rss"
AND time >= 2016-05-08T00:00:00;
クエリ例
©	Cloudera,	Inc.	All	rights	reserved.	
時刻のレンジによるパーティション
©	Cloudera,	Inc.	All	rights	reserved.	
時刻のレンジによるパーティション(inserts)	
新しいデータは全て一つのタブレットへ
©	Cloudera,	Inc.	All	rights	reserved.	
時刻のレンジによるパーティション(scans)	
多くのtimestampにまたがるクエリは	
パーティション間で分散される
©	Cloudera,	Inc.	All	rights	reserved.	
ノードのレンジによるパーティション
©	Cloudera,	Inc.	All	rights	reserved.	
ノードのレンジによるパーティション(inserts)	
Insertは複数のパーティションに分散される
©	Cloudera,	Inc.	All	rights	reserved.	
ノードのレンジによるパーティション(scans)	
Scanは特定のパーティションに限定される
©	Cloudera,	Inc.	All	rights	reserved.	
ノードのレンジによるパーティション	
特定のシリーズ(同一サービスのノード群など)で多くのデータが生
成されると流量が偏り、パーティションのサイズが偏る
©	Cloudera,	Inc.	All	rights	reserved.	
ノードのハッシュパーティション
©	Cloudera,	Inc.	All	rights	reserved.	
ノードのハッシュパーティション(inserts)	
Insertは複数のパーティションに分散される	
(Hashによる平均化も期待される)
©	Cloudera,	Inc.	All	rights	reserved.	
ノードのハッシュパーティション(scans)	
Scanは特定のパーティションに限定される
©	Cloudera,	Inc.	All	rights	reserved.	
ノードのハッシュパーティション	
関連するシリーズ(同一サービスのノード群など)のデー
タが分散されるので平均化されやすくなる
©	Cloudera,	Inc.	All	rights	reserved.	
時刻のレンジとノードハッシュ	
時
刻
	
ノードハッシュ
©	Cloudera,	Inc.	All	rights	reserved.	
時刻のレンジとノードハッシュ(inserts)	
Insertは最新のtimestampのパーティション間で分散される
時
刻
	
ノードハッシュ
©	Cloudera,	Inc.	All	rights	reserved.	
多くのtimestampにまたがるクエリは	
パーティション間で分散される	
時
刻
	
時刻のレンジとノードハッシュ(scans)	
ノードハッシュ
©	Cloudera,	Inc.	All	rights	reserved.	
表とパーティション設計の考慮点	
• プライマリキーにする列の検討	
• 複数列とする場合の分割性能	
• パーティションの種類と組み合わせの検討(Range/Hash)	
• データ流入、更新パターンの検討/テスト	
• アクセスパターンの検討/テスト	
• Cloudera Managerで管理していれば処理実行時の負荷をチャートで把握可能
©	Cloudera,	Inc.	All	rights	reserved.	 56
Kuduの関連情報
©	Cloudera,	Inc.	All	rights	reserved.	
インストール情報	
• Kuduのインストール(Cloudera Manager使用)
http://www.cloudera.com/documentation/betas/kudu/latest/topics/
kudu_installation.html	
OSDのダウンロードと設置、Cloudera Manager Server再起動が必要なので	
注意	
	
• Impala-Kuduのインストール(CDH5.8以前)	
http://www.cloudera.com/documentation/betas/kudu/latest/topics/
kudu_impala.html#install_impala	
(CDH5.9以降のImpalaはKuduとのインテグレーションが組み込まれている)
©	Cloudera,	Inc.	All	rights	reserved.	
Kuduのトラブルシューティングと注意事項	
• Apache Kudu Troubleshooting	
http://kudu.apache.org/docs/troubleshooting.html	
トラブルシューティング集、スパースファイルを処理するためのHole Punching
についてはLinux Kernelのバージョンとファイルシステムの要件があるので特
に注意	
Linux: RHEL/CentOS 6.4 + patch or later, Ubuntu 14.04	
FileSystem: XFS/Ext4
©	Cloudera,	Inc.	All	rights	reserved.	
Kuduの情報	
• Apache Kudu project page 	
http://kudu.apache.org/	
ドキュメントをはじめ各コミュニティ(slack, JIRA, mailing listなど)へのアクセス
方法やBlog形式でのWeekly Reportを確認できる	
	
• Cloudera Engineering Blog	
https://blog.cloudera.com/	
今後の方針やパフォーマンステスト、ベストプラクティスなど
©	Cloudera,	Inc.	All	rights	reserved.	
Kuduの詳細情報	
• Kudu Design Docs	
https://github.com/apache/kudu/tree/master/docs/design-docs	
Tabletのコンパクションやバックグラウンドでのメンテナンス処理、	
APIなどのデザインについて情報がまとまっている
©	Cloudera,	Inc.	All	rights	reserved.	
まとめ	
• Apache KuduはHadoopクラスタの新しいカラムナストレージエンジン	
• タブレットサーバーによりデータが管理され、Raft consensus による	
レプリケーション、耐障害性を備えている	
• 使用用途によってはHDFS+ParquetやHBaseの方が適切なことはあるので	
検討と検証が不可欠	
	
• パフォーマンス維持と安定運用のためにはパーティションの設計が重要
©	Cloudera,	Inc.	All	rights	reserved.	
Thank	you!

More Related Content

What's hot

基礎から学ぶ超並列SQLエンジンImpala #cwt2015
基礎から学ぶ超並列SQLエンジンImpala #cwt2015基礎から学ぶ超並列SQLエンジンImpala #cwt2015
基礎から学ぶ超並列SQLエンジンImpala #cwt2015Cloudera Japan
 
#cwt2016 Cloudera Managerを用いた Hadoop のトラブルシューティング
#cwt2016 Cloudera Managerを用いた Hadoop のトラブルシューティング #cwt2016 Cloudera Managerを用いた Hadoop のトラブルシューティング
#cwt2016 Cloudera Managerを用いた Hadoop のトラブルシューティング Cloudera Japan
 
C5.2 (Cloudera Manager + CDH) アップデート #cwt2014
C5.2 (Cloudera Manager + CDH) アップデート #cwt2014C5.2 (Cloudera Manager + CDH) アップデート #cwt2014
C5.2 (Cloudera Manager + CDH) アップデート #cwt2014Cloudera Japan
 
HBase活用事例 #hbase_ca
HBase活用事例 #hbase_caHBase活用事例 #hbase_ca
HBase活用事例 #hbase_caCloudera Japan
 
機械学習の定番プラットフォームSparkの紹介
機械学習の定番プラットフォームSparkの紹介機械学習の定番プラットフォームSparkの紹介
機械学習の定番プラットフォームSparkの紹介Cloudera Japan
 
大規模データに対するデータサイエンスの進め方 #CWT2016
大規模データに対するデータサイエンスの進め方 #CWT2016大規模データに対するデータサイエンスの進め方 #CWT2016
大規模データに対するデータサイエンスの進め方 #CWT2016Cloudera Japan
 
Cloudera Data Science WorkbenchとPySparkで 好きなPythonライブラリを 分散で使う #cadeda
Cloudera Data Science WorkbenchとPySparkで 好きなPythonライブラリを 分散で使う #cadedaCloudera Data Science WorkbenchとPySparkで 好きなPythonライブラリを 分散で使う #cadeda
Cloudera Data Science WorkbenchとPySparkで 好きなPythonライブラリを 分散で使う #cadedaCloudera Japan
 
Hadoopビッグデータ基盤の歴史を振り返る #cwt2015
Hadoopビッグデータ基盤の歴史を振り返る #cwt2015Hadoopビッグデータ基盤の歴史を振り返る #cwt2015
Hadoopビッグデータ基盤の歴史を振り返る #cwt2015Cloudera Japan
 
エンタープライズデータハブ活用の落とし穴 2015 08-27
エンタープライズデータハブ活用の落とし穴 2015 08-27エンタープライズデータハブ活用の落とし穴 2015 08-27
エンタープライズデータハブ活用の落とし穴 2015 08-27Cloudera Japan
 
HBase Meetup Tokyo Summer 2015 #hbasejp
HBase Meetup Tokyo Summer 2015 #hbasejpHBase Meetup Tokyo Summer 2015 #hbasejp
HBase Meetup Tokyo Summer 2015 #hbasejpCloudera Japan
 
CDHの歴史とCDH5新機能概要 #at_tokuben
CDHの歴史とCDH5新機能概要 #at_tokubenCDHの歴史とCDH5新機能概要 #at_tokuben
CDHの歴史とCDH5新機能概要 #at_tokubenCloudera Japan
 
Impala 2.0 Update 日本語版 #impalajp
Impala 2.0 Update 日本語版 #impalajpImpala 2.0 Update 日本語版 #impalajp
Impala 2.0 Update 日本語版 #impalajpCloudera Japan
 
Kuduを調べてみた #dogenzakalt
Kuduを調べてみた #dogenzakaltKuduを調べてみた #dogenzakalt
Kuduを調べてみた #dogenzakaltToshihiro Suzuki
 
G-Tech2015 Hadoop/Sparkを中核としたビッグデータ基盤_20151006
G-Tech2015 Hadoop/Sparkを中核としたビッグデータ基盤_20151006G-Tech2015 Hadoop/Sparkを中核としたビッグデータ基盤_20151006
G-Tech2015 Hadoop/Sparkを中核としたビッグデータ基盤_20151006Cloudera Japan
 
Cloudera in the Cloud #CWT2017
Cloudera in the Cloud #CWT2017Cloudera in the Cloud #CWT2017
Cloudera in the Cloud #CWT2017Cloudera Japan
 
Apache Kuduを使った分析システムの裏側
Apache Kuduを使った分析システムの裏側Apache Kuduを使った分析システムの裏側
Apache Kuduを使った分析システムの裏側Cloudera Japan
 
Hue 4.0 / Hue Meetup Tokyo #huejp
Hue 4.0 / Hue Meetup Tokyo #huejpHue 4.0 / Hue Meetup Tokyo #huejp
Hue 4.0 / Hue Meetup Tokyo #huejpCloudera Japan
 
CDH5最新情報 #cwt2013
CDH5最新情報 #cwt2013CDH5最新情報 #cwt2013
CDH5最新情報 #cwt2013Cloudera Japan
 
基調講演: 「データエコシステムへの挑戦」 #cwt2015
基調講演: 「データエコシステムへの挑戦」 #cwt2015基調講演: 「データエコシステムへの挑戦」 #cwt2015
基調講演: 「データエコシステムへの挑戦」 #cwt2015Cloudera Japan
 

What's hot (20)

基礎から学ぶ超並列SQLエンジンImpala #cwt2015
基礎から学ぶ超並列SQLエンジンImpala #cwt2015基礎から学ぶ超並列SQLエンジンImpala #cwt2015
基礎から学ぶ超並列SQLエンジンImpala #cwt2015
 
#cwt2016 Cloudera Managerを用いた Hadoop のトラブルシューティング
#cwt2016 Cloudera Managerを用いた Hadoop のトラブルシューティング #cwt2016 Cloudera Managerを用いた Hadoop のトラブルシューティング
#cwt2016 Cloudera Managerを用いた Hadoop のトラブルシューティング
 
C5.2 (Cloudera Manager + CDH) アップデート #cwt2014
C5.2 (Cloudera Manager + CDH) アップデート #cwt2014C5.2 (Cloudera Manager + CDH) アップデート #cwt2014
C5.2 (Cloudera Manager + CDH) アップデート #cwt2014
 
HBase活用事例 #hbase_ca
HBase活用事例 #hbase_caHBase活用事例 #hbase_ca
HBase活用事例 #hbase_ca
 
機械学習の定番プラットフォームSparkの紹介
機械学習の定番プラットフォームSparkの紹介機械学習の定番プラットフォームSparkの紹介
機械学習の定番プラットフォームSparkの紹介
 
大規模データに対するデータサイエンスの進め方 #CWT2016
大規模データに対するデータサイエンスの進め方 #CWT2016大規模データに対するデータサイエンスの進め方 #CWT2016
大規模データに対するデータサイエンスの進め方 #CWT2016
 
Cloudera Data Science WorkbenchとPySparkで 好きなPythonライブラリを 分散で使う #cadeda
Cloudera Data Science WorkbenchとPySparkで 好きなPythonライブラリを 分散で使う #cadedaCloudera Data Science WorkbenchとPySparkで 好きなPythonライブラリを 分散で使う #cadeda
Cloudera Data Science WorkbenchとPySparkで 好きなPythonライブラリを 分散で使う #cadeda
 
Hadoopビッグデータ基盤の歴史を振り返る #cwt2015
Hadoopビッグデータ基盤の歴史を振り返る #cwt2015Hadoopビッグデータ基盤の歴史を振り返る #cwt2015
Hadoopビッグデータ基盤の歴史を振り返る #cwt2015
 
エンタープライズデータハブ活用の落とし穴 2015 08-27
エンタープライズデータハブ活用の落とし穴 2015 08-27エンタープライズデータハブ活用の落とし穴 2015 08-27
エンタープライズデータハブ活用の落とし穴 2015 08-27
 
HBase Meetup Tokyo Summer 2015 #hbasejp
HBase Meetup Tokyo Summer 2015 #hbasejpHBase Meetup Tokyo Summer 2015 #hbasejp
HBase Meetup Tokyo Summer 2015 #hbasejp
 
CDHの歴史とCDH5新機能概要 #at_tokuben
CDHの歴史とCDH5新機能概要 #at_tokubenCDHの歴史とCDH5新機能概要 #at_tokuben
CDHの歴史とCDH5新機能概要 #at_tokuben
 
Impala 2.0 Update 日本語版 #impalajp
Impala 2.0 Update 日本語版 #impalajpImpala 2.0 Update 日本語版 #impalajp
Impala 2.0 Update 日本語版 #impalajp
 
Kuduを調べてみた #dogenzakalt
Kuduを調べてみた #dogenzakaltKuduを調べてみた #dogenzakalt
Kuduを調べてみた #dogenzakalt
 
G-Tech2015 Hadoop/Sparkを中核としたビッグデータ基盤_20151006
G-Tech2015 Hadoop/Sparkを中核としたビッグデータ基盤_20151006G-Tech2015 Hadoop/Sparkを中核としたビッグデータ基盤_20151006
G-Tech2015 Hadoop/Sparkを中核としたビッグデータ基盤_20151006
 
Cloudera in the Cloud #CWT2017
Cloudera in the Cloud #CWT2017Cloudera in the Cloud #CWT2017
Cloudera in the Cloud #CWT2017
 
Apache Kuduを使った分析システムの裏側
Apache Kuduを使った分析システムの裏側Apache Kuduを使った分析システムの裏側
Apache Kuduを使った分析システムの裏側
 
Hue 4.0 / Hue Meetup Tokyo #huejp
Hue 4.0 / Hue Meetup Tokyo #huejpHue 4.0 / Hue Meetup Tokyo #huejp
Hue 4.0 / Hue Meetup Tokyo #huejp
 
CDH5最新情報 #cwt2013
CDH5最新情報 #cwt2013CDH5最新情報 #cwt2013
CDH5最新情報 #cwt2013
 
Impalaチューニングポイントベストプラクティス
ImpalaチューニングポイントベストプラクティスImpalaチューニングポイントベストプラクティス
Impalaチューニングポイントベストプラクティス
 
基調講演: 「データエコシステムへの挑戦」 #cwt2015
基調講演: 「データエコシステムへの挑戦」 #cwt2015基調講演: 「データエコシステムへの挑戦」 #cwt2015
基調講演: 「データエコシステムへの挑戦」 #cwt2015
 

Viewers also liked

Apache Kudu - Updatable Analytical Storage #rakutentech
Apache Kudu - Updatable Analytical Storage #rakutentechApache Kudu - Updatable Analytical Storage #rakutentech
Apache Kudu - Updatable Analytical Storage #rakutentechCloudera Japan
 
機械学習で大事なことをミニGunosyをつくって学んだ╭( ・ㅂ・)و ̑̑ 
機械学習で大事なことをミニGunosyをつくって学んだ╭( ・ㅂ・)و ̑̑ 機械学習で大事なことをミニGunosyをつくって学んだ╭( ・ㅂ・)و ̑̑ 
機械学習で大事なことをミニGunosyをつくって学んだ╭( ・ㅂ・)و ̑̑ Seiji Takahashi
 
Gunosyデータマイニング研究会 #118 これからの強化学習
Gunosyデータマイニング研究会 #118 これからの強化学習Gunosyデータマイニング研究会 #118 これからの強化学習
Gunosyデータマイニング研究会 #118 これからの強化学習圭輔 大曽根
 
あなただけにそっと教える弊社の分析事情 #data analyst meetup tokyo vol.1 LT
あなただけにそっと教える弊社の分析事情 #data analyst meetup tokyo vol.1 LTあなただけにそっと教える弊社の分析事情 #data analyst meetup tokyo vol.1 LT
あなただけにそっと教える弊社の分析事情 #data analyst meetup tokyo vol.1 LTHiroaki Kudo
 
A/B Testing at Pinterest: Building a Culture of Experimentation
A/B Testing at Pinterest: Building a Culture of Experimentation A/B Testing at Pinterest: Building a Culture of Experimentation
A/B Testing at Pinterest: Building a Culture of Experimentation WrangleConf
 
爆速クエリエンジン”Presto”を使いたくなる話
爆速クエリエンジン”Presto”を使いたくなる話爆速クエリエンジン”Presto”を使いたくなる話
爆速クエリエンジン”Presto”を使いたくなる話Kentaro Yoshida
 
“確率的最適化”を読む前に知っておくといいかもしれない関数解析のこと
“確率的最適化”を読む前に知っておくといいかもしれない関数解析のこと“確率的最適化”を読む前に知っておくといいかもしれない関数解析のこと
“確率的最適化”を読む前に知っておくといいかもしれない関数解析のことHiroaki Kudo
 
記事分類における教師データおよびモデルの管理
記事分類における教師データおよびモデルの管理記事分類における教師データおよびモデルの管理
記事分類における教師データおよびモデルの管理圭輔 大曽根
 
マイクロサービスとABテスト
マイクロサービスとABテストマイクロサービスとABテスト
マイクロサービスとABテスト圭輔 大曽根
 
Gunosy における AWS 上での自然言語処理・機械学習の活用事例
Gunosy における AWS 上での自然言語処理・機械学習の活用事例Gunosy における AWS 上での自然言語処理・機械学習の活用事例
Gunosy における AWS 上での自然言語処理・機械学習の活用事例圭輔 大曽根
 
論文紹介@ Gunosyデータマイニング研究会 #97
論文紹介@ Gunosyデータマイニング研究会 #97論文紹介@ Gunosyデータマイニング研究会 #97
論文紹介@ Gunosyデータマイニング研究会 #97圭輔 大曽根
 
WebDB Forum 2016 gunosy
WebDB Forum 2016 gunosyWebDB Forum 2016 gunosy
WebDB Forum 2016 gunosyHiroaki Kudo
 
いまさら聞けない機械学習の評価指標
いまさら聞けない機械学習の評価指標いまさら聞けない機械学習の評価指標
いまさら聞けない機械学習の評価指標圭輔 大曽根
 

Viewers also liked (13)

Apache Kudu - Updatable Analytical Storage #rakutentech
Apache Kudu - Updatable Analytical Storage #rakutentechApache Kudu - Updatable Analytical Storage #rakutentech
Apache Kudu - Updatable Analytical Storage #rakutentech
 
機械学習で大事なことをミニGunosyをつくって学んだ╭( ・ㅂ・)و ̑̑ 
機械学習で大事なことをミニGunosyをつくって学んだ╭( ・ㅂ・)و ̑̑ 機械学習で大事なことをミニGunosyをつくって学んだ╭( ・ㅂ・)و ̑̑ 
機械学習で大事なことをミニGunosyをつくって学んだ╭( ・ㅂ・)و ̑̑ 
 
Gunosyデータマイニング研究会 #118 これからの強化学習
Gunosyデータマイニング研究会 #118 これからの強化学習Gunosyデータマイニング研究会 #118 これからの強化学習
Gunosyデータマイニング研究会 #118 これからの強化学習
 
あなただけにそっと教える弊社の分析事情 #data analyst meetup tokyo vol.1 LT
あなただけにそっと教える弊社の分析事情 #data analyst meetup tokyo vol.1 LTあなただけにそっと教える弊社の分析事情 #data analyst meetup tokyo vol.1 LT
あなただけにそっと教える弊社の分析事情 #data analyst meetup tokyo vol.1 LT
 
A/B Testing at Pinterest: Building a Culture of Experimentation
A/B Testing at Pinterest: Building a Culture of Experimentation A/B Testing at Pinterest: Building a Culture of Experimentation
A/B Testing at Pinterest: Building a Culture of Experimentation
 
爆速クエリエンジン”Presto”を使いたくなる話
爆速クエリエンジン”Presto”を使いたくなる話爆速クエリエンジン”Presto”を使いたくなる話
爆速クエリエンジン”Presto”を使いたくなる話
 
“確率的最適化”を読む前に知っておくといいかもしれない関数解析のこと
“確率的最適化”を読む前に知っておくといいかもしれない関数解析のこと“確率的最適化”を読む前に知っておくといいかもしれない関数解析のこと
“確率的最適化”を読む前に知っておくといいかもしれない関数解析のこと
 
記事分類における教師データおよびモデルの管理
記事分類における教師データおよびモデルの管理記事分類における教師データおよびモデルの管理
記事分類における教師データおよびモデルの管理
 
マイクロサービスとABテスト
マイクロサービスとABテストマイクロサービスとABテスト
マイクロサービスとABテスト
 
Gunosy における AWS 上での自然言語処理・機械学習の活用事例
Gunosy における AWS 上での自然言語処理・機械学習の活用事例Gunosy における AWS 上での自然言語処理・機械学習の活用事例
Gunosy における AWS 上での自然言語処理・機械学習の活用事例
 
論文紹介@ Gunosyデータマイニング研究会 #97
論文紹介@ Gunosyデータマイニング研究会 #97論文紹介@ Gunosyデータマイニング研究会 #97
論文紹介@ Gunosyデータマイニング研究会 #97
 
WebDB Forum 2016 gunosy
WebDB Forum 2016 gunosyWebDB Forum 2016 gunosy
WebDB Forum 2016 gunosy
 
いまさら聞けない機械学習の評価指標
いまさら聞けない機械学習の評価指標いまさら聞けない機械学習の評価指標
いまさら聞けない機械学習の評価指標
 

Similar to #cwt2016 Apache Kudu 構成とテーブル設計

Ibis: すごい pandas ⼤規模データ分析もらっくらく #summerDS
Ibis: すごい pandas ⼤規模データ分析もらっくらく #summerDSIbis: すごい pandas ⼤規模データ分析もらっくらく #summerDS
Ibis: すごい pandas ⼤規模データ分析もらっくらく #summerDSCloudera Japan
 
オラクル・データベース・クラウド~さらなる進化のご紹介(Oracle Cloud Days Tokyo 2015)
オラクル・データベース・クラウド~さらなる進化のご紹介(Oracle Cloud Days Tokyo 2015)オラクル・データベース・クラウド~さらなる進化のご紹介(Oracle Cloud Days Tokyo 2015)
オラクル・データベース・クラウド~さらなる進化のご紹介(Oracle Cloud Days Tokyo 2015)オラクルエンジニア通信
 
Cloudera Manager 5 (hadoop運用) #cwt2013
Cloudera Manager 5 (hadoop運用)  #cwt2013Cloudera Manager 5 (hadoop運用)  #cwt2013
Cloudera Manager 5 (hadoop運用) #cwt2013Cloudera Japan
 
CDH4セミナー資料
CDH4セミナー資料 CDH4セミナー資料
CDH4セミナー資料 Cloudera Japan
 
クラウド上でHadoopを構築できる Cloudera Director 2.0 の紹介 #dogenzakalt
クラウド上でHadoopを構築できる Cloudera Director 2.0 の紹介 #dogenzakaltクラウド上でHadoopを構築できる Cloudera Director 2.0 の紹介 #dogenzakalt
クラウド上でHadoopを構築できる Cloudera Director 2.0 の紹介 #dogenzakaltCloudera Japan
 
DBTS2015 Tokyo DBAが知っておくべき最新テクノロジー
DBTS2015 Tokyo DBAが知っておくべき最新テクノロジーDBTS2015 Tokyo DBAが知っておくべき最新テクノロジー
DBTS2015 Tokyo DBAが知っておくべき最新テクノロジーMasaya Ishikawa
 
Web App for Containers + MySQLでコンテナ対応したPHPアプリを作ろう!
Web App for Containers + MySQLでコンテナ対応したPHPアプリを作ろう! Web App for Containers + MySQLでコンテナ対応したPHPアプリを作ろう!
Web App for Containers + MySQLでコンテナ対応したPHPアプリを作ろう! Yoichi Kawasaki
 
最強のデータベース基盤“Exadata”をパブリック・クラウドで活用!(Oracle Cloud Days Tokyo 2015)
最強のデータベース基盤“Exadata”をパブリック・クラウドで活用!(Oracle Cloud Days Tokyo 2015)最強のデータベース基盤“Exadata”をパブリック・クラウドで活用!(Oracle Cloud Days Tokyo 2015)
最強のデータベース基盤“Exadata”をパブリック・クラウドで活用!(Oracle Cloud Days Tokyo 2015)オラクルエンジニア通信
 
Managed Instance チートシート
Managed Instance チートシートManaged Instance チートシート
Managed Instance チートシートMasayuki Ozawa
 
Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」
Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」
Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」オラクルエンジニア通信
 
Oracle Database Appliance X5-2 アップデート内容のご紹介
Oracle Database Appliance X5-2 アップデート内容のご紹介Oracle Database Appliance X5-2 アップデート内容のご紹介
Oracle Database Appliance X5-2 アップデート内容のご紹介オラクルエンジニア通信
 
HDFS Supportaiblity Improvements
HDFS Supportaiblity ImprovementsHDFS Supportaiblity Improvements
HDFS Supportaiblity ImprovementsCloudera Japan
 
Web App for Containers + MySQLでコンテナ対応したRailsアプリを作ろう!
Web App for Containers + MySQLでコンテナ対応したRailsアプリを作ろう!Web App for Containers + MySQLでコンテナ対応したRailsアプリを作ろう!
Web App for Containers + MySQLでコンテナ対応したRailsアプリを作ろう!Yoichi Kawasaki
 
PCIコンプライアンスに向けたビジネス指針〜MasterCardの事例〜 #cwt2015
PCIコンプライアンスに向けたビジネス指針〜MasterCardの事例〜 #cwt2015PCIコンプライアンスに向けたビジネス指針〜MasterCardの事例〜 #cwt2015
PCIコンプライアンスに向けたビジネス指針〜MasterCardの事例〜 #cwt2015Cloudera Japan
 
PaaS勉強会#25 Helion Development Platform Tech Overview
PaaS勉強会#25 Helion Development Platform Tech OverviewPaaS勉強会#25 Helion Development Platform Tech Overview
PaaS勉強会#25 Helion Development Platform Tech OverviewToru Makabe
 
MySQL 5.7 & 最新開発状況 @ オープンソースカンファレンス20
MySQL 5.7 & 最新開発状況 @ オープンソースカンファレンス20MySQL 5.7 & 最新開発状況 @ オープンソースカンファレンス20
MySQL 5.7 & 最新開発状況 @ オープンソースカンファレンス20Ryusuke Kajiyama
 
MySQL製品概要
MySQL製品概要MySQL製品概要
MySQL製品概要yoyamasaki
 

Similar to #cwt2016 Apache Kudu 構成とテーブル設計 (20)

Ibis: すごい pandas ⼤規模データ分析もらっくらく #summerDS
Ibis: すごい pandas ⼤規模データ分析もらっくらく #summerDSIbis: すごい pandas ⼤規模データ分析もらっくらく #summerDS
Ibis: すごい pandas ⼤規模データ分析もらっくらく #summerDS
 
オラクル・データベース・クラウド~さらなる進化のご紹介(Oracle Cloud Days Tokyo 2015)
オラクル・データベース・クラウド~さらなる進化のご紹介(Oracle Cloud Days Tokyo 2015)オラクル・データベース・クラウド~さらなる進化のご紹介(Oracle Cloud Days Tokyo 2015)
オラクル・データベース・クラウド~さらなる進化のご紹介(Oracle Cloud Days Tokyo 2015)
 
Cloudera Manager 5 (hadoop運用) #cwt2013
Cloudera Manager 5 (hadoop運用)  #cwt2013Cloudera Manager 5 (hadoop運用)  #cwt2013
Cloudera Manager 5 (hadoop運用) #cwt2013
 
Osdt s3
Osdt s3Osdt s3
Osdt s3
 
CDH4セミナー資料
CDH4セミナー資料 CDH4セミナー資料
CDH4セミナー資料
 
Serverless analytics on aws
Serverless analytics on awsServerless analytics on aws
Serverless analytics on aws
 
Oracle Database 12c Release 1 PSR 12.1.0.2 のご紹介
Oracle Database 12c Release 1 PSR 12.1.0.2 のご紹介Oracle Database 12c Release 1 PSR 12.1.0.2 のご紹介
Oracle Database 12c Release 1 PSR 12.1.0.2 のご紹介
 
クラウド上でHadoopを構築できる Cloudera Director 2.0 の紹介 #dogenzakalt
クラウド上でHadoopを構築できる Cloudera Director 2.0 の紹介 #dogenzakaltクラウド上でHadoopを構築できる Cloudera Director 2.0 の紹介 #dogenzakalt
クラウド上でHadoopを構築できる Cloudera Director 2.0 の紹介 #dogenzakalt
 
DBTS2015 Tokyo DBAが知っておくべき最新テクノロジー
DBTS2015 Tokyo DBAが知っておくべき最新テクノロジーDBTS2015 Tokyo DBAが知っておくべき最新テクノロジー
DBTS2015 Tokyo DBAが知っておくべき最新テクノロジー
 
Web App for Containers + MySQLでコンテナ対応したPHPアプリを作ろう!
Web App for Containers + MySQLでコンテナ対応したPHPアプリを作ろう! Web App for Containers + MySQLでコンテナ対応したPHPアプリを作ろう!
Web App for Containers + MySQLでコンテナ対応したPHPアプリを作ろう!
 
最強のデータベース基盤“Exadata”をパブリック・クラウドで活用!(Oracle Cloud Days Tokyo 2015)
最強のデータベース基盤“Exadata”をパブリック・クラウドで活用!(Oracle Cloud Days Tokyo 2015)最強のデータベース基盤“Exadata”をパブリック・クラウドで活用!(Oracle Cloud Days Tokyo 2015)
最強のデータベース基盤“Exadata”をパブリック・クラウドで活用!(Oracle Cloud Days Tokyo 2015)
 
Managed Instance チートシート
Managed Instance チートシートManaged Instance チートシート
Managed Instance チートシート
 
Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」
Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」
Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」
 
Oracle Database Appliance X5-2 アップデート内容のご紹介
Oracle Database Appliance X5-2 アップデート内容のご紹介Oracle Database Appliance X5-2 アップデート内容のご紹介
Oracle Database Appliance X5-2 アップデート内容のご紹介
 
HDFS Supportaiblity Improvements
HDFS Supportaiblity ImprovementsHDFS Supportaiblity Improvements
HDFS Supportaiblity Improvements
 
Web App for Containers + MySQLでコンテナ対応したRailsアプリを作ろう!
Web App for Containers + MySQLでコンテナ対応したRailsアプリを作ろう!Web App for Containers + MySQLでコンテナ対応したRailsアプリを作ろう!
Web App for Containers + MySQLでコンテナ対応したRailsアプリを作ろう!
 
PCIコンプライアンスに向けたビジネス指針〜MasterCardの事例〜 #cwt2015
PCIコンプライアンスに向けたビジネス指針〜MasterCardの事例〜 #cwt2015PCIコンプライアンスに向けたビジネス指針〜MasterCardの事例〜 #cwt2015
PCIコンプライアンスに向けたビジネス指針〜MasterCardの事例〜 #cwt2015
 
PaaS勉強会#25 Helion Development Platform Tech Overview
PaaS勉強会#25 Helion Development Platform Tech OverviewPaaS勉強会#25 Helion Development Platform Tech Overview
PaaS勉強会#25 Helion Development Platform Tech Overview
 
MySQL 5.7 & 最新開発状況 @ オープンソースカンファレンス20
MySQL 5.7 & 最新開発状況 @ オープンソースカンファレンス20MySQL 5.7 & 最新開発状況 @ オープンソースカンファレンス20
MySQL 5.7 & 最新開発状況 @ オープンソースカンファレンス20
 
MySQL製品概要
MySQL製品概要MySQL製品概要
MySQL製品概要
 

More from Cloudera Japan

Impala + Kudu を用いたデータウェアハウス構築の勘所 (仮)
Impala + Kudu を用いたデータウェアハウス構築の勘所 (仮)Impala + Kudu を用いたデータウェアハウス構築の勘所 (仮)
Impala + Kudu を用いたデータウェアハウス構築の勘所 (仮)Cloudera Japan
 
分散DB Apache Kuduのアーキテクチャ DBの性能と一貫性を両立させる仕組み 「HybridTime」とは
分散DB Apache KuduのアーキテクチャDBの性能と一貫性を両立させる仕組み「HybridTime」とは分散DB Apache KuduのアーキテクチャDBの性能と一貫性を両立させる仕組み「HybridTime」とは
分散DB Apache Kuduのアーキテクチャ DBの性能と一貫性を両立させる仕組み 「HybridTime」とはCloudera Japan
 
Cloudera のサポートエンジニアリング #supennight
Cloudera のサポートエンジニアリング #supennightCloudera のサポートエンジニアリング #supennight
Cloudera のサポートエンジニアリング #supennightCloudera Japan
 
Train, predict, serve: How to go into production your machine learning model
Train, predict, serve: How to go into production your machine learning modelTrain, predict, serve: How to go into production your machine learning model
Train, predict, serve: How to go into production your machine learning modelCloudera Japan
 
先行事例から学ぶ IoT / ビッグデータの始め方
先行事例から学ぶ IoT / ビッグデータの始め方先行事例から学ぶ IoT / ビッグデータの始め方
先行事例から学ぶ IoT / ビッグデータの始め方Cloudera Japan
 
Clouderaが提供するエンタープライズ向け運用、データ管理ツールの使い方 #CW2017
Clouderaが提供するエンタープライズ向け運用、データ管理ツールの使い方 #CW2017Clouderaが提供するエンタープライズ向け運用、データ管理ツールの使い方 #CW2017
Clouderaが提供するエンタープライズ向け運用、データ管理ツールの使い方 #CW2017Cloudera Japan
 
How to go into production your machine learning models? #CWT2017
How to go into production your machine learning models? #CWT2017How to go into production your machine learning models? #CWT2017
How to go into production your machine learning models? #CWT2017Cloudera Japan
 
Cloudera + MicrosoftでHadoopするのがイイらしい。 #CWT2016
Cloudera + MicrosoftでHadoopするのがイイらしい。 #CWT2016Cloudera + MicrosoftでHadoopするのがイイらしい。 #CWT2016
Cloudera + MicrosoftでHadoopするのがイイらしい。 #CWT2016Cloudera Japan
 
MapReduceを置き換えるSpark 〜HadoopとSparkの統合〜 #cwt2015
MapReduceを置き換えるSpark 〜HadoopとSparkの統合〜 #cwt2015MapReduceを置き換えるSpark 〜HadoopとSparkの統合〜 #cwt2015
MapReduceを置き換えるSpark 〜HadoopとSparkの統合〜 #cwt2015Cloudera Japan
 
基調講演:「ビッグデータのセキュリティとガバナンス要件」 #cwt2015
基調講演:「ビッグデータのセキュリティとガバナンス要件」 #cwt2015基調講演:「ビッグデータのセキュリティとガバナンス要件」 #cwt2015
基調講演:「ビッグデータのセキュリティとガバナンス要件」 #cwt2015Cloudera Japan
 
基調講演: 「パーペイシブ分析を目指して」#cwt2015
基調講演: 「パーペイシブ分析を目指して」#cwt2015基調講演: 「パーペイシブ分析を目指して」#cwt2015
基調講演: 「パーペイシブ分析を目指して」#cwt2015Cloudera Japan
 

More from Cloudera Japan (11)

Impala + Kudu を用いたデータウェアハウス構築の勘所 (仮)
Impala + Kudu を用いたデータウェアハウス構築の勘所 (仮)Impala + Kudu を用いたデータウェアハウス構築の勘所 (仮)
Impala + Kudu を用いたデータウェアハウス構築の勘所 (仮)
 
分散DB Apache Kuduのアーキテクチャ DBの性能と一貫性を両立させる仕組み 「HybridTime」とは
分散DB Apache KuduのアーキテクチャDBの性能と一貫性を両立させる仕組み「HybridTime」とは分散DB Apache KuduのアーキテクチャDBの性能と一貫性を両立させる仕組み「HybridTime」とは
分散DB Apache Kuduのアーキテクチャ DBの性能と一貫性を両立させる仕組み 「HybridTime」とは
 
Cloudera のサポートエンジニアリング #supennight
Cloudera のサポートエンジニアリング #supennightCloudera のサポートエンジニアリング #supennight
Cloudera のサポートエンジニアリング #supennight
 
Train, predict, serve: How to go into production your machine learning model
Train, predict, serve: How to go into production your machine learning modelTrain, predict, serve: How to go into production your machine learning model
Train, predict, serve: How to go into production your machine learning model
 
先行事例から学ぶ IoT / ビッグデータの始め方
先行事例から学ぶ IoT / ビッグデータの始め方先行事例から学ぶ IoT / ビッグデータの始め方
先行事例から学ぶ IoT / ビッグデータの始め方
 
Clouderaが提供するエンタープライズ向け運用、データ管理ツールの使い方 #CW2017
Clouderaが提供するエンタープライズ向け運用、データ管理ツールの使い方 #CW2017Clouderaが提供するエンタープライズ向け運用、データ管理ツールの使い方 #CW2017
Clouderaが提供するエンタープライズ向け運用、データ管理ツールの使い方 #CW2017
 
How to go into production your machine learning models? #CWT2017
How to go into production your machine learning models? #CWT2017How to go into production your machine learning models? #CWT2017
How to go into production your machine learning models? #CWT2017
 
Cloudera + MicrosoftでHadoopするのがイイらしい。 #CWT2016
Cloudera + MicrosoftでHadoopするのがイイらしい。 #CWT2016Cloudera + MicrosoftでHadoopするのがイイらしい。 #CWT2016
Cloudera + MicrosoftでHadoopするのがイイらしい。 #CWT2016
 
MapReduceを置き換えるSpark 〜HadoopとSparkの統合〜 #cwt2015
MapReduceを置き換えるSpark 〜HadoopとSparkの統合〜 #cwt2015MapReduceを置き換えるSpark 〜HadoopとSparkの統合〜 #cwt2015
MapReduceを置き換えるSpark 〜HadoopとSparkの統合〜 #cwt2015
 
基調講演:「ビッグデータのセキュリティとガバナンス要件」 #cwt2015
基調講演:「ビッグデータのセキュリティとガバナンス要件」 #cwt2015基調講演:「ビッグデータのセキュリティとガバナンス要件」 #cwt2015
基調講演:「ビッグデータのセキュリティとガバナンス要件」 #cwt2015
 
基調講演: 「パーペイシブ分析を目指して」#cwt2015
基調講演: 「パーペイシブ分析を目指して」#cwt2015基調講演: 「パーペイシブ分析を目指して」#cwt2015
基調講演: 「パーペイシブ分析を目指して」#cwt2015
 

#cwt2016 Apache Kudu 構成とテーブル設計