SlideShare a Scribd company logo
1 of 10
分散ブロックストレージ Sheepdog
〜プロダクト品質に向けて〜
VIOPS07 WORKSHOP
2012年7月20日
NTT ソフトウェアイノベーションセンタ 森田 和孝
Copyright (C) 2012 NTT Corporation 2
Sheepdog とは
● PCクラスタ型のブロックストレージシステム
● ユーザに任意のサイズの仮想ディスクを提供
● 仮想化ソフトウェア QEMU/KVM では標準サポート
● libvirt や OpenStack などの管理ソフトからも利用可能
● QEMU 以外からも, iSCSI, NBD (network block device),
ファイルシステムとしてアクセス可能
Sheepdog クラスタ
Amazon EBS の機能
Isilon のアーキテクチャ
をオープンソースで実現
Copyright (C) 2012 NTT Corporation 3
全体構成
● QEMU/KVM を対象
● ライブマイグレーション
可能
● イーサネットで動作可能
● ネットワークが分断して
もデータ一貫性を保証
● 汎用のPCサーバのみで
動作
● 数千台まで拡張可能
● 単一障害点なし
● 自律運用可能
● スナップショット・クロー
ン機能
● 任意の冗長度・サイズ
で作成可能
● 仮想ディスク作成後で
もサイズの拡張が可能
仮想化環境
Sheepdog クラスタ
仮想マシン
ホストマシン
仮想ディスク
イーサネット
スイッチ
ストレージ
マシン
Copyright (C) 2012 NTT Corporation 4
コミュニティの現状
● Ml登録者数 (2012/6 現在)
● 248 人
● 一ヶ月のパッチ数(2012/5)
● 183 件 (うち 171 件が外部開発者)
● 一ヶ月のML投稿数(2012/5)
● 1083 件
● コミッター
● 2名 (NTT, Taobao)
● 開発者
● 21 名
ML投稿数の推移
ML投稿数
Copyright (C) 2012 NTT Corporation 5
事例
● ElasticHosts
● イギリスのパブリッククラウドを提供する会社
● 実サービスでSheepdogを利用している
● Taobao
● 中国最大のECサイトを提供する会社
● 1000 台規模の Sheepdog 検証を行っている
● 現在の Sheepdog 開発の中心
● 某ベンチャー企業
● 大規模プライベートクラウドを提供する会社
● Linuxカーネル開発, ストレージ開発で著名な Christoph が開発に
参加している
Copyright (C) 2012 NTT Corporation 6
1000 台規模における性能評価
Sheepdog クラスタ (物理 96 台, 仮想 960 台)
- HP ProLiant BL460c G1
- Intel Xeon E5410 2.33GHz
- 8 GB RAM
- 150GB SAS x 2 (raid0)
- Gigabit Ethernet x 2 (bonding)
ZooKeeper クラスタ (5 台)
(マシンスペックは Sheepdog クラスタと同一)
仮想マシン
- QEMU/KVM
- 2 cpu
- 2 GB RAM
- 80 GB Sheepdog disk
- virtio-net
Copyright (C) 2012 NTT Corporation 7
I/O 性能
● VM 台数に対して, トータル性能が線形にスケールする
● 各 VM から見ると, raw ディスクを直接使う場合に比べて8割強の性能が得られる
シーケンシャル read (ブロックサイズ 4 KB) シーケンシャル write (ブロックサイズ 4 KB)
トータルI/O数/秒
トータルI/O数/秒
VM 数 VM 数
Copyright (C) 2012 NTT Corporation 8
ストレージサーバの障害試験
● サーバ 960 台中, 10
台 (1 ゾーン) の障害
を試験したところ, 約
7 分で, データの復旧
完了
● 復旧完了までの時間
が, サーバごとにばら
つきがある点が問題
経過時間
マシン番号
Copyright (C) 2012 NTT Corporation 9
過負荷時におけるサーバ追加/離脱
● VM 内で負荷 (qemu の
build) をかけている状態で,
サーバ 960 台中, 10 台 (1
ゾーン) の障害を試験したと
ころ, 各サーバは平均約 45
分でデータの復旧が完了.
● 950 台中, 35 台のサーバが
落ちてしまっているが, 最新
バージョンの Sheepdog では
修正済
● データ復旧中に VM の性能
が落ちてしまうことが課題
マシン番号
経過時間
Copyright (C) 2012 NTT Corporation 10
まとめ
● Sheepdog は, ノウハウがあれば十分運用可能なレベルまで品質が
上がってきました
– 1000 台規模でも動きます
– 日本でも積極的な試用、評価をお待ちしてます
– 今年末ごろに安定版 (Sheepdog 1.0) をリリース予定です
● Sheepdog は信頼性, 拡張性, 管理容易性の実現を目指した分散
ブロックストレージシステムです
– クラウドストレージのデファクトスタンダードを目指しています
● その他の情報
– Project site: http://www.osrg.net/sheepdog/
– Mailing list
● Developers: sheepdog@lists.wpkg.org
● Users: sheepdog-users@lists.wpkg.org
– Wiki: https://github.com/collie/sheepdog/wiki

More Related Content

Viewers also liked

分散仮想ストレージシステム紹介
分散仮想ストレージシステム紹介分散仮想ストレージシステム紹介
分散仮想ストレージシステム紹介OSSラボ株式会社
 
Qemu & KVM Guide #1 (intro & basic)
Qemu & KVM Guide #1 (intro & basic)Qemu & KVM Guide #1 (intro & basic)
Qemu & KVM Guide #1 (intro & basic)JungIn Jung
 
Performance comparison of Distributed File Systems on 1Gbit networks
Performance comparison of Distributed File Systems on 1Gbit networksPerformance comparison of Distributed File Systems on 1Gbit networks
Performance comparison of Distributed File Systems on 1Gbit networksMarian Marinov
 
Ceph アーキテクチャ概説
Ceph アーキテクチャ概説Ceph アーキテクチャ概説
Ceph アーキテクチャ概説Emma Haruka Iwao
 
10年効く分散ファイルシステム技術 GlusterFS & Red Hat Storage
10年効く分散ファイルシステム技術 GlusterFS & Red Hat Storage10年効く分散ファイルシステム技術 GlusterFS & Red Hat Storage
10年効く分散ファイルシステム技術 GlusterFS & Red Hat StorageEtsuji Nakai
 
[db tech showcase Tokyo 2016] D15: データベース フラッシュソリューション徹底解説! 安価にデータベースを高速にする方法...
[db tech showcase Tokyo 2016] D15: データベース フラッシュソリューション徹底解説! 安価にデータベースを高速にする方法...[db tech showcase Tokyo 2016] D15: データベース フラッシュソリューション徹底解説! 安価にデータベースを高速にする方法...
[db tech showcase Tokyo 2016] D15: データベース フラッシュソリューション徹底解説! 安価にデータベースを高速にする方法...Insight Technology, Inc.
 
[db tech showcase Tokyo 2016] A12: フラッシュストレージのその先へ ~不揮発性メモリNVDIMMが拓くデータベースの世界...
[db tech showcase Tokyo 2016] A12: フラッシュストレージのその先へ ~不揮発性メモリNVDIMMが拓くデータベースの世界...[db tech showcase Tokyo 2016] A12: フラッシュストレージのその先へ ~不揮発性メモリNVDIMMが拓くデータベースの世界...
[db tech showcase Tokyo 2016] A12: フラッシュストレージのその先へ ~不揮発性メモリNVDIMMが拓くデータベースの世界...Insight Technology, Inc.
 
Docker入門: コンテナ型仮想化技術の仕組みと使い方
Docker入門: コンテナ型仮想化技術の仕組みと使い方Docker入門: コンテナ型仮想化技術の仕組みと使い方
Docker入門: コンテナ型仮想化技術の仕組みと使い方Yuichi Ito
 

Viewers also liked (8)

分散仮想ストレージシステム紹介
分散仮想ストレージシステム紹介分散仮想ストレージシステム紹介
分散仮想ストレージシステム紹介
 
Qemu & KVM Guide #1 (intro & basic)
Qemu & KVM Guide #1 (intro & basic)Qemu & KVM Guide #1 (intro & basic)
Qemu & KVM Guide #1 (intro & basic)
 
Performance comparison of Distributed File Systems on 1Gbit networks
Performance comparison of Distributed File Systems on 1Gbit networksPerformance comparison of Distributed File Systems on 1Gbit networks
Performance comparison of Distributed File Systems on 1Gbit networks
 
Ceph アーキテクチャ概説
Ceph アーキテクチャ概説Ceph アーキテクチャ概説
Ceph アーキテクチャ概説
 
10年効く分散ファイルシステム技術 GlusterFS & Red Hat Storage
10年効く分散ファイルシステム技術 GlusterFS & Red Hat Storage10年効く分散ファイルシステム技術 GlusterFS & Red Hat Storage
10年効く分散ファイルシステム技術 GlusterFS & Red Hat Storage
 
[db tech showcase Tokyo 2016] D15: データベース フラッシュソリューション徹底解説! 安価にデータベースを高速にする方法...
[db tech showcase Tokyo 2016] D15: データベース フラッシュソリューション徹底解説! 安価にデータベースを高速にする方法...[db tech showcase Tokyo 2016] D15: データベース フラッシュソリューション徹底解説! 安価にデータベースを高速にする方法...
[db tech showcase Tokyo 2016] D15: データベース フラッシュソリューション徹底解説! 安価にデータベースを高速にする方法...
 
[db tech showcase Tokyo 2016] A12: フラッシュストレージのその先へ ~不揮発性メモリNVDIMMが拓くデータベースの世界...
[db tech showcase Tokyo 2016] A12: フラッシュストレージのその先へ ~不揮発性メモリNVDIMMが拓くデータベースの世界...[db tech showcase Tokyo 2016] A12: フラッシュストレージのその先へ ~不揮発性メモリNVDIMMが拓くデータベースの世界...
[db tech showcase Tokyo 2016] A12: フラッシュストレージのその先へ ~不揮発性メモリNVDIMMが拓くデータベースの世界...
 
Docker入門: コンテナ型仮想化技術の仕組みと使い方
Docker入門: コンテナ型仮想化技術の仕組みと使い方Docker入門: コンテナ型仮想化技術の仕組みと使い方
Docker入門: コンテナ型仮想化技術の仕組みと使い方
 

More from VIOPS Virtualized Infrastructure Operators group ARCHIVES

VIOPS09: 本当に必要なのはSoftware- Defined Networking? ~今、改めて考えるデータセンタ・ネットワークの役割~
VIOPS09: 本当に必要なのはSoftware- Defined Networking? ~今、改めて考えるデータセンタ・ネットワークの役割~VIOPS09: 本当に必要なのはSoftware- Defined Networking? ~今、改めて考えるデータセンタ・ネットワークの役割~
VIOPS09: 本当に必要なのはSoftware- Defined Networking? ~今、改めて考えるデータセンタ・ネットワークの役割~VIOPS Virtualized Infrastructure Operators group ARCHIVES
 
VIOPS09: Hadoop向けバッチアプリケーション開発フレームワーク Asakura Frameworkが目指すところ
VIOPS09: Hadoop向けバッチアプリケーション開発フレームワーク Asakura Frameworkが目指すところVIOPS09: Hadoop向けバッチアプリケーション開発フレームワーク Asakura Frameworkが目指すところ
VIOPS09: Hadoop向けバッチアプリケーション開発フレームワーク Asakura Frameworkが目指すところVIOPS Virtualized Infrastructure Operators group ARCHIVES
 
VIOPS09: 圧倒的なコストパフォーマンスを実現するクラウドアーキテクチャの秘密
VIOPS09: 圧倒的なコストパフォーマンスを実現するクラウドアーキテクチャの秘密VIOPS09: 圧倒的なコストパフォーマンスを実現するクラウドアーキテクチャの秘密
VIOPS09: 圧倒的なコストパフォーマンスを実現するクラウドアーキテクチャの秘密VIOPS Virtualized Infrastructure Operators group ARCHIVES
 

More from VIOPS Virtualized Infrastructure Operators group ARCHIVES (20)

VIOPS10: サーバーロードマップから考えるクラウドの次
VIOPS10: サーバーロードマップから考えるクラウドの次VIOPS10: サーバーロードマップから考えるクラウドの次
VIOPS10: サーバーロードマップから考えるクラウドの次
 
VIOPS10: DMM.comのインフラのこれから
VIOPS10: DMM.comのインフラのこれからVIOPS10: DMM.comのインフラのこれから
VIOPS10: DMM.comのインフラのこれから
 
VIOPS10: SSDの基本技術と最新動向
VIOPS10: SSDの基本技術と最新動向VIOPS10: SSDの基本技術と最新動向
VIOPS10: SSDの基本技術と最新動向
 
VIOPS10: クラウドのつぎに起こるコト
VIOPS10: クラウドのつぎに起こるコトVIOPS10: クラウドのつぎに起こるコト
VIOPS10: クラウドのつぎに起こるコト
 
VIOPS10: クラウドのつぎに起こるコト
VIOPS10: クラウドのつぎに起こるコトVIOPS10: クラウドのつぎに起こるコト
VIOPS10: クラウドのつぎに起こるコト
 
VIOPS10: いまパブリッククラウドで起きているコト
VIOPS10: いまパブリッククラウドで起きているコトVIOPS10: いまパブリッククラウドで起きているコト
VIOPS10: いまパブリッククラウドで起きているコト
 
VIOPS09: 本当に必要なのはSoftware- Defined Networking? ~今、改めて考えるデータセンタ・ネットワークの役割~
VIOPS09: 本当に必要なのはSoftware- Defined Networking? ~今、改めて考えるデータセンタ・ネットワークの役割~VIOPS09: 本当に必要なのはSoftware- Defined Networking? ~今、改めて考えるデータセンタ・ネットワークの役割~
VIOPS09: 本当に必要なのはSoftware- Defined Networking? ~今、改めて考えるデータセンタ・ネットワークの役割~
 
VIOPS09: Hadoop向けバッチアプリケーション開発フレームワーク Asakura Frameworkが目指すところ
VIOPS09: Hadoop向けバッチアプリケーション開発フレームワーク Asakura Frameworkが目指すところVIOPS09: Hadoop向けバッチアプリケーション開発フレームワーク Asakura Frameworkが目指すところ
VIOPS09: Hadoop向けバッチアプリケーション開発フレームワーク Asakura Frameworkが目指すところ
 
VIOPS09: AWSで実現する クラウドと物理製品の融合
VIOPS09: AWSで実現する クラウドと物理製品の融合VIOPS09: AWSで実現する クラウドと物理製品の融合
VIOPS09: AWSで実現する クラウドと物理製品の融合
 
VIOPS09: クラウド時代におけるFusion-ioのポジショニング
VIOPS09: クラウド時代におけるFusion-ioのポジショニングVIOPS09: クラウド時代におけるFusion-ioのポジショニング
VIOPS09: クラウド時代におけるFusion-ioのポジショニング
 
VIOPS09: 圧倒的なコストパフォーマンスを実現するクラウドアーキテクチャの秘密
VIOPS09: 圧倒的なコストパフォーマンスを実現するクラウドアーキテクチャの秘密VIOPS09: 圧倒的なコストパフォーマンスを実現するクラウドアーキテクチャの秘密
VIOPS09: 圧倒的なコストパフォーマンスを実現するクラウドアーキテクチャの秘密
 
VIOPS09: その鐘を鳴らすのはあなた
VIOPS09: その鐘を鳴らすのはあなたVIOPS09: その鐘を鳴らすのはあなた
VIOPS09: その鐘を鳴らすのはあなた
 
VIOPS08: マイクロサーバー アーキテクチャトレンド
VIOPS08: マイクロサーバー アーキテクチャトレンドVIOPS08: マイクロサーバー アーキテクチャトレンド
VIOPS08: マイクロサーバー アーキテクチャトレンド
 
VIOPS08: Behavior Analysis Solution for Bigdata
VIOPS08: Behavior Analysis Solution for BigdataVIOPS08: Behavior Analysis Solution for Bigdata
VIOPS08: Behavior Analysis Solution for Bigdata
 
VIOPS08: ハードウェアオフロードの現在と今後
VIOPS08: ハードウェアオフロードの現在と今後VIOPS08: ハードウェアオフロードの現在と今後
VIOPS08: ハードウェアオフロードの現在と今後
 
VIOPS08: PaaSのメリットと課題
VIOPS08: PaaSのメリットと課題VIOPS08: PaaSのメリットと課題
VIOPS08: PaaSのメリットと課題
 
VIOPS07: “Practical” Guide to GlusterFS
VIOPS07: “Practical” Guide to GlusterFSVIOPS07: “Practical” Guide to GlusterFS
VIOPS07: “Practical” Guide to GlusterFS
 
VIOPS07: アプリケーションサービスの自動化
VIOPS07: アプリケーションサービスの自動化VIOPS07: アプリケーションサービスの自動化
VIOPS07: アプリケーションサービスの自動化
 
VIOPS07: OSMと地理空間情報
VIOPS07: OSMと地理空間情報VIOPS07: OSMと地理空間情報
VIOPS07: OSMと地理空間情報
 
VIOPS07: CDNの困ったネタ
VIOPS07: CDNの困ったネタVIOPS07: CDNの困ったネタ
VIOPS07: CDNの困ったネタ
 

Recently uploaded

NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NTT DATA Technology & Innovation
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)Hiroshi Tomioka
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?akihisamiyanaga1
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfFumieNakayama
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineerYuki Kikuchi
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)UEHARA, Tetsutaro
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...博三 太田
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfFumieNakayama
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案sugiuralab
 

Recently uploaded (9)

NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
 

VIOPS07: 分散ブロックストレージ Sheepdog

  • 2. Copyright (C) 2012 NTT Corporation 2 Sheepdog とは ● PCクラスタ型のブロックストレージシステム ● ユーザに任意のサイズの仮想ディスクを提供 ● 仮想化ソフトウェア QEMU/KVM では標準サポート ● libvirt や OpenStack などの管理ソフトからも利用可能 ● QEMU 以外からも, iSCSI, NBD (network block device), ファイルシステムとしてアクセス可能 Sheepdog クラスタ Amazon EBS の機能 Isilon のアーキテクチャ をオープンソースで実現
  • 3. Copyright (C) 2012 NTT Corporation 3 全体構成 ● QEMU/KVM を対象 ● ライブマイグレーション 可能 ● イーサネットで動作可能 ● ネットワークが分断して もデータ一貫性を保証 ● 汎用のPCサーバのみで 動作 ● 数千台まで拡張可能 ● 単一障害点なし ● 自律運用可能 ● スナップショット・クロー ン機能 ● 任意の冗長度・サイズ で作成可能 ● 仮想ディスク作成後で もサイズの拡張が可能 仮想化環境 Sheepdog クラスタ 仮想マシン ホストマシン 仮想ディスク イーサネット スイッチ ストレージ マシン
  • 4. Copyright (C) 2012 NTT Corporation 4 コミュニティの現状 ● Ml登録者数 (2012/6 現在) ● 248 人 ● 一ヶ月のパッチ数(2012/5) ● 183 件 (うち 171 件が外部開発者) ● 一ヶ月のML投稿数(2012/5) ● 1083 件 ● コミッター ● 2名 (NTT, Taobao) ● 開発者 ● 21 名 ML投稿数の推移 ML投稿数
  • 5. Copyright (C) 2012 NTT Corporation 5 事例 ● ElasticHosts ● イギリスのパブリッククラウドを提供する会社 ● 実サービスでSheepdogを利用している ● Taobao ● 中国最大のECサイトを提供する会社 ● 1000 台規模の Sheepdog 検証を行っている ● 現在の Sheepdog 開発の中心 ● 某ベンチャー企業 ● 大規模プライベートクラウドを提供する会社 ● Linuxカーネル開発, ストレージ開発で著名な Christoph が開発に 参加している
  • 6. Copyright (C) 2012 NTT Corporation 6 1000 台規模における性能評価 Sheepdog クラスタ (物理 96 台, 仮想 960 台) - HP ProLiant BL460c G1 - Intel Xeon E5410 2.33GHz - 8 GB RAM - 150GB SAS x 2 (raid0) - Gigabit Ethernet x 2 (bonding) ZooKeeper クラスタ (5 台) (マシンスペックは Sheepdog クラスタと同一) 仮想マシン - QEMU/KVM - 2 cpu - 2 GB RAM - 80 GB Sheepdog disk - virtio-net
  • 7. Copyright (C) 2012 NTT Corporation 7 I/O 性能 ● VM 台数に対して, トータル性能が線形にスケールする ● 各 VM から見ると, raw ディスクを直接使う場合に比べて8割強の性能が得られる シーケンシャル read (ブロックサイズ 4 KB) シーケンシャル write (ブロックサイズ 4 KB) トータルI/O数/秒 トータルI/O数/秒 VM 数 VM 数
  • 8. Copyright (C) 2012 NTT Corporation 8 ストレージサーバの障害試験 ● サーバ 960 台中, 10 台 (1 ゾーン) の障害 を試験したところ, 約 7 分で, データの復旧 完了 ● 復旧完了までの時間 が, サーバごとにばら つきがある点が問題 経過時間 マシン番号
  • 9. Copyright (C) 2012 NTT Corporation 9 過負荷時におけるサーバ追加/離脱 ● VM 内で負荷 (qemu の build) をかけている状態で, サーバ 960 台中, 10 台 (1 ゾーン) の障害を試験したと ころ, 各サーバは平均約 45 分でデータの復旧が完了. ● 950 台中, 35 台のサーバが 落ちてしまっているが, 最新 バージョンの Sheepdog では 修正済 ● データ復旧中に VM の性能 が落ちてしまうことが課題 マシン番号 経過時間
  • 10. Copyright (C) 2012 NTT Corporation 10 まとめ ● Sheepdog は, ノウハウがあれば十分運用可能なレベルまで品質が 上がってきました – 1000 台規模でも動きます – 日本でも積極的な試用、評価をお待ちしてます – 今年末ごろに安定版 (Sheepdog 1.0) をリリース予定です ● Sheepdog は信頼性, 拡張性, 管理容易性の実現を目指した分散 ブロックストレージシステムです – クラウドストレージのデファクトスタンダードを目指しています ● その他の情報 – Project site: http://www.osrg.net/sheepdog/ – Mailing list ● Developers: sheepdog@lists.wpkg.org ● Users: sheepdog-users@lists.wpkg.org – Wiki: https://github.com/collie/sheepdog/wiki