SlideShare a Scribd company logo
1 of 23
Download to read offline
Confiden'al 
:Discussion 
purpose 
only 
Sensu Casual Talks #1 
ヤフー株式会社 
渡邉 貴志 
takaswat@yahoo-‐‑‒corp.jp 
Copyright 
(C) 
2012 
Yahoo 
Japan 
Corpora'on. 
All 
Rights 
Reserved.
⾃自⼰己紹介P2 
Confiden'al 
:Discussion 
purpose 
only 
Copyright 
(C) 
2012 
Yahoo 
Japan 
Corpora'on. 
All 
Rights 
Reserved. 
• 名前:渡邉 貴志 
• 職業:インフラエンジニア 
システム統括本部 サイトオペレーション本部 
インフラ技術3部 シスアド 
• 担当:サーバ(OS  ハード) 
• Linux, FreeBSD 
• ハイパーバイザ 
• 半導体メモリ 
 
• 最近の興味 
• 不不揮発性メモリ(PCM, ReRAM, MRAM, ...)
Sensu + Graphite を 
1年年運⽤用してみて 
 
-‐‑‒ 導⼊入に⾄至るまで 
-‐‑‒ 運⽤用あれこれ 
Confiden'al 
:Discussion 
purpose 
only 
P3 
Copyright 
(C) 
2012 
Yahoo 
Japan 
Corpora'on. 
All 
Rights 
Reserved.
導⼊入に⾄至るまでP4 
• 2011年年:内製 IaaS をローンチ 
急増する HV の運⽤用に追われる⽇日々 
↓ 
• 監視はカスタム Nagios を利利⽤用 
• 設定が煩雑 
• 監視サーバが分散しており運⽤用が⾯面倒 
• 死活監視程度度しかできてない 
• 可視化できてない 
• 運⽤用してておもしろくない 
Confiden'al 
:Discussion 
purpose 
only 
Copyright 
(C) 
2012 
Yahoo 
Japan 
Corpora'on. 
All 
Rights 
Reserved.
導⼊入に⾄至るまでP5 
• 2013年年:OpenStack へ切切り替え開始 
計画段階で HV 5000台 
ハイペースで投⼊入予定 
↓ 
• このままだと死ぬ! 
• 次世代監視サーバの選定 
↓ 
• Sensu + Graphite に決定 
Confiden'al 
:Discussion 
purpose 
only 
Copyright 
(C) 
2012 
Yahoo 
Japan 
Corpora'on. 
All 
Rights 
Reserved.
Sensu + Graphite にした理理由 P6 
• クライアント追加時にサーバ設定必要なし 
• Nagios 資産が流流⽤用できる 
• 描画 API がいいかんじ 
• どちらもスケールするアーキタイプ 
• Chef 使えばセットアップが楽 
• 既成 cookbook をカスタムして利利⽤用することに 
Confiden'al 
:Discussion 
purpose 
only 
Copyright 
(C) 
2012 
Yahoo 
Japan 
Corpora'on. 
All 
Rights 
Reserved. 
• portertech/chef-‐‑‒monitor 
• sensu/sensu-‐‑‒chef 
• subscriber と role が連動したり 
• LWRP が⽤用意されていたり
Confiden'al 
:Discussion 
purpose 
only 
P7 
とりあえず運⽤用開始 
Copyright 
(C) 
2012 
Yahoo 
Japan 
Corpora'on. 
All 
Rights 
Reserved. 
第1世代
第1世代:構成P8 
Hypervisor x N 
sensu-‐‑‒client 
redissensu-‐‑‒server 
Confiden'al 
:Discussion 
purpose 
only 
graphite-‐‑‒web 
conetxt-‐‑‒hashing 
replication=1 
Copyright 
(C) 
2012 
Yahoo 
Japan 
Corpora'on. 
All 
Rights 
Reserved. 
All-‐‑‒in-‐‑‒one Sensu Server x 1 
rabbitmq-‐‑‒server 
sensu-‐‑‒apisensu-‐‑‒dashboard 
carbon-‐‑‒relay server x 1 
carbon-‐‑‒relay 
carbon-‐‑‒cache server x 3 
carbon-‐‑‒cache
第1世代:構成P9 
Hypervisor x N 
sensu-‐‑‒client 
Xeon L5640 2.13GHz x 1 
DDR3-‐‑‒1333 2GB x 3 
300GB 15k SAS HDD x 4 (RAID1+0) 
Intel 5520 + IOH-‐‑‒36D  
redissensu-‐‑‒server 
Confiden'al 
:Discussion 
purpose 
only 
Sensu と同じ
graphite-‐‑‒web 
conetxt-‐‑‒hashing 
replication=1 
Xeon E5-‐‑‒2630L 2.00GHz x 2 
DDR3-‐‑‒1600 8GB x 8 
300GB 10k SAS HDD x 4 (RAID1+0) 
Intel C602 
Copyright 
(C) 
2012 
Yahoo 
Japan 
Corpora'on. 
All 
Rights 
Reserved. 
All-‐‑‒in-‐‑‒one Sensu Server x 1 
rabbitmq-‐‑‒server 
sensu-‐‑‒apisensu-‐‑‒dashboard 
carbon-‐‑‒relay server x 1 
carbon-‐‑‒relaycarbon-‐‑‒cache server x 3 
carbon-‐‑‒cache
第1世代:運⽤用P10 
• 開始時点のクライアント数は 200 弱 
• 500 ぐらいまで安定稼働 
 
Confiden'al 
:Discussion 
purpose 
only 
Copyright 
(C) 
2012 
Yahoo 
Japan 
Corpora'on. 
All 
Rights 
Reserved.
第1世代:運⽤用P11 
Confiden'al 
:Discussion 
purpose 
only 
Copyright 
(C) 
2012 
Yahoo 
Japan 
Corpora'on. 
All 
Rights 
Reserved. 
• sensu 
• LOG LEVEL = warn でローテ 
• max open files は増量量(server) 
• Checks:約10項⽬目 per 60sec 
• セキュリティチェック 
• リソースチェック 
• サービス / RAID 監視 
• etc... 
• 通知:1⽇日1回 
• メール:コミュニティのものをカスタム 
• 社内チャット:graphite グラフを添えて通知
第1世代:運⽤用P12 
Confiden'al 
:Discussion 
purpose 
only 
Copyright 
(C) 
2012 
Yahoo 
Japan 
Corpora'on. 
All 
Rights 
Reserved. 
• graphite 
• relay 
• スケール考えると consistent hash 1択 
• cache 
• HDD だと IO たりない 
• tmpfs でまかなうことに(55GB) 
• cron で定期的に永続化ジョブ実⾏行行 
• リテンションはテストして調整・キャパプラ 
• aggregator 
• 使いづらいし使わないほうがいいらしい 
• 集約するなら別の⼿手段を検討すべき
Confiden'al 
:Discussion 
purpose 
only 
P13 
Copyright 
(C) 
2012 
Yahoo 
Japan 
Corpora'on. 
All 
Rights 
Reserved. 
冗⻑⾧長化開始 
第2世代
第2世代:構成P14 
redissensu-‐‑‒server 
Confiden'al 
:Discussion 
purpose 
only 
Copyright 
(C) 
2012 
Yahoo 
Japan 
Corpora'on. 
All 
Rights 
Reserved. 
All-‐‑‒in-‐‑‒one Sensu Server x 3 
rabbitmq-‐‑‒server 
sensu-‐‑‒apisensu-‐‑‒dashboard 
carbon-‐‑‒relay server x 2 
carbon-‐‑‒relay 
carbon-‐‑‒cache server x 3 
carbon-‐‑‒cache 
Hypervisor x N 
sensu-‐‑‒client 
graphite-‐‑‒web 
conetxt-‐‑‒hashing 
replication=1
第2世代:運⽤用P15 
Confiden'al 
:Discussion 
purpose 
only 
Copyright 
(C) 
2012 
Yahoo 
Japan 
Corpora'on. 
All 
Rights 
Reserved. 
• Sensu 
• All-‐‑‒in-‐‑‒one を3台並べてロードバランス 
• redis は1台のみにむける 
• rabbitmq のミラーリングは無し 
• 最初してたけどキューが謎に暴暴発するのでやめた 
• ただしクラスタは組む 
 
• Graphite 
• carbon-‐‑‒relay 
• 同⼀一構成を2台並べてロードバランス
第2世代:運⽤用P16 
Confiden'al 
:Discussion 
purpose 
only 
Copyright 
(C) 
2012 
Yahoo 
Japan 
Corpora'on. 
All 
Rights 
Reserved. 
• クライアント数は 1000 弱 
• 設定ミスするとアラートが無双する... 
ntp 同期してない sensu-‐‑‒server を投⼊入してしまった図
Confiden'al 
:Discussion 
purpose 
only 
P17 
Copyright 
(C) 
2012 
Yahoo 
Japan 
Corpora'on. 
All 
Rights 
Reserved. 
本格運⽤用化 
第3世代
第3世代:構成 
redis server x 1 
Confiden'al 
:Discussion 
purpose 
only 
P18 
carbon-‐‑‒cache x N 
Copyright 
(C) 
2012 
Yahoo 
Japan 
Corpora'on. 
All 
Rights 
Reserved. 
dashboard server x 1 
sensu server x 30 
rabbitmq server x 3 
rabbitmq-‐‑‒server 
sensu-‐‑‒apiuchiwa 
sensu-‐‑‒server 
redis 
carbon-‐‑‒relay server x 2 
carbon-‐‑‒relay x N 
carbon-‐‑‒cache server x 6 
Hypervisor x N 
sensu-‐‑‒clienthaproxygraphite-‐‑‒web 
carbon-‐‑‒relay x N 
gluster 
conetxt-‐‑‒hashing 
replication=1 
conetxt-‐‑‒hashing 
replication=1 
replication=2
第3世代:運⽤用P19 
• クライアント数は 3000+ 
• VM のメトリクス取得開始でキューが急増 
• 1HV あたり 10VM+ 
• VM 作成者にサービスとしてグラフ API 提供 
Confiden'al 
:Discussion 
purpose 
only 
Copyright 
(C) 
2012 
Yahoo 
Japan 
Corpora'on. 
All 
Rights 
Reserved.
第3世代:運⽤用P20 
Confiden'al 
:Discussion 
purpose 
only 
スケールアウトしたときのキュー推移 
Copyright 
(C) 
2012 
Yahoo 
Japan 
Corpora'on. 
All 
Rights 
Reserved. 
• sensu 
• sensu-‐‑‒server on VM を並べてスケールアウト 
• スペックよりも数を重視 
• redis は現在冗⻑⾧長化中... 
• UI は uchiwa に切切り替え 
• v0.2+ になってずいぶん軽くなった
第3世代:運⽤用P21 
Confiden'al 
:Discussion 
purpose 
only 
Copyright 
(C) 
2012 
Yahoo 
Japan 
Corpora'on. 
All 
Rights 
Reserved. 
• graphite 
• LB → haproxy で受けて relay プロセスに分散 
• コア数に応じて daemon ⽴立立ち上げ(職⼈人芸) 
• carbon-‐‑‒relay = CPU bound 
• carbon-‐‑‒cache = IO bound 
• 管理理は megacarbon 利利⽤用(v0.10+) 
• ログが結構サイズをとるのでケアする必要あり 
• LOG_̲WRITES=false / LOG_̲CACHE_̲HITS = false 
• max open files 増量量必須 
• whisper ではなく ceres (v0.10+) 
• whisper はスケールアウト時にやや難あり 
• メンテスクリプトを cron で回す必要あり
Confiden'al 
:Discussion 
purpose 
only 
P22 
Copyright 
(C) 
2012 
Yahoo 
Japan 
Corpora'on. 
All 
Rights 
Reserved. 
まとめ
まとめP23 
• sensu + graphite を1年年運⽤用してみて 
• ⼤大規模な監視で⼗十分つかえる 
• ⾃自動で監視登録されるのは⾮非常に便便利利 
Confiden'al 
:Discussion 
purpose 
only 
Copyright 
(C) 
2012 
Yahoo 
Japan 
Corpora'on. 
All 
Rights 
Reserved. 
• どんどん投⼊入できる 
• フレキシブルで気軽に使える 
• とりあえず導⼊入して徐々にスケールできた 
• ただし CM ツール利利⽤用しないとつらいかも 
 
• 今後 
• メールハンドラを改良良する 
• ⼀一定時間分を畳み込んで送信するようなもの 
• よいものあれば教えてください 
• carbon-‐‑‒cache にフラッシュデバイスとか

More Related Content

What's hot

drecomにおけるwinning the metrics battle
drecomにおけるwinning the metrics battledrecomにおけるwinning the metrics battle
drecomにおけるwinning the metrics battleMitsuki Kenichi
 
Ceph Loves OpenStack: Why and How
Ceph Loves OpenStack: Why and HowCeph Loves OpenStack: Why and How
Ceph Loves OpenStack: Why and HowEmma Haruka Iwao
 
Seastar in 歌舞伎座.tech#8「C++初心者会」
Seastar in 歌舞伎座.tech#8「C++初心者会」Seastar in 歌舞伎座.tech#8「C++初心者会」
Seastar in 歌舞伎座.tech#8「C++初心者会」Takuya ASADA
 
MPSoCのPLの性能について
MPSoCのPLの性能についてMPSoCのPLの性能について
MPSoCのPLの性能についてmarsee101
 
H2O - making HTTP better
H2O - making HTTP betterH2O - making HTTP better
H2O - making HTTP betterKazuho Oku
 
Direct3D 12 Summary
Direct3D 12 SummaryDirect3D 12 Summary
Direct3D 12 Summaryshobomaru
 
LINEのMySQL運用について 修正版
LINEのMySQL運用について 修正版LINEのMySQL運用について 修正版
LINEのMySQL運用について 修正版LINE Corporation
 
第2回Web技術勉強会 webパフォーマンス改善編
第2回Web技術勉強会 webパフォーマンス改善編第2回Web技術勉強会 webパフォーマンス改善編
第2回Web技術勉強会 webパフォーマンス改善編tzm_freedom
 
ネットワーク ゲームにおけるTCPとUDPの使い分け
ネットワーク ゲームにおけるTCPとUDPの使い分けネットワーク ゲームにおけるTCPとUDPの使い分け
ネットワーク ゲームにおけるTCPとUDPの使い分けモノビット エンジン
 
Ceph Day Tokyo - High Performance Layered Architecture
Ceph Day Tokyo - High Performance Layered Architecture  Ceph Day Tokyo - High Performance Layered Architecture
Ceph Day Tokyo - High Performance Layered Architecture Ceph Community
 
Fluentdでログを集めてGlusterFSに保存してMapReduceで集計
Fluentdでログを集めてGlusterFSに保存してMapReduceで集計Fluentdでログを集めてGlusterFSに保存してMapReduceで集計
Fluentdでログを集めてGlusterFSに保存してMapReduceで集計maebashi
 
CephとGluster次期バージョンでの新機能
CephとGluster次期バージョンでの新機能CephとGluster次期バージョンでの新機能
CephとGluster次期バージョンでの新機能Emma Haruka Iwao
 
GTC 2017 基調講演からディープラーニング関連情報のご紹介
GTC 2017 基調講演からディープラーニング関連情報のご紹介GTC 2017 基調講演からディープラーニング関連情報のご紹介
GTC 2017 基調講演からディープラーニング関連情報のご紹介NVIDIA Japan
 
仮想化環境の設計手法 〜プロのテクニック教えます〜
仮想化環境の設計手法 〜プロのテクニック教えます〜仮想化環境の設計手法 〜プロのテクニック教えます〜
仮想化環境の設計手法 〜プロのテクニック教えます〜VirtualTech Japan Inc.
 
Db2 Warehouse ご紹介資料 20170922
Db2 Warehouse ご紹介資料 20170922Db2 Warehouse ご紹介資料 20170922
Db2 Warehouse ご紹介資料 20170922IBM Analytics Japan
 
Starting qt5beta at_raspberry_pi Qtnagoya#6
Starting qt5beta at_raspberry_pi Qtnagoya#6Starting qt5beta at_raspberry_pi Qtnagoya#6
Starting qt5beta at_raspberry_pi Qtnagoya#6Kazuo Asano (@kazuo_asa)
 
NetBSD/evbarm on Raspberry Pi
NetBSD/evbarm on Raspberry PiNetBSD/evbarm on Raspberry Pi
NetBSD/evbarm on Raspberry Pitokudahiroshi
 
仮想化環境の設計手法〜プロのテクニック教えます〜
仮想化環境の設計手法〜プロのテクニック教えます〜仮想化環境の設計手法〜プロのテクニック教えます〜
仮想化環境の設計手法〜プロのテクニック教えます〜VirtualTech Japan Inc.
 

What's hot (20)

Kernel vm-2014-05-25
Kernel vm-2014-05-25Kernel vm-2014-05-25
Kernel vm-2014-05-25
 
drecomにおけるwinning the metrics battle
drecomにおけるwinning the metrics battledrecomにおけるwinning the metrics battle
drecomにおけるwinning the metrics battle
 
Ceph Loves OpenStack: Why and How
Ceph Loves OpenStack: Why and HowCeph Loves OpenStack: Why and How
Ceph Loves OpenStack: Why and How
 
Seastar in 歌舞伎座.tech#8「C++初心者会」
Seastar in 歌舞伎座.tech#8「C++初心者会」Seastar in 歌舞伎座.tech#8「C++初心者会」
Seastar in 歌舞伎座.tech#8「C++初心者会」
 
MPSoCのPLの性能について
MPSoCのPLの性能についてMPSoCのPLの性能について
MPSoCのPLの性能について
 
H2O - making HTTP better
H2O - making HTTP betterH2O - making HTTP better
H2O - making HTTP better
 
Direct3D 12 Summary
Direct3D 12 SummaryDirect3D 12 Summary
Direct3D 12 Summary
 
LINEのMySQL運用について 修正版
LINEのMySQL運用について 修正版LINEのMySQL運用について 修正版
LINEのMySQL運用について 修正版
 
第2回Web技術勉強会 webパフォーマンス改善編
第2回Web技術勉強会 webパフォーマンス改善編第2回Web技術勉強会 webパフォーマンス改善編
第2回Web技術勉強会 webパフォーマンス改善編
 
ネットワーク ゲームにおけるTCPとUDPの使い分け
ネットワーク ゲームにおけるTCPとUDPの使い分けネットワーク ゲームにおけるTCPとUDPの使い分け
ネットワーク ゲームにおけるTCPとUDPの使い分け
 
Ceph Day Tokyo - High Performance Layered Architecture
Ceph Day Tokyo - High Performance Layered Architecture  Ceph Day Tokyo - High Performance Layered Architecture
Ceph Day Tokyo - High Performance Layered Architecture
 
Fluentdでログを集めてGlusterFSに保存してMapReduceで集計
Fluentdでログを集めてGlusterFSに保存してMapReduceで集計Fluentdでログを集めてGlusterFSに保存してMapReduceで集計
Fluentdでログを集めてGlusterFSに保存してMapReduceで集計
 
CephとGluster次期バージョンでの新機能
CephとGluster次期バージョンでの新機能CephとGluster次期バージョンでの新機能
CephとGluster次期バージョンでの新機能
 
Kafka・Storm・ZooKeeperの認証と認可について #kafkajp
Kafka・Storm・ZooKeeperの認証と認可について #kafkajpKafka・Storm・ZooKeeperの認証と認可について #kafkajp
Kafka・Storm・ZooKeeperの認証と認可について #kafkajp
 
GTC 2017 基調講演からディープラーニング関連情報のご紹介
GTC 2017 基調講演からディープラーニング関連情報のご紹介GTC 2017 基調講演からディープラーニング関連情報のご紹介
GTC 2017 基調講演からディープラーニング関連情報のご紹介
 
仮想化環境の設計手法 〜プロのテクニック教えます〜
仮想化環境の設計手法 〜プロのテクニック教えます〜仮想化環境の設計手法 〜プロのテクニック教えます〜
仮想化環境の設計手法 〜プロのテクニック教えます〜
 
Db2 Warehouse ご紹介資料 20170922
Db2 Warehouse ご紹介資料 20170922Db2 Warehouse ご紹介資料 20170922
Db2 Warehouse ご紹介資料 20170922
 
Starting qt5beta at_raspberry_pi Qtnagoya#6
Starting qt5beta at_raspberry_pi Qtnagoya#6Starting qt5beta at_raspberry_pi Qtnagoya#6
Starting qt5beta at_raspberry_pi Qtnagoya#6
 
NetBSD/evbarm on Raspberry Pi
NetBSD/evbarm on Raspberry PiNetBSD/evbarm on Raspberry Pi
NetBSD/evbarm on Raspberry Pi
 
仮想化環境の設計手法〜プロのテクニック教えます〜
仮想化環境の設計手法〜プロのテクニック教えます〜仮想化環境の設計手法〜プロのテクニック教えます〜
仮想化環境の設計手法〜プロのテクニック教えます〜
 

Viewers also liked

Serverspec and Sensu - Testing and Monitoring collide
Serverspec and Sensu - Testing and Monitoring collideServerspec and Sensu - Testing and Monitoring collide
Serverspec and Sensu - Testing and Monitoring collidem_richardson
 
Serverspecを使ってみた話
Serverspecを使ってみた話Serverspecを使ってみた話
Serverspecを使ってみた話Yasufumi Moritake
 
俺のZabbixがこんなに可愛いわけがない
俺のZabbixがこんなに可愛いわけがない俺のZabbixがこんなに可愛いわけがない
俺のZabbixがこんなに可愛いわけがないSeiichiro Ishida
 
Verifying your Ansible Roles using Docker, Test Kitchen and Serverspec
Verifying your Ansible Roles using Docker, Test Kitchen and ServerspecVerifying your Ansible Roles using Docker, Test Kitchen and Serverspec
Verifying your Ansible Roles using Docker, Test Kitchen and ServerspecEdmund Dipple
 
【Qp08】ざびたん2リリース報告lt 20111022
【Qp08】ざびたん2リリース報告lt 20111022【Qp08】ざびたん2リリース報告lt 20111022
【Qp08】ざびたん2リリース報告lt 20111022Seiichiro Ishida
 
Start Haskell - Exercise 13 1
Start Haskell - Exercise 13 1Start Haskell - Exercise 13 1
Start Haskell - Exercise 13 1ymmtmsys
 
sensuのちょっと進んだ使い方
sensuのちょっと進んだ使い方sensuのちょっと進んだ使い方
sensuのちょっと進んだ使い方正貴 小川
 
俺のZabbixがこんなに可愛いわけがない(おかわり)
俺のZabbixがこんなに可愛いわけがない(おかわり) 俺のZabbixがこんなに可愛いわけがない(おかわり)
俺のZabbixがこんなに可愛いわけがない(おかわり) Seiichiro Ishida
 
OSS監視ツールSensuの紹介
OSS監視ツールSensuの紹介OSS監視ツールSensuの紹介
OSS監視ツールSensuの紹介Akihiko Horiuchi
 
ZABBIXでメトリクス監視の話
ZABBIXでメトリクス監視の話ZABBIXでメトリクス監視の話
ZABBIXでメトリクス監視の話kenjiskywalkerslide
 
2015 07 31_yashin_project
2015 07 31_yashin_project2015 07 31_yashin_project
2015 07 31_yashin_projectDaegwon Kim
 
Continuous infrastructure testing
Continuous infrastructure testingContinuous infrastructure testing
Continuous infrastructure testingDaniel Paulus
 
第6回zabbix jp勉強会資料
第6回zabbix jp勉強会資料第6回zabbix jp勉強会資料
第6回zabbix jp勉強会資料Daisuke Ikeda
 
Automated Infrastructure Testing
Automated Infrastructure TestingAutomated Infrastructure Testing
Automated Infrastructure TestingRanjib Dey
 
도커(Docker) 메트릭스 & 로그 수집
도커(Docker) 메트릭스 & 로그 수집도커(Docker) 메트릭스 & 로그 수집
도커(Docker) 메트릭스 & 로그 수집Daegwon Kim
 
Sensuでネットワーク監視やってみた
Sensuでネットワーク監視やってみたSensuでネットワーク監視やってみた
Sensuでネットワーク監視やってみたAkihiko Horiuchi
 

Viewers also liked (16)

Serverspec and Sensu - Testing and Monitoring collide
Serverspec and Sensu - Testing and Monitoring collideServerspec and Sensu - Testing and Monitoring collide
Serverspec and Sensu - Testing and Monitoring collide
 
Serverspecを使ってみた話
Serverspecを使ってみた話Serverspecを使ってみた話
Serverspecを使ってみた話
 
俺のZabbixがこんなに可愛いわけがない
俺のZabbixがこんなに可愛いわけがない俺のZabbixがこんなに可愛いわけがない
俺のZabbixがこんなに可愛いわけがない
 
Verifying your Ansible Roles using Docker, Test Kitchen and Serverspec
Verifying your Ansible Roles using Docker, Test Kitchen and ServerspecVerifying your Ansible Roles using Docker, Test Kitchen and Serverspec
Verifying your Ansible Roles using Docker, Test Kitchen and Serverspec
 
【Qp08】ざびたん2リリース報告lt 20111022
【Qp08】ざびたん2リリース報告lt 20111022【Qp08】ざびたん2リリース報告lt 20111022
【Qp08】ざびたん2リリース報告lt 20111022
 
Start Haskell - Exercise 13 1
Start Haskell - Exercise 13 1Start Haskell - Exercise 13 1
Start Haskell - Exercise 13 1
 
sensuのちょっと進んだ使い方
sensuのちょっと進んだ使い方sensuのちょっと進んだ使い方
sensuのちょっと進んだ使い方
 
俺のZabbixがこんなに可愛いわけがない(おかわり)
俺のZabbixがこんなに可愛いわけがない(おかわり) 俺のZabbixがこんなに可愛いわけがない(おかわり)
俺のZabbixがこんなに可愛いわけがない(おかわり)
 
OSS監視ツールSensuの紹介
OSS監視ツールSensuの紹介OSS監視ツールSensuの紹介
OSS監視ツールSensuの紹介
 
ZABBIXでメトリクス監視の話
ZABBIXでメトリクス監視の話ZABBIXでメトリクス監視の話
ZABBIXでメトリクス監視の話
 
2015 07 31_yashin_project
2015 07 31_yashin_project2015 07 31_yashin_project
2015 07 31_yashin_project
 
Continuous infrastructure testing
Continuous infrastructure testingContinuous infrastructure testing
Continuous infrastructure testing
 
第6回zabbix jp勉強会資料
第6回zabbix jp勉強会資料第6回zabbix jp勉強会資料
第6回zabbix jp勉強会資料
 
Automated Infrastructure Testing
Automated Infrastructure TestingAutomated Infrastructure Testing
Automated Infrastructure Testing
 
도커(Docker) 메트릭스 & 로그 수집
도커(Docker) 메트릭스 & 로그 수집도커(Docker) 메트릭스 & 로그 수집
도커(Docker) 메트릭스 & 로그 수집
 
Sensuでネットワーク監視やってみた
Sensuでネットワーク監視やってみたSensuでネットワーク監視やってみた
Sensuでネットワーク監視やってみた
 

Similar to Sensu + Graphite を1年運⽤してみて #sensucasual

Hadoop operation chaper 4
Hadoop operation chaper 4Hadoop operation chaper 4
Hadoop operation chaper 4Yukinori Suda
 
Cocos2d-x 3.0を使ったゲーム “消滅都市” の開発事例
Cocos2d-x 3.0を使ったゲーム “消滅都市” の開発事例Cocos2d-x 3.0を使ったゲーム “消滅都市” の開発事例
Cocos2d-x 3.0を使ったゲーム “消滅都市” の開発事例gree_tech
 
HPCフォーラム2015 A-2 グローバル設計環境に欠かせないHP ProLiantサーバー 久保田隆志
HPCフォーラム2015 A-2 グローバル設計環境に欠かせないHP ProLiantサーバー  久保田隆志HPCフォーラム2015 A-2 グローバル設計環境に欠かせないHP ProLiantサーバー  久保田隆志
HPCフォーラム2015 A-2 グローバル設計環境に欠かせないHP ProLiantサーバー 久保田隆志日本ヒューレット・パッカード株式会社
 
KubeCon EU報告(ランタイム関連,イメージ関連)
KubeCon EU報告(ランタイム関連,イメージ関連)KubeCon EU報告(ランタイム関連,イメージ関連)
KubeCon EU報告(ランタイム関連,イメージ関連)Akihiro Suda
 
シンラ・テクノロジー第2回クラウドゲーム開発者会議
シンラ・テクノロジー第2回クラウドゲーム開発者会議シンラ・テクノロジー第2回クラウドゲーム開発者会議
シンラ・テクノロジー第2回クラウドゲーム開発者会議Shinra_Technologies
 
Craft CMSに最適なサーバはどんな環境?
Craft CMSに最適なサーバはどんな環境?Craft CMSに最適なサーバはどんな環境?
Craft CMSに最適なサーバはどんな環境?Kei Mikage
 
Openstack neutron vtjseminar_20160302
Openstack neutron vtjseminar_20160302Openstack neutron vtjseminar_20160302
Openstack neutron vtjseminar_20160302Takehiro Kudou
 
知っているようで知らないNeutron -仮想ルータの冗長と分散- - OpenStack最新情報セミナー 2016年3月
知っているようで知らないNeutron -仮想ルータの冗長と分散- - OpenStack最新情報セミナー 2016年3月 知っているようで知らないNeutron -仮想ルータの冗長と分散- - OpenStack最新情報セミナー 2016年3月
知っているようで知らないNeutron -仮想ルータの冗長と分散- - OpenStack最新情報セミナー 2016年3月 VirtualTech Japan Inc.
 
NHNグループ合同勉強会 ライブドア片野
NHNグループ合同勉強会 ライブドア片野NHNグループ合同勉強会 ライブドア片野
NHNグループ合同勉強会 ライブドア片野livedoor
 
GMOメディア RHEV-S-事例紹介
GMOメディア RHEV-S-事例紹介GMOメディア RHEV-S-事例紹介
GMOメディア RHEV-S-事例紹介Dai Utsui
 
ゆるふわLinux-HA 〜PostgreSQL編〜
ゆるふわLinux-HA 〜PostgreSQL編〜ゆるふわLinux-HA 〜PostgreSQL編〜
ゆるふわLinux-HA 〜PostgreSQL編〜Taro Matsuzawa
 
Web サービス インフラの近未来
Web サービス インフラの近未来Web サービス インフラの近未来
Web サービス インフラの近未来Syuichi Murashima
 
ニフティクラウドアップデート in クラウドごった煮@青森
ニフティクラウドアップデート in クラウドごった煮@青森ニフティクラウドアップデート in クラウドごった煮@青森
ニフティクラウドアップデート in クラウドごった煮@青森亮介 山口
 
[D20] 高速Software Switch/Router 開発から得られた高性能ソフトウェアルータ・スイッチ活用の知見 (July Tech Fest...
[D20] 高速Software Switch/Router 開発から得られた高性能ソフトウェアルータ・スイッチ活用の知見 (July Tech Fest...[D20] 高速Software Switch/Router 開発から得られた高性能ソフトウェアルータ・スイッチ活用の知見 (July Tech Fest...
[D20] 高速Software Switch/Router 開発から得られた高性能ソフトウェアルータ・スイッチ活用の知見 (July Tech Fest...Tomoya Hibi
 
OpenStackでつくる開発環境と外道塾
OpenStackでつくる開発環境と外道塾OpenStackでつくる開発環境と外道塾
OpenStackでつくる開発環境と外道塾外道 父
 
Windows Server 2019 の Hyper-Converged Infrastructure (HCI)
Windows Server 2019 の Hyper-Converged Infrastructure (HCI) Windows Server 2019 の Hyper-Converged Infrastructure (HCI)
Windows Server 2019 の Hyper-Converged Infrastructure (HCI) Hiroshi Matsumoto
 

Similar to Sensu + Graphite を1年運⽤してみて #sensucasual (20)

Hadoop operation chaper 4
Hadoop operation chaper 4Hadoop operation chaper 4
Hadoop operation chaper 4
 
Cocos2d-x 3.0を使ったゲーム “消滅都市” の開発事例
Cocos2d-x 3.0を使ったゲーム “消滅都市” の開発事例Cocos2d-x 3.0を使ったゲーム “消滅都市” の開発事例
Cocos2d-x 3.0を使ったゲーム “消滅都市” の開発事例
 
HPCフォーラム2015 A-2 グローバル設計環境に欠かせないHP ProLiantサーバー 久保田隆志
HPCフォーラム2015 A-2 グローバル設計環境に欠かせないHP ProLiantサーバー  久保田隆志HPCフォーラム2015 A-2 グローバル設計環境に欠かせないHP ProLiantサーバー  久保田隆志
HPCフォーラム2015 A-2 グローバル設計環境に欠かせないHP ProLiantサーバー 久保田隆志
 
Storm×couchbase serverで作るリアルタイム解析基盤
Storm×couchbase serverで作るリアルタイム解析基盤Storm×couchbase serverで作るリアルタイム解析基盤
Storm×couchbase serverで作るリアルタイム解析基盤
 
[dbts-2014-tokyo] 目指せExadata!! Oracle DB高速化を目指した構成
[dbts-2014-tokyo] 目指せExadata!! Oracle DB高速化を目指した構成[dbts-2014-tokyo] 目指せExadata!! Oracle DB高速化を目指した構成
[dbts-2014-tokyo] 目指せExadata!! Oracle DB高速化を目指した構成
 
KubeCon EU報告(ランタイム関連,イメージ関連)
KubeCon EU報告(ランタイム関連,イメージ関連)KubeCon EU報告(ランタイム関連,イメージ関連)
KubeCon EU報告(ランタイム関連,イメージ関連)
 
シンラ・テクノロジー第2回クラウドゲーム開発者会議
シンラ・テクノロジー第2回クラウドゲーム開発者会議シンラ・テクノロジー第2回クラウドゲーム開発者会議
シンラ・テクノロジー第2回クラウドゲーム開発者会議
 
第24回「IBM STGエバンジェリスト座談会 2013年のインフラエンジニアの生き方」(2013/01/17 on しすなま!)
第24回「IBM STGエバンジェリスト座談会 2013年のインフラエンジニアの生き方」(2013/01/17 on しすなま!)第24回「IBM STGエバンジェリスト座談会 2013年のインフラエンジニアの生き方」(2013/01/17 on しすなま!)
第24回「IBM STGエバンジェリスト座談会 2013年のインフラエンジニアの生き方」(2013/01/17 on しすなま!)
 
Craft CMSに最適なサーバはどんな環境?
Craft CMSに最適なサーバはどんな環境?Craft CMSに最適なサーバはどんな環境?
Craft CMSに最適なサーバはどんな環境?
 
Openstack neutron vtjseminar_20160302
Openstack neutron vtjseminar_20160302Openstack neutron vtjseminar_20160302
Openstack neutron vtjseminar_20160302
 
知っているようで知らないNeutron -仮想ルータの冗長と分散- - OpenStack最新情報セミナー 2016年3月
知っているようで知らないNeutron -仮想ルータの冗長と分散- - OpenStack最新情報セミナー 2016年3月 知っているようで知らないNeutron -仮想ルータの冗長と分散- - OpenStack最新情報セミナー 2016年3月
知っているようで知らないNeutron -仮想ルータの冗長と分散- - OpenStack最新情報セミナー 2016年3月
 
NHNグループ合同勉強会 ライブドア片野
NHNグループ合同勉強会 ライブドア片野NHNグループ合同勉強会 ライブドア片野
NHNグループ合同勉強会 ライブドア片野
 
GMOメディア RHEV-S-事例紹介
GMOメディア RHEV-S-事例紹介GMOメディア RHEV-S-事例紹介
GMOメディア RHEV-S-事例紹介
 
ゆるふわLinux-HA 〜PostgreSQL編〜
ゆるふわLinux-HA 〜PostgreSQL編〜ゆるふわLinux-HA 〜PostgreSQL編〜
ゆるふわLinux-HA 〜PostgreSQL編〜
 
Web サービス インフラの近未来
Web サービス インフラの近未来Web サービス インフラの近未来
Web サービス インフラの近未来
 
osoljp 2011.08
osoljp 2011.08osoljp 2011.08
osoljp 2011.08
 
ニフティクラウドアップデート in クラウドごった煮@青森
ニフティクラウドアップデート in クラウドごった煮@青森ニフティクラウドアップデート in クラウドごった煮@青森
ニフティクラウドアップデート in クラウドごった煮@青森
 
[D20] 高速Software Switch/Router 開発から得られた高性能ソフトウェアルータ・スイッチ活用の知見 (July Tech Fest...
[D20] 高速Software Switch/Router 開発から得られた高性能ソフトウェアルータ・スイッチ活用の知見 (July Tech Fest...[D20] 高速Software Switch/Router 開発から得られた高性能ソフトウェアルータ・スイッチ活用の知見 (July Tech Fest...
[D20] 高速Software Switch/Router 開発から得られた高性能ソフトウェアルータ・スイッチ活用の知見 (July Tech Fest...
 
OpenStackでつくる開発環境と外道塾
OpenStackでつくる開発環境と外道塾OpenStackでつくる開発環境と外道塾
OpenStackでつくる開発環境と外道塾
 
Windows Server 2019 の Hyper-Converged Infrastructure (HCI)
Windows Server 2019 の Hyper-Converged Infrastructure (HCI) Windows Server 2019 の Hyper-Converged Infrastructure (HCI)
Windows Server 2019 の Hyper-Converged Infrastructure (HCI)
 

More from Yahoo!デベロッパーネットワーク

ヤフーでは開発迅速性と品質のバランスをどう取ってるか
ヤフーでは開発迅速性と品質のバランスをどう取ってるかヤフーでは開発迅速性と品質のバランスをどう取ってるか
ヤフーでは開発迅速性と品質のバランスをどう取ってるかYahoo!デベロッパーネットワーク
 
データの価値を最大化させるためのデザイン~データビジュアライゼーションの方法~ #devsumi 17-E-2
データの価値を最大化させるためのデザイン~データビジュアライゼーションの方法~ #devsumi 17-E-2データの価値を最大化させるためのデザイン~データビジュアライゼーションの方法~ #devsumi 17-E-2
データの価値を最大化させるためのデザイン~データビジュアライゼーションの方法~ #devsumi 17-E-2Yahoo!デベロッパーネットワーク
 
ヤフーを支えるセキュリティ ~サイバー攻撃を防ぐエンジニアの仕事とは~ #yjtc
ヤフーを支えるセキュリティ ~サイバー攻撃を防ぐエンジニアの仕事とは~ #yjtcヤフーを支えるセキュリティ ~サイバー攻撃を防ぐエンジニアの仕事とは~ #yjtc
ヤフーを支えるセキュリティ ~サイバー攻撃を防ぐエンジニアの仕事とは~ #yjtcYahoo!デベロッパーネットワーク
 
Yahoo! JAPANのIaaSを支えるKubernetesクラスタ、アップデート自動化への挑戦 #yjtc
Yahoo! JAPANのIaaSを支えるKubernetesクラスタ、アップデート自動化への挑戦 #yjtcYahoo! JAPANのIaaSを支えるKubernetesクラスタ、アップデート自動化への挑戦 #yjtc
Yahoo! JAPANのIaaSを支えるKubernetesクラスタ、アップデート自動化への挑戦 #yjtcYahoo!デベロッパーネットワーク
 
ヤフーのAIプラットフォーム紹介 ~AIテックカンパニーを支えるデータ基盤~ #yjtc
ヤフーのAIプラットフォーム紹介 ~AIテックカンパニーを支えるデータ基盤~ #yjtcヤフーのAIプラットフォーム紹介 ~AIテックカンパニーを支えるデータ基盤~ #yjtc
ヤフーのAIプラットフォーム紹介 ~AIテックカンパニーを支えるデータ基盤~ #yjtcYahoo!デベロッパーネットワーク
 
新技術を使った次世代の商品の見せ方 ~ヤフオク!のマルチビュー機能~ #yjtc
新技術を使った次世代の商品の見せ方 ~ヤフオク!のマルチビュー機能~ #yjtc新技術を使った次世代の商品の見せ方 ~ヤフオク!のマルチビュー機能~ #yjtc
新技術を使った次世代の商品の見せ方 ~ヤフオク!のマルチビュー機能~ #yjtcYahoo!デベロッパーネットワーク
 
PC版Yahoo!メールリニューアル ~サービスのUI/UX統合と改善プロセス~ #yjtc
PC版Yahoo!メールリニューアル ~サービスのUI/UX統合と改善プロセス~ #yjtcPC版Yahoo!メールリニューアル ~サービスのUI/UX統合と改善プロセス~ #yjtc
PC版Yahoo!メールリニューアル ~サービスのUI/UX統合と改善プロセス~ #yjtcYahoo!デベロッパーネットワーク
 
モブデザインによる多職種チームのコミュニケーション改善 #yjtc
モブデザインによる多職種チームのコミュニケーション改善 #yjtcモブデザインによる多職種チームのコミュニケーション改善 #yjtc
モブデザインによる多職種チームのコミュニケーション改善 #yjtcYahoo!デベロッパーネットワーク
 
ユーザーの地域を考慮した検索入力補助機能の改善の試み #yjtc
ユーザーの地域を考慮した検索入力補助機能の改善の試み #yjtcユーザーの地域を考慮した検索入力補助機能の改善の試み #yjtc
ユーザーの地域を考慮した検索入力補助機能の改善の試み #yjtcYahoo!デベロッパーネットワーク
 

More from Yahoo!デベロッパーネットワーク (20)

ゼロから始める転移学習
ゼロから始める転移学習ゼロから始める転移学習
ゼロから始める転移学習
 
継続的なモデルモニタリングを実現するKubernetes Operator
継続的なモデルモニタリングを実現するKubernetes Operator継続的なモデルモニタリングを実現するKubernetes Operator
継続的なモデルモニタリングを実現するKubernetes Operator
 
ヤフーでは開発迅速性と品質のバランスをどう取ってるか
ヤフーでは開発迅速性と品質のバランスをどう取ってるかヤフーでは開発迅速性と品質のバランスをどう取ってるか
ヤフーでは開発迅速性と品質のバランスをどう取ってるか
 
オンプレML基盤on Kubernetes パネルディスカッション
オンプレML基盤on Kubernetes パネルディスカッションオンプレML基盤on Kubernetes パネルディスカッション
オンプレML基盤on Kubernetes パネルディスカッション
 
LakeTahoe
LakeTahoeLakeTahoe
LakeTahoe
 
オンプレML基盤on Kubernetes 〜Yahoo! JAPAN AIPF〜
オンプレML基盤on Kubernetes 〜Yahoo! JAPAN AIPF〜オンプレML基盤on Kubernetes 〜Yahoo! JAPAN AIPF〜
オンプレML基盤on Kubernetes 〜Yahoo! JAPAN AIPF〜
 
Persistent-memory-native Database High-availability Feature
Persistent-memory-native Database High-availability FeaturePersistent-memory-native Database High-availability Feature
Persistent-memory-native Database High-availability Feature
 
データの価値を最大化させるためのデザイン~データビジュアライゼーションの方法~ #devsumi 17-E-2
データの価値を最大化させるためのデザイン~データビジュアライゼーションの方法~ #devsumi 17-E-2データの価値を最大化させるためのデザイン~データビジュアライゼーションの方法~ #devsumi 17-E-2
データの価値を最大化させるためのデザイン~データビジュアライゼーションの方法~ #devsumi 17-E-2
 
eコマースと実店舗の相互利益を目指したデザイン #yjtc
eコマースと実店舗の相互利益を目指したデザイン #yjtceコマースと実店舗の相互利益を目指したデザイン #yjtc
eコマースと実店舗の相互利益を目指したデザイン #yjtc
 
ヤフーを支えるセキュリティ ~サイバー攻撃を防ぐエンジニアの仕事とは~ #yjtc
ヤフーを支えるセキュリティ ~サイバー攻撃を防ぐエンジニアの仕事とは~ #yjtcヤフーを支えるセキュリティ ~サイバー攻撃を防ぐエンジニアの仕事とは~ #yjtc
ヤフーを支えるセキュリティ ~サイバー攻撃を防ぐエンジニアの仕事とは~ #yjtc
 
Yahoo! JAPANのIaaSを支えるKubernetesクラスタ、アップデート自動化への挑戦 #yjtc
Yahoo! JAPANのIaaSを支えるKubernetesクラスタ、アップデート自動化への挑戦 #yjtcYahoo! JAPANのIaaSを支えるKubernetesクラスタ、アップデート自動化への挑戦 #yjtc
Yahoo! JAPANのIaaSを支えるKubernetesクラスタ、アップデート自動化への挑戦 #yjtc
 
ビッグデータから人々のムードを捉える #yjtc
ビッグデータから人々のムードを捉える #yjtcビッグデータから人々のムードを捉える #yjtc
ビッグデータから人々のムードを捉える #yjtc
 
サイエンス領域におけるMLOpsの取り組み #yjtc
サイエンス領域におけるMLOpsの取り組み #yjtcサイエンス領域におけるMLOpsの取り組み #yjtc
サイエンス領域におけるMLOpsの取り組み #yjtc
 
ヤフーのAIプラットフォーム紹介 ~AIテックカンパニーを支えるデータ基盤~ #yjtc
ヤフーのAIプラットフォーム紹介 ~AIテックカンパニーを支えるデータ基盤~ #yjtcヤフーのAIプラットフォーム紹介 ~AIテックカンパニーを支えるデータ基盤~ #yjtc
ヤフーのAIプラットフォーム紹介 ~AIテックカンパニーを支えるデータ基盤~ #yjtc
 
Yahoo! JAPAN Tech Conference 2022 Day2 Keynote #yjtc
Yahoo! JAPAN Tech Conference 2022 Day2 Keynote #yjtcYahoo! JAPAN Tech Conference 2022 Day2 Keynote #yjtc
Yahoo! JAPAN Tech Conference 2022 Day2 Keynote #yjtc
 
新技術を使った次世代の商品の見せ方 ~ヤフオク!のマルチビュー機能~ #yjtc
新技術を使った次世代の商品の見せ方 ~ヤフオク!のマルチビュー機能~ #yjtc新技術を使った次世代の商品の見せ方 ~ヤフオク!のマルチビュー機能~ #yjtc
新技術を使った次世代の商品の見せ方 ~ヤフオク!のマルチビュー機能~ #yjtc
 
PC版Yahoo!メールリニューアル ~サービスのUI/UX統合と改善プロセス~ #yjtc
PC版Yahoo!メールリニューアル ~サービスのUI/UX統合と改善プロセス~ #yjtcPC版Yahoo!メールリニューアル ~サービスのUI/UX統合と改善プロセス~ #yjtc
PC版Yahoo!メールリニューアル ~サービスのUI/UX統合と改善プロセス~ #yjtc
 
モブデザインによる多職種チームのコミュニケーション改善 #yjtc
モブデザインによる多職種チームのコミュニケーション改善 #yjtcモブデザインによる多職種チームのコミュニケーション改善 #yjtc
モブデザインによる多職種チームのコミュニケーション改善 #yjtc
 
「新しいおうち探し」のためのAIアシスト検索 #yjtc
「新しいおうち探し」のためのAIアシスト検索 #yjtc「新しいおうち探し」のためのAIアシスト検索 #yjtc
「新しいおうち探し」のためのAIアシスト検索 #yjtc
 
ユーザーの地域を考慮した検索入力補助機能の改善の試み #yjtc
ユーザーの地域を考慮した検索入力補助機能の改善の試み #yjtcユーザーの地域を考慮した検索入力補助機能の改善の試み #yjtc
ユーザーの地域を考慮した検索入力補助機能の改善の試み #yjtc
 

Sensu + Graphite を1年運⽤してみて #sensucasual

  • 1. Confiden'al :Discussion purpose only Sensu Casual Talks #1 ヤフー株式会社 渡邉 貴志 takaswat@yahoo-‐‑‒corp.jp Copyright (C) 2012 Yahoo Japan Corpora'on. All Rights Reserved.
  • 2. ⾃自⼰己紹介P2 Confiden'al :Discussion purpose only Copyright (C) 2012 Yahoo Japan Corpora'on. All Rights Reserved. • 名前:渡邉 貴志 • 職業:インフラエンジニア システム統括本部 サイトオペレーション本部 インフラ技術3部 シスアド • 担当:サーバ(OS ハード) • Linux, FreeBSD • ハイパーバイザ • 半導体メモリ • 最近の興味 • 不不揮発性メモリ(PCM, ReRAM, MRAM, ...)
  • 3. Sensu + Graphite を 1年年運⽤用してみて -‐‑‒ 導⼊入に⾄至るまで -‐‑‒ 運⽤用あれこれ Confiden'al :Discussion purpose only P3 Copyright (C) 2012 Yahoo Japan Corpora'on. All Rights Reserved.
  • 4. 導⼊入に⾄至るまでP4 • 2011年年:内製 IaaS をローンチ 急増する HV の運⽤用に追われる⽇日々 ↓ • 監視はカスタム Nagios を利利⽤用 • 設定が煩雑 • 監視サーバが分散しており運⽤用が⾯面倒 • 死活監視程度度しかできてない • 可視化できてない • 運⽤用してておもしろくない Confiden'al :Discussion purpose only Copyright (C) 2012 Yahoo Japan Corpora'on. All Rights Reserved.
  • 5. 導⼊入に⾄至るまでP5 • 2013年年:OpenStack へ切切り替え開始 計画段階で HV 5000台 ハイペースで投⼊入予定 ↓ • このままだと死ぬ! • 次世代監視サーバの選定 ↓ • Sensu + Graphite に決定 Confiden'al :Discussion purpose only Copyright (C) 2012 Yahoo Japan Corpora'on. All Rights Reserved.
  • 6. Sensu + Graphite にした理理由 P6 • クライアント追加時にサーバ設定必要なし • Nagios 資産が流流⽤用できる • 描画 API がいいかんじ • どちらもスケールするアーキタイプ • Chef 使えばセットアップが楽 • 既成 cookbook をカスタムして利利⽤用することに Confiden'al :Discussion purpose only Copyright (C) 2012 Yahoo Japan Corpora'on. All Rights Reserved. • portertech/chef-‐‑‒monitor • sensu/sensu-‐‑‒chef • subscriber と role が連動したり • LWRP が⽤用意されていたり
  • 7. Confiden'al :Discussion purpose only P7 とりあえず運⽤用開始 Copyright (C) 2012 Yahoo Japan Corpora'on. All Rights Reserved. 第1世代
  • 8. 第1世代:構成P8 Hypervisor x N sensu-‐‑‒client redissensu-‐‑‒server Confiden'al :Discussion purpose only graphite-‐‑‒web conetxt-‐‑‒hashing replication=1 Copyright (C) 2012 Yahoo Japan Corpora'on. All Rights Reserved. All-‐‑‒in-‐‑‒one Sensu Server x 1 rabbitmq-‐‑‒server sensu-‐‑‒apisensu-‐‑‒dashboard carbon-‐‑‒relay server x 1 carbon-‐‑‒relay carbon-‐‑‒cache server x 3 carbon-‐‑‒cache
  • 9. 第1世代:構成P9 Hypervisor x N sensu-‐‑‒client Xeon L5640 2.13GHz x 1 DDR3-‐‑‒1333 2GB x 3 300GB 15k SAS HDD x 4 (RAID1+0) Intel 5520 + IOH-‐‑‒36D redissensu-‐‑‒server Confiden'al :Discussion purpose only Sensu と同じ graphite-‐‑‒web conetxt-‐‑‒hashing replication=1 Xeon E5-‐‑‒2630L 2.00GHz x 2 DDR3-‐‑‒1600 8GB x 8 300GB 10k SAS HDD x 4 (RAID1+0) Intel C602 Copyright (C) 2012 Yahoo Japan Corpora'on. All Rights Reserved. All-‐‑‒in-‐‑‒one Sensu Server x 1 rabbitmq-‐‑‒server sensu-‐‑‒apisensu-‐‑‒dashboard carbon-‐‑‒relay server x 1 carbon-‐‑‒relaycarbon-‐‑‒cache server x 3 carbon-‐‑‒cache
  • 10. 第1世代:運⽤用P10 • 開始時点のクライアント数は 200 弱 • 500 ぐらいまで安定稼働 Confiden'al :Discussion purpose only Copyright (C) 2012 Yahoo Japan Corpora'on. All Rights Reserved.
  • 11. 第1世代:運⽤用P11 Confiden'al :Discussion purpose only Copyright (C) 2012 Yahoo Japan Corpora'on. All Rights Reserved. • sensu • LOG LEVEL = warn でローテ • max open files は増量量(server) • Checks:約10項⽬目 per 60sec • セキュリティチェック • リソースチェック • サービス / RAID 監視 • etc... • 通知:1⽇日1回 • メール:コミュニティのものをカスタム • 社内チャット:graphite グラフを添えて通知
  • 12. 第1世代:運⽤用P12 Confiden'al :Discussion purpose only Copyright (C) 2012 Yahoo Japan Corpora'on. All Rights Reserved. • graphite • relay • スケール考えると consistent hash 1択 • cache • HDD だと IO たりない • tmpfs でまかなうことに(55GB) • cron で定期的に永続化ジョブ実⾏行行 • リテンションはテストして調整・キャパプラ • aggregator • 使いづらいし使わないほうがいいらしい • 集約するなら別の⼿手段を検討すべき
  • 13. Confiden'al :Discussion purpose only P13 Copyright (C) 2012 Yahoo Japan Corpora'on. All Rights Reserved. 冗⻑⾧長化開始 第2世代
  • 14. 第2世代:構成P14 redissensu-‐‑‒server Confiden'al :Discussion purpose only Copyright (C) 2012 Yahoo Japan Corpora'on. All Rights Reserved. All-‐‑‒in-‐‑‒one Sensu Server x 3 rabbitmq-‐‑‒server sensu-‐‑‒apisensu-‐‑‒dashboard carbon-‐‑‒relay server x 2 carbon-‐‑‒relay carbon-‐‑‒cache server x 3 carbon-‐‑‒cache Hypervisor x N sensu-‐‑‒client graphite-‐‑‒web conetxt-‐‑‒hashing replication=1
  • 15. 第2世代:運⽤用P15 Confiden'al :Discussion purpose only Copyright (C) 2012 Yahoo Japan Corpora'on. All Rights Reserved. • Sensu • All-‐‑‒in-‐‑‒one を3台並べてロードバランス • redis は1台のみにむける • rabbitmq のミラーリングは無し • 最初してたけどキューが謎に暴暴発するのでやめた • ただしクラスタは組む • Graphite • carbon-‐‑‒relay • 同⼀一構成を2台並べてロードバランス
  • 16. 第2世代:運⽤用P16 Confiden'al :Discussion purpose only Copyright (C) 2012 Yahoo Japan Corpora'on. All Rights Reserved. • クライアント数は 1000 弱 • 設定ミスするとアラートが無双する... ntp 同期してない sensu-‐‑‒server を投⼊入してしまった図
  • 17. Confiden'al :Discussion purpose only P17 Copyright (C) 2012 Yahoo Japan Corpora'on. All Rights Reserved. 本格運⽤用化 第3世代
  • 18. 第3世代:構成 redis server x 1 Confiden'al :Discussion purpose only P18 carbon-‐‑‒cache x N Copyright (C) 2012 Yahoo Japan Corpora'on. All Rights Reserved. dashboard server x 1 sensu server x 30 rabbitmq server x 3 rabbitmq-‐‑‒server sensu-‐‑‒apiuchiwa sensu-‐‑‒server redis carbon-‐‑‒relay server x 2 carbon-‐‑‒relay x N carbon-‐‑‒cache server x 6 Hypervisor x N sensu-‐‑‒clienthaproxygraphite-‐‑‒web carbon-‐‑‒relay x N gluster conetxt-‐‑‒hashing replication=1 conetxt-‐‑‒hashing replication=1 replication=2
  • 19. 第3世代:運⽤用P19 • クライアント数は 3000+ • VM のメトリクス取得開始でキューが急増 • 1HV あたり 10VM+ • VM 作成者にサービスとしてグラフ API 提供 Confiden'al :Discussion purpose only Copyright (C) 2012 Yahoo Japan Corpora'on. All Rights Reserved.
  • 20. 第3世代:運⽤用P20 Confiden'al :Discussion purpose only スケールアウトしたときのキュー推移 Copyright (C) 2012 Yahoo Japan Corpora'on. All Rights Reserved. • sensu • sensu-‐‑‒server on VM を並べてスケールアウト • スペックよりも数を重視 • redis は現在冗⻑⾧長化中... • UI は uchiwa に切切り替え • v0.2+ になってずいぶん軽くなった
  • 21. 第3世代:運⽤用P21 Confiden'al :Discussion purpose only Copyright (C) 2012 Yahoo Japan Corpora'on. All Rights Reserved. • graphite • LB → haproxy で受けて relay プロセスに分散 • コア数に応じて daemon ⽴立立ち上げ(職⼈人芸) • carbon-‐‑‒relay = CPU bound • carbon-‐‑‒cache = IO bound • 管理理は megacarbon 利利⽤用(v0.10+) • ログが結構サイズをとるのでケアする必要あり • LOG_̲WRITES=false / LOG_̲CACHE_̲HITS = false • max open files 増量量必須 • whisper ではなく ceres (v0.10+) • whisper はスケールアウト時にやや難あり • メンテスクリプトを cron で回す必要あり
  • 22. Confiden'al :Discussion purpose only P22 Copyright (C) 2012 Yahoo Japan Corpora'on. All Rights Reserved. まとめ
  • 23. まとめP23 • sensu + graphite を1年年運⽤用してみて • ⼤大規模な監視で⼗十分つかえる • ⾃自動で監視登録されるのは⾮非常に便便利利 Confiden'al :Discussion purpose only Copyright (C) 2012 Yahoo Japan Corpora'on. All Rights Reserved. • どんどん投⼊入できる • フレキシブルで気軽に使える • とりあえず導⼊入して徐々にスケールできた • ただし CM ツール利利⽤用しないとつらいかも • 今後 • メールハンドラを改良良する • ⼀一定時間分を畳み込んで送信するようなもの • よいものあれば教えてください • carbon-‐‑‒cache にフラッシュデバイスとか