переезд мониторинга

•Download as PPTX, PDF•

5 likes•19,002 views

Алексей Демидов

Презентация для Zabbix Moscow Meetup, June 27th 2015 http://www.meetup.com/Zabbix-Moscow-Meetup/events/223289028/

Software

О компании QIWI*
Kazakhstan
177,000+ терминалов и точек
приема платежей
17,3+ млн. виртуальных кошельков
*По данным QIWI plc за 1 квартал 2015 года

• Масштабируемость
• Функция discovery
• Инвентаризация
• Простота кастомизации
• Поддержка инфраструктурных
проверок из коробки
• Клонирование элементов

С чего начали
1.Установка сервера
2.Добавление хостов и
авторегистрация
3.Работа над ошибками
4.Составление плана

План (что сделано)
1.Перенос отдельных метрик
и orabbix
2.Уведомления и jira
3.Настройка авторизации
4.Шаблоны и полезность LLD

План (что осталось)
5.Шаблоны по сервисам
6.Перенос специфичных
бизнес метрик
7.Отказоустойчивость
8.Группировка узлов сети по
сервисам
9.Реализация baseline в
триггерах

Дополнительные модули
1.Orabbix
2.Java-gateway
3.Zabbix extras

Статистика
Zabbix server performance
Nagios Zabbix
Items 14868 131152
VPS 40 606
LA 612.68 1.73
WEB Latency 5000+ms 238ms
Check Latency 250sec 3sec

What's hot

мониторинг производительности Web приложений на pythonSlach

Мастер-класс "Микросервисы: удобно, надежно, серебрянопульно" / Евгений Павло...Ontico

обзор архитектуры и подсистем деплоя и мониторингаКонстантин Никифоров

Как не положить тысячи серверов с помощью системы централизованного управлени...Ontico

Zabbix и миллионы метрик: наилучший опыт масштабного мониторинга / Алексей Вл...Ontico

Архитектура поиска в Avito / Андрей Смирнов (Avito)Ontico

Дизайн REST API для высокопроизводительных систем / Александр Лебедев (Новые ...Ontico

Преждевременная оптимизация архитектуры / Евгений Потапов, Антон Баранов (ITS...Ontico

Путь DevOps в «Parallels» / Константин Назаров (Parallels)Ontico

Порядок для скорости. Система структурирования фронтендовой части веб-приложе...Ontico

мониторинг производительности приложения на PINBASlach

Стратегия и тактика улучшения производительности BSS систем оператора мобильн...Ontico

Сравнение решений по балансировке высоконагруженных систем / Евгений Пивень (...Ontico

Мониторинг в высоконагруженных (и не только) проектах: сравнительный анализ с...Anton Baranov

Как devops исчерпывает себя, и что будет дальше / Кирилл Вечера (Jetware)Ontico

«Путь от монолита на PHP к микросервисам на Scala» – Денис Иванов, 2ГИС 2ГИС Технологии

Платформа для поставки счастья в команду QASlava Kuznetsov

OpenResty: превращаем NGINX в полноценный сервер приложений / Владимир Прота...Ontico

RootConf 2015: Как Vagrant и Chef ускорили разработку в несколько разTimur Batyrshin

Эволюция процесса деплоя в проекте / Денис Яковлев (2ГИС)Ontico

What's hot (20)

мониторинг производительности Web приложений на python

Мастер-класс "Микросервисы: удобно, надежно, серебрянопульно" / Евгений Павло...

обзор архитектуры и подсистем деплоя и мониторинга

Как не положить тысячи серверов с помощью системы централизованного управлени...

Zabbix и миллионы метрик: наилучший опыт масштабного мониторинга / Алексей Вл...

Архитектура поиска в Avito / Андрей Смирнов (Avito)

Дизайн REST API для высокопроизводительных систем / Александр Лебедев (Новые ...

Преждевременная оптимизация архитектуры / Евгений Потапов, Антон Баранов (ITS...

Путь DevOps в «Parallels» / Константин Назаров (Parallels)

Порядок для скорости. Система структурирования фронтендовой части веб-приложе...

мониторинг производительности приложения на PINBA

Стратегия и тактика улучшения производительности BSS систем оператора мобильн...

Сравнение решений по балансировке высоконагруженных систем / Евгений Пивень (...

Мониторинг в высоконагруженных (и не только) проектах: сравнительный анализ с...

Как devops исчерпывает себя, и что будет дальше / Кирилл Вечера (Jetware)

«Путь от монолита на PHP к микросервисам на Scala» – Денис Иванов, 2ГИС

Платформа для поставки счастья в команду QA

OpenResty: превращаем NGINX в полноценный сервер приложений / Владимир Прота...

RootConf 2015: Как Vagrant и Chef ускорили разработку в несколько раз

Эволюция процесса деплоя в проекте / Денис Яковлев (2ГИС)

Viewers also liked

Grafana zabbixalexanderzobnin

Автоматизация нагрузочного тестирования в связке JMeter + TeamСity + Grafana ...Positive Hack Days

Zabbix Rootconf2009Liudmila Li

С чего начать внедрение Hadoop в компании. Доклад Алексея Еремихина (Badoo). Badoo Development

Реалтайм статистика скорости работы нативных и веб-приложений у реальных поль...Badoo Development

Zabbix и правильное обнаружение проблем - Алексей Владышев @ RootConf 2015Zabbix

Автоматизация мониторинга распределенной сети подразделенийBadoo Development

Introduction to Zabbix - Company, Product, Services and Use CasesZabbix

Continuous Deployment (in Russian)Smartling

Continuous deployment Smartling eventViktoriya Pridatko

Пётр Зайцев, PerconaOntico

Визуальная аналитика на страже информационной безопасностиPositive Hack Days

Jelastic PaaS for DevOps: Hybrid Cloud based on Microsoft AzureDmitry Lazarenko

Nagios Conference 2014 - Eric Mislivec - Getting Started With Nagios CoreNagios

Nagios core vs. nagios xi presentation power point.pptx [diperbaiki]Fanky Christian

Zabbix 3.2 - мониторинг качественно нового уровня / Алексей Владышев (Zabbix)Ontico

Jesse Olson - Nagios Log Server Architecture OverviewNagios

Zabbix Performance TuningRicardo Santos

QaAPI. Взгляд на тестирование с другой стороны баррикад. Доклад Дмитрия Марущ...Badoo Development

Внедрение Docker в процесс разработки демонов. Доклад Константина Карпова на ...Badoo Development

Viewers also liked (20)

Grafana zabbix

Автоматизация нагрузочного тестирования в связке JMeter + TeamСity + Grafana ...

Zabbix Rootconf2009

С чего начать внедрение Hadoop в компании. Доклад Алексея Еремихина (Badoo).

Реалтайм статистика скорости работы нативных и веб-приложений у реальных поль...

Zabbix и правильное обнаружение проблем - Алексей Владышев @ RootConf 2015

Автоматизация мониторинга распределенной сети подразделений

Introduction to Zabbix - Company, Product, Services and Use Cases

Continuous Deployment (in Russian)

Continuous deployment Smartling event

Пётр Зайцев, Percona

Визуальная аналитика на страже информационной безопасности

Jelastic PaaS for DevOps: Hybrid Cloud based on Microsoft Azure

Nagios Conference 2014 - Eric Mislivec - Getting Started With Nagios Core

Nagios core vs. nagios xi presentation power point.pptx [diperbaiki]

Zabbix 3.2 - мониторинг качественно нового уровня / Алексей Владышев (Zabbix)

Jesse Olson - Nagios Log Server Architecture Overview

Zabbix Performance Tuning

QaAPI. Взгляд на тестирование с другой стороны баррикад. Доклад Дмитрия Марущ...

Внедрение Docker в процесс разработки демонов. Доклад Константина Карпова на ...

Similar to переезд мониторинга

WebSite Security Day 2016 - Мониторинг e-commerceСергей Обухов

20% of investment and 80% of profit. How to implement security requirements a...Igor Gots

Обзор архитектуры ETSI MANO для управления сетями NFV и реализация CiscoCisco Russia

NoBigData - потоковая система аналитики clientside производительности, Сергей...Ontico

Безопасность ЦОД-часть 1Cisco Russia

Как превратить Openstack Swift в хранилище для высоких нагрузок разных типов,...Ontico

SECON'2016. Алексеев Олег, Живой APISECON

Обзор продукта Prime Carrier Management for IP NGN: состав, решаемые задачи, ...Cisco Russia

AggreGate Network Manager. Мониторинг IT и управление сетямиTibbo

Cti контактный центр_по_запросу_10.06.2014Tim Parson

Bykov monitoring mailrurit2010

Cisco ACI: концепция инфраструктуры, ориентированной на приложенияCisco Russia

Gnevshev мониторингkuchinskaya

Оркестрация в сетях операторов связиCisco Russia

Архитектура и технологии Pryaniky.comPryaniky.com

Enterprise monitoring solutionMaxim Sovetkin

Контроль и управление доступом к корпоративным ресурсам предприятияVERNA

Ориентированная на приложения инфраструктура Cisco ACI Cisco Russia

Демонстрация работы интеллектуальной подсистемы управления в многоуровневой сетиCisco Russia

Управление доступом и контроль параметров безопасности виртуальной инфраструк...areconster

Similar to переезд мониторинга (20)

WebSite Security Day 2016 - Мониторинг e-commerce

20% of investment and 80% of profit. How to implement security requirements a...

Обзор архитектуры ETSI MANO для управления сетями NFV и реализация Cisco

NoBigData - потоковая система аналитики clientside производительности, Сергей...

Безопасность ЦОД-часть 1

Как превратить Openstack Swift в хранилище для высоких нагрузок разных типов,...

SECON'2016. Алексеев Олег, Живой API

Обзор продукта Prime Carrier Management for IP NGN: состав, решаемые задачи, ...

AggreGate Network Manager. Мониторинг IT и управление сетями

Cti контактный центр_по_запросу_10.06.2014

Bykov monitoring mailru

Cisco ACI: концепция инфраструктуры, ориентированной на приложения

Gnevshev мониторинг

Оркестрация в сетях операторов связи

Архитектура и технологии Pryaniky.com

Enterprise monitoring solution

Контроль и управление доступом к корпоративным ресурсам предприятия

Ориентированная на приложения инфраструктура Cisco ACI

Демонстрация работы интеллектуальной подсистемы управления в многоуровневой сети

Управление доступом и контроль параметров безопасности виртуальной инфраструк...

переезд мониторинга

1. Переезд мониторинга

2. О компании QIWI* Kazakhstan 177,000+ терминалов и точек приема платежей 17,3+ млн. виртуальных кошельков *По данным QIWI plc за 1 квартал 2015 года

5. • Масштабируемость • Функция discovery • Инвентаризация • Простота кастомизации • Поддержка инфраструктурных проверок из коробки • Клонирование элементов

6. С чего начали 1.Установка сервера 2.Добавление хостов и авторегистрация 3.Работа над ошибками 4.Составление плана

7. План (что сделано) 1.Перенос отдельных метрик и orabbix 2.Уведомления и jira 3.Настройка авторизации 4.Шаблоны и полезность LLD

8. План (что осталось) 5.Шаблоны по сервисам 6.Перенос специфичных бизнес метрик 7.Отказоустойчивость 8.Группировка узлов сети по сервисам 9.Реализация baseline в триггерах

9. Отказоустойчивость (passive master)

10. Дополнительные модули 1.Orabbix 2.Java-gateway 3.Zabbix extras

11. Статистика Zabbix server performance Nagios Zabbix Items 14868 131152 VPS 40 606 LA 612.68 1.73 WEB Latency 5000+ms 238ms Check Latency 250sec 3sec

12. Вопросы? Email: a.demidov@qiwi.ru

Editor's Notes

Как-то перед Новым годом, на собрании нашего подразделения, обсуждали текущие проблемы и планы на будущее. Одной из тем была "проблемы мониторинга". Текущая система мониторинга (исторически сложившийся нагиос) в текущем его исполнении, уже порядком поднадоел.
Высокое LA, частенько флапающие статусы проверок, тормозащий вэб. А так же желание навести порядок в мониторинге, так как от некоторых костылей можно избавиться, плюс увеличивающееся число заявок на постановку на мониторинг.
Высокое LA, частенько флапающие статусы проверок, тормозащий вэб. А так же желание навести порядок в мониторинге, так как от некоторых костылей можно избавиться, плюс увеличивающееся число заявок на постановку на мониторинг.
Короче говоря пришли к мысли: тут не исправить уже ничего, Господь, жги!
Из очевидных плюсов: масштабируемость (думаю тут и так все понятно), функция discovery (избавляемся от необходимости добавлять все вручную), мониторинг через агентов (избавляемся от необходимости ходить на хосты по ssh), кастомизация (), поддержка инфраструктурных проверок из коробки. Так же стоит отметить функцию "клонирования" элементов данных и прочего, позволяющая в пару кликов размножить элементы мониторинга. Приходится часто сталкиваться с этим при заведении новых серверов в мониторинг и уже пальцы натерты от ctrl+C/ctrl+V. Поскольку мы впервые столкнулись с использованием zabbix, мы как непосвященные пошли таким путем.
Про установку сервера, думаю, нет смысла рассказывать, так как проблем тут обычно не бывает. На виртуалку раскатили заббикс и начали с добавления хостов из нагиос. Вручную. Epic fail. Потратили на это много времени, и в дальнейшем обнаружили, что существует "Авторегистрация". В общем, ощутимо бы сэкономили время. После этого добавили правила авторегистрации для unix и windows серверов, а для всего остального правила обнаружения. Единственная придирка к обнаружению - негде посмотреть прогресс выполнения. После этого было решено составить план переезда.
Первым пунктом была просьба от одного подразделения, перенести их сенсоры в заббикс. Чтобы уж сильно кардинально не отходить от привычного использования конфигов, для sql запросов мы прикрутили orabbix. Для нас он показался удобнее чем встроенная в заббикс поддержка запросов в базы. Отдельный информативный лог, привычные конфиги. Плюс по принципу работы, orabbix похож на самописную sql шлюз, который мы используем в nagios. После этого сделали систему уведомлений. От стандарной функции рассылки писем в заббикс отказался в пользу скрипта, чтобы были возможности кастомизации. По смскам, адаптировали скрипт из нагиос рассылающий через смс-агрегатора. С джирой подружили через перловый модуль JIRA::Client::Automated. Включили LDAP авторизацию, и скриптом добавили синхронизацию пользователей из AD. 3. Следующим по плану, были шаблоны. Решили разделить на: шаблоны на инфтраструктурные элементы и шаблоны на сервисы. Так же решили по возможности минимизировать количество проверок которые выполняются с сервера. В процессе разработки шаблонов, увидели заинтересованность сетевиков, уставших от cacti. Посовещавшись, решили перенести и сетевые хосты, чтобы был единый мониторинг. В шаблоне для сетевых железок, прониклись идеей LLD. Так же помог snmp-builder входящий в состав Zabbix Extras.
Из оставшегося: шаблоны по отдельным сервисам, перенос специфичных метрик, схема отказоустойчивости, реализация baseline в триггерах, группировка хостов по сферам работы
В нашем случае, мониторинг должен иметь аптайм 24/7 и простои недопустимы. Следовательно должен быть резерв готовый вступить в бой. Zabbix через peacemaker+corosync. Mysql в режиме master-slave(passive master,с ведением бинарных логов). Переключение БД будет автоматизировано скриптами. Остановились на такой схеме, правда пока не реализовали ее, потому что нужно будет перевезти заббикс на железный сервер, и согласно нашему плану мы пока не дошли до этого.
Про плюсы ораббикс уже рассказал. Java gateway - отличная вещь для мониторинга jmx, но наши разработчики ее перепишут для поддержки нашего кастома. Zabbix extras: надстройка на фронте, из тех вещей что понравились в ней это: вкладка с неподдерживаемыми элементами (в отличие от стандартного фильтра, показывает еще и текст ошибки), snmp builder - генератор шаблонов из мибов, вкладка показывает стоимость элементов данных.
Про плюсы ораббикс уже рассказал. Java gateway - отличная вещь для мониторинга jmx, но наши разработчики ее перепишут для поддержки нашего кастома. Zabbix extras: надстройка на фронте, из тех вещей что понравились в ней это: вкладка с неподдерживаемыми элементами (в отличие от стандартного фильтра, показывает еще и текст ошибки), snmp builder - генератор шаблонов из мибов, вкладка показывает стоимость элементов данных.

переезд мониторинга

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Viewers also liked

Viewers also liked (20)

Similar to переезд мониторинга

Similar to переезд мониторинга (20)

переезд мониторинга

Editor's Notes