Zabbix Rootconf2009

15
Алексей Владышев, www.zabbix.com Zabbix и распределенный мониторинг тысяч серверов

description

 

Transcript of Zabbix Rootconf2009

Page 1: Zabbix Rootconf2009

Алексей Владышев, www.zabbix.com

Zabbix и распределенный мониторинг тысяч серверов

Page 2: Zabbix Rootconf2009

Zabbix празднует 8 летний юбилей!

• Выбор 1998 года — HP OpenView, IBM, BMC. Open Source: BigBrother• Проблема! Как назвать продукт?! ABCDE...Zabbix! • Апрель 2001 года — вышла первая версия Zabbix 1.0alpha1• Апрель 2004 года — первая стабильная версия Zabbix 1.0• Март 2005 года — основана компания Zabbix SIA

А что сегодня?

Zabbix 1.6.4, 500 скачиваний в день, 15.000 человек на форуме, нас 9 человек, и мы говорим по-русски :-)

История проекта

Page 3: Zabbix Rootconf2009

Zabbix — это система для мониторинга производительности и доступности IT инфраструктуры: приложения, сервисы, вычислительные ресурсы.

Функциональность Zabbix:• Мониторинг с помощью агентов и без• Auto-discovery• Эскалация проблем и запуск скриптов• WEB мониторинг• Графики, карты, экраны• Мониторинг SLA, отчёты• Dashboard

Что такое Zabbix

Page 4: Zabbix Rootconf2009

Основные компонентыСервер:• Ядро Zabbix, логика системы• Обработка данных• Оповещения• Эскалации

WEB интерфейс:• Доступ к истории• Вся конфигурация

Агент:•Сбор данных

Page 5: Zabbix Rootconf2009

Чем отличается Zabbix от других продуктов?• Решение всё-в-одном, но только что касается мониторинга!• Все данные и вся конфигурация находятся в базе данных• 100% наш код: не используем Nagios, RRD• Вся логика на стороне сервера, агенты лишь собирают данные

Важные технические решения:• WEB интерфейс для просмотра и конфигурации• Все написано на C, интерфейс на PHP. Никаких Java/Python/Perl/Ruby на стороне сервера и агента! Fork() - нет, syscalls() - ДА!• Удобен для мониторинга как больших, так и маленьких сред.• Поддержка практически всех платформ

Особенности архитектуры Zabbix

Page 6: Zabbix Rootconf2009

Способы мониторинга серверовService checks: FTP, SSH, HTTP, SMTP, DNS ...

Zabbix Agent:• Активные и пассивные проверки• Мониторинг log файлов• Легко расширяемый• Удалённый запуск команд• Очень эффективен!

SNMP агент:• Обычно NET-SNMP• Мониторинг приложений (Oracle, Weblogic, Websphere, PostgreSQL, MySQL, ...)• SNMP traps

IPMI:• Мониторинг состояния железа• Удалённое управление (reboot, reset, halt)

Page 7: Zabbix Rootconf2009

Используем Zabbix агентАктивные проверки:• Наиболее эффективны• Возможна буферизация данных

Пассивные проверки:• Требуют polling на стороне Zabbix сервера• Дополнительные накладные расходы

Page 8: Zabbix Rootconf2009

Тысячи серверов: сложностиЗадача:• Несколько тысяч серверов• Распределены по 2-100 дата-центрам или филиалам• Необходим централизованный мониторинг

Проблемы и решения:• Объём данных (история, тенденции) и производительность Zabbix • Интеграция с существующими системами (helpdesk, conf management, LDAP)• Поддержка: изменение конфигурации (шаблоны)• Upgrade (непросто для тысяч устройств)

Самое важное решение:• Выбор правильной архитектуры

Page 9: Zabbix Rootconf2009

Zabbix: несколько вариантов

• Один Zabbix сервер занимается всем

• Один Zabbix сервер • Один Proxy на дата-центр или филиал

РаспределенныйРаспределенный1 Сервер1 СерверМного ProxyМного Proxy1 Сервер1 Сервер

• Один Zabbix сервер на дата-центр• Требует бOльших усилий по поддержке• Можно комбинировать с Proxy

Page 10: Zabbix Rootconf2009

Что такое Proxy?Proxy — это демон для сбора данных с агентов

Какие плюсы:• Упрощает архитектуру• Не требует больших ресурсов• Разгружает Zabbix сервер

Page 11: Zabbix Rootconf2009

Как работает Proxy?Если пропала связь с Zabbix сервером:• Данные накапливаются на стороне Proxy• Отсылаются при восстановлении связи• Не получим сообщения о проблемах!

Управление:

• Только сбор данных• Полностью управляется сервером через WEB интерфейс• Конфигурация хранится на Zabbix сервере• Все соединения создает Proxy• Обработка тысяч значений в секунду

Page 12: Zabbix Rootconf2009

Распределенный мониторингОсновные характеристики:• Структура в виде дерева• Нода — это Zabbix сервер• Ноды платформо-независимы

Управление:• Two-way replication• Ноды более высокого уровня контролируют зависимые ноды

Page 13: Zabbix Rootconf2009

Обработка потери соединенияЧто перестанет работать?• Отсылка данных• Синхронизация конфигурации

Всё остальное продолжает работать!

Page 14: Zabbix Rootconf2009

Какую схему выбрать?

Знакомимся с ZabbixДобавляем Proxy

РаспределенныйРаспределенный1 Сервер1 Сервер

Много ProxyМного Proxy1 Сервер1 Сервер Полноценный

распределенный мониторинг

Зависит от требований:• Локальное администрирование• Полноценный мониторинг при потере соединений между филиалами

Page 15: Zabbix Rootconf2009

Вопросы?Сегодня и завтра я на RootConf.