Отказоустойчивость веб-проекта: мониторинг,...

21
Евгений Потапов ITSumma ОТКАЗОУСТОЙЧИВОСТЬ ВЕБ-ПРОЕКТА: МОНИТОРИНГ, РЕЗЕРВИРОВАНИЕ, ОБСЛУЖИВАНИЕ

Transcript of Отказоустойчивость веб-проекта: мониторинг,...

Евгений ПотаповITSumma

ОТКАЗОУСТОЙЧИВОСТЬ ВЕБ-ПРОЕКТА:МОНИТОРИНГ, РЕЗЕРВИРОВАНИЕ, ОБСЛУЖИВАНИЕ

Евгений ПотаповITSumma.ru, генеральный директор

Круглоcуточное удаленное администрирование серверов и техническая поддержка сайтов

150 клиентов на поддержке

Более 1000 серверов на поддержке

100 миллионов уникальных посетителей

На поддержке

КАК СДЕЛАТЬ ТАКчтобы сайт никогда не падал?

• Для магазина с оборотом в 300 миллионов рублей в год один час даунтайма стоит 34 тысячи рублей

• Регулярная недоступность сайта и долгое время ответа приводят к снижению позиции сайта в поисковых системах

• Снижается лояльность постоянных пользователей

• Снижается рейтинг сайта в рекламных системах

Цена простоя

Вебсайт как живой организм

«медицинская инфраструктура»

3 СОСТАВЛЯЮЩИХ

Опыт персонала «Образ жизни»

1 2 3

• Медицинская инфраструктура: надежность хостинга, архитектура, резервирование

• Опыт персонала: культура разработки, навыки поддержки, навыки администрирования

• Образ жизни: количество и скорость изменений на проекте, взаимодействие с внешним миром

Отказоустойчивость

ИНФРАСТРУКТУРА

• Реселлер или собственный хостинг?реселлер - плохо

• Аренда дата-центра или собственный дата-центр?аренда – не очень хорошо

• Виртуальные или «железные» серверывиртуализация – не всегда хорошо

• Географическое распределение дата-центроввозможность взять резервный сервер в другом дата-центре - хорошо

Хостинг

• Защита от DDOS? Поведение в случае крупного DDOS?«вытаскивают шнур» – надо позаботится о защите

• Доступность KVM, время замены оборудования в случае аварии, время установки нового сервера

• Часы работы и время реакции поддержки хостинга

Хостинг

• Есть ли резервная площадка? Как поддерживается ее актуальность? Online-синхронизация файлов, базы данных

• Когда последний раз проверялся «резерв» в бою?

• Насколько связан резервный дата-центр с основным дата-центром?

• Каким образом будет осуществляться переключение на резервную площадку в случае аварии?

Резервирование

• Резерв – это не бэкап, как часто ведется резервное копирование?

• Куда сохраняются резервные копии, изолирована ли площадка с резервными копиями от основной площадки?

• Как быстро можно восстановиться из резервной копии? Какое максимальное количество данных может быть потеряно в случае утраты данных на основной площадке?

• Когда последний раз проверяли бэкап?

Бэкап

• Упавший сайт не всегда означает упавший сервер, ведется ли мониторинг доступности бизнес-функций?

• Насколько изолирован мониторинг от основной площадки?

• Кто и каким образом узнает о падении сайта/сервера, как быстро?

• Мониторинг должен сообщать о приближении аварии, а не о том, что она произошла.

Мониторинг

ПЕРСОНАЛ

• Используется ли система контроля версий? Есть ли версия проекта для разработки и тестирования? Как быстро можно «откатиться» в случае аварии?

• Какой опыт у разработчиков? Прежде всего – опыт эксплуатации запущенного проекта.

• Соблюдается ли культура разработки?

• Ведется ли документация?

• Насколько доступны разработчики?

Разработка

• Кто занимается системным администрированием проекта? Насколько доступны эти люди?

• Есть ли опыт эксплуатации сложных проектов?

• Есть ли опыт разработки? Опыт взаимодействия с разработчиками?

Администраторы

ЖИЗНЬ

• Большинство аварий происходят из-за человеческого фактора.

• Как часто происходят изменения? Можно ли «откатить» систему на предыдущую версию в случае аварии?

• Если «падать» совсем нельзя – сохраняется ли резервная копия с предыдущей версией?

• В идеальном мире любые изменения делаются «инкрементально».

Изменения на сайте

• Проводится ли нагрузочное тестирование? Есть ли понимание перспектив роста?

• Первые крупные рассылки практически наверняка пройдут с авариями.

• Есть ли возможность остановить маркетинговую кампанию? Если нет – надо максимально подготовиться.

Маркетинговые кампании

Евгений Потаповhttp://facebook.com/eapotapov

[email protected]

http://itsumma.ru