Солидекс ПИ - ЦОДы

69
20 марта 2012 ЦОД. Вокруг и внутри СП ООО «Солидекс ПИ» Иванов Сергей Евгеньевич Ганус Сергей Александрович Кацубо Сергей Михайлович

Transcript of Солидекс ПИ - ЦОДы

Page 1: Солидекс ПИ - ЦОДы

20 марта 2012

ЦОД. Вокруг и внутри

СП ООО «Солидекс ПИ»

Иванов Сергей Евгеньевич

Ганус Сергей Александрович

Кацубо Сергей Михайлович

Page 2: Солидекс ПИ - ЦОДы

2

Содержание

• Уменьшение ART

• Резервирование и балансировка в WAN

• Непрерывность функционирования: два ЦОД

– Распределение запросов

– Миграция виртуальных машин

– Синхронизация данных

• Сеть ЦОД

– Производительность

– Уменьшение количества уровней

– Единая сеть для LAN и SAN

Page 3: Солидекс ПИ - ЦОДы

3

WAN

ЦОД. Вокруг и внутри

ОЦОД

Удаленное подразделение

WOC/WPC GSLB

Network-based Storage VirtSLB

РЦОД

Оператор А

Оператор B

VM VM

WOC/WPC GSLB

SLB

VM VM

WOC/WPC

Page 4: Солидекс ПИ - ЦОДы

4

WAN

Вариации дизайна ЦОД

ОЦОД

Удаленное подразделение

WOC/WPC GSLB

Network-based Storage VirtSLB

РЦОД

Оператор А

Оператор B

VM VM

WOC/WPC GSLB

SLB

VM VM

WOC/WPC

Связь «ОЦОД – РЦОД» через WAN

DMCDMC

Page 5: Солидекс ПИ - ЦОДы

5

WAN

Вариации дизайна ЦОД (2)

ОЦОД

Удаленное подразделение

WOC/WPC GSLB

Network-based Storage VirtSLB

РЦОД

Оператор А

Оператор B

VM VM

WOC/WPC

WOC/WPC GSLB

SLB

VM VM

1 уровень в сети ЦОД

Page 6: Солидекс ПИ - ЦОДы

6

Содержание

• Уменьшение ART

• Резервирование и балансировка в WAN

• Непрерывность функционирования: два ЦОД

– Распределение запросов

– Миграция виртуальных машин

– Синхронизация данных

• Сеть ЦОД

– Производительность

– Уменьшение количества уровней

– Единая сеть для LAN и SAN

Page 7: Солидекс ПИ - ЦОДы

7

Проблемные точки в WAN

ЦОД

Удаленное подразделение

Оператор

Разница в скоростях

LAN и WAN:

очередь, сброс пакетов

при переполнении

буфера

Удаленное подразделение

На стороне оператора:

Rate Limiting –

сброс пакетов при

превышении порога

Congestion Points: задержки и сбросы пакетов,

рост ART

Page 8: Солидекс ПИ - ЦОДы

8

Шейпинг

(FIFO-очередь)

Разница в скоростях LAN и WAN. Пример

• Настроена очередь длиной 1000 пакетов

• Время ожидания

1000 х 1500 байт x 8 бит/байт : 4 Мбит/с = 3 сек

• Интерактивные приложения требуют* ART < 100 мс

ЦОД

Оператор

4 Мбит/с100 Мбит/с

* Источник: Top-Down Network Design, 3rd Edition. CiscoPress, 2011

Page 9: Солидекс ПИ - ЦОДы

9

К чему ведет разница в скоростях LAN и WAN?

• Буферизация

• Рост задержек (RTT, ART)

• Сброс пакетов для всех приложений независимо

от типа

Page 10: Солидекс ПИ - ЦОДы

10

Задача

• Для трафика интерактивных приложений:

сократить время ожидания в буфере

• Как этого добиться?

Page 11: Солидекс ПИ - ЦОДы

11

Помогает ли Network QoS? Пример 1

• Приложение совместной работы

– Признак интерактивного трафика: тип содержимого –

html, xml, js

• Нужно анализировать HTTP-заголовки

– Иначе не сможем отделить интерактивный трафик от

фоновой загрузки PDF или ZIP

Page 12: Солидекс ПИ - ЦОДы

12

Помогает ли Network QoS? Пример 2

• Терминальный доступ (Citrix)

– Признак интерактивного трафика: поле в L7-заголовке

• Нужно анализировать Citrix-заголовки

– Иначе не сможем отделить интерактивный трафик от

фоновой печати или передачи файлов

Page 13: Солидекс ПИ - ЦОДы

13

Помогает ли Network QoS?

• Распознавание ряда приложений требует анализа

на L7

• Network QoS ограничен L3/L4

• Вывод: не подходит

Page 14: Солидекс ПИ - ЦОДы

14

Что требуется от решения?

• Visibility: различать трафик на L7

• Control: обслуживать трафик в соответствии с

требованиями приложений

Приложение Пропускная способность

(на 1 пользователя)

Задержка Потери

Citrix

(интерактивный)

40 – 400 кбит/с 100 – 200 мс 1 – 2%

Citrix (фоновый) 50 – 1000 кбит/с 200 – 500 мс 1 – 5%

Exchange 100 – 2000 кбит/с 1 – 5 с 1 – 10%

Сетевые сервисы 20 – 200 кбит/с 100 – 500 мс 1 – 3%

Page 15: Солидекс ПИ - ЦОДы

15

Оптимизация

• Можно ли управлять

– Полосой пропускания: «увеличить» WAN-канал?

– Приложением: «улучшить» для работы в WAN?

Page 16: Солидекс ПИ - ЦОДы

16

Техники оптимизации

• Caching, deduplication

• Compression

• Protocol Acceleration

• Request Prediction

Page 17: Солидекс ПИ - ЦОДы

17

Результат

ЦОД

Удаленное подразделение

Оператор

Удаленное подразделение

WOC

WOCWOC

• Уменьшение времени отклика

интерактивных приложений

• Экономия на полосе

пропускания WAN-каналов

Page 18: Солидекс ПИ - ЦОДы

18

Содержание

• Уменьшение ART

• Резервирование и балансировка в WAN

• Непрерывность функционирования: два ЦОД

– Распределение запросов

– Миграция виртуальных машин

– Синхронизация данных

• Сеть ЦОД

– Производительность

– Уменьшение количества уровней

– Единая сеть для LAN и SAN

Page 19: Солидекс ПИ - ЦОДы

19

WANОператор А

Оператор B

2 канала WAN

ЦОД

Удаленное подразделение

Задачи:

• Резервирование

• Параллельное использование

Page 20: Солидекс ПИ - ЦОДы

20

WANОператор А

Оператор B

Резервирование

ЦОД

Удаленное подразделение

Активный

туннель

Резервный

туннель

• Статические маршруты + контроль доступности

второго конца туннеля

• Динамическая маршрутизация

Page 21: Солидекс ПИ - ЦОДы

21

WANОператор А

Оператор B

Параллельное использование

ЦОД

Удаленное подразделение

Активный

туннель #1

Активный

туннель #2

• Статические маршруты + PBR + контроль доступности

второго конца туннеля

• Динамическая маршрутизация + ECMP

Page 22: Солидекс ПИ - ЦОДы

22

Общая проблема приведенных решений

• Не принимаются в расчет текущие

характеристики WAN – задержки, потери пакетов

• Не будет замечена, например, деградация WAN-

транспорта при возникновении перегрузки в сети

оператора

Page 23: Солидекс ПИ - ЦОДы

23

WAN Path Selection

• Мониторинг функционирования каждого WAN-

канала

– Доступность удаленных площадок

– Характеристики каналов: задержка, RTT, потери

• Динамическая балансировка сессий между WAN-

каналами с учетом их текущих характеристик

Page 24: Солидекс ПИ - ЦОДы

24

WAN Path Selection. Результат

Оператор А

Оператор B

ЦОД

Удаленное подразделение

WPS

WPS

• Параллельное использование

WAN-каналов

• Для интерактивного трафика –

выбор канала с наименьшей

задержкой

• Виртуализация WAN: несколько

каналов посредством WPS

представляются как один

логический

Page 25: Солидекс ПИ - ЦОДы

25

Содержание

• Уменьшение ART

• Резервирование и балансировка в WAN

• Непрерывность функционирования: два ЦОД

– Распределение запросов

– Миграция виртуальных машин

– Синхронизация данных

• Сеть ЦОД

– Производительность

– Уменьшение количества уровней сети

– Единая сеть для LAN и SAN

Page 26: Солидекс ПИ - ЦОДы

26

Задача Global Site Load Balancing

• Исходные данные: 2 ЦОД в режиме Active/Active

• Задача: выбор ЦОД для обслуживания запросов

Page 27: Солидекс ПИ - ЦОДы

27

Выбор ЦОД для обработки запроса

ОЦОД

VM

РЦОД

VM

Internet / WAN

SLB SLB

AppVIP-1 AppVIP-2

GSLB GSLB

Балансировка между

ЦОД:

DNS, HTTP Redirect

Балансировка между

серверами с учетом

показателей

функционирования

Page 28: Солидекс ПИ - ЦОДы

28

Сценарий 1

ОЦОД

VM

РЦОД

VM

AppVIP-1 AppVIP-2

21 3

4

app.by = AppVIP-1

Page 29: Солидекс ПИ - ЦОДы

29

Сценарий 2. Live VM Migration

ОЦОД

VM

РЦОД

AppVIP-1 AppVIP-2

VM

Page 30: Солидекс ПИ - ЦОДы

30

Сценарий 3

ОЦОД

VM

РЦОД

AppVIP-1 AppVIP-2

VM

23

GSLB учитывает новое

расположение VM1

SLB учитывает

расположение VM

4

app.by = AppVIP-2

Page 31: Солидекс ПИ - ЦОДы

31

Содержание

• Уменьшение ART

• Резервирование и балансировка в WAN

• Непрерывность функционирования: два ЦОД

– Распределение запросов

– Миграция виртуальных машин

– Синхронизация данных

• Сеть ЦОД

– Производительность

– Уменьшение количества уровней

– Единая сеть для LAN и SAN

Page 32: Солидекс ПИ - ЦОДы

32

VM Mobility

• Миграция VM в пределах одного ЦОД

• Не составляет проблем

• Миграция VM между ЦОД

• С выключением VM

• Live Migration

Page 33: Солидекс ПИ - ЦОДы

33

Миграция с выключением VM. Этапы

1. Выключение VM

2. Создание копии VM в СХД резервного ЦОД

• задача синхронизации будет рассмотрена далее

3. Регистрация VM на сервере РЦОД

4. Запуск VM

Page 34: Солидекс ПИ - ЦОДы

34

Миграция без выключения VM. Этапы

1. Миграция VM

• при миграции передается содержимое RAM

(как правило, несколько гигабайт)

• WAN должен обеспечить достаточную пропускную

способность и отсутствие ошибок в канале

2. Storage Migration

• чтобы избежать обращения к СХД через WAN

VMVMVMVM VMVMVMVM

WAN

VMVM

Page 35: Солидекс ПИ - ЦОДы

35

Storage Migration. Shared Storage

• Работа с СХД через WAN

• Задержка при распространении сигнала ~ 5мкс/км

• Выполнение iSCSI команды – 4 сообщения => 20 мкс/км

• 100 км – дополнительная задержка в 2 мс

VMVMVMVM VMVMVMVM

WAN

VMVM

Page 36: Солидекс ПИ - ЦОДы

36

Storage Migration. Active-Standby режим работы

WAN

VMVMVMVM VMVMVMVM

Необходимо синхронизировать данные между СХД

Синхронизация через выделенный канал связи

Синхронизация через WAN

DMC DMC

Page 37: Солидекс ПИ - ЦОДы

37

Содержание

• Уменьшение ART

• Резервирование и балансировка в WAN

• Непрерывность функционирования: два ЦОД

– Распределение запросов

– Миграция виртуальных машин

– Синхронизация данных

• Сеть ЦОД

– Производительность

– Уменьшение количества уровней

– Единая сеть для LAN и SAN

Page 38: Солидекс ПИ - ЦОДы

38

Варианты синхронизации

• Storage-Based

• Синхронизация обеспечивается средствами СХД

• Как правило, возможна только между одинаковыми

устройствами (или устройствами одного вендора)

• Network-Based

• Синхронизация обеспечивается средствами

промежуточного устройства

Page 39: Солидекс ПИ - ЦОДы

39

Преимущества network-based синхронизации

• Синхронизация между устройствами

• разных производителей

• с разными технологиями доступа (FC, iSCSI)

• Переключение ролей active-standby для LUN

WAN

VMVMVMVM VMVMVMVM

РЦОД можно

сделать

дешевле

Page 40: Солидекс ПИ - ЦОДы

40

Особенности синхронизации данных

• Большие объемы данных (десятки гигабайт)

• Информация повторяется (например,

синхронизация VM с одинаковыми гостевыми OS)

• Чем меньше загрузка WAN, тем быстрее можно

осуществить синхронизацию и миграцию

Поле деятельности для средств дедупликации

Page 41: Солидекс ПИ - ЦОДы

41

Дедупликация данных

• Средствами СХД

• Средствами платформы виртуализации

• Средствами платформы WAN-оптимизации: DMC

Page 42: Солидекс ПИ - ЦОДы

42

Пример работы дедупликации

Средствами СХД или платформы виртуализации

Блок данных, 8kB

Фактически измененные данные, 512B

В канал передаются только измененные данные -

512 B вместо 8 кB

Page 43: Солидекс ПИ - ЦОДы

43

Содержание

• Уменьшение ART

• Резервирование и балансировка в WAN

• Непрерывность функционирования: два ЦОД

– Распределение запросов

– Миграция виртуальных машин

– Синхронизация данных

• Сеть ЦОД

– Производительность

– Уменьшение количества уровней

– Единая сеть для LAN и SAN

Page 44: Солидекс ПИ - ЦОДы

44

ЦОД сейчас

• STP – стандарт де-факто

• с учетом его разновидностей – RSTP, MSTP и т.д.

• STP обладает рядом недостатков

• bisectional bandwidth

• время конвергенции

• неоптимальный выбор пути

Page 45: Солидекс ПИ - ЦОДы

45

Bisectional bandwidth

Из возможных 8 аплинков задействованы 4

B B B B

Page 46: Солидекс ПИ - ЦОДы

46

Альтернативы STP. M-LAG

LAG

ISL

SW1

SW2 SW3

• Для SW1 – обычный LAG (802.3ad)

• Оба аплинка активны – передают трафик

SW23

SW1

Физическая топология Логическая топология

M-LAG

Page 47: Солидекс ПИ - ЦОДы

47

Варианты применения M-LAG

LAG

M-LAG

SRV1

SW2 SW3

LAG

ISL

SW1

SW2 SW3

M-LAG

ISL

LAG

Page 48: Солидекс ПИ - ЦОДы

48

Особенности топологии сети и M-LAG

M-LAG

M-LAG

M-LAGB

В некоторых случаях M-LAG не обеспечивает полную

утилизацию каналов

Page 49: Солидекс ПИ - ЦОДы

49

MLAG. Заключение

• Решается проблема задействования каналов*

• Остается ограничение: не более двух

коммутаторов для организации M-LAG

M-LAG

* для определенных топологий

Page 50: Солидекс ПИ - ЦОДы

50

Можно ли отказаться от STP?

• Отключить MAC-learning на коммутаторах ядра

• Отключить процесс STP: ввести другой control-

plane протокол

Page 51: Солидекс ПИ - ЦОДы

51

Альтернативы STP и M-LAG. SPB

• Задействуются все аплинки (все возможные

маршруты – до 16) между серверами Server A и

Server B

S1 S2

S3 S4 S5 S6

Server A Server B

Page 52: Солидекс ПИ - ЦОДы

52

SPB. Общая идея

• IS-IS обеспечивает расчет параллельных маршрутов

• Пограничный коммутатор добавляет в заголовок адрес

точки выхода (B-DA)

• Коммутаторы ядра используют этот адрес для передачи

S1S2

S3 S4 S5 S6

Server A Server B

Таблица MAC

Server A Порт 1

Server B S2

Таблица Switch

S2 Порт 3,4,5,6

----------------------------

Page 53: Солидекс ПИ - ЦОДы

53

Отличия TRILL и SPB

Характеристика SPB TRILL

Разработчик IEEE (802.1aq) IETF (RFC 5556)

Заголовок

Использует заголовок

PBB: не требует

замены оборудования

Собственный заголовок

TRILL: требует поддержки

“в железе”

Расчет топологииИспользует IS-IS для

расчета топологии

Использует IS-IS для расчета

топологии

Обеспечение

симметричности

трафика

Для всех типов

Только для unicast.

Для multicast и unknown

MAC – возможны

несимметричные пути

Page 54: Солидекс ПИ - ЦОДы

54

Содержание

• Уменьшение ART

• Резервирование и балансировка в WAN

• Непрерывность функционирования: два ЦОД

– Распределение запросов

– Миграция виртуальных машин

– Синхронизация данных

• Сеть ЦОД

– Производительность

– Уменьшение количества уровней

– Единая сеть для LAN и SAN

Page 55: Солидекс ПИ - ЦОДы

55

Уровни сети в ЦОД: сейчас

РЦОД

VM VM

vSwitch

VM VM

vSwitch

Коммутаторы ядра

Коммутаторы агрегирования

Коммутаторы доступа

Blade-коммутаторы

Виртуальные коммутаторы

• Уровневый дизайн vs «Горизонтальный» трафик

Page 56: Солидекс ПИ - ЦОДы

56

Сколько уровней в самый раз?

Page 57: Солидекс ПИ - ЦОДы

57

3 уровня

РЦОД

VM VM

vSwitch

VM VM

vSwitch

Коммутаторы ядра и агрегирования

Коммутаторы доступа

Виртуальные коммутаторы

• Исключены blade-коммутаторы

• Совмещены функции уровней ядра и агрегирования

• Можно ли убрать уровень виртуальных коммутаторов?

Page 58: Солидекс ПИ - ЦОДы

58

Исключаем vSwitch: IEEE 802.1Qbg (VEPA)

VM1 VM2 VM3

NIC

Коммутатор доступа

Сервер

Direct Path I/O

Virtual Station

Interface Discovery

and Configuration

Передача трафика без

привлечения виртуального

коммутатора

Динамическая настройка

VLAN при перемещении VM

Обработка VM-трафика

(коммутация, фильтрация,

обнаружение аномалий, учет)

Page 59: Солидекс ПИ - ЦОДы

59

2 уровня

РЦОД

VM VM VM VM

Коммутаторы ядра и агрегирования

Коммутаторы доступа

Page 60: Солидекс ПИ - ЦОДы

60

1 уровень

РЦОДКоммутаторы ядра, агрегирования и доступа

VM VM VM VM

Page 61: Солидекс ПИ - ЦОДы

61

Содержание

• Уменьшение ART

• Резервирование и балансировка в WAN

• Непрерывность функционирования: два ЦОД

– Распределение запросов

– Миграция виртуальных машин

– Синхронизация данных

• Сеть ЦОД

– Производительность

– Уменьшение количества уровней

– Единая сеть для LAN и SAN

Page 62: Солидекс ПИ - ЦОДы

62

2 разные сети или 1 универсальная сеть?

• Сейчас: разные сети (технологии, оборудование,

специалисты) под разные задачи

– Ethernet: для LAN

– FC для SAN: малые задержки и loseless-транспорт

• Можно ли отказаться от FC и использовать

Ethernet в сети хранения данных?

Page 63: Солидекс ПИ - ЦОДы

63

Требования к универсальной сети

От Ethernet потребуются новые «умения»

1. Гарантировать доставку без потерь

2. Гарантировать минимальную задержку

3. Гарантировать полосу пропускания

Page 64: Солидекс ПИ - ЦОДы

64

Datacenter Bridging: улучшенный Ethernet

Свойство Назначение

Priority-based Flow Control (PFC)

IEEE 802.1Qbb

Транспорт без потерь (loseless)

Enhanced Transmission Selection

(ETS)

IEEE 802.1Qaz

Приоритет и гарантированная полоса пропускания для каждого класса

Data Center Bridging Exchange

Protocol (DCBX)

IEEE 802.1Qaz

Согласование конфигурации

Congestion Notification

IEEE 802.1Qau

Управление перегрузками

Page 65: Солидекс ПИ - ЦОДы

65

Priority-based Flow Control (PFC)

• Уведомление PAUSE для линии (класса трафика)

при исчерпании соответствующего буфера

• Позволяет строить loseless-транспорт

Выходные очереди

Входные буферы

Буфер “Blue” заполнен?

PFC PAUSE: “Blue” lane

Page 66: Солидекс ПИ - ЦОДы

66

Enhanced Transmission Selection (ETS)

• Передача трафика на основе приоритета (Priority)

и минимальной полосы (Bandwidth)

Выходные очереди

Входные буферы

PRI 1, BW 30%

PRI 2, BW 60%

Page 67: Солидекс ПИ - ЦОДы

67

Data Center Bridging Exchange Protocol (DCBX)

Выходные очереди

Входные буферы

• Проверка и согласование конфигурации DCB

между соседними коммутаторами

– Параметры PFC и ETS

– Логическое состояние Virtual Lane

Page 68: Солидекс ПИ - ЦОДы

68

WAN

ЦОД. Вокруг и внутри

ОЦОД

Удаленное подразделение

WOC/WPC GSLB

Network-based Storage VirtSLB

РЦОД

Оператор А

Оператор B

VM VM

WOC/WPC GSLB

SLB

VM VM

WOC/WPC

Page 69: Солидекс ПИ - ЦОДы

Вопросы?