1© Copyright 2009 EMC Corporation. All rights reserved.
Vliv diskové infrastruktury na výkon MS SQL Serveru
2© Copyright 2009 EMC Corporation. All rights reserved.
Agenda
Návrh diskové infrastruktury pro MS SQL
RAID penalty
zvyšování výkonu
EFD
Anatomie IO
Naměření hodnoty
Ideální nasazení pro SQL
Tiering na poli
3© Copyright 2009 EMC Corporation. All rights reserved.
Jak mohu zjednodušit nasazení
Microsoft SQL Serveru?
Jak mohu konsolidovat mnoho serverů a DB instancí? Jak získat co nejlepší poměr –
výkon, funkce, cena?
Jak mohu optimalizovat proces zálohy a
obnovy?Jak mohu vylepšit výkon DB
a naplnit tak požadavky nejnáročnějších aplikací?
Jak mohu naplnit RPO, RTO požadavky organizace?
Klíčové úkoly při vytváření infrastruktury pro MS SQL
Konsolidace Náklady
Vysoká dostupnost
ZálohaObnovaVýkon
Snadnost nasazení
4© Copyright 2009 EMC Corporation. All rights reserved.
Návrh diskové infrastruktury-na co je třeba myslet I.
Analýza I/O profilu nasazované aplikace– Dotaz na dodavatele– Kalkulátory a modelační nástroje– Analýza stávajícího prostředí v případě migrace
• Počet I/O• Velikost I/O• Poměr čtení zápis• Poměr náhodných a sekvenčních transakcí
Diskové schéma– Typ disků (EFD, FC, SATA)– Typ RAID zabezpečení– Počet disků, distribuce– Velikost stripe a element size logického disku– Posunutí počátku logického volumu, Window 2003 a starší– Velikost stripe souborového systému– Definice a oddělení jednotlivých částí DB (DB, logy, indexy, TEMPDB)– Ověřit koexistenci dalších aplikací na stejném poli RG nebo disku– Používání referenčních konfigurací
Porty FE
R/W cache
CPU
Porty BE
Porty FE
R/W cache
CPU
Porty BE
Hosti/Servery
Fyzické disky v RAIDu
5© Copyright 2009 EMC Corporation. All rights reserved.
Návrh diskové infrastruktury - na co je třeba myslet II.
5
Připojení systému do diskového pole– Volba technologie FC, iSCSI, FCoE, NAS, DAS– HBA karty pro dostupnost a výkon– Použití MultiPath ovladačů, MPIO– Maximální počet logických disků, LVM
Před nasazením do živého provozu– Ověřte design pomocí simulačních nástrojů
Microsoft – SQLIO, SQLIO Simulator IOZONE
– Ověřte chování HA komponent
Po nasazení do ostrého provozu– Pravidelně ověřujte výkon infrastruktury včetně diskového pole - Monitoring– Vyžadujte po svém storage administrátorovi výkonnostní statistiky diskového pole– Optimalizujte diskové schéma při zvýšení nároků na výkon
Porty FE
R/W cache
CPU
Porty BE
Porty FE
R/W cache
CPU
Porty BE
Hosti/Servery
Fyzické disky v RAIDu
6© Copyright 2009 EMC Corporation. All rights reserved.
Co je to výkon diskového pole
6
Základní parametry které měříme na diskových polích:
– Throughput (IOPS)Velmi důležitý pro přístup souborového systému a DB,
RDBMS; velmi malé I/O požadavky (2-16KB)
– Bandwidth (MB/s)Důležitý pro backup a obnovu - přesun velkých souborů
přenášených pomocí velkých bloků
– Response time (ms)Klíčové měřítko pro posuzování kvality poskytování dat;
kritická je stabilita RT při různých režimech zatížení SnapShot Sessions, Mirrors
7© Copyright 2009 EMC Corporation. All rights reserved.
Vliv RAID protekce na výkon zápisových operací
Počet BE zápisových operací pro jednotlivé typy RAID
8© Copyright 2009 EMC Corporation. All rights reserved.
Fyzické disky
Čtecí operace
Read Cache
PREFETCH
6 ms.
0.25 ms.
Techniky pro zvyšování výkonu
Read Caching
Read Caching– Přečtená data jsou určitou dobu držena v cache pro další čtení
Prefetch– Jakmile je detekováno sekvenční čtení, data následných
bloků jsou předpřipravena do čtecí cache
Výhody: výrazně kratší response time na vyřízení čtecích požadavků
Porty FE
R/W cache
CPU
Porty BE
Porty FE
R/W cache
CPU
Porty BE
Hosti/Servery
Fyzické disky v RAIDu
9© Copyright 2009 EMC Corporation. All rights reserved.
Write Cache
zápisová operace2 KB I/O to LUN
Single 8 KB I/O to disk
Write Caching – Write acknowledgement
Psaní dat do cache je vždy rychlejší než-li zápis do disků– Pro malé I/O, menší než-li 1 ms, versus 5 – 12 ms do disků– Dokáže eliminovat typ disků na zápisový výkon
Algoritmus vyprazdňování cache je klíčová vlastnost– Pomalé disky pomalu odebírají data z cache– Optimalizace velikosti bloků pro disky
LUN
Techniky pro zvyšování výkonu
Porty FE
R/W cache
CPU
Porty BE
Porty FE
R/W cache
CPU
Porty BE
Hosti/Servery
Fyzické disky v RAIDu
10© Copyright 2009 EMC Corporation. All rights reserved.
Typy disků I.
– Fibre Channel disky Kapacity 73-450 GB Otáčky 10k – 15k ot. Propustnost cca 50-70MB/s I/O 120-180 Doba odezvy 6-9ms
– SATAII disky Kapacity 500-1000 GB Otáčky 5.4k – 7.2k ot. Propustnost cca 50-60MB/s I/O 80-100 Doba odezvy 12-16ms
11© Copyright 2009 EMC Corporation. All rights reserved.
Nárůst kapacity disků
28 Years Density Improvements
0
200
400
600
800
1000
1200
1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 2002 2004 2006 2008
Year
Ca
pac
ity
in
GB
12© Copyright 2009 EMC Corporation. All rights reserved.
Nárůst propustnosti sběrnic disků
28 Years of Channel Interface Improvements
0
50
100
150
200
250
300
350
400
450
BMC SCSI 1 SCSI Fast SCSI Ultra SCSI Ultra2 SSA FC 1Gb FC 2Gb FC 4Gb
Interface Type
MB
/Sec
on
d
13© Copyright 2009 EMC Corporation. All rights reserved.
Zvýšení počtu IO operací
28 Years of HDD EvolutionIOPS 4X
0.0
20.0
40.0
60.0
80.0
100.0
120.0
140.0
160.0
180.0
3600_RPM 5400_RPM 7200_RPM 10K_RPM 15K_RPM
IO/S
ec
1982
20082008
14© Copyright 2009 EMC Corporation. All rights reserved.
Klíčové parametry ovlivňující výkon konvenčních disků
Seek time– čas potřebný pro nastavení čtecích
a zápisových hlaviček
Rotační latence– specifikuje potřebný čas pro
nastavení datové oblasti pod čtecí nebo zápisovou hlavičku
15© Copyright 2009 EMC Corporation. All rights reserved.
Typy disků - Enterprise Flash Drive
EMC spolupracovalo na vývoji EFD disků se společností STEC Inc.
první EFD uvedeny před rokem na platformě EMC Symmetrix DMX4
druhá generace EFD uvedena v březnu 09
Nové výkonnostní parametry:Náhodné čtení: 45,000 operacíNáhodné zápisy: 16,000 operacíSekvenční čtení: 220 MB/sSekvenční zápisy: 115 MB/sInterface: FC, SAS a SATAProvedení: 3.5 palců
(standardní HDD rozměry)
Váha: menší než 0,4 kg
16© Copyright 2009 EMC Corporation. All rights reserved.
Controller Controller LogicLogic
Controller Controller LogicLogic
Non-VolatileNon-VolatileSLCSLC
NAND FlashNAND Flash
Non-VolatileNon-VolatileSLCSLC
NAND FlashNAND Flash
Anatomie Enterprise Flash Drive
FirmwareFirmware• Interface Protocol• Media Management• Error Detection & Correction
Dual-PortedDual-PortedFC FC
InterfaceInterface
Dual-PortedDual-PortedFC FC
InterfaceInterface
DDR DDR SDRAM SDRAM w/SPSw/SPS
DDR DDR SDRAM SDRAM w/SPSw/SPS
MultipleMultipleParallelParallel
I/O ChannelsI/O Channels
MultipleMultipleParallelParallel
I/O ChannelsI/O Channels
První Enterprise Flash Drive na trhu
Spolehlivost DostupnostVýkon
17© Copyright 2009 EMC Corporation. All rights reserved.
Enterprise Flash Drive - spolehlivost
Spolehlivost na úrovni zařízení– Duální FC rozhraní– Integrovaná ochrana DRAM destage při
ztrátě napájení– Multi-bit ECC – oprava chyb– Integrovaný termální senzor– Rozšířený SMART mechanismus
NAND – Spolehlivost na úrovni logiky– SLC NAND technologie garantuje min
100,000 přepisů s 1-bit ECC Praxe potvrzuje 300,0002,000,000
přepisů Multi-bit ECC
– Dynamické pře-mapování vadných bloků Stejný přístup jako u konvečních HDD
– SDRAM cache buffer pro optimalizace zápisových operací
Wear-Leveling-Regulace opotřebení– Hrubá kapacita vs. hrubá NAND kapacita
73 GB použitelná = 128 GB hrubá 146 GB použitelná = 256 GB hrubá
– Statická a dynamická regulace opotřebení Zápisy a přepisy jsou re-alokovány na méně
opotřebený fyzický NAND blok
Očekávaná životnost je vyšší než-li u konvenčních pevných disků
18© Copyright 2009 EMC Corporation. All rights reserved.
Rozdíl mezi SSD a Enterprise Flash Drives
EFD• Singl level cell (SLC) NAND
• Ukládají jeden datový bit do paměťové buňky
• Duální FC porty
• Více kanálový paralelní IO přístup
• Vyšší propustnost
• Rozšířená správa opotřebení
SSD • Multi-level cell (MLC) NAND nebo NOR
• Ukládají do paměťové buňky více než-li jeden Bit
• Optimalizované pro provoz „jednou zapsat a mnohokrát přečíst“
• Optimalizováno pro výkon čtení, průměrný výkon pro zápis
• Zřídka podporují optimalizaci opotřebení
Příklad: USB disky, MP3 přehrávače, PC disky
19© Copyright 2009 EMC Corporation. All rights reserved.
Anatomie čtecí operace
Cache Read Hit
Cache Read Miss
Locate& TransmitRequested
Block
AllocateCache
Slot
Store&
TransmitBlock
~0.2-0.5 milliseconds
7200 rpm HDD: ~12 milliseconds10K rpm HDD: ~ 9 milliseconds15K rpm HDD: ~ 6 milliseconds EFD: ~ 1
milliseconds
Read BlockFrom MediaInto Cache
20© Copyright 2009 EMC Corporation. All rights reserved.
21752
20822
0
1
2
3
4
5
6
7
8
9
0 5000 10000 15000 20000 25000IOPs
Re
sp
on
se
Tim
e -
ms
ec
Výkon Enterprise Flash Disků
HDD14 RAID Groups
(112 disků)
Flash drive1 RAID Group
(8 disků)
OLTP2 profile:20% random read hit 8 Kb
45% random read miss 8 Kb15% random write 8 Kb
10% seq read 64 Kb10% seq write 64 Kb
Výrazně nižší Response Time i pro smíšený typ zátěže
KBKB
KBKBKB
21© Copyright 2009 EMC Corporation. All rights reserved.
EFD měření – jeden EFD vs FC
22© Copyright 2009 EMC Corporation. All rights reserved.
Čtení - EFD RAID5 - 4+1
23© Copyright 2009 EMC Corporation. All rights reserved.
Čtení - FC RAID5 - 4+1
24© Copyright 2009 EMC Corporation. All rights reserved.
Čtecí operace – RAID5 4+1
typ disku velikost IO IOPS MB/Saverage latence
(ms)
FC 8 KB 702 5,49 4
EFD 8 KB 17946 140,2 0
FC 16 KB 598 9,34 4
EFD 16 KB 9888 154,5 1
FC 32 KB 375 11,73 8
EFD 32 KB 5275 164,86 2
FC 64KB 257 16,07 11
EFD 64 KB 2840 177,51 2
25© Copyright 2009 EMC Corporation. All rights reserved.
Enterprise Flash Drive – porovnání základních parametrů
typ disku IOPSbandwidth
(MB/s)average
seek (ms)rotační
latence (ms)váha (kg)
spotřeba idle (W)
spotřeba aktivní (W)
vyzářené teplo 15 disků (Btu/Hod)
SATA 80 10 9,2 4,17 0,53 8,00 12,00 1100
FC 10k 140 15 4,4 3 0,8 6,49 10,07 1200
FC 15k 180 20 4 2 0,8 13,70 18,80 1240
EFD 2500 100 0,02 N/A < 0,4 5,40 8,40 770
26© Copyright 2009 EMC Corporation. All rights reserved.
Zrychlení správné části aplikace
databáze obvykle obsahují několik tabulek, které jsou přistupovány častěji
– Indexy a vyhledávací funkce – např. Account #, Phone #, SS #, email ID, ZIP Code, atd.
jedna aplikační transakce většinou generuje desítky diskových operací– např: transakce s debetní kartou vyžaduje 12 diskových I/Os
8 lookup, 2 reads, 2 writes
– 250+ diskových I/O’s per požadavek je běžné např. pro aplikace data warehousů
umístění vyhledávacích tabulek na EFD může mít obrovský dopad– Transaction time s 12 Read Miss I/O’s na 15K HDD: 720ms– Transaction time jestliže 8/12 je obslouženo EFD: 32ms
Není nutné používat Flash disky pro 100 % dat
22x !
27© Copyright 2009 EMC Corporation. All rights reserved.
Tiering v rámci diskového pole
Clariion– manuální tiering na základě výkonnostních dat
z analyzačních nástrojů – Navisphere Analyzer nebo OS related (Perfmon, IOSTAT)
– Virtual LUN – non-disruptive přesouvání LUNů mezi různými typy disků
Symmetrix– Symmetrix optimizer – automatický přesun
vytížených hyperů mezi různými typy disků bez přerušení přístupu k datům
– Virtual LUN – non-disruptive přesouvání LUNů mezi různými typy disků
Zrychlením malé, ale používané části databáze
lze výrazně zvýšit výkon databáze!
Flash
FibreChannel
SATA
V-LUN
V-LUN
28© Copyright 2009 EMC Corporation. All rights reserved.
Demo prostředí
29© Copyright 2009 EMC Corporation. All rights reserved.
Vaše dotazy
Top Related