PLSSUG Meeting - Wysoka dostepność SQL Server 2008 w kontekscie umów SLA

29
Wysoka dostępność SQL Server 2008 w kontekście umów SLA {GET DATE 28/04/2009} {WHERE ABC Data, ośrodek poznański } {AUDIENCE TYPE członkowie PLSSUG Poznań}

Transcript of PLSSUG Meeting - Wysoka dostepność SQL Server 2008 w kontekscie umów SLA

Page 1: PLSSUG Meeting - Wysoka dostepność SQL Server 2008 w kontekscie umów SLA

Wysoka dostępność SQL Server 2008w kontekście umów SLA

{GET DATE – 28/04/2009}{WHERE – ABC Data, ośrodek poznański}{AUDIENCE TYPE – członkowie PLSSUG Poznań}

Page 2: PLSSUG Meeting - Wysoka dostepność SQL Server 2008 w kontekscie umów SLA

Tobiasz Janusz Koprowski

Data Center Operation Specialist atAsseco Business Solutions SA

Page 3: PLSSUG Meeting - Wysoka dostepność SQL Server 2008 w kontekscie umów SLA

{get BIO}•związany z informatyką od połowy lat dziewięćdziesiątych•kilkuletnie doświadczenie w informatyce bankowej [Zorba, AS/400, ICBS, BTeller]•kilkuletnie doświadczenie w Centrum Przetwarzania Danych•na co dzień zajmujący się MOSS, Disaster Recovery, High Availibility, wirtualizacją,

bezpieczeństwem fizycznym, tworzeniem procedur bezpieczeństwa•uczestnik kilku programów Microsoft: Connect, Community Leadership Programm,

ITPro Momentum, VS2010 Terminology Community, Windows 7 Beta 2 PL•Konsultant i wdrożeniowiec przy projektach audytów licencyjnych, systemów bezpieczeństwa

antywirusowego, tworzenia ośrodków przetwarzania danych •lider wrocławskiej grupy PLSSUG•prelegent na spotkaniach społeczności PLSSUG, ISSA, SE Club,•Thawte Web Of Trust Notary

Page 4: PLSSUG Meeting - Wysoka dostepność SQL Server 2008 w kontekscie umów SLA

Agenda

• Czym jest HA (High Availibility)

• Dlaczego SLA – co to jest?

• Zastosowanie HA w organizacji

• Zastosowanie SLA w organizacji

• Zależności SLA i HA

• Przykłady

• Q&A

Page 5: PLSSUG Meeting - Wysoka dostepność SQL Server 2008 w kontekscie umów SLA

Czym jest HA ?

• Wysoka dostępność (HA) to zapewnienienieprzerwanej pracy urządzeń i systemów napotrzeby (zazwyczaj) środowiskaprodukcyjnego w przedsiębiorstwie.

• Ma zapobiegać utracie danych w wyniku:− błędów oprogramowania,

− defektów produkcyjnych,

− awarii sprzętowych

− naturalnych katastrof

− błędów człowieka

− innych nieprzewidzianych zdarzeń

Page 6: PLSSUG Meeting - Wysoka dostepność SQL Server 2008 w kontekscie umów SLA

Dwa rodzaje niedostępności:

• PSO Planned System Outages – Planowana NiedostępnośćSystemu− zaplanowana minimalna niedostępność systemu, spowodowana

koniecznością przeprowadzenia prac modernizacyjnych, instalacjipoprawek, wymianą/rozszerzeniem rozwiązań sprzętowych,

− uzgodniona z klientem i nie wpływająca na postanowienia HA iSLA, do momentu…

• USO Unplaned System Outages – Nieplanowana NiedostępnośćSystemu− wystąpienie błędu uniemożliwiającego częściową, bądź całkowita

pracę środowiska w sposób odczuwalny, mierzalny przez klienta

− powodująca wysokie koszty w przypadku konieczności napraw, jakrównież płatności karnych za niewykonanie SLA

Page 7: PLSSUG Meeting - Wysoka dostepność SQL Server 2008 w kontekscie umów SLA

Wskaźniki wydajności (HA)

• Każdy z nas słyszał o popularnych dziewiątkach?

• Co to naprawdę jest dostępność rzędu 99,99%?

• Dostępność 99,99% to NIEDOSTĘPNOŚĆ rzędu 0,01% w zadanym okresie (np. rocznym), czyli…

• Ile to jest w przeliczeniu na niedostępność serwera/środowiska/bazy:

• Availability = MTBF / MTBF + MTTR− MTBF -> Mean Time Between Failures

− MTTR -> Mean Time To Repair

Page 8: PLSSUG Meeting - Wysoka dostepność SQL Server 2008 w kontekscie umów SLA

Niedostępności w dniach, godzinach, minutach

Availability % Downtime per year Downtime per month* Downtime per week

90% 36.5 days 72 hours 16.8 hours

95% 18.25 days 36 hours 8.4 hours

98% 7.30 days 14.4 hours 3.36 hours

99% 3.65 days 7.20 hours 1.68 hours

99.5% 1.83 days 3.60 hours 50.4 min

99.8% 17.52 hours 86.23 min 20.16 min

99.9% ("three nines") 8.76 hours 43.2 min 10.1 min

99.95% 4.38 hours 21.56 min 5.04 min

99.99% ("four nines") 52.6 min 4.32 min 1.01 min

99.999% ("five nines") 5.26 min 25.9 s 6.05 s

99.9999% ("six nines") 31.5 s 2.59 s 0.605 s

Page 9: PLSSUG Meeting - Wysoka dostepność SQL Server 2008 w kontekscie umów SLA

Czym jest SLA?

• SLA – Service Level Agreement.

• Początki sięgają 1980 roku i umów pomiędzy operatoramitelekomunikacyjnymi i klientami końcowymi.

• Obustronnie negocjowalna umowa o świadczenie usług(nie tylko IT, choć tych w szczególności)

• Powinna być zawarta formalnie, choć prawniedopuszczalna jest umowa nieformalna

• Obejmująca poziom i zakres świadczonej usługi zapomocą mierzalnych wskaźników (poziom dostępności,użyteczności, wydajności)

• Umowa powinna mieć sprecyzowany zakres minimum imaksimum dla każdej podlegającej jej usługi

Page 10: PLSSUG Meeting - Wysoka dostepność SQL Server 2008 w kontekscie umów SLA

Mierzalność SLA

Nie ma umowy SLA bez określonych wskaźników pomiaru!!!

PRZYKŁAD DLA CALL CENTER / SERVICE DESK:

• ABA (Abandonment Rate): Odsetek porzuconych połączeń podczas oczekiwania na odpowiedź.

• ASA (Average Speed to Answer): Średnia czasu (zazwyczaj w sekundach) potrzebny do połączenia z help deskiem.

• TSF (Time Service Factor): Odsetek odebranych połączeń w precyzyjnych ramach czasowych, np. 80% w 20 sekund.

• FCR (First Call Resolution): Procent połączenia, podczas których problem został rozwiązany bez konieczności przełączania do innego eksperta

• TAT (Turn Around Time): Czas potrzebny do zakończenia określonych zadań.

Page 11: PLSSUG Meeting - Wysoka dostepność SQL Server 2008 w kontekscie umów SLA

Gwarancja SLA w Google

Piotr Waszczuk, IDG News Service

31 października 2008 16:17

Computerworld

Wczoraj (30 października) Google wprowadził gwarancję dostępności komercyjnej wersji pakietuaplikacji biurowych. Umowa SLA ma obejmować m.in. aplikacje: Kalendarz, Dokumenty i GoogleSites oraz usługę Google Talk. Wcześniej gwarancja taka dotyczyła tylko usługi Gmail.

Google zobowiązał się do zapewnienia dostępności pakietu Google Apps Premier Edition na poziomie 99,9proc. w skali miesiąca. W ramach rekompensaty za ewentualne dłuższe przerwy w dostępności koncernzamierza oferować klientom darmowy dostęp do komercyjnych usług. Przykładowo, jeśli dostępność GoogleApps spadnie poniżej poziomu 99 proc. w ciągu miesiąca klienci będą mogli za darmo korzystać z aplikacjiprzez trzy dni. W przypadku dostępności na poziomie niższym niż 95 proc. użytkownicy Google AppsPremier Edition zostaną zwolnieni z opłat na 15 dni.

Uwzględniane będą jednak tylko przestoje trwające dłużej niż 10 minut. Umowa SLA nie uwzględnia równieżplanowanych przerw technicznych, zapowiedzianych z co najmniej pięciodniowym wyprzedzeniem.Jednocześnie Google zobowiązuje się, że przerwy takie nie będą trwały dłużej niż 12 godzin rocznie.

Zapowiedź rozszerzenia gwarancji dostępności jest odpowiedzią na wzrastającą liczbę zarzutówdotyczących spadku jakości oferowanych usług. Tylko w październiku niektórzy użytkownicy Google Appsnie mogli korzystać z aplikacji nawet przez 30 godzin. Według oficjalnych informacji z aplikacji Google Appskorzysta ponad 500 tys. firm z całego świata oraz ponad 10 mln aktywnych użytkowników.

Page 12: PLSSUG Meeting - Wysoka dostepność SQL Server 2008 w kontekscie umów SLA

Zastosowania HA SQL Server 2008

Microsoft SQL Server 2008 oferuje:

• Database Mirroring

• Database Snapshots

• Windows Clustering

• SQL Server Replication

• Hot-add memory and CPU

• Online Index Operations

• Table and Index Partitioning

• Failover Clustering

• Peer-To-Peer Replication

Page 13: PLSSUG Meeting - Wysoka dostepność SQL Server 2008 w kontekscie umów SLA

Rozwiązania HA dla SQL Server 2008

AREADATABASE

MIRRORING

FAILOVER

CLUSTERING

TRANSACTIONAL

REPLICATIONLOG SHIPPING

Data Loss no data loss no data loss some data loss possible

some data loss

possible

Automatic Failover YES (in HA mode) YES no no

Transparent To Client YES, autodirect

YES, connect to same

IP no, NLB helps no, NLB helps

Downtime < 3 seconds

20 seconds or more +

time to recovery seconds

seconds plus time to

recovery

Standby Ready Access Yes, with db snapshots no data loss YES

Data Granularity DB only all systems and db's table or view DB only

Masking of hdd failure YES No, shared disk YES YES

Special hardware

NO, duplicate

recommended Cluster HCL

NO, duplicate

recommended

NO, duplicate

recommended

Complexity Some More More More

Page 14: PLSSUG Meeting - Wysoka dostepność SQL Server 2008 w kontekscie umów SLA

Database Mirroring

• Mirroring, czyli lustrzane odbicie danych

• Dostępne tylko dla dwóch baz (principal, mirror),

• Wymagana funkcja świadka (witness)

• Wymagania:− principal, mirror – tylko SQL Server Enterprise

− witness – może być SQL Server Express

• Dostępne dla bazy:

− kopia bazy na innym serwerze fizycznym, i/lub wirtualnym

• Dostępne dla systemu:

− Kopia całego środowiska na innym serwerze fizycznym i/lub wirtualnym

Page 15: PLSSUG Meeting - Wysoka dostepność SQL Server 2008 w kontekscie umów SLA

Fast Manual Failover

• W trybie High Security (synchroniczny mirroring bez świadków), failover zawsze jest manualny

• SQL Server 2005, jeżeli wystąpi sytuacja awaryjna, baza danych na serwerze lustrzanym jest zamykana i uruchamiana ponownie, aby wymusić na odzyskanie niezakontraktowanego dziennika transakcji

− Może to znacznie wydłużyć czas pracy awaryjnej

− Rozważmy bazę danych z setkami plików, gdzie wszystkie muszą być otwierane kolejno aby ruchomić bazy danych

• SQL Server 2008 usuwa ten krok, tym samym przyspieszenie i ograniczenie stosowania awaryjnego przestoju

Page 16: PLSSUG Meeting - Wysoka dostepność SQL Server 2008 w kontekscie umów SLA

Hot-add memory and CPU

• W SQL Server 2005 dodano możliwość wykorzystania pamięci dodawanej „na gorąco”

• W SQL Server 2008 rozszerzono możliwości dynamicznej pracy SQL Server, pozwalając na gorąco dodać CPU

• "Hot-add" oznacza możliwość podłączenia RAM/CPU do komputera, gdy komputer jest uruchomiony, a następnie poprzez odświeżenie SQL Server umożliwić korzystanie z nowego sprzętu ONLINE

• Sprzęt musi obsługiwać Hot-add (oczywiście!!)

− Obsługiwane tylko w wersji Enterprise Edition uruchomiony w 64-bitowej wersji systemu Windows Server 2008 Datacenter / Enterprise

− SQL Server nie może automatycznie rozpocząć korzystania z nowych procesorów / pamięci

− Potrzeba uruchomić polecenie reconfigure

− Uruchomione już kwerendy nie będą korzystać z nowo dodanych pamięci/procesorów.

Page 17: PLSSUG Meeting - Wysoka dostepność SQL Server 2008 w kontekscie umów SLA

Peer-to-Peer Topology (?)

• W SQL Server 2005 wprowadzono możliwość użycia rozwiązania peer-to-peer (lub "dwukierunkowej") replikacji transakcyjnej

• Świetny sposób na skalowanie zasobów niezbędnych do pracy

• Częściowo jako sposób na posiadanie „zbędnej kopii”

• Miała jedną poważną wadę - zmiana topologii peer-to-peer wymagała zatrzymania CAŁEJ działalności na serwerach w drzewie topologii

• W SQL Server 2008,

− zostały usunięte te ograniczenia (w większości przypadków),

− także zmodernizowano kreator konfiguracji peer-to-peer w SSMS

− Przełączanie partycji może zostać powtórzone

Page 18: PLSSUG Meeting - Wysoka dostepność SQL Server 2008 w kontekscie umów SLA

Peer-To-Peer Topology Wizard

• The wizard now is graphical, with drag-n-drop functionality for making topology connections

Page 19: PLSSUG Meeting - Wysoka dostepność SQL Server 2008 w kontekscie umów SLA

SLA – co to ma wspólnego z DBA

• Hours Of Operation:

− Godziny w których partycja/tabela/baza danych musi być dostępna

− Może być różny dla różnych części bazy danych, zależnych np. od aplikacji

• Procent czasu działania usługi:

− Procent czasu w ciągu (zakresu czasowego) kiedy usługa/partycja/tabela/baza jest dostępna

• Godziny zastrzeżone dla przestojów:

− Podane z wyprzedzeniem godziny przestojów (przerwy techniczne) ułatwiają pracę użytkownikom

• Metody pomocy dla użytkowników

• Czas odpowiedzi od HelpDesku

• Czas reakcji DBA na zdarzenie

Page 20: PLSSUG Meeting - Wysoka dostepność SQL Server 2008 w kontekscie umów SLA

SLA – co to ma wspólnego z DBA - cd

• Liczba użytkowników w systemie

− Liczba transakcji obsługiwanych w danej jednostce czasu

− Dopuszczalne poziomy osiągów dla dostępu do różnych operacji

− Minimalny czas wymagany do replikacji na różne serwery

• Termin na odzyskanie danych z awarii

− Przypadkowe usunięcie danych

− Uszkodzenie bazy danych

− SQL Server Crash

− OS Server Crash

− Czas potrzebny na odczytanie danych w internecie (np. odczyt/zapis tabeli sprzedaży) tak by mona było kontynuować prowadzenie sprzedaży

• Maksymalna ilość miejsca

− Maksymalna ilość miejsca na tabele/bazy

− Ilość użytkowników w konkretnych rolach

Page 21: PLSSUG Meeting - Wysoka dostepność SQL Server 2008 w kontekscie umów SLA

Czy wiesz dlaczego SLA jest ważne

• Tak naprawdę to coś więcej niż tylko podpisana umowa między klientem a twoim szefem.

• Jest to kontrakt który również TY musisz spełniać

• Jeśli jest podpisana umowa na zero przestojów i zero utraty danych (abstrakcja?) to musisz mieć pewność, że w przypadku korupcji możesz tę umowę spełnić (zmiana/usunięcie danych celowo przez autoryzowanego użytkownika).

• Jeśli nie możesz spełnić SLA, to biznes narażony jest na przestoje i utratę danych

• Końcowym efektem jest złożenie swojego CV do agencji pracy…

Page 22: PLSSUG Meeting - Wysoka dostepność SQL Server 2008 w kontekscie umów SLA

Czy myślisz że możesz spełnić swoje Service Level Agreement?

• Musisz wiedzieć jakie są warunki/wymagania dla SLA jeżeli masz je spełnić

• Jak możesz je spełnić, jeśli nie wiesz że istnieje umowa SLA?

• Jak możesz przejrzeć umowę skoro nikt Cię nie zaprosił na spotkanie w sprawie stworzenia umowy SLA?

• Końcowym efektem jest złożenie swojego CV do agencji pracy…

Page 23: PLSSUG Meeting - Wysoka dostepność SQL Server 2008 w kontekscie umów SLA

Czy znasz swoje SLA?

• Musisz wiedzieć jakie są warunki/wymagania dla SLA jeżeli masz je spełnić

• Jak możesz je spełnić, jeśli nie wiesz że istnieje umowa SLA?

• Jak możesz przejrzeć umowę skoro nikt Cię nie zaprosił na spotkanie w sprawie stworzenia umowy SLA?

Page 24: PLSSUG Meeting - Wysoka dostepność SQL Server 2008 w kontekscie umów SLA

Czy uważasz, że możesz spełnić swoje SLA?

• Plan odbudowy wygląda świetnie na papierze – ale czy kiedykolwiek go przetestowałeś?

• Załóżmy taką sytuacje:

− Dopuszczamy 15 minut niedostępności dla 300 GB bazy danych

− Jesteśmy w stanie w ciągu tych 15 minut podstawić kopię bazy dla użytkownika

− Co zrobisz w przypadku uszkodzenia bazy danych?

− Co zrobisz w przypadku uszkodzenia dysku?

− Co zrobisz w przypadku spalenia się płyty głównej?

− Co zrobisz w przypadku przecięcia kabla FC?

− Jak dużo czasu zajmie odzyskanie z backupu?

− Jak dużo czasu zajmie przywiezienie tasiemki z backupem z drugiej lokalizacji oddalonej o 25 kilometrów w centrum Warszawy o godzinie 14?

Czy dalej spełniasz SLA 15 minut przestoju?

Page 25: PLSSUG Meeting - Wysoka dostepność SQL Server 2008 w kontekscie umów SLA

Podsumowanie

• Database mirroring

• Log Shipping

• Hot-add CPU

• Transactional Replication

• Failover clustering enhancements

• Peer-to-peer replication enhancements

Page 26: PLSSUG Meeting - Wysoka dostepność SQL Server 2008 w kontekscie umów SLA

Podsumowanie

• Musisz wiedzieć o istnieniu SLA

• Musisz brać udział w tworzeniu umowy SLA (wymagań/możliwości/technologii)

• Musisz mieć plany awaryjne –PRZETESTOWANE

• Musisz mieć wiedzę o swojej odpowiedzialności

• Musisz mieć możliwość techniczną dotrzymania umowy SLA

Page 27: PLSSUG Meeting - Wysoka dostepność SQL Server 2008 w kontekscie umów SLA

Pytania? Dyskusja?

PROSZĘ O OCENĘ MOJEJ SESJI

DZIĘKUJĘ ZA UWAGĘ

Page 28: PLSSUG Meeting - Wysoka dostepność SQL Server 2008 w kontekscie umów SLA

{MAILTO}: Tobiasz.Koprowski(at)plssug.org.pl

{BLOG}: http://itblogs.pl/blogs/notbeautifulanymore/default.aspx

Kontakt:

• Przydatne linki:− Portal WSS http://www.wss.pl

− Portal PLSSUG http://www.ms-groups.pl/plssug

Page 29: PLSSUG Meeting - Wysoka dostepność SQL Server 2008 w kontekscie umów SLA

© 2008 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries.

The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market

conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation.

MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION.