Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data...

82
Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan Kirner & Thomas Neureuther Karlsruhe, 22.6.2016

Transcript of Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data...

Page 1: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

Cloud Wars – what‘s the smartestdata platform

Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform

Stefan Kirner & Thomas Neureuther Karlsruhe, 22.6.2016

Page 2: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

• Teamleiter BI Solutions bei der inovex GmbH• Langjährige Erfahrung mit dem Microsoft BI Stack • Data Management Lösungen in der Cloud

2

• inovex Lab für den Research im Cloud Bereich • Spezialist für die Implementierung von data-driven-business

Lösungen • Erfahrungen im Microsoft SQL Server BI Stack.

Stefan KirnerTeamleiter BI Solutions bei der inovex GmbH

Werkstudent bei der inovex GmbH Thomas Neureuther

Page 3: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

3NIST

Was ist Cloud Computing?

“Cloudcomputing is amodel forenabling ubiquitous, convenient,on-demand network access to asharedpool of configurable computingresources (e.g.,networks,servers,storage,applications, and services)thatcan be rapidly provisioned and releasedwith minimalmanagement effort orservice provider interaction”

Page 4: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

4http://cavdar.net/cloud-computing/#/1

Warum Cloud Computing?

Page 5: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

HierimFocus

5Microsoft (Thierry Gasser)

I/P/S-as-a-Service(On-Premises)

Storage

Servers

Networking

O/S

Middleware

Virtualization

Data

Applications

Runtime

Youmanage

Infrastructure(asaService)

Storage

Servers

Networking

O/S

Middleware

Virtualization

Data

Applications

Runtime

OtherM

anages

Youmanage

Platform(asaService)

OtherM

anages

Youmanage

Storage

Servers

Networking

O/S

Middleware

Virtualization

Applications

Runtime

Data

Software(asaService)

OtherM

anages

Storage

Servers

Networking

O/S

Middleware

Virtualization

Applications

Runtime

Data

Page 6: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

6Albert Barron (Ibm) https://www.linkedin.com/pulse/20140730172610-9679881-pizza-as-a-service

Analogie der “as a Service“ Schichten

Page 7: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

7http://www.adslzone.net/app/uploads/2014/09/cloud.jpg

Welche Public Cloud?

Page 8: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

10Amazon Web Services

Public Cloud Anbieter

• Seit 2006• Iaas Marktführer• Dogfood für viele eigene Dienste (Amazon

Store, Video…)• “PaaS like services with the option of IaaS-

like control in some cases” - Dan Sullivan - Tom's IT Pro

Page 9: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

Amazon Web Services9Screenshot Console AWS

Page 10: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

Public Cloud Anbieter

• Seit 2010• Als PaaS gestartet wurde seit 2013

sukzessive erweitert mit IaaS-Komponenten

• Starke SaaS Komponenten• Dogfood für viele SaaS Dienste (Skype,

XBox etc)

Microsoft Azure

13

Page 11: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

Azure Platform Services „Landscape“11https://i-msdn.sec.s-msft.com/dynimg/IC831231.png

Page 12: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

http://www.infoworld.com/article/3051017/cloud-computing/the-importance-of-dogfooding-in-the-cloud.html

Public Cloud Anbieter

• Seit 2008– IaaS, PaaS• No “Dogfooding“ – Googles Dienste

basieren nicht auf GCP• CloudSDKundCLI,Console als

WebFrontend• Go, Java, Python

Google Cloud Platform

15

Page 13: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

Google Cloud Platform13

Storage and Databases Big Data and Analytics Machine Learinig

Compute

Cloud ML

Cloud SpeachAPI

Page 14: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

14Forrester- https://d0.awsstatic.com/analyst-reports/The%20Forrester%20Wave%20Enterprise%20Public%20Cloud%20Platforms,%20Q4%202014.pdf

Marktsituation

“The cloud wars between Amazon, Google, and Microsoft are heating up, with the three working tirelessly to attract the large business customers that bring in the big bucks.

From a technological perspective, though,the three cloud platforms are basically equal, and offer a similar sales pitch.”

Business Insider, April 2016

Page 15: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

15Forrester- https://d0.awsstatic.com/analyst-reports/The%20Forrester%20Wave%20Enterprise%20Public%20Cloud%20Platforms,%20Q4%202014.pdf

MarktsituationGartner: 2015 Magic Quadrant for Cloud Infrastructure as a Service, Worldwide

Page 16: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

16https://www.gartner.com/doc/reprints?id=1-2G45TQU&ct=150519&st=sb

MarktsituationGartner: 2016 Magic Quadrant for Enterprise Application Platform as a Service, Worldwide

Page 17: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

17Synergy Research Group - https://www.srgresearch.com/

Marktsituation

Page 18: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

18Synergy Research Group - https://www.srgresearch.com/

Marktsituation

Page 19: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

19http://searchcloudcomputing.techtarget.com/tip/Compare-AWS-vs-Azure-vs-Google-big-data-services

„The cloud market is evolving quickly, withan ever-changing set of big data services.

While this makes cloud vendor comparisonsdifficult, it's worth the attempt, because theofferings from the top three cloud providers -- Amazon Web Services, Microsoft Azure and

Google -- aren't created equal.“

Jim O'Reilly

Page 20: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

20

Fazit Marktsituation• EinheitlichesBildzuPaaS eherschwierig• UnterschiedlicheDefinitionen• Technologiennichtimmervergleichbar/bekannt• QualitativeVergleichedeckennurspezielleUsecases ab

Damüssenwirselberran!

Page 21: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

• Web Interface und Bedienung• SDK‘s und Programmiersprachen• Tooling und Integration in

Entwicklungsumgebung• Dokumentation

21

Web Interface & HandhabungVergleich der Cloud Provider Services

Page 22: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

22

Web Interface & Handhabung

• Übersichtlich und minimalistisches Web Interface mit Übersicht über Dienste

• Tooling• Plugins fürEclipse und

VisualStudiovorhanden• AWSCommandLine

Interface• AWSSDK• S3Browser

(Desktopanwendung)

AWS Management Console

Page 23: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

23Azure Portal

Web Interface & Handhabung

• Web Portal mit sehr verschachtelter Kacheloptik

• Altes und neues Portal• Tooling

• BefehlszeilentoolsüberPowerShell• CLIauchfürLinux&Mac

• Azure SDK-MitpassendemToolkitfürVisualStudio

• Azure Explorer

Azure Portal

Page 24: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

24GCP Console

Web Interface & Handhabung

• Schlichtes Web Interface • Tooling

• gcloud Tool- CLIfürGCPProdukteundServices

• CloudSDK• WenigIDEUnterstützung

Page 25: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

25

DEMO TIME

Page 26: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

AWS Portal und S3 Bucket26

Page 27: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

Azure Ressourcengruppe und Speicherkonto27

Page 28: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

GCP Storage Bucket28

Page 29: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

29

Web Interface & Handhabung

Dienst WebConsole Azure Portal GCPConsoleBewertung Portal:☆☆☆

SDK:☆☆Tooling:☆☆Dokumentation:☆CLI:☆☆☆

Portal:☆☆SDK:☆☆Tooling:☆☆Dokumentation:☆☆☆CLI:☆☆

Portal:☆☆SDK:☆☆Tooling:☆Dokumentation:☆☆CLI:☆☆

Vergleich der Cloud Provider Services

Page 30: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

30

Big Data /Analytics Use-Case

DataPresentation

VisualisierungundDashboard

Analyticsand Computation

AggregationundAnalyse

Collectionand Storage

EventBrokerundStreamProzessor

DataGeneration/Extraction

App, IoT oderSensordaten

Page 31: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

31http://lambda-architecture.net/

Lambda Architecture

1. Weiterleiten der ankommenden Daten zu Speed und Batch Layer

2. Batch-Layer 1. BerechnenderBatchViews2. Rohdatenaufbewahren

3. Serving Layer indexiert die Batch Views

4. Speed-Layer erlaubt Echtzeit Views

5. Querys auf Batch und Echtzeit Views möglich

Page 32: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

32https://blogs.technet.microsoft.com/msuspartner/2016/01/27/azure-partner-community-big-data-advanced-analytics-and-lambda-architecture/

Lambda Architektur

Viele Möglichkeiten Lambda Architektur mit Cloud Technologien abzubilden-> Architektur nicht an Dienste gebunden

LambdaArchitecture onAzureOptions for each Layer

Page 33: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

33

Big Data /Analytics Use-Case

• Startup ULTRA TENDENCY aus Japan

• Sensorwerte erfassen und Strahlenwerte analysieren

• Umsetzung mittels Cloud basierter Analyse in Azure

Page 34: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

34

Big Data /Analytics Use-Case

• ≈5000 Wetterstationen in Baden-Württemberg

• Weather Underground API• Temperatur, Niederschlag,

Luftdruck, Windgeschwindigkeit

• Aktualisierung ≈ 5 min

Page 35: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

35

Pub/Sub Dataflow BigQuery DataStudio360

KinesisFirehose

S3 Elastic MapReduce

DataPipeline

QuickSight

EventHub

StreamAnalytics

DataFactory

PowerBI

DataGeneration

Collectionand Storage

AnalyticsandComputation

DataPresentation

DataLakeStore

Redshift

DataLakeAnalytics

DataLakeStore

Page 36: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

Collection36

Page 37: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

• Kontinuierlicher Strom von Daten empfangen und verarbeiten• Mehrere Publisher/Subscriber• Skalierbar• Hoch Verfügbar• Niedrige Latenzen

• Echtzeit Verarbeitung und Analyse

37

Streaming DiensteVergleich der Cloud Provider Services

Page 38: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

38

Pub/Sub, Message Broker - Streaming

Dienst Kinesis Event Hub Pub/Sub

Beschreibung • NaheEchtzeit• ZeitbasierterEreignispuffer

• Datastrom vonverschiedenenProzessenoderGeräten

• Vereinfachtdasempfangen undveröffentlichen vonDatenströmeninEchtzeit

• Datenaufbewahrungbis7 Tage

• Azure EventHubsisteinhochgradigskalierbarerDienstfürdasVeröffentlichenundAbonnieren vonEreignissen

• Publish/Subscribe• Hochskalierbare

MessageQueuemitPush/Pull Delivery

Page 39: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

39

Dienste zur Stream Verarbeitung

Dienst Kinesis FirehoseKinesis Analytics(Beta)Kinesis &Lambda

Stream Analytics Dataflow

Beschreibung • EchtzeitverarbeitungvonStreams

• Kinesis mit SQLbasierteAnfragen

• LambdaFunktionen umEventszuverarbeiten

• Firehose persistiertStreamnachS3,ES(1.5),Redshift

• SQLbasierteAbfragen• Windowing• Echtzeitdashboardsund

Warnungen

• ProgrammierungvonDataflows inJava

• DamitWindowing undquasijederOutputmöglich

Page 40: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

40AWS Kinesis

Streaming Dienste

• Kinesis Firehose• SchreibtStreaminBlöckenauf

denS3Storage,ElasticsearchoderRedshift

• KeineMöglichkeitenderProgrammierung

• Kinesis Streams• Machtesnotwendigeinen

StreamReceiverzuprogrammierenunddiesenzudeployen

• AWSLambdaFunktionen• Kinesis Analytics (Beta)

Page 41: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

41

Streaming Dienste

• Leistungsstarkes Modell• Eingabe

• EventHub,Blob,IoT Hub• MehrereEingabenmöglich

• Abfrage• SA-QL:SQLÄhnlicheSyntax• Window Operationenmöglich

• Ausgabe• Blob,SQL,PowerBI ....• MehrereAusgabenmöglich

Azure Stream Analytics

Page 42: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

42Google DataFlow

Streaming Dienste

• Programmiermodell– Batch und Stream

Workload– Pipelineing als DAG– Arbeiten auf Collections

• Google Dataflow als Runner für das DataflowProgrammiermodell

Google Dataflow

Page 43: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

43

Dienste zur Stream Verarbeitung

Dienst AmazonKinesis StreamAnalytics Dataflow

Bewertung Bedienung:☆☆LifecycleManagement:☆Möglichkeiten:☆☆

+SimpleBedienung- FürgleicheFunktionalitätwiebeiAzure coding erforderlich- Firehose eingeschränkteFunktionsumfang- Kinesis StreambenötigtselbstimplementiertenunddeploytenReceiver(z.B:AWSLambda)

Bedienung:☆☆☆LifecycleManagement:☆Möglichkeiten:☆☆☆

+SimpleBedienung+HoheFunktionalitätmitgeringemAufwand+SQLSyntaxfürAbfrage- Schlechtzuversionieren oderzuManagen

Bedienung:☆☆LifecycleManagement:☆☆Möglichkeiten:☆☆☆

ProgrammcodemitallenVor- undNachteilen+SehrguteSkalierbarkeitundBigDataFähigkeit- HöhererEinarbeitungsaufwand

Page 44: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

44

Kosten Message Broker /Stream Verarbeitung

Dienst AmazonKinesis StreamAnalytics Dataflow

Preise Shard Stunde1,7ctPut Nutzlastpro1MioPuts (25KB)1,65ctVerlängerteDatenaufbewahrung2ct/h

Beispiel:2Eventsa35KBproSekunde≈13€/Monat

UnitStunde 3,1ctNutzlast0,1ctproGB

Beispiel:2Eventsa35KBproSekunde≈20€ StreamAnalytics/Monat≈9€ EventHub/Monat

Pub/Sub1MilionOperationen40ctHalbiertsichab 250MOperationen

Batch1ctGCEU/hStream1,5ctGCEU/h

Page 45: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

45

DEMO TIME

Page 46: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

Azure Stream Analytics46

Page 47: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

AWS Kinesis47

Page 48: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

GCP Pub/Sub48

Page 49: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

GCP Dataflow49

Page 50: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

Analytics and Computation50

Page 51: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

• Daten auslesen, ggf. transformieren und schreiben (Vergleichbar mit ETL)

• Transformation eher schwieriger• Orchestrierung Dienste

• Zusammenfassen und Orchestrierung von Verarbeitungsschritten

• Neue Quellen und Ziele• Cloud und Hybride Szenarien

• Big-Data Fähigkeit

51

Orchestrierungs Dienste

Page 52: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

52

Orchestrierungs Dienste

• Erstellen in AWS Management Console

• DesignerundVorlagen• PropertiesinDrop-Down

Feldernverwalten• Rechtüberschaubarer

FunktionsumfangohneDetailfunktionen

• DeckttypischeETL-Szenariengutab

• KeineEntwicklungsumgebungundCodeManagement

Data Pipeline

Page 53: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

53

Orchestrierungs Dienste – Data Pipeline

• Hive in Data Pipeline• RessourceAnlegen• Skriptschreibenund

verknüpfen

Page 54: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

54

Orchestrierungs Dienste

• Factory Dashboard• WerkzeugefürdasErstellen

derFactory• Zustandsüberwachung• ManuellesStartenvon

Vorgängen• AuslastungundDiagnosen

Data Factory

Page 55: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

55

Orchestrierungs Dienste

• Data Factory Projekt• Templateserlauben

schnellesErstelleneinfacherAnwendungsfälle

• Deployment ausVisualStudiooderFactoryDashboard

• JSON-DokumenteohneToolunterstützungfüllenundverknüpfen• Designby Copy and Paste

Data Factory

Page 56: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

56

Orchestrierungs Dienste

Dienst DataPipeline DataFactoryBewertung Bedienung:☆☆

LifecycleManagement:☆Möglichkeiten:☆☆

+SelbsterklärenderDesigner- KeineCodeCompletion oderSyntaxHighlightingoderValidierung- Code kannlediglichüberJSONexportiertund versioniert werden(händisch)

Bedienung:☆+LifecycleManagement:☆☆Möglichkeiten:☆☆

+TemplatesundVisualStudioUnterstützung- KeinDesignersondernzusammenfügenvonJSONDokumenten

SSISweitvoraus

Page 57: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

57

DEMO TIME

Page 58: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

Azure Data Factory58

Page 59: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

AWS Data Pipeline59

Page 60: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

Horizontal skalierende analytische Datenspeicher60

Page 61: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

• ParallelverarbeitendeInstanzen• Massively ParallelProcessingArchitecture• Skalierbarkeit

• SQLQuerys

61

Horizontal skalierende analytische Datenspeicher

Page 62: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

62

Analytische Datenspeicher

• Schnelle Skalierung der Cluster Instanzen über API Aufrufe

• Postgres-Fork nutzt spaltenbasierte Datenbank und massive parallele Verarbeitung

Redshift

Page 63: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

63

Analytische Datenspeicher

•Data Lake (Beta) – Store & Analytics

– VerteilterSpeicher- undAnalysedienstgroßerDaten

– U-SQL– TSQLundC#– VisualStudioUnterstützung– DynamischeSkalierung– VerteilteHardwareund

Parallelisierunggänzlichabstrahiert

Data Factory - Data Lake Analytics (Beta)

Page 64: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

64

Analytische Datenspeicher

• Unabhängige Skalierung von Compute- und Speicherressourcen innerhalb von Sekunden

• Vielfältige SQL Server-Funktionalität mit T-SQL Abfragen

SQL Data Warehouse (Beta)

Page 65: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

65

Analytische Datenspeicher

•SQL Querys auf Terabyte von Daten •Import/Export Mechanismen•Bezahlung nach Datenmenge der Query•Keine Server•Browsertool vorhanden (sonst REST oder CLI) - SDK für .Net, Java, Python, Go

Google Big Query

Page 66: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

66

Analytische Datenspeicher

Dienst AWSRedshift Azure DataLake BigQuery

Beschreibung • Postgres Fork• MassivParallel

• StoreundAnalytics• U-SQLalsMischung

vonC#und T-SQL

• Serverless• PayperQuery

Preise • $0.25proStundefürdc1.large

• $0.85proStundefürds2.xlarge

• AnalyticsEinheit0,017$/Minute

• Abgeschlossener Auftrag0,025$

SQL-DWH:ab0,70$/h

• $5proqueryed TB• $0.02perGBSpeicher• $0.01per200MBInsert

Page 67: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

Dienst AmazonRedshift Azure DataLake BigQuery

Bewertung Bedienung:☆+LifecycleManagement:☆☆Möglichkeiten:☆☆

- KeineEntwicklungsunterstützungimWebInterfaceoderEntwicklungsumgebung

Bedienung:☆☆☆LifecycleManagement:☆☆Möglichkeiten:☆☆☆

+VisualStudioUnterstützung+StrukturierteundSemistrukturierteDaten

Bedienung:☆☆+LifecycleManagement:☆☆Möglichkeiten:☆☆

+WebTooling

67

Analytische Datenspeicher

Page 68: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

68

DEMO TIME

Page 69: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

AWS Redshift – und Kinesis als Quelle69

Page 70: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

Azure Data Lake Analytics70

Page 71: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

GCP Big Query71

Page 72: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

Data Presentation72

Page 73: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

• Daten Präsentieren• Umfangreiche Visualisierungen• Dashboards und Reports über Web

• SaaS

• Anbindung an Datenbanken• Real-Time Anbindung

73

Datenvisualisierung

Page 74: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

74

Datenvisualisierung

Dienst AmazonQuickSight MicrosoftPowerBi(keinTeil vonAzure abergutintegrierbar)

GoogleDataStudio360(beta)

Beschreibung • Beta(nurfürausgewählteKunden)

• EchtzeitBImitStreamAnalyticsmöglich

• AnbindunganDatenbankenundandereDatenspeicher

• Beta(nurfürausgewählteKunden)

• Alternativ guteIntegrationvonBIToolswieTableau,Qlik undeinigenanderen

Page 75: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

Dienst AmazonQuickSight MicrosoftPowerBi(keinTeil vonAzure abergutintegrierbar)

GoogleDataStudio360(beta)

Bewertung Bedienung:☆+Möglichkeiten:☆+

- Closed Beta

Bedienung:☆☆☆Möglichkeiten:☆☆☆

+VieleDatenquellen+On-PremEntwicklungmöglich

Bedienung:☆+Möglichkeiten:☆+

- Beta

75

Datenvisualisierung

Page 76: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

76

DEMO TIME

Page 77: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

Power Bi – Daten von Stream Analytics77

Page 78: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

Google Data Studio78�https://datastudio.google.com/#/reporting/0B_U5RNpwhcE6bzVYT2FSNmRBUWc

Page 79: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

79http://www.tecchannel.de/a/amazon-web-services-versus-microsoft-windows-azure,2071501,3

„Unterm Strich lässt sich sagen, dass Microsoft aufgrund seiner PaaS-Historie technologisch in diesem

Bereich einen deutlichen Vorsprung hat. Amazon AWS hingegen ist derzeit

noch der unumstrittene Innovations-und Marktführer im IaaS-Umfeld.“

René Büst - Senior Analyst und Cloud Practice Lead bei Crisp Research

Page 80: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

80

Vergleich der Cloud Provider

AmazonWeb Services MicrosoftAzure GoogleCloud Platform

Stream ☆☆ ☆☆☆ ☆☆

Orchestration ☆☆+ ☆☆ -

MPP ☆☆ ☆☆+ ☆☆+

Datenvisualisierung ☆+ ☆☆☆ ☆+

Für diesen Use Case hat Microsoft die Nase vorn

Page 81: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

81

Demnächst auch als Artikelserie auf:

blog.inovex.deRegelmäßige Beiträge zu den aktuellsten Technologie-

Themen rund um Web, Mobile, Analytics, Data Center & Co.

Page 82: Cloud Wars – what‘s the smartest data platform · Cloud Wars – what‘s the smartest data platform Vergleich Microsoft Azure, Amazon Web Services und Google Cloud Platform Stefan

Vielen Dank

Stefan Kirner &Thomas Neureuther

inovex GmbHLudwig-Erhard-Allee 676131 Karlsruhe

[email protected]@inovex.de

SolcheProjekteundTechnologiensindfürdich

interessant?

Wirsuchen

CloudSolutionArchitects

undWerkstudentenfürDataManagement&Analytics

UndvieleandereJobsaufhttps://www.inovex.de/de/karriere

/stellenangebote