SAP Big Data El Viaje Instantáneo en el Universo de ... · SAP HANA Spark SQL/ Shark Spark...

41
SAP Big Data El Viaje Instantáneo en el Universo de Información. Gonzalo Málaga Digital Enterprise Platform Group Octubre, 2016

Transcript of SAP Big Data El Viaje Instantáneo en el Universo de ... · SAP HANA Spark SQL/ Shark Spark...

Page 1: SAP Big Data El Viaje Instantáneo en el Universo de ... · SAP HANA Spark SQL/ Shark Spark Streaming MLlib Graph X (graph) HDFS / Any Hadoop Fault Tolerant DFS Mgmt Integration between

SAP Big DataEl Viaje Instantáneo en el Universo de Información.

Gonzalo MálagaDigital Enterprise Platform Group Octubre, 2016

Page 2: SAP Big Data El Viaje Instantáneo en el Universo de ... · SAP HANA Spark SQL/ Shark Spark Streaming MLlib Graph X (graph) HDFS / Any Hadoop Fault Tolerant DFS Mgmt Integration between

© 2015 SAP SE or an SAP affiliate company. All rights reserved. 2

© 2015 SAP SE or an SAP affiliate company. All rights reserved.

No part of this publication may be reproduced or transmitted in any form or for any purpose without the express permission of SAP SE or an SAP affiliate company.

SAP and other SAP products and services mentioned herein as well as their respective logos are trademarks or registered trademarks of SAP SE (or an SAP affiliate

company) in Germany and other countries. Please see http://global12.sap.com/corporate-en/legal/copyright/index.epx for additional trademark information and notices.

Some software products marketed by SAP SE and its distributors contain proprietary software components of other software vendors.

National product specifications may vary.

These materials are provided by SAP SE or an SAP affiliate company for informational purposes only, without representation or warranty of any kind, and SAP SE or its

affiliated companies shall not be liable for errors or omissions with respect to the materials. The only warranties for SAP SE or SAP affiliate company products and

services are those that are set forth in the express warranty statements accompanying such products and services, if any. Nothing herein should be construed as

constituting an additional warranty.

In particular, SAP SE or its affiliated companies have no obligation to pursue any course of business outlined in this document or any related presentation, or to develop

or release any functionality mentioned therein. This document, or any related presentation, and SAP SE’s or its affiliated companies’ strategy and possible future

developments, products, and/or platform directions and functionality are all subject to change and may be changed by SAP SE or its affiliated companies at any time

for any reason without notice. The information in this document is not a commitment, promise, or legal obligation to deliver any material, code, or functionality. All forward-

looking statements are subject to various risks and uncertainties that could cause actual results to differ materially from expectations. Readers are cautioned not to place

undue reliance on these forward-looking statements, which speak only as of their dates, and they should not be relied upon in making purchasing decisions.

Page 3: SAP Big Data El Viaje Instantáneo en el Universo de ... · SAP HANA Spark SQL/ Shark Spark Streaming MLlib Graph X (graph) HDFS / Any Hadoop Fault Tolerant DFS Mgmt Integration between

3© 2015 SAP SE or an SAP affiliate company. All rights reserved.

Saber que pasará?

Regresar en el tiempo?

Universos Paralelos?

Viajar instantáneamente?

Page 4: SAP Big Data El Viaje Instantáneo en el Universo de ... · SAP HANA Spark SQL/ Shark Spark Streaming MLlib Graph X (graph) HDFS / Any Hadoop Fault Tolerant DFS Mgmt Integration between

Confidential Information under NDA

“Estos motores generan 1Tb de datos por avión

por día”

Jeff Immelt – CEO GE

Page 5: SAP Big Data El Viaje Instantáneo en el Universo de ... · SAP HANA Spark SQL/ Shark Spark Streaming MLlib Graph X (graph) HDFS / Any Hadoop Fault Tolerant DFS Mgmt Integration between

Confidential Information under NDA

100 millones de usuarios activos

2 mil millones de páginas vistas por día

250 millones de “queries” de búsqueda

20 petabytes

eBay

Page 6: SAP Big Data El Viaje Instantáneo en el Universo de ... · SAP HANA Spark SQL/ Shark Spark Streaming MLlib Graph X (graph) HDFS / Any Hadoop Fault Tolerant DFS Mgmt Integration between

Confidential Information under NDA

Cyber

seguridadCloud

Super

computación

Mundo

“Smart”Hyperconectividad

Tendencias que Redefinen la Economía

Page 7: SAP Big Data El Viaje Instantáneo en el Universo de ... · SAP HANA Spark SQL/ Shark Spark Streaming MLlib Graph X (graph) HDFS / Any Hadoop Fault Tolerant DFS Mgmt Integration between

Confidential Information under NDA

Mobile

9 mil

millonesDe Usuarios móviles en el

mundo al 2020 4

Internet of Things

212 mil millonesDispositvos conectados a IoT hacia el 2020 3

Big Data

90%De los datos en el mundo

han sido generados en

los últimos 2 años 1 Cloud Ya al 2014

51%De las cargas de

procesamiento

estaban en cloud 5

Redes Empresariales

40%de crecimiento en la adopcion de

redes de negocios y colaboración 2

1 ScienceDaily, May 22, 2013.

2 Technology Adoption Report on Business Networks, Ardent Partners, 2014.

3 Internet of Things (IoT) 2013 to 2020 Market Forecast: Billions of Things, Trillions of Dollars, IDC, 2013.

4 Statista, 2014.

5 Cisco Global Cloud Index: Forecast and Methodology for 2013–2018, Cisco Systems Inc., November 11, 2014.

Cifras de la Economía Digital

Page 8: SAP Big Data El Viaje Instantáneo en el Universo de ... · SAP HANA Spark SQL/ Shark Spark Streaming MLlib Graph X (graph) HDFS / Any Hadoop Fault Tolerant DFS Mgmt Integration between

Confidential Information under NDA

WHAT IS A ZETTABYTE? 1 ZETTABYTE = 1,000,000,000,000 GIGABYTES

Crecimiento de BIG DATA

Page 9: SAP Big Data El Viaje Instantáneo en el Universo de ... · SAP HANA Spark SQL/ Shark Spark Streaming MLlib Graph X (graph) HDFS / Any Hadoop Fault Tolerant DFS Mgmt Integration between

Confidential Information under NDA

MORE DATA

DATA IS GETTING BIG

SPEED OF BUSINESS

HAS RADICALLY

INCREASED

LESS TIME

Se Require una Mayor Agilidad

Page 11: SAP Big Data El Viaje Instantáneo en el Universo de ... · SAP HANA Spark SQL/ Shark Spark Streaming MLlib Graph X (graph) HDFS / Any Hadoop Fault Tolerant DFS Mgmt Integration between

Confidential Information under NDA

El Exito de BIG DATA Requiere Cobertura Completa

Accessible

Profunda

SimpleTiempoReal

Amplia

• Responder preguntas complejassobre datos granulares

• Predecir la mejor-próxima acción

• En cualquier dispositivo, para cualquier usuario

• Autoservicio y de interacciónnintuitiva

• Sin preparacion de datos

• Sin pre agregacionesNo “tuning”

• Flujo de datos en tiemporeal

• Al hacer una pregunta, obtener una respuestainmediata

• Datos a escalamasiva

• Muchos tipos de datos

Page 12: SAP Big Data El Viaje Instantáneo en el Universo de ... · SAP HANA Spark SQL/ Shark Spark Streaming MLlib Graph X (graph) HDFS / Any Hadoop Fault Tolerant DFS Mgmt Integration between

© 2015 SAP SE or an SAP affiliate company. All rights reserved. 12

Plataforma de Big Data que acelera la forma como ustedadquiere, análiza y actúa sobre nuevas percepciones.

8

Infinite storage

HADOOP

Instant Results

SAP HANA

Page 13: SAP Big Data El Viaje Instantáneo en el Universo de ... · SAP HANA Spark SQL/ Shark Spark Streaming MLlib Graph X (graph) HDFS / Any Hadoop Fault Tolerant DFS Mgmt Integration between

Confidential Information under NDA

SAP HANA Platform

SPATIAL

PROCESSING

ANALYTICS, TEXT,

GRAPH, PREDICTIVE

ENGINES

CONSUME

COMPUTE

STORAGE

SOURCE

INGEST

Application

Development

Environment

Transformations & Cleansing

Smart Data Integration

Smart Data Quality

StreamProcessing

Smart Data Streaming

STREAM

PROCESSING

LogsTextOLTP Social MachineGeoERP SensorStore & forward

Mobile applications and BI

Smart Data Access

Virtual Tables

User Defined Functions

1010100

1010110

1001110

Dynamic Tiering

Aged datain Disk

In-Memory

Data model& data

Calculation engine

Fastcomputing

Column Storage

High performance analytics

Series Data Storage

Store time-series data

Reporting &

Dashboards

High Performance

Applications

Data Exploration

& Visualization

Adhoc & OLAP

Analytics

Predictive

Analysis

Business Planning

& ForecastingLumira / BI

Vora / Hadoop /

NoSQL

MapReduce

YARN

HDFS

El enfoque de SAP: Cadena de valor de Big Data de punta a punta

Page 14: SAP Big Data El Viaje Instantáneo en el Universo de ... · SAP HANA Spark SQL/ Shark Spark Streaming MLlib Graph X (graph) HDFS / Any Hadoop Fault Tolerant DFS Mgmt Integration between

Optimizado para las Personas

Agile

Visualization

Advanced

Analytics

Enterprise BIPersonalizedInsights

Advanced Planningand Forecasting

Sensing and Responding

PredictiveModeling

Real-time Reportingand Analysis

Conectando a las personas con las percepcionescorrectas

Page 15: SAP Big Data El Viaje Instantáneo en el Universo de ... · SAP HANA Spark SQL/ Shark Spark Streaming MLlib Graph X (graph) HDFS / Any Hadoop Fault Tolerant DFS Mgmt Integration between

Confidential Information under NDA

Detección automatizada de

señales sobre 100 Pb con un 97%

de confianza.

Permite responder proactivamente

a la dinámica del mercado en

tiempo real

Anticipa el comportamiento del consumidor

Sistema de detección de señales tempranas con base en análisis

predictivo

ebay

Page 16: SAP Big Data El Viaje Instantáneo en el Universo de ... · SAP HANA Spark SQL/ Shark Spark Streaming MLlib Graph X (graph) HDFS / Any Hadoop Fault Tolerant DFS Mgmt Integration between

El problema de las arquitecturas típicas de TISilos, demoras, y complejidad limitan la agilidad e innovación del negocio

ETL & Staging

Data

Manufacturing App

Logic

FinanceApp

Logic

SalesApp

Logic

ServiceApp

Logic

StreamingApp

Logic

PredictiveApp

Logic

AnalyticsApp

Logic

SpatialApp

Logic

ETL & Staging

Data

ETL & Staging

Data

Silos de Applicaciones

Multiples Copias de Datos

Procesamiento Batch

Vista parcial del Negocio

Sin Visibilidad en Tiempo Real

Capacidad Limitada para Innovar

Data Data Data Data Data DataData Data

Page 17: SAP Big Data El Viaje Instantáneo en el Universo de ... · SAP HANA Spark SQL/ Shark Spark Streaming MLlib Graph X (graph) HDFS / Any Hadoop Fault Tolerant DFS Mgmt Integration between

ONE Platform for ALL Applications

La solución: Hacer que todos los datos esténdisponibles inmediatamente a todas las aplicacionesReducir movimiento y latencia de datos– mejorar agilidad e innovacion del negocio

Manufacturing App

Finance App

SalesApp

ServiceApp

StreamingApp

PredictiveApp

AnalyticsApp

SpatialApp

FinanceApp

Manufacturing App

SalesApp

ServiceApp

StreamingApp

PredictiveApp

AnalyticsApp

SpatialApp

Logic Logic Logic Logic Logic LogicLogic Logic

Data Data Data Data Data DataData Data

Cargas de aplicaciones unificadas

Datos Unificados – Unica Copia

Procesamiento en Tiempo Real

Vista Completa del Negocio

Capacidad para reaccionar en tiempo real

Capacidad para innovar

Data

Page 18: SAP Big Data El Viaje Instantáneo en el Universo de ... · SAP HANA Spark SQL/ Shark Spark Streaming MLlib Graph X (graph) HDFS / Any Hadoop Fault Tolerant DFS Mgmt Integration between

Toda la lógica de aplicaciones (OLTP & OLAP) procesada enúnico sistema

Todos los tipos de datos procesadosen un únicosistema

Sin espera para el acceso a los datosy el procesamiento

Velocidad

Simpleza

Innovación

Una solucion solo posible con “in-memory data management”Solo la gestión de información en memoria habilita el tiempo real a todas las aplicaciones

Manufacturing App

Finance App

SalesApp

ServiceApp

StreamingApp

PredictiveApp

AnalyticsApp

SpatialApp

ONE Platform for ALL Applications

Logic Logic Logic Logic Logic LogicLogic Logic

Data

Page 19: SAP Big Data El Viaje Instantáneo en el Universo de ... · SAP HANA Spark SQL/ Shark Spark Streaming MLlib Graph X (graph) HDFS / Any Hadoop Fault Tolerant DFS Mgmt Integration between

DATABASE SERVICES

Web Server JavaScript

Graphic Modeler

Data Virtualization ELT & Replication

Columnar OLTP+OLAP

Multi-Core & Parallelization

Advanced Compression

Multi-tenancy Multi-Tier Storage

Graph Predictive Search

DataQuality

SeriesData

Business Functions

Hadoop & Spark Integration

Streaming Analytics

Application Lifecycle Management

High Availability &Disaster Recovery

OpennessDataModeling

Admin &Security

Remote Data Sync

Spatial

Text Analytics

Fiori UX

ALM

</>

APPLICATION SERVICES INTEGRATION & QUALITY SERVICESPROCESSING SERVICES

SAP HANA PlatformLa plataforma de gestión de información para todas las aplicaciones

SAP, ISV and Aplicaciones desarrolladas

Todos los dispositivos

OLTP + OLAP UNA Plataforma Abierta UNA Copia de Datos

S A P H A N A P L A T F O R M

Page 20: SAP Big Data El Viaje Instantáneo en el Universo de ... · SAP HANA Spark SQL/ Shark Spark Streaming MLlib Graph X (graph) HDFS / Any Hadoop Fault Tolerant DFS Mgmt Integration between

Confidential Information under NDA

Big Data Startups usan SAP

20 Unase - startupfocus.saphana.com

Page 21: SAP Big Data El Viaje Instantáneo en el Universo de ... · SAP HANA Spark SQL/ Shark Spark Streaming MLlib Graph X (graph) HDFS / Any Hadoop Fault Tolerant DFS Mgmt Integration between

Confidential Information under NDA

Utiliza algoritmos de busqueda

avanzados, procesmiento de

lenguaje, imagenes satelitales

y mineria de datos

5.5 horas/dia menos

destinadas a identificacion de

prospectos potenciales

Identifica, Valida y Aprende sobre nuevos proyectos de construcción

a nivel Global

Building Radar

Page 22: SAP Big Data El Viaje Instantáneo en el Universo de ... · SAP HANA Spark SQL/ Shark Spark Streaming MLlib Graph X (graph) HDFS / Any Hadoop Fault Tolerant DFS Mgmt Integration between

© 2015 SAP SE or an SAP affiliate company. All rights reserved. 22

Procesa 10 TB de datos

satelitales por semana y

relaciona un mapa del

mundo de edad promedio

de 5 dias

Page 23: SAP Big Data El Viaje Instantáneo en el Universo de ... · SAP HANA Spark SQL/ Shark Spark Streaming MLlib Graph X (graph) HDFS / Any Hadoop Fault Tolerant DFS Mgmt Integration between

© 2015 SAP SE or an SAP affiliate company. All rights reserved. 23

Utiliza algoritmos de búsqueda para analizar

millones de páginas web diariamente e incorporar

la información de mercados de bienes inmuebles

Page 24: SAP Big Data El Viaje Instantáneo en el Universo de ... · SAP HANA Spark SQL/ Shark Spark Streaming MLlib Graph X (graph) HDFS / Any Hadoop Fault Tolerant DFS Mgmt Integration between

© 2015 SAP SE or an SAP affiliate company. All rights reserved. 24

Agrega datos en tiempo real, adicionando

hasta 7 mil millones de puntos al dia sobre

proyectos de construcción.

Page 25: SAP Big Data El Viaje Instantáneo en el Universo de ... · SAP HANA Spark SQL/ Shark Spark Streaming MLlib Graph X (graph) HDFS / Any Hadoop Fault Tolerant DFS Mgmt Integration between

© 2015 SAP SE or an SAP affiliate company. All rights reserved. 25

Despliega la información en graficos

interactivos y mapas de manera ágil para mas

de 1000 usuarios en forma simultanea.

Los usuarios pueden

adicionar información

socio-demográfica en

forma interactiva

Page 26: SAP Big Data El Viaje Instantáneo en el Universo de ... · SAP HANA Spark SQL/ Shark Spark Streaming MLlib Graph X (graph) HDFS / Any Hadoop Fault Tolerant DFS Mgmt Integration between

Real-time Applications, Interactive Analysis

SCMERP CRM Text Geospatial SensorSocial

MediaLogs

Data

Source

Distributed

File

Persistence

In-Memory

Persistence

In-Memory

Processing

SAP HANA

smart data

access

Data Access

SQL Java Scala Python OtherSQL .NET Javascrip

tMDX OtherNodeJS

In-memory

Columnar Data

Predictive Text / NLP

GeospatialPlanning /

Rules

SAP HANA

Spark

SQL/

Shark

Spark

StreamingMLlib Graph

X

(graph)

HDFS / Any Hadoop

Fault Tolerant

DFS Mgmt

Integration between SAP HANA and Spark via SAP HANA SDA

Done with Spark SQL

Requires Shark ODBC driver and unixODBC Driver Manager

Vora (query engine)

SAP HANA VORAMotor de consultas “In-Memory” distribuído sobre Spark

Page 27: SAP Big Data El Viaje Instantáneo en el Universo de ... · SAP HANA Spark SQL/ Shark Spark Streaming MLlib Graph X (graph) HDFS / Any Hadoop Fault Tolerant DFS Mgmt Integration between

CenterPoint EnergyData Tiering en escala de Petabytes

Data Lifecycle Manager

HOT-STORE

(Column Table)WARM-STORE

(Extended Table)DATA

MOVEMENT

SAP HANA

YARN

HDFS

Vora Vora Vora

Hadoop Cluster

Spark Spark Spark

Files Files Files

DW actual 12TB

120TB de Data de Smart Meters

Page 28: SAP Big Data El Viaje Instantáneo en el Universo de ... · SAP HANA Spark SQL/ Shark Spark Streaming MLlib Graph X (graph) HDFS / Any Hadoop Fault Tolerant DFS Mgmt Integration between

Arquitectura Lambda y SAP HANAPara todos los datos, SAP HANA actua como punto central de acceso, modelamiento y administración

SAP HANA lo habilita para implementar un arquitectura Lambda completa a partir

de componentes pre integrados de la plataforma incluyendo motores de

procesamiento y repositorios de datos

N. Marz, J. Warren: Big Data, Manning 2015, page 19. This book is considered to be the “lambda architecture book”

But also: http://radar.oreilly.com/2014/07/questioning-the-lambda-architecture.html

All dataFast data

Source data

Page 29: SAP Big Data El Viaje Instantáneo en el Universo de ... · SAP HANA Spark SQL/ Shark Spark Streaming MLlib Graph X (graph) HDFS / Any Hadoop Fault Tolerant DFS Mgmt Integration between

Arquitectura Lambda y SAP HANAPara todos los datos, SAP HANA actua como punto central de acceso, modelamiento y administración

SAP HANA

-Smart Data Streaming gestiona los flujos de información

-High speed analytics habilita analisis avanzado inmediato sobre los datos recientes

-Vora permite utilizar todos los datos para el modelamiento y analisis historico

MQ Kafka

LTE

Validate & Aggregate Messages

Reporting with standard BI Tools

Low Latency – High throughput

Modern Developer Tools

Record/Replay

SpatialPredictive Libraries

SAP HANASAP HANA Smart Data Streaming

All Thing History +++

High Speed Analytics

Immutable Copy

Alerts

Things

YARN

HDFSFiles

Vora

Spark

Files

Vora

Spark

Files

Vora

Spark

Page 30: SAP Big Data El Viaje Instantáneo en el Universo de ... · SAP HANA Spark SQL/ Shark Spark Streaming MLlib Graph X (graph) HDFS / Any Hadoop Fault Tolerant DFS Mgmt Integration between

Columnar Store Time-Series

Vir

tua

l D

ata

Mo

de

l

HANA AplianceExternal DB

Spatial-Predictive-Graph-Text Mining-Search-Analytic

HANA IN -MEMORY DBHANA SMART DATA

STREAMING

OLTP

ERP

Geo

Logs

Text

Machine

Sensor

BI | Reporting | Ad-hoc Analysis | OLAP | Planning | Unstructured Data Discovery | Predictive | Apps

SAP Vora

Dynamic Tiering Smart Data Access In-M

em

ory

D

ata

Ba

se

SAP HANA Big Data Platform

Page 31: SAP Big Data El Viaje Instantáneo en el Universo de ... · SAP HANA Spark SQL/ Shark Spark Streaming MLlib Graph X (graph) HDFS / Any Hadoop Fault Tolerant DFS Mgmt Integration between

Confidential Information under NDA

Monitorea Velocidad, Volumen

del trafico

Calcula Indice de Desempeño

del Trafico cada 5 Minutos

100 millones de registros por

diá tomados de

– Floating Car Data (FCD)

– Fixed Device Data (FDD)

Situación del Flujo de Tráfico en Tiempo Real, descubre

congestiones y predice estado

del trafico

Nanjing City: Smart Traffic

Page 33: SAP Big Data El Viaje Instantáneo en el Universo de ... · SAP HANA Spark SQL/ Shark Spark Streaming MLlib Graph X (graph) HDFS / Any Hadoop Fault Tolerant DFS Mgmt Integration between

Podemos Siempre Centralizar toda la información?

Hadoop / HDFS

Spark

Dynamic

Tiering

Optional: Raw storage: Swift / S3

HANA

InMemory

HANA Vora

Page 34: SAP Big Data El Viaje Instantáneo en el Universo de ... · SAP HANA Spark SQL/ Shark Spark Streaming MLlib Graph X (graph) HDFS / Any Hadoop Fault Tolerant DFS Mgmt Integration between

Industrial PCs

Donde está la información en el borde?

IDC estima:

Al 2019, 45%de los datos creados por IoT se

almacenarán… cerca, o al borde de la red *

IoT Gateways (Intel, Dell, Cisco,…)

Remote servers

Raspberry Pi, etc

* IDC FutureScape: Worldwide Internet of Things 2016 Predictions, November 2015

Page 35: SAP Big Data El Viaje Instantáneo en el Universo de ... · SAP HANA Spark SQL/ Shark Spark Streaming MLlib Graph X (graph) HDFS / Any Hadoop Fault Tolerant DFS Mgmt Integration between

Que tan grande son los datos de IoT?

Type of dataRecommended SAP

data management solutionSize range

Expressed

numerically

Transactional data SAP HANA – in-memory Terabytes (TB) 1012

Traditional analytics

(OLAP)

SAP IQ or SAP HANA DT

(Dynamic Tiering) – disk-based10s to 100s of Terabytes 1013-14

Big DataHadoop with SAP HANA Vora

– both in-memory & disk-basedPetabytes (PB) 1015

IoT dataSAP SQL Anywhere

distributed as an edge databaseExabytes (EB) 1018

Page 36: SAP Big Data El Viaje Instantáneo en el Universo de ... · SAP HANA Spark SQL/ Shark Spark Streaming MLlib Graph X (graph) HDFS / Any Hadoop Fault Tolerant DFS Mgmt Integration between

Llegaran a ser tan grandes estos datos?

Ejemplo de un gran Fabricante de Automóviles – Números provistos por el cliente

100 millions de autos (10-años de vida) x 4 mensajes/día x 25-Kilobyte por mensaje

= 10 Terabytes/día = 3½ Petabytes/año x 10 años de data = 3% de 1 Exabyte

Puede crecer a 200 mensajes/día x 50-Kilobyte por mensaje 3½ Exabytes

Para 1 solo caso de uso de un cliente

Algunos analistas estiman: 50 mil millones de dispositivos conectados al 2020

Supuesto conservador: Un mensaje promedio de 500-byte por minuto por dispositivo

50 mil millones de dispositivos x ½ million de minutos/año x ½ Kilobyte = 12½ Exabytes/año

Hacia el 2025 estos números solo crecerán aun más

Page 37: SAP Big Data El Viaje Instantáneo en el Universo de ... · SAP HANA Spark SQL/ Shark Spark Streaming MLlib Graph X (graph) HDFS / Any Hadoop Fault Tolerant DFS Mgmt Integration between

Será mas eficiente gestionar esta informacionen el borde?

Edge Node

Edge Node

Edge Node

Edge Node

Edge Node

Hadoop / HDFS

Spark

Dynamic

Tiering

Optional: Raw storage: Swift / S3

HANA

InMemory

HANA Vora

Algunas estimaciones:

Mover un Exabyte a la nube

1 Exabyte/año = 250 Gigabits/sec,

cada segundo 24/7/52

= 8% de la capacidad promedio

DE-CIX o 10% de AMS-IX – Los 2

nodos de intercambio más

grandes de Europa*

10 Exabytes/año podria consumir

toda la Internet en Europa

* en.wikipedia.org/wiki/List_of_Internet_exchange_points_by_size

Page 38: SAP Big Data El Viaje Instantáneo en el Universo de ... · SAP HANA Spark SQL/ Shark Spark Streaming MLlib Graph X (graph) HDFS / Any Hadoop Fault Tolerant DFS Mgmt Integration between

Se hace necesaria una plataformadistribuida de gestión de información

Pattern

discovery

Raw data

AppsSignals

Pattern

recognizer

Edge

gateway

Apps

Pattern

discovery

Raw dataUploading

AppsSignals

Raw data

Pattern

recognizer

Millions of

edge

gateways

Downloading new patterns to match

Page 39: SAP Big Data El Viaje Instantáneo en el Universo de ... · SAP HANA Spark SQL/ Shark Spark Streaming MLlib Graph X (graph) HDFS / Any Hadoop Fault Tolerant DFS Mgmt Integration between

El reto: automatizar y gobernar centralmentela plataforma distribuida de gestión de información

Machine

learning

Apps AppsSignals HANA

Millions of

edge

gateways

Remote Data Sync (MobiLink)SQL

Anywhere

Streaming

Lite

Petabytes

Terabytes (in aggregate)

Exabytes(in aggregate)

HANA Vora

on Spark on Hadoop

Dynamic Edge Processing

Page 40: SAP Big Data El Viaje Instantáneo en el Universo de ... · SAP HANA Spark SQL/ Shark Spark Streaming MLlib Graph X (graph) HDFS / Any Hadoop Fault Tolerant DFS Mgmt Integration between

40© 2015 SAP SE or an SAP affiliate company. All rights reserved.

Haciendo posible el viaje en Universode Información

Page 41: SAP Big Data El Viaje Instantáneo en el Universo de ... · SAP HANA Spark SQL/ Shark Spark Streaming MLlib Graph X (graph) HDFS / Any Hadoop Fault Tolerant DFS Mgmt Integration between

Confidential Information under NDA

Muchas Gracias!

[email protected]