Big Data Discovery Solution Overview - · PDF fileHadoop Data Reservoir gewinnt weiter an...
Transcript of Big Data Discovery Solution Overview - · PDF fileHadoop Data Reservoir gewinnt weiter an...
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Hadoop Data Reservoir gewinnt weiter an Bedeutung
2
Hadoop Umsatz und Forecast 49% CAGR, 2013-2018
Der Big Data Infrastruktur Markt €18m in 2018
Big Data Software Markt €8m in 2018
Data Warehouse
Bekannte Datenquellen Entstehende Datenquellen
Data Reservoir Data Warehouse
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Ein Problem ist die Analytik mit ausreichender Geschwindigkeit
3
Werkzeug Komplexität
• Nur Coding und Expertentools
• Bestehende BI tools nicht geeignet
• Immer wieder kommt neues ins Spiel
80% des Aufwandes gehen in Datenanalyse und -aufbereitung
Ungewissheit der Daten
• Neue Datentypen, deren Nutzen nur schwer erkennbar
• Erheblicher Aufwand in der Datenvorbereitung
Sehr spezialisiertes Wissen als Vorraussetzung
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Ein neuer Ansatz wird gebraucht
4
Einfache Datenaufbereitung und -anreicherung
Den Zugriff jedem ermöglichen und
Erkenntnis einfach zu teilen
Ein einziges intuitives und grafisches GUI, um …
Daten zu finden und zu erforschen und den Nutzen zu erkennen
find explore transform discover share
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | 5
Oracle Big Data Discovery. The Visual Face of Hadoop
find explore transform discover share
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Oracle Big Data Discovery. The Visual Face of Hadoop
6
find explore transform discover share Den Nutzen erkennen
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Find
7
• Einfacher Zugriff auf alle Daten in Hadoop
• Gewohnter Umgang mit neuen Informationen
• Deskriptive Statistik und einfache, unterstütze Visualisierung
• Datendeployment ins Hadoop für die Endanwender
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Explore
8
• Automatische Darstellung nach Typ
• Sortierung der Attribute nach Verwendbarkeit
• Einfache Statistik, Qualität und Extreme
• Korrelationen und Zusammenhänge einfach entdecken
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Oracle Big Data Discovery. The Visual Face of Hadoop
9
find explore transform discover share Einfach brauchbarere Big Data
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | 10 10
• Einfache Daten-Handhabung
• Erweiterbare Bibliothelk an Transformationen
• Ergebnisse der Transformationen prüfen
• Ein Test auf einem Daten-Sample die Anwendung auf allen Daten
Transform
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Oracle Big Data Discovery. The Visual Face of Hadoop
11
find explore transform discover share Jedem Zugriff auf Big Data ermöglichen
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | 12
• Kombinierbare Sichten auf die Daten
• Drag and Drop Design für Analyse-Seiten
• Umfangreiche Analysemöglichkeiten
• Zusammenhänge und Nutzen durch automatisch optimale visualisierung
Discover
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | 13
• Analysenund Sichten mit anderne teilen
• Die Story abbildenund weitererzählen
• Zusammenarbeit in Teams
• Rückschreiben ins HDFS zur weiteren Verwendung
Share
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Oracle Confidential – Internal 14
Oracle Big Data Discovery. Technologische Innovation für Hadoop
Oracle Big Data Discovery Workloads
Hadoop Cluster (BDA or Commodity Hardware)
BDD node
data node
data node
data node
data node
name node Data Processing, Workflow & Monitoring
• Profiling: catalog entry creation, data type &
language detection, schema configuration • Sampling: dgraph (index) file creation • Transforms: >100 functions • Enrichments: location (geo), text (cleanup,
sentiment, entity, key-phrase, whitelist tagging)
Self-Service Provisioning & Data Transfer
• Personal Data: Upload CSV and XLS to HDFS
In-Memory Discovery Indexes
• DGraph: Search, Guided Navigation, Analytics
Studio
• Web UI: Find, Explore, Transform, Discover, Share
Hadoop 2.x
Filesystem (HDFS)
Workload Mgmt (YARN)
Metadata (HCatalog)
Other Hadoop Workloads
MapReduce
Spark
Hive
Pig
Oracle Big Data SQL (BDA only)