Data Warehousing (II):Data Warehousing (II...

54
Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm Data Warehousing (II): Data Warehousing (II): Multidimensionales Datenmodell, Cognos Praktikum: Data Warehousing und Mining Praktikum Data Warehousing und Mining, Sommersemester 2010

Transcript of Data Warehousing (II):Data Warehousing (II...

Page 1: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

Data Warehousing (II):Data Warehousing (II):Multidimensionales Datenmodell, Cognos

Praktikum:Data Warehousing und Mining

Praktikum Data Warehousing und Mining, Sommersemester 2010

Page 2: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

Vereinfachte Sicht auf die Referenzarchitektur

ExtraktionTransformationL d

Data

Analyse

Operative

Laden Warehouse

Datenbanken

OLAP ServerOLAP Server

Praktikum Data Warehousing und Mining, Sommersemester 2010 2

Page 3: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

F k j i P k ikFokus jetzt im PraktikumUnser Fokus jetztUnser Fokus jetzt

ExtraktionTransformationL d

Data

Analyse

Operative

Laden Warehouse

Datenbanken

OLAP ServerOLAP Server

Praktikum Data Warehousing und Mining, Sommersemester 2010 3

Page 4: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

A dAgenda• Online Analytical Processing (OLAP)Online Analytical Processing (OLAP)

• Multidimensionales Datenmodell• Konzeptionelle Modellierung• Konzeptionelle Modellierung• Relationale Umsetzung des multidim. Modells• Multidimensionale Operatoren• Multidimensionale Operatoren

• Cognos• Hinweise zur Bearbeitung

Praktikum Data Warehousing und Mining, Sommersemester 2010 4

Page 5: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

A l hAnalysephase• Unterschiedliche Ansätze:

• Data Mining – Erster Block• Suche nach unbekannten Mustern im Datenbestand• „Welche Eigenschaften zeichnen Kunden aus, die wieder bei

i k f d ?“uns einkaufen werden?“• Online Transactional Processing (OLTP) – Vorheriger Block

• Zugriff auf vorhandenen DatenbestandN t D t i l ti h ( B SQL)• Nutzung von Datenmanipulationssprachen (z.B. SQL)

• „Wieviele Einheiten von Artikel X wurden vom Kunden Y im Zeitraum Z gekauft?“

• Online Analytical Processing (OLAP) Jetzt• Online Analytical Processing (OLAP) – Jetzt• Anpassung des Datenbestands an die Analyse• Dynamischer, flexibler, interaktiver Zugriff auf eine Vielzahl von

WertenWerten• „In welchem Gebiet macht Warengruppe X den größten

Umsatz?“

Praktikum Data Warehousing und Mining, Sommersemester 2010 5

Page 6: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

D AData Access• Tools:Tools:

• Anfragesprachen (z.B. SQL)• Lesen von Daten

– Vorheriger BlockLesen von Daten

• Arithmetische Operationen auf Daten• Zunächst keine Präsentationsmöglichkeit

• Reporting Tools (z.B. Cognos)• Lesen der Daten

– Jetzt

• Anreicherung der Daten durch arithmetische Operationen

• Präsentation der Daten in BerichtenPräsentation der Daten in Berichten• Unterstützung von Ampelfunktionalität

Praktikum Data Warehousing und Mining, Sommersemester 2010 6

Page 7: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

Anforderungen an Online Analytical Processing • Geschwindigkeitg

• Anfragen sollten in 5 Sekunden beantwortet sein• Analysemöglichkeit

E ö li h d f dli h d i t iti A l• Ermöglichung anwenderfreundlicher und intuitiver Analyse• Sicherheit

• Sicherer Mehrbenutzerbetrieb• Stabile Sicherungsmechanismen

• MultidimensionalitätM ltidi i l Si ht f di D t• Multidimensionale Sicht auf die Daten

• Kapazität• Hohe Skalierbarkeit der verwalteten Daten

FASMI: Fast Analysis of Shared Multidimensional Information (Pendse/Creeth 1995)

Praktikum Data Warehousing und Mining, Sommersemester 2010

Information (Pendse/Creeth, 1995)7

Page 8: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

A dAgenda• Online Analytical Processing (OLAP)Online Analytical Processing (OLAP)

• Multidimensionales Datenmodell• Konzeptionelle Modellierung• Konzeptionelle Modellierung• Relationale Umsetzung des multidim. Modells• Multidimensionale Operatoren• Multidimensionale Operatoren

• Cognos• Hinweise zur Bearbeitung

Praktikum Data Warehousing und Mining, Sommersemester 2010 8

Page 9: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

Multidimensionales Datenmodell - Begriffe• Hilfsmittel zur Veranschaulichung

von Datenvon Daten• verschiedene Aspekte auf gleiche

Weise zugreifbar• Einsatz bei OLAP-Anwendungen

• KennzahlenKennzahlen• Elemente eines Würfels

• Dimensionen Kennzahl• Dimensionen• Beschreiben Daten• Ermöglichen Zugriff auf Kennzahlen

Kö Hi hi hö

Kennzahl

Dimension• Können zu Hierarchien gehören

Praktikum Data Warehousing und Mining, Sommersemester 2010 9

Page 10: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

Multidimensionales Datenmodell – Beispiel

ProduktQuartal

Jahr

TagMonat

...

UmsatzZeit

Geographie

Praktikum Data Warehousing und Mining, Sommersemester 2010 10

Page 11: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

Di iDimensionen• EinordnungEinordnung

• Bewertung der Analysedaten durch Kenngrößen (z.B. Umsatz, Kosten)

• Untersuchung der Kenngrößen aus verschiedenen Perspektiven (z.B. Stadt, Bundesland, Zeitachse)B t ht kti h ißt Di i• Betrachtungsperspektive heißt Dimension

Ei h ft• Eigenschaften• Mindestens 2 Dimensionselemente

Di i l t bild Blätt i B• Dimensionselemente bilden Blätter eines Baums (sog. Klassifikationshierarchie)

Praktikum Data Warehousing und Mining, Sommersemester 2010 11

Page 12: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

Di i B i i l Z iDimensionen – Beispiel Zeit

QuartalJahr

TagMonat

...

DimensionselementKlassifikationshierarchie

Praktikum Data Warehousing und Mining, Sommersemester 2010 12

Page 13: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

A Kl ifik i hi hiArten von Klassifikationshierarchien• Einfache HierarchienEinfache Hierarchien

• Höhere Hierarchieebenen enthalten die aggregierten Werte der jeweils niedrigeren Ebenen

• Oberster Knoten: Gesamtknoten• Verdichtung aller Werte einer Dimension

P ll l Hi hi• Parallele Hierarchien• Entstehen bei unterschiedlicher Art der

GruppierungGruppierung• Parallele Äste ohne Beziehung• Betrachtung eines Teilaspekts der Hierarchie proBetrachtung eines Teilaspekts der Hierarchie pro

Ast

Praktikum Data Warehousing und Mining, Sommersemester 2010 13

Page 14: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

Kl ifik i hi hi B i i lKlassifikationshierarchie - Beispiele

TOP TOPTOP

L d

TOP

J hLand

Bundesland

Jahr

Quartal WocheBundesland

Stadt

Quartal

Monat

Woche

Stadt

Strasse

Monat

TagStrasse Tag

Einfache Hierarchie Parallele Hierarchie

Praktikum Data Warehousing und Mining, Sommersemester 2010 14

Page 15: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

W i B iffWeitere Begriffe• WürfelWürfel

• Kanten von Dimensionen aufgespannt• Kantenlänge entspricht Anzahl der Elemente in• Kantenlänge entspricht Anzahl der Elemente in

Dimension• Eine oder mehrere Kennzahlen pro WürfelzelleEine oder mehrere Kennzahlen pro Würfelzelle• Anzahl der Dimensionen heißt Dimensionalität

• KonsolidierungspfadPf d i Kl ifik i h• Pfade im Klassifikationsschema

Praktikum Data Warehousing und Mining, Sommersemester 2010 15

Page 16: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

A dAgenda• Online Analytical Processing (OLAP)Online Analytical Processing (OLAP)

• Multidimensionales Datenmodell• Konzeptionelle Modellierung• Konzeptionelle Modellierung• Relationale Umsetzung des multidim. Modells• Multidimensionale Operatoren• Multidimensionale Operatoren

• Cognos• Hinweise zur Bearbeitung

Praktikum Data Warehousing und Mining, Sommersemester 2010 16

Page 17: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

K i ll M d lliKonzeptionelle Modellierung• Einsatz von Entity/Relationship-Modell oder UMLy p

• Probleme:• Modellierung der Konsolidierungspfade nicht möglich• Entitäten besitzen keine Semantik• Entitäten besitzen keine Semantik

• Wir wollen aber: Höheren Automatisierungsgrad durch Verzicht auf universelle Anwendbarkeit

• Unterscheidung zwischen Klassifikationsstufen, g ,beschreibenden Attributen und Kennzahlen nicht möglich

• Daher eigene Modellierungsmodelle• Multidimensionales Entity/Relationship Modell (ME/R)• Multidimensionales Entity/Relationship-Modell (ME/R)• Multidimensionale Unified Modeling Language (mUML)• Ansatz von Totok (objektorientiert, notiert in UML)• …

• Hier: ME/R

Praktikum Data Warehousing und Mining, Sommersemester 2010 17

Page 18: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

ME/R M d llME/R-Modell• Weiterentwicklung des E/R-Modellse te e t c u g des / ode s

• Anforderungen• Spezialisierung:

All i füh t El t i d S i lfäll E/RAlle eingeführten Elemente sind Spezialfälle von E/R-Konstrukten

• Minimale Erweiterung:L i ht l b fü f h E/R M d lliLeicht erlernbar für erfahrene E/R-Modellierer

• Darstellung der multidimensionalen Semantik:Klassifikationsschema, Würfelstruktur muss abbildbar sein

• Eingeführte Konstrukte• Entitätenmenge „Dimension Level“ (Klassifikationsstufe)• n-äre Faktenbeziehung• Binäre Klassifikationsbeziehungsmenge

Praktikum Data Warehousing und Mining, Sommersemester 2010 18

Page 19: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

Vi li i d ME/R K kVisualisierung der ME/R - Konstrukte

FaktKlassifikationsstufe

Klassifikationsbeziehung

Kenngröße

TagMonatQuartal

Einkauf

Kosten

StrasseStadtRegion

Praktikum Data Warehousing und Mining, Sommersemester 2010 19

Page 20: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

A dAgenda• Online Analytical Processing (OLAP)Online Analytical Processing (OLAP)

• Multidimensionales Datenmodell• Konzeptionelle Modellierung• Konzeptionelle Modellierung• Relationale Umsetzung des multidim. Modells• Multidimensionale Operatoren• Multidimensionale Operatoren

• Cognos• Hinweise zur Bearbeitung

Praktikum Data Warehousing und Mining, Sommersemester 2010 20

Page 21: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

Relationale Umsetzung des multidim. Modells

• AnforderungenAnforderungen• Beibehaltung der Semantik

• z.B. Hierarchienz.B. Hierarchien

• Effiziente Umsetzung von Anfragen• Effiziente Verarbeitung von AnfragenEffiziente Verarbeitung von Anfragen• Einfache Wartung

• z.B. beim Nachladen von Daten

Relationales OLAP (ROLAP) Relationales OLAP (ROLAP)

Praktikum Data Warehousing und Mining, Sommersemester 2010 21

Page 22: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

R l i l U F k b llRelationale Umsetzung: Faktentabelle• Beispiel zeigt einen

typischen Datensatz• Kennzahlen,

Dimensionen Spalten

• Zellen Tupel• Zusätzlich existierenZusätzlich existieren

Hierarchien• Z.B.: Artikel –

Produktgruppe –Produktgruppe Produktkategorie

• Wie kann der Datacube mit atacube tHierarchien in einem DBMS gespeichert werden?

Praktikum Data Warehousing und Mining, Sommersemester 2010 22

Faktentabelle ohne Hierarchien

Page 23: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

R l i l U S S hRelationale Umsetzung: Star-Schema• Eine Relation pro Dimension• Nicht normalisiert

• Redundanz• Gefahr von AnomalienGefahr von Anomalien

• Nur wenige Joins notwendig• Nachteile werden in

Warehouses oft in KaufWarehouses oft in Kauf genommen

Praktikum Data Warehousing und Mining, Sommersemester 2010 23

Page 24: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

Relationale Umsetzung: Snowflake-Schema

• Verfeinerung• Verfeinerungdes Star-Schemas

• Normalisiert, keine Redundanz,• Mehrere Dimension Tables

pro DimensionR l ti Eb i Hi hi• Relation pro Ebene einer Hierarchie

• Viele Joins:• 11 Tabellen bei Gruppierung nach Kategorie, Land und Jahr

Praktikum Data Warehousing und Mining, Sommersemester 2010

pp g g ,

24

Page 25: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

R l i l U S ik lRelationale Umsetzung: Semantikverluste• Verluste in…

• Faktentabelle• Unterscheidung von Dimensionen und Kenngrößen nicht

ersichtlichersichtlich• Dimensionstabelle

• Unterscheidung zwischen beschreibendem Attribut und Attribut der Klassifikationsebene nicht möglichder Klassifikationsebene nicht möglich

• Aufbau der Dimensionen geht verloren

Lö• Lösung:• Erweiterung des Systemkatalogs in relationalen DBMS

• Multidimensionales OLAP (MOLAP)( )• Hybrides OLAP (HOLAP)

Praktikum Data Warehousing und Mining, Sommersemester 2010 25

Page 26: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

Üb bli k OLAP T h ikÜberblick: OLAP-Techniken• Relationales OLAP (ROLAP):( )

• Relationale Datenbank• Skalierbarkeit gegeben, aber oft langsam (viele Joins)

M ltidi i l OLAP (MOLAP)• Multidimensionales OLAP (MOLAP):• Multidimensionale Datenbank• Persistente Speicherung aggregierter KennzahlenPersistente Speicherung aggregierter Kennzahlen• Oft schneller, aber „curse of dimensionality“

• Hybrides OLAP (HOLAP):• Mischform, Tradeoff: Geschwindigkeit vs. Flexibilität

• Desktop OLAP (DOLAP):• Lokale multidimensionale Analysen z B für Mobile User• Lokale multidimensionale Analysen z.B. für Mobile User

• Memory-Based OLAP:• Datenhaltung komplett im RAM (Beispiel: QlikView)

Praktikum Data Warehousing und Mining, Sommersemester 2010

g p ( p )

26

Page 27: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

A dAgenda• Online Analytical Processing (OLAP)Online Analytical Processing (OLAP)

• Multidimensionales Datenmodell• Konzeptionelle Modellierung• Konzeptionelle Modellierung• Relationale Umsetzung des multidim. Modells• Multidimensionale Operatoren• Multidimensionale Operatoren

• Cognos• Hinweise zur Bearbeitung

Praktikum Data Warehousing und Mining, Sommersemester 2010 27

Page 28: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

Pi iPivotierenZeit

Produkt

Geographie

Produkt

Produkt

Zeit Geographie

Geographie

Zeit

Praktikum Data Warehousing und Mining, Sommersemester 2010 28

Geographie

Page 29: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

R ll d D ill dRoll-up und Drill-downDrill-down

Produkt Produkt

1 QuartalJanuar 2 3 33 11 36 107

Februar

1. QuartalJanuar

2. Quartal

3 Quartal

2

4

3

21

33

29

11 36 107

18 25 58

Geographie Geographie

März 3. Quartal12 455 15 51 22

Geographie

Roll-up

Praktikum Data Warehousing und Mining, Sommersemester 2010 29

Roll-up

Page 30: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

Sli i d Di iSlicing und Dicing

Produkt Produkt

Zeit Zeit

GeographieGeographie g pg p

• Slicing: Einschränkung entlang einer Dimension• Dicing: Einschränkung entlang zweier oder mehr

Dimensionen

Praktikum Data Warehousing und Mining, Sommersemester 2010 30

Page 31: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

Z f l idi OZusammenfassung: multidim. Operatoren• Nutzen multidimensionale Struktur der DatenNutzen multidimensionale Struktur der Daten• Erlauben einfache Modifikation von Anfragen

zu inhaltlich ähnlichen Anfragen• …zu inhaltlich ähnlichen Anfragen• …zu strukturell ähnlichen Anfragen

Si d f di F t ll i D t• Sind auf die Fragestellungen im Data Warehouse zugeschnitten

Praktikum Data Warehousing und Mining, Sommersemester 2010 31

Page 32: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

Rü kbli k MDX (I)Rückblick: MDX (I)

Praktikum Data Warehousing und Mining, Sommersemester 2010 32

Page 33: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

Rü kbli k MDX (II)Rückblick: MDX (II)

Praktikum Data Warehousing und Mining, Sommersemester 2010 33

Page 34: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

A dAgenda• Online Analytical Processing (OLAP)Online Analytical Processing (OLAP)

• Multidimensionales Datenmodell• Konzeptionelle Modellierung• Konzeptionelle Modellierung• Relationale Umsetzung des multidim. Modells• Multidimensionale Operatoren• Multidimensionale Operatoren

• CognosC R t St di• Cognos Report Studio

• Cognos Analysis StudioI l• Internals

• Hinweise zur Bearbeitung

Praktikum Data Warehousing und Mining, Sommersemester 2010 34

Page 35: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

D B i I lli M k 2010Der Business-Intelligence-Markt 2010

Magic Quadrant for Data Warehouse Database Management Systems, Gartner 2010

Magic Quadrant for Business Intelligence Platforms, Gartner 2010

Praktikum Data Warehousing und Mining, Sommersemester 2010 35

Page 36: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

CCognos

Üb h d h IBM 2008 ( C IBM C “)• Übernahme durch IBM 2008 („Cognos, an IBM Company“)

• Cognos BI ermöglicht Erstellen von• Ad hoc Anfragen (Query Studio)• Ad-hoc-Anfragen (Query Studio)• Berichten (Report Studio)• Multidimensionalen Anfragen (Analysis Studio)

• Backend• Data Cube• Relationale Daten

• Anmeldung• Internet-Explorer• URL: http://i40virt01.ipd.kit.edu/cognos8p p g• Benutzername: <Benutzername>• Passwort: <Passwort>

Praktikum Data Warehousing und Mining, Sommersemester 2010 36

Page 37: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

C S bild hiCognos - Startbildschirm

Praktikum Data Warehousing und Mining, Sommersemester 2010 37

Page 38: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

C KCognos-Komponenten• Query Studio (für einfache Anfragen)

• „In Echtzeit“• Visuell

• Report Studio (für komplexe Berichte)• Visuell

E b i i f B f hl• Ergebnisgenerierung auf Befehl• Bedingte Variablen• Dynamische BerichteDynamische Berichte• Layout individueller anpassbar

• Analysis Studio (fü ltidi i l Si ht)• Analysis Studio (für multidimensionale Sicht)• „In Echtzeit“• Visuell

Praktikum Data Warehousing und Mining, Sommersemester 2010 38

Page 39: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

A dAgenda• Online Analytical Processing (OLAP)Online Analytical Processing (OLAP)

• Multidimensionales Datenmodell• Konzeptionelle Modellierung• Konzeptionelle Modellierung• Relationale Umsetzung des multidim. Modells• Multidimensionale Operatoren• Multidimensionale Operatoren

• CognosC R t St di• Cognos Report Studio

• Cognos Analysis StudioI l• Internals

• Hinweise zur Bearbeitung

Praktikum Data Warehousing und Mining, Sommersemester 2010 39

Page 40: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

R S diReport Studio

• Erstellen komplexer Berichte• Vielfältige Ausgabe und Darstellungsoptionen• Vielfältige Ausgabe- und Darstellungsoptionen• Parameterabfrage bei Anfrageaufruf

Praktikum Data Warehousing und Mining, Sommersemester 2010 40

Page 41: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

R S di A fbReport Studio - Aufbau

Praktikum Data Warehousing und Mining, Sommersemester 2010 41

Page 42: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

A dAgenda• Online Analytical Processing (OLAP)Online Analytical Processing (OLAP)

• Multidimensionales Datenmodell• Konzeptionelle Modellierung• Konzeptionelle Modellierung• Relationale Umsetzung des multidim. Modells• Multidimensionale Operatoren• Multidimensionale Operatoren

• CognosC R t St di• Cognos Report Studio

• Cognos Analysis StudioI l• Internals

• Hinweise zur Bearbeitung

Praktikum Data Warehousing und Mining, Sommersemester 2010 42

Page 43: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

A l i S di A fbAnalysis Studio – Aufbau

Praktikum Data Warehousing und Mining, Sommersemester 2010 43

Page 44: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

Si h f di DSicht auf die Daten• Blättern in derBlättern in der

Hierarchie möglich

• Ähnlich MDX Tools in SQL SSQL Server

• Unterscheidung zwischen Fakten und Dimensionen

Praktikum Data Warehousing und Mining, Sommersemester 2010 44

Page 45: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

M l idi i l OMultidimensionale Operatoren• Rechtsklick auf Spalten- bzwRechtsklick auf Spalten bzw.

Zeilennamen

• Kontextmenü erlaubt • Drilldown und Drillup• Drilldown und Drillup• Slicing und Dicing

(über „Ausschließen“)

• Pivotieren wie im Report Studio• Entsprechendes Icon im Menü

anklicken

Praktikum Data Warehousing und Mining, Sommersemester 2010 45

Page 46: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

A dAgenda• Online Analytical Processing (OLAP)Online Analytical Processing (OLAP)

• Multidimensionales Datenmodell• Konzeptionelle Modellierung• Konzeptionelle Modellierung• Relationale Umsetzung des multidim. Modells• Multidimensionale Operatoren• Multidimensionale Operatoren

• CognosC R t St di• Cognos Report Studio

• Cognos Analysis StudioI l• Internals

• Hinweise zur Bearbeitung

Praktikum Data Warehousing und Mining, Sommersemester 2010 46

Page 47: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

C A f hCognos: Anfragesprachen

…MDX auch von Cognos unterstützt!

Praktikum Data Warehousing und Mining, Sommersemester 2010 47

Page 48: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

N i SQL C SQLNatives SQL vs. Cognos SQL

• Natives SQL• Für einzelne Anfragen an Datenbankg

• Cognos SQL• Generische Cognos-Erweiterung von SQLGenerische Cognos Erweiterung von SQL• Für mehrere Datenquellen• Natives SQL ist Untermenge

Praktikum Data Warehousing und Mining, Sommersemester 2010

Natives SQL ist Untermenge48

Page 49: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

MDX U üMDX-Unterstützung• In Abfrageexplorer: SQL oder MDX möglichIn Abfrageexplorer: SQL oder MDX möglich

Praktikum Data Warehousing und Mining, Sommersemester 2010 49

Page 50: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

N i MDX C SQLNatives MDX vs. Cognos SQL

Praktikum Data Warehousing und Mining, Sommersemester 2010 50

Page 51: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

E ll B i h V h iErstellung von Berichten: Vorgehensweisen• Intuitives Vorgehen:Intuitives Vorgehen:

• „Zusammenklicken“• im Hintergrund Formulierung in Cognos SQL• im Hintergrund Formulierung in Cognos SQL• Generierung von nativem SQL/MDX für DB-Anfrage• Optimierung der DB Anfragen durch Benutzer• Optimierung der DB-Anfragen durch Benutzer

möglich• Alternativ:• Alternativ:

• Einbindung existierender SQL-/MDX-Anfragen über AbfrageexplorerAbfrageexplorer

• Erst danach Berichterstellung

Praktikum Data Warehousing und Mining, Sommersemester 2010 51

Page 52: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

A dAgenda• Online Analytical Processing (OLAP)Online Analytical Processing (OLAP)

• Multidimensionales Datenmodell• Konzeptionelle Modellierung• Konzeptionelle Modellierung• Relationale Umsetzung des multidim. Modells• Multidimensionale Operatoren• Multidimensionale Operatoren

• CognosC R t St di• Cognos Report Studio

• Cognos Analysis StudioI l• Internals

• Hinweise zur Bearbeitung

Praktikum Data Warehousing und Mining, Sommersemester 2010 52

Page 53: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

Hi i B b iHinweise zur Bearbeitung• Erreichen der Toolse c e de oo s

• Internet Explorer• URL: http://i40virt01.ipd.kit.edu/cognos8

• Report Studio bevorzugt nutzen• Performance!

• Daten des Data Cubes aus• Package: DWM Multidimensional

• Ergebnis in „Eigenem Ordner“ speichern

Praktikum Data Warehousing und Mining, Sommersemester 2010 53

Page 54: Data Warehousing (II):Data Warehousing (II ...dbis.ipd.kit.edu/download/dwmprak2010/veranstaltung6.pdf · Rü kbli k MDX (I)Rückblick: MDX (I) Praktikum Data Warehousing und Mining,

Institut für Programmstrukturen und Datenorganisation (IPD)Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm

Q ll bQuellenangabenA Bauer H Günzel: Data WarehouseA. Bauer, H. Günzel: „Data Warehouse

Systeme – Architektur, Entwicklung, Anwendung“ dpunkt verlag 2004Anwendung , dpunkt.verlag, 2004.

J. Han, M. Kamber: „Data Mining – Concepts and Techniques“ Morgan Kaufmann 2006and Techniques , Morgan Kaufmann, 2006.

Cognos Report Studio Professional Authoring U G id 2007User Guide, 2007.

Praktikum Data Warehousing und Mining, Sommersemester 2010 54