Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009...
-
Upload
truonghanh -
Category
Documents
-
view
221 -
download
2
Transcript of Open Source Business Intelligence - · PDF fileit -novum White Paper November 2009...
it-novum White Paper November 2009
©it-novum GmbH 2009 Version 1.0
Open Source
Business
Intelligence
Ein Vergleich der Open Source BI-Lösungen
JasperSoft, Palo und Pentaho
it-novum White Paper Open Source Business Intelligence November 2009
© it-novum GmbH 2009 2 Version 1.0
Es gibt verschiedene Open SourceEs gibt verschiedene Open SourceEs gibt verschiedene Open SourceEs gibt verschiedene Open Source----Lösungen für Business Intelligence auf Lösungen für Business Intelligence auf Lösungen für Business Intelligence auf Lösungen für Business Intelligence auf
dem Markt. dem Markt. dem Markt. dem Markt. DiesesDiesesDiesesDieses DoDoDoDokumentkumentkumentkument stellt drei stellt drei stellt drei stellt drei besonders ausgereifte Vebesonders ausgereifte Vebesonders ausgereifte Vebesonders ausgereifte Vertreter rtreter rtreter rtreter
vor: vor: vor: vor: Pentaho, JasperSoft und Palo. Pentaho, JasperSoft und Palo. Pentaho, JasperSoft und Palo. Pentaho, JasperSoft und Palo. Verglichen werden die Funktionen Verglichen werden die Funktionen Verglichen werden die Funktionen Verglichen werden die Funktionen
sowohl der Community Version als auch der jeweiligen kostenpflichtigen sowohl der Community Version als auch der jeweiligen kostenpflichtigen sowohl der Community Version als auch der jeweiligen kostenpflichtigen sowohl der Community Version als auch der jeweiligen kostenpflichtigen
Version. Version. Version. Version. Ziel Ziel Ziel Ziel des des des des ProduktvergleichsProduktvergleichsProduktvergleichsProduktvergleichs ist es, dem Anwender die Auswahl der ist es, dem Anwender die Auswahl der ist es, dem Anwender die Auswahl der ist es, dem Anwender die Auswahl der
richtigen Burichtigen Burichtigen Burichtigen Business Intelligencesiness Intelligencesiness Intelligencesiness Intelligence----Software zSoftware zSoftware zSoftware zu erleichternu erleichternu erleichternu erleichtern....
Sie haben Fragen zum vorliegenden Sie haben Fragen zum vorliegenden Sie haben Fragen zum vorliegenden Sie haben Fragen zum vorliegenden DokumentDokumentDokumentDokument, Anmerkungen, Anmerkungen, Anmerkungen, Anmerkungen,,,, Kritik? Dann Kritik? Dann Kritik? Dann Kritik? Dann
schreiben Sie uns an schreiben Sie uns an schreiben Sie uns an schreiben Sie uns an businessbusinessbusinessbusiness----intelligence@itintelligence@itintelligence@[email protected]. . . .
Wir bieten regelmäßig Webinare zu Jaspersoft, PWir bieten regelmäßig Webinare zu Jaspersoft, PWir bieten regelmäßig Webinare zu Jaspersoft, PWir bieten regelmäßig Webinare zu Jaspersoft, Palo und Pentaho an. alo und Pentaho an. alo und Pentaho an. alo und Pentaho an. Bei Bei Bei Bei
Interesse schreiben Sie anInteresse schreiben Sie anInteresse schreiben Sie anInteresse schreiben Sie an businessbusinessbusinessbusiness----intelligence@itintelligence@itintelligence@[email protected]....
Kurzfassung
Fragen, Anmerkungen, Kritik
Webinar
it-novum White Paper Open Source Business Intelligence November 2009
© it-novum GmbH 2009 3 Version 1.0
Einleitung: Open Source Software im Bereich BusEinleitung: Open Source Software im Bereich BusEinleitung: Open Source Software im Bereich BusEinleitung: Open Source Software im Bereich Business Intelligenceiness Intelligenceiness Intelligenceiness Intelligence 5
1. Business Intelligence1. Business Intelligence1. Business Intelligence1. Business Intelligence ................................................................... 9
1.1.1.1.1.1.1.1. ETL ETL ETL ETL ---- Extraktion, Transformation, LadenExtraktion, Transformation, LadenExtraktion, Transformation, LadenExtraktion, Transformation, Laden .......................... 10
1.2.1.2.1.2.1.2. Online Analytical Processing (OLAP)Online Analytical Processing (OLAP)Online Analytical Processing (OLAP)Online Analytical Processing (OLAP)................................... 13
1.3.1.3.1.3.1.3. Data MiningData MiningData MiningData Mining ............................................................................ 16
1.4.1.4.1.4.1.4. ReportingReportingReportingReporting .................................................................................. 17
1.5.1.5.1.5.1.5. DashboardsDashboardsDashboardsDashboards .............................................................................. 18
1.6.1.6.1.6.1.6. PortalePortalePortalePortale ...................................................................................... 18
2. An2. An2. An2. Anbieter von Open Source Businesbieter von Open Source Businesbieter von Open Source Businesbieter von Open Source Busines IntelliIntelliIntelliIntelligencegencegencegence ................ 20
2.1.2.1.2.1.2.1. Pentaho: Pentaho BIPentaho: Pentaho BIPentaho: Pentaho BIPentaho: Pentaho BI----SuiteSuiteSuiteSuite ................................................... 20
2.1.1.2.1.1.2.1.1.2.1.1. ETL: Pentaho Data Integration (Kettle)ETL: Pentaho Data Integration (Kettle)ETL: Pentaho Data Integration (Kettle)ETL: Pentaho Data Integration (Kettle) ......................... 21
2.1.2.2.1.2.2.1.2.2.1.2. Pentaho Analysis Services (Mondrian)Pentaho Analysis Services (Mondrian)Pentaho Analysis Services (Mondrian)Pentaho Analysis Services (Mondrian) ........................ 23
2.1.2.1.2.1.2.1.2.1.2.1.2.1.2.1. Mondrian SchemaMondrian SchemaMondrian SchemaMondrian Schema----WorkbenchWorkbenchWorkbenchWorkbench ................................... 24
2.1.2.2.2.1.2.2.2.1.2.2.2.1.2.2. MondriMondriMondriMondrianananan----WebanwendungWebanwendungWebanwendungWebanwendung ........................................ 24
2.1.2.3.2.1.2.3.2.1.2.3.2.1.2.3. Aggregation DesignerAggregation DesignerAggregation DesignerAggregation Designer .................................................. 26
2.1.3.2.1.3.2.1.3.2.1.3. Pentaho WEKAPentaho WEKAPentaho WEKAPentaho WEKA ................................................................... 27
2.1.4.2.1.4.2.1.4.2.1.4. Pentaho Report DesignerPentaho Report DesignerPentaho Report DesignerPentaho Report Designer ................................................ 27
2.1.5.2.1.5.2.1.5.2.1.5. Pentaho DashboardPentaho DashboardPentaho DashboardPentaho Dashboard----BuildingBuildingBuildingBuilding ........................................ 28
2.1.6.2.1.6.2.1.6.2.1.6. Pentaho Enterprise EditionPentaho Enterprise EditionPentaho Enterprise EditionPentaho Enterprise Edition ............................................ 29
2.1.7.2.1.7.2.1.7.2.1.7. Fazit: PentahoFazit: PentahoFazit: PentahoFazit: Pentaho ..................................................................... 31
2.2.2.2.2.2.2.2. JasperSoft BIJasperSoft BIJasperSoft BIJasperSoft BI----SuiteSuiteSuiteSuite ................................................................. 32
2.2.1.2.2.1.2.2.1.2.2.1. JasperSoft BIJasperSoft BIJasperSoft BIJasperSoft BI----PlattformPlattformPlattformPlattform ................................................... 33
Inhalt
it-novum White Paper Open Source Business Intelligence November 2009
© it-novum GmbH 2009 4 Version 1.0
2.2.2.2.2.2.2.2.2.2.2.2. JasperETL (Talend Open Studio)JasperETL (Talend Open Studio)JasperETL (Talend Open Studio)JasperETL (Talend Open Studio) ................................... 33
2.2.3.2.2.3.2.2.3.2.2.3. JasperAnalysis (Mondrian)JasperAnalysis (Mondrian)JasperAnalysis (Mondrian)JasperAnalysis (Mondrian) ............................................ 34
2.2.4.2.2.4.2.2.4.2.2.4. JasperReportsJasperReportsJasperReportsJasperReports ................................................................... 35
2.2.4.1.2.2.4.1.2.2.4.1.2.2.4.1. iReportiReportiReportiReport ............................................................................. 35
2.2.5.2.2.5.2.2.5.2.2.5. JasperSoft BI Suite Professional EditionJasperSoft BI Suite Professional EditionJasperSoft BI Suite Professional EditionJasperSoft BI Suite Professional Edition ..................... 36
2.2.6.2.2.6.2.2.6.2.2.6. Fazit: JasperSoftFazit: JasperSoftFazit: JasperSoftFazit: JasperSoft ............................................................... 37
2.3.2.3.2.3.2.3. Palo BI SuitePalo BI SuitePalo BI SuitePalo BI Suite ............................................................................ 39
2.3.1.2.3.1.2.3.1.2.3.1. Palo OLAP SerPalo OLAP SerPalo OLAP SerPalo OLAP Serverververver .............................................................. 40
2.3.2.2.3.2.2.3.2.2.3.2. Palo ETL ServerPalo ETL ServerPalo ETL ServerPalo ETL Server ................................................................. 40
2.3.3.2.3.3.2.3.3.2.3.3. Palo WorksheetPalo WorksheetPalo WorksheetPalo Worksheet----ServerServerServerServer .................................................... 41
2.3.4.2.3.4.2.3.4.2.3.4. Palo Excel AddPalo Excel AddPalo Excel AddPalo Excel Add----inininin .............................................................. 44
2.3.5.2.3.5.2.3.5.2.3.5. Palo Supervision ServerPalo Supervision ServerPalo Supervision ServerPalo Supervision Server .................................................. 45
2.3.6.2.3.6.2.3.6.2.3.6. Fazit: PaloFazit: PaloFazit: PaloFazit: Palo .......................................................................... 45
3. Gesamtbetrachtung3. Gesamtbetrachtung3. Gesamtbetrachtung3. Gesamtbetrachtung .................................................................. 47
Weiterführende Informationen /Links........................................ 49
Kontaktadressen.............................................................................. 50
it-novum White Paper Open Source Business Intelligence November 2009
© it-novum GmbH 2009 5 Version 1.0
EEEEinleitunginleitunginleitunginleitung: : : : Open Source Software im Bereich Open Source Software im Bereich Open Source Software im Bereich Open Source Software im Bereich Business IntelligenceBusiness IntelligenceBusiness IntelligenceBusiness Intelligence
Kennen Sie die Situation, dass für die Bereitstellung von Berichten immer die IT-
Abteilung herangezogen wird oder die Auswertung von Geschäftskennzahlen
sehr zeitaufwändig und kostenintensiv ist? Bei Besprechungen werden Reports
mit unterschiedlichen Datenbeständen herangezogen; zudem sind viele
Datenbestände über mehrere Datenquellen und Systeme verteilt. Solche
Situationen erschweren es, aussagekräftige Berichte zu erstellen und die
dazugehörigen Daten zu analysieren. Doch gerade Geschäftsdaten sind meistens
die Grundlage für unternehmerische Entscheidungen von großer Tragweite.
Früher waren Begrifflichkeiten wie „IT-basierte Managementunterstützung“,
„Management Support Systeme“ oder „Management-Informationssysteme“ weit
verbreitet und wurden eingesetzt, um Führungskräfte in ihrer Tätigkeit zu
unterstützen. Heute hat sich der Begriff „Business Intelligence“ (BI) durchgesetzt.
Business IntelligenceBusiness IntelligenceBusiness IntelligenceBusiness Intelligence
Business Intelligence ist heute ein wichtiges Anwendungsfeld im Umfeld
betriebswirtschaftlicher Applikationen. BI umfasst die Methoden, mit denen die
Daten eines Unternehmens aufbereitet und strukturiert ausgewertet werden
können. Die eigentlichen Anwendungen sind vielfältig: Kennzahlensysteme und
Balanced Scorecards, Konsolidierung, Reporting, Management-Dashboards,
Ursachenanalyse, Datenkorrelation etc.
BI hat in den letzten Jahren nicht ohne Grund so ein großes Marktinteresse
erfahren. Auslöser waren z.B. ungeeignete Reporting- und Analyse-
Funktionalitäten von anderen (insbesondere ERP-) Systemen, die diese
Anforderungen nur mit viel Mühe und Aufwand umsetzen konnten, die
Notwendigkeit, Daten aus mehreren (oft unterschiedlichen) Vorsystemen zu
konsolidieren, um einen umfassenden Überblick zu gewinnen (z.B.
Konzernreporting), oder schlicht die wirtschaftliche Situation als äußerer Druck
zur Verbesserung der eigenen Organisation und Prozesse mit Hilfe besseren
Zahlenmaterials. Ein wesentlicher Grund ist auch der Wunsch nach einem
einfachen Zugriff auf Geschäftsdaten und Analysen über vertraute, nicht-
technische Frontends wie Excel oder Portale, die auch Fachanwendern und nicht
nur der IT das Arbeiten mit diesen Daten ermöglichen. Aufgeführt wurde oft auch
die Entlastung der operativen Transaktionssysteme. Dieser Performancegrund ist
aber durch die stetig günstigere und leistungsfähigere Hardware kaum noch
relevant.
it-novum White Paper Open Source Business Intelligence November 2009
© it-novum GmbH 2009 6 Version 1.0
Die Auswertung von unternehmerischem Zahlenmaterial geschieht durch
analytische Informationssysteme, die auf einen konsolidierten Datenbestand
(oftmals in Form sogenannter „Cubes“) zugreifen. .Je größer das Unternehmen
ist, desto mehr Daten entstehen. Dazu kommt, dass auf Grund von heterogenen
IT-Landschaften Daten aus verschiedenen Vorsystemen integriert werden
müssen. Das stellt nicht nur hohe technische Anforderungen, sondern auch
semantische, z.B. die Normierung von Daten (Euro und Dollar in einem globalen
Umsatzreport). Natürlich sind diese Daten ohne eine entsprechende
Aufbereitung nicht wirklich nützlich für die Unternehmensführung. Werden sie
aber unter Verwendung von BI-Systemen bearbeitet und verändert, bekommen
sie einen Bezug zueinander und sind in Entscheidungsprozessen einsetzbar.
BI-Systeme sind also mit wenigen Ausnahmen ein „Muss“ für alle
Managementebenen. Entscheider erhalten dadurch einen einfachen Zugang zu
Kennzahlen, Berichten und Scorecards und können selber Analysen mit zeitlicher
Betrachtung (wie z.B. Drill-Down-Analysen) durchführen. Führungskräfte haben
spezielle Anforderungen, die BI-Systeme gut erfüllen können: Schnelligkeit,
Einfachheit der Nutzung, Gebrauchstauglichkeit für IT-fremde Personen,
Datenqualität, stetige Aktualität, Verlässlichkeit, Integrität und Konsistenz.
SoftwareSoftwareSoftwareSoftware----Lösungen für Lösungen für Lösungen für Lösungen für BIBIBIBI
Kommerzielle Anbieter im Bereich Business Intelligence bieten vielfältige und
integrierte Gesamtpakete. Sie unterscheiden sich im Leistungsumfang, der
Benutzerfreundlichkeit und dem Preis. Ein eigenes Produktsegment stellt Open
Source BI-Software dar. Sie basiert oft auf einem modularen Aufbau: Während
die Gesamtlösung Plattformcharakter hat, können ihre Bestandteile auch separat
eingesetzt werden. Daneben gibt es eine Reihe von Open Source-Lösungen für
einzelne Bereiche der Business Intelligence.
Open Source hat sich seit einiger Zeit auf dem Markt für Business Intelligence
etabliert und stellt auf einigen Anwendungsgebieten eine absolut
ernstzunehmende Konkurrenz zu den kommerziellen Lösungen dar. Es handelt
sich dabei um Softwarepakete, die im Internet zum Download stehen. Sowohl das
Programm an sich als auch der Quellcode können heruntergeladen werden.
Neben den kostenlosen „Community“-Versionen gibt es inzwischen auch
kostenpflichtige „Enterprise Editionen“, die professionelle Dienstleistungen
(Support etc.) und mehr Funktionen bieten.
Vorteile von Open SourceVorteile von Open SourceVorteile von Open SourceVorteile von Open Source
Für eine Open Source BI-Lösung spricht nicht nur der Kostenaspekt. Klare Vorteile
bringen auch die Unabhängigkeit von einem bestimmten Hersteller und eine
it-novum White Paper Open Source Business Intelligence November 2009
© it-novum GmbH 2009 7 Version 1.0
größere Flexibilität und Integrationsfähigkeit in heterogene IT-Landschaften
dank der verwendeten offenen Technologien und Schnittstellen.
Der Der Der Der Open SourceOpen SourceOpen SourceOpen Source----DiamantDiamantDiamantDiamant
Die marktführenden Anbieter im Open Source-Bereich, von denen einige im
Rahmen des vorliegenden Dokuments betrachtet werden, zeichnen sich durch
bestimmte Eigenschaften aus. Für eine bildliche Darstellung dieser Eigenschaften
und einen vereinfachten Vergleich mit den Charakteristika proprietärer Software
haben wir das Modell eines Diamanten entwickelt. Es setzt die Aspekte
Abhängigkeit, Funktionalität/Innovation, Flexibilität, Sicherheit und Kosten
zueinander in Beziehung und hilft, Klarheit über die Vor- und Nachteile einer IT-
Lösung zu gewinnen (siehe Abbildung 1).
Der bekannteste Vorteil quelloffener Software ist der frei zugängliche Quellcode.
Damit hat der Anwender grundsätzlich die Möglichkeit, selbst Erweiterungen am
Code durchzuführen (ob das der Endanwender macht oder einen darauf
spezialisierten Dienstleister beauftragt, ist in diesem Fall nicht ausschlaggebend)
und diese anderen zur Verfügung zu stellen. Ein weiterer Vorteil der strukturellen
Transparenz von Open Source-Software ist ein umfassenderer und gründlicherer
Innovationszyklus, weil die Anwender entscheidenden Einfluss auf die
Weiterentwicklung haben. Proprietäre Software ist dagegen von einem Hersteller
Abbildung Abbildung Abbildung Abbildung 1111: Der Open Source: Der Open Source: Der Open Source: Der Open Source----DiamantDiamantDiamantDiamant
it-novum White Paper Open Source Business Intelligence November 2009
© it-novum GmbH 2009 8 Version 1.0
abhängig und kann vom Anwender weder editiert noch ergänzt oder verbessert
werden. Das beschränkt ihr Innovationspotenzial auf die
Weiterentwicklungsressourcen und -bereitschaft des Produzenten.
Die weiteren im Open Source-Diamanten beschriebenen Eigenschaften werden
auf unserer Website www.itwww.itwww.itwww.it----novum.com/opensource_diamant_4629.htmlnovum.com/opensource_diamant_4629.htmlnovum.com/opensource_diamant_4629.htmlnovum.com/opensource_diamant_4629.html
näher erläutert.
it-novum White Paper Open Source Business Intelligence November 2009
© it-novum GmbH 2009 9 Version 1.0
1.1.1.1. Business IntelligenceBusiness IntelligenceBusiness IntelligenceBusiness Intelligence
Der Begriff „Business Intelligence“ wurde Mitte der neunziger Jahre zum ersten
Mal vom Analystenhaus Gartner verwendet. Er umschreibt die Bereitstellung und
Analyse von Daten mit dem Ziel, Führungskräfte in ihrer Tätigkeit zu
unterstützen. Business Intelligence hilft beim Umgang mit Problemstellungen
wie dem richtigen Aufeinanderbeziehen von Daten aus unstrukturiert
abgelegten Datenquellen, um sie danach zur Beschreibung und Analyse
unternehmerischer Zustände heranzuziehen.
Business Intelligence stellt verschiedene Methoden und spezialisierte
Applikationen zur Verfügung, um interne und externe Daten zu sammeln,
zusammenzuführen und auszuwerten. Den Rahmen dafür bilden im
Wesentlichen drei Prozessstufen:
1) Datenbeschaffung
Die benötigten Daten können aus einer oder mehreren Ursprungsquellen
herangezogen werden. Das kann ein ERP-System, eine Datenbank, eine Datei
(z.B. eine Excel-Datei) u.a. sein. Die zur Datenbeschaffung eingesetzte BI-
Funktionalität ist der ETL-Prozess (Extraction, Transformation, Loading).
2) Analytische Auswertung
Die gewonnenen Daten werden mittels analytischer Verfahren verarbeitet.
Hierbei handelt es sich entweder um eine einfache Ansammlung der Daten -
mit Hilfe der Analysetechnik OLAP (Online Analytical Processing) - oder um
komplexe statistische Untersuchungen über die Data Mining-Methode
erarbeitet.
3) Präsentationsfunktion
Dem Analyseschritt folgt die Aufbereitung der Daten zu
Präsentationszwecken in Form von Berichten (Reports). Sie werden entweder
als pdf-Dokumente oder in Form von Dashboards auf dem Frontend von
Portalen veröffentlicht.
Nach Abschluss der drei Verarbeitungsphasen bieten die dargestellten Daten eine
Hilfestellung bei der Entscheidungsfindung für Unternehmen, das sich so besser
auf Chancen und Risiken einstellen und dementsprechend agieren kann.
it-novum White Paper Open Source Business Intelligence November 2009
© it-novum GmbH 2009 10 Version 1.0
1.1.1.1.1.1.1.1. ETLETLETLETL ---- Extraktion, Transformation, LaExtraktion, Transformation, LaExtraktion, Transformation, LaExtraktion, Transformation, Ladendendenden
Die Beschaffung der Daten setzt sich aus folgenden Schritten zusammen:
• ExtraktionExtraktionExtraktionExtraktion der Daten aus dem ERP-System, einer Datenbank, einer
Datei oder aus anderen bestehenden Ursprungsquellen
• TransformationTransformationTransformationTransformation der Daten, um sie im nächsten Schritt
weiterverarbeiten zu können
• LLLLadenadenadenaden der erzielten Daten in eine zentrale Datensammelstelle (Data
Warehouse), um sie später für die verschiedenen Geschäftseinheiten zu
trennen.
Der ETL-Prozess wandelt operative Daten in subjekt- bzw. themenorientierte
Daten um. Dadurch können sie für die Entscheidungsfindung des Managements
eingesetzt werden. Dieser Vorgang setzt sich aus mehreren Teilprozessen
zusammen: Filterung, Harmonisierung, Aggregation und Anreicherung.
Abbildung Abbildung Abbildung Abbildung 2222: : : : Die Die Die Die BusinBusinBusinBusiness Intelligenceess Intelligenceess Intelligenceess Intelligence----Plattform (Schema)Plattform (Schema)Plattform (Schema)Plattform (Schema)
it-novum White Paper Open Source Business Intelligence November 2009
© it-novum GmbH 2009 11 Version 1.0
FilterungFilterungFilterungFilterung
Die Filterungsschicht umfasst die Extraktions- und die Bereinigungsphase (data
cleansing). Aus internen und externen Quellsystemen werden die benötigten
Daten ausgewählt und zwischengespeichert. Bevor die Daten in das Data
Warehouse geladen werden, werden sie vorerst in einer sogenannten „Staging
Area“ gelagert (Extraktion). Anschließend erfolgt die Bereinigung der
zwischengelagerten Daten von formellen und von inhaltlichen Mängeln.
HarmonisierungHarmonisierungHarmonisierungHarmonisierung
Nach erfolgreicher Filterung der Daten folgt die Harmonisierungsschicht. Sie
dient der Verknüpfung der gefilterten Daten. Dabei sind zwei Aspekte zu
untersuchen, die syntaktische Harmonisierung und die betriebswirtschaftliche
Harmonisierung.
• Syntaktische SynchronisierungSyntaktische SynchronisierungSyntaktische SynchronisierungSyntaktische Synchronisierung
Operative und externe Daten haben eine uneinheitliche Struktur und
müssen syntaktisch harmonisiert werden. Das geschieht durch
verschiedene Vorgänge:
a) Abstimmung von Kodierungen: Daten können unterschiedlich
kodiert sein, deshalb muss mit Hilfe von Zuordnungstabellen
eine Wahl getroffen werden.
b) Lösung des Synonym-Problems: Es existieren unterschiedlich
benannte, aber den gleichen Inhalt enthaltende Spalten. Dieses
Problem lässt sich durch die Einigung auf einen Spaltennamen
beheben.
c) Lösung des Homonym-Problems: Hier sind die Spaltennamen
identisch, aber der Inhalt unterscheidet sich. Die Lösung ist die
Vergabe von neuen Spaltennamen.
d) Bereinigung von Schlüsseldisharmonien: Wenn die extrahierten
und bereinigten Daten andere Primärschlüssel aufweisen als in
der operativen Datenhaltung, werden künstliche Primärschlüssel
erzeugt und die vorherigen Primärschlüssel als Fremdschlüssel
mitgeführt.
• Betriebswirtschaftliche HarmonisierungBetriebswirtschaftliche HarmonisierungBetriebswirtschaftliche HarmonisierungBetriebswirtschaftliche Harmonisierung
Für eine optimale Überführung der operativen Daten in
entscheidungsunterstützende Datenbestände muss die
it-novum White Paper Open Source Business Intelligence November 2009
© it-novum GmbH 2009 12 Version 1.0
betriebswirtschaftliche Harmonisierung durchgeführt werden. Sie
gleicht die betriebswirtschaftlichen Kennziffern ab und legt die
gewünschte Granularität (Detaillierungsgrad) der Daten fest:
a) Abgleichung der betriebswirtschaftlichen Kennziffern: Die Daten
werden betriebswirtschaftlich vereinheitlicht. Daten wie
Währung müssen nach gebiets- und ressortspezifischen Kriterien
in homogene Werte transformiert werden.
b) Festlegung der gewünschten Granularität der dispositiven Daten:
Je niedriger die Datengranularität, desto detaillierter sind die
Daten. Im Management werden niedrige Granularitäten
bevorzugt, weil die Analysen dementsprechend detaillierter
betrachtet werden können. Zur Festlegung des gewünschten
Detaillierungsgrades sind weitere Transformationsregeln nötig.
AggregationAggregationAggregationAggregation
Die gefilterten und harmonisierten Daten werden der nächsten
Transformationsschicht übergeben. Diese Schicht befasst sich mit der
Aggregation (Verdichtung, Ansammlung) der Daten. Es werden bestimmte
Aggregationsalgorithmen angewendet, da ein bestimmter Granularitätsgrad
nicht nötig ist. So werden in diesem Schritt Vorsummierungen getroffen, weil
gewisse betriebswirtschaftliche Kennzahlen nur mit diesen berechnet werden
können. Im Rahmen der Aggregation werden Dimensionshierarchietabellen
entworfen. Dabei entstehen Elemente wie „Gesamt“ oder „Alle“, die die
Summation der Einzeldaten enthalten.
AnreicherungAnreicherungAnreicherungAnreicherung
Hier werden die betriebswirtschaftlichen Kennzahlen berechnet und integriert.
Dieser Prozess ist wichtig für Informationen, die von mehreren Endanwendern
benutzt werden. Dabei werden verschiedene Kennzahlen für verschiedene
Anwender errechnet. Beispielsweise ist für einen Produktmanager der
wöchentliche Deckungsbeitrag auf Produktebene wichtig, ein Filialleiter hat
dagegen mehr Interesse an den jährlichen Deckungsbeiträgen auf Filialebene.
Nach den Transformationsprozessen sind die Daten so aufbereitet, dass sie in das
Data Warehouse aufgenommen werden können. Dieser Prozess nennt sich Laden
(Loading). Die Daten werden von der Staging Area in das Data Warehouse
verschoben und stehen jetzt für analytische Zwecke zur Verfügung.
it-novum White Paper Open Source Business Intelligence November 2009
© it-novum GmbH 2009 13 Version 1.0
1.2.1.2.1.2.1.2. Online Analytical Processing (OLAP)Online Analytical Processing (OLAP)Online Analytical Processing (OLAP)Online Analytical Processing (OLAP)
Die Technologien des „Online Analytical Processing“ (OLAP) bilden die Grundlage
des Berichtswesens (Reporting). Dazu werden die im Data Warehouse
eingelagerten Daten in einem sogenannten OLAP-Cube (Würfel) aufbereitet und
zur Verfügung gestellt, sodass sich die Anwender die benötigten Daten
herausziehen und anzeigen lassen können.
Beim OLAP werden relationale Datenmodelle mit Hilfe von zweidimensionalen
Tabellen abgebildet. Die eindeutige Identifikation der einzelnen Zeilen erfolgt
über Primärschlüssel. Um eine engere Analyserichtung gewährleisten zu können,
bedarf es multidimensionaler Datenräume. Diese werden mit Hilfe von
Datenwürfeln (Cubes) verwirklicht. Die Struktur eines Cubes erlaubt die
Abbildung mehrerer Dimensionen. Im Gegensatz dazu lässt sich ein normaler
Würfel nur auf drei Dimensionen abbilden. Um Analysen im Sinne der Business
Abbildung Abbildung Abbildung Abbildung 3333: Normierung der Daten für die spätere betriebswirtsch: Normierung der Daten für die spätere betriebswirtsch: Normierung der Daten für die spätere betriebswirtsch: Normierung der Daten für die spätere betriebswirtschaftlich einheitliche Darstellungaftlich einheitliche Darstellungaftlich einheitliche Darstellungaftlich einheitliche Darstellung
it-novum White Paper Open Source Business Intelligence November 2009
© it-novum GmbH 2009 14 Version 1.0
Intelligence durchführen zu können, bedarf es mehrerer Ebenen bzw.
Dimensionen.
Zwei Gesichtspunkte kennzeichnen einen Cube:
• Fakten:Fakten:Fakten:Fakten: Stehen im Mittelpunkt des Cubes und werden durch
betriebswirtschaftliche Kennzahlen gebildet.
• Dimensionen:Dimensionen:Dimensionen:Dimensionen: Stellen die Ebenen dar, die bei der Analyse zum Einsatz
kommen. Sie sind gleichzeitig die Achsen des Cubes.
Die Erstellung eines Cubes ist verbunden mit einer gut durchdachten
Aufbereitung der Daten. Die Daten müssen normiert vorliegen, um einen Cube
erstellen zu können und durchlaufen zunächst Prozesse wie den ETL-Prozess, um
in nächster Ebene als Tabelle in ein Data Warehouse integriert zu werden.
Dimensionsebenen werden herausgegriffen und anhand dieser wird eine
Faktentabelle erstellt, die die notwendigen Primärschlüssel der einzelnen
Dimensionstabellen enthält. Dabei kann ein Cube mehr als nur drei Dimensionen
AbAbAbAbbildung bildung bildung bildung 4444: Beispiel für einen Cube: Ein sogenannter Vertriebswürfel: Beispiel für einen Cube: Ein sogenannter Vertriebswürfel: Beispiel für einen Cube: Ein sogenannter Vertriebswürfel: Beispiel für einen Cube: Ein sogenannter Vertriebswürfel
it-novum White Paper Open Source Business Intelligence November 2009
© it-novum GmbH 2009 15 Version 1.0
enthalten. Die Faktentabelle umfasst zusätzlich zu den Primärschlüsseln der
Dimensionstabellen auch Kennzahlen wie beispielsweise „Umsatz“ oder
„Gewinn“. Diese Kennzahlen werden innerhalb der Faktentabelle über die
Dimensionen hinweg berechnet und im Cube gespeichert.
Cubes werden hauptsächlich im Controlling eingesetzt. So werden beispielsweise
einzelne Cubes für das Vertriebscontrolling erstellt, die einzelne Kennzahlen wie
„Umsatz pro Jahr“ oder „Anzahl der Aufträge pro Kunde“ beinhalten. Diese
Kennzahlen dienen gleichzeitig der strategischen Planung und Kontrolle des
Unternehmens.
Mit Hilfe von Internet und Intranet hat der Anwender die Möglichkeit, sich die
Tabellen bzw. Cubes über den Web-Browser anzeigen zu lassen, um daraus die
Analysen zu konstruieren. Die Daten können daneben auch als Excel-Datei
ausgegeben werden.
In OLAP-Systemen sollen die Informationen aus verschiedenen Perspektiven und
in verschiedenen Detaillierungsstufen veranschaulicht werden. Dazu dienen
Funktionen wie Drill-Down, Drill-Up, Drill-Across, Dicing und Slicing (Abbildung
5).
• DrillDrillDrillDrill----Down:Down:Down:Down: Erlaubt eine detailliertere Betrachtung der Daten in
vertikaler Richtung.
• DrillDrillDrillDrill----Up bzw.Up bzw.Up bzw.Up bzw. RollRollRollRoll----Up: Up: Up: Up: Entspricht der nächsthöheren Verdichtungs-
ebene und ist das Gegenteil des Drill-Down.
• DrillDrillDrillDrill----Across:Across:Across:Across: Erlaubt das Vertauschen der Dimensionen untereinander.
• Dicing: Dicing: Dicing: Dicing: Filtert bestimmte Attribute zur Betrachtung. Dadurch, dass alle
anderen Attribute ausgeblendet werden, entsteht ein kleinerer Cube.
• Slicing: Slicing: Slicing: Slicing: Es wird nur eine Scheibe des Cubes berücksichtigt.
it-novum White Paper Open Source Business Intelligence November 2009
© it-novum GmbH 2009 16 Version 1.0
Es gibt verschiedene OLAP-Umsetzungskonzepte wie das R-OLAP (Relationales
OLAP) und das M-OLAP (Multidimensionales OLAP). R-OLAP basiert auf Daten, die
in einer relationalen Datenbank gespeichert sind. Dieses Konzept findet bei
hohen Datenvolumen und großen Benutzerkreisen Anwendung. M-OLAP
(Multidimensionales OLAP) arbeitet mit multidimensionalen Datenbanken. Dabei
sind die abgespeicherten Daten transformiert und bilden von vornherein einen
Würfel). Der Vorteil ist die schnellere Antwortzeit bei Datenabfragen. Abfragen
auf multidimensionalen Datenstrukturen werden mit MDX-Anweisungen
(Multidimensional Expressions) durchgeführt.
1.3.1.3.1.3.1.3. Data MiningData MiningData MiningData Mining
Beim Data Mining handelt es sich um ein weiteres Analyseverfahren. Die
existierende Datensammlung wird nach Zusammenhängen untersucht und die
neu entdeckten Hypothesen festgehalten. Eingesetzt werden verschiedene
Methoden der Statistik, der Mathematik und der Künstlichen Intelligenz:
• Entscheidungsbäume
• Künstliche Neuronale Netze (KNN)
• Clusterverfahren
• Assoziationsanalyse
Abbildung Abbildung Abbildung Abbildung 5555: Die Selektion von unterschiedlichen Datenschichten: Die Selektion von unterschiedlichen Datenschichten: Die Selektion von unterschiedlichen Datenschichten: Die Selektion von unterschiedlichen Datenschichten
it-novum White Paper Open Source Business Intelligence November 2009
© it-novum GmbH 2009 17 Version 1.0
1.4.1.4.1.4.1.4. ReportingReportingReportingReporting
Das Reporting (deutsch: Berichtswesen) ist die Gesamtheit aller Methoden und
Techniken für die betriebliche Berichterstattung. Dabei wird gerne in „Standard-
Reporting” und „Ad-hoc-Reporting” unterschieden. Reports oder Berichte
erleichtern Mitarbeitern die Erledigung ihrer Aufgaben und dienen dem
Management als Informationsquelle. Um einen Bericht zu erstellen, müssen die
folgenden Punkte festgelegt werden: der Berichtszweck, der Berichtsinhalt,
Sender und Empfänger und sowie der Zeitpunkt der Berichterstattung.
Aktive Berichtssysteme arbeiten selbstständig. Nachdem Form und Inhalt des
Berichts einmal festgelegt sind, generieren sie automatisch die Reports und
stellen sie dem Empfänger zu. Passive Berichtssysteme erzeugen Berichte nur auf
Anfrage eines Benutzers. Ad-hoc-Berichtssysteme sind ein Teil der passiven
Berichtssysteme.
Im Bereich des Ad-hoc-Reportings ist der Endbenutzer jedoch nicht nur an der
Berichtserzeugung, sondern auch an dessen Gestaltung beteiligt. Bereits der
Name „ad hoc“ drückt aus, dass ein Bericht „aus dem Stegreif“ erstellt wird. Das
bedeutet, dass der Anwender während der Berichtserzeugung selbstständig das
Layout des gewünschten Reports festlegt. Eine solche interaktive
Zusammenstellung der Daten bevorzugt besonders der Anwenderkreis der
Analytiker, wie beispielsweise die Controller. Ihnen reichen häufig die
Informationen aus den Standardreports nicht aus. Sie benötigen die Möglichkeit,
Daten auf Produktsegmente oder Einzelkunden herunterzubrechen. Hier helfen
die Ad-hoc-Analysen weiter. Ad-hoc-Berichte basieren ausschließlich auf
multidimensionalen Daten, weil sich ihre Struktur optimal für derartige
Auswertungen eignet. Ad-hoc-Analysen werden häufig in
Tabellenkalkulationsprogrammen wie beispielsweise Microsoft Excel
durchgeführt. Je nach zugrunde liegender Datenbank werden verschiedene
Plugins für die Erstellung von Ad-hoc-Berichten angeboten. Häufig können die
auszuwählenden Dimensionen einfach mit Drag-and-Drop selektiert werden. Ad-
hoc-Berichte können ebenso wie Standardberichte in Form von Tabellen oder
Diagrammen umgesetzt werden. Sie zeichnen sich durch eine sehr große
Benutzerfreundlichkeit aus, weil schnelle Sichtänderungen auch vom
unerfahrenen Anwender durchgeführt werden können.
it-novum White Paper Open Source Business Intelligence November 2009
© it-novum GmbH 2009 18 Version 1.0
1.5.1.5.1.5.1.5. DashDashDashDashboardboardboardboardssss
Die wichtigsten Kennzahlen eines Unternehmens werden gerne im sogenannten
Dashboard auf einer einzigen Bildschirmseite präsentiert. Ein Dashboard ist eine
Ansammlung von einzelnen Berichten, die wiederum aus Kennzahlen,
Messpunkten oder Key Performance Indicators (KPIs) bestehen, wobei die Berichte
aufeinander aufbauen. Es ähnelt dem Cockpit eines Piloten, weil die Daten durch
Tachometer, Liniendiagramme, Ampeln, Landkarten und andere Darstellungen
visualisiert werden. Das soll Entscheidungsträgern einen schnellen Blick auf die
wichtigsten Unternehmensdaten ermöglichen.
Dashboards zeichnen sich durch folgende Merkmale aus:
• Komprimierte Darstellung:Komprimierte Darstellung:Komprimierte Darstellung:Komprimierte Darstellung: Die benötigten Informationen werden in
verdichteter Form, meist auf einer einzigen Bildschirmseite, dargestellt,
um den Übersichtscharakter zu betonen. Dazu werden geeignete
Visualisierungstechniken verwendet.
• Konzentration auf wesentliche Informationen:Konzentration auf wesentliche Informationen:Konzentration auf wesentliche Informationen:Konzentration auf wesentliche Informationen: Auf eine Überhäufung
an Detailinformationen wird verzichtet. Auffällige
Visualisierungsmerkmale wie z.B. Ampeln werden eingesetzt, damit der
Betrachter die Informationen schnell erfassen kann.
• Spezifische Lösung:Spezifische Lösung:Spezifische Lösung:Spezifische Lösung: Dashboards werden den Bedürfnissen des
Endanwenders angepasst.
Key Performance Indicators (KPIs) sind Kennzahlen von besonders großer
Bedeutung für unternehmerische Entscheidungen. Mit ihrer Hilfe wird gerne die
Wirtschaftlichkeit eines Unternehmens durch einen Soll-Ist-Vergleich ermittelt.
Sie sind deshalb ein wichtiges Hilfsmittel für Führungspersonen. Weil solche
Kennzahlen für sich allein genommen keine Aussagekraft haben, werden sie dem
Benutzer in Verbindung mit anderen Kennzahlen präsentiert. Zur visuellen
Darstellung der KPIs dienen die Dashboards, die die Werte mit Hilfe der bereits
erwähnten Ampeln, Tachometern oder Thermometern verdeutlichen.
1.6.1.6.1.6.1.6. PortalePortalePortalePortale
Portale bieten eine individuell angepasste Zugriffsmöglichkeit auf Inhalte und
Applikationen. Durch ein Portal erhält der Anwender einen zentralen Zugang zu
ausgewählten Themenbereichen sowie den zugehörigen Informationen und
Diensten.
it-novum White Paper Open Source Business Intelligence November 2009
© it-novum GmbH 2009 19 Version 1.0
Portale basieren auf Web-Technologien. Ihre Inhalte werden in Web-Browsern
dargestellt. Das erfordert einen Web-Server, der die Nutzeranfragen (Requests)
beantwortet, damit die benötigten Informationen in Form von Portlets
dargestellt werden können. Portlets sind kleine Fenster auf der Web-Seite eines
Portals, die mit beliebigen Inhalten befüllt und innerhalb des Portalfensters
verschoben werden können. Der Vorteil eines Portals ist, dass sich der Benutzer
nur einmal am Portal anmelden muss, nach der Authentifizierung aber auf alle
im Portal enthaltenen Anwendungen und Dienste Zugriff hat.
In der Business Intelligence dienen Portale zur Darstellung von webbasierten
Berichten und Dashboards. Das Portal fungiert innerhalb eines Unternehmens als
zentraler „Point of Access“ auf unternehmerische Kennzahlen und deren
Darstellung in Reports oder Dashboards. Der Benutzer meldet sich einmal am
Portal an und kann dann auf die BI-Funktionalitäten im Portal zugreifen.
it-novum White Paper Open Source Business Intelligence November 2009
© it-novum GmbH 2009 20 Version 1.0
2222.... Anbieter von Open Source Anbieter von Open Source Anbieter von Open Source Anbieter von Open Source Business Business Business Business IntelligenceIntelligenceIntelligenceIntelligence
Pentaho, JasperSoft und Jedox sind drei marktführende Anbieter von
kommerzieller Open Source-Software für Business Intelligence. Ihre Produkte sind
mittlerweile auf dem Markt gut etabliert, weshalb sie im Fokus des vorliegenden
Dokuments stehen. Alle drei Anbieter unterscheiden in ihrer Produktpalette
zwischen kostenpflichtigen Enterprise Edition-Versionen und einer Community-
Version, die kostenlos zum Download zur Verfügung steht. Die Enterprise Edition-
Versionen bieten meist mehr Funktionen als die Community-Versionen und eine
Reihe von Dienstleistungen, die Support, Schulungen oder gar Consulting
umfassen können.
2.1.2.1.2.1.2.1. PentahoPentahoPentahoPentaho: Pentaho: Pentaho: Pentaho: Pentaho BIBIBIBI----SuiteSuiteSuiteSuite
Pentaho ist neben JasperSoft der bekannteste Anbieter kommerzieller Open
Source-Software. Pentaho entwickelt und vertreibt eine Business Intelligence-
Plattform, die Pentaho BI-Suite. Daneben bietet das Unternehmen
kostenpflichtige Dienstleistungen wie professionellen Support an. Die Pentaho
BI-Suite entstand 2002, als verschiedene Open Source-Projekte im Business
Intelligence-Bereich wie JFreeReport, Kettle, Mondrian und Weka zu einer BI-
Plattform zusammengefasst wurden.
Die Pentaho BI-Suite hat einen modularen Aufbau. Die einzelnen Module
entsprechen den BI-Funktionsbereichen ETL-Prozesse, OLAP-Analysen, Data
Mining, Reporting und Dashboards. Sie können im Rahmen der Suite verwendet
werden, es ist aber auch möglich, einzelne Komponenten alleine einzusetzen
(Abbildung 6).
it-novum White Paper Open Source Business Intelligence November 2009
© it-novum GmbH 2009 21 Version 1.0
Zur Umsetzung der BI-Funktionalitäten setzt Pentaho den Java-
Applikationsserver Tomcat ein. Die Benutzeroberfläche (user console) und die
administrative Sicht (administration console) sind Java-Webanwendungen. Die
user console umfasst Beispielordner, kann aber um weitere Ordner ergänzt
werden. Neue Berichte oder OLAP-Analysen können hier angelegt werden, für
einen besseren Überblick lassen sich verschiedene Ordner mit Unterordnern
erstellen und verwalten. Die administration console dient zur
Benutzerverwaltung, der Vergabe von Berechtigungen und der Konfiguration von
Datenbanken.
2.1.1.2.1.1.2.1.1.2.1.1. EEEETL: TL: TL: TL: Pentaho Data Integration (Kettle)Pentaho Data Integration (Kettle)Pentaho Data Integration (Kettle)Pentaho Data Integration (Kettle)
Das ETL-Tool von Pentaho heißt Pentaho Data Integration. Es ist aus dem sehr
beliebten Open Source-Projekt Kettle hervorgegangen und wird auch als
integrierter Bestandteil der Suite noch gerne Kettle genannt. Pentaho Data
Integration unterliegt der LGPL-Lizenz. Der Einsatz ist sowohl mit Pentaho als
auch als Standalone-Tool möglich.
Abbildung 6: Der modulare Aufbau der PentahoAbbildung 6: Der modulare Aufbau der PentahoAbbildung 6: Der modulare Aufbau der PentahoAbbildung 6: Der modulare Aufbau der Pentaho----BIBIBIBI----SuiteSuiteSuiteSuite
it-novum White Paper Open Source Business Intelligence November 2009
© it-novum GmbH 2009 22 Version 1.0
AufbauAufbauAufbauAufbau
Pentaho Data Integration besteht aus vier Einzelapplikationen:
• SpoonSpoonSpoonSpoon ist verantwortlich für die grafische Benutzerschnittstelle.
• PanPanPanPan ist zuständig für die Stapelverarbeitung von Transformationen.
• KitchenKitchenKitchenKitchen erledigt die Stapelverarbeitung von Job-Ketten.
• CarteCarteCarteCarte hat die Aufgabe, einen "Remote-Server" zu aktivieren, mit dem
Spoon-Transformationen remote ausgelöst werden können.
Kettle basiert auf der Entwicklungsumgebung Eclipse und ist deshalb ähnlich
strukturiert und mit Hilfe von Plugins erweiterbar. Neben freien existieren auch
kostenpflichtige Plugins, wie z.B. ein SAP-Plugin mit dem Namen „ProERPconn",
das den Datenaustausch mit SAP-Systemen ermöglicht.
Mit Kettle können entweder Transformationen oder Jobs angelegt werden.
Transformationen umfassen den Import und Export der Daten. Jobs
konzentrieren sich auf die Umsetzung von mehreren Transformationen und
anderen Prozessen.
NutzungNutzungNutzungNutzung
Die Entwicklungsumgebung von Kettle ist übersichtlich aufgebaut und
unkompliziert zu bedienen. Per Mausklick können die „Steps" (einzelne
Bestandteile) des Jobs bzw. der Transformation erzeugt werden. Die "Hops" sind
die Verbindungspfeile zwischen den Steps (Abbildung 7). Der Datentransfer von
bzw. in eine Datenbank erfordert eine Datenbankanbindung. Diese Anbindung
wird einmalig im View-Fenster erstellt und kann mehrmals verwendet werden.
Wenn Kettle im Zusammenhang mit Pentaho verwendet wird, bietet Pentaho die
Option, generierte Jobs in einer speziellen „administration console“ zu verwalten.
it-novum White Paper Open Source Business Intelligence November 2009
© it-novum GmbH 2009 23 Version 1.0
Erfahrungen und EinstufungenErfahrungen und EinstufungenErfahrungen und EinstufungenErfahrungen und Einstufungen
Vom Aufbau ausgehend ist Pentaho Data Integration sehr gut strukturiert,
übersichtlich und unkompliziert in der Bedienung. Für die Gliederung der ETL-
Elemente nach Anwendungsbereichen gibt es eine einheitliche Struktur. Kettle
eignet sich daher gut für ETL-Einsteiger. Ebenfalls positiv ins Auge fallen die
großen Erweiterungsmöglichkeiten durch die vielen Plugins.
Für SAP-Anwender gibt es ein eigenes Plugin für Kettle, den „ProERPconn“ des
Pentaho-Partners proratio. Er ist ohne weiteres in die Umgebung
implementierbar, allerdings kostenpflichtig.
2.1.2.2.1.2.2.1.2.2.1.2. Pentaho Analysis Services (Mondrian)Pentaho Analysis Services (Mondrian)Pentaho Analysis Services (Mondrian)Pentaho Analysis Services (Mondrian)
Die Pentaho Analysis Services bestehen im Wesentlichen aus dem Open Source-
Projekt Mondrian. Sie setzen sich zusammen aus der Schema-Workbench, der
Mondrian-Webanwendung und dem Aggregation Designer.
Abbildung 7: ETLAbbildung 7: ETLAbbildung 7: ETLAbbildung 7: ETL----Prozesse mit KettleProzesse mit KettleProzesse mit KettleProzesse mit Kettle
it-novum White Paper Open Source Business Intelligence November 2009
© it-novum GmbH 2009 24 Version 1.0
2.1.2.1.2.1.2.1.2.1.2.1.2.1.2.1. Mondrian SchemaMondrian SchemaMondrian SchemaMondrian Schema----WorkbenchWorkbenchWorkbenchWorkbench
Die Mondrian Schema-Workbench wird sowohl von Pentaho als auch von
Mitbewerber JasperSoft genutzt und ist für die Erstellung von Mondrian-
Schemata basierend auf R-OLAP-Systemen geeignet. Ein Schema wird per Drag-
and-Drop-Technik angefertigt und als XML-Datei abgespeichert. Wichtig ist dabei
die Betrachtung von R-OLAP-Systemen, weil sich die Schema-Workbench auf die
strukturierten Tabellen eines Relationalen Datenbankmanagement Systems
bezieht. Zur Erstellung eines Schemas wird ein Cube definiert, der aus einer
Faktentabelle und mehreren Dimensionstabellen besteht.
AufbauAufbauAufbauAufbau
Die Schema-Workbench umfasst Komponenten wie Cubes, die zugehörigen
Dimensionen, Hierarchien, Levels oder Kennzahlen. Das Schema wird in einer
Baumstruktur angezeigt. MDX-Abfragen können in einem Editor durchgeführt
werden.
NutzungNutzungNutzungNutzung
Über die Oberfläche kann der Anwender ein neues Schema bzw. eine neue MDX-
Anweisung erstellen oder ein Vorhandenes öffnen. Sobald ein neues Schema
erzeugt wird, muss eine Datenbankverbindung angegeben werden. Per
Mausklick wird ein Cube generiert und die zugehörige Faktentabelle mit ihren
Dimensionstabellen hinzugefügt. Es entsteht eine Baumstruktur, mit der weitere
Elemente wie Kennzahlen oder Hierarchien einfach angelegt werden können. Die
Schema-Workbench speichert das Schema im XML-Format und es besteht die
Möglichkeit, das Schema in der jeweiligen BI-Plattform zu publizieren.
2.1.2.2.2.1.2.2.2.1.2.2.2.1.2.2. MondrianMondrianMondrianMondrian----WebanwendungWebanwendungWebanwendungWebanwendung
Für das Webfrontend für Mondrian gibt es momentan drei Anwendungen: Das
von Pentaho erst kürzlich erworbene Produkt ClearView des Drittanbieters
LucidEra, JPivot und die Pentaho Analysis Tools (PAT). Klassisches Webfrontend
war bis vor kurzem das Open Source-Projekt JPivot. JPivot besitzt alle Funktionen
zur Durchführung von OLAP-Analysen, wurde jedoch von Anwendern als
umständlich und visuell wenig ansprechend wahrgenommen. Seit kurzem setzt
Pentaho daher ClearView ein, allerdings nur in der Enterprise Edition. Die
Community Version enthält weiterhin JPivot, es ist aber geplant, JPivot durch das
Open Source-Projekt Pentaho Analysis Tools (PAT) zu ersetzen. PAT gilt als
anwenderfreundlicher und zeitgemäßer als JPivot, eine erste stabile Version soll
Weihnachten 2009 veröffentlicht werden. Da PAT im Gegensatz zu JPivot noch
it-novum White Paper Open Source Business Intelligence November 2009
© it-novum GmbH 2009 25 Version 1.0
nicht in die Pentaho BI-Plattform integriert ist, die meisten User aber bis zur
Einbindung von PAT mit JPivot arbeiten dürften, wird im Folgenden die
Arbeitsweise von JPivot beschrieben.
Der Datenzugriff wird bei JPivot über MDX-Abfragen durchgeführt. Mit Hilfe des
Mondrian-Schemas werden die Abfragen in eine SQL-Syntax übersetzt und auf
der Datenbank ausgeführt. JPivot ermöglicht die grafische Darstellung der
Ergebnisse in Form von Tabellen oder Diagrammen. Die Mondrian Cubes können
in Excel mit Hilfe von Pivot-Tabellen ausgewertet werden. Zu diesem Zweck
enthält die Pentaho-Plattform mittlerweile nicht mehr das Excel-Add-In Pentaho
Spreadsheet Services, es gibt aber einen Drittanbieter namens Simba. Mit dem
kostenpflichtigen SimbaO2X-Plugin kann Excel als Frontend zur Darstellung von
Mondrian Cubes verwendet werden, was für Anwender aus technikfernen
Fachabteilungen sicher eine attraktive Alternative zum eher umständlich zu
bedienenden JPivot ist.
Das Webfrontend von Mondrian besteht aus JPivot-Tabellen. Diese umfassen in
einer tabellarischen Sicht die Datenwürfel, die in der Schema-Workbench erstellt
wurden, und eine Leiste zur Durchführung von OLAP-Analysen. Darunter befindet
sich ein OLAP-Navigator, mit dem sich die Dimensionen eines Cubes frei
kombinieren und die anzuzeigenden Daten auswählen lassen.
Abbildung 8: Der Zugriff auf Excel PivotAbbildung 8: Der Zugriff auf Excel PivotAbbildung 8: Der Zugriff auf Excel PivotAbbildung 8: Der Zugriff auf Excel Pivot----Tabellen mit SimbaTabellen mit SimbaTabellen mit SimbaTabellen mit Simba
it-novum White Paper Open Source Business Intelligence November 2009
© it-novum GmbH 2009 26 Version 1.0
NutzungNutzungNutzungNutzung
Mit jPivot werden OLAP-Analysen durchgeführt, MDX-Anweisungen erzeugt und
Daten in Excel oder als gedrucktes Dokument ausgegeben.
2.1.2.3.2.1.2.3.2.1.2.3.2.1.2.3. Aggregation DesignerAggregation DesignerAggregation DesignerAggregation Designer
Um die Leistung von OLAP-Analysen zu steigern, wurde von Pentaho der
Aggregation Designer entwickelt. Der Designer erstellt Tabellen, die der
Datenbank den Aggregationsprozess ersparen.
AufbauAufbauAufbauAufbau
Der Aggregation Designer ist ein separates Werkzeug mit einer einfachen
Struktur. Drei Fenster bilden die Oberfläche. Die linke Sicht enthält die
Dimensionen des ausgewählten Cubes mit den entsprechenden Levels. Ein
Grafikfenster demonstriert die Performance des Ergebnisses.
NutzungNutzungNutzungNutzung
Der Aggregation Designer lässt sich sehr leicht bedienen. Durch vorgefertigte
Wizards werden Datenbankverbindungen und das bereits existierende Schema
angelegt. Die zugehörigen Dimensionen werden angezeigt und die
entsprechenden Levels können ausgewählt werden. Nach dem Speichern kann
das aggregierte Schema im BI-Server veröffentlicht werden.
Erfahrungen und EinstufungenErfahrungen und EinstufungenErfahrungen und EinstufungenErfahrungen und Einstufungen
Die Mondrian-Plattform setzt sich aus mehreren Einzeltools zusammen und
erscheint daher auf den ersten Blick unübersichtlich und unstrukturiert.
Eine große Erleichterung für Endanwender-Szenarios stellt das Simba-Plugin dar.
Mit dem Plugin können Auswertungen aus Mondrian direkt in Excel-Pivot-
Tabellen importiert werden, sodass der Endanwender innerhalb seiner
gewohnten Excel-Umgebung arbeiten und gleichzeitig schnelle Analysen
durchführen kann.
Im SAP-Bereich eignet sich Mondrian beispielsweise für die Generierung von
Cubes, die SAP-Daten beinhalten. Dafür werden zunächst die Daten aus dem SAP-
it-novum White Paper Open Source Business Intelligence November 2009
© it-novum GmbH 2009 27 Version 1.0
System exportiert, um daraus Cubes zu bilden, auf denen dann die OLAP-Analyse
ausgeführt wird – wird Simba verwendet, auch in Excel.
2.1.3.2.1.3.2.1.3.2.1.3. Pentaho WEKAPentaho WEKAPentaho WEKAPentaho WEKA
Pentaho kooperiert im Bereich Data Mining seit 2006 mit dem WEKA-Projekt. Das
Projekt wurde 1993 an der Universität von Waikato (Neuseeland) gestartet. WEKA
steht unter der GPL und kann auch unabhängig vom Pentaho BI-Server eingesetzt
werden. Das Tool umfasst drei Oberflächen: Explorer, Experimenter und
Knowledge Flow.
• Explorer:Explorer:Explorer:Explorer: Mit Hilfe des Explorers gibt der Anwender die Datenquelle
an, aus der die benötigten Daten importiert werden. Gleichzeitig
werden darüber Daten geändert und gefiltert, um anschließend die
Algorithmen ausführen zu können.
• Experimenter: Experimenter: Experimenter: Experimenter: Der Experimenter besitzt eine Oberfläche für das
Anlegen und Testen von Lernansätzen in Form von Experimenten.
Der Anwender legt eine Datei an, in der die Ergebnisse geschrieben
werden, wählt die Algorithmen aus, die ausgeführt werden sollen,
und gibt die Datenquelle an. Das Experiment wird durchgeführt, das
Ergebnis in einem eigenen Fenster dargestellt.
• Knowledge Flow:Knowledge Flow:Knowledge Flow:Knowledge Flow: Als eine weitere Option des Explorers ermöglicht
Knowledge Flow, Data-Mining Analysen als Datenflussdiagramme
zu visualisieren.
2.1.4.2.1.4.2.1.4.2.1.4. Pentaho Report DesignerPentaho Report DesignerPentaho Report DesignerPentaho Report Designer
Pentaho Reporting ist eine Weiterführung des Projekts JFreeReport, das unter
dem Namen Classic Reporting Engine herausgegeben wird. JFreeReport ist eine
freie Bibliothek von Java-Klassen zum Generieren von Berichten, lizensiert unter
der LGPL. Das Projekt wurde im Jahre 2002 erstmals zum Download angeboten
und 2006 in Pentaho integriert. Anhand von JFreeReport lassen sich XML-basierte
Berichte erstellen und in verschiedene Formate wie csv, html oder pdf
exportieren. Für die Erstellung von Berichten steht dem Anwender eine eigene
Oberfläche angeboten: Der Pentaho Report Designer. Alternativ kann auch der
mit etwas weniger Funktionen ausgestattete Report Design Wizard gewählt
werden.
it-novum White Paper Open Source Business Intelligence November 2009
© it-novum GmbH 2009 28 Version 1.0
Pentaho erlaubt das Generieren von Berichten in verschiedenen Varianten: Zum
einen mit Hilfe des Pentaho Report Designer als separatem
Berichtsentwicklungstools, zum anderen innerhalb der BI-Plattform durch fertige
Vorlagen (Templates). Der Pentaho Report Designer ermöglicht es, die generierten
Berichte auf der BI-Plattform zu publizieren.
AufbauAufbauAufbauAufbau
Eine Palette listet alle vorhandenen Berichtselemente des Report Designers auf.
Die Komponenten der Palette können per Drag-and-Drop-Technik auf die
Oberfläche platziert und bearbeitet werden. Die komplette Struktur des Berichtes
wird in einer hierarchischen Gliederung wiedergegeben.
NutzungNutzungNutzungNutzung
Der Anwender kann zwischen einer manuellen Berichterstellung und dem Report
Design Wizard (siehe Abbildung 4.21.) entscheiden. Mit dem Report Design
Wizard wird auf einfache Weise ein Standardbericht erzeugt. Für mehr
Flexibilität bei der Erstellung und Gestaltung des Berichts sollte man die Berichte
jedoch manuell erstellen. Wie bei anderen Reporting-Tools auch, wird ein Bericht
in einzelne Bereiche wie ”Page Header”, ”Report Header”, ”Item Band”, ”Report
Footer” und ”Page Footer“ gegliedert”. Sobald Layout und Design des Berichts
feststehen, hat der Anwender die Option, den Bericht zu speichern oder auf der
BI-Plattform zu veröffentlichen.
Erfahrungen und Erfahrungen und Erfahrungen und Erfahrungen und BewertungBewertungBewertungBewertung
Der Report Designer von Pentaho hat eine einfache Struktur, lässt sich sehr leicht
bedienen und benötigt nur wenig Einarbeitungszeit. Er umfasst eine große
Auswahl an qualitativ hochwertigen Diagrammen, sodass ansprechende Berichte
erstellt werden können. Als Datenquellen lassen sich auch SAP-Systeme und
Excel-Dateien anbinden. Das Publizieren des generierten Berichts ist direkt auf
der Report Designer-Oberfläche und Pentaho-BI-Plattform möglich.
2.1.5.2.1.5.2.1.5.2.1.5. Pentaho DashboardPentaho DashboardPentaho DashboardPentaho Dashboard----BuildingBuildingBuildingBuilding
Eine Oberfläche für die grafische Erstellung von Dashboards steht bei Pentaho
nur in der kostenpflichtigen Enterprise Edition zur Verfügung. Die Community
Version enthält aber Bibliotheken des Projekts Community Dashboard
Framework, mit denen manuell Dashboards generiert werden können (Abbildung
9).
it-novum White Paper Open Source Business Intelligence November 2009
© it-novum GmbH 2009 29 Version 1.0
Erfahrungen und EinstufungenErfahrungen und EinstufungenErfahrungen und EinstufungenErfahrungen und Einstufungen
Durch die manuelle Dashboard-Erstellung ist es für einen technisch weniger
versierten Anwender schwierig, schnell und einfach Visualisierungen zu
erzeugen. Notwendig ist Entwicklerwissen z.B. über die Funktionsweise von XML-
Dateien und html- und Java Script-Kenntnisse. Auch das Community Dashboards
Framework und seine Bibliotheken ändern wenig daran, weil die damit
entwickelten Dashboards nicht ohne Programmierkenntnisse verändert werden
können.
2.1.6.2.1.6.2.1.6.2.1.6. Pentaho Enterprise EditionPentaho Enterprise EditionPentaho Enterprise EditionPentaho Enterprise Edition
Die Pentaho Enterprise Edition ist das kostenpflichtige Komplettpaket der
Pentaho BI-Suite. Sie enthält alle Designer-Tools wie z.B. Aggregation Designer,
Data Integration (Kettle), Report Designer und Schema-Workbench. Die
Community Version liefert diese Tools nicht innerhalb eines Gesamtpakets,
sondern bietet sie einzeln zum Download an. Vergleicht man die einzelnen
Komponenten der beiden Versionen, sind kaum Unterschiede zwischen den
Community Design-Tools und den Enterprise Edition Design-Tools festzustellen
mit Ausnahme des Dashboard Designers (Abbildung 10).
Abbildung Abbildung Abbildung Abbildung 6666: Die Erstellung von Dashboards in der Community Version: Die Erstellung von Dashboards in der Community Version: Die Erstellung von Dashboards in der Community Version: Die Erstellung von Dashboards in der Community Version
it-novum White Paper Open Source Business Intelligence November 2009
© it-novum GmbH 2009 30 Version 1.0
Mit dem Designer kann der Anwender anhand vorher gespeicherter Berichte
Dashboards erstellen. Dafür können Filter gesetzt werden, um Abhängigkeiten zu
erzeugen. Grafisch gesehen ist der Dashboard-Designer sehr übersichtlich
strukturiert und enthält die wichtigsten Funktionen zur Dashboard-Generierung.
Erfahrungen und EinstufungenErfahrungen und EinstufungenErfahrungen und EinstufungenErfahrungen und Einstufungen
Die Pentaho Enterprise Edition hat aus Anwendersicht den Vorteil, dass sowohl
die Design-Tools als auch die BI-Plattform auf einem Blick zur Verfügung stehen,
weil sie nach der Installation über das Start-Menü aufgerufen werden können.
Aus Entwicklersicht ist das separate Herunterladen der Open Source-Design-Tools
und der BI-Plattform innerhalb der Community Version aber kein Nachteil
gegenüber der Enterprise Edition.
Die von der Community Version bereitgestellten Module weisen die gleichen
Funktionalitäten wie die der Enterprise Version auf. Die wesentlichen
Unterschiede sind der fehlenden Dashboard-Designer in der Community-Version
und die Dienstleistungen der Enterprise Edition. Für Entwickler spielen diese
Unterschiede sicher keine Rolle. Endanwender ohne Programmierkenntnisse aus
der Managementebene bevorzugen aber eine leicht zu bedienende Oberfläche
Abbildung Abbildung Abbildung Abbildung 7777: Der Dashboard Designer der Pentaho Enterprise Edition: Der Dashboard Designer der Pentaho Enterprise Edition: Der Dashboard Designer der Pentaho Enterprise Edition: Der Dashboard Designer der Pentaho Enterprise Edition
it-novum White Paper Open Source Business Intelligence November 2009
© it-novum GmbH 2009 31 Version 1.0
für die Darstellung ihrer Kennzahlen. Bei größeren BI-Projekten dürften
außerdem die Support- und Service-Leistungen der Enterprise Edition eine
sinnvolle Investition darstellen.
2.1.7.2.1.7.2.1.7.2.1.7. Fazit: PentahoFazit: PentahoFazit: PentahoFazit: Pentaho
Die Pentaho Community Version bietet eine große Palette an Anwendungen für
die verschiedenen Fragestellungen der Business Intelligence. Besonders positiv
fallen Pentaho Data Integration (Kettle) und Pentaho Report Designer ins Auge.
Kettle ist mit Hilfe von Plugins erweiterbar und damit sehr flexibel im Hinblick
auf neue oder sich ändernde BI-Anforderungen. Der Report Designer überzeugt
durch das Zusammenspiel mit der BI-Plattform: Berichte werden im Report
Designer generiert und können anschließend auf der BI-Plattform veröffentlicht
werden.
OLAP-Funktionalität stellt Mondrian auf der Grundlage der R-OLAP-Technologie
bereit. Durch den Einsatz der Drittanbieter-Lösung Simba kann Mondrian in Excel
importiert werden. Mit Blick auf den Anwenderkreis aus technikfernen Bereichen
wie Controlling, Finanzen oder Marketing stellt das Excel-Frontend einen klaren
Vorteil dar, weil diese Anwender OLAP-Analysen in ihrer gewohnten
Arbeitsumgebung durchführen können.
it-novum White Paper Open Source Business Intelligence November 2009
© it-novum GmbH 2009 32 Version 1.0
2.2.2.2.2.2.2.2. JasperSoftJasperSoftJasperSoftJasperSoft BIBIBIBI----SuiteSuiteSuiteSuite
JasperSoft wurde 2001 unter dem Namen Panscopic gegründet und spezialisierte
sich zunächst auf den Bereich Reporting. Gleichzeitig entwickelte ein
Programmierer namens Teodor Danciu die Open Source Software JasperReports.
Er wurde daraufhin von Panscopic übernommen und der Firmenname in
JasperSoft geändert. JasperSoft ist seither nicht nur im Reporting-Bereich tätig,
sondern entwickelt auch Lösungen für andere Bereiche der Business Intelligence.
Seit 2005 vertreibt JasperSoft auch kommerzielle Produkte.
JasperSoft hat wie Pentaho eine Business Intelligence-Plattform im Angebot. Die
Suite ist wie Pentaho modular aufgebaut: Für die verschiedenen BI-Bereiche gibt
es einzelne Werkzeuge:
• JasperETL ist verantwortlich für den ETL-Prozess und enthält Talend
Open Studio, eine auch eigenständig erhältliche Anwendung.
• JasperAnalysis ist zuständig für OLAP-Analysen. Es ist identisch mit
dem Pentaho-Modul Pentaho Analysis Services, weil es aus den
gleichen Komponenten besteht: der Mondrian Schema-Workbench,
der Mondrian Webanwendung und dem Aggregation Designer.
• JasperReports umfasst die Entwicklungsumgebung iReport, die der
Erstellung von Berichten dient.
Abbildung Abbildung Abbildung Abbildung 8888: : : : Der mDer mDer mDer modulare Aufbau der JasperSoft BIodulare Aufbau der JasperSoft BIodulare Aufbau der JasperSoft BIodulare Aufbau der JasperSoft BI----SuiteSuiteSuiteSuite
it-novum White Paper Open Source Business Intelligence November 2009
© it-novum GmbH 2009 33 Version 1.0
2.2.1.2.2.1.2.2.1.2.2.1. JasperSoft JasperSoft JasperSoft JasperSoft BIBIBIBI----PlattformPlattformPlattformPlattform
Die JasperSoft BI-Plattform basiert wie Pentaho auf einem Server. Wie bei
Pentaho handelt es sich um den Tomcat Server. Die grafische Oberfläche hat eine
Baumstruktur und ist gegliedert nach Themengebieten wie OLAP-Analysen oder
Reporting. Anders als bei Pentaho gibt es zwei verschiedene
Anmeldemöglichkeiten: als User (mit Leserechten) oder als Administrator
(Schreib- und Leserechte). Dafür existiert keine zusätzliche administration
console wie bei Pentaho.
2.2.2.2.2.2.2.2.2.2.2.2. JasperETL (TalenJasperETL (TalenJasperETL (TalenJasperETL (Talend Open Studio)d Open Studio)d Open Studio)d Open Studio)
JasperSoft setzt im ETL-Bereich das Talend Open Studio (TOS) ein. Dafür
kooperiert JasperSoft mit dem französischen Anbieter Talend, der sich auf
Datenintegration spezialisiert hat. Talend Open Studio wurde unter der GPL-
Lizenz veröffentlicht.
AufbauAufbauAufbauAufbau
Wie bei Pentaho Kettle können in JasperETL ETL-Prozesse per Drag-and-Drop auf
einer grafischen Oberfläche erstellt werden. Der Unterschied zu Kettle ist, dass
ein Codegenerator die grafisch erstellten Prozesse automatisch in Code (Java oder
Perl) umwandelt. Auch Talend hat seinen Ursprung in der Eclipse-Umgebung.
Hier können neue Jobs und die zugehörigen Komponenten angelegt und
verwaltet werden. Der Paletten-View enthält eine große Anzahl an Konnektoren,
die Verbindungen zu Datenbanken, ERP-Systemen oder zu einfachen Dateien (wie
XML- oder Excel-Dateien) aufbauen können.
NutzungNutzungNutzungNutzung
Abweichend zu Kettle umfasst der Ausdruck „Job" bei JasperETL beide Vorgänge
„Transformation“ und „Job". Bei Kettle setzt sich ein Job aus mehreren
Transformationen zusammen. Talend verbindet dagegen mehrere Jobs
miteinander und unterscheidet nicht zwischen Job und Transformation.
Der große Funktionsumfang von JasperETL erleichtert den Prozessablauf beim
ETL. Durch die vielen Konnektoren kann JasperETL mit allen wichtigen
Datenbanken eingesetzt werden. Zu SAP gibt es eine eigene Schnittstelle, den
Java-Connector SAP JCo. Bei der Ausgabe von SAP-Daten in JasperETL werden
diese allerdings durch Trennzeichen getrennt im Zielordner gespeichert. Das
muss manuell wieder rückgängig gemacht werden.
it-novum White Paper Open Source Business Intelligence November 2009
© it-novum GmbH 2009 34 Version 1.0
Erfahrungen und EinstufungenErfahrungen und EinstufungenErfahrungen und EinstufungenErfahrungen und Einstufungen
Die Talend Open Studio-Entwicklungsumgebung ist auf den ersten Blick sehr
unübersichtlich. Angesichts der vielen Elemente fühlt man sich schnell
überfordert. Die Komponenten des Paletten-Views sind im Unterschied zu Kettle
nicht nach Anwendungsbereichen, sondern funktional kategorisiert. Hier
entscheidet allein der Anwender, was ihm lieber ist. Talend Open Studio verfügt
über eine deutlich größere Anzahl an Konnektoren als Kettle. Durch den JCo-
Connector ist die Anbindung an SAP möglich, der Datenzugriff erfolgt dabei
durch BAPI-Aufrufe. Interessant für Perl-Anwender und ein
Unterscheidungsmerkmal zu Pentaho und Palo: Im Open Studio können
Codeanpassungen nicht nur in Java, sondern auch in Perl vorgenommen werden.
2.2.3.2.2.3.2.2.3.2.2.3. JasperAnalysis (Mondrian)JasperAnalysis (Mondrian)JasperAnalysis (Mondrian)JasperAnalysis (Mondrian)
JasperSoft benutzt im Bereich der OLAP-Analysen die gleichen Open Source
Software-Tools, die auch Pentaho einsetzt. Es wird die Mondrian Schema-
Workbench angeboten und weitere Produkte wie der Aggregation Designer. Da
die Funktionsweise gleich ist, wird für eine detaillierte Darstellung auf den
entsprechenden Abschnitt bei Pentaho verwiesen.
Abbildung Abbildung Abbildung Abbildung 9999: JasperETL : JasperETL : JasperETL : JasperETL ---- das Open Studio von Talenddas Open Studio von Talenddas Open Studio von Talenddas Open Studio von Talend
it-novum White Paper Open Source Business Intelligence November 2009
© it-novum GmbH 2009 35 Version 1.0
2.2.4.2.2.4.2.2.4.2.2.4. JasperReportsJasperReportsJasperReportsJasperReports
JasperReports ist wie JFreeReport eine Open Source Reporting-Bibliothek, die auf
Java basiert und unter der GNU GPL lizenziert ist. Die Anwendung entstand 2001
entworfen und wird seitdem weiterentwickelt. Berichte werden in JasperReports
mit dem speziellen Werkzeugs iReport erstellt.
2.2.4.1.2.2.4.1.2.2.4.1.2.2.4.1. iReportiReportiReportiReport
Das grafische Entwicklungstool iReport erzeugt die XML-Dateien für die Berichte.
Erstmals 2002 herausgebracht, ist iReport unter der GPL veröffentlicht.
AufbauAufbauAufbauAufbau
iReport ist in Java geschrieben und hat eine ähnliche Oberfläche wie der Pentaho
Report Designer und der kommerzielle Berichts-Designer von Microsoft. Ein
„Report Inspector” listet die einzelnen Elemente des zu erstellenden Berichts auf,
z.B. die Datenbankverbindung oder die im Bericht verwendeten Tabellen oder
Charts. Die Berichte sind wie bei Pentaho in Bereiche unterteilt: „Page Header”,
„Column Header”, „Detail”, „Column Footer” und „Page Footer”.
NutzungNutzungNutzungNutzung
Berichte werden in iReport auf der „Design”-Oberfläche erstellt. Gleichzeitig
generiert das Backend automatisch einen XML-Code. Ein Bericht wird mit Hilfe
mehrerer Prozesse kreiert: Zunächst wird eine ”.jrxml”-Datei erzeugt, der nächste
Schritt erzeugt daraus eine ”.jasper”-Datei, woraufhin eine ”.jrprint”-Datei
entsteht. Jetzt kann der Bericht z.B. als „.html”- oder ”.pdf”-Datei geöffnet
werden.
Erfahrungen und EinstufungenErfahrungen und EinstufungenErfahrungen und EinstufungenErfahrungen und Einstufungen
Das Reporting Tool iReport bietet mehr Funktionen als der Pentaho Report
Designer. Beispielsweise beinhaltet iReport einen Expression Editor, der
Variablen, Parameter, Felder und andere Elemente umfasst. Diese Elemente
ermöglichen eine flexible Gestaltung des Berichts. Außerdem hat iReport mehr
Diagramme im Angebot als der Pentaho Report Designer.
it-novum White Paper Open Source Business Intelligence November 2009
© it-novum GmbH 2009 36 Version 1.0
Der Nachteil von iReport ist, dass das Publizieren eines Berichts nicht über die
iReport-Umgebung erfolgt, sondern von der BI-Plattform von JasperSoft
hochgeladen werden muss.
2.2.5.2.2.5.2.2.5.2.2.5. JasperSoft JasperSoft JasperSoft JasperSoft BIBIBIBI Suite Professional EditionSuite Professional EditionSuite Professional EditionSuite Professional Edition
Die kostenpflichtige Version der JasperSoft BI Suite nennt sich Professional
Edition und bietet neben den Modulen der Community Version zusätzlich einen
Dashboard-Designer an. Der Designer ist eine Webanwendung und zugänglich
über den JasperServer.
Der Dashboard-Designer bietet eine Reihe von Optionen zur flexiblen Gestaltung
von Dashboards an. Beispielsweise lassen sich die einzelnen Dashboard-Fenster
sowie auch die jeweiligen Filter beliebig platzieren. Daneben ist es möglich, die
Größe der Berichte zu verändern und sie von einer Baumstruktur ausgehend per
Drag-and-Drop zu positionieren.
Erfahrungen und EinstufungenErfahrungen und EinstufungenErfahrungen und EinstufungenErfahrungen und Einstufungen
Die Professional Edition von JasperSoft wird nicht wie ihr Pentaho-Gegenstück als
Gesamtpaket angeboten. Die einzelnen Design-Tools wie der Aggregation
Abbildung Abbildung Abbildung Abbildung 10101010: Das Berichtsdesign: Das Berichtsdesign: Das Berichtsdesign: Das Berichtsdesign----Tool iReportTool iReportTool iReportTool iReport
it-novum White Paper Open Source Business Intelligence November 2009
© it-novum GmbH 2009 37 Version 1.0
Designer, das ETL-Tool oder die Schema Workbench sind nicht Bestandteil der
Plattform, sondern werden separat vermarktet. Lediglich der Report Designer
iReport und der Webserver sind von vornherein Teil des Pakets.
Die Design-Tools können entweder als Open Source-Variante oder als
kostenpflichte Professional Edition eingesetzt werden. Vorteil der Professional-
Version ist wie bei Pentaho der Dashboard-Designer, der in der freien Variante
von JasperSoft fehlt.
2.2.6.2.2.6.2.2.6.2.2.6. Fazit: JasperSoftFazit: JasperSoftFazit: JasperSoftFazit: JasperSoft
Im Gegensatz zu Pentaho ist die JasperSoft-BI-Suite nicht als Gesamtpaket
konzipiert. Trotz der vorhandenen Plattform ist deutlich, dass die einzelnen
Anwendungen für einen separaten Einsatz entwickelt wurden. Da die Tools
funktional teils sehr stark sind, empfiehlt es sich, für bestimmte BI-
Anforderungen die entsprechende JasperSoft-Anwendung und nicht die gesamte
Plattform einzusetzen.
Abbildung Abbildung Abbildung Abbildung 11111111: Der Dashboard Designer in der JasperSoft Professional Edition: Der Dashboard Designer in der JasperSoft Professional Edition: Der Dashboard Designer in der JasperSoft Professional Edition: Der Dashboard Designer in der JasperSoft Professional Edition
it-novum White Paper Open Source Business Intelligence November 2009
© it-novum GmbH 2009 38 Version 1.0
Positiv ins Auge fallen die vielen Plugins und Konnektoren für die ETL-Lösung
JasperETL/Talend. Besonders der von einem Drittanbieter vertriebene SAP-
Konnektor ist für Anwender aus dem SAP-Bereich sehr interessant. Der Konnektor
kann von Entwicklern ohne ein zusätzliches Plugin eingesetzt werden. Für nicht-
technische Anwender ist die Nutzung allerdings nicht so einfach, weil es
spezieller Modifikationen bedarf, um aus dem SAP-System Daten auslesen zu
können.
iReport und der Aggregation Designer sind vollfunktionale BI-Anwendungen.
Allerdings können die erstellten Berichte bzw. Aggregationstabellen nicht direkt
von der jeweiligen Anwendung auf der JasperSoft BI-Plattform publiziert werden.
Dazu ist ein manueller Publiziervorgang erforderlich.
Im OLAP-Bereich gibt es keinen großen Unterschied zu Pentaho, da JasperSoft
ebenfalls Mondrian einsetzt. Mit Hilfe des Drittanbieters Simba kann dabei Excel
als OLAP-Front-End verwendet werden, was dem nicht-technischen
Anwenderkreis entgegenkommt.
it-novum White Paper Open Source Business Intelligence November 2009
© it-novum GmbH 2009 39 Version 1.0
2.3.2.3.2.3.2.3. PaloPaloPaloPalo BI SuiteBI SuiteBI SuiteBI Suite
Palo ist ein Produkt der Jedox AG und wird für Einzelbereiche der Business
Intelligence wie Planung, Analyse und Berichterstellung eingesetzt. Palo arbeitet
auf Basis von M-OLAP (multidimensionales OLAP; greift auf eine
multidimensionale Datenbank zu) und hat daher den Vorteil, dass es sehr schnell
arbeitet.
Wie Pentaho und JasperSoft kann Palo als Open Source Software, die Community
Version, oder als kostenpflichtigen Enterprise Edition eingesetzt werden.
Die Palo BI Suite Community Version besteht aus den Komponenten
• Palo ETL Server
• Palo OLAP Server
• Palo Worksheet Server und
• Palo Excel Add-In
Die Enterprise Edition enthält die Community-Elementen auf und bietet
zusätzlich den Palo Supervisor Server an.
Abbildung Abbildung Abbildung Abbildung 12121212: Die Palo BI Suite: Die Palo BI Suite: Die Palo BI Suite: Die Palo BI Suite
it-novum White Paper Open Source Business Intelligence November 2009
© it-novum GmbH 2009 40 Version 1.0
BI-Prozesse werden in Palo folgendermaßen durchgeführt: Der Palo ETL Server
bereitet die Daten auf und importiert sie in Palo-Cubes. Alternativ können dafür
auch Kettle oder Talend eingesetzt werden. Nach dem erfolgreichen Import der
Daten können die Palo-Cubes analysiert werden: Entweder über ein Excel-Front-
End oder im Palo Worksheet Server.
2.3.1.2.3.1.2.3.1.2.3.1. Palo OLAP ServerPalo OLAP ServerPalo OLAP ServerPalo OLAP Server
Der Palo OLAP Server ist die Grundlage der Palo BI Suite. Auf ihn greifen die
einzelnen Anwendungen zu. Sein Aufbau basiert auf der M-OLAP-Architektur; in
der Enterprise Edition werden auch Multi-Prozessor-Architekturen unterstützt.
Die Daten werden in Form von Cubes, Dimensionen und Hierarchien gespeichert,
ihre Analyse erfolgt in Echtzeit.
2.3.2.2.3.2.2.3.2.2.3.2. Palo ETL ServerPalo ETL ServerPalo ETL ServerPalo ETL Server
Palo bietet einen speziellen ETL Server für den Datenaustauch zwischen Quell-
und Zielsystemen an. Damit ist nicht nur der Datenimport in Palo Cubes möglich,
sondern auch in die gängigsten Zielsysteme aus verschiedenen Quellsystemen.
Bei der Enterprise Edition können auch Daten aus SAP-Systemen geladen werden.
AufbauAufbauAufbauAufbau
Der Palo ETL Server ist eine Java-Anwendung und wird als Webdienst zur
Verfügung gestellt. Wie bei Kettle gibt es die Unterscheidung zwischen Jobs und
Transformationen. Diese können unter einer Baumstruktur angelegt und
definiert werden. Auch Verbindungen werden in der Baumstruktur festgelegt.
NutzungNutzungNutzungNutzung
Anders als bei den ETL-Tools Kettle und Talend stellt der Palo ETL Server keine
eigenen Konnektoren zu Fremdsystemen bereit. Eine Anbindung an andere
Datenbanken oder Dateiformate ist jedoch möglich, in der Enterprise Edition
kann zusätzlich SAP angebunden werden. Je nach Art des Quellsystems legt man
eine Extraktion fest. Beispielsweise wird die Extraktion bei relationalen
Datenbanken anhand von SQL-Statements durchgeführt. Nach dem
Extraktionsprozess wird mit Hilfe des Loading-Vorgangs die Zielquelle
angegeben. Nach Abschluss der Phasen legt man innerhalb von „Jobs“ fest, wann
das angelegte Projekt gestartet werden soll.
it-novum White Paper Open Source Business Intelligence November 2009
© it-novum GmbH 2009 41 Version 1.0
Erfahrungen und EinstufungenErfahrungen und EinstufungenErfahrungen und EinstufungenErfahrungen und Einstufungen
Der Palo ETL Server unterstützt zwar auch eine Reihe von Drittsystemen, wenn
man aber erst einmal mit ihm arbeitet, wird klar, dass er den Datenaustausch mit
Palosystemen bevorzugt. Für den Endanwender ist die Anwendung nicht ganz
einfach zu bedienen, es braucht dazu einer gewissen Einarbeitungszeit.
Palo-Cubes können nicht nur in Palo selbst, sondern auch in Talend und Kettle
erstellt werden. Dazu gibt es Konnektoren (Talend) bzw. ein eigenes Palo-Plugin
(Kettle).
2.3.3.2.3.3.2.3.3.2.3.3. Palo WorksheetPalo WorksheetPalo WorksheetPalo Worksheet----ServerServerServerServer
Der Palo Worksheet Server (Abbildung 17) basiert auf einer Webanwendung und
dient zur Generierung und Visualisierung von Berichten oder Analysen und zur
Bereitstellung von Formularen für Benutzereingaben. Daneben werden über ihn
die Benutzerrechte gesteuert.
Abbildung Abbildung Abbildung Abbildung 13131313: Der Palo ETL Server: Der Palo ETL Server: Der Palo ETL Server: Der Palo ETL Server
it-novum White Paper Open Source Business Intelligence November 2009
© it-novum GmbH 2009 42 Version 1.0
AufbauAufbauAufbauAufbau
Der Palo Worksheet-Server besitzt eine Baumstruktur, so dass die einzelnen
Module wie beispielsweise „Ressourcen“ oder „Berichtspeicher“ hierarchisch
strukturiert sind.
Zur Berichtsgenerierung stellt das Tool eine Art Excel-Umgebung über den
Browser bereit. Die Berichte werden als Ressourcen angelegt und können zur
weiteren Bearbeitung im Berichtsspeicher abgelegt werden.
NutzungNutzungNutzungNutzung
Der Palo Worksheet-Server vereinfacht die Erstellung von Reports enorm. Durch
das Anlegen von neuen Arbeitsmappen können die Daten über den Webbrowser
aufgerufen werden, um daraus Berichte zu erstellen. Positiv dabei ist, dass
Sondergrafiken, die es in Excel nicht gibt (Dashboard-Vorlagen wie Tachometer
etc.), eingebunden werden können. Der Worksheet-Server erlaubt außerdem,
Benutzerrechte für Würfel, Berichte und einzelne Zellen innerhalb von Berichten
einzurichten. So können einzelne Zellen für Eingaben freigegeben bzw. gesperrt
werden.
Abbildung Abbildung Abbildung Abbildung 14141414: Der Palo Worksheet Server: Der Palo Worksheet Server: Der Palo Worksheet Server: Der Palo Worksheet Server
it-novum White Paper Open Source Business Intelligence November 2009
© it-novum GmbH 2009 43 Version 1.0
Erfahrungen und EinstufungenErfahrungen und EinstufungenErfahrungen und EinstufungenErfahrungen und Einstufungen
Der Worksheet-Server von Palo weist zwei entscheidende Vorteile im Bereich der
Berichtgenerierung auf: Der Endanwender auf der Geschäftsseite kann mit der
gewohnten Excel-Umgebung arbeiten, die über den Webbrowser bereitgestellt
wird. Selbst, wenn er Excel nicht installiert hat, kann er die Berichte von
verschiedenen Standorten aus abrufen.
Der zweite Vorteil ist die zentrale Benutzerverwaltung. Sie macht den Worksheet-
Server für Einsatzszenarien in der Planungsebene sehr interessant. Indem
einzelne Zellen freigegeben bzw. gesperrt werden können, wird die Gefahr
falscher Einträge verhindert. So kann der Benutzer gezielt zur Bearbeitung
bestimmter Zellen aufgefordert werden, besitzt aber nicht die Möglichkeit, für
ihn gesperrte Zellen zu editieren.
it-novum White Paper Open Source Business Intelligence November 2009
© it-novum GmbH 2009 44 Version 1.0
2.3.4.2.3.4.2.3.4.2.3.4. Palo Excel AddPalo Excel AddPalo Excel AddPalo Excel Add----inininin
Das Excel Add-in von Palo (Abbildung 18) bringt im Sinne der OLAP-
Funktionalitäten und der Planung einen großen Mehrwert. Der Anwender muss
sich nicht an eine neue Anwendungsumgebung gewöhnen, sondern kann OLAP-
Analysen in Excel selbst durchführen. Das umso mehr, als dass über das Add-in
auch die grafische Berichterstellung erfolgt.
AufbauAufbauAufbauAufbau
Das Add-in gleicht vom Aussehen her exakt Excel, besitzt aber einen zusätzlichen
Menüpunkt mit dem Titel „Palo“, über den sich die Palo-Funktionalitäten
aufrufen lassen. Darüber wird auf vorher angelegte Palo-Würfel zugegriffen. Ad-
hoc-Berichte können per Drag-and-Drop erstellt werden.
NutzungNutzungNutzungNutzung
Über die Excel-Oberfläche fügt man Ansichten ein. Dadurch können Palo-Würfel
selektiert und die entsprechenden Dimensionen mit den Werten angezeigt
werden. Der Zugriff auf die Würfeldaten erfolgt über spezielle Funktionen, die
Excel mit der Datenbank verknüpfen.
Das Entwerfen von neuen Würfeln ist mit dem Add-in auf einfache Weise
möglich. Dimensionen können angelegt werden, um daraus verschiedene Würfel
zu konstruieren.
Abbildung Abbildung Abbildung Abbildung 15151515: Das Palo Excel Add: Das Palo Excel Add: Das Palo Excel Add: Das Palo Excel Add----in mit der Funktion PALO.DATAC()in mit der Funktion PALO.DATAC()in mit der Funktion PALO.DATAC()in mit der Funktion PALO.DATAC()
it-novum White Paper Open Source Business Intelligence November 2009
© it-novum GmbH 2009 45 Version 1.0
Daneben lassen sich Daten nicht nur analysieren, sondern gegebenenfalls auch
zurückschreiben. Palo eignet sich dadurch auch gut als Planungswerkzeug.
Erfahrungen und EinstufungenErfahrungen und EinstufungenErfahrungen und EinstufungenErfahrungen und Einstufungen
Anwendung findet das Palo Excel Add-in im Controlling und
Finanzplanungsbereich. Die Cube-Daten können je nach Wunsch detailliert im
Excel-Front-End angezeigt oder mit den jeweiligen OLAP-Funktionen analysiert
bzw. verändert werden. Die meisten Anwender favorisieren Excel als Front-End,
weil sich dadurch unübersichtliche Datenmengen bequem anzeigen lassen.
Großer Vorteil des Add-ins ist es, dass der Endanwender Modifikationen selbst
durchführen kann und nicht die IT-Abteilung dazu heranziehen muss.
2.3.5.2.3.5.2.3.5.2.3.5. Palo Supervision ServerPalo Supervision ServerPalo Supervision ServerPalo Supervision Server
Der Palo Supervision Server ist nur in der Palo Enterprise BI Suite enthalten und
dient als Kontrollinstanz für die einzelnen Abläufe bezüglich der Palo Datenbank.
Das betrifft beispielsweise den Prozess „Login eines Benutzers“, d.h. wann ist der
Benutzer eingeloggt, welche Änderungen hat er vorgenommen, wann hat er sich
abgemeldet. Das Tool arbeitet mit PHP Codes, die als Warnsysteme fungieren,
wenn definierte Grenzwerte über- bzw. unterschritten werden. Der Benutzer
kann in solchen Fällen per SMS oder E-Mail kontaktiert werden. Die
Anwendungsgebiete für den Einsatz des Palo Supervision Server sind Bereiche, in
denen Transparenz eine wichtige Rolle spielt, z.B. im Controlling bei der Analyse
bestimmter Kennzahlen wie Gewinn, Umsatz oder Liquidität.
2.3.6.2.3.6.2.3.6.2.3.6. Fazit: PaloFazit: PaloFazit: PaloFazit: Palo
Palo ist ein Softwarepaket zur Analyse und Planung. Die Community Version
umfasst mehrere Einzelanwendungen, die sowohl alleine als auch als
Gesamtpaket eingesetzt werden können. Verglichen mit anderen Open Source BI-
Tools besticht Palo durch die Möglichkeit, einzelne Zellen anpassen zu können.
Palo eignet sich deshalb besonders für die Festlegung von Planzahlen. Ein
weiterer Pluspunkt dabei ist, dass die Änderung von Datenwürfeln ohne die IT-
Abteilung vorgenommen werden kann.
Weitere Pluspunkte sind das Excel Add-in und der ETL-Server. Die
Datenintegration kann bei Palo über beide Tools erfolgen. Im Vergleich zu den
ETL-Werkzeugen der beiden anderen Suiten überzeugt der ETL-Server von Palo
durch die Art der Datenflussmodellierung: Der Design-Prozess läuft bei Palo über
eine selbst entwickelte Webanwendung. Allerdings wird die eigentlich schön
it-novum White Paper Open Source Business Intelligence November 2009
© it-novum GmbH 2009 46 Version 1.0
strukturiert aufgebaute Anwendung bei großen Transformationen leider ein
wenig unübersichtlich.
Der ETL-Server besticht im Vergleich zu Kettle oder Talend mit einer guten
Performance und bietet in der Enterprise Version einen Konnektor zur Integration
von SAP-Daten an.
Beide Anwendungen sind als sehr anwenderfreundlich einzustufen: Dank der
Excel-Anbindung muss der Benutzer seine vertraute Anwendungsumgebung
nicht verlassen, sondern greift einfach über Excel auf die Daten zu. Das erweitert
den Anwenderkreis von Palo, weil damit auch die Fachabteilungen ohne viel
Aufwand Analysen vornehmen können.
Ein weiterer Vorteil ist, dass Palo dem Anwender einige Berechnungen während
des Planungsprozesses erspart. Der Anwender gibt die Vorgehensweise zur
Planzahlenberechnung an, etwa die prozentuale Aufteilung der Zahlen vom
Vorjahr bezüglich der Monate. Palo listet nach derselben Anordnung die
Planzahlen auf.
In Bezug auf diese Punkte kommt also Palo dem nicht-technischen
Anwenderkreis mehr entgegen als Pentaho oder JasperSoft.
Die Enterprise Edition von Palo stellt einen Supervision Server bereit, der als
Kontrollinstanz fungiert und Aktionen wie An- und Abmelden eines Benutzers,
Verändern einer Zelle, Speichern der Datenbank oder die Gruppenzugehörigkeit
des Benutzers protokolliert. Darüber hinaus können Regeln wie das Unter- bzw.
Überschreiten von Grenzwerten definiert werden, sodass der Supervision Server
Warnungen in Form von SMS- oder E-Mail-Benachrichtigungen auslöst.
it-novum White Paper Open Source Business Intelligence November 2009
© it-novum GmbH 2009 47 Version 1.0
3.3.3.3. GesamtbetrachtungGesamtbetrachtungGesamtbetrachtungGesamtbetrachtung
Ziel des vorliegenden White Papers ist es, einen Überblick von drei Lösungen im
Open Source Business Intelligence-Bereich zu geben. In diesem Kapitel werden
die Erkenntnisse noch einmal zusammengefasst.
Alle drei der vorgestellten Open Source Produkte sind modular aufgebaut und
plattformunabhängig. Angeboten werden sie sowohl als Gesamtpakete als auch
als Einzellösungen, die allein betrieben werden können. Die kostenpflichtigen
Versionen von Pentaho, JasperSoft und Palo decken die einzelnen BI-Bereiche wie
ETL-Prozesse, OLAP-Analysen, Berichterstellung und die Zusammenfassung von
Kennzahlen in Dashboards ab. Bis auf die Dashboard-Funktionen trifft das auch
auf die Community-Alternativen zu.
Es ist möglich, die einzelnen Anwendungen untereinander zu kombinieren. Das
gibt dem Anwender größtmögliche Flexibilität bei der Lösung seines jeweiligen
BI-Problems. Hier zeigen sich klar die Vorteile der Herstellerunabhängigkeit und
offenen Standards von Open Source-Software. Beispiel: Zum Laden eines Palo-
Würfels kann entweder der Palo ETL-Server oder aber Talend bzw. Kettle
eingesetzt werden. Der frei zugängliche Quellcode der drei Lösungen kann zudem
geändert oder erweitert werden, wenn für unternehmens- oder
problemspezifische Anforderungen die vorhandenen Funktionen nicht
ausreichen. Das trifft auch auf Integrationsszenarien zu: Muss die Software an
andere Anwendungen angebunden werden, können dank des offen liegenden
Codes und der schon existierenden Konnektoren Schnittstellen erstellt werden.
Da es sich zudem um Java-basierte Lösungen handelt, lassen sich die
vorgestellten Werkzeuge um Plugins erweitern. Beispielsweise können zum
Importieren von Daten aus ERP-Systemen Programmcodes entwickelt und
implementiert werden.
Vor der Durchführung eines BI-Projektes mit Open Source sind wie bei einer
proprietären Software genaue Überlegungen nötig. Hilfreich kann dabei das Vier-
Phasen-Modell sein. Das Vier-Phasen-Modell setzt sich aus den Stufen
Konzeption, Datenarchitektur, technische Architektur und Implementierung
(jeweils mit dem Fokus auf Backend- und Frontend-Aspekte) zusammen und
bildet eine gute gedankliche Grundlage für die Umsetzung von Projekten.
Ob sich die Investition in eine BI-Suite lohnt, lässt sich anhand der Frage nach
dem Integrationsbedarf und der Unternehmensgröße beantworten. So kann es
für ein kleines Unternehmen ausreichend sein, im Bereich der BI die einzelnen
Community-Tools einzusetzen. Interessant wird der Einsatz von BI-Plattformen in
mittelständigen bis großen Firmen, weil diese Firmen aus mehreren Abteilungen
it-novum White Paper Open Source Business Intelligence November 2009
© it-novum GmbH 2009 48 Version 1.0
und hunderten von Mitarbeitern bestehen. Hier entsteht beim Einsatz einer Open
Source-Lösung, selbst in der kostenpflichtigen Enterprise Version, immer noch ein
deutlicher Kostenvorteil, der zur Anpassung und Konfiguration der Lösung
verwendet werden kann. Trotzdem sollte Open Source-Software nicht allein aus
Kostengründen eingesetzt werden. Die ausgewählte Lösung sollte zu den
jeweiligen Anforderungen passen und sie zufriedenstellend erfüllen.
Die untersuchten Open Source-Produkte sind in der Lage, die Anforderungen
typischer Anwendungsszenarien der Business Intelligence zu erfüllen. Sie stellen
bezüglich Leistungsumfang und Anwenderfreundlichkeit vollwertige BI-Produkte
dar und entscheiden sich in den wichtigsten Anwendungsbereichen nur marginal
voneinander. Die größten Unterschiede liegen im Bedienungskomfort der
einzelnen Lösungen. So ist Pentaho sicherlich das überzeugendste BI-
Komplettpaket. Sollen nur Einzelanwendungen für bestimmte BI-Bereiche
eingesetzt werden, stehen JasperSoft und Palo dem bekannteren Konkurrenten
aber in nichts nach.
Wenn bei der Einführung einer quelloffenen Business Intelligence-Lösung nicht
der Fehler gemacht wird, auf angemessene Projektunterstützung und -planung
zu verzichten, nur weil es sich um Open Source handelt, sondern die gleichen
Prioritäten, Ressourcen und die entsprechende „Management-Attention“ wie bei
einem Einsatz kommerzieller Lösungen eingesetzt werden, kann Open Source den
gleichen Gewinn bringen wie proprietäre Software.
it-novum White Paper Open Source Business Intelligence November 2009
© it-novum GmbH 2009 49 Version 1.0
Weiterführende Informationen /Links
Weiterführende White-Papers zu OpenSource allgemein oder themen- bzw.
produktspezifischen Analysen sind bei it-novum als Download oder auf Anfrage
erhältlich:
Allgemein zum Thema Open Source:
Einführung von Open Source aus der Sicht eines Anwenders: Die Top-10
Mythen und Fallstricke
Der Open Source-Diamond: Beurteilung von Open Source Lösungen
nach fünf praxis-relevanten Kriterien
Die Open Source Strategie eines Unternehmens als Teil einer
umfassenden IT-Strategie
100% Open Source – ist das möglich?
Themenspezifisch:
Modernes Open Source Dokumentenmanagement mit Alfresco:
Wegweiser vom einfachen Enterprise Content Management bis hin zu
komplexen Workflows mit jBPM und SAP-Integration
Open Source System- und Servicemanagement einfach gemacht:
Integriertes Systemmanagement und -monitoring – Geschäftsprozesse
im Fokus mit Nagios und ITCOCKIT.
Open Source BI: Vergleich der Open Source BI-Lösungen Pentaho,
Jaspersoft und Palo
Open Source CRM mit sugarCRM als nachhaltiger Beitrag zum
Vertriebserfolg: Lassen sich moderne Anforderungen wie bspw.
Abbildung von Vertriebsprozesse, Closed-Loop Marketing und
analytisches CRM einfach mit Open Source umsetzen?
SAP und Open Source – ein Widerspruch? Flexible Integration zum
Aufbau individueller und effizienter Lösungen
Aus unseren Projekten heraus ergeben sich immer neue themen-
/produktspezifische WhitePapers. Sehen Sie regelmäßig auf unserer Homepage
vorbei oder fragen Sie gezielt nach Themen, die sie interessieren unter den oben
genannten Kontaktdaten.
it-novum White Paper Open Source Business Intelligence November 2009
© it-novum GmbH 2009 50 Version 1.0
Kontaktadressen
Bei Fragen zu Business Intelligence können Sie sich gerne an business-
[email protected] wenden.
Bei Fragen zu unseren anderen Geschäftsbereichen und Dienstleistungen stehen
wir Ihnen unter folgender Adresse zur Verfügung:
it-novum GmbH
Deutschland:
Edelzeller Straße 44 • 36043 Fulda • Tel: +49 (661) 103-333
Österreich:
Mooslackengasse 17 • 1190 Wien • Tel: +43 (1) 230 60-41 50
www.it-novum.com