Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims.

25
Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims

Transcript of Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims.

Page 1: Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims.

Email Archival and Discovery

Michael PribSeminar StuPro cims

14.07.2009

cims

Page 2: Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims.

Email Archival and Discovery 14.07.2009 2cims

Agenda

• Einleitung• Email Archival and Discovery• EAD-Prototyp• Zusammenfassung• Demonstration

Page 3: Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims.

Email Archival and Discovery 14.07.2009 3cims

Einleitung

Page 4: Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims.

Email Archival and Discovery 14.07.2009 4cims

Einleitung

• Softwaregestützte Datenverwaltung- Gründe:

• riesige Datenmengen• enormer Aufwand

- Lösung: Enterprise-Content-Management (ECM)

• Anpassungsfähigkeit• Durchsatz• Sicherheit

Page 5: Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims.

Email Archival and Discovery 14.07.2009 5cims

Email Archival and Discovery (EAD)

Page 6: Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims.

Email Archival and Discovery 14.07.2009 6cims

• Mailbox-Kapazität Beschränkungen

• Information in der E-Mail

• Rechtliche Voraussetzungen

• Gerichtsbeschlüsse

Warum braucht man EAD-Systeme?

Page 7: Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims.

Email Archival and Discovery 14.07.2009 7cims

Eingliederung ein E-Mail System

Abbildung 1: E-Mail-System [2]

Page 8: Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims.

Email Archival and Discovery 14.07.2009 8cims

• Einfügen der E-Mail

• Compliance und Discovery

• Suche und Retrieval

• Löschen der E-Mails

Funktionale Anforderungen an ein EAD-System

Page 9: Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims.

Email Archival and Discovery 14.07.2009 9cims

• Zuverläsigkeit, Rechstgültigkeit, Sicherheit

• Hohe Leistung und besonders hoher Durchsatz (sehr große Datenmengen)

• Finanzielle Tragbarkeit und Rentabilität (kleine und mittlere Unternehmen)

Nicht-funktionale Anforderungen an ein EAD-System

Page 10: Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims.

Email Archival and Discovery 14.07.2009 10cims

Das EAD-Prototyp

Page 11: Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims.

Email Archival and Discovery 14.07.2009 11cims

• Entwickelt im Rahmen des CMaaS-Projekts (Content Management as a Service) in Zusammenarbeit von Uni-Stuttgart, Uni-Hamburg und IBM Deutschland Research and Development GmbH

• Serviceorientierter Ansatz

Das EAD-Prototyp

Page 12: Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims.

Email Archival and Discovery 14.07.2009 12cims

Schichtenbasierte Architektur

Abbildug 2: Prototyp-Architektur [2]

Page 13: Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims.

Email Archival and Discovery 14.07.2009 13cims

Infrastructure SoftwareHier weden die E-Mails

abgespeichert

Unveräderliche Metadaten

veränderliche Daten

Abbildung 2: Infrastructure-Software-Schicht [2]

Page 14: Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims.

Email Archival and Discovery 14.07.2009 14cims

• Indexiertes Inhalt der E-Mail (unveränderlich)– Voll-Text-Index

• Status der E-Mail (veränderlich)– Metadaten DB

• Benutzer- und Zugriffskontrolle für eine E-Mail (veränderlich)

Im Katalog abgelegte Daten

Page 15: Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims.

Email Archival and Discovery 14.07.2009 15cims

Applikationsschicht

SOAP SOAP

Eifüge-Prozess

Suche und Retrieval

Abbildung 4: Applikationsschicht [2]

Page 16: Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims.

Email Archival and Discovery 14.07.2009 16cims

• Vertikal- Vorteil: geringer

Administrations-aufwand

- Nachteil: begrenzte Skalierbarkeit (CPU Anzahl)

Horizontal- Vorteil: praktisch

unbegrenzte Skalierbarkeit

- Nachteil: großer Administrations-aufwand

Skalierarkeit

Page 17: Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims.

Email Archival and Discovery 14.07.2009 17cims

Horizontale Skalierung im Prototyp

Abbildung 6: DHT als Koordinationsschicht

Page 18: Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims.

Email Archival and Discovery 14.07.2009 18cims

Einfüge-Prozess

Abbildung 7: Einfüge-Prozess [6]

Page 19: Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims.

Email Archival and Discovery 14.07.2009 19cims

Messung

Abbildung 8: Einfüge-Prozess-Messung [6]

Page 20: Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims.

Email Archival and Discovery 14.07.2009 20cims

Verteilte Suche

Abbildung 9: Verteilte Suche

Page 21: Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims.

Email Archival and Discovery 14.07.2009 21cims

• Enterprise-Content-Management• Email Archiv and Discovery

- Sicherheit- Skalierbarkeit- Hoher Durchsatz

• Prototyp- DHT(horizontale Skalierung)- Hybrides Katalog

Zusammenfassung

Page 22: Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims.

Email Archival and Discovery 14.07.2009 22cims

Demo

Page 23: Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims.

Email Archival and Discovery 14.07.2009 23cims

• [1] Cataldo Mega, Kathleen Krebs, Frank Wagner, Norbert Ritter und Bernhard Mitschang: Content-Management-Systeme der nächsten Generation, IBM Deutschland Research & Development Universität Hamburg und Universität Stuttgart.

• [2] Frank Wagner, Kathleen Krebs, Cataldo Mega, Bernhard Mitschang, und Norbert Ritter: Email Archiving and Discovery as a Service, IBM Deutschland Research & Development Universität Hamburg und Universität Stuttgart.

• [3] Martin Russold: Erweiterung des Datenmodells für ein System zur Email Archivierung und Discovery, Abteilung Anwendersoftware, Universität Stuttgart

• [4] Alexander Moosbrugger: Evaluation of Scale-Out Characteristics of an ECM System using Overlay-Techniques to Support Dynamic Topologies , Abteilung Anwendersoftware Universität Stuttgart

Quellen (1)

Page 24: Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims.

Email Archival and Discovery 14.07.2009 24cims

• [5] IBM Deutschland Research and Development GmbH: Monitoring the EADM prototype

• [6] David Lebutsch, Alexander Moosbrugger, Frank Wagner: Enhancing Enterprise Content Management Systems for Dynamic Provisioning and Scale-out, Universität Stuttgart

• [7] Ian Sommerville: Software Engineering, Pearson Studium

Quellen (2)

Page 25: Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims.

Email Archival and Discovery 14.07.2009 25cims

Fragen?

?