IBM SPSS Text Analytics Juli 2010 Friedel Jonker
-
Upload
friedel-jonker -
Category
Documents
-
view
130 -
download
0
description
Transcript of IBM SPSS Text Analytics Juli 2010 Friedel Jonker
IBM SPSS Text Analytics (TA)
Einführung und EinsatzbeispieleFriedel Jonker, Manager Business DevelopmentAnalytics & Performance Management
Juli 2010
Important Disclaimer (1/2)
� THE INFORMATION CONTAINED IN THIS PRESENTATION IS P ROVIDED FOR INFORMATIONAL PURPOSES ONLY.
� WHILE EFFORTS WERE MADE TO VERIFY THE COMPLETENESS AND ACCURACY OF THE INFORMATION CONTAINED IN THIS PRESE NTATION, IT IS PROVIDED “AS IS”, WITHOUT WARRANTY OF ANY KIND, EXP RESS OR IMPLIED.
� IN ADDITION, THIS INFORMATION IS BASED ON IBM’S CUR RENT PRODUCT PLANS AND STRATEGY, WHICH ARE SUBJECT TO CHANGE BY IBM WITHOUT NOTICE.
� IBM SHALL NOT BE RESPONSIBLE FOR ANY DAMAGES ARISIN G OUT OF THE USE OF, OR OTHERWISE RELATED TO, THIS PRESENTAT ION OR ANY OTHER DOCUMENTATION.
� NOTHING CONTAINED IN THIS PRESENTATION IS INTENDED TO, OR SHALL HAVE THE EFFECT OF:
– CREATING ANY WARRANTY OR REPRESENTATION FROM IBM (OR ITS AFFILIATES OR ITS OR THEIR SUPPLIERS AND/OR LICENSORS); OR
– ALTERING THE TERMS AND CONDITIONS OF THE APPLICABLE LICENSE AGREEMENT GOVERNING THE USE OF IBM SOFTWARE.
© IBM Corporation 2010. All Rights Reserved.
The webinars, sessions and materials have been prep ared by IBM or the session speakers and reflect the ir own views. They are provided for informational purposes only, and are neither intended to, nor sha ll have the effect of being, legal or other guidanc e or advice to any participant. While efforts were made to verify the completeness and accuracy of the info rmation contained in this presentation, it is provi ded AS IS without warranty of any kind, express or implied. IBM shall not be responsible for any damag es arising out of the use of, or otherwise related to, this presentation or any other materials. Nothi ng contained in this presentation is intended to, nor shall have the effect of, creating any warranties o r representations from IBM or its suppliers or licen sors, or altering the terms and conditions of the applica ble license agreement governing the use of IBM soft ware.
References in this presentation to IBM products, pr ograms, or services do not imply that they will be available in all countries in which IBM operates. Product release dates and/or capabilities reference d in this presentation may change at any time at IB M’s sole discretion based on market opportunities o r other factors, and are not intended to be a commitm ent to future product or feature availability in any way. Nothing contained in these materials is intended to, nor shall have the effect of, stating or implying that any activities undertaken by you w ill result in any specific sales, revenue growth or other results.
Performance is based on measurements and projection s using standard IBM benchmarks in a controlled env ironment. The actual throughput or performance that any user will experience will vary depending upon many factors, including considerati ons such as the amount of multiprogramming in the user's job stream, the I/O configuration, the s torage configuration, and the workload processed. Therefore, no assurance can be given that an individual user will achieve results similar to tho se stated here.
All customer examples described are presented as il lustrations of how those customers have used IBM pr oducts and the results they may have achieved. Actual environmental costs and performance characte ristics may vary by customer.
The following are trademarks of the International B usiness Machines Corporation in the United States a nd/or other countries: ibm.com/legal/copytrade.shtmlAIX, CICS, CICSPlex, D ataPower, DB2, DB2 Universal Database, i5/OS, IBM, the IBM logo, IMS/ESA, Power Systems, Lotus, OMEGAMON, OS/390, Parallel Sysplex, pureXML, Ration al, Redbooks, Sametime, SMART SOA, System z , Tivol i, WebSphere, and z/OS.
A current list of IBM trademarks is available on th e Web at “Copyright and trademark information” at ib m.com/legal/copytrade.shtml.
Adobe, the Adobe logo, PostScript, and the PostScri pt logo are either registered trademarks or tradema rks of Adobe Systems Incorporated in the United States, and/or other countries.IT Infrastructure Library is a registered trademark of the Central Computer and Telecommunications Age ncy which is now part of the Office of Government CommerceJava and all Java-based trademarks are trademarks o f Sun Microsystems, Inc. in the United States, other countries, or both.Microsoft and Windows are trademarks of Microsoft C orporation in the United States, other countries, or both.ITIL is a registered trademark, and a registered co mmunity trademark of the Office of Government Comme rce, and is registered in the U.S. Patent and Trademark OfficeIntel and Pentium are trademarks or registered trad emarks of Intel Corporation or its subsidiaries in the United States and other countries.UNIX is a registered trademark of The Open Group in the United States and other countries.Linux is a registered trademark of Linus Torvalds in the United States, other countries, or both.
Important Disclaimer (2/2)
IBM Software Group, Information ManagementFriedel Jonker, Manager Business Development Analytics & PM
Career History and Education
Selected projects
� Global Pharma Information Company: German Business Value Concept to improve Sales Force Effectiveness based on eBusiness Assessment, Pain Point Analysis, Definition of Requirements and Portfolio Prioritization.
Contribution: Lead the German Business Value Concept to improve Sales Force Effectiveness.
� Global German Automotive Company: Global Concept and implementation coordination together with the Boston Consulting Group to set up IT/Data Governance and Data Modelling/Re-Engineering of an As/is Landscape with the objective to reduce costs in development and maintenance and increase and secure the Quality of Data as a base for high quality use of CRM, BI/LI for Sales & Risk Performance Management (SRPM).
Contribution: Lead the IT/Data Governance and acted as the SME for all IT/Data Governance related issues at the company.
� Global German Bank: Definition of a Business Driven Traffic Light Test Management Concept to successfully implement an Oracle/Siebel CRM & BI solution.
Contribution: Lead the Testmangement and acted as the SME for all CRM & BI related Testmanagement matters. The Testmanagement Concept is now used as a global handbook for Testmanagement.
� German, English (fluent).
� CRM, BI/LI Strategy Leader IBM GBS Germany.
� Winner of the Sales Excellence Award 2005 from the University of St. Gallen and Handelsblatt.
� Broad experience in Planning and Implementing value based CRM & BI/LI Strategy, Processes, Architecture and Systems.
� Member of the MIT, Member of the Sales Executive Councile and member of Marketing Alumni, University of Münster, Germany
Languages and Profile
University of Münster , Master of Business Management in Marketing & Statistics
19881982-
Infas , Germany, LOCAL-Direct Project manager for SRPM with Location Intelligence (LI)
19891988-
Ogilvy & Mather Dataconsult , Germany, Consultant Database Marketing
19901989-
Citicorp-Citibank AG , Germany, European Manager Marketing Database VISA
19941990-
Deutsche Leasing AG, S-Finance Group , Germany, CRM & BI Business and ProgramDirector
20081994-
IBM, Germany, Manager Business Development Analytics & PM, ManagingConsultant CRM & BI
today2008-
� Neue Informationsqualität für das VISA Kartenmanage ment der Citicorp, in: Oracle Finanzwelt, 1994
� Leadership durch Informations- und Lernsysteme, in: Know How, 7/1996, Schumann Unternehmensberatung
� Database Marketing bei der Deutschen Leasing AG, in: Jahrbuch 2000, Deutscher Direktmarketing Verband e.V.
� Von Database Marketing zum CRM, in: Computerwoche, 19/2001
� Customer Relationship Management, Bericht über das Deutsche Leasing CRM-Projekt, in: GoAhead 9/2001, CSC- Ploenzke
� CRM – die nächste Generation, Interview mit Friedel Jonker, in: Computerwoche, 33/2002
� Mit intelligentem Database Marketing und CRM zu übe rdurchschnittlichem Markterfolg, in: Cognos- Kundenmagazin
� Case Study Präsentation C3M-Eagle, marcusevans, FoCus Gipfel CRM, Montreux, 19.-21. Januar 2003
� Erfolgreiches Customer Relationship Management bei de r Deutschen Leasing AG , Nordakademie, Elmshorn, e-think-tank, Febraur 2003
� Konflikte zwischen Vertrieb und Vertrag lösen, in: Praxismagazin für Marktkommunikation der Sparkassen-Finanzgruppe, 2004, 11. Jahrgang, Nr. 5, S 38 ff
� CRM und Sales -2 Seiten einer erfolgreichen Verbind ung , im Beratungsbrief von http://www.vertriebs-experts.de , 23.03.2005
� Deutsche Leasing Gruppe: Mit Siebel/Oracle CRM-Syste m das Neugeschäft jährlich um durchschnittlich 12 Proz entgesteigert, in: Oracle Customer Snapshot Juli 2006
� CRM als strategisches Element der wertorientierte U nternehmensführung der Deutschen Leasing AG -7P Pro gramm für erfolgreiche CRM-Programme –Position_Path_Portfolio_ Program_People_Progress_Performance, marcusevans, FoCus Gipfel CRM, Montreux, 14.-16. Februar 2007
� Case Study CRM bei der DL, in Kundenmanagement –Grundlagen-Strategien-Beispiele von Manfred Krafft, März 2007
� Vom Callcenter zum Intelligent Multichannel Custom er Management Center , IBM Callcenter Circle, Hamburg HASPA, Mai 2008
� Neue Technologien schaffen eine Demokratisierung de r Information, Initiative Mittelstand http://www.imittelstand.de/themen/topthema_100288.html , 16.11.2009
� Integrierte Echtzeit Unternehmenssteuerung (IEU), IBM Partner Channel Kick Off-Berlin-Januar 2010, Salesforce.comCloudforce2-Frankfurt-März 2010, Teradata Enterprise Intelligence Summit-Berlin-April 2010, IBM Partner University-Frankfurt-April2010
� Integrated Realtime Corporate Management (IRCM), IBM Europe & Asia IT Architects University-Stuttgart-April 2010
References
References –Literature and Presentations
Agenda
1. Einführung� Das Unternehmen SPSS� Predictive Analytics und Predictive Enterprise
2. Bedarfsanalyse / Anforderungen
3. Vorstellung der Lösung
4. Zusammenfassung
Agenda
1. Einführung� Das Unternehmen SPSS� Predictive Analytics und Predictive Enterprise
2. Bedarfsanalyse / Anforderungen
3. Vorstellung der Lösung
4. Zusammenfassung
Wer ist IBM SPSS ?
� Seit 1968 fokussiert auf Predictive Analytics
� Weltweit führender Anbieter in den Bereichen Statistik, Analyse, Marktforschung und Data Mining
� Mehr als 250.000 Kunden mit ca. 3 Mio. Anwendern weltweit
� 80% der Fortune 500, 70% der Marktforschungs-unternehmen
� Über 1.200 Mitarbeiter weltweit
020406080
100120140160180200220240
1997 1999 2001 2003 20XX
40 Jahre Erfahrung in Statistik, Analyse, Marktforschung und Data Mining
IBM SPSS –The ROI Leader in Analytics
� 94% of customers achieved a positive ROI
� payback period of 10.7 months.
� 81% of projects were deployed on time
� 75% on or under budget.
“This is one of the highest ROI scores Nucleus has ever seen in its Real ROI series of research reports”
� Best marketing automation solution
� Best customer-centric solution
� Best CRQI score (Customer Think Relationship Quality Index)� Project success� Customer loyalty
� Beat E.piphany, SAS and Unica
10
Der Predictive Analytics Ansatz
Interaktionen Einstellungen
Demografie Verhalten
Kundenkontakt(in allen Kanälen)
Kumulativer ROI
Kunde
Predictive Analytics ist ein Prozess11
Capture
DataCollection
Act
DeploymentTechnologies
Predict
…Plattform
StatisticsText
MiningData
Mining
Vier Produktlinien für Mehrwert mit Predictive Analytics
12
StatisticsIBM SPSS Statistics
Data CollectionIBM SPSS Data Collection
ModelingIBM SPSS ModelerIBM SPSS Text Analytics
DeploymentIBM SPSS Collaboration & Deployment ServicesIBM SPSS Decision Management
Agenda
1. Einführung� Das Unternehmen SPSS� Predictive Analytics und Predictive Enterprise
2. Bedarfsanalyse / Anforderungen
3. Vorstellung der Lösung
4. Zusammenfassung
Die meisten Unternehmen haben einen Top-Down Ansatz für den Blick auf die vorhandenen Daten und analysieren diese. Häufig fehlt jedoch die Fähigkeit gewonnene Kenntnisse und Resultate der Analyse effektiv umzusetzen.
Gareth Herschel, Gartner Inc.
The Knowledge and Execution Gap
Gartner Group:Die “Prediktive (d.h. vorausschauende) Analyse”generiert aus Daten operative Aktionen, indem verlässliche Schlüsse zur aktuellen Situation und zukünftigen Ereignissen erkannt bzw. prognostiziert werden.
Die Sicht der Analysten zurPrediktiven Analyse
Operative
Systeme
Operative
Systeme
ERPERP
ERMERM
WebWeb
CRMCRM
BASISBASISBASISBASISBASISBASISBASISBASIS�� Interaktion mit KundenInteraktion mit KundenInteraktion mit KundenInteraktion mit KundenInteraktion mit KundenInteraktion mit KundenInteraktion mit KundenInteraktion mit Kunden�� WarenwirtschaftWarenwirtschaftWarenwirtschaftWarenwirtschaftWarenwirtschaftWarenwirtschaftWarenwirtschaftWarenwirtschaft�� Supply Chain ManagementSupply Chain ManagementSupply Chain ManagementSupply Chain ManagementSupply Chain ManagementSupply Chain ManagementSupply Chain ManagementSupply Chain Management�� QualitQualitQualitQualitQualitQualitQualitQualitäääääääätstststststststs--------KontrolleKontrolleKontrolleKontrolleKontrolleKontrolleKontrolleKontrolle�� FIBUFIBUFIBUFIBUFIBUFIBUFIBUFIBU
WebWeb
Business
Intelligence
Business
Intelligence
OLAPOLAPOLAPOLAPOLAPOLAPOLAPOLAP
ETLETLETLETLETLETLETLETL
DatenqualitDatenqualitDatenqualitDatenqualitäääättttDatenqualitDatenqualitDatenqualitDatenqualitäääättttQueryQueryQueryQuery/
ReportingReportingReportingReportingQueryQueryQueryQuery/
ReportingReportingReportingReporting DataDataDataDataWarehouseWarehouseWarehouseWarehouse
DataDataDataDataWarehouseWarehouseWarehouseWarehouse
STANDARD REPORTINGSTANDARD REPORTINGSTANDARD REPORTINGSTANDARD REPORTINGSTANDARD REPORTINGSTANDARD REPORTINGSTANDARD REPORTINGSTANDARD REPORTING-- VergangenheitVergangenheitVergangenheitVergangenheitVergangenheitVergangenheitVergangenheitVergangenheit-- VorstrukturiertVorstrukturiertVorstrukturiertVorstrukturiertVorstrukturiertVorstrukturiertVorstrukturiertVorstrukturiert-- Sehen was warSehen was warSehen was warSehen was warSehen was warSehen was warSehen was warSehen was war……………………
Analyse und
Vorhersage
Analyse und
VorhersageEmpfehlungenEmpfehlungen
ScoringScoringScoringScoringScoringScoringScoringScoring
DataDataDataDataMiningMiningMiningMiningDataDataDataDataMiningMiningMiningMining
OPTIMIERT pro aktiv:OPTIMIERT pro aktiv:OPTIMIERT pro aktiv:OPTIMIERT pro aktiv:OPTIMIERT pro aktiv:OPTIMIERT pro aktiv:OPTIMIERT pro aktiv:OPTIMIERT pro aktiv:Warum ist es passiert und Warum ist es passiert und Warum ist es passiert und Warum ist es passiert und Warum ist es passiert und Warum ist es passiert und Warum ist es passiert und Warum ist es passiert und wie kann ich eingreifenwie kann ich eingreifenwie kann ich eingreifenwie kann ich eingreifenwie kann ich eingreifenwie kann ich eingreifenwie kann ich eingreifenwie kann ich eingreifen�� KundenbindungKundenbindungKundenbindungKundenbindungKundenbindungKundenbindungKundenbindungKundenbindung�� ProduktmixProduktmixProduktmixProduktmixProduktmixProduktmixProduktmixProduktmix�� DirektmarketingDirektmarketingDirektmarketingDirektmarketingDirektmarketingDirektmarketingDirektmarketingDirektmarketing�� QualitQualitQualitQualitQualitQualitQualitQualitäääääääätsverbesserungtsverbesserungtsverbesserungtsverbesserungtsverbesserungtsverbesserungtsverbesserungtsverbesserung�� PersonalbindungPersonalbindungPersonalbindungPersonalbindungPersonalbindungPersonalbindungPersonalbindungPersonalbindung
Der Analysekreislauf und IBM´s Software
081500004711
13Kennedystr.Hamburg2258JBerg31Kennedystr.Hamburg22587BergPetra
Kennedy 13Hamburg22587BerkPeter
Verstehen
Kardinalität, Frequenz, Abhängigkeiten (Cross)
Parallel Verbindung Metadaten Admin Deployment
Analysieren der Quelldaten
Analysieren, Verstehen und Reports
Quellen-übergreifend
?
Liefern4711 4 925 528-01.07.2010
Transparenter Zugriff
Echtzeit-Daten
4711 13Kennedystr.Hamburg22587BergPetra320 985
Aktuellste Daten
Echtzeitzugriff durch Föderation
Konsistente Daten durch Replikation
4711 13Kennedystr.Hamburg22587BergPeter
Verbesserung der Qualität
Fehlende Informationsstandards
Fehlende Daten / DuplikateDuplikate, Referenz
Match, SelektionBereinigen
Verstehen LiefernPlattform
Bereinigen Transformieren
Transformieren
Joins, Aggregation,
Geschäfts-Regeln
4711 13Kennedystr.Hamburg22587BergPetra5 246 486
Extraktion, Transformation, LadenDaten GeschäftsinformationenVordefiniert, wiederverwendbar
0815
4711
5 228 76915.09.2007
13 34213.01.20084711 4 37521.12.2007
IBM InfoSphere Information ServerDatenfluss von Kundendaten
Operative Prozesse
Verhaltensdaten- Aufträge / Käufe- Transaktionen- Zahlungsverhalten- Nutzungsverhalten
Beschreibende Daten- Attribute- Charakteristik- selbsterklärende Informationen- (Geo)demographisch
Daten zur Einstellung- Meinungen- Präferenzen- Bedürfnisse- Wünsche
Interaktionsdaten- Angebote- Anrufe- Bemerkungen- Click streams- Anfragen
Prediktives Unternehmen:Kundeninformationen im Fokus
Daten-quellen des Unterneh-mens
Unternehmensplattform fürdie Prediktive Analyse
Operative Abläufe
Datenquellen des Unternehmens
Produkt& Markt
Finanzen &Risiko
Tätigkeiten
CRM
Kunden-dienst
Unternehmensplattform für d. Prediktive Analyse
Web-daten
Produkt-daten
Transakt-ionsdaten
Marketing-daten
Kunden-daten
VerstehenEinblick in die aktuelle Unternehmensleistung anbieten
� Was ist in der Vergangenheitgeschehen?
� Was geschieht momentan?
1
VorhersagenVerhalten in der Vergangenheit analysieren, um zukünftige Events vorherzusagen
� Was wird passieren?
2
AgierenOperative Prozesse überwachen und Maßnahmen vorschlagen
� Welche Maßnahme bietet dasbeste Ergebnis?
3
“Einblick in die Effektivität von Marketingkampagnen”
“Management Cockpit:Indikatoren für die Schlüsselleistung”
“Visualisierung von komplexen Beziehungen”
Verstehen
Vorhersagen
“Entdecken neuer Risikoprofile”
“Modellierung des Kampagnenresponses und Auswahl der affinsten Segmente”
“Automatische Erkennung neuer Zielgruppen und Vorhersage ihres potenziellen Wertes”
“Einsatz von Clusterverfahren zur Kundensegmentierung und zur Erstellung von speziellen Angeboten für wenig loyale Kundengruppen”
Echtzeitempfehlungenüber Call Center
Kampagnenübergreifende Planung und Optimierung
Agieren
Optimierung der
Entscheidung
Optimierung des Direct Marketing, um die Resonanz und den Profit zu maximieren
Real-time Identifikation von suspekten Transaktionen
Risiko-Scoring, um Fälle für die Recherche zu bestimmen
Bewertung der Risiken zum Zeitpunkt der Dateneingabe
PersonalisierteAngebote via Website
Spektrum der Lösungen von SPSS
Befragungen
Echtzeit-Empfehlungen
Text AnalyticsData Mining
Web Mining VorhersagenKampagnen-
Optimierungen
Datengewinnung Optimierung der Abläufe
SPSS Enterprise-Plattform für die Prediktive Analyse
SPSS BaseStatistik Server
SPSS Text Analytics – Inf. Mining PlattformText Analytics – Web Mining
SPSSDimensions
Befragungs-lösung
-EnterpriseFeedback
Management
Customer Touch Points
SPSS Unternehmensplattform für die Prediktive Analyse
DataWarehouse
OLAP, BI
Markt-forschungs-
daten
MarketingDatenbank
Interaktions-daten
Web-daten
Call CenterDatenbank
MonitoringReporting
SPSS Predictive Enterprise Services – Modellverwaltung, Security, Automatisierung
CustomApplications
IndividuelleUmsetzung
SPSSEvent Builder
ÜbergreifendeKampagnenoptimierung
SPSSInteraction Builder
Echtzeit Scoring fürWeb und Call Center
SPSSRisc Control BuilderEchtzeit Betrugserkennung
für Versicherungen
SPSSSHOWCASE(i5 – AS/400)
Partner(NT, Unix)
Agenda
1. Einführung� Predictive Analytics und Predictive Enterprise � Das Unternehmen SPSS
2. Bedarfsanalyse / Anforderungen
3. Vorstellung der Lösung
4. Zusammenfassung
USP‘s „in a Nutshell“
� Zugriff auf alle Textformate
� Text Analytics� � enge Integration mit klassischem Data Mining� � Clementine-/Predictive Analytics – Deployment
(Echtzeit)
� Text Analytics: Schnell, standardisiert, flexibel anpassbar
� Intuitive grafische Bedienung und Darstellung, z.B. Web-Diagramme, Overlay-Diagramme, Tabellen
Was ist Text Analytics?
� Über 80% aller Daten, mit denen Unternehmen und Organisationen täglich zu tun haben, sind unstrukturierte Textdaten:� E-mails, � Call Center logs,� Reports, Fachartikel� Webseiten, Blogs, uvm.
� Text Analytics bedeutet, effizient strategisch nutzbares Wissen aus unstrukturierten Daten zu generieren � Identifikation zentraler Themen und Konzepte� Verfolgen von Diskussionen und Trends
Eine kurze Geschichte des linguistisch basierten Text Analytics
1970 1980 1990
« Bag of Words »-Extraktion
cstmrcustomer
Yellowinc
happynot
SwitchCell
phone
Extraktion von zusammenhängenden
Ausdrücken (Expressions
extraction)
cstmrcustomerYellow inc
switchCell phoneNot happy
Extraktion von « typisierten »
Begriffen(« Named Entities
extraction »)
customer -> CRM termCstmr?
Yellow inc -> Telco Company (not the color)Cell Phone -> Telco term
Not Happy switch
Nov 18th-> Date
Extraktion von Zusammenhängen
(« Events/SentimentExtraction »)
Nov 18thCustomer (cstmr) -> cell phone -> unhappy (Negative)
Switch to (Negative Predicate) -> yellow inc(Competition)
Kombinationmit strukturierten
Daten
Decision makingChurner
-> special offer
Freitext-Protokoll eines Kundenanrufs: “Customer not h appy with his cell phone, customer wants to switch to Yellow inc”
JETZT!!
Warum wird Text Analytics immer wichtiger
� “…Text mining will revolutionize customer service strategies within customer relationship management by 2008…”
� “…Text categorization software will not succeed as a stand-alone offering but will instead be embedded in portals, larger applications (email response) and data mining suites .”
Gartner Group
Text Analytics in the Predictive Enterprise� Text Analytics is a key component to capture any
kind of unstructured data to leverage Customer Insight and Predictive Applications
Behavioral data- Orders- Transactions- Payment history- Usage history
Descriptive data- Attributes- Characteristics- Self-declared info- (Geo)demographics
Attitudinal data- Opinions- Preferences- Needs- Desires
Interaction data- Offers- Results- Context- Click streams- Notes
Web data10 – 20%
improvement
Web data10 – 20%
improvement
Text data20 – 40%
improvement
Text data20 – 40%
improvement
Attitudes10 – 30%
improvement
Attitudes10 – 30%
improvement
Wer setzt Text Analytics ein?
TelcoTelco /ISP/ISP FBIFBI AutomotiveAutomotive
RetailRetail
Wer setzt Text Analytics ein?
MediaMedia Pharma./Life SciencesPharma./Life Sciences Public/Public/ GovernmentGovernment AgenciesAgencies
Einsatzbereiche
� Customer Relationship Management� “Voice of the customer”:
Wie äußern sich die Kunden?� Analyse von Einstellungen,
Wünschen, Meinungen zur besseren Betreuung
� Marktforschung und Befragungen� Analyse offener Fragen� Effizientes Auswerten von
Interviews
� Market Intelligence / Wettbewerberanalyse� Trends antizipieren� Wettbewerberverhalten
antizipieren
� Qualitätsmanagement� Frühzeitiges Erkennen von Fehlerquellen� Optimieren von Prozessketten
� Sicherheitsbehörden und Verwaltung� Bedrohungen schneller erkennen� Analyse von Einstellungen zu Behörden� Optimierung der Bürger-/
Klienteninteraktion
� Betrugserkennung� Auffälliges Verhalten schneller entdecken� Präziser Motive und mögliche
Betrugsindikatoren entdecken
� Wissenschaft� Genomforschung� Medikamentenentwicklung� Medizinische Forschung und
Patentrecherche
Customer Relationship Management
Telekommunikations-BrancheCustomer Retention Kampagne
Hintergrund
� Mobilfunkanbieter� 43,8 Mio. Kunden
Geschäftsziel
� Senken der Abwanderungsrate profitabler Kunden
� Motive der Kunden verstehen� Markttrends antizipieren
Lösung
� Kombination aus Text Analytics und Data Mining
� Bessere Prognose- und Klassifikationsmodelle
Ergebnis
� Prognosen um 15% verbessert
� Verbesserte Früherkennung von abwanderungswilligen Kunden
� Einsparungen von mehreren hunderttausend Dollar pro Jahr durch zielgerichtete Ansprache der richtigen Kunden zum richtigen Zeitpunkt mit den richtigen Angeboten
Die Verbesserung der Vorhersagen durch Text Analytics – wie geht das?
Strukturierte Kundenmerkmale und Transaktionsdaten: welche Kunden kündigen
Unstrukturierte Daten (Freitexte): warum kündigt ein Kunde?
&
Zugriffsmöglichkeiten mit Text Analytics
� SPSS Text Analytics versetzt Sie in die Lage, Texte aller Art aus� Internet� Dateiverzeichnissen� Befragungen� Datenbanken� .csv / Tabellenkalkulation uvm.
� speziell auf Ihre Bedürfnisse abgestimmt auszuwerten
� mit anderen (z.B. strukturierten) Daten zu verbinden
� => 3600-Sicht!
Zentrale Aufgabe: Verbinden der Informationen
Freitextkommentare
Linguistisch basiertes Text Analytics:
1. Sprache und Strukturen bestimmen
2. Konzepte identifizieren3. Konzepttyp, Häufigkeiten
und Muster analysieren
Integrierte Analyse strukturierter und unstrukturierter Daten
Leichtes Ergänzen und Verwalten von Synonymen, Schreibvarianten und Abkürzungen
Beispiel zum Anreichern von Kundendaten: hat sich ein Kunde entsprechend geäußert – oder nicht!
CHURNTechnical Support
New Phone ASAP
New Phone
Nearest Store Location
Minute Charges Manager ASAP
Help Learning
Handset
Customer Care
Change Rate
Welche Themen hängen mit bestimmtenKategorien zusammen?
Stärkere Linien = Stärkere Assoziationen
Het is voor U voordeliger om een sms voorraad 50 aan te slui ten.
JohnsonChurchilllaan 221022 AMAmsterdam53463788
0622147763
0622147763
Cross-Selling Vorschlag
Kündigungsrisiko
Kundenwertindikator
Vodafone -Mehrumsatz durch optimierte Echtzeit Handlungsempfehlungen am Point of Sale
Merck Sharpe & DohmeÄrztekommentare und Patienten-Feedback
Hintergrund
� Deutsches Pharmaunternehmen, gegründet1891; 22,9 Mill. USD Umsatz (2004)
� Schwerpunkte der Anwendungen: AIDS, Asthma, CNS (ZentralesNervensysstem), Osteoporose und Herzmittel
Geschäftsziel
� Effektivere Marketingkampagnen durchgezielte Ansprache von Ärzten
Lösung
� Clementine und Text Analytics für Clementine ermöglichen ein besseres Verständnis und leichte Integration verschiedenerInformationskanäle (Umfragen, Datenbankenim Bereich Vorsorge uvm.)
� Ärzte und Personal können u.a. anhand ihresFeedbacks noch präziser bestimmten Profilenzugeordnet werden
Resultat
� Bestimmung typischer Sprachmuster, die in Zusammenhang mit Verordnungsverhalten bestehen
� Präzisere Kundenprofil-bildung und Segmentierung
� Verbesserung derKommunikation und des Informationsaustauschs imwissenschaftlichen Bereich
Text Analytics in derMarktforschung
ArsoaMarktanforderungen besser verstehen
Hintergrund
� Hersteller von Naturkosmetik und Health Food
� Gegründet 1972, ca. 800.000 Kunden in Japan
� Vertrieb über 28.000 B-to-B Sales Representatives
Geschäftsziel
� Unterstützung der Produktentwicklung� Entwicklung eines Loyalty-Programms
Lösung
� Text Analytics zur Analyse projektüber-greifender Studienergebnisse, Experten-Interviews, Produkttests, Erfolg von Testprodukten, Kundendatenbanken uvm.
Ergebnisse
� Identifikation von Unterschieden zwischen neuen und existierenden Kunden, Entwicklung eines Loyalty-Programms
� Nutzen des Feedbacks von Produkttestern, um Produktentwicklung und Gestaltung von Labels und Beipackzetteln zu verbessern
� Gesteigerte Marktpräsenz
Marktforschung: Die wichtige Rolle offener Fragen
� Direkte „Voice of the Customer“
� Wichtige Antwortalternativen erfassen
� Vermeiden von Bias und verzerrtenErgebnissen
� Validitätskontrolle, u.a.:� Verstehen die Befragten die Zusammenhänge
richtig?� Gibt es weitere wichtige Aspekte?
Offene Antworten: Die Herausforderung des Kodierens
Reduktionvon Komplexität
Einschränkungdurch vordefinierte Code-
Schemata
Kostet Zeit und Geld
Der semi-manuelle Kodierungsprozess:
Schnelle , NLP-gestützte
Erfassung zentraler Themen
Flexible und dabei leicht standardi-
sierbare Kategorie-Schemata
Interkodierer-Reliabilität durch
konsistente Extraktionsraster
Leicht auf neue und verwandte Projekte
übertragbar
Text Analytics ermöglicht:
Text Analytics for Market Intelligence
Analyse externer Informationsquellen:Nutzen des Web 2.0 (Internetforen, Newsgroups uvm.)
Auswirkungen negativer Statements
Auswirkungen positiver Statements
News Watch / Supervision von Webforen
� Tausende von Informationen, die täglich von Newsfeeds, Blog, Internetforen geliefert werden
� Darin « manuell » strategisch wichtige Themen zu entdeckenist sehr zeitaufwändig und erfordert viel geschulteRessourcen
� SPSS bietet Ihnen hierfür die « Finde-Maschine » um schnel lzu erkennen, welche Themen für Sie interessant sind� Welche Fragen werden gerade diskutiert?� Lassen sich Trends erkennen?� Wie kommunizieren die relevanten Akteure miteinander? � Gibt es Schlüsselfiguren und Meinungsbildner – wer sind
diese?� Dadurch erhalten Sie die Möglichkeit, rechtzeitig auf
Gerüchte, Stimmungen, Trends zu reagieren!
Blog- und Foren-Analyse Beispiel: Anderson Analytics
Eine Hotelkette ließ untersuchen, welche Ausstattungs-merkmale besonders häufig bei zufriedenen Kunden gelobt wurden – und welche von unzufriedenen Kunden kritisiert wurden!
Blog- und Foren-AnalyseAnderson Analytics
So ließ sich zeigen, dass über Probleme mit der Schließanlage berichtet wurde.
Diese wiederum wurden verursacht durch System-Wartung gegen Ende des Monats.
=> Ansatzpunkt für Gegenmaßnahmen!
Blog- und Foren-AnalyseAnderson Analytics
Verbesserte Kundensegmentierung:
• Loyale Kunden betonen positive Aspekte
• Wechselfreudige Kunden diskutieren verstärkt Sonderangebote
Beispiel zur Web Foren-Analyse (1)
� Führender Bekleidungs-hersteller analysiert Web-Foren für Jugendliche
� Vorteil von Text Analytics: es kann leicht durch den Anwender bezüglichspezieller Jargons undFachsprachen trainiertwerden
� « Nick names », Umschreibungen u.ä. können unter offiziellenBrandnames und eigenenstrategischen Kategorienzusammengefasst werden
Beispiel zur Web Foren-Analyse (2)
� “Gothic Style” alsHauptthema
� zwei signifikanteAusschläge imMai und September
GerGerüüchte und Trends in Newsgroups chte und Trends in Newsgroups und Internetforen frund Internetforen fr üühzeitig erkennenhzeitig erkennen
Identification of patent infringements by mining newsfeeds
Agenda
1. Einführung� Predictive Analytics und Predictive Enterprise � Das Unternehmen SPSS
2. Bedarfsanalyse / Anforderungen
3. Vorstellung der Lösung
� Zusammenfassung
Der Mehrwert von SPSS Text Analytics-Lösungen� Designed für alle Arten von Text
� Meinungsforschung (Surveys), Webseiten, Newsgroups und Blogs, Manuals, technische Dokumentationen, Patente; Wettbewerberanalyse
� Informationen aller Art, die in Textform vorliegt!
� Skalierbar vom Einzelplatz zum unternehmensweiten Einsatz
� Viele Sprachen� Englisch, Französisch, Japanisch, Spanisch, Deutsch, Holländisch, Italiensisch, Portugiesisch; � Direkte Schnittstelle zu Language Weaver für u.a. Arabisch, Chinesisch, Persisch
� Teil der SPSS Plattform� Direkte Schnittstellen zur Integration weiterer Datenquellen� Schnittstellen und Exportmöglichkeiten für den variablen Einsatz in vielen Bereichen� Erfolgreicher Einsatz in weltweit über 1300 Unternehmen und Organisationen
� Interessen des Fachanwenders im Vordergrund� Training der Extraktions- und Suchfunktionen nach eigenen Interessen und Vorgaben (z.B. Orte,
Namen, Produkte, Themen)� Analyseraster nach eigenen Schwerpunkten bestimmen und leicht modifizieren können� Keine Linguisten und wenig IT nötig!
� Besser und schneller als „nur Lesen“!� Computer haben keine selektive Wahrnehmung, er arbeitet schnell und streng nach den vorgebenen
Rastern und Strategien,� und wird niemals müde!
SPSS Predictive Text Analytics:Beispiele für Benefits
� 3600-Sicht auf die Kundenbeziehung� Schnelle Analyse von Kommentaren, Meinungsdaten uvm.� Leichte Verbindung mit Stammdaten und Transaktionsdaten
� Was wird im Internet diskutiert? Welche Themen sind in Online-Communities gerade wichtig?
� Was spielt sich auf den Webseiten anderer Unternehmen, Organisationen und Wettbewerber ab?
� SPSS Textanalyse:� Sofort sehen, was steckt in Newsgroups, offenen Antworten und
sonstigen Texten aller Art!„What (and who) is „hot“ – and what‘s not!
Einige zufriedene Nutzer von SPSS Text Analytics-Lösungen
“The combination of the Computer Forensics Architecture together with Textmining has significant advantages:
• Finding missed conclusions• Speeding up cases
Cases grow bigger and bigger, so better and faster insights in seized data isessential“ Jochen van der Wal
Dutch National Police Agency
“We know, thanks to SPSS text mining, which properties of and information about our drugs are particularly well understood in conversations with the doctors, and in which instances the terms used for our marketing campaigns still need to be refined”
Werner Kreiter, Data Mining SpecialistMerck Sharp & Dohme
“…We selected this solution because of its cost, the openness of the software, itsease of use and implementation, and the responsiveness of the vendor”
Pierre-Yves Thomas, ManagerDe Boeck/DBIT
Search
NA
*
NABPM
NACollaboration
NANABusiness Applications
NAPortal
NAApplication Server
Content Analytics
NABAM
Modeling/Metadata/MDM
NAContent Management
Database/Data Warehouse
Data Integration
NAPackaged Analytic Apps
NACPM Suites
BI Platform
*Predictive AnalyticsPredictive Analytics
= Strong Negative
= Caution
= OK or Promising
= Positive
= Strong Positive
Source: Gartner Mega Vendor Comparison, Feb 2009 + IBM Analysis
IBM SPSS –Der Leader in Analytics
* Relies on 3 rd party; OEM SPSS components
Auswahl internationaler Kunden
IBM SPSS Customer Success Stories
Grow and Retain
“The power and ease of use of PASW Statistics enables the AMR Consumer Research department to perform more research than ever before and deliver timely reports while maintaining a small, dedicated staff.”
Grow
“With SPSS, HSBC Bank USA effectively mines an ever-growing file of customer data, creating predictive models to uncover cross-selling and “roll over”sales opportunities.”
Attract, Grow and Retain
“SPSS solutions add intelligence to our business ensuring efficiencies in pricing, marketing and reporting –something no company can afford to ignore in today’s business environment”Hong Juan Liu, R&D AnalystPremierline Direct
“...Blend the Cognos portfolio with IBM's data integration, data quality, data warehouse,
content management, text mining & other offerings, & there's no more extensive information
management portfolio available, period…”
2008 Editor’s Choice AwardsIntelligent Enterprise Magazine
Leading Capabilities…
© Copyright IBM Corporation 2010 All rights reserve d. The information contained in these materials is provided for informational purposes only, and is provided AS IS without warrantyof any kind, express or implied. IBM shall not be responsible for any damages arising out of the use of, or otherwise related to, these materials. Nothing contained in these materials is intended to, nor shall have the effect of, creating any warranties or representations from IBM or its suppliers or licensors, or altering the terms and conditions of the applicable license agreement governing the use of IBM software. References in these materials to IBM products, programs, or services do not imply that they will be available in all countries in which IBM operates. Product release dates and/or capabilities referenced in these materials may change at any time at IBM’s sole discretion based on market opportunities or other factors, and are not intended to be a commitment to future product or feature availability in any way. IBM, the IBM logo, Cognos, the Cognos logo, and other IBM products and services are trademarks of the International Business Machines Corporation, in the United States, other countries or both. Other company, product, or service names may be trademarks or service marks of others.
Questions?
??
?
Contact Details
Friedel JonkerDipl.-KaufmannManager Business Dev. Analytics & PMIBM Software GroupInformation Management
Wilhelm-Fay-Strasse 30-34D-65936 Frankfurt
Phone (+49)-69-6645-1227Fax (+49)-69-6645-5640Mobile (+49)[email protected]
More information from IBM and me. Look at Xing, Linkedin, Youtube, Twitter, Scribd, Slideshare and Lotus Greenhouse.
Join my Networks as Thomas H. Davenport, J. Ross (MIT),Daniel Pink, Charles Savage, David Croslin and other leadingThinkers and Practitioners have already done it !