Bachelorarbeit zum Thema:
Chancen und Risiken von Voice User Interfaces im Marketing
und im User Engagement
in Zusammenarbeit mit Kolle Rebbe
zur Erlangung des Grades Bachelor of Arts
Fakultät Verkehr-Sport-Tourismus-Medien
vorgelegt von: Luca-Maxim Meinhardt
Matrikelnummer: 70455375
Studiengang: Mediendesign
Abgabe: 17. Oktober 2018
Erstprüferin: Professor Jutta Tränkle
Zweitprüfer: Christian Rentschler
Inhalt
Abkürzungsverzeichnis ........................................................................................................................... 8
1. Einleitung .................................................................................................................................... 10
TEIL I – GRUNDLAGEN
2. Die verbale Kommunikation – mehr als Worte ....................................................................... 14
3. Definitionen ................................................................................................................................. 18
3.1. Sprachassistent .......................................................................................................................18
3.2. Voice User Interfaces ..............................................................................................................19
3.3. User Engagement ....................................................................................................................20
4. Historie der sprachbasierten Anwendungen ............................................................................ 22
5. Technischer Hintergrund ........................................................................................................... 28
5.1. Automated Speech Recognition .............................................................................................28
5.2. Natural Language Processing .................................................................................................30
TEIL II – POTENZIALE
6. SWOT-Analyse: Voice User Interfaces ..................................................................................... 34
6.1. Stärken (Strength) ...................................................................................................................34
6.2. Schwächen (Weakness) ..........................................................................................................36
6.3. Risiken (Threats) ....................................................................................................................37
6.4. Chancen (Opportunity) ...........................................................................................................40
7. Zielgruppenanalyse von Sprachassistenten ............................................................................. 44
8. Potenziale für Marken und Unternehmen ............................................................................... 48
9. Voice Search ................................................................................................................................ 52
9.1. Suchmaschinenoptimierung ....................................................................................................53
TEIL III – KONZEPTION
10. KonzeptionelleVorüberlegungenfüreineeffektiveSprachanwendung ............................... 60
10.1. DefinitionderBusinessziele ...................................................................................................61
10.2. Nutzer- und Nutzungsverständnis ...........................................................................................62
10.2.1. Nutzer ............................................................................................................................62
10.2.2. Nutzung .........................................................................................................................63
10.3. Inhalt der Anwendung ............................................................................................................64
11. Reduzierung des kognitiven Aufwands ................................................................................... 66
11.1. Konsistenter Aufbau ...............................................................................................................66
11.2. Aufbereitung der Informationen .............................................................................................68
12. Use Cases für Sprachanwendungen im Marketing ................................................................. 72
TEIL IV – UMFRAGE
13. Umfrage bei Kolle Rebbe ........................................................................................................... 78
13.1. Allgemeine Angaben der Teilnehmer .....................................................................................78
13.2. Sprachassistenten ...................................................................................................................82
13.3. Sprachbasierte Geräte .............................................................................................................84
13.4. Altersgruppen .........................................................................................................................86
13.5. Nutzungsort ............................................................................................................................87
13.6. Potenzial im Marketing ..........................................................................................................88
13.7. Zusammenfassung der Umfrage .............................................................................................89
14. Fazit ............................................................................................................................................. 92
Literaturverzeichnis .............................................................................................................................. 94
Anhang ................................................................................................................................................. 102
8
Abkürzungsverzeichnis
BfDI – Die Bundesbeauftragte für den Datenschutz und die Informationsfreiheit
HhnE – Haushaltsnettoeinkommen
IVR – Interactive Voice Response
KI – Künstliche Intelligenz
NLG – Natural Language Generation
NLP – Natural Language Processing
SEO – Search Engine Optimization
TTS – Text-To-Speech
VUI – Voice User Interface
10 11Einleitung
1. Einleitung
EinflimmerndesrotesLichthintereinergewölbtenGlasscheibe.
DieComputerintelligenzhatdieabsoluteKontrolleüberalleFunktionendesRaumschiffes.
Er ist allwissend und macht nie einen Fehler.
ObderSupercomputer eigeneGefühle empfindenkann, könnenExpertennichtmitSicherheit sagen.
DochimLaufederZeitwendetsichHAL9000gegendieMenschen,dieihngebauthaben.Erentwi-
ckelteineeigenePersönlichkeit,dieletztendlichvierBesatzungsmitgliederumbringt.Nurmitgrößten
Anstrengungen kann Dave Bowman die künstliche Intelligenz abschalten und sein eigenes Leben retten.1
So stellte sich Stanley Kubrick 1968 in seinem Film »2001: Odyssey im Weltraum« die Zukunft vor.
IneinerSzenewerdendieAstronautenvoneinemFernsehmoderatorgefragtwieessei,mitderComputer-
intelligenz HAL 9000 zusammenzuarbeiten.
»Man gewöhnt sich schnell an die Tatsache, dass er sprechen kann. Und bald redet man
mit ihm genauso, wie mit einem Menschen.« 2
LangebevorSprachassistentenwieAlexa,GoogleAssistantundSiriunsereHandysundWohnzimmer
bevölkerthaben, sahKubrickbereitsdasPotenzialunddieGefahrendieser sprechenden,künstlichen
Intelligenzen. In dieser Bachelorarbeit werde ich seine Diskussion fortführen und mich mit den Chancen
und Risiken von Sprachassistenten im Marketing beschäftigen.
1 Vgl.StanleyKubrick:2001:OdysseeimWeltraum.2001:ASpaceOdyssey.1968
2 Ebd.
DieRelevanzdesThemaswirdalleinschondadurchunterstrichen,dasssichimLaufederletztendrei
Jahre die Anzahl der Nutzer von digitalen Assistenten auf über eine Milliarde Nutzer verdreifacht hat –
einTrend,dersichlautPrognosenindennächstenJahrenfortsetztenwird.3
AusdiesemGrundsolldieseArbeit,eineAntwortaufdieFragefinden,obdigitaleAssistenteneinreales
WerbepotenzialbesitzenodersichdochaufeinederzeitigeModeerscheinungreduzierenlassen,dertrotz
allem Zutrauens der Durchbruch versagt bleibt.
Darüber hinaus wird sich meine Arbeit mit dem User Engagement der digitalen Assistenten befassen.
DarunterverstehtmandieSummederAktionen,diederBenutzter innerhalbeinerSprachanwendung
ausführt.Hier steht die Frage imVordergrund,wie dieGestaltung derAnwendung aussehen könnte,
damit der Nutzer sie als nützlich empfindet und entsprechend das Engagement und die Nutzungs-
häufigkeitgesteigertwird.
Diese Bachelorarbeit gliedert sich in vier Teile:
ImerstenwerdeichaufdieDefinitionderBegrifflichkeitenunddiezeitlicheEntwicklungeingehen,um
daraufhin einen Exkurs zu den technischen Grundlagen der Spracherkennung zu liefern.
ImweiterenVerlaufwerdeich,mithilfeeinerSWOT-AnalysedieChancenundStärkendenSchwächen
und Risiken gegenüberstellen, sowie die Zielgruppe analysieren und das Potenzial für Unternehmen
herausarbeiten.
ImdrittenTeilstelleichkonkreteMaßnahmenfüreineerfolgreicheKonzeptionvonSprachassistenten
vor.ImletztenTeilfließendieMeinungenundAnsichtenvonMarketingexpertenmitein.Diesewurden
im Rahmen einer Umfrage in Zusammenarbeit mit der Hamburger Werbeagentur Kolle Rebbe zusam-
mengetragen.
Im Fazit werde ich basierend auf den Rechercheergebnissen das Marketingpotenzial von digitalen Assis-
tentenabschätzenundmeinepersönlicheMeinungzudemThemaäußern.
3 Vgl.Tractica:AnzahlderNutzervirtuellerdigitalerAssistentenweltweitindenJahrenvon2015bis2021. Statista.2016
14 15Die verbale Kommunikation – mehr als Worte
eineArtCodemiteinanderverbunden.DeSaussurebezeichnetdieSeitedesLautbildesalsSignifikant
(Bezeichnendes)unddieSeitederVorstellungalsSignifikat(Bezeichnetes).
Im Rückkehrschluss bedeutet dies, dass Laute undWörter sich unterscheiden können und trotzdem
dieselbeAssoziationhervorrufen,wieesz.B.beiverschiedenenSprachenderFallist.8
In dieser Dualität kann die Macht des ge-
sprochenen Wortes gesehen werden. Denn
die Assoziation des Gesprochenen findet
im Kopf des Gesprächspartners statt 9 und
kann je nach Empfänger unterschiedlich
ausfallen. Je nachdem mit welchen persön-
lichen Erfahrungen und Bewertungen das
Gesagte inVerbindunggebrachtwird,unter-
scheiden sich die Assoziationen.10
Aber nicht nur der Inhalt des Gesprochenen
hat eineWirkung aufdenZuhörer; auchdie
Tonalität des Gesagten ist ausschlaggebend
für die Vorstellung im Gehirn.11 Mithilfe von Spiegelneuronen ist es in der Lage die Gefühle und Emo-
tionen des Sprechenden zu begreifen und Empathie für ihn zu entwickeln.12
Die Tonalität kann sogar ausschlaggebend für das Verhalten von Menschen sein. Dies wird leicht
begreiflich,daeinefreundlicheStimmebeieinemVerkaufsgespräch,eherdazuführt,dassderKunde
dasProduktoderdieDienstleitungerwirbt,alseineunsympathische.13
8 Vgl.ebd.,S.76–79
9 Vgl.ebd.,S.14–15
10 Vgl.Eicher,S.12
11 Vgl.ebd.,S.7
12 Vgl.ebd.,S.39f
13 Vgl.ebd.,S.5–6
2. Die verbale Kommunikation – mehr als Worte
»In der Sprache liegen alle Möglichkeiten des Menschseins beschlossen.« 4
DiesschreibtHansHörmanninseinemWerk»Psychologie der Sprache« von 1967.
Die wichtigste Funktion der Sprache ist der Austausch von Informationen. Es befriedigt das menschliche
Urbedürfnis sichmitzuteilen und auszudrücken.DochSprache kann noch vielmehr. Sie kann,wenn
entsprechendeingesetzt,positiveundnegativeGefühlebeidemGesprächspartnerauslösen.5
Umgekehrt werden auch unsere eigenen Gefühle durch sie wiedergespiegelt. Unbewusst lässt die Stim-
mesogarRückschlüsseaufCharakterzüge,SchulbildungunddiejeweiligeHerkunftzu.6
Der Sprachwissenschaftler Ferdinand de Saussure untersuchte bereits vor über 100 Jahren die Funktion
der Sprache. Er definierte sie als ein System von Zeichen,welchesGedanken und Ideen ausdrückt.7
SeinerAnsichtnach,habenZeichenzweiSeiten.ZumeinendasLautbild,welchesderMenschausspricht
und wahrnimmt. Zum anderen, die Vorstellung, die sich aufgrund des wahrgenommenen Lautbildes
ergibt. Er verdeutlicht dies mit folgendem Modell (Abb. 1):
DieLaute,diedasWort»Baum«bilden,sinddasLautbilddesZeichens.DieandereSeiteistdieVorstel-
lung des physischen Baumes mit seinen Blättern und Wurzeln. Lautbild und Vorstellung sind also durch
4 HansHörmann:PsychologiederSprache.Berlin,Heidelberg1967,S.1
5 Vgl.HansEicher:DieverblüffendeMachtderSprache.WasSiemitWortenauslösenoderverhindernund wasIhrSprachverhaltenverrät.Wiesbaden2018,S.3–4
6 Vgl.DanielHaase,IngoKnopfundShajanRamezanian:DieGeheimnisseunseresKörpers.04.09.2018.Quarks &Co.zuletztgeprüftam19.09.2018
7 Vgl.Ferdinandd.Saussure,Grundfragen der allgemeinen Sprachwissenschaft,3.Aufl.,hrsg.vonBally, Charles,Sechehaye,Albert,De-Gruyter-Studienbuch.Berlin2001,S.19
Abb. 1: Zeichenmodell nach Ferdinand de Saussure
16 Die verbale Kommunikation – mehr als Worte
DiesesurmenschlicheVerhaltenkönnensichSprachassistentenimMarketingzuNutzemachen,umbei
Kunden Aufmerksamkeit für Produkte oder Dienstleistungen zu erzeugen.
Ob digitale Assistenten durch ihre Sprache die »Möglichkeiten des Menschseins« imitieren und
Empathie für sie erzeugen können, wird jedoch im weiteren Verlauf dieser Arbeit nur am Rande
behandelt und ist nicht Inhalt dieser Arbeit.
18 19Definitionen
3. Definitionen
3.1. Sprachassistent
Ein digitaler Sprachassistent ist eine Software, die mithilfe von Sprachbefehlen Aufgaben erledi-
gen kann, wie z.B.Wetterberichte vorlesen, E-Mails verschicken oder Kalendereinträge tätigen. Die
derzeit bekanntesten Sprachassistenten sind Siri, Google Assistant, Alexa und Cortana. Diese sind
sowohlaufSmartphonesverfügbar,14alsauchinseparatenVoice-Only-Geräten,wieAmazonEchooder
Google Home. Voice-Only-Geräte auch Smartspeaker genannt, kommen komplett ohne Display und
visuelleEingabenzurechtundsindausschließlichmitderStimmezu steuern.15 Die digitalen Sprach-
assistentenfindenmittlerweileauchEinzuginAlltagsgegenständewieKühlschränke,Autos,odersogar
Badezimmerspiegeln.16
DieHauptleistungderAssistentenbestehtdarin,sprachlicheBefehle innatürlicherSprachezuverste-
hen und zu verarbeiten.17 Mit natürlicher Sprache ist die »normale«Sprachegemeint,diewirimAlltag
verwenden.Dabei kommt esweniger darauf an, dasGesagte zu erkennen, als vielmehr dasGesagte
sinngemäßzuverstehen.DieserProzesswirdNaturalLanguageUnderstandinggenannt.18
14 Vgl.HeidemarieSchuster:WasisteinSprachassistent?VogelCommunicationsGroupGmbH&Co.KG.2017
15 Vgl.CathyPearl:Designingvoiceuserinterfaces.Principlesofconversationalexperiences.Beijing2017,S. 1–2
16 Vgl.TillS.Nagel:CES:DigitaleSprachassistentensind2018eingrossesThema.2018
17 Vgl.Pearl,S.156–59
18 Vgl.ebd.
3.2. Voice User Interfaces
DieNutzungvonVoiceUserInterfacesistnichtswirklichNeues.JamesGiangola,MichaelCohenund
JenniferBaloghdefiniereninihremBuch»Voice User Interface Design« bereits 2004 VUIs folgender-
maßen:
»A Voice User Interface is what a person interacts with when communicating with a
spoken language application.« 19
SobaldderNutzer folglichseineStimmebenutzt,umeineAnwendungzusteuern,befindeter sich in
einem sprachbasierten Interface. Diese können weiter unterteilt werden inAuditority Interfaces und
Multimodale Interfaces. Letztere kombinieren das Medium Sprache mit einem grafischen, visuellen
Interface,währendAuditoryInterfacesausschließlichperSprachezubedienensind.
Ein weiteres Teilgebiet der Voice User Interfaces sind Spoken Language- bzw. Conversational Inter-
faces.DerenAnspruch istes,einenatürlicheKonversation,ähnlichwiezwischenzweiMenschen,zu
führen.Dabeiisteswichtigzubeachten,dassSprachenichtexplizitfürdieAnwendunggelerntwurde,
wie z.B. derUmgangmit einer visuellenBedienoberfläche, sondern implizit in der frühenKindheit.
Entsprechend sollte sich auch das auditive Interface an die menschliche Sprache anpassen und nicht um-
gekehrt.DenndieAussprache,derSatzbauoderdieArtwelcheInformationenzuwelcherZeitanden
Gesprächspartnerübermitteltwerden,istmindestensgenausowichtigfürdieKommunikation,wieder
Gesprächsinhalt.20 Zudem werden typischerweise im weiteren Verlauf eines Gespräches Informationen
wiederaufgegriffen,dieamAnfangderKommunikationgenanntwurden.DiesmussbeiderGestaltung
einesConversationalUserInterfacesbeachtetundzwischengespeichertwerden,dadieKommunikation
ansonstenäußersteinseitigstattfindet.AlsBeispielseihierangeführt,dassnachderFragezurAbflug-
19 MichaelH.Cohen,JamesP.GiangolaundJenniferBalogh:Voiceuserinterfacedesign.Boston,Mass.[u.a.] 2004,S.5
20 Vgl.ebd.,S.6–9
20 Definitionen
zeiteinesFlugzeugesundderanschließendenNachfrage,vonwelchemGateesstartet,dasSystemdie
Bedeutung des Wortes »es« in dem zweiten Gesprächsabschnitt einordnen muss.21
3.3. User Engagement
DerBegriffdesUserEngagementstauchtezuerstinden1980erJahrenauf.Seitdemsindvieleverschie-
deneDefinitionenentstanden,dieimFolgendenvereinfachtzusammengefasstwerden.
Das User Engagement ist eine Form der Kundenbindung bei einer Webseite, App oder anderem
interaktivenMedium. Das Engagement hängt eng mit der User Experience zusammen, welches die
Erfahrung bzw. das Erlebnis des Nutzers mit der Webseite oder App wiederspiegelt.22
BetrachtetmandasUserEngagementgenauer,soistesdieGesamtheitderInteraktionen,dieeinNutzer
ineinerAnwendungausführt.DiesewirdbeeinflusstdurchdieAufmerksamkeitundMotivationdesNut-
zers,schließtaberauchdieZeit,dieermitihrverbringt,ein.
Dabeiisteswichtig,eineUnterscheidungzurUserExperiencefestzulegen,denneinesolchebedeutet
nicht,dassaucheinhohesEngagementvorliegt.DasEngagementzeigt,inwiefernNutzereinenMehr-
wertausderUserExperience,alsoausdemErlebnisziehenkönnen.
Das Engagement kann in zwei Bereiche unterteilt werden: Die »Engaging Interaction«, welche die
einmalige Benutzung einer Anwendung beschreibt und das »Long-time-Engagement«,welchediemehr-
malige Nutzung über einen längeren Zeitraum darstellt.
Zusammengefasst ist das User Engagement die emotionale, wahrgenommene und verhaltensbasierte
ErfahrungdesNutzersbeieinerAnwendung,diezueinerbestimmtenZeitundübereinenlängerenZeit-
raumstattfindet.23
21 Vgl.Pearl,S.6–8
22 Vgl.JörgPflüger:Ist»UserEngagement«messbar?enconda.2016
23 Vgl.MouniaLalmas,HeatherO‘BrienundEladYom-Tov:Measuringuserengagement.38SanRafael,Calif 2014,S.2–3
22 23Historie der sprachbasierten Anwendungen
4. Historie der sprachbasierten Anwendungen
Bereits in den 50er Jahren experimentierte das Entwicklungszentrum »Bell Labs« – eine Tochtergesell-
schaftdesfinnischenHandyherstellersNokia–aneinerMöglichkeitZiffernviaSpracheerkennenzu
können.DiesesSystemfandaußerhalbderFirmajedochkaumAnwendungsmöglichkeiten.Dochinner-
halbvonzehnJahrenwuchsdieAnzahl,dervomSystemverstandenenWorte,beträchtlich.Eswurden
allerdings nur Stimmen von bestimmten Personen erkannt. Erst in den 1990er Jahren wurden die ersten
»Speaker-Independent-Systeme«entwickelt,dieWörterunabhängigvomSprechererkennenkonnten.
NochJahrzehntevordenVoiceUserInterfaces,diemitderStimmegesteuertwerden,entwickelteder
InformatikerJosephWeizenbaum1966denerstenText-basiertenChatbotnamensELIZA,derAussagen
indernatürlicheSprachedesMenschenverarbeitenundaufdessenBasis,passendeRückfragenstellten
konnte.24 ELIZA ebnete den frühenVUIs ihrenWeg in dieGesellschaft, die ihrenDurchbruch aller-
dings erst in den 2000er Jahren mit der Einführung der Interactive Voice-Response-Systeme (IVR-Syste-
me)hatten.DieseermöglichtenesNutzernüberdasFestnetztelefonInformationenzuAktienständeund
Verkehrssituationen zu erhalten. Auch konkrete Aktionen wie Geldüberweisungen oder Flugbuchungen
konnten über Sprache gesteuert werden.
Das amerikanische Investmentunternehmen »Charles Schwab«nutzteab1997einIVR-System,mitdem
ihreKundenAktienangebotemehrfachhintereinanderabhörenkonnten.FürvielewardieseineErleich-
terung,dasienichtmehrdasGefühlhatten,einen realenAgentenmitdenselbenFragenmehrfachzu
belästigen.25 Schon damals wurde das Potential der Sprachassistenten bereits erkannt. Mit der Zeit wur-
dendieseständigverbessertundselbst längereSpracheingaben,wiePaketverfolgungs-Nummernoder
24 Vgl.OliverBendel:300KeywordsInformationsethik.GrundwissenausComputer-,Netz-undNeue- Medien-EthiksowieMaschinenethik.Wiesbaden2016,S.60–61
25 Vgl.Pearl,S.1–2
komplexeSätze,wiePlatzierungenbeiPferdewettenkonntenverstandenwerden.
MitdenfrühenSprachsystemenwarenInformationenrundumdieUhrerhältlich,auchzuZeiten,wenn
einmenschlicherAgentnichtzuerreichenwar.GleichzeitigwurdendieIVR-Systemedafürgenutzt,die
Agenten zu entlasten.AnfangswarendieSystemeoftmals so schlecht aufgebaut, dassNutzer immer
wiederversuchten,durcheineHintertüraneinenmenschlichenAgentenzugelangen,ummit ihmzu
sprechen.26 Jedoch war der Fortschritt rasant und kaum zehn Jahre später erfolgte die nächste Revolution
im Bereich der Sprachassistenten.
Siri wurde von dem Stanford Research Institute (SRI) entwickelt und durch dessen Präsidenten Norman
Winarsky 2007 vorgestellt.
Kerngedanke dieses Sprachassistenten war die Zeitersparnis. Durch Sprachbefehle konnten einfache
Anweisungen,wiez.B.dieErstellungvonKalendereinträgen, schnellerdurchgeführtwerdenalsüber
die Tastatureingabe der damals noch sehr unhandlichen ersten Smartphones – vor dem Siegeszug des
iPhones.
Anfang 2010 wurde Siri im Apple Store angeboten und stieg schnell in die Liste der 50 beliebtesten
Apps auf. Nur zwei Wochen später wurde das Unternehmen von Steve Jobs aufgekauft und als neues
Feature des iPhone 4S vorgestellt.27
Im September 2014 folgte dannmitAmazonsAlexa, der nächsteMeilenstein in der Geschichte der
Sprachassistenten. Der Name Alexa ist an die antike Stadt Alexandria und dessen berühmte Bibliothek
angelehnt, die das gesamteWissen derAntike sammelte. Synonym sollAmazons digitalerAssistent
das Wissen der digitalen Welt und ihrer Dienstleitungen zusammentragen und per Sprache verfügbar
machen.
26 Vgl.ebd.
27 Vgl.NormanWinarsky:ThePresidentofSRIVenturesonBringingSiritoLife.Harvard Busisness Review 2015,Nr.9.
24 25Historie der sprachbasierten Anwendungen
Ab 2016 ist die Computerintelligenz Alexa auch in Deutschland verfügbar und ist über unabhängige
Lautsprecherboxen, den Amazon Echos ansprechbar (Abb. 2). Wie oben ausgeführt, werden diese
Lautsprecher Smartspeaker bzw. Voice-Only-Geräte genannt. Neben Standard-Anwendungen wie
beispielsweise der Abfrage von Kalendereinträgen oder Wettervorhersagen können Drittanbieter
sogenannte Skills als Thrid-Party-Apps für Alexa programmieren und auf diese Weise den Funktions-
umfang des Assistenten erweitern. Bei-
spiele für solche Sprachanwendungen
sind der Chefkoch-Skill, den man nach
Rezepten fragen kann, oder der Deut-
sche Bahn-Skill, der Zugverbindungen
heraussucht und vorliest.28 Es gibt bereits
über 15.000 Skills weltweit (Stand: 2.
Quartal2017)29 davon ca. 1.200 im deutsch-
sprachigen Skills-Store. (Stand 2017)30
Alle Sprachbefehle von Alexa werden
an die firmeneigenen Server geschickt, dort verarbeitet, gespeichert und die passende
Antwort zurück an das Gerät gesendet.31 Aus allen gesammelten Daten lernt die künstliche
Intelligenz (KI) mithilfe von maschinellem Lernen dazu und kann entsprechend den Nutzern
immer bessere Antworten liefern. Das bedeutet, je mehr Nutzer und Daten vorhanden sind,
desto besser wird der Sprachassistent.
28 Vgl.RolandEisenbrand:MarketingmitAmazonAlexaSkills:DassinddieerstenReichweitenzahlen.On lineMarketingRockstars.2017
29 Vgl.MathiasBrandt:Alexalerntschnell.Statista.2017
30 Vgl.Eisenbrand:MarketingmitAmazonAlexaSkills
31 Vgl.ThomasKuhn:JetztbringtAmazondiekünstlicheIntelligenzinsWohnzimmer.Wirtschaftswoche, Nr.44(2016):51–52
Google holte im Frühjahr 2017 zum Gegenschlag aus und brachte seinen Smartspeaker Google
Home auf den deutschen Markt. Gleichzeitig gab das Unternehmen seinen Sprachassistenten Google
Assistent für alleAndroid-Smartphones frei, die insgesamt einen Marktanteil von 80% ausmachen.
Somit stehen demUnternehmen sehr viel mehr Nutzerdaten zurVerfügung (z.B. Standortdaten), als
seinemKonkurrentenAmazon,derkeinbekanntesSmartphone-Betriebssystembetreibt(Abb.3).32
Google wird damit allerdings voraussichtlich
keine Monopolstellung im Sprachassistenten-
markt erreichen, denn einige Handyhersteller
bieten Amazons Sprachassistenten Alexa
bereits in den Werkseinstellungen als Standard-
Assistentenan.Mittlerweileistessogarmöglich,
auf allen Android Geräten Alexa als Standard-
Sprachassistenten einzustellen.33 Aber auch
der Handyhersteller Samsung startete seinen
Sprachassistenten Bixby und ist damit zu ei-
nem weiteren Konkurrenten vom Google Assistant geworden.34
Ein paar Monate nach der Einführung des Google Assistant erweiterte das Unternehmen seinen
AssistentenumsogenannteActions,einemPendantzudenSkillsvonAmazonAlexa.Allerdingshängt
Google mit der Anzahl dieser Third-Party-Apps noch weit hinter seinem Konkurrenten Amazon
hinterher.35
32 Vgl.ThomasHeuzeroth:KriegderSprachassistenten.2017
33 Vgl.IngoPakalski:StattGoogleAssistant:AlexaalsStandardassistentaufAndroid-Smartphonesnutzbar. t3nMagazin.2018
34 Heuzeroth:KriegderSprachassistenten
35 Vgl.IngoPakalski:GoogleAssistant:ÜbersichtsseitefürverfügbareActionsgestartet.Golem.de.2018
Abb. 2: Amazon Echo mit der Computerintelligenz Alexa Abb. 3: inergrierter Sprachassistent Googgle Assistent
auf dem Handy
26 Historie der sprachbasierten Anwendungen
Ab dem 18. Juni 2018 ist nun auchApplesKonkurrenzprodukt, derHome Pod,mit seinemSprach-
assistenten Siri auf dem deutschen Markt angekommen.36 Zwar hat Apple für Siri im Sommer 2018
dieEinführungvonsogenanntenShortcutsbekanntgegeben,dieähnlichwieAlexaSkillsoderGoogle
ActionseineArtThird-Party-IntegrationvoniOS-Appsermöglicht.ObdamitjedochexterneMarkenin
ZukunfteigeneAnwendungenfürSirientwickelnkönnenistnochnichtklar.37
36 Vgl.MatthiasKrempp:ApplekündigtHomePodfürDeutschlandan.SpiegelOnline.2018
37 Vgl.NatLevy:SiriShortcutsvs.AlexaSkills.HowAppleistappingappstocompetewithAmazon’svoice assistant.GeekWire.2018
28 29Technischer Hintergrund
5. Technischer Hintergrund
In dieser Bachelorarbeit geht es um die Nutzung von Sprachassistenten im Marketing und die Steigerung
desUserEngagements.FürbeidesisteshilfreicheinGrundverständnisvonderTechnologiezuhaben,
die hinter der Spracherkennung steht. Aus diesem Grund wird sich nachfolgendes Kapitel mit den wich-
tigstenSchlüsselkomponentenbeschäftigen,dieeinreibungslosesundfunktionierendessprachbasiertes
Nutzererlebnisermöglichen.
5.1. Automated Speech Recognition
Automated Speech Recognition (ASR) ist neben dem Natural Language Processing (NLP) die wich-
tigsteKomponente,dieeineSpracherkennungbenötigt.BeidieserTechnologiegehtesumdieErken-
nungderSpracheunddiedarauffolgendeUmwandlungineinenText.38 Vereinfacht läuft diese Sprach-
umwandlung in vier Schritten ab.
Zunächst wird das Gesprochene in eine Waveform Audiodatei umgewandelt aus der anschließend,
soweitmöglich,Hintergrund- und Störgeräusche entferntwerden.Diese optimierteAudiodateiwird
im dritten Schritt in Phoneme zerlegt. Phoneme sind die kleinste Einheit in der (Aus)Sprache. Sie
sindnichtmitBuchstabenzuvergleichen,daz.B.das»sch«ausdreiBuchstabenbesteht,dieineinem
Phonem zusammengefasst sind.
38 Vgl.Pearl,S.107
AbgeleitetausderReihenfolgederPhonemeunddemZusammenhang,welchesPhonemamehestenauf
dasVorherigefolgenkönnte,werdenimletztenSchrittStückfürStückeinzelneWörterundSätzezu-
sammengesetzt.39
UmdieWordErrorRatekleinzuhalten,kommtimASR-ModulderSpracherkennungeinen-Best-Liste
zumEinsatz. In ihrwerden alleSätze aufgelistet, die durch den oben beschriebenenProzess erkannt
wurden.JehöherdieWahrscheinlichkeitist,dassdasASR»denkt«denSatzrichtigerkanntzuhaben,
desto weiter oben steht er in der n-Best-Liste.
Ein Beispiel: In der Sprachanwendungen eines Saftherstellers kann der Nutzer nach Cocktail-Rezepten
fragen.DieAnwendungbegrüßtdenNutzerundfragt:
»Welchen Cocktail möchtest du mixen?«
Der Nutzer antwortet:
»Ich möchte einen Cosmopolitan machen«
Die Spracherkennung erstellt nun die n-Best-Liste.AnersterStellestehtnichtunbedingtauchdas,was
derNutzergesagthat.DieerstenEinträgederListekönntensoaussehen:
1. 92% IchmöchtekeinekomischePolitikmachen.
2. 88% IchmochtekeinekosmischenPollenmachen.
3. 79% IchmöchteeinenCosmopolitanmachen.
4. 72% IchmochtekeinekomischenPolenmögen.
WürdedieSpracherkennungnurdenerstenEintragderListealsAntwortanerkennen,würdedieAn-
wendung wahrscheinlich etwas wie, »Wie bitte? Könntest du das wiederholen« antworten. Da sie
aber »weiß«, dass nach einemCocktailnamen gefragt wurde, kann dieAnwendung die Einträge der
n-Best-ListevonobennachuntennachdiesenSchlüsselwörternuntersuchen.
39 Vgl.MatthewZajechowski:AutomaticSpeechRecognition(ASR)Software.AnIntroduction.Usability Geek.2014
30 31Technischer Hintergrund
In dem dritten Eintrag der Liste ist nun das Wort »Cosmopolitan«zufinden.Diesesist ineinerzuvor
angelegten Liste von Cocktailnamen vorhanden und die Sprachanwendung kann die passende Anleitung
zum Cosmopolitan ausspielen.40
5.2. Natural Language Processing
Das Erkennen der Sprache stellt nur den ersten Schritt dar. Es folgt die Analyse der Bedeutung des
Textes mithilfe von Natural Language Understanding (ein Teilgebiet von NLP). Dies geschieht auf
Grundlage von maschinellem Lernen, wobei sehr große Datenmengen als Trainingsmaterial benutzt
werden.YvonneGöpfertgibtinihremArtikelinderZeitschriftW&VfolgendesBeispiel:Sagentausend
Personen »Mach das Licht an« und jeder möchte mit diesem Sprachbefehl bezwecken, das Licht
anzumachen, sowirdmithoherWahrscheinlichkeitauchder1001.Nutzerdieselbe Intentionhaben.41
DiesistallerdingsnureinsehroberflächlichesBeispielfürdieBedeutungserkennungvonTexten.Das
AnalyseUnternehmenSASInstitutebeschreibtdieHauptaufgabevonNLPdamit,unstrukturierteDaten
in eine vom Computer lesbare Struktur zu bringen.42
Dabei werden die Sätze zunächst auf die Grammatik hin analysiert. Diese sogenannte syntaktische
Analyse ordnet den einzelnen Wörtern ihre grammatikalische Funktion zu. In der darauffolgenden
semantischenAnalysewerdendenWörternihreBedeutungenzugeordnet.ImletztenSchritt,derprag-
matischenAnalyse,wirddieBedeutungderkomplettenPhrasemithilfedervorangegangenenAnalyse
herausgearbeitet und der Kontext ergründet.43
40 Vgl.Pearl,S.120–21
41 Vgl.YvonneGöpfert:Sagwas!SprachsteuerungimMarketing.W&V,Nr.20(2018)
42 Vgl.SASInsitute.WhatisNaturalLanguageProcessing?
43 Vgl.MarcErichLatoschik:SpezielleThemenderKI:NLP-NaturalLanguageProcessing-Sprachverste hen.,2006,S.52
Nachdem der Input desNutzers analysiert und verarbeitetwurde, beginnt der umgekehrte Prozess –
die Sprachsynthese (Natural Language Generation (NLG)). Hier werden, die vom System erzeugten
strukturiertenDaten,zurückinvonMenschenlesbareTexte»übersetzt«.44 Diese Texte werden letztend-
lichwiederinhörbareSpracheumgewandeltundalsAudioabgespielt.DiesenProzessbezeichnetman
als Text-To-Speech (TTS).45 Die Aussprachequalität von TTS ist jedoch noch deutlich als Computer-
stimme wahrnehmbar.
Esbesteht auchdieMöglichkeitmit aufgezeichneterSprache zu arbeiten.DamitwürdendieSchritte
desNLGundTTSwegfallen.DieseMöglichkeitderSpracherzeugungistallerdingswesentlichteuer,da
hierfüreinSprecherundeinTonstudiofürjedeAufnahme,ÄnderungundErweiterungbenötigtwird.46
Gerade beim Onlinehandel mit unzähligen Produktnamen, die ständig aktualisiert werden müssen,
bietetsichTTSan.HiermusslediglichderTextgeändertwerde,anstattineinemTonstudiomenschliche
Sprache bei der Aktualisierung aufnehmen zu müssen.
Auch eine Kombination aus Text-To-Speech und menschlicher Sprache sind möglich. So wird bei
Cortana, dem Sprachassistenten von Microsoft, die Sprache zum Teil aus mehreren Audiodateien
sowohlzusammengesetzt,komplettaufgezeichnet,alsauchdurchTTSgebildet.47
44 Vgl.MaryGlascott:WhatisNaturalLanguageGeneration?narrarivescience.2017.
45 Vgl.TobiasGoebel:Don‘tConfuseSpeechRecognitionwithNaturalLanguageUnderstanding.aspect.2017.
46 Vgl.Pearl,S.148–50.
47 Vgl.ebd.
34 35SWOT-Analyse: Voice User Interfaces
6. SWOT-Analyse: Voice User Interfaces
NachdemdieGrundlagenderSprachassistentenundderenVoiceUserInterfaceeingeführtwurden,wird
sichdiesesKapitelmitihrenChancenundRisikenbefassen.Umdiesezuanalysieren,wirddieMethode
der SWOT-Analyse (Strength,Weakness,Opportunity,Threat) herangezogen. Sie wird in zwei Bereiche
unterteilt: die interneAnalyse,welche die Stärken undSchwächen desMediumsVoice auflistet; und
dieexterneAnalyse,diedieChancenundRisikenvonSprachanwendungeninBezugaufMarkenund
Marketing aufzeigt.48
TrotzihreseigentlichenAnwendungsbereichs,inderstrategischenPlanungvonUnternehmen,stelltdie
SWOT-Analyseaucheingeeignetes Instrumentdar,umdieVor-undNachteilevonVoiceUser Inter-
faces zu beleuchten.
6.1. Stärken (Strength)
Anwendungen auf dem Smartphone werden in der heutigen Zeit vor allem durch zwei gängige Metho-
dengesteuert.Dies sinddieEingabevonTextenunddieSteuerungdurchGesten,wiedemWischen,
TippenundScrollen.HierstelltsichdieFrage, inwieweitbeidiesenbewährtenAktionendieEingabe
vonInformationenüberSpracheeinenMehrwertdarstellt?
48 Vgl.JürgenFleig:SWOT-Analyse:SowirdeineSWOT-Analyseerstellt.busines-wissen.de.2018
Ein Aspekt dabei ist die Geschwindigkeit.49 In einer Studie der Stanfort Universität und dem chinesi-
schenOnlineunternehmenBaiduvon2016,wurdedieEingabegeschwindigkeitviaiPhoneTastaturmit
dereinerSpracherkennungverglichen.DasErgebniszeigte,dassdieEingabeüberdieSprachebiszu
dreimalschnellerablief,alsüberdieTastatur.50
Ein passendes Zitat lieferte Baidus Wissenschaftschef Andrew Ng:
»Humanity was never designed to communicate by using our fingers to poke at a tiny little
keyboard on a mobile phone. Speech has always been a much more natural way for hu-
mans to communicate with each other« 51
EineweitereStärkeistdieIntuitivitäteinesVoiceInterfaces,dadieEingabemöglichkeiteneinerSprach-
anwendung nicht neu erlerntwerdenmuss. Somit können selbstMenschen, die nichtmit den neuen
TechnologienvertrautsindoderSchwierigkeitenhaben,sichinderderzeitigenMedienvielfaltzurecht-
zufinden,einSprachinterfacebedienen.52DiesführtgleichzeitigzueinergrößerenZufriedenheitbeiden
Nutzern,dennMissverständnisseundBedienfehleraufSeitenderBenutzerwerdendurcheinSprach-
system vorgebeugt.53SelbstverständlichkanndieseStärkenurausgeschöpftwerden,wennindemVUI
vieleverschiedeneAntwortmöglichkeitenfürdenNutzerkonzipiertwurden,umentsprechendsinnvoll
daraufreagierenzukönnen.
EinederinteressantestenStärkenistjedochdieempathischeBeziehung,dieeinNutzerzueinemSprach-
assistentenaufbauenkann.IstdieStimmedesVUIsberuhigendodergestresst?Sprichtsieschnelloder
langsam?VieleCharaktereigenschaftenkönnendurchdieWahlderStimmeunddieArtundWeiseder
Inhaltsübermittlungdargestelltwerden.DiesekönnendemVUIsogareineArtPersönlichkeitverleihen,
49 Vgl.Pearl,S.3
50 Vgl.AartiShahani:VoiceRecognitionSoftwareFinallyBeatsHumansAtTyping,StudyFinds.npr.2016
51 Ebd.
52 Vgl.Pearl,S.3
53 Vgl.Cohen,GiangolaundBalogh,S.10
36 37SWOT-Analyse: Voice User Interfaces
zudereinepersönlicheBeziehungaufgebautwerdenkann.DarausergebensichvieleneueGestaltungs-
möglichkeiten,diebeivisuellenBedienoberflächennichtmöglichwären.54
6.2. Schwächen (Weakness)
NebendenobengenanntenStärkenvonSprachsystemengibtesauchAnwendungsbereiche,beidenenes
nicht sinnvoll ist ein Voice Interface einzusetzen.
DiefehlendePrivatsphäreisteinesolcheSchwäche.BeieinerSprachanwendung,imöffentlichenRaum,
fälltesvielenMenschenschwerprivateoderpersönlicheInformationenpreiszugeben.55
DergrößteNachteilistjedochdasFehleneinesDisplays.DamitfallenwichtigevisuelleElementeder
Informationsvermittlungweg,soz.B.dieAuswahlliste,dauerhafteSichtbarkeitunddieSpeichermög-
lichkeit.
Nach einemAufsatz des Psychologen George Miller, sei der Mensch nicht in der Lage, mehr als
sieben Informationseinheiten im Kurzzeitgedächtnis zu behalten.56 Es ist also nicht sinnvoll eine Liste
einszueinsvonderSprachanwendungvorgelesenzubekommen,dahierbeidiekognitiveAnstrengung
wesentlichhöherist,alsbeieinervisuellenAuflistung.DementsprechendmüssenneueWegeentwickelt
werden,umeineVielzahlvonInformationenübereinenSprachanwendungvermittelnzukönnen.
Ein gängigesMittel ist die Kombination ausAudio und visueller Darstellung, wie es auch bei dem
GoogleAssistantgenutztwird.FragtmannachdenreichstenMenschenderWelt,sowirddemNutzer
eine Liste dieser Personen angezeigt und nicht vorgelesen.57
54 Vgl.ebd.
55 Vgl.Pearl,S.4–5
56 Vgl.GeorgeMiller:ThemagicalnumberSeven,plusorminustwo:somelimitsonourCapacityfor ProcessingInformation.Psychological Review,1955,S.9–11
57 Vgl.Pearl,S.14–15
Eine weitere Methode ist die Inhaltskomprimierung von langen Listen. Sucht der Nutzer beispielsweise
nacheinemRestaurant,kanndie»endlose« Liste durch gezielte Fragen seitens der Sprachanwendung
eingrenztwerden.Mit Fragen zu derNationalität dieKüche, derAnreiseformoder inwelcherPreis-
klassesichdasRestaurantbefindendarf,kanndieListeverkürztwerden.SindnurnochwenigeEinträge
vorhanden,werdendiesevorgelesen.
WeitereMethoden,diedenkognitivenAufwanddesNutzersreduzierenwerdeninKapitel11vorgestellt
und diskutiert.
6.3. Risiken (Threats)
In ihrem Buch »Designing Voice User Interfaces« beschreibt Cathy Pearl Risiken von sprachbasierten
Anwendungen.
Hierzu zählen zunächst ganz allgemeine Bedenken bei der Nutzung von Sprachassistenten. Für viele
Menschen ist es unangenehm mit einem Computer zu sprechen. Sie bevorzugen das vertraute und ver-
traulicheTippen,ummitihrenGerätenzuinteragieren.58
Allerdings ist dies nicht nur ein auf das Medium Voice beschränktes Phänomen. In einem Interview des
Medienprofessors Frank Hartmann in »Die Tageszeitung« spricht er von der Angst über den Kontrollver-
lustbeiderNutzungneuerMedien.ErsiehtdasProblemdarin,dassderMenschvonNaturauseinfaules
Wesensei,derGelernteseinigeZeitlanganwendenmöchte.ErbeschäftigtsichnichtgernemitNeuem
undverlieredamit schnelldenAnschlussanneueTechnologien.DiesesPhänomenbetrifft, lautHart-
mann,nichtnurältereMenschen,sondernistgeradeimdeutschenKulturkreisstarkvertreten.Soseien
dieDeutschenschonimmerkulturpessimistischgewesenundhabenihrehumanistischenGlaubenssätze,
wiebeispielsweise,dasseinBuchimmerbesseralseinBildschirmsei,verteidigt.DiessiehtHartmann
alsGrund,warumneueMedieninDeutschlandnichtsoschnellAnklangfinden,wiez.B.indenUSA.
58 Vgl.ebd.,S.4
38 39SWOT-Analyse: Voice User Interfaces
FüreineerfolgreicheAkzeptanzvonVoiceInterfacessprichtjedoch,dassesvieleBeispielevonMedien
gibt,diezunächstvonderGesellschaftnichtangenommenwurdenundspätertrotzdemAllgemeingutge-
wordensind.DazuzählendieFotografie,diedemAdeldasPrivilegnahm,sichabbildenzulassenoder
derFernseher,derdasharmonischeFamilienlebenzerstörenwürde.59
IneinerDeutschlandumfrageaus2017wurdenachdenmöglichenRisikengefragt,dieSprachassistenten
mitsichbringenkönnten(Abb.4).
An erster Stelle nannten die Be-
fragten die Sorge, dass sie kei-
nen persönlichen Ansprechpartner
mehr erreichen würden und das
Risiko eines immer unpersönlicher
werdendenAlltages(ca.60%)Wei-
terhin wurde die Sorge vor zuneh-
menden Missverständnissen auf-
geführt.60 Technisch kann diesem
Risiko durch ein besseres Design
der VUIs bzw. die Verbesserung der
Spracherkennungssoftware begeg-
net werden.
VondenBefragtensahen30%dieGefahr,dassinZukunftzuvielWerbungaufdenSprachassistenten
laufenkönnte–eineAussage,diediehoheRelevanzdesThemasdieserBachelorarbeitunterstreicht.
DieAbneigunggegenoffensichtlicheWerbungindenMedienbestätigtaucheineStudievon»Exponen-
tial Interactive Deutschland«,diedieAnzahlderangeklicktenDisplaywerbungenbeinur0,02%angibt.
59 Vgl.FrankHartmann,interviewtvonSebasitianKempkens,03.08.2013;WoherkommtdieAngstvorTechnik?
60 Vgl.StatistaundNorstat:WelcheGefahrensehenSiebeiderzunehmendenVerbreitungvon Sprachassistenten?Statista.2017
DazukommtderAnstiegvongenutztenAdblockern,dieeinenWerbeverlustvonbiszu40Milliarden
US-DollarzurFolgehaben.BetrachtetmandiesesWerbevermeidungsverhaltengenauer,sostelltmanfest,
dassalleinschonderEindruck,eskönntesichumWerbunghandeln,dazuführt,dasssieignoriertwird.Diese
Erkenntnissezeigeneinmalmehr,wiewichtigesist,zielgruppenrelevanteWerbungzugestalten,diees
schaffteinenMehrwertfürdenNutzerzukreieren. 61 Im weiteren Verlauf der Arbeit wird dieses Thema
intensiv behandelt.
EinweiteresRisikobeiSprachassistentenstelltderDatenschutzdar.Dieszeigteineweltweite, reprä-
sentativeStudieausdemJahr2018,beider65%derNutzer, fehlendesVertrauen indenDatenschutz
alsGrunddafüranführten,keinendigitalenAssistentenzubenutzten.62 Das diese Sorge nicht unbegrün-
detist,bestätigteinInformationsschreibenderBundesbehördefürDatenschutzundInformationsfreiheit
(BfDI)vomFrühjahr2017.Hierwirddaraufaufmerksamgemacht,dassHackergesprocheneSprach-
befehleabhörenkönnten,umandieverknüpftenZahlungsdatenderNutzerzugelangen.
Ein weiterer negativer Aspekt ist, dass nicht immer transparent vermittelt wird, zu welchem
Zwecken dieHersteller die gespeichertenNutzerdaten verwenden.DieDaten könnten beispielsweise
für personalisierte Werbung genutzt werden.63 Durch den Sitz der großen Hersteller der Sprach-
assistentenindenUSA,bestehtzudemdasRisiko,dasspersonenbezogeneDatenandieNSAgelangen.Denn
amerikanischeFirmensindgesetzlichdazuverpflichtet,demNachrichtendienstEinblickeinihreDaten
zu gewähren.64
61 Vgl.AndreasBaetzgen:BrandExperience:EineEinführung.inBrand Experience: an jedem Touchpoint auf den Punkt begeistern,hrsg.v.AndreasBaetzgen,1.Auflage2015(Stuttgart2015),3–15,14
62 Vgl.JeromeBuvatetal.:ConversationalCommerce:WhyConsumersAreEmbracingVoiceAssistansinTheir Lives.,2018,S.17
63 Vgl.DieBundesbeauftragtefürdenDatenschutzunddieInformationsfreiheit:Internetauftrittder BundesbeauftragtenfürdenDatenschutzunddieInformationsfreiheit-Homepage-Sprachassistenten. Bund
64 Vgl.TanjaTricarico:DatenschutzbeiSprachassistenten:LauschangriffimWohnzimmer.DieTageszeitung. 2018
0% 20% 40% 60%
schwieriger menschl.Ansprechpartner zu finden
unpersönlicher Alltag
Missverständnisse
mehr Werbung
Sonstiges
Nichts davon
Abb. 4: Welche Gefahren sehen Sie bei der zunehmenden
Verbreitung von Sprachassistenten
40 41SWOT-Analyse: Voice User Interfaces
6.4. Chancen (Opportunity)
Basierend auf den Prognosen, liegt die größteChancen vonSprachassistenten fürUnternehmen dem
rasanten Zuwachs von Nutzern zu Grunde. Demnach wird sich die Anzahl der Nutzer bis zum Jahr 2021
auf ca. zwei Milliarden verdoppeln. Es kann folglich von einer immer weiter zunehmenden Etablierung
des Mediums in der Gesellschaft ausgegangen werden.65
ZusätzlichzudenRisikenwurdendieProbandeninderoberenUmfrageauchzudenChancenbefragt,
die Sprachassistenten für dieNutzer bieten könnten,wobei dieMehrheit über eine Erleichterung im
Alltag berichten.66
Aus dieser Erkenntnis ergeben sich wiederum Aufgaben auf Seiten der Marken und Unternehmen. Sie
solltengründlichanalysieren, inwelchenBereichendesAlltagsSprachassistenteneineBedeutungfür
dieKundenspielenkönnen,umsozuerkennen,wannundwoderEinsatzvondigitalenAssistentenim
Marketing sinnvoll ist.67
Eine weitere Chance auf Seiten der Nutzer liegt in der Verkürzung der Wartezeit bei Telefonhotlines.68
WiedasvorangegangeneKapitelzeigt,teilendieNutzeroffenkundigdieSorgeinZukunftkaumnoch
aufpersönlicheAnsprechpartnerzutreffen.GleichzeitigfehltihnenjedochdieBereitschaft,aufdiesein
einerHotlinelangezuwarten.EntsprechendliegteinegroßeAufgabebeidenUnternehmeneinenzufrie-
denstellendenMittelwegzufinden.
Die Stiftung Warentest berichtet in ihrer Zeitschrift »test« vom 27. September 2018, dass keine der
geprüften Gespräche mit Mitarbeitern von Telekommunikationsfirmen als gut bewertet wurden.
Fragen der Kunden wurden oft missverstanden oder keine zufriedenstellenden Antworten geliefert.
65 Vgl.Tractica:AnzahlderNutzervirtuellerdigitalerAssistentenweltweitindenJahrenvon2015bis2021
66 Vgl.StatistaundNorstat:WelchenNutzensehenSiebeiderzunehmendenVerbreitungvon Sprachassistenten?Statista.2017
67 Vgl.FelixStöckle:ConnectingtheDots:DiekomplexenBeziehungenzwischenCustomerJourneys, TouchpointsundBusinessEcosystemverstehen.inBaetzgen,Brand Experience (s.Anm.66),S.170
68 Vgl.StatistaundNorstat:WelchenNutzensehenSiebeiderzunehmendenVerbreitungvon Sprachassistenten?
Hier liegt viel Potenzial bei den Sprachassistenten, diese Mängel zumindest teilweise zu beheben.
Erwähnt werden muss jedoch, dass in dem Test auch die digitalen Assistenten einiger Firmen
überprüft wurden, und zum Teil noch schlechter, als ihre menschlichen Kollegen abschnitten. Dies
zeigt,dassnochvielArbeitindieSpracherkennungunddasSprachverständnisinvestiertwerdenmuss.69
ImVerlaufderoberenUmfragegaben26%derTeilnehmerdenVorteilan,durcheinendigitalenAssis-
tenten weniger Zeit vor einem Bildschirm zu verbringen.70DiesesberechtigeAnliegenderAnwender,
wiederspricht jedoch der breiten Nutzung im Marketing.
IndiesemZusammenhangistumsointeressanter,dasseinigeNutzerindigitalenAssistentendieChance
sehen,einebessereBeratungimKaufvonWarenundDienstleitungenzuerhalten.71 Hier hätten Marken
alsodieMöglichkeitihreKundenaktivzumKaufzubewegenundgleichzeitigeinpositivesImagezu
schaffen.
Cathy Pearl nennt zudem Situationen, in denen die Bedienung einer Anwendung mit den Händen
unangenehm oder gefährlich ist, wie beispielsweisewährend derAutofahrt oder bei anspruchsvollen
handwerklichenTätigkeiten,dieeinhohesMaßanAufmerksamkeiterfordern.72 Ein Beispiel wäre die
Wartung oder Reparatur von Autos. Anstatt mit den verschmutzten Händen ein Smartphone zu bedie-
nen,aufdemdieeinzelnenSchrittezurReparaturvisuellangezeigtwerden,könntedieBedienungper
Sprache das geeignetere Mittel sein. Weitere Anwendungsbeispiele sind Kochrezepte oder Bastelanlei-
tungen.
AlsbarrierefreiesInformationsangebotbietetderSprachassistentzudemdieChanceMenschenmitkörper-
lichen oder geistigen Beeinträchtigungen an diesem Medium teilhaben zu lassen. Somit hätten blinde Men-
schenoderPersonen,dieanderweitignichtinderLagesindSmartphoneszubedienendieMöglichkeitan
Informationen zu gelangen, an die sie ohne digitalenAssistenten nur schwer herankommenwürden.
69 Vgl.StiftungWarentest:HotlinesimTest:BeratenRoboterbesseralsMenschen?test,Nr.10(2018)
70 Vgl.StatistaundNorstat:WelchenNutzensehenSiebeiderzunehmendenVerbreitungvon Sprachassistenten?
71 Vgl.ebd.
72 Vgl.Pearl,S.3
42 43SWOT-Analyse: Voice User Interfaces
Eineweitere überraschendeEntwicklung zeigen die annähernd gleichmäßigenNutzerzahlen über die
Altersgruppenhinweg.DieSprachassistentenwerdenzwaröftervonden»Digital Natives«genutzt,die
mit dem neuen Medium aufgewachsen sind. Doch auch der Anteil der Senioren ist relativ hoch. Somit
trifftdieAussagevonHartmann,dassälterePersonenwenigeraufgeschlossengegenüberneuenMedien
sind,zumindest imFallderSprachassistentennichtzu.Dies istverständlich,dennsie schaffenAuto-
nomität imAlterundermöglichenihneneinenZugangzumSmartphone.73 Diese Zielgruppe sollte für
MarkenundUnternehmen,dieMarketingperSprachassistentbetreibenwollen,verstärktindenFokus
rücken. Denn in Deutschland wird jeder dritter Euro von den über 60-jährigen ausgegeben.74 Auch den
Onlinehandel nutzten bereits über die Hälfte der Senioren.75
Die rechte Tabelle fasst die SWOT-Analyse in einem sogenannten SWOT-Modell zusammen und gibt
einenÜberblickderimTextbehandeltenThemen(Abb.5).EsnenntdieMaßnahmen,dieergriffenwerden
können,umausdenStärkendieChancenzumaximieren,bzw.SchwächenundRisikenzuminimieren.
73 Vgl.SebastianGubernator:Sprachassistenten:Senioren,freuteuchaufSiriundAlexa!Welt.2018
74 Vgl.Statista:AnteilderKaufkraftderDeutschennachAltersgruppen.Statista.2010
75 Vgl.Statista:AnteilderInternetnutzer,dieindenletztendreiMonatenEinkäufeundBestellungenüber dasInternetgetätigthaben,nachAltersgruppenimJahr2017.Statista.2017
Stärken Schwächen
Cha
ncen
Stärken nutzen, um Chancen zu verbessern Schwächen eliminieren, um Chancen zu nutzen
- Verhaltenund»Persönlichkeit«derSprachanwendung auf das Marken-image ausrichten
- Kundenberatung: Kombination aus Sprachassistentundpersönliches Gespräch
- Sprachanwendung speziell für Senioren anbieten
- Kombination aus Audio und visuellen Elementen
- Umfassendes Verständnis des Nutzers und der Nutzung entwickeln
- Antworten durch weitere eingrenzende Fragen optimieren
Ris
iken
Stärken nutzen, um Risiken abzuwehren Verteidigungsstrategien
- Sprachanwendungen,dieschnellerundintuitiver zu bedienen sind als Handy-Apps
- Anwendung muss Mehrwert für den Nutzer liefern
- personalisierte Werbung nur nach positiver Rückmeldung des Nutzers
- wichtige Kundengespräche nicht durch Sprachanwendungen automatisieren
- ransparente Einsicht über den Verbleib und Verwendung der Nutzerdaten
- keineunspezifischenWerbespotsaufSprachassistenten
Abb. 5: SWOT-Modell
44 45Zielgruppenanalyse von Sprachassistenten
7. Zielgruppenanalyse von Sprachassistenten
Der folgende Abschnitt wird sich mit der Analyse der Nutzer von digitalen Sprachassistenten beschäf-
tigen.DarauskönnenRückschlüssegezogenwerden,welcheNutzerdurcheineSprachanwendungam
bestenangesprochenwerdenkönnenunddurchwelchedemografischenMerkmalesiesichauszeichnen.
Statistiken zeigen, dass 40%der 14–19-jährigenSprachassistenten nutzen (Abb. 6). Sie bilden damit
die Altersgruppe mit dem größten Nutzerpotenzial.
Je älter die Zielgruppe wird, desto seltener werden
Sprachassistentenverwendet.Überraschendist,dassder
Nutzeranteil nur geringfügig mit dem Alter sinkt.
Selbst bei den über 60-jährigen nutzt immerhin noch
mehralsjederfünfteeinendigitalenAssistenten,was
erstaunlich viel ist.76
Dieser hohe Nutzungswert kann ggf. darauf zurück-
zuführen sein, dass Sprache eines der ältesten und
intuitivsten Kommunikationswege ist. Im Vergleich
zugrafischenUserInterfacesmüssenfürSprachassistentenkeineneuenTechnologiengelerntwerden.
Dadurch sinkt die Akzeptanzschwelle des neuen Mediums bei den Senioren erheblich.77
EineUmfragederSplendidResearchGmbHzeigt,dassdieNutzungvonSprachassistentenweitgehend
geschlechtsneutralist.39%derMännernutzenbereitsdigitaleAssistenten,einWertdermit35%,kaum
geringer, auchvonderweiblichenNutzerschafterreichtwird.Ebensomarginal sinddieUnterschiede
beidemHaushaltsnettoeinkommen.DieErgebnissedortfolgenkeinemerkennbarenMuster,sodasskein
76 Vgl.BertramBarthundSandraMag.Cerny:IABTrendmonitor:DigitaleAssistenten.,Nr.5432(2017):S.8
77 Vgl.LewisLeong:Whypersonalvoiceassistantsarethenextbigmarketingplatform.2017
direkterZusammenhangzwischenVermögenbzw.EinkommenundderNutzungvonSprachassistenten
gezogen werden kann.78
Etwas anders sieht es bei den verschiedenen SINUS-Milieus®aus.Dieses,inden1970erJahrenentwi-
ckelteModelfasstMenschenmitähnlichenLebensauffassungenund-einstellungeningesellschaftliche
Gruppen zusammen. Die Gruppen werden nach sozialer Schicht und Grundorientierung geclustert und
entsprechend auf den Achsen des oberen Diagrammes aufgetragen (Abb. 7).79
Die hier zugrunde liegenden Umfragedaten stammen aus Österreich. Ein Land, in dem laut dem
78 Vgl.SplendidResearchGmbH:DigitaleSprachassistenten:EinerepräsentativeUmfrageunter 1.024DeutschenzumThemadigitaleSprachassistenten.2017
79 Vgl.BertramBarthundBertholdB.Flaig:HoherNutzwertundvielfältigeAnwendung:Entstehungund EntfaltungdesInformationssystemsSinus-Milieus®.inPraxis der Sinus-Milieus®: Gegenwart und Zukunft eines modernen Gesellschafts- und Zielgruppenmodells,hrsg.v.BertramBarthetal.(Wiesbaden2018),3–22,S.4–5
0% 20% 40%
14-19
20-39
40-59
60+
Abb. 6: Nutzer von Sprachassistenten nach
Alter in Österreich
Abb. 7: Nutzungsanteile von Sprachassistenten in Österreich nach den SINUS©-Milieus
46 Zielgruppenanalyse von Sprachassistenten
SINUS-Institut mehr an traditionellen Werten festgehalten wird und eine geringere Akzeptanz gegenüber
Modernisierungsbestrebungenbesitzt,alsinDeutschland.80
IndemDiagrammistzuerkennen,dassdieAnteilederNutzervonSprachassistentengrößerwerden,
jehöherihresozialeSchichtundjeneuorientierterdasMilieuist.DementsprechendistderAnteilvon
Sprachassistenten-Nutzern bei den Performernmit 36% am größten.81 Dieser Personenkreis zeichnet
sich durch erfolgsorientiertes Denken aus und bilden die Leistungselite einer Gesellschaft.82 Im Gegen-
satzdazuhatdieGruppederTraditionellenmit4%dengeringstenNutzeranteil.83
Die oben erwähnte Umfrage von Splendid Research liefert darüber hinaus Informationen zu den An-
schaffungsgründen von Sprachassistent.Mehr als die Hälfte der 383 befragtenNutzer haben diesen,
bereitsvorinstalliert,mitihremSmartphoneerworben.SiehabensichsomitnichtaktivumdieAnschaf-
fungbemühenmüssen.Fast22%derUmfragegruppesagtenaus,dasssieanKonzeptundTechnologie
der digitalen Assistenten interessiert seien. Zeitersparnis bzw. Bequemlichkeit gegenüber der manuellen
Eingabe führten etwas weniger als jeder Fünfte an.84
Neben denAnschaffungsgründen, wurden die Nutzer auch nach denAnwendungen gefragt, die sie
bei einemSprachassistenten amhäufigsten nutzenwürden.Diese sind dasDiktieren vonMessenger-
Nachrichten(67%),dieSuchfunktionperVoiceSearch(65%)unddasSteuernvonMusik(62%),alsdie
dreimeistgenutztenAnwendungen.Dichtgefolgtdavon,liegenmitjeweils60%Wettervorhersagenund
die Steuerung des Fernsehers über Spracheingabe.85
80 Vgl.ebd.,S.15
81 Vgl.BarthundCerny,S..
82 Vgl.BertramBarth:OrientierunginderUnübersichtlichkeit:DasSINUS-ModellfürJugendlicheund jungeErwachseneinÖsterreich.inBarth;Flaig;Schäuble;Tautscher,Praxis der Sinus-Milieus® (s.Anm.81), S. 81
83 Vgl.BarthundCerny,S.9
84 Vgl.SplendidResearchGmbH:DigitaleSprachassistenten
85 Vgl.ebd.
48 49Potenziale für Marken und Unternehmen
assistenten insgesamt zu einer Steigerung des Onlinehandels kommen wird. 90
AllerdingszeigenandereQuellen,dassdieSorgevoreinemOnlinehandel-MonopolvonAmazontrotz
über 50Millionen verkauftenAlexa-Geräten, zum jetzigenZeitpunkt noch unbegründet ist. In ihrem
Artikel vom August 2018 berichtet das amerikanische Online Magazin »The Information«,dassbisjetzt
nur2%derNutzervonalexabasiertenGeräteneinenEinkaufperVoicegetätigthätten.Vondiesen2%
wiederumwürden90%keinenweiterenvoicebasiertenEinkaufmehrtätigen.91
EsseienbisjetztnursehrwenigeVoice-Einkäufe,erklärteininternerKontaktvonAmazon,allerdings
könnte es zu einem schnellenAnstieg kommen, sobald die Nutzer herausgefunden hätten, was das
Besondere an dieser Art des Einkaufens sei.
Diese Einschätzung bestätigt auch das Strategieunternehmen OC&C Strategy Consults, die einen
Umsatz von 40 Mrd. US-Dollar im Bereich des voicebasierten E-Commerce bis zum Jahr 2022 prognos-
tizieren.92
Hingegen ist Jo Jaquinta, ein Software-Entwickler, der bereits mehrereAlexa-Skills entwickelt hat,
derMeinung,dassSprachanwendungen fürdenSales-Bereichungeeignet seien.Dennerkennekeine
Anwendung,diealleindurchihrein-App-EinnahmendieeigeneEntwicklungfinanzierenkann.Ersieht
das Potenzial vielmehr im Bereich von Public Relations und Marken Awareness.93
Dieses Problem erkannte auch das Startup-Unternehmen Voice Labs. Es hatte sich zum Ziel gemacht
Werbeeinspielungen inAlexa Skills zu implementieren, um diese zu finanzieren. Marken hätten so
dieMöglichkeit, ähnlichwie beiRadiowerbung, ihreBotschaften denNutzern zukommen zu lassen.
Allerdings stellte Voice Labs das Angebot nur wenige Wochen nach dem Start der Werbeausspielungen
wieder ein. Grund dafür seien Änderungen in den Zulassungsbedingungen für Alexa Skills, wie
Voice Labs berichtet. Alexa sehe keine Notwendigkeit Werbeeinspielungen zu erlauben. Ausgenommen
90 Vgl.FlorianKolfundJoachimHofer:Sprachassistent:AlexawirdzumSchreckenderHändler. Handelsblatt.2018
91 Vgl.PriyaAnand:TheRealityBehindVoiceShoppingHype.TheInformation.2018
92 Vgl.ebd
93 Vgl.ebd
8. Potenziale für Marken und Unternehmen
WogenaudiePotenzialederSprachanwendungen imMarketing liegen, umdie zuvorgenannteZiel-
gruppezuerreichen,undwieMarkensienutzenkönnenzeigtdiesesKapitel.
DaserkennbargrößtePotenzialliegtaufSeitenvonAmazon,GoogleundCo.DennsiesindimBegriff
alle existierendenOnlinedienste auf ihren eigenenPlattformen zubündelnund schaffen sichdadurch
einen entscheidenden Wettbewerbsvorteil gegenüber der Konkurrenz.86
Damit werden dieMarktführer zu sogenannten Gatekeepern, die entscheiden, welches Produkt oder
welche Dienstleistung dem Kunden zum Verkauf angeboten wird. Dementsprechend schlägt Amazon
dem Kunden vor allem Eigenmarken vor und erschwert es externen Herstellern überhaupt erst wahr-
genommen zu werden.87DennimGegensatzzueinervisuellenApp,indiederNutzerauseinerlangen
Listevergleichenundauswählenkann,88sindbeidemMediumVoice,nureinbiszweiProduktvorschlä-
gezuhören,daeinehöhereZahlbeimNutzerzurÜberforderungführenwürde.89
Ähnlich argumentieren auch die Autoren Florian Kolf und Joachim Hofer in einem Artikel des
»Handelsblatt«vom18.Juli2018.Siebetonen,dassdieKundenbequemlichkeitverhindernwürdeAlter-
nativen zu vergleichen und dies zu einer Kaufentscheidung zu Gunsten der priorisierten Amazon Eigen-
markenführenwürde.SobestündedieGefahr,dasssichAmazonalsDritterzwischendenKundenund
denHändlerschiebtunddamitdenNutzeraktivdaranhindert,Konkurrenzproduktezuerwerben.
Der Handel im E-Commerce wäre somit eingeschränkt. Gleichzeitig erwartet Achim Himmelreich,
Experte von der Unternehmensberatung Campgemini, dass es aufgrund der Intuitivität von Sprach-
86 Vgl.Kuhn,S.51
87 Vgl.FrankBachér|MelanieSchlegel|MalteKosub|PascalFantou,interviewtvonHaraldFortmann, 11.04.2018,Hamburg;DieneueMarketingweltvonAlexaundCo
88 Vgl.Pearl,S.31
89 EigenerVersuch:»IchmöchteBatterienkaufen«
50 51Potenziale für Marken und Unternehmen
davonseiWerbungbeiSkills,dieRadiostreaming,PodcastoderTageszusammenfassungenenthalten.94
So verkündete derAlexa Skill der amerikanischenTageszeitungWashington Post im Sommer 2016,
dass ihre tägliche Zusammenfassung nun von der Investment-Bank Morgan Stanley gesponsert wird.
Diesgeschieht,ähnlichwievonVoiceLabsgedacht,alskurze15-sekündigeAudioeinspielung,vordem
Podcast.95
Nach einem Artikel der Marketingzeitung »Horizont« wird sich in den nächsten ein bis zwei Jahren
durch Sprachassistenten auch die Werbung im Radio verändern. Denn das Zapping-Phänomen im
Fernsehen bei der Einblendung vonWerbeblöcken findet imRadio derzeit kaum statt. Entsprechend
oftwird derWerbeblock in diesemMedium angehört.Wird dasRadio allerdings über einenSprach-
assistenten bedient, genügt ein Zuruf, um zum nächsten, werbefreien Sender zu wechseln. Experten
erwartenausdiesemGrund,dassAmazonsichähnlichwieimBereichdesE-CommercezwischenSender
und Hörer platzieren wird, um zum Beispiel bei jedem Senderwechsel Werbung zu spielen. Diese
könnedankpersonenbezogenerDatenauchpersonalisiertwerden.96
NebendengeringenMöglichkeitenWerbungaufSprachassistentenabzuspielen,istauchdieVerlinkung
zu externen Apps oder Webseiten technisch bis jetzt noch nicht etabliert. Damit ist die Chance mit einem
SkilldieDownloadzahleneinerAppoderdieAnzahlderBesuchereinerWebseitepositivzubeeinflussen
derzeitnochzugering,alsdassessichlohne,GeldindieEntwicklungenzuinvestieren.97
AufderanderenSeitesprichtMicrosoftsCEOSatyaNadelladavon,dassder40MilliardenUS-Dollar
schwereApp-MarktinZukunftvon(Sprach-)Botsersetztwerdenkönnte.98
94 Vgl.IngoPakalski:VoiceLabs:VorerstdochkeineWerbunginAlexa-Skills.Golem.de.2017
95 Vgl.WashingtonPostPR:MorganStanleysponsorsTheWashingtonPost’s2016flashbriefingson Alexa-enableddevices.WashingtonPost.2016
96 Vgl.JulianePaperlein:DieAudio-Revolution:Alexa&Co:WieSprachassistentenundSmartspeakerdas RadiounddasMarketingverändern.Horizont,32/2018(2018):S.8–9
97 Vgl.Eisenbrand:MarketingmitAmazonAlexaSkills
98 Vgl.Kuhn,S.51
DiederzeitigeNutzungderAlexaSkillshängtihremPendant,denvisuellenAppsderzeitnochdeutlich
hinterher.AllerdingsgibteserstaunlichvieleNutzer,wenninErwähnunggezogenwird,welchkurzen
Zeitraum die Sprachassistenten im Vergleich zu den visuellen Smartphone-Apps erst auf dem Markt
sind.99
EntsprechendgroßistdasPotenzialdesEinsatzesvonGoogleActionsoderAlexaSkillsimMarketing
vonUnternehmen.MiteinemVoiceInterfacekönnendieNutzerpersönlichmitderMarkesprechenund
das Unternehmen antwortet direkt. Dies kann die Hürde zur Nutzung eines Produktes oder einer Dienst-
leitung reduzieren und gleichzeitig zu einer Festigung der Kundenbindung führen. Zum Beispiel bietet
dieamerikanischeBankCapitalOneihrenKundenan,ihrenKontostandunddieletztenKontobewegun-
gen durch einen Alexa Skill zu erfragen.100
WieschoninderfrühenZeitderIVR-SystemekönntenSprachanwendungendenKundenserviceauto-
matisieren.DamitkönntePersonalgespartundeffektivereingesetztwerden.Aufeinfacheundhäufige
KundenfragenkönntederSprachassistentmitstandardisiertenAussagenantworten.WerdendieFragen
komplexer und spezifischer, würde derKunde an einenmenschlichenAnsprechpartnerweitergeleitet
werden,derdenServicefortführt.101
DaskonkretePotenzialeinesMediumszubeschreiben,welchesnochindenKinderschuhensteckt,ist
schwierig.Doches istnichtzuübersehen,dassSprachassistentenschon jetzteine immergrößerwer-
dende Rolle im Leben der Menschen spielen. Also sollten sich auch Unternehmen mit den Potenzialen
diesesMediumsfrühzeitigbeschäftigen,umihrezukünftigenundderzeitigenKundenzuerreichen.
99 Vgl.Eisenbrand:MarketingmitAmazonAlexaSkills
100 Vgl.RolandEisenbrand:MarketingmitAmazonAlexaSkills:DassinddieerstenReichweitenzahlen. OnlineMarketingRockstars.2017
101 Vgl.AlexandraLindner:5Marketing-TippsfürSprachassistenten.com!professional
52 53Voice Search
9. Voice Search
»Eine Suche ist eine Form der Frage-Antwort-Kommunikation. […]« 102
Nach der These des Horizont-Autors André Vieregge geht es bei Voice-Search um kurze verständliche
Antworten,diedieSuchanfragedesNutzersklärenundbeenden.103
Anders sieht dies Oliver Barrenbrügge, wie er in einem Bloggbeitrag der Marketingagentur iCross
beschreibt.Erbetont,dassgeradeW-FragenRückschlüsseaufdieIntentiondesSuchendenzulassenund
anhandihrerzuerkennenist,inwelcherEntscheidungsphasediesersichgeradebefindet.Diesgilteszu
nutzen,ummiteinerzielgerichtetenKommunikationdieSucherergebnissezuoptimieren.
Fragen,diemit»Was…?« oder »Wie…?«beginnen,deutendaraufhin,dassderNutzersichnochinder
Recherchephase befindet. Stellt er allerdingsFragen, diemit»Wo…?« oder »Wann…?« beginnen, so
hatersichbereitsentschiedenundistbereitzuhandeln,indemerz.B.einenLadenbesucht,einProdukt
kauft oder eine Dienstleistung in Anspruch nimmt.104
Hier verweist Barrenbrügge auf den Vergleich zwischen Sprachassistenten und Verkäufern im echten
Laden.ErstelltdieFrage,wiesicheinVerkäuferverhaltenwürde,dervoneinemKundenmiteinerW-
Frage konfrontiert wird.105AlltäglicheErfahrungenzeigen,dassderVerkäuferbeidenFragen»Was…?«
oder »Warum…?«denKundenzudeminteressierendenProduktbzw.derDienstleistung,beratenwürde.
WeiterführendbeginntindieserBeratungs-Phase,trotzderzuBeginndesKapitelsaufgestelltenThese,
eine Konversation zwischen Verkäufer und Käufer.
102 AndréVieregge:VielLärmumnichts:WasVoiceSearchwirklichfürSEAbedeutet.Horizont.2017
103 Vgl.ebd.
104 Vgl.OliverBarrenbrügge:TheDivineVoice-DiegöttlicheStimme?-TeilEins.iCrossing.2018
105 Vgl.ebd.
Um ein Beispiel zu nennen:
EinKundeerkundigtsichineinemFahrradgeschäft,wasfüreinRadambestenfüreineTourin
den Bergen geeignet ist. Anstatt dass der Verkäufer kurz und knapp mit Mountainbike antwor-
tet,wirderwahrscheinlichdemKundenweitereFragenstellen,umbesseraufseineWünsche
einzugehen.ZumBeispielwieteueresmaximalseindarf,obderKundeeinebestimmteMarke
präferiert oder ob er bereits Erfahrung mit Bergtouren hat.
ZiehtmandenVergleichzurückzuVoiceSearch,sosolltediesprachbasierteSuchenichteinfachnurein
Frage-Antwort-Formatsein,wiezuBeginnzitiert.VielmehrkönntejenachFragedesSuchenden,der
SprachassistentpassendeergänzendeFragenstellen,umdieSuchergebnisseeinzugrenzenundzuverfei-
nern und damit besser die Intentionen und Wünsche des Kunden zu befriedigen.106
DerstrukturelleAufbauvonVoiceSearchsollesichdahernichtanderherkömmlichenSucheperTasta-
tur orientieren – sondern an dem Verkaufsgespräch eines realen Verkäufers.
1.1. Suchmaschinenoptimierung
Bereits letztes Jahr sagteGooglesCEOSundarPichai,dass20%allerSuchanfragenbeiGoogleüber
die Stimmeneingabe abgewickelt werden.107 Prognosen sagen bis zum Jahr 2020 sogar einen Zuwachs
von30–50%voraus.108EntsprechendwichtigistdieFrage,wieMarkenaufdiesenAnstiegvonVoice-
Search-AnfragenreagierenundSuchmaschinenoptimierungbetreibenkönnen.
106 Vgl.ebd.
107 Vgl.Vieregge:VielLärmumnichts:WasVoiceSearchwirklichfürSEAbedeutet
108 Vgl.OliverBarrenbrügge:TheDivineVoice-DiegöttlicheStimme?-TeilEins.iCrossing.2018
54 55Voice Search
Durch die digitalenAssistenten hat sich dieArt undWeise, wie nach Informationen gesucht wird,
verändert.FrüherbestandenSuchanfragennochauseinzelnenKeywords,diesoknappwiemöglichdas
Gesuchte wiedergegeben haben. Durch Sprachassistenten nähern sich die Suchanfragen immer weiter
dernatürlichenSprachean.EntsprechendwirdvielnachsogenanntenLong-Tail-Keywordsgesucht,also
längere, zusammenhängendeSätzeoderFragen.Dies sindvorallemdie typischenW-Fragen.Anstatt
also nach »bestes Café Hamburg« zu suchen, sindbeiVoiceSearchAnfragenwie»Wo finde ich das
beste Café in Hamburg«zuhören.
DieseAnfragensindinderRegelpräziser,sodassirrelevanteSuch-Ergebnisseausgeschlossenwerden
können.AndréViereggenenntfolgendesBeispiel:WennmandendigitalenAssistentennach»Wie schwer
darf mein Koffer sein«fragt,soisteindeutig,dasskeineErgebnissezumKaufeinesKofferserwünscht
sind, sondern das Gewicht beim Fliegen, obwohl das Schlüsselwort »Koffer« in der Search-Query
vorkommt.109
WelcheMaßnahmenkönnenalsoWebseitenbetreiberergreifen,umauchüberVoiceSearchgefundenzu
werden?ZudiesemThemahatJohnMueller,SeniorWebmastervonGoogle,AnfangdesJahres2018
einLive-InterviewaufGooglesMessengerHangoutgehalten,indemeraufFragenzuaktuellenVoice-
Search-Trendseingegangenist.DiesebeinhalteteunteranderemauchdieMethoden,dieergriffenwer-
den können, damit Webseiten Voice-Anfragen zufriedenstellend beantworten und entsprechend von
Google besser gerankt werden.
Muellerbetont,dassdieTechnologieamAnfangstündeundnochvielArbeitvonGooglesSeiteerfor-
derlichist.AberauchdieNutzermüssensichdarüberklarwerden,wassievonVoiceSearcherwarten.
Dies sei allerdings ein sich langsam entwickelnder Prozess.
DerContent der Seite sollte so geschrieben sein, dass er natürlich klingt und problemlos vorgelesen
werdenkann,soMueller.EntsprechendmachediekünstlicheAufblähungderKeywordanzahl,umein
besseresRankingzuerzielen,keinenSinnmehr.Essolltevielmehrdaraufgeachtetwerden,inkurzen
109 Vgl.Vieregge:VielLärmumnichts:WasVoiceSearchwirklichfürSEAbedeutet
und klaren Sätzen zu schreiben, damit die Kernaussagen der Texte besser vomGoogle-Algorithmus
verstandenwerdenkönnen.110
Er argumentiert mit der Gefahr, dass Webseitenbetreiber mehrere kleine Seiten kreieren könnten,
die nur auf bestimmte Long-Tail-Keywords optimiert sind. Diese Doorway-Pages sind von Google
unerwünscht.SiewürdenzwarAntwortenaufdieFragenliefern,allerdingsseienesqualitativminder-
wertigeSeiten.DeshalbempfiehltMuellerdenEinsatzeinesVoiceCode-Snippets,welchesimQuellcode
derWebseiteeingefügtwird.Es fasstdie InformationeinerSeitezusammen, sodass sieüberSprach-
assistenten wiedergegeben werden kann.111
SokönnenFragenwie»Was sind die Neuigkeiten
der NASA« per Sprache beantwortet werden und
sind dementsprechend über Voice Search erreich-
bar.
Circa sechs Monate nach seinem Online-Inter-
view stellt Google das von Mueller erwähnte
Voice-Snippet vor. Es ist allerdings bis jetzt nur
für amerikanische und registrierte News-Web-
seiten verfügbar.112
Strukturierte Daten sind nach seiner Aussage eine
weitere Maßnahme, die ergriffen werden kann,
damit Googles Sprachassistent gezieltere Ant-
worten auf Fragen liefern kann.113 Strukturierte
Daten helfen Google dabei die Informationen
110 Vgl.JohnMueller:EnglishGoogleWebmasterCentraloffice-hourshangout.GoogleWebmasters.2018
111 Vgl.ebd.
112 Vgl.SusanneGillner:Googlepräsentiert»Speakable«:WebseitenfürdenAssistantoptimieren. InternetWordBusiness.2018
113 Vgl.JohnMueller:EnglishGoogleWebmasterCentraloffice-hourshangout
Abb. 8: Strukturierten Daten auf einer Webseite am
Beispiel eines Restaurants
56 57Voice Search
einerWebseite besser zu verstehen. Diese Daten werden dem Quellcode derWebseite hinzugefügt,
sodass Google die zusammengefassten Informationen ohne Probleme lesen kann (Abb. 8).114
AufderBasisdieserDatenerstelltGoogleunteranderemspezielleSnippets,diedirektaufdenSuch-
ergebnisseiten angezeigt werden. Diese sogenannten Featured Snippets liefern zum Teil schon die
AntwortderFrage,ohnedassaufeinSuchergebnisgeklicktwerdenmuss(Abb.9).115
Bezogen auf Voice, würde das
Vorlesen dieser Informationen
allerdings nicht bedeuten, dass
der Suchende auch die Webseite
besucht und eine Conversion –
also eine bestimmte Aktion aus-
löst.SobalderdieAntwortauf
seine Frage bekommen hat,
gibt es für ihn keinen Grund mehr die Webseite zu besuchen. Dieses Problem bestand allerdings schon
früher,alsGoogledieFeaturedSnippetseinführteundwirdwohlauchnichtdurchVoiceSearchgelöst
werden.116
Esmuss also ein Zwischenweg gefundenwerden, dieAntworten so zu formulieren, dass derNutzer
trotzdemnochInteressehat,diezitierteWebseitezubesuchen.
DerGoogleAssistantversuchtdiesesProblemzulösen,indemerdiezitierteQuellenennt:
Nutzer: Wie putze ich meine Brille richtig?
GA: Laut Mr. Spexs: Das Wasser sollte lauwarm sein, um die Beschichtung der
Gläser nicht zu beschädigen…
114 Google:IntroductiontoStructuredData.Google.2017
115 Vgl.ebd.
116 Vgl.Barrenbrügge:TheDivineVoice-DiegöttlicheStimme?–TeilEins
Mit der Phrase »Laut Mr. Spexs«,gibtGoogledemNutzerdieMöglichkeitdieseSeiteaufzurufen,um
weiterführende Informationen zum Thema zu bekommen.
Zusammengefasst ist für Unternehmen die Suchmaschinenoptimierung im Voice Search ein erster und
wichtiger Einstieg in das Thema Sprachassistenten. So lässt sich mit geringem Aufwand die Markt-
präsenz über die Sprachsuche verbessern. Zur Interaktion mit dem Kunden sind eigene Sprachanwen-
dungenerforderlich,derenKonzeptionimFolgendenerläutertwird.
Abb. 9: Featured Snippet auf Googles Ergebnisseite bei der
Suchphrase: »Wie putze ich meine Brille?«
60 61KonzeptionelleVorüberlegungenfüreineeffektiveSprachanwendung
10. Konzeptionelle Vorüberlegungen für eine effektiveSprachanwendung
Inihrem2004erschienenWerkschriebenCohen,GiangolaundBaloghüberVoiceUserInterfaces,die
über dasTelefonmit seinenNutzern interagieren.Damals dachtennur diewenigstendaran,wie sich
Sprachassistenten in den kommenden Jahren entwickeln würden. Obwohl ihr Werk mittlerweile 14 Jahre
alt ist,beschreibtesdochsehrgutdiekonzeptionellenVorüberlegungen,diebeidenPlanungeneiner
Sprachanwendung im Marketing notwendig sind. Deshalb soll ihr Schriftwerk im folgenden Kapitel bei
der Planung von modernen Sprachinterfaces herangezogen werden.
ZurKonzeptioneineseffektivenVUIssindimVorfelddiefolgendenPunktegenaustenszuanalysieren:
- Businessziele
- Nutzer und deren Verhalten
- Inhalt der Anwendung
So kann dieAnwendung denNutzer zufrieden stellen, ein hohesEngagement erzielen und somit ihr
Zielerreichen.Wirdnichtdaraufgeachtet,bestehtdieGefahr,dassdasVoiceUserInterfaceaufwendig
geändert werden muss oder es im schlimmsten Fall ein Misserfolg wird.117
ImFolgendenwerdenFragengestellt,diefüreineerfolgreicheKonzeptionundGestaltungbeantwortet
werden müssen.
117 Vgl.Cohen,GiangolaundBalogh,S.45
10.1. DefinitionderBusinessziele
Zuerst ist zu klären, welche Motivation oder welchen Mehrwert die Marke mit der Entwicklung
einerSprachanwendungverfolgt.Dieskönnenz.B.Kostenreduzierungensein,umPersonal-oderandere
Werbekosten einzusparen.
Ersetzt oder ergänzt eine Sprachanwendung beispielsweise den Kundenservice einer Versicherung,
so werden Servicemitarbeiter von standardisierten Anfragen entlastet.
DarüberhinauskönntedurcheinVoiceinterfaceeinkomplettneuerServiceetabliertwerden.Sokann
z.B. Ebays Sprachanwendung auf Zuruf den Wert für gebrauchte Gegenstände ermitteln.118
WennesmitderSprachanwendungeinezweiteMöglichkeitgibtaufdenServicezuzugreifen,wiedie
VerfolgungvonPaketsendungenperSpracheundLink,sosolltegenaugeprüftwerden,wasandemVUI
besser ist als an der bisherigen Schnittstelle zum Kunden.
BeiderAusgestaltungderAnwendungistdaraufzuachten,dassdieArtderStimmeunddasDesigndes
Dialoges zum Produkt bzw. Service passen muss. Das Image der Marke und die Zufriedenheit der Nutzer
sinddabeiimFokuszuhalten.IstdasNutzerziel,möglichstvieleInformationenzuerhalten,soisteine
lückenlose Informationswiedergabe ohne viele Interaktionen erforderlich.
Zu guter Letzt muss der potenzielle Kunde auf die Sprachanwendung aufmerksam gemacht werden.
Auchhierfürmussgeklärtwerden,überwelcheKanäleundinwelcherFormdiesameffektivstenge-
währleistet werden kann.119
118 Vgl.RichardNieva:GoogleHomeandeBaycantellyouhowmuchthat‘sworth.Cnet.2017.
119 Vgl.Cohen,GiangolaundBalogh,S.46–48.
62 63KonzeptionelleVorüberlegungenfüreineeffektiveSprachanwendung
10.2. Nutzer- und Nutzungsverständnis
Neben den Businesszielen ist auch das Wissen über den Nutzer und dessen Verhalten eine wichtige
Voraussetzung,umeineeffektiveSprachanwendungzuerstellen.
DerfolgendeAbschnittwirdsichdaherinzweiBereicheaufteilen.DemNutzerprofil,welchessichmit
denAnwendernbeschäftigenwirdunddemNutzungsprofil,indemesumdieFragegehtwiedieSprach-
anwendung bedient wird.
10.2.1. Nutzer
Alserstesistzuklären,wermitderSprachanwendungerreichtwerdensoll.DaransinddieReaktionen
unddasVerhaltenderAnwendung anzupassen.Spricht dieZielgruppe einenAkzent oderDialekt, so
kannesangenehmerfürsiesein,wennderSprachassistentmitdemselbenAkzentantwortet.Genauso
verhält es sich mit dem Sprachstil. Abhängig von der Zielgruppe ist es z.B. sinnvoll in Fach- oder
Jugendsprache zu antworten.
Eskannsogarvorteilhaftsein,beiunterschiedlichenZielgruppenparalleleAnwendungenfürdasgleiche
Produkt anzubieten.Dies kann dieBeratung zu einerVersicherung oderBankdienstleistung sein, die
unterschiedliche Altersgruppen ansprechen soll.
UnterschiedlicheGestaltungsmöglichkeitenergebensichauch,wenndieNutzerbereitsmitderBedie-
nung von digitalen Assistenten vertraut sind. Entsprechend müssen gelernte Befehle und Verhaltens-
weisennichtmehrSchrittfürSchritterklärtwerden.GenaudiesmussbeiNutzernbeachtetwerden,die
bishernichtmitderNutzungdieserGeräteinBerührunggekommensind.GeradedieseNutzerkönnten
eventuellhöhereErwartungenbesitzen,alsdieHeavy-User,diemitdenVerhaltensmusternvonSprach-
assistenten bereits vertraut sind.
Die hohen Erwartungen liegen darin begründet, dass neue Nutzer mit dem Sprachassistenten häufig
einen realenMenschen assoziieren. Es ist alsowichtig, gerade amTelefon, frühzeitig klarzumachen,
dass es sich um ein Bot handelt.
SoempfiehltauchGooglesInteractionDesignerinMargaretUrbanzuBeginneinerSprachanwendung
eineArt erklärende virtuelle Tour durch dieAnwendung anzubieten. Sie begründet dies damit, dass
imKörperdesNutzersGlückshormoneausgeschüttetwerden,wenneinSprachbefehlerfolgreichaus-
geführtwurde.Esseialsosinnvoll,demNutzergleichzuBeginnzuzeigen,wieerdieAnwendungrich-
tig zu bedienen hat.120
Diese Vorgehensweise wurde durch die Anfang 2018 durchgeführt Studie von Facit Digital in Koope-
rationmit derVoiceUser ExperienceAgenturVUI.agency, bestätigt. Probanden ohne Erfahrungmit
Sprachassistenten wurden in zwei Gruppen aufgeteilt. Die eine Gruppe bekam eine virtuelle Tour durch
dieAnwendung,dieanderenicht.
97%derTeilnehmer,ohneHilfestellung,hättendiesebegrüßt.VonderanderenGruppewarenfast60%mit
der bereitgestellten Hilfestellung zufrieden oder hätten eher mehr davon gewünscht. Für eine gute User
Experience bei einer Sprachanwendung ist also eine geführte Einweisung erforderlich. Patrik Esslinger
empfiehltallerdings,einemitderZeitabnehmendeAnzahlanHilfestellungen,umdenNutzernichtzu
nerven.121
10.2.2. Nutzung
Neben dem wer ist auch das wie eine entscheidende Frage, um ein gutes Zielgruppenverständnis zu
erhalten. Denn je nachdem wo, wann und warum der Nutzer mit der Sprachanwendung interagiert,
ergeben sich neue Paradigmen hinsichtlich der Anforderungen an die Anwendung. Wird sie z.B. im Auto
genutzt,musssowohlderInput,alsauchderOutputgegendieVerkehrsgeräuscheankommen.Wirdsie
120 Vgl.Pearl,S.19–20
121 Vgl.ChristianBopp:UserExperiencebeiVoiceUserInterfaces–EineTagebuchstudieamBeispielAmazon Echo.Facit.2018
64 65KonzeptionelleVorüberlegungenfüreineeffektiveSprachanwendung
zuHausegenutzt, sprichtderNutzereherüberprivateDinge,alswennersich imöffentlichenRaum
befindet.
Ebensowichtigistes,denGrundfürdieAnwendungzukennen–wirdeinkonkretesZielverfolgt,oder
möchtederNutzernurunterhaltenwerden?
DesWeiterenistzuberücksichtigen,wiesehrdieKonzentrationdesNutzersaufderAnwendungliegt.
WirdsiewährenddesKochensoderAutofahrensausgeführt,sosolltesiekürzereundkonkretereInfor-
mationen liefern,alswennderFokusausschließlichaufderAnwendungliegt.Somit istderGraddes
Multitaskings während der Nutzung ein entscheidender Faktor für das spätere Design.
Auch dieDauer undHäufigkeit, der zu erwartendenNutzung der Sprachanwendung, ist bei derGe-
staltungzubeachten.WerdenAnwendungennurseltengenutzt,empfiehltessich,dassdieAnwendung
wieder mit einer Einführung startet.
BeimehrfacherNutzunghingegen,könntedieAnwendungdenaktuellenNutzerstandspeichern,ähnlich
wie beispielsweise bei einer unterbrochenen Bestellung. Eine Zwischenform der beiden Varianten ist auch
denkbar, sodass bestimmte persönliche Einstellungen bei der folgendenNutzungwieder aufgegriffen
werden.122
BeieinemkonkretenAnwendungsbeispielmussalsovorherdurchdachtwerden,fürwendieAnwendung
erstelltwirdundwiesichderNutzerverhaltenwürden.DieseÜberlegungenbildendieGrundlagederzu
entwickelndenSprachanwendungundsolltengroßenEinflussaufdiesehaben.
10.3. Inhalt der Anwendung
BevoresindiekonkreteUmsetzunggeht,musszunächstermitteltwerden,welcherInputvomNutzer
erforderlichist,sodassermitderAnwendungzufriedenistundmitdenrichtigenInformationenversorgt
wird.Dabeiistesnotwendig,diejeweiligenFragensoprägnantzuformulieren,dassdieAntwortendes
122 Vgl.Cohen,GiangolaundBalogh,S.48–51
Nutzersmöglichstkonkretundeindeutigausfallen.DieTechnologie istzwarmittlerweile inderLage
InformationenauchausstarkverschachteltenSätzenzuextrahieren,wiederdigitaleAssistentHound
zeigt. Allerdings ist es für Menschen unnatürlich in langen komplizierten Sätzen zu sprechen. Deshalb
sollte ihnen die Sprachanwendung entgegenkommen und geschlossene Fragen stellen, auf die kurz
geantwortet werden kann.123 Die Anzahl dieser Fragen sollte zudem auf das absolut Notwendigste redu-
ziertwerden,umdenNutzernichtunnötigzubelästigen.124
NebenderInformationsbeschaffungistaucheinAugeaufmöglicheFragendesNutzerszuwerfen.Es
sollteimVorfeldüberlegtwerden,wasderNutzerfragenkönnteundwiedieSprachanwendungentspre-
chend zufriedenstellend antworten kann.
DesWeiteren kann mit einbezogen werden, ob es externeAnwendungen gibt, die mit der Sprach-
anwendungverbundenwerdenkönnen.Wenndiesebereits nützliche InformationenüberdenAnwen-
derenthalten,somussdieAnwendungdiesenichtmehrerneuterfragen,sondernkannaufdasexterne
Nutzerkonto zugreifen. Zum Beispiel nutzt der Alexa Skill von Lieferando die Angaben zum Lieblings-
essenderNutzer,dasseparatüberdieHandy-Appeingegebenwirdund imLieferando-Kontogespei-
chert ist.AlexakenntalsobereitsdasGericht,dasderNutzerbestellenmöchte,wennernachseinem
Lieblingsessen fragt.125,126
DieobenbeschriebenenVorüberlegungenbeziehensichaufspezielleVoraussetzungen,dieeineSprach-
anwendung erfüllen sollte. Allerdings ist bereits ein allgemeines Verständnis des Verhaltens und der
Probleme des Nutzers von Vorteil, wenn es um die Entwicklung einer mehrwertbietenden Sprach-
anwendung geht.127
123 Vgl.Pearl,S.159
124 Vgl.Cohen,GiangolaundBalogh,S.48–50
125 Vgl.Liferando:EssenbestellenmitAmazonAlexa-derLieferando.deSkill.2017
126 Vgl.Cohen,GiangolaundBalogh,S.53–54
127 Vgl.ebd.,S.4
66 67Reduzierung des kognitiven Aufwands
11. Reduzierung des kognitiven Aufwands
Nachdem sich das vorangegangene Kapitel mit den Vorüberlegungen beschäftigt hat, wird nun auf
konkrete Maßnahmen eingegangen, die ergriffen werden können, um der größten Schwäche einer
Sprachanwendung,denfehlendenvisuellenInformationen,entgegenzuwirken.
JedesUserInterfacebeanspruchtdiekognitivenFähigkeitenseinesBenutzers.DieseFähigkeiten,wie
Wahrnehmung,Aufmerksamkeit,Merkfähigkeit und dasTreffen vonEntscheidungen sind jedoch nur
begrenzt verfügbar.
Bei sprachbasierten Interfacen ist die Beanspruchung des kognitiven Denkens besonders groß. Die
dargestelltenInformationensindnichtstetigaufdemBildschirmzufinden,sondernstehennurkurzzur
Verfügung und müssen folglich schnell nacheinander aufgenommen werden.
DiesesKapitelwirdeinenÜberblickderMöglichkeitengeben,umeinVUIsointuitivwiemöglichzu
gestalten.128
11.1. Konsistenter Aufbau
DieKomplexitätderSprachanwendungkanndurcheinenkonsistentenAufbaureduziertwerden,umso
die Benutzerfreundlichkeit des VUIs zu verbessern.
DieskannunteranderemdurchdaskonstanteEinsetzenvonBedienelementengeschehen.EinzelneWör-
ter wie »Hilfe« und »Wiederholen« können dabei als universelle Sprachbefehle genutztwerden.De-
renFunktionsweisemussunabhängigvomZeitpunkt,andemsiegenanntwerden,immerdieselbesein.
JenachAnwendungsfallkannesunterschiedlicheuniverselleKommandosgeben.Essollteneinfache,
128 Vgl.ebd.,S.119
kurzeBegriffesein,dieleichtzumerkensind.ZudemistessinnvollnichtzuvieleverschiedeneKom-
mandoszuzulassen,umeineÜberforderungdesNutzerszuvermeiden.
DieseSprachbefehlesolltendemNutzergleichzuBeginndererstenAnwendungvorgestelltwerden,um
früh eine Vertrautheit herzustellen.
In einem grafischenUser Interface,wird für Buttons, die dieselbenAktionen ausführen, ein einheit-
licherLookgewählt.ÜbertragenaufSprachanwendungenbedeutetdies,dassauchdasAusführenvon
ähnlichen Prozessen durch eine einheitliche Folge von Sprachbefehlen geschehen muss. Dabei ist es
unabhängig,obessichumdasNavigierendurchSpeisepläneoderZugverbindungenhandelt.
DesWeiterenistderEinsatzvonMetapherneininteressanterWeg,umdieKomplexitäteinerSprachan-
wendungzureduzierenundderenContextzuverdeutlichen.Ähnlichwieder»Schreibtisch« eines Com-
puters oder der »Warenkorb« im Onlineshop erleichtern diese das Verständnis für die Zusammenhänge.
Ein gutes Beispiel hierfür liefert eine Studie der britischen Telekom von 1999. In dieser Studie wurden
denProbandendreiverschiedeneTeleshopping-Möglichkeitenpräsentiert.DerEinkaufwarsowohlüber
eineMenüstruktur,einKatalogsystemalsauchübereineWarenhaus-Metaphermöglich.Indiesemvir-
tuellenLadenwurdenTür-,Kassen-undsogarFahrstuhlgeräuschesimuliert.DergrößteTeilderTeil-
nehmerempfanddiesealsdasangenehmsteEinkaufserlebnis.Darüberhinauswaresauchdaseffektivste.
Der gezielte Einsatz von Metaphern erweitert das VUI um die visuelle Komponente im Kopf des
Nutzers.129
129 Vgl.ebd.,S.119–24
68 69Reduzierung des kognitiven Aufwands
11.2. Aufbereitung der Informationen
NebendemkonsistentenAufbauhatauchdieArtderInformationsaufbereitungeinenwichtigenEinfluss
auf die User Experience des Voice User Interface.
Im Verlauf der Arbeit wurde bereits die »Millersche Zahl«erwähnt,diebesagt,dassderMenschnicht
inderLageist,mehralssiebenDingeinseinemKurzzeitgedächtniszubehalten.Hierbeimussbetont
werden,dassesjedochdeutlichanspruchsvollerist,einemSprachassistentenzuzuhören,alsindenvon
GeorgeMillerdurchgeführtenVersuchen.DennnebendemErinnernandieSätzedesAssistenten,muss
derNutzerauchdiefür ihnrelevantenInformationenherausfilternundzusätzlichaufgestellteFragen
reagieren.
Experimenteindenfrühen2000erJahrenhabengezeigt,dassPersonen,diemiteinemSprachassistenten
interagieren, sich maximal vier verschiedene Informationseinheiten merken konnten. Dies lässt den
Rückschlusszu,dassAuswahlmenüsineinerSprachanwendungnichtmehralsdreibisvierverschiedene
Elementebeinhaltensollten,umeineNutzerüberforderungzuvermeiden.
EineweiteremöglicheÜberforderungdesAnwenderskanndurchdieNutzungdesRezenzeffektverrin-
gertwerden.DiesesPhänomenbeschreibt,dassInformationenbesserwahrgenommenwerden,wennsie
am Ende eines Satzes genannt werden.
In ihrem Buch »Voice User Interface Design« nennen die Autoren folgendes Beispiel:
»Um das Gesagte noch einmal zu hören, sage ›Wiederholen‹« seibesser,als
»Sage ›Wiederholen‹, um das Gesagte noch einmal zu hören.«
BeidererstenEingabeaufforderungwirddieentscheidendeInformationamEndegenanntundentspre-
chend besser behalten, als bei derZweiten.DieseMethode lässt sich auch auf andere Informationen
übertragen,diefürdenNutzervonBedeutungsindundandieersicherinnernsoll.130
130 Vgl.ebd.,S.125–29
Sprachanwendungen werden häufig neben anderen Tätigkeiten, wie Hausarbeit oder Autofahren,
bedient.Es istdahervonentscheidenderBedeutung,dasseineAnwendungsowenigAufmerksamkeit
wiemöglichinAnspruchnimmt.DafürsinddierelevantenInformationendemNutzermöglichstkurz
und präzise zugänglich zu machen. Weitere Details sollten erst zu einem späteren Zeitpunkt wieder-
gegeben werden.
Geschiehtdiesnicht,soistderNutzermitdergroßenMengeanInformationenüberfordert,wiefolgendes
Beispiel zeigt:
Alexa: Wo soll es los gehen?
Nutzer: Braunschweig.
Alexa: Dein Start ist Braunschweig. Was ist dein Ziel?
Nutzer: München
Alexa: Dein Ziel ist München. Wann möchtest du fahren?
Nutzer: Heute 16 Uhr
Alexa: Es gibt zwei Verbindungen von Braunschweig Hauptbahnhof nach München
Hauptbahnhof um 16 Uhr. Erste Verbindung planmäßige Abfahrt um 15 Uhr
34 heute voraussichtlich erst um 15 Uhr 43 mit ICE 16 99 ab Gleis 6. An
kunft um 22 Uhr. Zweite Verbindung planmäßige Abfahrt um 16 Uhr 59 mit
ICE 877 von Gleis 7. Du musst einmal in Göttingen umsteigen. Kann ich dir
sonst noch weiterhelfen?
Nutzer: Stopp.
70 Reduzierung des kognitiven Aufwands
AnstattdenNutzermitDetailszuüberfordern,diezudiesemZeitpunktnochuninteressantsind,könnte
die Sprachanwendung zuerst nur die Verbindungen aufzählen:
Alexa: Alles klar, dein Ziel ist München. Wann möchtest du fahren?
Nutzer: Heute 16 Uhr.
Alexa: Es gibt zwei Verbindungen nach München: um 15: 43 und 16:59 Welche
möchtest du nehmen?
Nutzer: Die erste
Alexa: Um 15:43 startet der ICE 1699 auf Gleis 6. Ankunft in München um 22 Uhr.
Du musst einmal in Göttingen umsteigen.
Möchtest du weitere Infos zu dieser Verbindung aufs Handy geschickt
bekommen?
EntsprechenddiesemPrinzipwerdendieInformationenzunächstaufdasabsolutNötigstereduziertund
demNutzerpräsentiert.JenachZielgruppekannvariieren,welcheInformationenfürsierelevantsind.
Wählt derNutzer nun einElement aus, so können detailliertere Informationen folgen.Dadurchwird
seineAufmerksamkeitsspannenichtmitInformationenstrapaziert,diefürihnnochnichtvonBedeutung
sind.131
131 Vgl.ebd.,S.129–31
72 73Use Cases für Sprachanwendungen im Marketing
12. Use Cases für Sprach- anwendungen im Marketing
Aus Marketingsicht ist der Blick in die der Top-Ten-Liste der Alexa Skills relativ ernüchternd. Die mei-
stenSkillsdieserListewurdenvonprivaten,unabhängigenEntwicklernerstellt, derenAnwendungen
keineMarketingambitionenhaben.AufdenvorderenPlätzenfindensichSkillswie»Pupsgenerator« und
»Katzengeräusche«,sowie»Empfangsdame«,derBesuchermiteinemlaunigenSpruchwillkommenheißt.
Nur zwei Unternehmen mit professionellen Ambitionen konnten sich unter den ersten zehn positionie-
ren. Die ARD mit ihrer Anwendung »Tagesschau in 100 Sekunden« und der Radiosender Antenne Bay-
ern.Dieser bietet dieMöglichkeit, den Sender zu streamen und Infos zu aktuellenVerkehrslagen zu
erhalten.132
InDeutschlandgibteszwarweitereSkills,dievonbekanntenMarkenbetriebenwerden,wie»Mytaxi«,
»Deutsche Bahn« oder der Lieferdienst »Lieferando«,allerdingsscheintesso,alsobsiebisjetztnoch
keinen passenden Use Case gefunden haben. Denn diese Skills sich nicht in dem Ranking der beliebtes-
tenAlexa-Skillswiederzufinden.133
Auf dem amerikanischen Markt hingegen ist es diversen Anbietern gelungen mit Alexa-Skills Marketing
zu betreiben. Im Folgenden die interessantesten Beispiele:
- Der Skill »Tide-Stain Remover« des Waschmittels Tide wurde von dem
GroßkonzernProcter&Gambleentwickeltundliefertfürüber200Fleckenarten
einepassendeSchritt-für-Schritt-Anleitung,umihnzuentfernenundvermarket
dabei seine Produkte.134
132 Vgl.RolandEisenbrand:AmazonverrätinsgeheimdiebeliebtestendeutschenAlexaSkills. OnlineMarketingRockstars.2017
133 Vgl.ebd.
134 Vgl.Procter&Gamble:Tide–StainRemover.Amazon
- »Wine Finder«isteinSkill,umdenpassendenWeinzueinemGerichtzufinden.
Dabei schlägt es auch für einfache Gerichte wie Pizza oder Hot Dogs einen pas
senden Wein vor.135AufdieseWeisekönntenWeinebeworbenundauchverkauft
werden.
- Der Entwickler Brandon Telle entwickelte mit »Board Game Answer«einenSkill,
derdemNutzer,dieAnleitungvonBrettspielenerklärt.AufkonkreteFragenwie
»Wie viele Spieler können bei Monopoly mitspielen?« liefert Alexa eine passende
Antwort.136DieHerstellervonGesellschaftsspielenkönntenalsodieRegelnvor
und während des Spiels durch einen Sprachassistenten erklären lassen. Damit lässt
sich das Spielerlebnis steigern und die gedruckte Anleitung einsparen.
- Der Alexa Skill des Whisky-Herstellers »Johnnie Walker«istinderLage,Fragen
zuWhiskysortenzubeantworten.ErkanndurchgezielteFragenzuGeschmack,
VorliebenundPreiseinenpersönlichenWhiskyempfehlen.WennmanProdukte
erworbenhat,kannderSkilleineauthentischeWhisky-Verkostung,wieimStamm
haus durchführen.137
- Der Tierfutter-Hersteller »Purina PetCare«,entwickeltedenSkill
»Ask Purina« welcher sich nicht um die direkte Vermarktung der Produkte
kümmert,sondernNutzerneinBeratungstoolandieHandgibt,dieperfekte
Hunderassezufinden.138 Auch so lassen sich neue Kunden generieren.
135 Vgl.BloopEntertainment:WineFinder.Amazon
136 Vgl.BrandonTelle:BoardGamesAnswers.Amazon
137 Vgl.Ann-ChristinSchneider:AlexamachtVoiceContentMarketingzumneuenTrend.VoiceContent Marketing-AlexabistdudieZukunft?Xengoo.2018
138 Vgl.ebd
74 Use Cases für Sprachanwendungen im Marketing
- DerAlexaSkilldesBarbecuesoßen-HerstellersStubb,berätseineNutzerbei
Grill-RezeptenundgibtihnendieMöglichkeitSoßenperSprachezubestellen.
DasBesonderedesSkillsist,dassnichtAlexaantwortet,sondernder
Firmengründer mit seiner markanten Stimme.139
- DieGoogleActionvonEbayermöglichtesNutzerndenWertvonWarenzu
erfahren,diesieverkaufenwollen.MitgezieltenFragennachMarke,Spezifika-
tionenundZustand,nenntdieActionzuwelcherPreispannederNutzerdas
ProduktaufEbayverkaufenkönnte.140 So wird die Nutzung von Ebay erleichtert
und neue Kundengruppen erschlossen.
AllevorgestelltenSkillszeigendasMarketingpotenzialvonSprachanwendungen.Esgelingtihnen,den
Kunden einenMehrwert zu bieten und gleichzeitig dieMarken-Awareness zu vergrößern bzw. neue
Kunden zu generieren.
Allerdings ist die Nutzung von Skill noch nicht nachhaltig genug. Nach einer Studie von Voice Labs
nutztennur3%einenSkillauchinderzweitenWochenachderAktivierung. 141 Es ist noch viel in die
Content-Qualitätzuinvestieren,umdasgroßePotenzialvonSprachanwendungenfürUnternehmenzu
heben. Gerade deutsche Unternehmen haben im Vergleich zu amerikanischen einen erheblichen Nach-
holbedarf. Der amerikanische Markt ist hier viel weiterentwickelt und sollte als Vorbild fungieren.
Hiergiltes,alsdeutscheMarkenundUnternehmen,nichtdenAnschlusszuverlieren.
139 Vgl.Stubb‘sLegendaryBar-B-Q:AskStubb.Amazon
140 Vgl.Nieva:GoogleHomeandEbaycantellyouhowmuchthat‘sworth
141 Vgl.VoiceLabs:The2017VoiceReport.VoiceLabs.2017
78 79Umfrage bei Kolle Rebbe
13. Umfrage bei Kolle Rebbe
Im Rahmen dieser Bachelorarbeit wurde eine Umfrage zum Thema Sprachassistenten im Marke-
ting in der Hamburger Werbeagentur Kolle Rebbe durchgeführt. Die Umfrage wird einen Vergleich
zwischen den Ansichten der Marketingexperten in der Agentur und dem Verhalten der Nutzer ziehen. Die
Aussagen der Werber werden den Daten potenzieller Nutzer aus der Online-Statistik-Plattform Statista
und anderen repräsentativenQuellen gegenübergestellt.UmdiesenVergleich besser zu verdeutlichen
wird die Hamburger Umfrage orange dargestellt, während die anderen Umfragen in blau abgebildet
werden.
DarüberhinauswardasZiel,EinblickeindieEinschätzungderMitarbeiterhinsichtlichderNutzung,des
Potenzials und der Anwendung von Sprachassistenten in der Werbung zu gewinnen.
DerOnlinelinkzurUmfragewurdeanalleknapp300MitarbeiterderAgenturgesendet,vondenenmehr
als jeder fünfte teilgenommen hat.
13.1 Allgemeine Angaben der Teilnehmer
Über 80% der Teilnehmer stammen aus den relevanten
Bereichen Kreation (42%) und Beratung (40%), wobei die
Altersgruppender20–29-jährigenmitfast50%amstärksten
vertreten war (Abb. 10).
Zur besseren Segmentierung wurde diese Alters-gruppe
nochmals aufgeteilt in die 20–25- und 26–30-jährigen,
die sich mit etwa 25% gleich verteilen. Die zweitgrößte
Altersgruppe mit 35% bilden Personen zwischen 31 und
39 Jahren, während die über 40-jährigen nur zu 14% vertreten sind. Zur Einschätzung
des Potenzials und der Nutzung von Sprachassistenten wurde eine weitere Segmentierung basierend
aufdemTätigkeitsbereichvorgenommen.DreiviertelallerMitarbeiterarbeiteninderKlassik,diesich
mitdenMedienTV,RadioundPrintbeschäftigen.DasrestlicheViertelistindendigitalenMedientätig.
Insgesamt nutzen bereits knapp 60% der Befragten einen Sprachassistenten. Damit sind sowohl
dieAssistenten auf den Voice-Only-Geräte bzw. Smartspeaker gemeint, als auch die in das Handy
integriertenAssistenten.Esfälltauf,dasseskeinesignifikantenUnterschiedeindenNutzeranteilennach
den Tätigkeitsbereichen Kreation, Beratung oder
Digital und Klassik gibt.
Anders als erwartet, werden Sprachassistenten in
der Altersgruppe der 20–25-jährigen mit nur 50%
wenigergenutzt,alsbeidenÄlteren.
Auf die Frage, ob die Werber das Medium Voice
einempotenziellenKunden empfehlenwürden, ant-
worteten etwa 74% mit »ja« – unabhängig davon,
ob sie einen Assistenten selbst nutzten oder nicht.
Dabei fällt auf, dass die Empfehlungsrate der
Sprachassistenten-Nutzer mit 76% nur marginal
größer ist als die der Nichtnutzer mit 70%. Das
links stehende Sunburst-Diagramm zeigt dies im
Überblick(Abb.11).
Abb. 10: Altersüberblick der befragten
Werber von Kolle Rebbe
20-25
26-3031-39
40-4950+
Abb. 11: Nutzung von Sprachassistenten der
Werber und deren Empfehlung als
Medium im Marketing
80 81Umfrage bei Kolle Rebbe
bei denMitarbeitern aus, die für die digitalen
Medien arbeiten. Hier ergibt sich ein Mittel von
ca. 75 mit deutlich geringerer Streuung. Nur
7%diesesSegmentshabeneinenWertunter50
ausgewählt.
In derAnnahme, dass dieAntworten normal-
verteilt sind, ergibt sich das Diagramm in
Abbildung 13, bei demman deutlich erkennt,
dass der digitale Bereich das Potenzial von
VUIs im Marketing höher einschätzt und die
Meinungen dieses Segments nicht so weit
streuen,wiebeiderKlassik.
Entsprechend den Unterschieden bei der Ein-
schätzung des Potenzials von Sprachassistenten
zwischenKlassikundDigital,findensichdiese
auch bei der Beurteilung des geeigneten Kunden-
spektrums. Aus einer Kundenliste von Kolle
Rebbe konnten die Befragten die Unternehmen
heraussuchen,welcheihrerMeinungnachdashöchstePotenzialaufweisen,eineSprachanwendungim
Marketing zu benutzen. Dabei war Mehrfachauswahl zugelassen.
Die 13 meistgenannten Kunden sind in dem obenstehendes Diagramm aufgelistet (Abb. 14). Die Mar-
ketingexpertenweisendenDienstleisternO2undNetflixdasmeistePotenzialzu.AberauchAudiund
Lufthansa liegen sehr weit vorne.
DieThese,dassDienstleistungsfirmengrößereChancenhabenMarketingmitSprachanwendungenzu
betreibenalsProduktverteiber,zeigtauchdasErgebniseinerweiterenFrage.Hierantworteten80%der
Werber,dasseineDienstleitungbessergeeignetseidigitaleAssistentenzubenutzten,alsProdukte.
DieUmfragewurdesoangelegt,dassdieBefragten,je
nachdem ob sie bereits einen Sprachassistenten nutzen
oder nicht, zu anderen Fragenweitergeleitet wurden.
Die nachfolgende Auswertung bezieht sich auf die
Mitarbeiter,diebereitseinenSprachassistentenbenutzen
(35 Personen).
DabeigehtesumdieNutzungvonThird-Party-Apps,
wie Skills oder Actions. Es sollte herausgefunden wer-
den,wiehochdieNutzungvondiesenAnwendungen
ist.Nuretwa30%nutzenSkillsoderActionshäufigeralseinmalimMonat.DerGroßteilderBefragten
nutzt die Third-Party-Sprachanwendungen gar nicht (Abb. 12).
Im weiteren Verlauf der Umfrage wurden die Mitarbeiter um ihre Einschätzung hinsichtlich der Rolle
von Sprachassistenten im zukünftigen Marketing gebeten. Dazu sollten sie auf einer Skala von 0–100 das
Potenzial markieren. Null stand in diesem Fall für »keine Rolle« und 100 für »eine sehr große Rolle«.
DieseFragewarunabhängigdavon,obsiebereitseinenSprachassistentennutzenodernicht.Miteinem
Mittelwertvonca.64schreibendieAgenturmitarbeiterdendigitalenAssistenteneinerhöhtesPotenzial
im Marketing zu. Für die beiden Medienbereiche Klassik und Digital ergeben sich nach der Auswertung
des arithmetischen Mittels aller-
dings unterschiedliche Werte.
In der Klassik liegt es bei knapp
60. Allerdings ist die Streu-
ung der Antworten sehr groß,
sodass knapp 25% der Perso-
nen, die in der Klassik arbeiten,
ihre Markierung bei weniger als
50 gesetzt haben. Anderes sieht es
Abb. 14: In welchen Kunden sehen die Werber das
meiste Potenzial gesehen.
0 10 20 30 40
O2
Netflix
Audi
Audible
Lufthansa
DAZN
Hey car
BA für Arbeit
inlingua
Enterprise
Aktion Mensch
TUI
arte
nie
alle 2 Tage
monatlich
täglich alle 2 Wochen
Abb. 12: HäufigkeitderNutzungvon
Third-Party-Apps der Werber
0 25 50 75 100
Klassik Digital
Abb. 13: Potenzialeinschätzung von Sprachassistenten im
Marketing nach Klassik und Digital
82 83Umfrage bei Kolle Rebbe
Mit der nächsten Frage wurden den
Teilnehmern verschiedene Einsatz-
möglichkeiten derAssistenten vorge-
schlagen,ausdenensiemaximalzwei
markierenkonnten.Esergabsich,dass
die meisten Personen den Bereich
»Informationen vor dem Verkauf«
auswählten. Die »Beratung« vor und
nach dem Verkauf wurde deutlich
weniger markiert. Dem Sprach-
assistenten wird scheinbar keine Kom-
petenz in der Beratung der Nutzer
zugetraut. Hingegen wird viel Poten-
zial in dem schnellen und einfachen
Informieren des Nutzers gesehen.
Zudem ist eine Unterscheidung zwischen »vor« und »nach« dem Verkauf zu erkennen. Dem Zeit-
raum »vor dem Verkauf«wirdmehrPotenzialzugesprochen,alsdemAfter-Sales.InderoberenGrafik
ist dies durch die unterschiedlichen Farben dargestellt. Im »direkten Verkauf« wird kein Potenzial für
Sprachassistenten gesehen (Abb. 15). Dies bestätigt die bereits getätigte Aussage im Kapitel »Potenziale
für Marken und Unternehmen«.
13.2. Sprachassistenten
ImVerlaufderweiterenUmfrage,wurdendieMitarbeitervonKolleRebbeumeineEinschätzungder
Zielgruppe vondigitalenAssistenten gebeten.Auf dieFrage,welcherSprachassistent, ihrerMeinung
nachamhäufigstengenutztwird,lagdieMehrzahlderAntwortenbeiAlexaundSiri,wobeiAlexaetwas
Abb. 15: Einschätzung der Einsatzmöglichkeiten von
Sprachassistenten im Marketing
häufigererwähntwurde.DerGoogleAssistantspielenureineuntergeordneteRolle,sodieWerber.Die
Sprachassistenten Bixby von Samsung und Cortana von Microsoft wurden gar nicht genannt (Abb. 17).
Diese Einschätzungen decken sich nicht mit einer im Herbst 2017 durchgeführten Online-Umfrage in
Deutschland(Abb.16).BetrachtetmandieNutzungderGeräte,soliegenbeideUmfragenweitausein-
ander.LautderdeutschlandweitenUmfrage,mitübertausendTeilnehmern,nutzennur8%derBefragten
Alexaregelmäßig.AnderssiehtesbeidemGoogleAssistantundSiriaus,diebeidefastdoppeltsooft
verwendet werden.
Die Nutzung der Sprachassistenten deckt sich jedoch nicht mit ihrem Bekanntheitsgrad, sondern
verhalten sichkonträr zueinander.Sokennen88%allerDeutschenAlexa, dochnur etwa einZehntel
davonnutztdiesenAssistentenauch.DerGoogleAssistantundSirisindweitwenigerbekannt,werden
jedochhäufigerverwendet.142
142 Vgl.SplendidResearchGmbH:DigitaleSprachassistenten
Abb. 16: Nutzung und Bekanntheit von
Sprachassistenten in Deutschland
Abb. 17: Einschätzung der Werber, welcher
Sprachassistentamhäufigstengenutztwird.
0 20 40
Alexa
Siri
GoogleAssistent
Cortana
Bixby
0% 20% 40% 60% 80%
GoogleAssistent
Siri
Cortana
Alexa
regelmäßige Nutzung ist bekannt
84 85Umfrage bei Kolle Rebbe
assistenten im Auto die meisten Nutzer vermutet
haben (Abb. 19).
Betrachtet man die deutschlandweite Verteilung
der verschiedenen Hersteller bei den Smart-
speakern genauer, so zeigt sich Amazon mit
dem Echo als absoluter Marktführer in Deutsch-
land (Abb. 20). Fast dreiviertel der 164
befragten Smartspeaker-Nutzer verwenden dieses
Voice-Only-Gerät,währendnur15%denGoogle
Homebenutzen.DieweiterenverfügbarenSmartspeakervonLenovo,SonosundSonyspielenimMarkt
nur eine untergeordnete Rolle.145
Zum Zeitpunkt dieser Umfrage war Google Home allerdings erst ein paar Monate auf dem Markt.
Zudemkonnteder,erst2018inDeutschlanderschie-
nene,HomePodvonApplekeineBerücksichtigung
finden.
AndersalsvondenWerberneingeschätzt,habennicht
Voice-Only-Geräte diemeisten Nutzer, sondern die
digitalen Assistenten auf den Handys. Das integrierte
Sprachassistenten im Auto bis jetzt noch keine
bedeutendeRollespielen, stimmtmitdenAussagen
der Marketingexperten überein.
145 Vgl.Statista:SmartSpeaker.Statista.2018
ZusammenfassendverzeichnetderSprachassistentAlexazwardiegrößteBekanntheitinderdeutschen
Bevölkerung, aber nicht die meisten Nutzer. Hier dominieren Siri und GoogleAssistant denMarkt.
Diesistvermutlichdaraufzurückzuführen,dasssichbeidevorinstalliertaufdenmeistenHandysfinden
lassen,währendAmazonkeinbekanntesSmartphonevertreibt.143
DieWerber sahen inAlexa den meistgenutzten Sprachassistenten, obwohl er nur den Bekanntesten
darstellt.
13.3. Sprachbasierte Geräte
Die Nutzerverteilung von sprachbasierten Geräten aus einer deutschlandweiten Umfrage
von 2018 mit 1.600 Befragten zeigt, dass 58% digitale Assistenten auf ihrem Smartphone
nutzen (Abb. 18). Damit ist das Handy mit Abstand das meistgenutzte Endgerät. Hingegen nutzen
nur etwa 17% einen Sprachassistenten auf Voice-Only-Geräten bzw. Smartspeakern. Eine
noch geringere Nutzungsquote haben die Sprach-
assistenten, die in das Infotainmentsystem von
Fahrzeugen integriert sind.144
Hier stimmen diese Aussagen nicht vollständig
mit denEinschätzungen derWerber überein, von
denen 45% vermuten, dass Voice-Only-Geräte
wie Amazon Echo oder Google Home die meisten
Nutzer besitzen würden. Etwas seltener markierten
sie Sprachassistenten in Smartphones, während
nur etwa 20%, bei den integrierten Sprach-
143 Vgl.Heuzeroth:KriegderSprachassistenten
144 Vgl.Statista:MitwelchenGerätenhabenSieschoneinmaleinenSprachassistentengenutzt?Statista.2018
Abb. 19: häufigstesNutzungsgerätnachMeinung
der Werber.
0 10 20 30
Voice-Only
auf dem Handy
im Auto
0% 20% 40% 60% 80%
Amazon Echo
Google Home
Lenovo SmartAssistent
Sonos One
Sony LF-S50G
Abb. 20: Nutzung von Smartspeakern in
DeutschlandAbb. 18: Nutzung nach Gerät in Deutschland
0% 20% 40% 60%
Smartphones
Tablets
PC/Laptop
Voice-Only
Auto
Smartwatch
86 87Umfrage bei Kolle Rebbe
13.4. Altersgruppen
DieMarketingexpertenkonnteninderUmfragezweiAltersgruppenmarkieren,dieihrerMeinungnach
am besten mit Werbung über Sprachassistenten zu erreichen sind. Die Meisten von ihnen gaben die Ziel-
gruppe der 20- bis 39-jährigen als die relevanteste Gruppe an. Die Wenigsten sahen in der Zielgruppe der
über59-jährigendasgrößtePotenzial(Abb.21).
Eine2017inÖsterreichdurchgeführteUmfragezeigt,dassdieVerteilungderNutzerindenverschiedenen
Altersgruppenandersist,alsdieWerberdiesvermutethaben.
LautderösterreichischenUmfragesinddie14–19-jährigendieAltersgruppe,dieamhäufigstenSprach-
assistentennutzten(40%).AuchindieserUmfragezeigtsich,dassdieüber59-jährigen,mit22%die
wenigsten Nutzer vorzuweisen haben (Abb. 22).146
146 Vgl.BarthundCerny,S.12
In Bezug auf das Einkommen der verschiedenen Altersgruppen liegt die Einschätzung der Hamburger
Werber nicht schlecht. Denn die unter 20-jährigen haben in Deutschland das geringste Einkommen
und entsprechend auch die geringsteKaufkraft. Das höchste Einkommen findet sich bei den 45–50-
jährigen.147,148 Aus diesem Grund ist die Ausweitung der geeignetsten Zielgruppe auf die 20–39-jährigen
durch die Marketingexperten von Kolle Rebbe eine durchaus realistische Einschätzung.
Sie sollten jedoch trotzdem weder die 14–19-jährigen als Hauptnutzer von Sprachassistenten vernachläs-
sigen,nochdiewachendeZielgruppeder60-plus-Generation.
13.5. Nutzungsort
Hinsichtlich der Frage, ob Sprachassistenten in den eigenen vier Wänden oder unterwegs häufiger
genutzt werden, decken sich die Aussagen der Hamburger Umfrage mit vergleichbaren Statistiken
aus anderen Quellen. Die meisten der befragten
Personen nutzen ihre Sprachassistenten im
privaten Umfeld. Nur sehr wenige Nutzer,
sprechen mit den digitalen Assistenten in der
Öffentlichkeit, inBusbzw.Bahnoder inGemein-
schaftsbüros (Abb. 23). Dies ist aller Voraussicht
auf die, bereits in der SWOT-Analyse erwähnte,
fehlende Privatsphäre zurückzuführen, die die
Nutzer daran hindert, persönliche Informationen
verbal zu teilen. Die amerikanische digital Agentur
147 Vgl.Statista:DurchschnittlicherBruttojahresverdienstderArbeitnehmerinDeutschlandnachAlters gruppenimJahr2010.2010
148 Vgl.Statista:AnteilderKaufkraftderDeutschennachAltersgruppen
Abb. 21: Geeignetste Altersgruppe für Sprach-
assistenten nach Einschätzung der
Werber
Abb. 22: Nutzer von Sprachassistenten nach
Alter in Österreich
0 20 40 60
14-19
20-39
40-59
60+
0% 10% 20% 30% 40%
14-19
20-39
40-59
60+
Unterwegs
zu Hause
Abb. 23: Einschätzung, an welchem Ort Sprach-
assistentenamhäufigstengenutztwerden
88 89Umfrage bei Kolle Rebbe
Stone Temple Consulting konnte jedoch in einer Umfrage von 2018 eine Veränderung dieses Verhaltens
im Vergleich zum Vorjahr feststellen. Laut deren CEO Eric Enge werden die Nutzer immer aufgeschlos-
sener,SprachassistentenimöffentlichenRaumzunutzten.DieUmfragewarallerdingsaufdenamerika-
nischen Raum beschränkt.149EinemöglicheÜbertragungaufdeutscheNutzerbleibtoffen.
13.6. Potenzial im Marketing
AufgrunddesverzweigtenAufbausderUmfrage,wurdendieEinschätzungenzumMarketingpotenzial
ausschließlichdenKolleRebbeMitarbeiterngestellt,dieeinenSprachassistentennutzen.Jenachdem,
ob sie den Einsatz von Sprachassistenten einem potenziellen Kunden empfehlen würden oder nicht,
wurdenanschließendgetrenntnachdenGründenbefragt.
Dabei hatten Teilnehmer bei den genannten
Fragen die Möglichkeit je zwei Antwort-
möglichkeitenzumarkieren.
DiemeistenMitarbeiter, die den Einsatz von
Sprachassistenten empfehlen würden, nann-
ten Innovation als Hauptargument (Abb. 24).
EineÜbersichtderAntworten,istindemunten
stehenden Diagramm zu finden. Über die
Möglichkeit der freien Texteingabe wurden
mit »Barrierefreiheit« und »Kundenbindung«
zwei weitere gute Argumente genannt.
Als Hauptargument der Teilnehmer, die
den Einsatz von digitalen Assistenten in der
149 Vgl.EricEnge:31MustKnowMobileVoiceUsageTrendsfor2018.StoneTempleConsulting.2018
Werbungnichtempfehlen,wurdeeinezuge-
ringeGrößederZielgruppegenannt(Abb.25).
Zu guter Letzt wurden die Werber nach den
GeschäftsfeldernmitdemhöchstenPotenzial
für Sprachassistenten befragt. Diese Frage
konnte in einem freien Textfeld beantwortet
werden.
AmhäufigstenwurdenServicedienstleistun-
gen, wie Finanz- und Informationsdienste
genannt. Etwas seltener wurde die Auto-
mobilbranche und der Entertainmentbereich
aufgeführt.
13.7. Zusammenfassung der Umfrage
Die Umfrage liefert ein recht unterschiedliches Meinungsbild der Werber. Einige sehen sehr viel
Potenzial indemneuenMedium,anderesprechendendigitalenAssistentenkaumeineBedeutung im
Marketingzu.Diesunterstreichtauchdas letzte, freieAntwortfeldderUmfrage, indasdieBefragten
offenihrepersönlicheMeinungzudemThemaSprachassistentenimMarketingäußernkonnten.Zwar
teilten die meisten den virtuellen Assistenten eine nicht zu vernachlässigende Bedeutung im Leben der
Konsumentenzu,warensichjedochbezüglichderAnsichtenzumNutzenimMarketinguneinig.
Ausgelöst durch diese Umfrage wurde das Thema Sprachassistenten imMarketing bei Kolle Rebbe
intensivdiskutiert.Eszeigtesich,dasshierweiterer InformationsbedarfundpraktischeAnwendungs-
fälle notwendig sind, um die Nutzer und deren Verhalten besser einschätzen zu können. Diese
Kenntnisse sind jedoch unabdingbar für die Entwicklung von zielgruppenorientierten und mehrwertbie-
Abb. 24: Pro-Argumente
0 5 10 15 20
Innovation
bessererKundenservice
Schnelligkeit
natürlicheKommunikation
Emapthie
Nähe der Zielgruppe
andere
Abb. 25: Contra-Argumente
0 1 2 3 4
Zielgruppe zu klein
Entwicklungsstand
seltene Nutzung
fehlendeMarketingstudien
unpraktisch
es werden kaum Skillsgenutzt
90 91Umfrage bei Kolle Rebbe
tenden Sprachanwendungen angesehen.
Inwieweit mit dieser bei Kolle Rebbe durchgeführten Umfrage auf die Gesamtheit der deutschen
Werbeagenturengeschlossenwerdenkannistfraglich,dadieUmfragedafürmit64Teilnehmernnicht
repräsentativ ist.
EinedetaillierteAuswertungderUmfrageistimAnhangzufinden.
92 93Fazit
14. Fazit
VoiceUserInterfacebietenseinenNutzernvieleVorteile,dasieschnellerundintuitiverzubedienensind
als vergleichbare Mensch-Computer-Schnittstellen. Allerdings bedeutet dies im Gegenzug nicht zwangs-
läufig,dassderenNutzungauchfürdasMarketingsinnvollist.IhrEinsatzmachtnurdannSinn,wenn
sie dem Anwender einen realen Mehrwert bieten und nicht auf den ersten Blick als Werbung zu erkennen
sind.
UmdiesenMehrwertzuerreichen,istbeiderKonzeptioneinerSprachanwendungdiegenaueKenntnis
derZielgruppeunabdingbar.Ichbehauptesogar,dasssiewichtiger ist,alsbeieinervisuellenAnwen-
dung.DenndieNutzungderSprache folgt keinen explizit erlerntenBedienelementen,wiebei einem
grafischenNutzerinterface.SieistintuitiverundvonMenschzuMenschunterschiedlich.Deshalbmuss
die Sprachanwendung genausten auf das Verhalten der Zielgruppe ausgerichtet werden.
Sollte keinMehrwert für dieNutzer gefundenwerden, so ist ihr Einsatz für dasUnternehmen nicht
sinnvoll.
Generell ist ein Umdenken bei der Gestaltung von sprachbasierten Anwendungen erforderlich. Es gibt
kein Wo, sondern nurWann und Wie der Nutzer die Informationen wahrnimmt. Wobei sich das Wie
ausschließlichaufdieArtundWeisederStimmebezieht.DiesschränktdieGestaltungsmöglichkeiten
erheblichein,eröffnetabergleichzeitigauchneueund interessanteMöglichkeitendieMarkeunddas
Unternehmen auditiv wahrzunehmen.
ZielderArbeitwares,eineAntwortaufdieFragezufinden,obSprachassistentenPotenzialhabenim
MarketingEinsatzzufinden.
DieAntwortlautet:Ja,habensie,allerdingsnurbedingt.
Meiner Meinung nach ist der direkte Verkauf von Produkten oder Dienstleitungen über digitale Assis-
tentenkaummöglich.VielgrößereChancenhabenSprachassistentenimBereichMarken-Awareness,da
hier die Marke mit einer mehrwertbringenden Anwendung verbunden werden kann.
VorgutzehnJahrenkamdasiPhoneaufdenMarkt.EinsehrteuresTelefon,dasdamalskaummassen-
tauglich erschien. Wie wäre damals eine Umfrage zum Thema »Chancen und Risiken von Smartphones
im Marketing«ausgefallen?Wahrscheinlichhätteniemandvorhergesagt,dassdieseinmilliardenschwe-
rer Markt werden würde. Heute stehen wir mit der Entwicklung von Sprachassistenten auf derselben
Entwicklungsstufe und führen die gleiche Diskussion mit ähnlichen Argumenten.
Die Technologie der digitalen Assistenten steckt noch in den Kinderschuhen. Sie lernt jedoch stetig dazu
und wird von Tag zu Tag besser. In weniger als zehn Jahren wird sie erwachsen und ein fester Be-
standteilunsererGesellschaftsein.EsistalsoeinMussfürjedewerbungtreibendeMarkeundAgentur,
sichschonjetztindenfrühenJahrenmitihrzubeschäftigen.HeutekönnensiedieArtundWeisewie
MarkenkommunikationaufSprachassistentenaussehenwirdnochmitgestalten,Erfahrungensammeln
und neue Wege einschlagen.
BegonnenhabeichmeineBachelorarbeitmiteinemderbekanntestenundeinflussreichstenScience-Fic-
tion-FilmeallerZeiten.DahermöchteichmiteinerMetapherausKubricksMeisterwerk»2001: Odyssee
im Weltraum«,auchschließen:
DerschwarzeMonolithstehtimFilmfürdieErkenntnisundEvolutionundtauchtimmerdortauf,wo
dieMenschheitsichverändertundweiterentwickelt.VielleichtistdernächsteMonolith,derdieÄrader
Sprachassistentenankündigt,bereitsaufdemWegzuuns.
Wirsolltenvorbereitetsein,umnichtmitgeschlossenenAugenanihmvorbeizulaufen.
94 95Literaturverzeichnis
Literaturverzeichnis
ANAND,Priya.TheRealityBehindVoiceShoppingHype.TheInformation.Zuletztgeprüft
am03.09.2018.www.theinformation.com|articles|the-reality-behind-voice-shopping-hype
BACHÉR,Frank,MelanieSCHLEGEL,MalteKOSUB undPascalFANTOU.
InterviewtvonHaraldFortmann.11.04.2018.Hamburg;DieneueMarketingweltvon
AlexaundCo
BAETZGEN,Andreas,Hrsg.BrandExperience.anjedemTouchpointaufdenPunkt
begeistern.1.Auflage2015.Stuttgart,2015
——— BrandExperience:EineEinführung.InBaetzgen,BrandExperience,S.3–15
BARRENBRÜGGE,Oliver.TheDivineVoice-DiegöttlicheStimme?-TeilEins.iCrossing.
Zuletztgeprüftam12.08.2018.www.icrossing.com|de|ideas|divine-voice-die-
goettliche-stimme-teil-eins
BARTH,Bertram.OrientierunginderUnübersichtlichkeit:DasSINUS-ModellfürJugend-
licheundjungeErwachseneinÖsterreich.InBarth;Flaig;Schäuble;Tautscher,Praxis
derSinus-Milieus®,S.81–94
BARTH,Bertram,CERNY,Sandra.IABTrendmonitor:DigitaleAssistenten.,Nr.5432
(2017)
BARTH,Bertram,FLAIG,BertholdB.HoherNutzwertundvielfältigeAnwendung:
EntstehungundEntfaltungdesInformationssystemsSinus-Milieus®.InBarth;Flaig;
Schäuble;Tautscher,PraxisderSinus-Milieus®,S.3–22
BARTH,Bertram,BertholdB. FLAIG,NorbertSCHÄUBLEund
ManfredTAUTSCHER,Hrsg.PraxisderSinus-Milieus®.GegenwartundZukunfteines
modernenGesellschafts-undZielgruppenmodells.Wiesbaden,2018
BENDEL,Oliver.300KeywordsInformationsethik.GrundwissenausComputer-,Netz-und
Neue-Medien-EthiksowieMaschinenethik.1.Aufl.2016.Wiesbaden:SpringerGabler,2016
doi:10.1007|978-3-658-10567-9.gbv.eblib.com|patron|FullRecord.aspx
BLOOP ENTERTAINMENT.WineFinder.Amazon.Zuletztgeprüftam05.08.2018.www.
amazon.com|Bloop-Entertainment-Wine-Finder|dp|B07CLH4WF3
BOPP,Christian.UserExperiencebeiVoiceUserInterfaces–EineTagebuchstudieamBei-
spielAmazonEcho.Facit.Zuletztgeprüftam20.08.2018.blog.facit-digital.com|user-
experience-bei-voice-user-interfaces-eine-tagebuchstudie-am-beispiel-amazon-echo
BRANDT,Mathias.Alexalerntschnell.Statista.Zuletztgeprüftam17.06.2018.de.statista.
com|infografik|10134|verfuegbare-skills-fuer-amazons-digitale-assistentin-alex
BUVAT,Jerome,TAYLOR,Mark,KeesJacobs,AmolKhadikarundAmritaSengupta.Conver-
sationalCommerce:WhyConsumersAreEmbracingVoiceAssistansinTheirLives,2018
COHEN,MichaelH.,GIANGOLA,JamesP.undBALOGH,Jennifer.Voiceuserinterface
design..2.Aufl.Boston,Mass.[u.a.]:Addison-Wesley,2004.
DIE BUNDESBEAUFTRAGTE FÜR DEN DATENSCHUTZ UND DIE
INFORMATIONSFREIHEIT.InternetauftrittderBundesbeauftragtenfürden
DatenschutzunddieInformationsfreiheit-Homepage-Sprachassistenten.Bund.Zuletzt
geprüftam10.09.2018.www.bfdi.bund.de|SharedDocs|Publikationen|DatenschutzKompakt-
Blaetter|Sprachassistenten.html?
EICHER,Hans.DieverblüffendeMachtderSprache.WasSiemitWortenauslösenoder
verhindernundwasIhrSprachverhaltenverrät.2.,durchgeseheneundkorrigierteAuf-
lage.Wiesbaden:Springer,2018.doi:10.1007|978-3-658-18663-0
96 97Literaturverzeichnis
EISENBRAND,Roland.AmazonverrätinsgeheimdiebeliebtestendeutschenAlexaSkills.
OnlineMarketingRockstars.Zuletztgeprüftam05.08.2018.omr.com|de|amazon-ale-
xa-top-10-skills
——— MarketingmitAmazonAlexaSkills:DassinddieerstenReichweitenzahlen.Online
MarketingRockstars.Zuletztgeprüftam17.06.2018.omr.com|de|amazon-alexa-skill-mar-
keting
ENGE,Eric.31MustKnowMobileVoiceUsageTrendsfor2018.StoneTempleConsulting.
Zuletztgeprüftam08.09.2018.www.stonetemple.com|voice-usage-trends|
STÖCKLE,Felix.ConnectingtheDots:DiekomplexenBeziehungenzwischenCustomer
Journeys,TouchpointsundBusinessEcosystemverstehen.InBaetzgen,BrandExperience,
S. 159–73
FLEIG,Jürgen.SWOT-Analyse:SowirdeineSWOT-Analyseerstellt.busines-wissen.de.
Zuletztgeprüftam01.07.2018.www.business-wissen.de|artikel|swot-analyse-so-wird-ei-
ne-swot-analyse-erstellt
GILLNER,Susanne.Googlepräsentiert»Speakable«:WebseitenfürdenAssistantopti-
mieren.InternetWordBusiness.Zuletztgeprüftam20.08.2018.www.internetworld.
de|online-marketing|google|google-praesentiert-speakable-webseiten-assistant-optimie-
ren-1568019.html
GLASCOTT,Mary.WhatisNaturalLanguageGeneration?narrarivescience.Zuletztge-
prüftam30.06.2018.narrativescience.com|Resources|Resource-Library|Article-Detail-
Page|what-is-natural-language-generation
GOEBEL,Tobias.Don‘tConfuseSpeechRecognitionwithNaturalLanguageUnderstan-
ding.aspect.Zuletztgeprüftam30.06.2018.blogs.aspect.com|dont-confuse-speech-recog-
nition-with-natural-language-understanding
GOOGLE.IntroductiontoStructuredData.Google.Zuletztgeprüftam20.08.2018.
developers.google.com|search|docs|guides|intro-structured-data
GUBERNATOR,Sebastian.Sprachassistenten:Senioren,freuteuchaufSiriundAlexa!
Welt.Zuletztgeprüftam23.07.2018.www.welt.de|debatte|kommentare|article172219708|-
Sprachassistenten-Senioren-freut-euch-auf-Siri-und-Alexa.html
HAASE,Daniel,KNOPF,IngoundRamezanian,Shajan.DieGeheimnisseunseresKörpers.
WDR.04.09.2018.Quarks&Co.Zuletztgeprüftam19.09.2018.www.wdr.de|mediathek|vi-
deo|sendungen|quarks-und-co|video-die-geheimnisse-unseres-koerpers-100.html
HARTMANN,Frank.InterviewtvonSebasitianKempkens.03.08.2013;Woherkommtdie
AngstvorTechnik?
HEUZEROTH,Thomas.KriegderSprachassistenten.Zuletztgeprüftam04.06.2018.
www.welt.de|print|die_welt|wirtschaft|article162439418|Krieg-der-Sprachassistenten.
html
HÖRMANN,Hans.PsychologiederSprache..Berlin,Heidelberg:SpringerBerlinHeidel-
berg,1967.doi:10.1007|978-3-662-25119-5
MUELLER,John.EnglishGoogleWebmasterCentraloffice-hourshangout.GoogleWeb-
masters.Zuletztgeprüftam19.08.2018.www.youtube.com|watch?v=JLCwGo43fAY.
KOLF,FlorianundHOFER,Joachim.Sprachassistent:AlexawirdzumSchreckenderHänd-
ler.Handelsblatt.Zuletztgeprüftam02.09.2018.www.handelsblatt.com|technik|
thespark|sprachassistent-alexa-wird-zum-schrecken-der-haendler|22812862.html
KREMPP,Matthias.ApplekündigtHomePodfürDeutschlandan.SpiegelOn-
line.Zuletztgeprüftam18.06.2018.www.spiegel.de|netzwelt|gadgets|apple-home-
pod-und-ios-11-4-smartspeaker-kommt-nach-deutschland-a-1210194.html
KUBRICK,Stanley.2001:OdysseeimWeltraum.2001:ASpaceOdyssey.UnterMitarbeitvon
KeirDullea.1968
KUHN,Thomas.JetztbringtAmazondiekünstlicheIntelligenzinsWohnzimmer.Wirt-
schaftswoche,Nr.44(2016):S.51–52.Zuletztgeprüftam08.06.2018.www.wiwo.de-
|technologie|digitale-welt|amazon-echo-jetzt-bringt-amazon-die-kuenstliche-intelli-
genz-ins-wohnzimmer|14712556.html
98 99Literaturverzeichnis
LALMAS,Mounia, O‘BRIEN,HeatherundYOM-TOV,Elad.Measuringuserengagement.
SanRafael,Calif,2014.site.ebrary.com|lib|alltitles|docDetail.action?docID=10990031
LEONG,Lewis.Whypersonalvoiceassistantsarethenextbigmarketingplatform.Zuletzt
geprüftam10.06.2018.blog.applovin.com|personal-voice-assistants-marketing-platform
LEVY,Nat.SiriShortcutsvs.AlexaSkills:HowAppleistappingappstocompetewith
Amazon’svoiceassistant.GeekWire.Zuletztgeprüftam07.09.2018.www.geekwire.
com|2018|siri-shortcuts-vs-alexa-skills-apple-tapping-apps-compete-amazons-voice-assistant
LIFERANDO.EssenbestellenmitAmazonAlexa–derLieferando.deSkill.Zuletzt
geprüftam05.08.2018.www.lieferando.de|blog|lieferando-skill-amazon-alexa
LINDNER,Alexandra.5Marketing-TippsfürSprachassistenten.com!professional.
Zuletztgeprüftam23.06.2018.www.com-magazin.de|news|business-it|5-marke-
ting-tipps-sprachassistenten-1466565.html
LATOSCHIK,MarcErich.SpezielleThemenderKI:NLP–NaturalLanguageProcessing–
Sprachverstehen,2006.Zuletztgeprüftam29.06.2018.www.techfak.uni-bielefeld.de|ags-
|wbski|lehre|digiSA|SS05|STDKI|Vorlesung|STdKI2NLP4.pdf
MILLER,George.ThemagicalnumberSeven,plusorminustwo:somelimitsonour
CapacityforProcessingInformation.PsychologicalReview,1955
NAGEL,TillS.CES:DigitaleSprachassistentensind2018eingrossesThema.
Zuletztgeprüftam13.06.2018.www.welt.de|wirtschaft|webwelt|article172455180|CES-
Digitale-Sprachassistenten-sind-2018-ein-grosses-Thema.html
NIEVA,Richard.GoogleHomeandeBaycantellyouhowmuchthat‘sworth.Cnet.
Zuletztgeprüftam20.09.2018.www.cnet.com|news|google-home-and-ebay-can-tell-you-
how-much-your-stuff-is-worth
PAKALSKI,Ingo.VoiceLabs:VorerstdochkeineWerbunginAlexa-Skills.Golem.de.
Zuletztgeprüftam03.09.2018.www.golem.de|news|voice-labs-vorerst-doch-keine-wer-
bung-in-alexa-skills-1706-128410.html
——— GoogleAssistant:ÜbersichtsseitefürverfügbareActionsgestartet.Golem.de.Zu-
letztgeprüftam24.06.2018.www.golem.de|news|google-assistant-uebersichtsseite-fu-
er-verfuegbare-actions-gestartet-1801-132062.html
——— StattGoogleAssistant:AlexaalsStandardassistentaufAndroid-Smartphonesnutz-
bar.t3nMagazin.Zuletztgeprüftam12.06.2018.t3n.de|news|android-smartphones-ale-
xa-statt-google-assistant-1077186
PAPERLEIN,Juliane.DieAudio-Revolution:Alexa&Co:WieSprachassistentenund
SmartspeakerdasRadiounddasMarketingverändern.Horizont,32/2018(2018):S.8–9
PEARL,Cathy.Designingvoiceuserinterfaces.Principlesofconversationalexperiences.
FirstEdition.Beijing:O‘Reilly,2017
PFLÜGER,Jörg.Ist»UserEngagement«messbar?enconda.Zuletztgeprüftam21.07.2018.
www.econda.de|2016|05|user-engagement
PROCTER & GAMBLE.Tide–StainRemover.Amazon.Zuletztgeprüftam06.08.2018.
www.amazon.com|P-G-Productions-Tide-Remover|dp|B01M9B7ZTB
SAS INSITUTE.WhatisNaturalLanguageProcessing?Zuletztgeprüftam29.06.2018.
www.sas.com|de_de|insights|analytics|what-is-natural-language-processing-nlp.html
SAUSSURE,Ferdinandd.GrundfragenderallgemeinenSprachwissenschaft.3.Aufl.Hrsg.
vonBally,Charles,Sechehaye,Albert.De-Gruyter-Studienbuch.Berlin,2001
SCHNEIDER,Ann-Christin.AlexamachtVoiceContentMarketingzumneuenTrend.
VoiceContentMarketing–AlexabistdudieZukunft?Xengoo.Zuletztgeprüftam
06.08.2018.www.xengoo.biz|2018|01|alexa-voice-content-marketing
SCHUSTER,Heidemarie.WasisteinSprachassistent?VogelCommunicationsGroupGmbH&
Co.KG.Zuletztgeprüftam13.06.2018.www.it-business.de|was-ist-ein-
sprachassistent-a-660785
100 101Literaturverzeichnis
SHAHANI,Aarti.VoiceRecognitionSoftwareFinallyBeatsHumansAtTyping,Study
Finds.npr.Zuletztgeprüftam01.07.2018.www.npr.org|sections|alltechconsidere-
d|2016|08|24|491156218|voice-recognition-software-finally-beats-humans-at-typing-
study-finds
SPLENDID RESEARCH GMBH.DigitaleSprachassistenten:EinerepräsentativeUm-
frageunter1.024DeutschenzumThemadigitaleSprachassistenten.Zuletztgeprüftam
11.09.2018.www.splendid-research.com.
STATISTA.AnteilderKaufkraftderDeutschennachAltersgruppen.Statista.
Zuletztgeprüftam27.09.2018.de.statista.com|statistik|daten|studie|163248|umfrage|kauf-
kraft-nach-altersgruppen
——— DurchschnittlicherBruttojahresverdienstderArbeitnehmerinDeutschlandnach
AltersgruppenimJahr2010.Zuletztgeprüftam30.09.2018.de.statista.com|statistik|daten
|studie|296286|umfrage|bruttojahresverdienst-der-arbeitnehmer-in-deutschland
——— AnteilderInternetnutzer,dieindenletztendreiMonatenEinkäufeundBestellun-
genüberdasInternetgetätigthaben,nachAltersgruppenimJahr2017.Statista.Zuletzt
geprüftam27.09.2018.de.statista.com|statistik|daten|studie|28542|umfrage|
nutzer-von-e-commerce-je-altersgruppe-im-jahr-2007
——— MitwelchenGerätenhabenSieschoneinmaleinenSprachassistentengenutzt?
Statista.Zuletztgeprüftam07.09.2018.de.statista.com|statistik|daten|studie|872294|
umfrage|nutzung-von-sprachassistenten-in-deutschland-nach-geraet
———SmartSpeaker.Statista.Zuletztgeprüftam07.09.2018.de.statista.com|statistik|studie|
id|55754|dokument|smart-speaker
StatistaundNorstat.WelcheGefahrensehenSiebeiderzunehmendenVerbreitungvon
Sprachassistenten?Statista.
——— WelchenNutzensehenSiebeiderzunehmendenVerbreitungvonSprachassistenten?
Statista.Zuletztgeprüftam22.07.2018
StiftungWarentest.HotlinesimTest:BeratenRoboterbesseralsMenschen?test,Nr.10
(2018).Zuletztgeprüftam27.09.2018.www.test.de|Hotlines-im-Test-5380471-0
STUBB‘S LEGENDARY BAR-B-Q.AskStubb.Amazon.Zuletztgeprüftam06.08.2018.
www.amazon.com|Stubbs-Legendary-Bar-B-Q-Ask-Stubb|dp|B072QCZBMF
TELLE,Brandon.BoardGamesAnswers.Amazon.Zuletztgeprüftam06.08.2018.
www.amazon.com|Brandon-Telle-Board-Games-Answers|dp|B01FNXM6SW
TRACTICA.AnzahlderNutzervirtuellerdigitalerAssistentenweltweitindenJahren
von2015bis2021.Statista
TRICARICO,Tanja.DatenschutzbeiSprachassistenten:LauschangriffimWohnzimmer.
DieTageszeitung.Zuletztgeprüftam10.09.2018.www.taz.de|!5532244
VIEREGGE,André.VielLärmumnichts:WasVoiceSearchwirklichfürSEAbedeutet.
Horizont.Zuletztgeprüftam12.08.2018.www.horizont.net|tech|kommentare|Viel-
Laerm-um-nichts-Was-Voice-Search-wirklich-fuer-SEA-bedeutet-145362
VoiceLabs.The2017VoiceReport.VoiceLabs.Zuletztgeprüftam23.09.2018.
s3-us-west-1.amazonaws.com|voicelabs|report|vl-voice-report-exec-summary_final.pdf
WASHINGTON POST PR.MorganStanleysponsorsTheWashingtonPost’s2016flash
briefingsonAlexa-enableddevices.WashingtonPost.Zuletztgeprüftam03.09.2018.
www.washingtonpost.com|pr|wp|2016|07|18|morgan-stanley-sponsors-the-washington-
posts-2016-flash-briefings-on-alexa-enabled-devices
WINARSKY,Norman.ThePresidentofSRIVenturesonBringingSiritoLife.Harvard
BusisnessReview2015,Nr.9.Zuletztgeprüftam17.06.2018.hbr.org|2015|09|the-
president-of-sri-ventures-on-bringing-siri-to-life
GÖPFERT,Yvonne.Sagwas!SprachsteuerungimMarketing.W&V,Nr.20(2018):S.19–22
ZAJECHOWSKI,Matthew.AutomaticSpeechRecognition(ASR)Software:An
Introduction.UsabilityGeek.Zuletztgeprüftam24.06.2018.usabilitygeek.com|
automatic-speech-recognition-asr-software-an-introduction
104 105Auswertung der Umfrage
Auswertung der Umfrage
Umfragedaten:
Im Zusammenhang dieser Bachelorarbeit wurde eine Umfrage in der Hamburger Werbe-
agentur Kolle Rebbe durchgeführt. Die gesamte Auswertung liegt im Folgenden vor.
Je nach dem, ob die Befragten einen Sprachassistenten nutzen oder nicht bzw. ob sie ihn
einem Kunden im Marketing empfehlen würden, wurden ihnen unterschiedliche Fragen
angezeigt. Welche Fragen, den Teilnehmergruppen angezeigt wurden, wird durch die
farbige Line am äußeren Rand jeder Seite dargestellt.
Personen, an die die Umfrage geschickt wurde: 294
Anzahl der Teilnehmer: 64
Umfragezeitraum: 31.07.18 - 15.08.18
Frag
en w
urde
n al
len
Teiln
ehm
ern
gest
ellt 1. InwelchemBereichvonKolleRebbearbeitestdu?
Kreation 42,2%
Beratung 35,9%
Sonstiges 21,9%
Sonstiges
Kreation
Beratung
Frag
en w
urde
n al
len
Teiln
ehm
ern
gest
ellt
3. Wiealtbistdu?
2. InwelchemBereichvonKolleRebbearbeitestdu?
20-25: 23,4%
26-30 23,4%
31-39 37,5%
40-49 10,9%
50+ 4,7%
Klassik 73,8%
Digital 26,2%
20-25
26-3031-39
40-4950+
Klassik
Digital
106 107Auswertung der Umfrage
4. Welche Rolle werden Sprachassistenten im zukünftigen Marketingspielen?
5. Hat,deinerMeinungnach,eineDienstleitungoderein ProduktmehrPotenzialSprachanwendungenzubenutzten?
DieBefragten konnten auf einer Skala von 0-100 eineMarkierung setzten,wobei 0 für
keine Rolle und 100 für eine großere Rolle stand. Das obere Diagramm zeigt die Normal-
verteilung der Aussagen. Das Mittel der Digitaler liegt bei 75,6. Das Mittel der Klassiker
liegt bei 59,64.
Dienstleitung 81,8%
Produkt 18,2%
Dienstleitung
Produkt
Frag
en w
urde
n al
len
Teiln
ehm
ern
gest
ellt
0 25 50 75 100
Klassik Digital
6. GibteseinProduktodereineDienstleistung,diedir spontaneinfällt,dieeingroßesPotenzialhätteSprach- anwendungenzubenutzten?
7. In welchem Bereich siehst du das meiste Potenzial von Sprachassistenten?(max.2auswählbar)
- Autos
- AlleBereiche,indenenmit
Menschen gesprochen wird
- TV-Gerät
- Erinnerungen
- Suche
- Finanzen
- Shopping
- Kundenservice
- Menschen mit Behinderung
- Übersetzer
- Reservierungen
- Altenpflege
- Notfallversorgung
0 5 10 15 20 25
Informationen vor dem Kauf
Informationen nach dem Kauf
Beratung vor dem Kauf
Beratung nach dem Kauf
Hören von Rezensionen
Erstellen von Rezensionen
direkter Verkauf
andere
Frag
en w
urde
n al
len
Teiln
ehm
ern
gest
ellt
108 109Auswertung der Umfrage
8. FälltdireineMarkeein,dieThird-Party-Appseinsetzt?
- Spotify
- Philips Hue
- Chefkoch
- Tagesschau
- Audi
- Domino‘s
- Techniker Krankenkasse
- Deutsche Bahn
- Burger King
- Bring
- FDP
- mytaxi
- Car2go
9. Welche2Sprachassistentenwerden,deinerMeinungnach,in Deutschland am meisten genutzt (max. 2 auswählbar)
0 10 20 30 40 50
Alexa
Siri
Google Assistent
Cortana
Bixby
Frag
en w
urde
n al
len
Teiln
ehm
ern
gest
ellt 10. Für welche Zielgruppe sollte Werbung über eine Sprachan-
wendungambestenkonzipiertwerden?(max.2auswählbar)
0 10 20 30 40 50 60
14-19
20-39
40-59
60+
11.WowerdenSprachassistenten,deinerMeinungnach,am häufigstengenutzt?
Unterwegs 27,8%
zu Hause 72,2%
Unterwegs
zu Hause
Frag
en w
urde
n al
len
Teiln
ehm
ern
gest
ellt
110 111Auswertung der Umfrage
12. Bei welchem Kunden von Kolle Rebbe siehst du Potenzial einenSprachassistentenimMarketingzubenutzten? (Mehrfachauswahlmöglich)
Frag
en w
urde
n al
len
Teiln
ehm
ern
gest
ellt
0 10 20 30 40
O2
Netflix
Audi
Audible
Lufthansa
DAZN
Hey car
BA für Arbeit
inlingua
Enterprise
Aktion Mensch
TUI
arte
Peta
VGH Versicherung
LVM Versicherung
Hypovereinsbank
Hansgrohe
Ritter Sport
Kaldewei
Alpina
Krombacher
Leibniz
Rauch
13.AufwelchemGerätwerdenSprachassistenten,deiner Meinungnach,amhäufigstenbenutzt?
14. Kommentare und Anmerkungen zu Sprachassistenten im Marketing allgemein
integriert im Auto 18,2%
auf dem Handy 36,4%
Voice-Only-Geräten 45,5%
- Sprachassistenten wird im Marketing zu viel Potenzial zugesprochen
- keinNutzerwirdesschätzen,wennermitSchleichwerbungbelästigtwird
- jederRentnerkannmitdenAssistentensprechenkönnen
- WerbungüberSprachassistentenistabsolutüberflüssigundbelästigtdenNutzer
- ichbenutzekeinenSprachassistenten,weilichSorgehabebelauschtzuwerden
- MarketingmitdigitalenAssistentensolltenurbetriebenwerden,wennesSinn
macht und nicht auf-Teufel-komm-raus
- Sprachassistenten werden in Zukunft immer wichtiger
Frag
en w
urde
n al
len
Teiln
ehm
ern
gest
ellt
auf dem Handy
Voice-Only-Geräte
integriert im Auto
112 113Auswertung der Umfrage
15.NutztdubereitseinenSprachassistenten?
16.WarumnutztdueinenSprachassistenten? (Mehrfachauswahlmöglich)
FragenwurdenausschließlichdenNutzerngestellt
Nutzung
nein
39%
ja 61%keine Empfehlung
keine Empfehlung
Emfe
hlun
g
Emfe
hlun
g
Würdest du einem passenden Kunden das Medium Voice im Marketingempfehlen?
DienachfolgendenFragenwurdenausschließlichdenNutzernvonSprachassistentenangezeigt.
Frag
en w
urde
n al
len
Teiln
ehm
ern
gest
ellt
0 5 10 15 20 25
bequemer
schneller
Multitasking ist möglich
natürlicher zu bedienenen alsComputer oder Handy
intuitiver zu bedienen
Andere
17. Bitte nenne ein Beispiel wofür du es benutzt (Mehrfachauswahlmöglich)
0 5 10 15 20
Informationen suchen
Musik steuern
Wettervorhersage
an Termine erinnern
Nachrichten hören
Witze etc.
Taxi bestellen
Waren bestellen
Emails vorlesen lassen
Essen bestellen
Andere
Andere:
- Wecker&Timer
- Navigation
- Smartphone steuern
- Anrufe
- Texte diktieren
- Hörbüchersteuern
FragenwurdenausschließlichdenNutzerngestellt
114 115Auswertung der Umfrage
18. Was sollte an der Funktion des Assistenten verbessert werden,damiterdirnochbessergefällt?
- SchönereStimme
- GrößererWortschatz
- mehr Smarthome-Geräte
- eingeschlossenesSystem,sodasskeineDatenfürWerbunganDritte
gelangen kann
- intelligenter
- Akzente verstehen
- Signalworte wie »Alexa« schränken die Nutzung ein
- Sicherer und anonymer gestalten
- erweiterte Befehle
- bessere Verknüpfung zu anderen Geräten
- komplexere Sätze verstehen
- Routinen der Nutzer erkennen
- schnellere Reaktionszeit
- bessere Verknüpfung zu Nicht-Amazon-Programme
- Vertrauen in der Sicherheit sollte ausgebaut werden
FragenwurdenausschließlichdenNutzerngestellt 19.WieoftnutztduThird-Party-AppsvonSprachassistenten?
nie 65%
monatlich 6%
alle 2 Wochen 3%
alle 2 Tage 21%
täglich 6%
20.Wären,deinerMeinungnach,dieHauptargumentedas Medium Voice einen Kunden zu empfehlen (max. 2 auswählbar)
FragenwurdenausschließlichdenNutzerngestellt
0 5 10 15 20
Schnelligkeit
Innovation
natürliche Kommunikation
besserer Kundenservice
Emotionen können besserrübergebracht werden
nah an der Zielgruppe
Andere
nie
alle 2 Tage
monatlich
täglich alle 2 Wochen
116 117Auswertung der Umfrage
21.WarumwürdestduesdemKundennichtempfehlen,ob wohlduesselbernutzt?
Andere:
- noch nicht weitgenug entwickelt
- Sensibilisierung der Menschen braucht noch Zeit
- es gibt keine Verbindung zur Agentur
- Abneigung der Nutzen gegen Werbung in Sprachassistenten
0 1 2 3 4
Sprachassistent wird zu selten genutzt
Sprachanwendungen werden nichtgenutzt
zu unpraktisch
zu wenig Marketingstudien
mich hat der Assistent nicht überzeugt
Das Medium hat kein Potenzial
keine Möglichkeit Werbungzu betreiben
Andere
FragenwurdenausschließlichdenNutzerngestellt
DienachfolgendenFragenwurdenausschließlichdenNichtnutzernvonSprachassistentenangezeigt.
22.WarumnutztdukeinenSprachassistenten?Wasstörtdich anihm?(Mehrfachauswahlmöglich)
0 2 4 6 8 10 12
ich sehe keinen Mehrwert darin
zu umständlich
ich fühle mich beobachtet
Spracherkennung zu ungenau
unangenehm mit Computer zusprechen
dauert zu lange
zu unpersönlich
Andere
FragenwurdenausschließlichdenNichtnutzerngestellt
118 Auswertung der Umfrage
23. Was würde dich bewegen doch einen Sprachassistenten zu nutzen
24.WarumwürdestdueseinemKundennichtempfehlen? (Mehrfachauswahlmöglich)
- merkliche Verbesserung gegenüber manueller Bedienung
- eigenes Heimnetzwerk ohne Verbindung zum Internet
- irgendwelchewirklichneueMöglichkeiten(Musiksteuerngehtauchschnell
mit dem Handy)
- wenn es bequemer und schneller geht
- günstiger,sicherer,genauer
- Sicherheit
FragenwurdenausschließlichdenNichtnutzerngestellt
0 1 2 3 4 5 6
Datenschutz
Kunden sind nicht aufgeschlossen
Zielgruppe zu klein
zu umständlich
keine Werbemöglichkeiten
Medium wird sich nicht durchsetzten
zu teuer in der Entwicklung
zu unpersönlich
120 Eidesstattliche Erklärung
Eidesstattliche Erklärung
Ich erkläre hiermit des Eides statt, dass ich die vorliegendeArbeit selbstständig verfasst und dabei
keineanderenalsdieangegebenenHilfsmittelbenutzthabe.SämtlicheStellenderArbeit,dieimWort-
lautoderdemSinnnachPublikationenoderVorträgenandererAutorenentnommensind,habeichals
solche kenntlich gemacht. Die Arbeit wurde bisher weder gesamt noch in Teilen einer anderen Prüfungs-
behördevorgelegtundauchnochnichtveröffentlicht.
Top Related