SlideShare a Scribd company logo
1 of 98
Download to read offline
BEHIND THE SCREENS
IA Konferenz, 05. Mai 2017, 15:50 - 16:25, SAAL 1
UX Dos and Don'ts

auf Alexa, Google Home und Co
2
Jörn Siedentopp (CELLULAR GmbH | Hamburg)
Jörn Siedentopp
Senior Concept Designer bei CELLULAR
Mail: jsiedentopp@cellular.de, Twitter: @joernsie
0 Alexa, Google Home und Co
3Jörn Siedentopp, @joernsie, @CELLULAR_GmbH
Familie
Ich rede aktuell mit Alexa wie
mit meinem Hund.
0 Alexa, Google Home und Co
4Jörn Siedentopp, @joernsie, @CELLULAR_GmbH
0 Alexa, Google Home und Co
5Jörn Siedentopp, @joernsie, @CELLULAR_GmbH
„Smudo, AUS!“
0 Alexa, Google Home und Co
6Jörn Siedentopp, @joernsie, @CELLULAR_GmbH
„Alexa, STOP!“
Eigentlich wollen wir uns
natürlich mit Alexa
unterhalten.
0 Alexa, Google Home und Co
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 7
0 Alexa, Google Home und Co
8Jörn Siedentopp, @joernsie, @CELLULAR_GmbH
Amazon
Alexa
Alexa ist nie alleine.
0 Alexa, Google Home und Co Start
9Jörn Siedentopp, @joernsie, @CELLULAR_GmbH
Apple
iPad
Android
Smartphone
Google
ChromeCast
Android
Wear
MacBook
Laptop
Amazon
Alexa
Und es werden immer mehr…
0 Alexa, Google Home und Co
10Jörn Siedentopp, @joernsie, @CELLULAR_GmbH
0 Alexa, Google Home und Co
11Jörn Siedentopp, @joernsie, @CELLULAR_GmbH
ZDFmediathek
ZDFheute
Wir leben in einem Multi-
Device-Universum.
0 Alexa, Google Home und Co
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 12
Heute1996
ZDFmediathek
ZDFheute
Ein Teil des Universums: 

Der Alexa Skill.
0 Alexa, Google Home und Co
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 13
ZDFmediathek
ZDFheute
Sprachassistenten

sind aber überall:
0 Alexa, Google Home und Co
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 14
Noch nie genutzt
53 %
Schon mal genutzt
47 %
Nutzung von Sprachassistenten in Deutschland

Stand: April 2016
0 Alexa, Google Home und Co
15Jörn Siedentopp, @joernsie, @CELLULAR_GmbH https://de.statista.com/infografik/4686/nutzung-von-sprachassistenten-in-deutschland/
Gekommen, um zu bleiben.
0 Alexa, Google Home und Co
16Jörn Siedentopp, @joernsie, @CELLULAR_GmbH https://techcrunch.com/2017/01/24/24-5m-voice-first-devices-expected-to-ship-this-year-but-apps-struggle-to-retain-users/
(USA)
Prognose
Deutschland

Jede Woche kommen 60 Skills hinzu.
USA
Aktuell >10.000 Skills.
0 Alexa, Google Home und Co
17Jörn Siedentopp, @joernsie, @CELLULAR_GmbH Quelle: Bilanz Mai 2017
Echo-Besitzer haben ihre
Ausgaben bei Amazon nach
dem Kauf eines Devices um
10% erhöht.
0 Alexa, Google Home und Co
18Jörn Siedentopp, @joernsie, @CELLULAR_GmbH http://www.deraktionaer.de/aktie/amazon-mit-rekordzahlen-und-ueberraschungserfolg-295380.htm
Deutsche Amazon Alexa Skills
0 Alexa, Google Home und Co
19Jörn Siedentopp, @joernsie, @CELLULAR_GmbH
„Alexa, ruf mir ein Taxi mit mytaxi.“
Skill: MyTaxi
„Alexa, frage Deutsche Bahn nach einer 

Verbindung von Berlin nach Hamburg.“
Skill: Deutsche Bahn"Alexa, sage Uber, ich möchte 

eine Fahrt bestellen.“
Skill: Uber
Deutsche Amazon Alexa Skills
0 Alexa, Google Home und Co
20Jörn Siedentopp, @joernsie, @CELLULAR_GmbH
"Alexa, frage allyouneed nach 

den heutigen Angeboten.“
Skill: Allyouneed - Marktplatz
"Alexa, bestelle Pizza 

von Lieferando."
Skill: lieferando.de
„Alexa, frage Chefkoch nach 

vegetarischen Rezepten.“
Skill: Chefkoch
CELLULAR’s erfolgreichster
Skill.
0 Alexa, Google Home und Co
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 21
0 Alexa, Google Home und Co
22Jörn Siedentopp, @joernsie, @CELLULAR_GmbH
0 Alexa, Google Home und Co
23Jörn Siedentopp, @joernsie, @CELLULAR_GmbH
ZDFheute als Alexa Skill
Morning Briefing
0 Alexa, Google Home und Co
24Jörn Siedentopp, @joernsie, @CELLULAR_GmbH
"Alexa, was sind die Nachrichten?"
Wie geht Produktentwicklung
für Sprachassistenten?
0 Alexa, Google Home und Co
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 25
Unsere 7 Regeln:
0 Alexa, Google Home und Co
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 26
#1
Starte mit einem Dialog.
1 Starte mit einem Dialog.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 27
Konzepte sind Kopfgeburten.
1 Starte mit einem Dialog.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 28
Konzepte sind Kopfgeburten.
1 Starte mit einem Dialog.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 29
Gespräche.
Nie wieder Wireframes!
1 Starte mit einem Dialog.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 30
1 Starte mit einem Dialog.
31Jörn Siedentopp, @joernsie, @CELLULAR_GmbH
Frühzeitig 

simulieren.
Best Test: Talk.
Mit erstem Entwicklungsstand: 

Alexa führt Protokoll.
1 Starte mit einem Dialog.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 32
#2
Denke nur den einen
relevanten Usecase.
2 Denke nur den einen relevanten Usecase.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 33
2 Denke nur den einen relevanten Usecase.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 34
„What's next in tech? Is it machine
learning? Virtual reality? Augmented
reality? Wearables? Voice interfaces?
Autonomous vehicles?
Yes.“
Luke Wroblewski @lukew
ZDFmediathek
ZDFheute
Das ist gut: Der Skill muss
nicht alles können.
2 Denke nur den einen relevanten Usecase.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 35
Denke die User-Journey & das
Produkt immer Multi-Device.
2 Denke nur den einen relevanten Usecase.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 36
ZDFmediathek
ZDFheute
Denke die User-Journey & das
Produkt immer Multi-Device.
2 Denke nur den einen relevanten Usecase.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 37
Konzipiere nur den relevanten
Usecase für Alexa.
ZDFmediathek
ZDFheute
"Alexa, was sind die Nachrichten?"
Beispiel: Plex.

Alexa Skill im Zusammenspiel
mit einem Apple TV.
2 Denke nur den einen relevanten Usecase.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 38
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH
2 VIDEO: Plex. Alexa & Apple TV (https://www.youtube.com/watch?v=0jJfUa8Ij4k)
#3
Führe ein gutes Gespräch.
3 Führe ein gutes Gespräch.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 40
Jeder kann reden.
3 Führe ein gutes Gespräch.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 41
Jeder kann reden.
Schlechte Gespräche 

fallen immer auf.
3 Führe ein gutes Gespräch.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 42
Gute Gespräche folgen
Konversationsmaximen
Nach Paul Grice (Philosoph, 1913 – 1988)
3 Führe ein gutes Gespräch.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 43
Sage nur, was informativ, …
3 Führe ein gutes Gespräch.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 44
Konversationsmaximen für gute Gespräche von Paul Grice (Philosoph, 1913 – 1988)
Sage nur, was informativ,
wahr …
3 Führe ein gutes Gespräch.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 45
Konversationsmaximen für gute Gespräche von Paul Grice (Philosoph, 1913 – 1988)
Sage nur, was informativ,
wahr und wichtig ist.
3 Führe ein gutes Gespräch.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 46
Konversationsmaximen für gute Gespräche von Paul Grice (Philosoph, 1913 – 1988)
Sage nur, was informativ,
wahr und wichtig ist.
Sage dies klar und deutlich!
3 Führe ein gutes Gespräch.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 47
Konversationsmaximen für gute Gespräche von Paul Grice (Philosoph, 1913 – 1988)
Angewendet bei
Sprachassistenten:
3 Führe ein gutes Gespräch.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 48
3 Führe ein gutes Gespräch.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 49
Schlecht
Um die Nachricht erneut
zuhören, sag „Wiederholen“,
um zu antworten, sag
„Antworten“, und um die
nächste zur hören, sag
„Weiter“.
3 Führe ein gutes Gespräch.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 50
Schlecht
Um die Nachricht erneut
zuhören, sag „Wiederholen“,
um zu antworten, sag
„Antworten“, und um die
nächste zur hören, sag
„Weiter“.
Gut
Nachricht wiederholen,
antworten oder weiter zur
nächsten?
Like telling a joke — if you
have to explain it, you're
doing it wrong.


Google Actions Guidelines

https://developers.google.com/actions/design/
3 Führe ein gutes Gespräch.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 51
1
Actions on Google
Conversation basics
Creating better conversations
Conversation—a study in cooperation
Validating user input and managing expectations
When a conversation breaks, repair it
2
2
2
3
3
Table of contents Page
The Conversational UI and
Why it Matters
—
2
Actions on Google
We’re entering a promising new era of computing,
where advances in machine learning and artificial
intelligence are creating a resurgence of interest in
voice interfaces and natural language processing,
unlocking the potential for conversation as the new
mode of interaction with technology.
For the most part, the problem of recognizing spo-
ken input has been largely solved, opening up a new
challenge: How to build a user experience that’s
modeled after natural human conversation.
This multi-part series outlines the basic mechanics
of conversation, introduces core principles to design
by, and presents you with a practical voice user in-
terface (VUI) toolkit to start creating conversational
experiences that engage, delight, and truly help your
users.
Conversation basics
We can discover the key ingredients for a good VUI
conversation simply by deconstructing the rules and
conventions that we are mostly unaware of in natu-
ral human conversation.
Building blocks for successful VUI conversations
include:
• Turn-taking: We take turns in a conversation
based on subtle signals that we pass back and
forth. Without effective turn-taking, we might
talk over each other, or our conversations can
get out of sync and hard to follow.
• Threading: In natural speech, all elements of a
conversation are usually woven together in a co-
herent thread that includes context and the way
the conversation evolves over time. Threading
helps us keep track of that conversational flow.
• Inherent efficiency of speech: People often use
verbal shortcuts because they intuitively understand
what’s being said—essentially, we can “read between
the lines” in a conversation and some things can be
left unspoken. But the implication for VUIs is having
to compensate for the seemingly illogical, non-math-
ematical nature of human speech.
• Variations in user behavior and comfort level:
People use a variety of words and styles to say
the same thing, depending on their own situa-
tional context and expectations of a VUI based
on previous experience. VUIs should support
these variations so all users can have a friction-
less experience.
Read more on conversation basics in Understanding
How Conversations Work: The Key to a Better Voice
UI (https://developers.google.com/actions/design/principles)
Conversation—a study in cooperation
Turn-taking, context, and threading are all part of
cooperative conversation, an idea popularized by
linguistics philosopher Paul Grice 1
. Grice called this
the Cooperative Principle. He also developed Grice’s
Maxims to define the essential conversational rules
he observed—namely that people should be as truth-
ful, informative, relevant, and clear as possible when
talking with each other.
VUI should try to follow these inherent rules of
cooperation as well—and be ready to support wary
users who’ve had bad experiences with other voice
interfaces in the past.
Read more on the Cooperative Principle in Be Cooper-
ative … Like Your Users2
.
1 https://plato.stanford.edu/entries/grice/
2 http://g.co/dev/actions-be-cooperative
Creating better conversations
A good VUI doesn’t follow a stale script, and shouldn’t
be based on the old touch-tone phone systems that
force users down narrow paths. It also shouldn’t try
to “teach” people what to say to protect them from
veering off the so-called “happy path.”
Instead, it should focus on the intuitive power of
language and meaning, using everyday language
to communicate with users. VUIs should also avoid
stating the obvious or talking down to users—people
3
Actions on Google
don’t appreciate a device that sounds like it thinks
it’s smarter than they are.
Read more on building an intuitive VUI in Unlocking
the Power of Spoken Language.
(http://g.co/dev/actions-spoken-language)
Validating user input and managing
expectations
Once someone makes a request, a VUI can use
acknowledgers—words or phrases like “OK,” “Sure,”
“Alright,” “Thanks,” and “Got it”—that show the VUI is en-
gaged and listening. Randomizing acknowledgers can
help make the experience feel more fluid and natural.
After acknowledging, the system can then seek either
explicit or implicit confirmation that it understood.
With explicit confirmation (which is usually used when
something major is at stake, such as buying a plane
ticket), the VUI asks the user for verbal agreement
before proceeding.
With implicit confirmation (used for lower-risk
situations, such as streaming a song), the VUI in-
corporates a key element of the user’s request into
its response to validate and instill confidence in the
user, but doesn’t require verbal approval per se.
Read more in Instilling User Confidence Through
Confirmations and Acknowledgements.
When a conversation breaks, repair it
Things can go wrong with even the most well-de-
signed VUI. When conversations break down, either
party can initiate a repair. Though humans usually
spot and repair their own mistakes, a VUI must also
be able to repair the conversation based on the flow
and nature of the interaction.
Read more on repair in Understanding How Conver-
sations Work: The Key to a Better Voice UI.
http://g.co/dev/actions-understanding-conversations
Do this …
• Follow basic conversational rules and
everyday speech patterns
• Apply the principles in Grice’s Maxims
• Suggest through intuitive examples of what
people can say (without “teaching” them)
• Use acknowledgers to show that the
system is listening
• Randomize acknowledgers to make the VUI
sound more natural
• Use explicit confirmation for clarity around
important requests, and implicit confirma-
tion if a request is less risky to fulfil
• Use “errors” as opportunities for more
meaningful (and natural) interactions
Don’t do this...
• Model responses on touchtone apps and
phone-tree scripts
• Try to teach people what to say
• State the obvious
• Talk down to users or offer responses that
sound mechanical
• Use “Go back” instructions
• Accommodate just one speaking style
• Use language that talks down to users
© 2016 Google Inc. All rights reserved. Google and the Google logo are trademarks of Google Inc.
All other company and product names may be trademarks of the respective companies with which they are associated.
VUI Do’s and Don’ts
Gut
3 Führe ein gutes Gespräch.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 52
"Alexa, bestelle Pizza 

von Lieferando."
Skill: lieferando.de
Erst Settings
3 Führe ein gutes Gespräch.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 53
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH
3 Video: Lieferando Skill (https://www.youtube.com/watch?v=RkB0bsGka7M)
Gut
3 Führe ein gutes Gespräch.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 55
Plan: Starbucks Coffee Co.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH
3 Video: My Starbucks Barista (https://www.youtube.com/watch?v=v1pyZiDVlRw)
#4
Komm auf den Punkt.
4 Komm auf den Punkt.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 57
Eine kurze Gedankenreise
4 Komm auf den Punkt.
58Jörn Siedentopp, @joernsie, @CELLULAR_GmbH
Unser Tageskarte:
1. Rindercarpaccio m. frischen
Spargel u. Parmesan
2. Grüner Bohnensalat m.
Thunfisch u. Mozzarella
3. Reissalat nach Art des Chefs
4. Pasta mit Paprika u.Lachs in
Tomaten-Sahnesoße
5. Pizza m- Salami u.
Champignons
6. Feldsalat mit Melone u.
Fleischklößen.
Die schwierigste Frage ist:
Wie viele Infos sind nötig?
4 Komm auf den Punkt.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 59
Wie viele Infos sind für eine
Produktdarstellung
ausreichend?
4 Komm auf den Punkt.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 60
Ausgangslage
Eine Produktdarstellung in einer App
4 Komm auf den Punkt.
61Jörn Siedentopp, @joernsie, @CELLULAR_GmbH
SEBA MED
Sport Dusche, 2-in-1, für
Haut & Haar
Duschgel
Verschiedene Sorten
2,45€ statt 2,89€
Unser Ergebnis
Eine Produktbeschreibung in einem Skill
4 Komm auf den Punkt.
62Jörn Siedentopp, @joernsie, @CELLULAR_GmbH
Alexa Skill
Alexa, was ist heute im Angebot?
Unser Ergebnis
Eine Produktbeschreibung in einem Skill
4 Komm auf den Punkt.
63Jörn Siedentopp, @joernsie, @CELLULAR_GmbH
Im Angebot:
Duschgel von SEBA MED
für 2,45€
Alexa Skill
Alexa, was ist heute im Angebot?
Unser Ergebnis
Eine Produktbeschreibung in einem Skill
4 Komm auf den Punkt.
64Jörn Siedentopp, @joernsie, @CELLULAR_GmbH
Im Angebot:
Duschgel von SEBA MED
für 2,45€
Alexa Skill
Alexa, was ist heute im Angebot?
Lege das Duschgel auf meine Einkaufsliste.
Und wie viele Infos sind für
eine ganze Liste
ausreichend?
Für Suchergebnisse?
4 Komm auf den Punkt.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 65
4 Komm auf den Punkt.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 66
„In der Welt der Sprachsteuerung bist
du entweder die Nr. 1 in den
Suchergebnissen oder es wird
schwierig.“
Andre Alpar, SEO-Experte im OMR Podcast #75
#5
Sei persönlich.
5 Sei persönlich.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 67
Kontext, Listen, Historie.
Alles ist heute persönlich.
5 Sei persönlich.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 68
Öffentliche Raum
Persönliche Inhalte.
Kontext, Listen, Historie.
Alles ist heute persönlich.
5 Sei persönlich.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 69
vs.
Das birgt Gefahren…
5 Sei persönlich.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 70
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH
5 Video: Hilarious Amazon Echo Alexa Fail! - 2016 (https://www.youtube.com/watch?v=KMLzJ8i9Xl4 )
5 Sei persönlich.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 72
„Alexa, ruf mir ein Taxi mit mytaxi.“
Skill: MyTaxi
MyTaxi für Alexa:
Persönlicher Account.
Persönliche Adressen.
Einer muss bezahlen.
5 Sei persönlich.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 73
Was kann helfen?
5 Sei persönlich.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 74
Personalisierte Inhalte

sind der Anspruch.
Auch, wenn Sprachassistenten hier heutzutage (noch)
keinen Schutz bieten.
5 Sei persönlich.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 75
Personalisierte Inhalte

sind der Anspruch.
Auch, wenn Sprachassistenten hier heutzutage (noch)
keinen Schutz bieten.
5 Sei persönlich.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 76
Ansatz: Stimmidentifikation.
#6
Behalte den Kontext.
6 Behalte den Kontext.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 77
Alexa: Täglich grüßt das
Murmeltier.
Nach acht Sekunden ist dann alles vergessen.
6 Behalte den Kontext.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 78
Kontext = Dialog = 

Invocation Name
Unser UX Research: Die Probanden bleiben dauerhaft
Kontext.
Alexa aktuell leider nur 8 Sek.
6 Behalte den Kontext.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 79
Starte BUDNI, …
Öffne BUDNI, …
Frage BUDNI, …
Google Assistent: 

Der mit dem
Kurzzeitgedächtnis.
6 Behalte den Kontext.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 80
„Okay, Google. 

Wie weit ist es 

bis zum Mond?“
6 Behalte den Kontext.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 81
6 Behalte den Kontext.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 82
„Wie komm ich da hin?“
„Okay, Google. 

Wie weit ist es 

bis zum Mond?“
6 Behalte den Kontext.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 83
„Wie komm ich da hin?“
„Okay, Google. 

Wie weit ist es 

bis zum Mond?“
Bixby: 

Stellt den Kontext als KPI
heraus.
6 Behalte den Kontext.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 84
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH
6 Behalte den Kontext.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 87
„Einen Dialog zu führen, den
Zusammenhang zu begreifen und
auch abschweifende Gesprächsfäden
aufzugreifen: Das ist sehr, sehr
schwer.“
Siri Miterfinder Babak Hodjat – Bilanz Mai 2017
#7
Sei eine Marke.
7 Sei eine Marke.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 88
7 Sei eine Marke.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 89
„Cool ist Siri, weil es eine
Persönlichkeit hat.“
Tim Cook – Bilanz Mai 2017
Die Dreiecksbeziehung
7 Sei eine Marke.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 90
Sprach-
assistenten
Nutzer Skill
Die Dreiecksbeziehung
7 Sei eine Marke.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 91
Sprach-
assistenten
Nutzer Skill
Profiler haben die
Sprachassistenten
klassifiziert und ihnen
Gesichter gegeben:
7 Sei eine Marke.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 92
Wer ist wer?
7 Sei eine Marke.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 9345
Analyse: Axel Petermann* Analyse: Precire Technologies*
– Stimme wirkt ein wenig mechanisch
– Sprecherin intelligent, schlank, sexy
– Mittelgroß, lange und dunkle Haare
– Große Augen, ebenmäßige Haut
– Brille
– Hat Charme, Ausstrahlung und Humor
– Versucht eine Beziehung aufzubauen
– Scheint sogar mit dem Nutzer zu flirten
– Aufmerksame Zuhörerin
BILANZ MAI / 2017
Siri (Apple)
beziehungs-
orientiert
bestimmend
informativ
2
3
4
5
0
1
* Wer Axel Petermann ist, wer hinter Precire steckt und wie sie bei ihren Analysen vorgegangen sind: siehe Seite 46
2007 von der gleichnamigen Firma aus Kalifornien entwickelt / 2010 an Apple verkauft / 2011
erstmals vorgestellt („Iphone 4S“) / Fast elf Millionen deutsche Nutzer, vor allem via „Iphone /
Experten halten Siris Fähigkeiten inzwischen für überholt / Aktualisierung steht 2017 bevor
emotional-
offen
Digitale Gesprächspartner wie Siri von Apple oder Bix-
by von Samsung sind weit mehr als gefällige Marketing-Gags
oder raffinierte Spielereien, die auf Zuruf Musiktitel abspielen,
Hörfunksender einschalten oder den Wetterbericht aufsagen –
sie sind der Beginn eines neuen Zeitalters in der Wechselbezie-
hung zwischen Mensch und Maschine.
Denn Fragen stellen, Befehle erteilen, Wünsche äußern, For-
derungen erheben – dazu braucht es keine langwierige Einfüh-
ung, kein Studium von Bedienungsanleitungen. Selbst Kinder
können dies, bevor sie auch nur ihr erstes Wort geschrieben
haben. Sprachsteuerung ist nicht nur einfacher, sondern auch
schneller als jede zurzeit verfügbare Technik.
Branchenexperten wie Dominik Wee, Berater und Partner
bei McKinsey, halten den Small Talk mit künstlichen Assisten-
innen für die nächste große, epochale und zukunftsweisen-
de Sache in der Technikwelt, ähnlich wie die Einführung des
Smart- bzw. „Iphones“ im Jahr 2007. Die Sprachassistenz, sagt
Dominik Wee, berge „disruptives Potenzial“.
Als erster Anbieter überhaupt hatte Apple im Jahr 2011
sein Sprachsystem Siri auf den Markt gebracht, Microsoft
war 2014 mit Cortana gefolgt, ein Jahr später dann Amazon mit
Alexa, die über die intelligente Lautsprecher- und Mikrofonbox
Echo“ ansprechbar ist.
Der Kampf um den Zukunftsmarkt ist entbrannt. Und natür-
ich bleibt die sprechende Digitalassistenz nicht auf Mobiltelefo-
ne oder „Macbooks“ beschränkt. Amazon Automotive will die
Sprachassistentin Alexa etwa zur Beifahrerin weiterbilden und
sucht auf dem Karriereportal Linkedin nach Autofachleuten.
Volkswagen und Hyundai, Volvo, Ford und BMW haben bereits
die Möglichkeit geschaffen, das Kunstwesen in ihre Bordtech-
nik zu integrieren.
Google und Apple verfügen mit „Android“ und „Carplay“
über vergleichbare Angebote, während Huawei-Telefone schonüber vergleichbare Angebote, während Huawei-Telefone schonüber vergleichbare Angebote, während Hua
auf Zuruf Türen öffnen sowie Staubsauger aus- und Lam-
pen einschalten können. Seit Ende 2016 kann Alexa bereits
Bosch-Siemens-Hausgeräte über die BSH-Plattform Home
Connect kontrollieren.
Am klügsten ist wahrscheinlich Googles namenlose Hel-
erin („Google Home“). Sie versteht selbst vielschichtigere
Fragen und, in begrenztem Umfang, auch schon Zusammen-
hänge innerhalb eines Dialogs. Zudem ist sie lernfähig: Folge
einer 20-jährigen Erfahrung des Konzerns mit Suchanfragen
und der Listung und Verknüpfung ungezählter Internetseiten,
47
BILANZ MAI / 2017
Analyse: Axel Petermann Analyse: Precire Technologies
– Warme Stimme
– In gewisser Weise erotisch
– Braune Haare
– Vollschlank
– Kumpeltyp, Freundin des Anwenders
– Weniger Charme und Humor als Siri
Alexa (Amazon)
2
3
4
5
0
1
beziehungs-
orientiert
bestimmend
informativ
Lebt seit 2015 in den Amazon-Lautsprechermikrofonen „Echo“ und „Echo Dot“ / Versteht
Deutsch seit Februar 2017 / Sehr schnelle Verbreitung / Viele Wechselwirkungen mit anderen
Unternehmen und Geräten: u.a. Automobile, Hausgeräte, Amazon Prime
emotional-
offen
48
IDEEN UND INNOVATIONEN
unter ihnen natürlich auch Wikipedia. „Google Home“ bleibt
auf kaum eine Frage eine Antwort schuldig.
Das Marktpotenzial ist gewaltig. Nach einer Quellenforschung
des Datenportals Statista nutzten im vergangenen Jahr 10,8
Millionen Deutsche Apples Siri und sogar 17 Millionen „Google
Now“. Das US-Marktforschungsinstitut Tractica schätzt, dass
die Anzahl der Verbraucher, die Verständnis-voll reagierende
Sprachassistentinnen zumindest gelegentlich verwenden, von
derzeit 710 Millionen auf rund 1,8 Milliarden bis 2021 steigen wird.
Der Umsatz mit den unwirklichen Helferinnen soll im selben Zeit-Der Umsatz mit den unwirklichen Helferinnen soll im selben Zeit-Der Umsatz mit den unwirklichen Helferinnen soll im selben Zeit
raum von 689 Millionen auf zwölf Milliarden US-Dollar wachsen.
Siri – mittlerweile auch über „Ipad“, „Apple TV“ und die
kabellosen „Airpod“-Kopfhörer erreichbar – versteht sogar Chi-
nesisch,HebräischundNorwegisch.„Abercool“,sagtApple-Chef
Tim Cook, „ist Siri vor allem, weil sie eine Persönlichkeit hat.“
InderTathängtdieBereitschaft,mitMaschinenmündlichund
nicht mehr mit Klicks zu kommunizieren, mithin ihr Markterfolg,
in erheblichem Maße davon ab, ob Menschen den Geräten, an die
sie ihre Worte richten, einen Charakter zusprechen, ein Naturell,
ein Wesen, ein Temperament, kurzum: eine Persönlichkeit.
Doch welcher Anbieter beherrscht die Kunst der Schöpfung
am besten? Diese Frage hat BILANZ zwei Sachverständigen ge-
stellt: dem Profiler und Kriminalpolizisten Axel Petermann und
Christian Greb, Mitgründer der Sprachanalyse-Firma Precire in
Aachen (s. Kasten S. 46).
Was die Sprachintelligenz anbelangt, hat sich in der
Nerd- und Technik-Szene in den vergangenen Monaten
der Eindruck verbreitet, dass die Pionierin Siri, die populärste
Vertreterin unter den scheinbaren Mitarbeiterinnen, im Ver-
gleich mit ihren jüngeren Kolleginnen deutlich zu wünschen
übrig lässt. Oder anders gesagt: „Warum scheint Siri so dumm
zu sein?“, wie das Technikmagazin „The Verge“ fragte.
Gewiss, auch Siris Programmierer sorgen dafür, dass sie dazu-
lernt. Aber anders als die Google-Assistentin ist sie selten in der
Lage, Folgefragen zu beantworten. Siri floskelt in diesen Fällen:
„Ich bin mir nicht sicher, ob ich das richtig verstanden habe.“
Große Erwartungen knüpfen sich deshalb an das für dieses
Jahr erwartete „Iphone 8“ und das auf einen neueren Stand ge-
brachte mobile Betriebssystem IOS 11. Siri werde, Eingeweihten
zufolge, mit größerer künstlicher Intelligenz ausgestattet. Dar-
aufhin deuten Apples Zukäufe: 2015 hatte der Konzern die Fir-
men Vocal-Iq und Perceptio, ein Jahr später Turi übernommen,
drei Spezialisten für sprachgesteuerte, künstliche Intelligenz.
Apples Anstrengungen sind nötig, denn Begeisterung rief zu-
letzt die Konkurrenz hervor und hier in besonderer Weise das
Handelshaus Amazon (Umsatz: 136 Mrd. Dollar), das mit Alexa
einen regelrechten „Hit“ gelandet habe, wie die mit Lob norma-
lerweise sehr sparsam umgehende „New York Times“ notierte.
Alexa, namentlich inspiriert von der Bibliothek Alexandrias,
steckt im „Echo“ – einem 23 Zentimeter hohen, röhrenförmigen
Lautsprecher, der gleichzeitig auch ein Gerät enthält, durch das
sich Töne und Geräusche übertragen lassen. Sagt man „Alexa!“,
dann leuchtet der obere Rand des „Echo“ in blauem Licht auf
und signalisiert: Ich höre zu.
Sodann kann man Alexa bitten, die Temperatur im Zimmer zu
senken, das neue „Daft Punk“-Lied zu spielen, Fußballergebnisse
aufzusagen – und natürlich einzukaufen. Amazon will dergestalt
vor allem seinen Premiumversand Prime weiter ausbauen.
Seit zwei Jahren sind der „Echo“ und seine Mini-Ausgabe
„Echo Dot“ in den USA im Handel, in Deutschland erst seit
Februar. Die kursierenden „Echo“-Verkaufszahlen für die USA
sind bemerkenswert: Im ersten Jahr sollen es rund eine Million
Geräte gewesen sein, 2016 schon deren sieben, und bis Silvester
dieses Jahres rechnet man mit annähernd 30 Millionen weiteren
„Echos“ und „Echo Dots“. Damit wäre Amazon schon in jedem
vierten US-Haushalt vertreten.
Der Verkaufserfolg hat viel mit dem offenen System zu tun,
das es jedem Privatmann und Unternehmen erlaubt, Alexa in
neuen, zusätzlichen „Fähigkeiten“ zu unterrichten, also ähnlich
zu aktualisieren wie Anwendungen fürs Telefon. Fordert man
Alexa auf: „Frag die Deutsche Bahn, wann der nächste Zug von
Hamburg nach München fährt“, dann liefert sie die passende
Antwort. Auch Lieferando und Mytaxi, Medien wie „Spiegel On-
line“, Tagesschau und „Bild“ oder die Berliner Verkehrsbetriebe
sind bereits über „Echo“ beziehungsweise Alexa ansprechbar.
Jede Woche kommen in Deutschland etwa 60 Fähig- und Fertig-
keiten hinzu; in den USA gibt es bereits mehr als 10.000.
„Ohne viel Chi-Chi hat Amazon mit ,Echo‘ einfach mal das
nächste große Ding platziert“, sagt Max Koziolek (27), Mitgrün-
der des Berliner Unternehmens Spectrm. Koziolek bietet Un-
ternehmen Nachhilfeunterricht an, um Alexa neue Tricks bei-
zubringen, im Zunftjargon „Skills“ genannt. Er sieht Alexa tech„Skills“ genannt. Er sieht Alexa tech„Skills“ -
nisch weit voraus, und „es wird schwer, die wieder einzuholen“.
Der überraschende Erfolg Amazons forderte auch Google
heraus, ein ganz ähnlich arbeitendes Gerät zu entwickeln: Es
ist besagtes „Google Home“, etwas bauchiger geformt als die
„Echo“-Röhre und seit vergangenem Herbst in den USA auf
weiter auf Seite 52
49
BILANZ MAI / 2017
Analyse: Axel Petermann Analyse: Precire Technologies
– Cleverer als Microsofts Cortana
– Warme Sprache
– Rote Haare, kurzhaarig, US-Outfit
– Brille mit Strass besetzt
– Schlank, mittelgroß
– Kostüm
– Erledigt Aufgaben gewissenhaft
„Google Assistant“ (Google)
2
3
4
5
0
1
beziehungs-
orientiert
bestimmend
informativ
Löste 2016 das Vorgänger-Programm „Google Now“ ab / Große Verbreitung durch
Voreinstellung auf Telefonen und Handcomputern mit Android-Betriebssystem / Seit Herbst
2016 auch über den Lautsprecher „Google Home“ ansprechbar / Kann besonders gut Fragen
beantworten
emotional-
offen
50
IDEEN UND INNOVATIONEN
Werden Siri, Alexa, Bixby und Co. bald den
Computermonitor abschaffen? „Ich glaube
nicht, dass es eine gute Idee wäre, auf den
Bildschirm und eine grafische Benutzer-Bildschirm und eine grafische Benutzer-Bildschirm und eine grafische Benutzer
oberfläche zu verzichten“, sagt der Informa-
tiker Babak Hodjat, einer der Erfinder von
Siri. „Es ist doch oft so viel leichter, auf ein
Bildchen zu klicken, als es beschreiben zu
müssen.“ Vielmehr sollten Sprachassisten-
tinnen „den Benutzer bei seiner Interaktion
mit dem Bildschirm und damit dem Compu-
ter unterstützen“.
Hodjat hat 2007 in San Francisco die Firmen
Siri und Sentient Technologies gegründet, die auf Entwicklung
virtueller Assistenten mittels künstlicher Intelligenz spezialisiert
waren. Zusammen mit seinem Mitgründer Adam Cheyer verkauf-
te er Siri 2010 an Apple. Cheyer blieb noch bis 2012 an Bord, be-
vor er wiederum das Sprachprogramm „Viv“ entwickelte (das
später an Samsung ging). Sentient Technologies ist heute eines
der wertvollsten Unternehmen für die Entwicklung von künst-
licher Intelligenz auf der Welt.
Hodjat ist, im Gegensatz zu manchem Technikkonzernchef,
alles andere als euphorisch, was die Fähigkeiten von Sprachhel-
fern anbelangt: „Es ist ziemlich leicht, Sprachassistenten für ge-
nau umschriebene Aufgaben zu programmieren“, sagt er. „Aber
einen Dialog zu führen, den Zusammenhang zu begreifen und
auch abschweifende Gesprächsfäden aufzugreifen: Das ist sehr,
sehr schwer.“
Rein sprachbasierte Systeme hält Hodjat für „viel zu begrenzt“
und verweist auf Alltagssituationen, „in denen die Sprache nicht
der geeignete Kanal ist, zum Beispiel, wenn man im Bus sitzt,
oder in einem Großraumbüro, wo nicht jeder mithören soll“.
Geräte wie Amazons „Echo“ verstünden zu-
dem keine Ironie, könnten weder Gestik
noch Mimik erkennen.
Nach Hodjats Ansicht machten es sich
die Technikfirmen zu einfach und schöpften
die Möglichkeiten nicht aus, die sich durch
die künstliche Intelligenz eröffneten.
Die Sprachassistentinnen funktionieren
alle nach einem ähnlichen Prinzip: Mikrofo-
ne übertragen das Gesagte in eine Daten-
wolke, wo die Audiodatei in Schrift umge-
wandelt wird. Dann übernehmen sogenann-
te Chatbots, die aus Schlüsselwörtern im Text
die Aufgabe herauslesen (etwa „Flug“, „heute“, „München“ und
„London“), suchen im System nach der dazu passenden Antwort,
die wiederum in Sprache umgewandelt und ausgesprochen wird.
„Solche Konversationssysteme wie Siri funktionieren nur gut
in ihrem kleinen, abgezäunten Gärtchen, in dem ganze Teams
von Ingenieuren und Wissenschaftlern alles schön überschauen
und programmieren können“, kritisiert Hodjat. Um die engen
Grenzen zu überschreiten, empfiehlt er, sich nicht auf Sprach-
kommunikation allein zu konzentrieren. Vielmehr „müssten bis-
her getrennte Forschungsbereiche wie Maschinenlernen,
Spracherkennung und das Erkennen von Gesichtsausdrücken
zusammengebracht werden, was gar nicht so einfach ist“. Den
Durchbruch, glaubt er, brächten „Haushaltsroboter, die zur Kon-
versation fähig sind – weil sie zum Beispiel mit Kameras ausge-
rüstet sind, die uns anschauen und unsere Gesichtsausdrücke
lesen können“.
Die Firma Emotient in San Diego, sagt er, sei auf eben diese
Art Rechnerprogramme spezialisiert. Im vergangenen Jahr hat
Apple die Firma gekauft. Jürgen Schönstein
Hohn oder Witze verstehen die Assistentinnen nicht,
Gebärden und Mienen können sie nicht erkennen.
Forschung zusammenführen:
Siri-Miterfinder Babak Hodjat.
51
BILANZ MAI / 2017
Analyse: Axel Petermann Analyse: Precire Technologies
– Arrogant wie Madonna
– Nicht so weit entwickelt wie Siri und Alexa
– Wenig menschlich, Stimme künstlich
– Roboterhaft, starre Mimik
– Zackige, abgehackte Bewegungen
– Sachliche Antworten, nicht sehr klug
– Gewollt selbstbewusst
– Blasse, unscheinbare Frau, klein
– Unauffällig, in gewisser Weise bieder
Cortana (Microsoft)
2
3
4
5
0
1
beziehungs-
orientiert
bestimmend
informativ
Geburt 2014 / Standard im Betriebssystem Windows 10 / 145 Millionen Nutzer weltweit /
Erhält voraussichtlich 2017 auch eigene Lautsprecher- und Mikrofonbox (wie Alexa und
Googles Assistentin) / Zahlreiche Kooperationen mit anderen Unternehmen
emotional-
offen
© Alle Rechte vorbehalten - Axel Springer SE, Berlin - Jede Veröffentlichung und nicht-private Nutzung exklusiv über www.axelspringer-syndication.de/lizenzierung BILANZ--s3-beilagen-86 2565b33269f433cee4ea8d831d88b969
52
IDEEN UND INNOVATIONEN
kommen, und zwar noch in diesem Jahr. Über „Invoke“ würden
Nutzer auch Microsofts Internet-Telefondienst Skype verwen-
den können. Weder Microsoft noch Harman Kardon wollten die
Informationen auf BILANZ-Nachfrage kommentieren.
Wann auch immer der Zylinder auf den Markt kommen wird,
Microsofts Strategie lässt bereits jetzt erkennen, dass man Cor-
tana nicht auf ein Gerät beschränken möchte. So kündigte der
Autohersteller Volvo unlängst an, Cortana in seine Fahrzeuge
zu integrieren. Und BMW präsentierte auf der diesjährigen
CES-Technikmesse in Las Vegas bereits einen Prototyp, der
Cortana an Bord hatte.
Ob sich Bixby von Samsung etablieren und gegen die erfah-
reneren und bereits enteilten Wettbewerberinnen behaupten
kann, wird die Zukunft zeigen. Anders als Siri oder Alexa bil-
de Bixby kein „isoliertes Feature“, sondern eine „intelligente
Schnittstelle“, die Sprache mit berührungsempfindlicher Be-
dienung, mit Bildern und Informationen verbinde. Wer etwa
mit dem Telefon ein Foto von einer Weinflasche schieße, sagte
Sriram Thodla bei der „Galaxy S8“-Präsentation, könne Bixby
fragen, wo er diesen Wein in seiner Umgebung kaufen kann.
„Bixby versteht die Zusammenhänge.“
Für den Anfang wird Samsung aber nicht nur mit dem Um-
stand zu kämpfen haben, dass „Galaxy S8“-Besitzer zwischen
Bixby und der voreingestellten Google-Sprachassistentin wäh-
len können. Zusätzlich erschwert wurde der US-Start des Te-
lefons am 21. April noch durch die Tatsache, dass es bis Ende
Mai dauern könnte, bis Bixby Englisch sprechen kann. Bei in-
ternen Tests, berichtete das „Wall Street Journal“, hätten Bix-
bys Sprachkenntnisse noch nicht überzeugt. Zwar versteht
Bixby bereits schriftliche Befehle in englischer Sprache und
kann diese auch umsetzen und kommentieren („Sure. Let’s takekann diese auch umsetzen und kommentieren („Sure. Let’s takekann diese auch umsetzen und kommentieren (
a picture“) – mit ihr plaudern können aber bisher nur des Ko-
reanischen Mächtige. Eine deutsche Version wird „im vierten
Quartal 2017“ verfügbar sein, wie Samsung verkündete.
Ungeachtet der Startschwierigkeiten, sind Samsungs Pläne
mit Bixby höchst ambitioniert: „Wir starten mit dem Telefon und
werden schnell auf weitere Geräte expandieren“, kündigte Chef-werden schnell auf weitere Geräte expandieren“, kündigte Chef-werden schnell auf weitere Geräte expandieren“, kündigte Chef
entwickler Injong Rhee an. Praktischerweise baut Samsung die
Fernseher, Kühlschränke, Klimaanlagen und Waschmaschinen,
mit denen Bixby mal kommunizieren soll, gleich selbst.
In naher Zukunft, glaubt Rhee, werden all diese Geräte zu
Hause auf unsere Stimme hören: „Du rufst ,Hallo, Bixby‘, und
alles um dich herum erwacht und spricht mit dir.“ Er hält das
offenkundig für eine erstrebenswerte Vorstellung. 1
dem Markt. Im April brachte Google die Box nach Großbritan-
nien, im Sommer soll sie auch in Deutschland zu haben sein.
Die Google-Sprachassistentin selbst ist hiesigen Nutzern
nicht unbekannt: 2016 stellte man sie auf dem Google-Telefon
„Pixel“ vor. Und auf der Digitaltechnikmesse MWC in Barce-
lona Ende Februar kündigte Google an, sie den Telefonen von
HTC, Huawei, LG, Sony und auch Samsung einzupflanzen. Da-
mit wird die Google-Assistentin weltweit auf etwa einem Drit-
tel aller Android-Telefone laufen.
Der Suchmaschinenkonzern Google und seine Obergesell-
schaft Alphabet (Umsatz: 90,3 Mrd. US-Dollar) verfügen über
den mit Abstand umfangreichsten Datenberg aller Technikfir-
men, und mit jeder Suchanfrage, ob schriftlich oder mündlich
gestellt, lernt das System dazu.
Folgerichtig stellt Google besonders die Beantwortung von
Fragen in den Vordergrund des Leistungsspektrums seiner As-
sistentin („Wie groß ist die Strecke von der Erde zum Mond?“).
Im Unterschied zu den meisten Helferinnen hat Googles auch
ein Kurzzeitgedächtnis und merkt sich die vorangegangenen
Fragen. Ebenso wie „Echo“ kann „Google Home“ aber auch
Termine vorlesen und Musik abspielen.
Angestachelt und -gespornt sowohl vom Eifer als auch
Erfolg von „Echo“ und „Google Home“ zieht nun auch der
weltgrößte Software-Konzern Microsoft nach und verstärkt sei-
ne Bemühungen. Gewiss, das Unternehmen (Umsatz: 85,3 Mrd.
US-Dollar) aus Redmond hatte seine Sprachassistentin Cortana
bereits 2014 eingeführt, sie steckt im Betriebssystem Windows
10 sowie der Spielekonsole „Xbox“ und wird von mehr als
145 Millionen Menschen in 13 Ländern genutzt. Doch erst im
vergangenen Dezember hat Microsoft die Vorstellung „neuer
Cortana-gesteuerter Geräte“ angekündigt.
Als einen Partner für dieses Vorhaben präsentierte man die
Samsung-Firma Harman Kardon, einen Anbieter von Unter-
haltungselektronik aus Stamford, Connecticut, der als Vorge-
schmack auf die Kollaboration einen Werbefilm produzierte, in
dem eine längliche, schwarze Lautsprecherbox zu sehen ist – die
Parallele zum „Echo“ ist unübersehbar. Genau wie Amazon hat
auch Microsoft den Weg für Programmierer freigemacht, damit
sie Wissen und Gewandtheit von Cortana erweitern. Um verlo-
renen Boden wettzumachen, soll Microsoft gar versucht haben,
Alexa-Programmierer für Cortana abzuwerben.
Mittlerweile berichten mehrere Technikseiten: Der Corta-
na-Lautsprecher solle unter dem Namen „Invoke“ auf den Markt
Analyse: Axel Petermann Analyse: Precire Technologies
– Sehr amerikanisch
– Blond und stark geschminkt
– Kaut Kaugummi
– Auffällig lackierte Fingernägel
– Mitte 20
– Schlank
– Tätowierungen
– Exaltiert
Bixby (Samsung)
2
3
4
5
0
1
emotional-
offen
beziehungs-
orientiert
bestimmend
informativ
Entwickelt von früheren Siri-Erfindern / Existent seit Frühjahr 2017 (bislang nur) in Samsungs
„Galaxy S8“ / Soll Zusammenhänge besser verstehen und besser mit Telefonkamera und -An-
wendungen zusammenarbeiten / Versteht Befehle auf Englisch / Spricht bislang nur Koreanisch /
Andere Sprachen, auch Deutsch, im Laufe des Jahres via Programmaktualisierung
Siri (Apple) Alexa (Amazon) Google Assistant (Google) Cortana (Microsoft) Bixby (Samsung)
Quelle: Bilanz Mai 2017
Die Dreiecksbeziehung
7 Sei eine Marke.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 94
Sprach-
assistenten
Nutzer Skill
„Create a Persona … to make it
easier to pick the right words,
syntax, and structure.“


Google Actions Guidelines

https://developers.google.com/actions/design/
7 Sei eine Marke.
Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 95
SEI NATIV.
7 Sei eine Marke.
96Jörn Siedentopp, @joernsie, @CELLULAR_GmbH
#1Startem
iteinem
Dialog.
#2Denkenurdeneinen

relevantenUsecase.#3FühreeingutesGespräch.
#4Kom
m
aufdenPunkt.#5Seipersönlich.
#6BehaltedenKontext.#7SeieineMarke.
BE NATIVE.
RETHINK.
DON’T COPY.
X Allways.
97Jörn Siedentopp, @joernsie, @CELLULAR_GmbH
?
Die in dieser Präsentation dokumentierten Ideen und Vorschläge sind geistiges Eigentum der CELLULAR GmbH und unterliegen den geltenden Urhebergesetzen.
Eine unautorisierte Nutzung, die ganze oder teilweise Vervielfältigung sowie Weitergabe an Dritte ist nicht gestattet.
Office Germany – Große Elbstraße 39, D-22767 Hamburg
Office Austria – Hermanngasse 18, A-1070 Wien
Jörn Siedentopp
Senior Concept Designer
T +49 40 507199 93
Mail: jsiedentopp@cellular.de,
Twitter: @joernsie

More Related Content

What's hot

Solution10_Engagement Marketing
Solution10_Engagement MarketingSolution10_Engagement Marketing
Solution10_Engagement Marketingsolution10 GmbH
 
Social Media für Verlage
Social Media für VerlageSocial Media für Verlage
Social Media für VerlageIbrahim Evsan
 
Futuregram #.03 - Chatbots
Futuregram #.03 - ChatbotsFuturegram #.03 - Chatbots
Futuregram #.03 - ChatbotsTRENDONE GmbH
 
Euro cis bluetrade_zukunft_des_e-commerce_v1.04
Euro cis bluetrade_zukunft_des_e-commerce_v1.04Euro cis bluetrade_zukunft_des_e-commerce_v1.04
Euro cis bluetrade_zukunft_des_e-commerce_v1.04Joubin Rahimi
 
Solution 10 mobile experience_110411
Solution 10 mobile experience_110411Solution 10 mobile experience_110411
Solution 10 mobile experience_110411solution10 GmbH
 

What's hot (6)

Solution10_Engagement Marketing
Solution10_Engagement MarketingSolution10_Engagement Marketing
Solution10_Engagement Marketing
 
Social Media für Verlage
Social Media für VerlageSocial Media für Verlage
Social Media für Verlage
 
Chatbot Landscape
Chatbot Landscape Chatbot Landscape
Chatbot Landscape
 
Futuregram #.03 - Chatbots
Futuregram #.03 - ChatbotsFuturegram #.03 - Chatbots
Futuregram #.03 - Chatbots
 
Euro cis bluetrade_zukunft_des_e-commerce_v1.04
Euro cis bluetrade_zukunft_des_e-commerce_v1.04Euro cis bluetrade_zukunft_des_e-commerce_v1.04
Euro cis bluetrade_zukunft_des_e-commerce_v1.04
 
Solution 10 mobile experience_110411
Solution 10 mobile experience_110411Solution 10 mobile experience_110411
Solution 10 mobile experience_110411
 

Similar to UX Dos and Don'ts 
auf Alexa, Google Home und Co

Dnug05 2011 twenty-one_v1.0
Dnug05 2011 twenty-one_v1.0Dnug05 2011 twenty-one_v1.0
Dnug05 2011 twenty-one_v1.0TwentyOne AG
 
Nutzer Effekt 13 - Woher kommen die digitalen Konzepte?
Nutzer Effekt 13 - Woher kommen die digitalen Konzepte?Nutzer Effekt 13 - Woher kommen die digitalen Konzepte?
Nutzer Effekt 13 - Woher kommen die digitalen Konzepte?HANDSPIEL GmbH
 
Onlinemarketing für die öffentliche Hand - Socialbar Bonn
Onlinemarketing für die öffentliche Hand - Socialbar BonnOnlinemarketing für die öffentliche Hand - Socialbar Bonn
Onlinemarketing für die öffentliche Hand - Socialbar BonnSocialbar Bonn
 
Digitalstorytelling Workshop Vision Summit 2012
Digitalstorytelling Workshop Vision Summit 2012Digitalstorytelling Workshop Vision Summit 2012
Digitalstorytelling Workshop Vision Summit 2012betterplace lab
 
Multimediatreff
MultimediatreffMultimediatreff
MultimediatreffAnne Grabs
 
MMT 27: »Wer folgt schon einer Zuckererbse?« Social Media strategisch.
MMT 27: »Wer folgt schon einer Zuckererbse?«  Social Media strategisch.MMT 27: »Wer folgt schon einer Zuckererbse?«  Social Media strategisch.
MMT 27: »Wer folgt schon einer Zuckererbse?« Social Media strategisch.MMT - Multimediatreff
 
E-Commerce - Sofa Shopping - Impulsvortrag
E-Commerce - Sofa Shopping - ImpulsvortragE-Commerce - Sofa Shopping - Impulsvortrag
E-Commerce - Sofa Shopping - ImpulsvortragTelekom MMS
 
Halluzinationen - Online Trends für Anfänger und Fortgeschrittene
Halluzinationen - Online Trends für Anfänger und FortgeschritteneHalluzinationen - Online Trends für Anfänger und Fortgeschrittene
Halluzinationen - Online Trends für Anfänger und FortgeschritteneAlexander Muehr
 
Wunderland Marketing - Neue Ideen für Marketing im Social Web.
Wunderland Marketing - Neue Ideen für Marketing im Social Web.Wunderland Marketing - Neue Ideen für Marketing im Social Web.
Wunderland Marketing - Neue Ideen für Marketing im Social Web.Frank Tentler
 
The real voice of the customer: Speech in research interviews
The real voice of the customer: Speech in research interviews  The real voice of the customer: Speech in research interviews
The real voice of the customer: Speech in research interviews Holger Lütters
 
Vortrag Region Frankfurt 111027
Vortrag Region Frankfurt 111027Vortrag Region Frankfurt 111027
Vortrag Region Frankfurt 111027Sebastian Basedow
 
#Neulandreport 0818 - Podcasts, Voice, Audio und die WM 2018 im Versicherungs...
#Neulandreport 0818 - Podcasts, Voice, Audio und die WM 2018 im Versicherungs...#Neulandreport 0818 - Podcasts, Voice, Audio und die WM 2018 im Versicherungs...
#Neulandreport 0818 - Podcasts, Voice, Audio und die WM 2018 im Versicherungs...As im Ärmel
 
Voice search - "Next Big SEO Thing"? oder klassischer Hype?
Voice search - "Next Big SEO Thing"? oder klassischer Hype?Voice search - "Next Big SEO Thing"? oder klassischer Hype?
Voice search - "Next Big SEO Thing"? oder klassischer Hype?Fabian Meister
 
Programmieren als Kulturtechnik - 1st meetup on 2018-04-25
Programmieren als Kulturtechnik - 1st meetup on 2018-04-25Programmieren als Kulturtechnik - 1st meetup on 2018-04-25
Programmieren als Kulturtechnik - 1st meetup on 2018-04-25Olav Schettler
 
Zukunft des Journalismus - Convention Camp Hannover 2011
Zukunft des Journalismus - Convention Camp Hannover  2011Zukunft des Journalismus - Convention Camp Hannover  2011
Zukunft des Journalismus - Convention Camp Hannover 2011Ulrike Langer
 
Geld verdienen im Netz Teil 2
Geld verdienen im Netz Teil 2Geld verdienen im Netz Teil 2
Geld verdienen im Netz Teil 2Ulrike Langer
 

Similar to UX Dos and Don'ts 
auf Alexa, Google Home und Co (20)

Das ZDF App Universum
Das ZDF App UniversumDas ZDF App Universum
Das ZDF App Universum
 
Tim Ringel, metapeople
Tim Ringel, metapeopleTim Ringel, metapeople
Tim Ringel, metapeople
 
Dnug05 2011 twenty-one_v1.0
Dnug05 2011 twenty-one_v1.0Dnug05 2011 twenty-one_v1.0
Dnug05 2011 twenty-one_v1.0
 
Nutzer Effekt 13 - Woher kommen die digitalen Konzepte?
Nutzer Effekt 13 - Woher kommen die digitalen Konzepte?Nutzer Effekt 13 - Woher kommen die digitalen Konzepte?
Nutzer Effekt 13 - Woher kommen die digitalen Konzepte?
 
Onlinemarketing für die öffentliche Hand - Socialbar Bonn
Onlinemarketing für die öffentliche Hand - Socialbar BonnOnlinemarketing für die öffentliche Hand - Socialbar Bonn
Onlinemarketing für die öffentliche Hand - Socialbar Bonn
 
Digitalstorytelling Workshop Vision Summit 2012
Digitalstorytelling Workshop Vision Summit 2012Digitalstorytelling Workshop Vision Summit 2012
Digitalstorytelling Workshop Vision Summit 2012
 
Multimediatreff
MultimediatreffMultimediatreff
Multimediatreff
 
MMT 27: »Wer folgt schon einer Zuckererbse?« Social Media strategisch.
MMT 27: »Wer folgt schon einer Zuckererbse?«  Social Media strategisch.MMT 27: »Wer folgt schon einer Zuckererbse?«  Social Media strategisch.
MMT 27: »Wer folgt schon einer Zuckererbse?« Social Media strategisch.
 
E-Commerce - Sofa Shopping - Impulsvortrag
E-Commerce - Sofa Shopping - ImpulsvortragE-Commerce - Sofa Shopping - Impulsvortrag
E-Commerce - Sofa Shopping - Impulsvortrag
 
Halluzinationen - Online Trends für Anfänger und Fortgeschrittene
Halluzinationen - Online Trends für Anfänger und FortgeschritteneHalluzinationen - Online Trends für Anfänger und Fortgeschrittene
Halluzinationen - Online Trends für Anfänger und Fortgeschrittene
 
Wunderland Marketing - Neue Ideen für Marketing im Social Web.
Wunderland Marketing - Neue Ideen für Marketing im Social Web.Wunderland Marketing - Neue Ideen für Marketing im Social Web.
Wunderland Marketing - Neue Ideen für Marketing im Social Web.
 
The real voice of the customer: Speech in research interviews
The real voice of the customer: Speech in research interviews  The real voice of the customer: Speech in research interviews
The real voice of the customer: Speech in research interviews
 
Vortrag Region Frankfurt 111027
Vortrag Region Frankfurt 111027Vortrag Region Frankfurt 111027
Vortrag Region Frankfurt 111027
 
#Neulandreport 0818 - Podcasts, Voice, Audio und die WM 2018 im Versicherungs...
#Neulandreport 0818 - Podcasts, Voice, Audio und die WM 2018 im Versicherungs...#Neulandreport 0818 - Podcasts, Voice, Audio und die WM 2018 im Versicherungs...
#Neulandreport 0818 - Podcasts, Voice, Audio und die WM 2018 im Versicherungs...
 
Voice search - "Next Big SEO Thing"? oder klassischer Hype?
Voice search - "Next Big SEO Thing"? oder klassischer Hype?Voice search - "Next Big SEO Thing"? oder klassischer Hype?
Voice search - "Next Big SEO Thing"? oder klassischer Hype?
 
Programmieren als Kulturtechnik - 1st meetup on 2018-04-25
Programmieren als Kulturtechnik - 1st meetup on 2018-04-25Programmieren als Kulturtechnik - 1st meetup on 2018-04-25
Programmieren als Kulturtechnik - 1st meetup on 2018-04-25
 
130618 bieg omt
130618   bieg omt130618   bieg omt
130618 bieg omt
 
Powerflasher Praesentation
Powerflasher PraesentationPowerflasher Praesentation
Powerflasher Praesentation
 
Zukunft des Journalismus - Convention Camp Hannover 2011
Zukunft des Journalismus - Convention Camp Hannover  2011Zukunft des Journalismus - Convention Camp Hannover  2011
Zukunft des Journalismus - Convention Camp Hannover 2011
 
Geld verdienen im Netz Teil 2
Geld verdienen im Netz Teil 2Geld verdienen im Netz Teil 2
Geld verdienen im Netz Teil 2
 

UX Dos and Don'ts 
auf Alexa, Google Home und Co

  • 2. IA Konferenz, 05. Mai 2017, 15:50 - 16:25, SAAL 1 UX Dos and Don'ts
 auf Alexa, Google Home und Co 2 Jörn Siedentopp (CELLULAR GmbH | Hamburg)
  • 3. Jörn Siedentopp Senior Concept Designer bei CELLULAR Mail: jsiedentopp@cellular.de, Twitter: @joernsie 0 Alexa, Google Home und Co 3Jörn Siedentopp, @joernsie, @CELLULAR_GmbH Familie
  • 4. Ich rede aktuell mit Alexa wie mit meinem Hund. 0 Alexa, Google Home und Co 4Jörn Siedentopp, @joernsie, @CELLULAR_GmbH
  • 5. 0 Alexa, Google Home und Co 5Jörn Siedentopp, @joernsie, @CELLULAR_GmbH „Smudo, AUS!“
  • 6. 0 Alexa, Google Home und Co 6Jörn Siedentopp, @joernsie, @CELLULAR_GmbH „Alexa, STOP!“
  • 7. Eigentlich wollen wir uns natürlich mit Alexa unterhalten. 0 Alexa, Google Home und Co Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 7
  • 8. 0 Alexa, Google Home und Co 8Jörn Siedentopp, @joernsie, @CELLULAR_GmbH Amazon Alexa
  • 9. Alexa ist nie alleine. 0 Alexa, Google Home und Co Start 9Jörn Siedentopp, @joernsie, @CELLULAR_GmbH Apple iPad Android Smartphone Google ChromeCast Android Wear MacBook Laptop Amazon Alexa
  • 10. Und es werden immer mehr… 0 Alexa, Google Home und Co 10Jörn Siedentopp, @joernsie, @CELLULAR_GmbH
  • 11. 0 Alexa, Google Home und Co 11Jörn Siedentopp, @joernsie, @CELLULAR_GmbH
  • 12. ZDFmediathek ZDFheute Wir leben in einem Multi- Device-Universum. 0 Alexa, Google Home und Co Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 12 Heute1996
  • 13. ZDFmediathek ZDFheute Ein Teil des Universums: 
 Der Alexa Skill. 0 Alexa, Google Home und Co Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 13
  • 14. ZDFmediathek ZDFheute Sprachassistenten
 sind aber überall: 0 Alexa, Google Home und Co Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 14
  • 15. Noch nie genutzt 53 % Schon mal genutzt 47 % Nutzung von Sprachassistenten in Deutschland
 Stand: April 2016 0 Alexa, Google Home und Co 15Jörn Siedentopp, @joernsie, @CELLULAR_GmbH https://de.statista.com/infografik/4686/nutzung-von-sprachassistenten-in-deutschland/
  • 16. Gekommen, um zu bleiben. 0 Alexa, Google Home und Co 16Jörn Siedentopp, @joernsie, @CELLULAR_GmbH https://techcrunch.com/2017/01/24/24-5m-voice-first-devices-expected-to-ship-this-year-but-apps-struggle-to-retain-users/ (USA) Prognose
  • 17. Deutschland
 Jede Woche kommen 60 Skills hinzu. USA Aktuell >10.000 Skills. 0 Alexa, Google Home und Co 17Jörn Siedentopp, @joernsie, @CELLULAR_GmbH Quelle: Bilanz Mai 2017
  • 18. Echo-Besitzer haben ihre Ausgaben bei Amazon nach dem Kauf eines Devices um 10% erhöht. 0 Alexa, Google Home und Co 18Jörn Siedentopp, @joernsie, @CELLULAR_GmbH http://www.deraktionaer.de/aktie/amazon-mit-rekordzahlen-und-ueberraschungserfolg-295380.htm
  • 19. Deutsche Amazon Alexa Skills 0 Alexa, Google Home und Co 19Jörn Siedentopp, @joernsie, @CELLULAR_GmbH „Alexa, ruf mir ein Taxi mit mytaxi.“ Skill: MyTaxi „Alexa, frage Deutsche Bahn nach einer 
 Verbindung von Berlin nach Hamburg.“ Skill: Deutsche Bahn"Alexa, sage Uber, ich möchte 
 eine Fahrt bestellen.“ Skill: Uber
  • 20. Deutsche Amazon Alexa Skills 0 Alexa, Google Home und Co 20Jörn Siedentopp, @joernsie, @CELLULAR_GmbH "Alexa, frage allyouneed nach 
 den heutigen Angeboten.“ Skill: Allyouneed - Marktplatz "Alexa, bestelle Pizza 
 von Lieferando." Skill: lieferando.de „Alexa, frage Chefkoch nach 
 vegetarischen Rezepten.“ Skill: Chefkoch
  • 21. CELLULAR’s erfolgreichster Skill. 0 Alexa, Google Home und Co Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 21
  • 22. 0 Alexa, Google Home und Co 22Jörn Siedentopp, @joernsie, @CELLULAR_GmbH
  • 23. 0 Alexa, Google Home und Co 23Jörn Siedentopp, @joernsie, @CELLULAR_GmbH
  • 24. ZDFheute als Alexa Skill Morning Briefing 0 Alexa, Google Home und Co 24Jörn Siedentopp, @joernsie, @CELLULAR_GmbH "Alexa, was sind die Nachrichten?"
  • 25. Wie geht Produktentwicklung für Sprachassistenten? 0 Alexa, Google Home und Co Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 25
  • 26. Unsere 7 Regeln: 0 Alexa, Google Home und Co Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 26
  • 27. #1 Starte mit einem Dialog. 1 Starte mit einem Dialog. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 27
  • 28. Konzepte sind Kopfgeburten. 1 Starte mit einem Dialog. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 28
  • 29. Konzepte sind Kopfgeburten. 1 Starte mit einem Dialog. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 29 Gespräche.
  • 30. Nie wieder Wireframes! 1 Starte mit einem Dialog. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 30
  • 31. 1 Starte mit einem Dialog. 31Jörn Siedentopp, @joernsie, @CELLULAR_GmbH Frühzeitig 
 simulieren.
  • 32. Best Test: Talk. Mit erstem Entwicklungsstand: 
 Alexa führt Protokoll. 1 Starte mit einem Dialog. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 32
  • 33. #2 Denke nur den einen relevanten Usecase. 2 Denke nur den einen relevanten Usecase. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 33
  • 34. 2 Denke nur den einen relevanten Usecase. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 34 „What's next in tech? Is it machine learning? Virtual reality? Augmented reality? Wearables? Voice interfaces? Autonomous vehicles? Yes.“ Luke Wroblewski @lukew
  • 35. ZDFmediathek ZDFheute Das ist gut: Der Skill muss nicht alles können. 2 Denke nur den einen relevanten Usecase. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 35
  • 36. Denke die User-Journey & das Produkt immer Multi-Device. 2 Denke nur den einen relevanten Usecase. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 36 ZDFmediathek ZDFheute
  • 37. Denke die User-Journey & das Produkt immer Multi-Device. 2 Denke nur den einen relevanten Usecase. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 37 Konzipiere nur den relevanten Usecase für Alexa. ZDFmediathek ZDFheute "Alexa, was sind die Nachrichten?"
  • 38. Beispiel: Plex.
 Alexa Skill im Zusammenspiel mit einem Apple TV. 2 Denke nur den einen relevanten Usecase. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 38
  • 39. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 2 VIDEO: Plex. Alexa & Apple TV (https://www.youtube.com/watch?v=0jJfUa8Ij4k)
  • 40. #3 Führe ein gutes Gespräch. 3 Führe ein gutes Gespräch. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 40
  • 41. Jeder kann reden. 3 Führe ein gutes Gespräch. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 41
  • 42. Jeder kann reden. Schlechte Gespräche 
 fallen immer auf. 3 Führe ein gutes Gespräch. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 42
  • 43. Gute Gespräche folgen Konversationsmaximen Nach Paul Grice (Philosoph, 1913 – 1988) 3 Führe ein gutes Gespräch. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 43
  • 44. Sage nur, was informativ, … 3 Führe ein gutes Gespräch. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 44 Konversationsmaximen für gute Gespräche von Paul Grice (Philosoph, 1913 – 1988)
  • 45. Sage nur, was informativ, wahr … 3 Führe ein gutes Gespräch. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 45 Konversationsmaximen für gute Gespräche von Paul Grice (Philosoph, 1913 – 1988)
  • 46. Sage nur, was informativ, wahr und wichtig ist. 3 Führe ein gutes Gespräch. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 46 Konversationsmaximen für gute Gespräche von Paul Grice (Philosoph, 1913 – 1988)
  • 47. Sage nur, was informativ, wahr und wichtig ist. Sage dies klar und deutlich! 3 Führe ein gutes Gespräch. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 47 Konversationsmaximen für gute Gespräche von Paul Grice (Philosoph, 1913 – 1988)
  • 48. Angewendet bei Sprachassistenten: 3 Führe ein gutes Gespräch. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 48
  • 49. 3 Führe ein gutes Gespräch. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 49 Schlecht Um die Nachricht erneut zuhören, sag „Wiederholen“, um zu antworten, sag „Antworten“, und um die nächste zur hören, sag „Weiter“.
  • 50. 3 Führe ein gutes Gespräch. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 50 Schlecht Um die Nachricht erneut zuhören, sag „Wiederholen“, um zu antworten, sag „Antworten“, und um die nächste zur hören, sag „Weiter“. Gut Nachricht wiederholen, antworten oder weiter zur nächsten?
  • 51. Like telling a joke — if you have to explain it, you're doing it wrong. 
 Google Actions Guidelines
 https://developers.google.com/actions/design/ 3 Führe ein gutes Gespräch. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 51 1 Actions on Google Conversation basics Creating better conversations Conversation—a study in cooperation Validating user input and managing expectations When a conversation breaks, repair it 2 2 2 3 3 Table of contents Page The Conversational UI and Why it Matters — 2 Actions on Google We’re entering a promising new era of computing, where advances in machine learning and artificial intelligence are creating a resurgence of interest in voice interfaces and natural language processing, unlocking the potential for conversation as the new mode of interaction with technology. For the most part, the problem of recognizing spo- ken input has been largely solved, opening up a new challenge: How to build a user experience that’s modeled after natural human conversation. This multi-part series outlines the basic mechanics of conversation, introduces core principles to design by, and presents you with a practical voice user in- terface (VUI) toolkit to start creating conversational experiences that engage, delight, and truly help your users. Conversation basics We can discover the key ingredients for a good VUI conversation simply by deconstructing the rules and conventions that we are mostly unaware of in natu- ral human conversation. Building blocks for successful VUI conversations include: • Turn-taking: We take turns in a conversation based on subtle signals that we pass back and forth. Without effective turn-taking, we might talk over each other, or our conversations can get out of sync and hard to follow. • Threading: In natural speech, all elements of a conversation are usually woven together in a co- herent thread that includes context and the way the conversation evolves over time. Threading helps us keep track of that conversational flow. • Inherent efficiency of speech: People often use verbal shortcuts because they intuitively understand what’s being said—essentially, we can “read between the lines” in a conversation and some things can be left unspoken. But the implication for VUIs is having to compensate for the seemingly illogical, non-math- ematical nature of human speech. • Variations in user behavior and comfort level: People use a variety of words and styles to say the same thing, depending on their own situa- tional context and expectations of a VUI based on previous experience. VUIs should support these variations so all users can have a friction- less experience. Read more on conversation basics in Understanding How Conversations Work: The Key to a Better Voice UI (https://developers.google.com/actions/design/principles) Conversation—a study in cooperation Turn-taking, context, and threading are all part of cooperative conversation, an idea popularized by linguistics philosopher Paul Grice 1 . Grice called this the Cooperative Principle. He also developed Grice’s Maxims to define the essential conversational rules he observed—namely that people should be as truth- ful, informative, relevant, and clear as possible when talking with each other. VUI should try to follow these inherent rules of cooperation as well—and be ready to support wary users who’ve had bad experiences with other voice interfaces in the past. Read more on the Cooperative Principle in Be Cooper- ative … Like Your Users2 . 1 https://plato.stanford.edu/entries/grice/ 2 http://g.co/dev/actions-be-cooperative Creating better conversations A good VUI doesn’t follow a stale script, and shouldn’t be based on the old touch-tone phone systems that force users down narrow paths. It also shouldn’t try to “teach” people what to say to protect them from veering off the so-called “happy path.” Instead, it should focus on the intuitive power of language and meaning, using everyday language to communicate with users. VUIs should also avoid stating the obvious or talking down to users—people 3 Actions on Google don’t appreciate a device that sounds like it thinks it’s smarter than they are. Read more on building an intuitive VUI in Unlocking the Power of Spoken Language. (http://g.co/dev/actions-spoken-language) Validating user input and managing expectations Once someone makes a request, a VUI can use acknowledgers—words or phrases like “OK,” “Sure,” “Alright,” “Thanks,” and “Got it”—that show the VUI is en- gaged and listening. Randomizing acknowledgers can help make the experience feel more fluid and natural. After acknowledging, the system can then seek either explicit or implicit confirmation that it understood. With explicit confirmation (which is usually used when something major is at stake, such as buying a plane ticket), the VUI asks the user for verbal agreement before proceeding. With implicit confirmation (used for lower-risk situations, such as streaming a song), the VUI in- corporates a key element of the user’s request into its response to validate and instill confidence in the user, but doesn’t require verbal approval per se. Read more in Instilling User Confidence Through Confirmations and Acknowledgements. When a conversation breaks, repair it Things can go wrong with even the most well-de- signed VUI. When conversations break down, either party can initiate a repair. Though humans usually spot and repair their own mistakes, a VUI must also be able to repair the conversation based on the flow and nature of the interaction. Read more on repair in Understanding How Conver- sations Work: The Key to a Better Voice UI. http://g.co/dev/actions-understanding-conversations Do this … • Follow basic conversational rules and everyday speech patterns • Apply the principles in Grice’s Maxims • Suggest through intuitive examples of what people can say (without “teaching” them) • Use acknowledgers to show that the system is listening • Randomize acknowledgers to make the VUI sound more natural • Use explicit confirmation for clarity around important requests, and implicit confirma- tion if a request is less risky to fulfil • Use “errors” as opportunities for more meaningful (and natural) interactions Don’t do this... • Model responses on touchtone apps and phone-tree scripts • Try to teach people what to say • State the obvious • Talk down to users or offer responses that sound mechanical • Use “Go back” instructions • Accommodate just one speaking style • Use language that talks down to users © 2016 Google Inc. All rights reserved. Google and the Google logo are trademarks of Google Inc. All other company and product names may be trademarks of the respective companies with which they are associated. VUI Do’s and Don’ts
  • 52. Gut 3 Führe ein gutes Gespräch. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 52 "Alexa, bestelle Pizza 
 von Lieferando." Skill: lieferando.de
  • 53. Erst Settings 3 Führe ein gutes Gespräch. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 53
  • 54. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 3 Video: Lieferando Skill (https://www.youtube.com/watch?v=RkB0bsGka7M)
  • 55. Gut 3 Führe ein gutes Gespräch. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 55 Plan: Starbucks Coffee Co.
  • 56. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 3 Video: My Starbucks Barista (https://www.youtube.com/watch?v=v1pyZiDVlRw)
  • 57. #4 Komm auf den Punkt. 4 Komm auf den Punkt. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 57
  • 58. Eine kurze Gedankenreise 4 Komm auf den Punkt. 58Jörn Siedentopp, @joernsie, @CELLULAR_GmbH Unser Tageskarte: 1. Rindercarpaccio m. frischen Spargel u. Parmesan 2. Grüner Bohnensalat m. Thunfisch u. Mozzarella 3. Reissalat nach Art des Chefs 4. Pasta mit Paprika u.Lachs in Tomaten-Sahnesoße 5. Pizza m- Salami u. Champignons 6. Feldsalat mit Melone u. Fleischklößen.
  • 59. Die schwierigste Frage ist: Wie viele Infos sind nötig? 4 Komm auf den Punkt. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 59
  • 60. Wie viele Infos sind für eine Produktdarstellung ausreichend? 4 Komm auf den Punkt. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 60
  • 61. Ausgangslage Eine Produktdarstellung in einer App 4 Komm auf den Punkt. 61Jörn Siedentopp, @joernsie, @CELLULAR_GmbH SEBA MED Sport Dusche, 2-in-1, für Haut & Haar Duschgel Verschiedene Sorten 2,45€ statt 2,89€
  • 62. Unser Ergebnis Eine Produktbeschreibung in einem Skill 4 Komm auf den Punkt. 62Jörn Siedentopp, @joernsie, @CELLULAR_GmbH Alexa Skill Alexa, was ist heute im Angebot?
  • 63. Unser Ergebnis Eine Produktbeschreibung in einem Skill 4 Komm auf den Punkt. 63Jörn Siedentopp, @joernsie, @CELLULAR_GmbH Im Angebot: Duschgel von SEBA MED für 2,45€ Alexa Skill Alexa, was ist heute im Angebot?
  • 64. Unser Ergebnis Eine Produktbeschreibung in einem Skill 4 Komm auf den Punkt. 64Jörn Siedentopp, @joernsie, @CELLULAR_GmbH Im Angebot: Duschgel von SEBA MED für 2,45€ Alexa Skill Alexa, was ist heute im Angebot? Lege das Duschgel auf meine Einkaufsliste.
  • 65. Und wie viele Infos sind für eine ganze Liste ausreichend? Für Suchergebnisse? 4 Komm auf den Punkt. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 65
  • 66. 4 Komm auf den Punkt. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 66 „In der Welt der Sprachsteuerung bist du entweder die Nr. 1 in den Suchergebnissen oder es wird schwierig.“ Andre Alpar, SEO-Experte im OMR Podcast #75
  • 67. #5 Sei persönlich. 5 Sei persönlich. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 67
  • 68. Kontext, Listen, Historie. Alles ist heute persönlich. 5 Sei persönlich. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 68
  • 69. Öffentliche Raum Persönliche Inhalte. Kontext, Listen, Historie. Alles ist heute persönlich. 5 Sei persönlich. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 69 vs.
  • 70. Das birgt Gefahren… 5 Sei persönlich. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 70
  • 71. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 5 Video: Hilarious Amazon Echo Alexa Fail! - 2016 (https://www.youtube.com/watch?v=KMLzJ8i9Xl4 )
  • 72. 5 Sei persönlich. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 72 „Alexa, ruf mir ein Taxi mit mytaxi.“ Skill: MyTaxi
  • 73. MyTaxi für Alexa: Persönlicher Account. Persönliche Adressen. Einer muss bezahlen. 5 Sei persönlich. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 73
  • 74. Was kann helfen? 5 Sei persönlich. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 74
  • 75. Personalisierte Inhalte
 sind der Anspruch. Auch, wenn Sprachassistenten hier heutzutage (noch) keinen Schutz bieten. 5 Sei persönlich. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 75
  • 76. Personalisierte Inhalte
 sind der Anspruch. Auch, wenn Sprachassistenten hier heutzutage (noch) keinen Schutz bieten. 5 Sei persönlich. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 76 Ansatz: Stimmidentifikation.
  • 77. #6 Behalte den Kontext. 6 Behalte den Kontext. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 77
  • 78. Alexa: Täglich grüßt das Murmeltier. Nach acht Sekunden ist dann alles vergessen. 6 Behalte den Kontext. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 78
  • 79. Kontext = Dialog = 
 Invocation Name Unser UX Research: Die Probanden bleiben dauerhaft Kontext. Alexa aktuell leider nur 8 Sek. 6 Behalte den Kontext. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 79 Starte BUDNI, … Öffne BUDNI, … Frage BUDNI, …
  • 80. Google Assistent: 
 Der mit dem Kurzzeitgedächtnis. 6 Behalte den Kontext. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 80
  • 81. „Okay, Google. 
 Wie weit ist es 
 bis zum Mond?“ 6 Behalte den Kontext. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 81
  • 82. 6 Behalte den Kontext. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 82 „Wie komm ich da hin?“ „Okay, Google. 
 Wie weit ist es 
 bis zum Mond?“
  • 83. 6 Behalte den Kontext. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 83 „Wie komm ich da hin?“ „Okay, Google. 
 Wie weit ist es 
 bis zum Mond?“
  • 84. Bixby: 
 Stellt den Kontext als KPI heraus. 6 Behalte den Kontext. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 84
  • 87. 6 Behalte den Kontext. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 87 „Einen Dialog zu führen, den Zusammenhang zu begreifen und auch abschweifende Gesprächsfäden aufzugreifen: Das ist sehr, sehr schwer.“ Siri Miterfinder Babak Hodjat – Bilanz Mai 2017
  • 88. #7 Sei eine Marke. 7 Sei eine Marke. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 88
  • 89. 7 Sei eine Marke. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 89 „Cool ist Siri, weil es eine Persönlichkeit hat.“ Tim Cook – Bilanz Mai 2017
  • 90. Die Dreiecksbeziehung 7 Sei eine Marke. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 90 Sprach- assistenten Nutzer Skill
  • 91. Die Dreiecksbeziehung 7 Sei eine Marke. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 91 Sprach- assistenten Nutzer Skill
  • 92. Profiler haben die Sprachassistenten klassifiziert und ihnen Gesichter gegeben: 7 Sei eine Marke. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 92
  • 93. Wer ist wer? 7 Sei eine Marke. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 9345 Analyse: Axel Petermann* Analyse: Precire Technologies* – Stimme wirkt ein wenig mechanisch – Sprecherin intelligent, schlank, sexy – Mittelgroß, lange und dunkle Haare – Große Augen, ebenmäßige Haut – Brille – Hat Charme, Ausstrahlung und Humor – Versucht eine Beziehung aufzubauen – Scheint sogar mit dem Nutzer zu flirten – Aufmerksame Zuhörerin BILANZ MAI / 2017 Siri (Apple) beziehungs- orientiert bestimmend informativ 2 3 4 5 0 1 * Wer Axel Petermann ist, wer hinter Precire steckt und wie sie bei ihren Analysen vorgegangen sind: siehe Seite 46 2007 von der gleichnamigen Firma aus Kalifornien entwickelt / 2010 an Apple verkauft / 2011 erstmals vorgestellt („Iphone 4S“) / Fast elf Millionen deutsche Nutzer, vor allem via „Iphone / Experten halten Siris Fähigkeiten inzwischen für überholt / Aktualisierung steht 2017 bevor emotional- offen Digitale Gesprächspartner wie Siri von Apple oder Bix- by von Samsung sind weit mehr als gefällige Marketing-Gags oder raffinierte Spielereien, die auf Zuruf Musiktitel abspielen, Hörfunksender einschalten oder den Wetterbericht aufsagen – sie sind der Beginn eines neuen Zeitalters in der Wechselbezie- hung zwischen Mensch und Maschine. Denn Fragen stellen, Befehle erteilen, Wünsche äußern, For- derungen erheben – dazu braucht es keine langwierige Einfüh- ung, kein Studium von Bedienungsanleitungen. Selbst Kinder können dies, bevor sie auch nur ihr erstes Wort geschrieben haben. Sprachsteuerung ist nicht nur einfacher, sondern auch schneller als jede zurzeit verfügbare Technik. Branchenexperten wie Dominik Wee, Berater und Partner bei McKinsey, halten den Small Talk mit künstlichen Assisten- innen für die nächste große, epochale und zukunftsweisen- de Sache in der Technikwelt, ähnlich wie die Einführung des Smart- bzw. „Iphones“ im Jahr 2007. Die Sprachassistenz, sagt Dominik Wee, berge „disruptives Potenzial“. Als erster Anbieter überhaupt hatte Apple im Jahr 2011 sein Sprachsystem Siri auf den Markt gebracht, Microsoft war 2014 mit Cortana gefolgt, ein Jahr später dann Amazon mit Alexa, die über die intelligente Lautsprecher- und Mikrofonbox Echo“ ansprechbar ist. Der Kampf um den Zukunftsmarkt ist entbrannt. Und natür- ich bleibt die sprechende Digitalassistenz nicht auf Mobiltelefo- ne oder „Macbooks“ beschränkt. Amazon Automotive will die Sprachassistentin Alexa etwa zur Beifahrerin weiterbilden und sucht auf dem Karriereportal Linkedin nach Autofachleuten. Volkswagen und Hyundai, Volvo, Ford und BMW haben bereits die Möglichkeit geschaffen, das Kunstwesen in ihre Bordtech- nik zu integrieren. Google und Apple verfügen mit „Android“ und „Carplay“ über vergleichbare Angebote, während Huawei-Telefone schonüber vergleichbare Angebote, während Huawei-Telefone schonüber vergleichbare Angebote, während Hua auf Zuruf Türen öffnen sowie Staubsauger aus- und Lam- pen einschalten können. Seit Ende 2016 kann Alexa bereits Bosch-Siemens-Hausgeräte über die BSH-Plattform Home Connect kontrollieren. Am klügsten ist wahrscheinlich Googles namenlose Hel- erin („Google Home“). Sie versteht selbst vielschichtigere Fragen und, in begrenztem Umfang, auch schon Zusammen- hänge innerhalb eines Dialogs. Zudem ist sie lernfähig: Folge einer 20-jährigen Erfahrung des Konzerns mit Suchanfragen und der Listung und Verknüpfung ungezählter Internetseiten, 47 BILANZ MAI / 2017 Analyse: Axel Petermann Analyse: Precire Technologies – Warme Stimme – In gewisser Weise erotisch – Braune Haare – Vollschlank – Kumpeltyp, Freundin des Anwenders – Weniger Charme und Humor als Siri Alexa (Amazon) 2 3 4 5 0 1 beziehungs- orientiert bestimmend informativ Lebt seit 2015 in den Amazon-Lautsprechermikrofonen „Echo“ und „Echo Dot“ / Versteht Deutsch seit Februar 2017 / Sehr schnelle Verbreitung / Viele Wechselwirkungen mit anderen Unternehmen und Geräten: u.a. Automobile, Hausgeräte, Amazon Prime emotional- offen 48 IDEEN UND INNOVATIONEN unter ihnen natürlich auch Wikipedia. „Google Home“ bleibt auf kaum eine Frage eine Antwort schuldig. Das Marktpotenzial ist gewaltig. Nach einer Quellenforschung des Datenportals Statista nutzten im vergangenen Jahr 10,8 Millionen Deutsche Apples Siri und sogar 17 Millionen „Google Now“. Das US-Marktforschungsinstitut Tractica schätzt, dass die Anzahl der Verbraucher, die Verständnis-voll reagierende Sprachassistentinnen zumindest gelegentlich verwenden, von derzeit 710 Millionen auf rund 1,8 Milliarden bis 2021 steigen wird. Der Umsatz mit den unwirklichen Helferinnen soll im selben Zeit-Der Umsatz mit den unwirklichen Helferinnen soll im selben Zeit-Der Umsatz mit den unwirklichen Helferinnen soll im selben Zeit raum von 689 Millionen auf zwölf Milliarden US-Dollar wachsen. Siri – mittlerweile auch über „Ipad“, „Apple TV“ und die kabellosen „Airpod“-Kopfhörer erreichbar – versteht sogar Chi- nesisch,HebräischundNorwegisch.„Abercool“,sagtApple-Chef Tim Cook, „ist Siri vor allem, weil sie eine Persönlichkeit hat.“ InderTathängtdieBereitschaft,mitMaschinenmündlichund nicht mehr mit Klicks zu kommunizieren, mithin ihr Markterfolg, in erheblichem Maße davon ab, ob Menschen den Geräten, an die sie ihre Worte richten, einen Charakter zusprechen, ein Naturell, ein Wesen, ein Temperament, kurzum: eine Persönlichkeit. Doch welcher Anbieter beherrscht die Kunst der Schöpfung am besten? Diese Frage hat BILANZ zwei Sachverständigen ge- stellt: dem Profiler und Kriminalpolizisten Axel Petermann und Christian Greb, Mitgründer der Sprachanalyse-Firma Precire in Aachen (s. Kasten S. 46). Was die Sprachintelligenz anbelangt, hat sich in der Nerd- und Technik-Szene in den vergangenen Monaten der Eindruck verbreitet, dass die Pionierin Siri, die populärste Vertreterin unter den scheinbaren Mitarbeiterinnen, im Ver- gleich mit ihren jüngeren Kolleginnen deutlich zu wünschen übrig lässt. Oder anders gesagt: „Warum scheint Siri so dumm zu sein?“, wie das Technikmagazin „The Verge“ fragte. Gewiss, auch Siris Programmierer sorgen dafür, dass sie dazu- lernt. Aber anders als die Google-Assistentin ist sie selten in der Lage, Folgefragen zu beantworten. Siri floskelt in diesen Fällen: „Ich bin mir nicht sicher, ob ich das richtig verstanden habe.“ Große Erwartungen knüpfen sich deshalb an das für dieses Jahr erwartete „Iphone 8“ und das auf einen neueren Stand ge- brachte mobile Betriebssystem IOS 11. Siri werde, Eingeweihten zufolge, mit größerer künstlicher Intelligenz ausgestattet. Dar- aufhin deuten Apples Zukäufe: 2015 hatte der Konzern die Fir- men Vocal-Iq und Perceptio, ein Jahr später Turi übernommen, drei Spezialisten für sprachgesteuerte, künstliche Intelligenz. Apples Anstrengungen sind nötig, denn Begeisterung rief zu- letzt die Konkurrenz hervor und hier in besonderer Weise das Handelshaus Amazon (Umsatz: 136 Mrd. Dollar), das mit Alexa einen regelrechten „Hit“ gelandet habe, wie die mit Lob norma- lerweise sehr sparsam umgehende „New York Times“ notierte. Alexa, namentlich inspiriert von der Bibliothek Alexandrias, steckt im „Echo“ – einem 23 Zentimeter hohen, röhrenförmigen Lautsprecher, der gleichzeitig auch ein Gerät enthält, durch das sich Töne und Geräusche übertragen lassen. Sagt man „Alexa!“, dann leuchtet der obere Rand des „Echo“ in blauem Licht auf und signalisiert: Ich höre zu. Sodann kann man Alexa bitten, die Temperatur im Zimmer zu senken, das neue „Daft Punk“-Lied zu spielen, Fußballergebnisse aufzusagen – und natürlich einzukaufen. Amazon will dergestalt vor allem seinen Premiumversand Prime weiter ausbauen. Seit zwei Jahren sind der „Echo“ und seine Mini-Ausgabe „Echo Dot“ in den USA im Handel, in Deutschland erst seit Februar. Die kursierenden „Echo“-Verkaufszahlen für die USA sind bemerkenswert: Im ersten Jahr sollen es rund eine Million Geräte gewesen sein, 2016 schon deren sieben, und bis Silvester dieses Jahres rechnet man mit annähernd 30 Millionen weiteren „Echos“ und „Echo Dots“. Damit wäre Amazon schon in jedem vierten US-Haushalt vertreten. Der Verkaufserfolg hat viel mit dem offenen System zu tun, das es jedem Privatmann und Unternehmen erlaubt, Alexa in neuen, zusätzlichen „Fähigkeiten“ zu unterrichten, also ähnlich zu aktualisieren wie Anwendungen fürs Telefon. Fordert man Alexa auf: „Frag die Deutsche Bahn, wann der nächste Zug von Hamburg nach München fährt“, dann liefert sie die passende Antwort. Auch Lieferando und Mytaxi, Medien wie „Spiegel On- line“, Tagesschau und „Bild“ oder die Berliner Verkehrsbetriebe sind bereits über „Echo“ beziehungsweise Alexa ansprechbar. Jede Woche kommen in Deutschland etwa 60 Fähig- und Fertig- keiten hinzu; in den USA gibt es bereits mehr als 10.000. „Ohne viel Chi-Chi hat Amazon mit ,Echo‘ einfach mal das nächste große Ding platziert“, sagt Max Koziolek (27), Mitgrün- der des Berliner Unternehmens Spectrm. Koziolek bietet Un- ternehmen Nachhilfeunterricht an, um Alexa neue Tricks bei- zubringen, im Zunftjargon „Skills“ genannt. Er sieht Alexa tech„Skills“ genannt. Er sieht Alexa tech„Skills“ - nisch weit voraus, und „es wird schwer, die wieder einzuholen“. Der überraschende Erfolg Amazons forderte auch Google heraus, ein ganz ähnlich arbeitendes Gerät zu entwickeln: Es ist besagtes „Google Home“, etwas bauchiger geformt als die „Echo“-Röhre und seit vergangenem Herbst in den USA auf weiter auf Seite 52 49 BILANZ MAI / 2017 Analyse: Axel Petermann Analyse: Precire Technologies – Cleverer als Microsofts Cortana – Warme Sprache – Rote Haare, kurzhaarig, US-Outfit – Brille mit Strass besetzt – Schlank, mittelgroß – Kostüm – Erledigt Aufgaben gewissenhaft „Google Assistant“ (Google) 2 3 4 5 0 1 beziehungs- orientiert bestimmend informativ Löste 2016 das Vorgänger-Programm „Google Now“ ab / Große Verbreitung durch Voreinstellung auf Telefonen und Handcomputern mit Android-Betriebssystem / Seit Herbst 2016 auch über den Lautsprecher „Google Home“ ansprechbar / Kann besonders gut Fragen beantworten emotional- offen 50 IDEEN UND INNOVATIONEN Werden Siri, Alexa, Bixby und Co. bald den Computermonitor abschaffen? „Ich glaube nicht, dass es eine gute Idee wäre, auf den Bildschirm und eine grafische Benutzer-Bildschirm und eine grafische Benutzer-Bildschirm und eine grafische Benutzer oberfläche zu verzichten“, sagt der Informa- tiker Babak Hodjat, einer der Erfinder von Siri. „Es ist doch oft so viel leichter, auf ein Bildchen zu klicken, als es beschreiben zu müssen.“ Vielmehr sollten Sprachassisten- tinnen „den Benutzer bei seiner Interaktion mit dem Bildschirm und damit dem Compu- ter unterstützen“. Hodjat hat 2007 in San Francisco die Firmen Siri und Sentient Technologies gegründet, die auf Entwicklung virtueller Assistenten mittels künstlicher Intelligenz spezialisiert waren. Zusammen mit seinem Mitgründer Adam Cheyer verkauf- te er Siri 2010 an Apple. Cheyer blieb noch bis 2012 an Bord, be- vor er wiederum das Sprachprogramm „Viv“ entwickelte (das später an Samsung ging). Sentient Technologies ist heute eines der wertvollsten Unternehmen für die Entwicklung von künst- licher Intelligenz auf der Welt. Hodjat ist, im Gegensatz zu manchem Technikkonzernchef, alles andere als euphorisch, was die Fähigkeiten von Sprachhel- fern anbelangt: „Es ist ziemlich leicht, Sprachassistenten für ge- nau umschriebene Aufgaben zu programmieren“, sagt er. „Aber einen Dialog zu führen, den Zusammenhang zu begreifen und auch abschweifende Gesprächsfäden aufzugreifen: Das ist sehr, sehr schwer.“ Rein sprachbasierte Systeme hält Hodjat für „viel zu begrenzt“ und verweist auf Alltagssituationen, „in denen die Sprache nicht der geeignete Kanal ist, zum Beispiel, wenn man im Bus sitzt, oder in einem Großraumbüro, wo nicht jeder mithören soll“. Geräte wie Amazons „Echo“ verstünden zu- dem keine Ironie, könnten weder Gestik noch Mimik erkennen. Nach Hodjats Ansicht machten es sich die Technikfirmen zu einfach und schöpften die Möglichkeiten nicht aus, die sich durch die künstliche Intelligenz eröffneten. Die Sprachassistentinnen funktionieren alle nach einem ähnlichen Prinzip: Mikrofo- ne übertragen das Gesagte in eine Daten- wolke, wo die Audiodatei in Schrift umge- wandelt wird. Dann übernehmen sogenann- te Chatbots, die aus Schlüsselwörtern im Text die Aufgabe herauslesen (etwa „Flug“, „heute“, „München“ und „London“), suchen im System nach der dazu passenden Antwort, die wiederum in Sprache umgewandelt und ausgesprochen wird. „Solche Konversationssysteme wie Siri funktionieren nur gut in ihrem kleinen, abgezäunten Gärtchen, in dem ganze Teams von Ingenieuren und Wissenschaftlern alles schön überschauen und programmieren können“, kritisiert Hodjat. Um die engen Grenzen zu überschreiten, empfiehlt er, sich nicht auf Sprach- kommunikation allein zu konzentrieren. Vielmehr „müssten bis- her getrennte Forschungsbereiche wie Maschinenlernen, Spracherkennung und das Erkennen von Gesichtsausdrücken zusammengebracht werden, was gar nicht so einfach ist“. Den Durchbruch, glaubt er, brächten „Haushaltsroboter, die zur Kon- versation fähig sind – weil sie zum Beispiel mit Kameras ausge- rüstet sind, die uns anschauen und unsere Gesichtsausdrücke lesen können“. Die Firma Emotient in San Diego, sagt er, sei auf eben diese Art Rechnerprogramme spezialisiert. Im vergangenen Jahr hat Apple die Firma gekauft. Jürgen Schönstein Hohn oder Witze verstehen die Assistentinnen nicht, Gebärden und Mienen können sie nicht erkennen. Forschung zusammenführen: Siri-Miterfinder Babak Hodjat. 51 BILANZ MAI / 2017 Analyse: Axel Petermann Analyse: Precire Technologies – Arrogant wie Madonna – Nicht so weit entwickelt wie Siri und Alexa – Wenig menschlich, Stimme künstlich – Roboterhaft, starre Mimik – Zackige, abgehackte Bewegungen – Sachliche Antworten, nicht sehr klug – Gewollt selbstbewusst – Blasse, unscheinbare Frau, klein – Unauffällig, in gewisser Weise bieder Cortana (Microsoft) 2 3 4 5 0 1 beziehungs- orientiert bestimmend informativ Geburt 2014 / Standard im Betriebssystem Windows 10 / 145 Millionen Nutzer weltweit / Erhält voraussichtlich 2017 auch eigene Lautsprecher- und Mikrofonbox (wie Alexa und Googles Assistentin) / Zahlreiche Kooperationen mit anderen Unternehmen emotional- offen © Alle Rechte vorbehalten - Axel Springer SE, Berlin - Jede Veröffentlichung und nicht-private Nutzung exklusiv über www.axelspringer-syndication.de/lizenzierung BILANZ--s3-beilagen-86 2565b33269f433cee4ea8d831d88b969 52 IDEEN UND INNOVATIONEN kommen, und zwar noch in diesem Jahr. Über „Invoke“ würden Nutzer auch Microsofts Internet-Telefondienst Skype verwen- den können. Weder Microsoft noch Harman Kardon wollten die Informationen auf BILANZ-Nachfrage kommentieren. Wann auch immer der Zylinder auf den Markt kommen wird, Microsofts Strategie lässt bereits jetzt erkennen, dass man Cor- tana nicht auf ein Gerät beschränken möchte. So kündigte der Autohersteller Volvo unlängst an, Cortana in seine Fahrzeuge zu integrieren. Und BMW präsentierte auf der diesjährigen CES-Technikmesse in Las Vegas bereits einen Prototyp, der Cortana an Bord hatte. Ob sich Bixby von Samsung etablieren und gegen die erfah- reneren und bereits enteilten Wettbewerberinnen behaupten kann, wird die Zukunft zeigen. Anders als Siri oder Alexa bil- de Bixby kein „isoliertes Feature“, sondern eine „intelligente Schnittstelle“, die Sprache mit berührungsempfindlicher Be- dienung, mit Bildern und Informationen verbinde. Wer etwa mit dem Telefon ein Foto von einer Weinflasche schieße, sagte Sriram Thodla bei der „Galaxy S8“-Präsentation, könne Bixby fragen, wo er diesen Wein in seiner Umgebung kaufen kann. „Bixby versteht die Zusammenhänge.“ Für den Anfang wird Samsung aber nicht nur mit dem Um- stand zu kämpfen haben, dass „Galaxy S8“-Besitzer zwischen Bixby und der voreingestellten Google-Sprachassistentin wäh- len können. Zusätzlich erschwert wurde der US-Start des Te- lefons am 21. April noch durch die Tatsache, dass es bis Ende Mai dauern könnte, bis Bixby Englisch sprechen kann. Bei in- ternen Tests, berichtete das „Wall Street Journal“, hätten Bix- bys Sprachkenntnisse noch nicht überzeugt. Zwar versteht Bixby bereits schriftliche Befehle in englischer Sprache und kann diese auch umsetzen und kommentieren („Sure. Let’s takekann diese auch umsetzen und kommentieren („Sure. Let’s takekann diese auch umsetzen und kommentieren ( a picture“) – mit ihr plaudern können aber bisher nur des Ko- reanischen Mächtige. Eine deutsche Version wird „im vierten Quartal 2017“ verfügbar sein, wie Samsung verkündete. Ungeachtet der Startschwierigkeiten, sind Samsungs Pläne mit Bixby höchst ambitioniert: „Wir starten mit dem Telefon und werden schnell auf weitere Geräte expandieren“, kündigte Chef-werden schnell auf weitere Geräte expandieren“, kündigte Chef-werden schnell auf weitere Geräte expandieren“, kündigte Chef entwickler Injong Rhee an. Praktischerweise baut Samsung die Fernseher, Kühlschränke, Klimaanlagen und Waschmaschinen, mit denen Bixby mal kommunizieren soll, gleich selbst. In naher Zukunft, glaubt Rhee, werden all diese Geräte zu Hause auf unsere Stimme hören: „Du rufst ,Hallo, Bixby‘, und alles um dich herum erwacht und spricht mit dir.“ Er hält das offenkundig für eine erstrebenswerte Vorstellung. 1 dem Markt. Im April brachte Google die Box nach Großbritan- nien, im Sommer soll sie auch in Deutschland zu haben sein. Die Google-Sprachassistentin selbst ist hiesigen Nutzern nicht unbekannt: 2016 stellte man sie auf dem Google-Telefon „Pixel“ vor. Und auf der Digitaltechnikmesse MWC in Barce- lona Ende Februar kündigte Google an, sie den Telefonen von HTC, Huawei, LG, Sony und auch Samsung einzupflanzen. Da- mit wird die Google-Assistentin weltweit auf etwa einem Drit- tel aller Android-Telefone laufen. Der Suchmaschinenkonzern Google und seine Obergesell- schaft Alphabet (Umsatz: 90,3 Mrd. US-Dollar) verfügen über den mit Abstand umfangreichsten Datenberg aller Technikfir- men, und mit jeder Suchanfrage, ob schriftlich oder mündlich gestellt, lernt das System dazu. Folgerichtig stellt Google besonders die Beantwortung von Fragen in den Vordergrund des Leistungsspektrums seiner As- sistentin („Wie groß ist die Strecke von der Erde zum Mond?“). Im Unterschied zu den meisten Helferinnen hat Googles auch ein Kurzzeitgedächtnis und merkt sich die vorangegangenen Fragen. Ebenso wie „Echo“ kann „Google Home“ aber auch Termine vorlesen und Musik abspielen. Angestachelt und -gespornt sowohl vom Eifer als auch Erfolg von „Echo“ und „Google Home“ zieht nun auch der weltgrößte Software-Konzern Microsoft nach und verstärkt sei- ne Bemühungen. Gewiss, das Unternehmen (Umsatz: 85,3 Mrd. US-Dollar) aus Redmond hatte seine Sprachassistentin Cortana bereits 2014 eingeführt, sie steckt im Betriebssystem Windows 10 sowie der Spielekonsole „Xbox“ und wird von mehr als 145 Millionen Menschen in 13 Ländern genutzt. Doch erst im vergangenen Dezember hat Microsoft die Vorstellung „neuer Cortana-gesteuerter Geräte“ angekündigt. Als einen Partner für dieses Vorhaben präsentierte man die Samsung-Firma Harman Kardon, einen Anbieter von Unter- haltungselektronik aus Stamford, Connecticut, der als Vorge- schmack auf die Kollaboration einen Werbefilm produzierte, in dem eine längliche, schwarze Lautsprecherbox zu sehen ist – die Parallele zum „Echo“ ist unübersehbar. Genau wie Amazon hat auch Microsoft den Weg für Programmierer freigemacht, damit sie Wissen und Gewandtheit von Cortana erweitern. Um verlo- renen Boden wettzumachen, soll Microsoft gar versucht haben, Alexa-Programmierer für Cortana abzuwerben. Mittlerweile berichten mehrere Technikseiten: Der Corta- na-Lautsprecher solle unter dem Namen „Invoke“ auf den Markt Analyse: Axel Petermann Analyse: Precire Technologies – Sehr amerikanisch – Blond und stark geschminkt – Kaut Kaugummi – Auffällig lackierte Fingernägel – Mitte 20 – Schlank – Tätowierungen – Exaltiert Bixby (Samsung) 2 3 4 5 0 1 emotional- offen beziehungs- orientiert bestimmend informativ Entwickelt von früheren Siri-Erfindern / Existent seit Frühjahr 2017 (bislang nur) in Samsungs „Galaxy S8“ / Soll Zusammenhänge besser verstehen und besser mit Telefonkamera und -An- wendungen zusammenarbeiten / Versteht Befehle auf Englisch / Spricht bislang nur Koreanisch / Andere Sprachen, auch Deutsch, im Laufe des Jahres via Programmaktualisierung Siri (Apple) Alexa (Amazon) Google Assistant (Google) Cortana (Microsoft) Bixby (Samsung) Quelle: Bilanz Mai 2017
  • 94. Die Dreiecksbeziehung 7 Sei eine Marke. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 94 Sprach- assistenten Nutzer Skill
  • 95. „Create a Persona … to make it easier to pick the right words, syntax, and structure.“ 
 Google Actions Guidelines
 https://developers.google.com/actions/design/ 7 Sei eine Marke. Jörn Siedentopp, @joernsie, @CELLULAR_GmbH 95
  • 96. SEI NATIV. 7 Sei eine Marke. 96Jörn Siedentopp, @joernsie, @CELLULAR_GmbH #1Startem iteinem Dialog. #2Denkenurdeneinen
 relevantenUsecase.#3FühreeingutesGespräch. #4Kom m aufdenPunkt.#5Seipersönlich. #6BehaltedenKontext.#7SeieineMarke.
  • 97. BE NATIVE. RETHINK. DON’T COPY. X Allways. 97Jörn Siedentopp, @joernsie, @CELLULAR_GmbH
  • 98. ? Die in dieser Präsentation dokumentierten Ideen und Vorschläge sind geistiges Eigentum der CELLULAR GmbH und unterliegen den geltenden Urhebergesetzen. Eine unautorisierte Nutzung, die ganze oder teilweise Vervielfältigung sowie Weitergabe an Dritte ist nicht gestattet. Office Germany – Große Elbstraße 39, D-22767 Hamburg Office Austria – Hermanngasse 18, A-1070 Wien Jörn Siedentopp Senior Concept Designer T +49 40 507199 93 Mail: jsiedentopp@cellular.de, Twitter: @joernsie