Digitalisierung & Transformation

Voice Commerce

Mehr Personalisierung bei Sprachassistenten nötig

Sprachassistenten sind beliebt in der Schweiz – doch der Voice Commerce steckt noch in den Kinderschuhen. Der Grund: Vielen Nutzern fehlt das Vertrauen in die Technologie. Das kann geändert werden – wenn die Stimme des Sprachassistenten an die Persönlichkeit des Kunden angepasst wird.
PDF Kaufen

Sprachassistenten sind beliebt: Laut der Studie «Voice First Barometer» des Ins­tituts für Marketing & Analytics, der Universität Luzern, der Swisscom und der VUI Agency spricht jede zweite Person in der Schweiz mit Sprachassistenten, wie Amazons Alexa oder Googles Assistant, auf dem Smartphone, im Auto oder zu Hause mit dem Smart Speaker. Dabei werden die digitalen Helfer vorwiegend für die Suche nach Informationen, für die Steuerung von Smart-Home-Geräten und für die Musikwiedergabe genutzt. 

Noch wenig Vertrauen

Moderne Sprachassistenten können aber nicht nur einfache Aufgaben erledigen, sondern auch komplexe Voice-Commerce-Aktivitäten, wie das Vergleichen und Bestellen von Produkten, übernehmen. So können Kunden mit unternehmensspezifischen Sprachassistenten etwa die perfekte Kaffeemischung finden, eine Fahrt mit Uber anfordern oder schnell eine Mahlzeit bei ihrem bevorzugten Lieferdienst bestellen. Viele Unternehmen haben zwar bereits das enorme Potenzial von Sprachassistenten erkannt, sind aber oft unsicher, wie diese gestaltet werden sollten, um ein angenehmes Kundenerlebnis zu gewährleisten. 

Derzeit sind sich zwar Experten darüber ­einig, dass in den kommenden Jahren ­immer mehr Menschen ihre Einkäufe über Sprachassistenten tätigen werden. De facto aber konnte der Onlineeinkauf über die Stimme mit dem Sprachassistenten bei den Nutzern bislang nur sporadisch Fuss fassen. Ein Grund: Die Nutzer haben zu wenig Vertrauen in die neue Technologie. Während dieser wahrgenommene Mangel sicherlich auch dadurch verstärkt wird, dass die Sprach­assistenten den schwei­zerdeutschen ­Dialekt weder vollumfänglich verstehen noch sprechen, könnte das auch mit dem Sprachstil zusammenhängen: Viele Sprachassistenten sind immer noch mit Standard-Stimmen ausgestattet. Diese Stimmen klingen oft maschinell und erschweren es dadurch den Kunden, sich mit dem Sprachassistenten zu iden­tifizieren und ihm zu vertrauen.

Auf die Stimme kommt es an

Die «Ähnlichkeits-Attraktions-Theorie» könnte Unternehmen hierbei von Nutzen sein. Die Theorie besagt, dass Menschen eher zu anderen Menschen hingezogen werden, wenn diese ihnen ähnlich sind. Sind sich Menschen einander ähnlich, schenken sie sich mehr Vertrauen. Die Ähnlichkeit kann beispielsweise durch ­Interessen, Eigenschaften oder auch die Stimme bestehen. Dies gilt nicht nur für die Mensch-Mensch-Interaktion. Dieser Effekt funktioniert auch im Zusammenspiel von Mensch und Technologie. Studien zeigen, dass Nutzer, die eine Stimme, passend zu ihrer eigenen Persönlichkeit, hören, sich eher zu ihr hingezogen fühlen. Wenn es dem Sprachassistenten gelingt, seinen Usern in der Stimme ähnlich zu sein, könnte dies das Vertrauen in ihn stärken und die Bereitschaft erhöhen, mit ihm zu interagieren.

Ein Experiment

Wir wollten daher wissen, ob es einen ­positiven Effekt hat, wenn die Stimme von Sprachassistenten an die individu­ellen Eigenschaften der Nutzer angepasst würde. Vertrauen Frauen weiblichen Stimmen mehr? Und introvertierte Menschen langsameren, ruhigeren Tönen? Sind ­extrovertierte Menschen eher bereit, per Sprache einzukaufen, wenn Sprachassistenten laut und schnell sprechen? Um dies herauszufinden, führten wir eine ­Studie mit 380 Teilnehmern durch und untersuchten das Vertrauen, das Nutzer in Sprachassistenten haben, wenn diese nicht mehr klingen wie der Standard, sondern gezielt mit den Persönlichkeitseigenschaften ihrer Nutzer ausgestattet sind.

Dafür kreierten wir vier verschiedene Sprachassistenten mit unterschiedlichen Geschlechtern und Persönlichkeiten: «Hans» mit einer männlichen, tieferen Stimme, «Vicky» mit einer weiblichen, höheren. Ausserdem ordneten wir ihnen über die Stimmlage, die Lautstärke und die Schnelligkeit verschiedene Persönlichkeiten zu: eine schnellere, höhere, lautere Stimme für den extrovertierten Typ, eine langsamere, leisere Stimme für den introvertierten Typ.

Mit jeder der vier Varianten wurde dasselbe Verkaufsgespräch aufgezeichnet, das sich die Teilnehmenden des Expe­riments anhörten. Im nächsten Schritt machten sie Angaben zu ihrer Person. Daraus errechneten wir die Übereinstimmung zwischen den Charaktereigenschaften von Sprachassistent und Nutzern und verglichen auch das Geschlecht.

Keine Einheitsstrategien

Die Studie («Übereinstimmung oder Nichtübereinstimmung? Wie sich die Übereinstimmung von Persönlichkeit und Geschlecht zwischen Sprachassistenten und Benutzern auf das Vertrauen in Voice Commerce auswirkt») zeigt, dass eine hohe Vertrauensbasis zwischen Sprachassistent und Nutzer entsteht, wenn sich beide in ihrer Persönlichkeit ähnlich sind. Dies gilt für alle gemessenen Vertrauensdimensionen: Integrität, Kompetenz und Wohlwollen. Sprich, introvertierte Nutzer vertrauen eher einem introvertiert sprechenden Sprachassistenten und extrovertierte Nutzer eher einem extrovertiert sprechenden Sprachassistenten. Im Gegensatz dazu wurde keine Auswirkung auf das Vertrauensverhältnis festgestellt, wenn Sprachassistent und Nutzer demselben Geschlecht angehörten. 

Der fehlende Effekt der geschlechtsspezifischen Übereinstimmung ist möglicherweise darauf zurückzuführen, dass die meisten kommerziellen Sprachassistenten eine weibliche Stimme haben, was dazu führt, dass die Nutzer vorgefasste Erwartungen an die Stimme haben. Weibliche Sprachassistenten erlangen das Vertrauen der Nutzer in das Wohlwollen des Sprachassistenten leichter als männliche. Das Geschlecht hat aber keinen Effekt auf die Zuschreibung von Kompetenz und Integrität des Assistenten. Für Unternehmen ist das eine wertvolle Erkenntnis, die helfen kann, Kunden besser zu verstehen. Denn bei der Gestaltung von Sprachassistenten reicht es demnach nicht aus, sich nur auf technische Komponenten und Inhalte zu konzentrieren. Was Kunden wollen, sind personalisierte Angebote mit einer Stimme, in der sie sich selbst wiedererkennen können. Da Nutzer oft nicht bereit sind, sensible persönliche Informationen mitzuteilen, könnten automatisierte Ansätze verwendet werden, um auf Geschlecht und Persönlichkeit zu schliessen. 

Emotional anpassen

Über die Analyse der Nutzer-Stimmen können Unternehmen etwa Daten ge­winnen, Rückschlüsse auf die Persönlichkeit ziehen und dadurch den Sprachstil des Assistenten (Tonlage, Lautstärke, Schnelligkeit) an die jeweiligen Kunden anpassen. Dadurch erringt der Sprachassistent mehr Vertrauen – und Vertrauen ist einer der wichtigsten Erfolgsfaktoren im Onlineshopping. Unternehmen, die im Voice Commerce erfolgreich sein wollen, sollten diesem Aspekt höchste Bedeutung beimessen. Sprachassistenten, denen die Kunden vertrauen, bieten diesen eine angenehmere Kauferfahrung, einschliesslich einer grösseren Entscheidungszufriedenheit. 

In Zukunft könnten Unternehmen sogar einen Schritt weitergehen und die Stimme der Kunden während der Interaktion untersuchen. Damit könnte der emotionale Zustand während des Gesprächs festgestellt werden, etwa ob Anspannung, Frust oder gute Laune vorliegt. Während des Gesprächs kann sich der Sprachassistent dann an den Gefühls­zustand der Nutzer anpassen. So wie ein echter Freund, eine echte Freundin es tut. 

Unternehmen sollten die Vorteile dieses neuen «Touchpoints» zu den Kunden nutzen und ein personalisiertes Design ihrer Sprachassistenten, entsprechend ihrer Zielgruppen oder angepasst an den spezifischen Kunden, andenken. Durch eine Übereinstimmung zwischen der Persönlichkeit des Sprachassistenten und der Nutzer können Unternehmen einen gros­sen Schritt machen, um eine zentrale Herausforderung im Voice Commerce – den Aufbau von Vertrauen – zu meistern.

Porträt