bedeckt München 22°
vgwortpixel

Sprachsteuerung:Weißt du, was ich meine? 

Oct 14 2011 Irvine California U S BRIAN CHAVARRIAGA 20 of Huntington Beach had his new iP

Sprachsteuerung, wie etwa bei Apples Siri, gibt es bereits seit Jahren.

(Foto: imago/ZUMA Press)

Immer mehr Unternehmen wollen eine automatisierte Sprachsteuerung nutzen, um mit Kunden zu kommunizieren. Doch es gibt einige Hürden.

"Sind Sie bereit für das Meeting?" - "Wann fängt es noch mal an?" - "Bitte antworten Sie mit Ja oder Nein." Hans van Dam kennt viele solcher Beispiele. Beispiele dafür, wie es nicht laufen sollte, wenn Menschen mit sprachgesteuerten Systemen kommunizieren. Bots nennen Fachleute diese Systeme, abgeleitet von Robot. Mit seiner Firma Robocopy bringt van Dam Unternehmen bei, wie sie es besser machen können.

Sein Geschäft läuft gut, denn mehr und mehr Unternehmen setzen auf Bots. Weil es eine Menge Geld spart, wie Yoav Barel sagt. Der Israeli ist der Gründer des Chatbot Summits, einer Fachmesse, die vor Kurzem in Berlin stattfand. Erstmals war dabei ein ganzer Tag nur Bots gewidmet, die per Stimme kommunizieren. Für die Unternehmen ist das vielversprechend. Bei einer Kundenanfrage kostet die Arbeitszeit 2,50 Euro, der gleiche Betrag fällt für die IT an, also etwa die Datenbanken mit all den Verträgen eines Kunden.

Nimmt aber ein Bot das Gespräch an, sinken die Arbeitskosten auf weniger als 50 Cent pro Anruf. Bei 50 Millionen Kundenanfragen pro Monat wie beim Telekommunikationskonzern Vodafone kommen da schnell gewaltige Summen zusammen. 2021 wolle Vodafone 60 Prozent der Kundenanfragen automatisiert erledigen, sagt Barel. Einsparpotenzial: 35 Millionen Euro pro Monat.

Aber ziehen die Kunden da auch mit? Jeder kennt schließlich Horrorgeschichten wie die von Hans van Dam. Doch die Bots werden besser. Und: Angetrieben vom Internethändler Amazon hat sich eine neue Gerätekategorie etabliert - sprachgesteuerte Lautsprecher. Sprachsteuerung gab es zwar davor auch schon, etwa Apples Siri, vernetzte Lautsprecher ebenfalls. Die Kombination beider Technologien aber übt ganz offenbar einen großen Reiz auf viele Konsumenten aus, die damit herumspielen. Millionen Geräte sind bereits verkauft worden und lauschen nun in den Wohnungen der Besitzer auf ein Aufwachwort wie Alexa oder Hey Siri.

"Alexa! - Wie wird das Wetter morgen?" - das ist eine der leichtesten Übungen für Geräte. Komplizierter wird es, wenn etwa ein Geschäft abgeschlossen werden soll. Denn dann gibt es Rückfragen und verschiedene Möglichkeiten für die Kunden, sich zu entscheiden. Dann geben Kleinigkeiten den Ausschlag, ob Kunden verärgert auflegen oder sich gerne etwa durch einen Bestellprozess führen lassen. Hans van Dam rät als Erstes: "Lasse niemals Ingenieure den Text schreiben!"

Kreative und Techniker müssen von Anfang an zusammenarbeiten

Die Herangehensweise von früher, dass an einem Projekt zehn Ingenieure arbeiteten und ein Texter, der sich dann meist nur schlecht durchsetzen konnte, müsse dringend geändert werden, sagt er. Stattdessen müssten Kreative und Techniker von Anfang an zusammenarbeiten, damit die Bots auch angenommen werden. Van Dam sieht darin auch eine Chance für Geisteswissenschaftler, in einer von Technik dominierten Welt Arbeit zu finden.

Als zweite Regel nennt van Dam den Atemtest. Was man nicht in einem Atemzug sagen kann, sei zu lang. Gesprochene Ansagen dürften auch nicht zu viel Information enthalten. Und am besten schreibt man sie so, wie man sie auch im normalen Umgangston sagen würde. In seiner Firma werden daher neue Bots getestet, indem sich zwei Mitarbeiter Rücken an Rücken setzen, damit keine weiteren Informationen wie Gesten oder Mimik ausgetauscht werden können. Der eine spielt den Bot, der andere den menschlichen Nutzer. So wird das automatische System Wiederholung für Wiederholung optimiert.

Vorgehensweisen wie diese dürften Nikola Aschoff gefallen. Die junge Frau leitet bei Mercedes-Benz den Bereich erweiterte digitale Dienste: "Wir denken, wir kennen unsere Kunden", sagt sie, "aber oft stimmen unsere Annahmen nicht. Da helfen voice snippets gewaltig." Die kurzen Schnipsel an Text, die Kunden hinterlassen, wenn sie mit Bots gesprochen haben, zeigen nicht nur inhaltlich, was die Kunden eigentlich wollen. Aus ihnen lassen sich - auch mithilfe künstlicher Intelligenz - auch weitere Informationen gewinnen: Ist ein Kunde nervös, verärgert oder gut gelaunt? Welche Hintergrundgeräusche gibt es? "Das wird in seiner Langzeitwirkung unterschätzt", sagt Aschoff.

Das Problem ist: Die Anrufer müssen konsistent bedient werden, egal an welchen Kanal sie sich bei einem Unternehmen wenden. Yoav Barel fordert daher, es dürfe nur ein Gehirn geben, eine zentrale Stelle also, von der aus verschiedene Kanäle bedient werden können - Sprachbots, Chatroboter und die menschlichen Mitarbeiter. Doch so einfach ist das gar nicht, denn es hängt immer davon ab, in welchem Kontext eine Anfrage steht. "Der Aufwand dafür wird unterschätzt", sagt die Expertin Aschoff, "das darf man nicht nur einem Werkstudenten überlassen." Denn der gehe nach einiger Zeit wieder. Wichtig sei aber, dass sich jemand ständig kümmert. Die Bots müssten immer aktuell gehalten werden. Und die Inhalte müssten je nach Kanal auch auf andere Weise aufbereitet werden.

Sprachsteuerung: Die Technik ist da und die Akzeptanz wächst

Sprache als Mittel, um mit Maschinen zu kommunizieren, hält Aschoff aber für richtig - vor allem, weil sich die Technologie im Auto nutzen lässt und die Hände dennoch am Lenkrad bleiben können. Sprache zu nutzen, sei natürlich, die Technologie bereits da, und die Akzeptanz wachse. Und: 80 Prozent der Mercedes-Kunden rufen am liebsten an, um zum Beispiel einen Servicetermin zu buchen.

Mit einem ähnlichen Anruf - es ging um die Vereinbarung eines Friseurtermins - hat Google vor einigen Monaten bei einer Konferenz viel Aufsehen erregt. Denn die Frau im Friseursalon wusste nicht, dass sie mit einem Bot sprach, und merkte das auch im Verlauf des Gesprächs nicht. Damit, so glauben nicht wenige in der Branche, hat das Unternehmen der Sache allerdings einen Bärendienst erwiesen. Denn es sei schließlich Vertrauen nötig, sonst würden sich viele Menschen nicht gerne auf Bots einlassen.

Jeder Bot brauche eine eigene Persönlichkeit, glaubt Hans van Dam. Und Yoav Barel ist der Meinung, es müsse dafür gesorgt werden, dass die Menschen darüber informiert werden, wenn sie mit einem Bot sprechen. Grundsätzlich sieht er eine goldene Ära für Sprachtechnologie voraus. Es gebe heute schon Versicherungsanbieter, die mit KI-gesteuerten Bots Policen verkaufen und einfache Schadensansprüche regulieren. "Der Rekord liegt bei drei Sekunden", sagt er, dann sei die Überweisung schon auf dem Weg gewesen.

Bis 2025, glaubt er, würden Milliarden Menschen Dienste nutzen, die mit Sprache gesteuert werden, entweder per Stimmeingabe oder mit Text. Diese Bots hätten für Unternehmen einen enormen Wert. Die zugrundliegenden Techniken entwickelten sich ständig weiter. Und nicht jedes Unternehmen, das Bots einsetzen wolle, müsse die selbst programmieren.

Sie können sich an einen der Großen wenden, Amazon, Google und Microsoft etwa. Oder an Spezialunternehmen wie Audio Codes aus Israel, die bisher vor allem Technik für Callcenter geliefert haben. Die können dann auch spezielle Anwendungen wie Meeting Insights liefern. Ein Meeting wird dabei aufgezeichnet, und eine KI fasst die Redebeiträge der einzelnen Teilnehmer zusammen. Die US-Firma Nuance, einer der Pioniere bei Spracherkennung, setzt auf Systeme etwa fürs Auto, die ohne ein Aufwachwachwort wie Alexa erkennen sollen, wenn ein Mensch etwas von ihnen will. Und gut wäre, wenn die Antwort dann nicht lauten würde: "Ich habe Sie nicht verstanden."

© SZ vom 04.01.2020/mxh
Lesen Sie mit SZ Plus auch
Digitale Privatsphäre Sieben Tipps für die digitale Selbstverteidigung

Privatsphäre auf dem Smartphone

Sieben Tipps für die digitale Selbstverteidigung

Schnüffelnde Apps und spionierende Tracker verwandeln Handys in digitale Wanzen. Doch Nutzer können sich wehren. Mit dieser Anleitung holen sie sich ihre Privatsphäre zurück.   Von Simon Hurtz

Zur SZ-Startseite