bedeckt München
vgwortpixel

Sprachassistenten:Hallo?!

Barking orders at an Amazon Echo speaker.

Ohne Strom läuft digital - hier ein Sprachcomputer - nichts. Jedes einzelne Gerät verbraucht wenig, doch es gibt immer mehr davon.

(Foto: Jens Mortensen/NYT/Redux/laif)

Siri, Alexa, Cortana und Google - sprachgesteuerte Assistenten sind ein Renner, doch hören da nicht doch Menschen mit? Das tun sie - und das muss sogar so sein.

Hey Google, wie viele Menschen hören mir zu?"Es gibt nur wenige Fragen, auf die der Google Assistant keine Antwort weiß. Der Sprachassistent steckt in Smartphones, smarten Lautsprechern und Smart-Displays und kann auf alle Informationen zugreifen, die Google im Netz zusammengeklaubt hat. Der Suchindex umfasst Milliarden Seiten und ist mehr als 100 Millionen Gigabyte groß. Doch bei einem Thema wird Google schmallippig: Google. Dabei ist die Frage ganz einfach: "Hey Google, wie viele Menschen hören mir zu?"

Eine Frauenstimme antwortet: "Tut mir leid, da kann ich noch nicht weiterhelfen." Schade, denn die Antwort interessiert viele. Kürzlich gab eine Recherche des flämischen Rundfunks VRT einen Hinweis. Jemand spielte dem Sender Audioaufnahmen zu: Aufnahmen, die der Google Assistant von seinen Nutzern gespeichert hatte. Der Whistleblower arbeitet bei einem externen Dienstleister. Dort hört er die Mitschnitte ab, kategorisiert sie und fertigt Abschriften an. Weltweit sollen Tausende weitere Menschen dafür zuständig sein.

Wer Sprachassistenten nutzt, kann sich sicher sein: Früher oder später hört ein Mensch zu

Das passt zu einer Recherche der Nachrichtenagentur Bloomberg. Demnach setzt auch Amazon auf menschliche Korrekturhörer: Tausende Mitarbeiter bekommen zu hören, was Amazons Sprachassistent Alexa aufzeichnet. Beide Berichte lösten heftige Reaktionen aus. Verbraucherschützer empörten sich, Datenschützer kündigten Untersuchungen an, Medien überboten sich mit Schlagzeilen: "Wanzen im Wohnzimmer", "Spione im Schlafzimmer". Was sagen die Unternehmen dazu?

Der Google Assistant und Alexa verweigern die Auskunft. Von den Pressestellen ist zu erfahren, Google arbeite mit "Experten auf der ganzen Welt zusammen, um die Sprachtechnologie zu verbessern", Details: Fehlanzeige. Amazon teilt mit: "Grundsätzlich können wir zur Größe einzelner Teams keine Auskunft geben." Die "große Mehrheit" der Menschen, die Sprachaufnahmen abhörten, seien Vollzeitbeschäftigte von Amazon. Google macht keine Angaben, wie viele der zuständigen Mitarbeiter für externe Dienstleister tätig sind. Apple und Microsoft, die mit Siri und Cortana ebenfalls Sprachassistenten anbieten, antworten noch ausweichender. Apple lege großen Wert auf Sicherheit und Privatsphäre, sagt ein Sprecher, und verweist auf ein Sicherheits-Whitepaper. Microsoft konnte innerhalb von zwei Wochen gar keine Antworten zu Verfügung stellen.

Grundsätzlich kann man davon ausgehen, dass Unternehmen ein Interesse daran haben, eindeutige Auskunft zu geben, wenn sie glauben, dass die Antwort das Vertrauen der Nutzer steigert.

"Kein Mensch bekommt die Aufnahmen zu hören, die unsere Mikrofone aufzeichnen", dürfte vertrauenssteigernd wirkend. Dass der Satz nicht fällt, spricht für sich. Im Umkehrschluss bedeutet das: Wer Sprachassistenten nutzt, kann sich relativ sicher sein, dass früher oder später auch mal ein Mensch zuhört. Google sagt, dass 0,2 Prozent aller Aufnahmen von Menschen analysiert würden. Absolute Zahlen nennt das Unternehmen nicht. "Wir versehen nur den Bruchteil eines Prozents der Interaktionen mit Anmerkungen", teilt Amazon mit, sagt an anderer Stelle aber auch: "Kunden sprechen mit Alexa Milliarden Male im Monat."

Selbst bei einem sehr geringen Anteil an abgehörten Aufnahmen kommt eine Menge Material zusammen - genug, um Tausende Menschen zu beschäftigen, die Bloomberg zufolge täglich jeweils tausend Aufzeichnungen bearbeiten. Liest man die Stellungnahmen der Unternehmen und spricht mit aktuellen und ehemaligen Mitarbeitern, wird klar: Sie halten die teils entsetzten Reaktionen für übertrieben. Für sie ist es selbstverständlich, dass Menschen helfen, die Technik zu verbessern. Dagegen sind die meisten Nutzer überzeugt, dass hinter smarten Geräten ausschließlich Maschinen stecken. Sie hören "Algorithmus" oder "künstliche Intelligenz", denken vielleicht noch an Science-Fiction-Filme und kommen nicht auf die Idee, dass es Menschen braucht, um die Systeme weiterzuentwickeln.

Mit Deep-Learning-Methoden können Maschinen ihre Fähigkeiten selbständig verbessern, doch komplett autonome Systeme sind selten. Gerade Sprachassistenten brauchen menschliche Ohren zur Unterstützung. Wer schon einmal versucht hat, ein Gespräch mit schlechter Tonqualität von einer Spracherkennungssoftware transkribieren zu lassen, weiß, wie fehleranfällig das ist. Smarte Lautsprecher nehmen meist Hintergrundgeräusche auf, nur selten sprechen Nutzer direkt ins Mikrofon. Deshalb müssen Menschen einen Teil der Aufzeichnungen abtippen, damit die Maschinen die Protokolle als Trainingsmaterial nutzen können. Wenn die Tech-Unternehmen sagen, dass sie die manuellen Transkripte nicht verwenden, um noch mehr über einzelne Nutzer zu erfahren, ist das glaubwürdig: Sie wissen ohnehin genug. Um ihre Angebote zu personalisieren und Werbekunden anzulocken, die nach möglichst passgenauen Anzeigen verlangen, reichen die vorhandenen Daten allemal. Dennoch verdienen Google und Amazon zumindest einen Teil der Kritik.

Die Unternehmen tun so, als seien Alexa und der Google Assistant nahezu perfekte Systeme

Das hat vier Gründe: 1. Unklare Datenschutzerklärungen verschleiern den Faktor Mensch. Die Unternehmen klären Nutzer unzureichend auf, was mit ihren Sprachaufnahmen passiert. Der simple Satz, dass unter Umständen Menschen zuhören, steht nirgends. Mit dieser Information rücken die Unternehmen erst heraus, wenn Journalisten nachfragen. So befeuern sie die Illusion, die sich die meisten Menschen machen: dass sie mit einer nahezu magischen künstlichen Intelligenz interagieren. Wenn alle Nutzer wüssten, wie die Technik tatsächlich funktioniert, wären wohl weniger als 100 Millionen Alexa-Geräte verkauft worden.

2. Die Mikrofone nehmen mehr auf, als sie sollten. Beide Unternehmen tun so, als seien Alexa und der Google Assistant nahezu perfekte Systeme. Schließlich zeichneten die Assistenten nur auf, wenn man sie bewusst mit einem Signalwort aktiviere. Doch das stimmt nur in der Theorie: Vergangenes Jahr stellten die Marktwächter der Verbraucherzentrale NRW fest, dass Sprachassistenten auf viele Wörter ansprechen, die der Aktivierungsphrase nur ähneln. Alexa reagiert etwa auf "Alexandra" und "Ham wa schon" (statt "Amazon"). Googles Assistent fühlt sich auch bei "Okay Kuchen" angesprochen. Die smarten Lautsprecher geben dann ein optisches Signal und spielen auf Wunsch einen Ton ab. Doch das reicht offenbar nicht. Von etwa 1000 Aufnahmen, die dem flämischen VRT zugespielt wurden, seien rund 150 versehentlich auf Googles Servern gelandet. Bloomberg nennt einen Anteil von etwa zehn Prozent unbeabsichtigten Alexa-Aktivierungen. Immer wieder sollen sensible Momente eingefangen worden sein: Schlafzimmergeflüster, Streitgespräche, berufliche Telefonate. Beide Medien berichten von verstörenden Aufzeichnungen: Ein Kind habe um Hilfe gerufen, eine Frau sei offenbar bedrängt worden. Amazon-Mitarbeiter sollen Zeugen einer Vergewaltigung geworden sein.

Hersteller von Sprachassistenten müssen eine Entscheidung treffen: Wie sensibel sollen die Mikrofone auf das Signalwort reagieren? Liegt die Schwelle zu hoch, frustriert das die Nutzer. Umgekehrt kann es zu versehentlichen Aktivierungen kommen. "In seltenen Fällen" könne Alexa unbeabsichtigt aufwachen, sagt Amazon. "Ein großes Team arbeitet daran, die Wahrscheinlichkeit ungewollter Aktivierungen kontinuierlich zu minimieren." Auch Google spricht von Einzelfällen. Mitarbeiter seien angewiesen, ausschließlich Aufnahmen zu transkribieren, bei denen Nutzer bewusst mit dem Sprachassistent interagiert hätten.

3. Google und Amazon beschwichtigen, statt aufzuklären. Menschen hören Korrektur. Maschinen machen Fehler. Das sind keine Skandale. Problematisch ist, wie die Konzerne damit umgehen. Google beteuert, man wolle künftig klarer machen, wie Daten genutzt werden. Amazon erklärt: "Wir suchen kontinuierlich nach Möglichkeiten, Kunden einen besseren Zugang zu Informationen über die Funktionsweise von Alexa zu geben." Alexa wird im November fünf Jahre alt, auch Google entwickelt seit vielen Jahren sprachgesteuerte Assistenten. Warum fällt den Unternehmen erst jetzt auf, dass sie Nutzer besser aufklären sollten? Auch die Stellungnahmen zu den Enthüllungen enthalten Widersprüche. Erst dementierte Amazon, dass Mitarbeiter einzelne Nutzer identifizieren können. Eine weitere Bloomberg-Recherche belegte das Gegenteil: Einige Angestellte konnten mithilfe von Geodaten die Privatadressen von Nutzern rekonstruieren, deren Sprachaufnahmen sie anhörten. Noch im Frühjahr behauptete Google, die Audiosequenzen seien verzerrt und nicht mit persönlich identifizierbaren Informationen verknüpft. VRT berichtet dagegen von "sehr klarer" Tonqualität. Im Google-System mögen Nutzerprofile und Sprachaufnahmen getrennt sein, doch teils enthalten die Tonschnipsel Adressen und andere sensible Informationen. So konnten Journalisten einzelne Menschen identifizieren und ihnen ihre eigenen Stimmen vorspielen.

4. Pannen untergraben das Vertrauen. Oktober 2017: Etwa 4000 Exemplare des Google Home Mini nehmen rund um die Uhr die Umgebung auf und übertragen alles auf Googles Server. Mai 2018: Alexa zeichnet unbemerkt das Privatgespräch eines Paares auf und verschickt es an einen Bekannten aus dem Adressbuch des Mannes. Januar 2019: Amazon sendet bei einer DSGVO-Abfrage 1700 teils intime Sprachnachrichten an einen Nutzer, der damit nichts zu tun hat. Februar 2019: In Googles Alarmanlage Nest Secure steckt ein Mikrofon - von dem niemand wusste. Das sind Einzelfälle. Bei Hunderten Millionen vernetzten Geräten geht immer irgendetwas schief. Doch wenn Unternehmen wollen, dass Menschen sich Mikrofone und Kameras anschaffen, die zumindest theoretisch alles aufnehmen könnten, sollten sie solche Einzelfälle tunlichst vermeiden. "Wer Google-Geräte ins Schlafzimmer stellt, muss Vertrauen haben", sagt der verantwortliche Google-Manager Rishi Chandra. "Deshalb ist für uns wichtig, dass wir dabei absolut transparent sind und erklären, was wir aufzeichnen und auswerten."Für Google und Amazon wäre es ein guter Anfang, mit den Fragen ihrer Nutzer anzufangen. Bloomberg berichtet, dass Echo-Besitzer weltweit immer wieder wissen wollten: "Alexa, hört uns noch jemand anderes zu?"