"Hey Google, wie viele Menschen hören mir zu?"

Es gibt nur wenige Fragen, auf die der Google Assistant keine Antwort weiß. Der Sprachassistent steckt in Smartphones, smarten Lautsprechern und Smart-Displays und kann auf alle Informationen zugreifen, die Google im Netz zusammengeklaubt hat. Der Suchindex umfasst Milliarden Seiten und ist mehr als 100 Millionen Gigabyte groß. Doch bei einem Thema wird der Google Assistant schmallippig: bei Google.

Dabei ist die Frage ganz einfach: "Hey Google, wie viele Menschen hören mir zu?" Die Frauenstimme antwortet: "Tut mir leid, da kann ich noch nicht weiterhelfen." Bedauerlich, denn die Antwort interessiert viele Menschen. Kürzlich gab eine Recherche des flämischen Rundfunks VRT einen Hinweis. Jemand spielte dem Sender Audioaufnahmen zu: Aufzeichnungen, die der Google Assistant von seinen Nutzern gespeichert hatte. Der Whistleblower arbeitet bei einem externen Dienstleister. Dort hört er die Mitschnitte ab, kategorisiert sie und fertigt Abschriften an. Weltweit sollen Tausende weitere Menschen dafür zuständig sein.

IT-Sicherheit Amazon-Mitarbeiter hören Alexa-Sprachbefehlen zu — Smart-Speaker Echo

Amazon-Mitarbeiter hören Alexa-Sprachbefehlen zu

Wer dachte, die Spracheingaben seien nur für Software gedacht, der irrt einem Bericht zufolge. Amazon-Mitarbeiter können auch Informationen sehen, mit denen Nutzer identifiziert werden könnten. Von Max Muth

Das passt zu einer Recherche der Nachrichtenagentur Bloomberg. Demnach setzt auch Amazon auf menschliche Korrekturhörer: Tausende Mitarbeiter bekommen zu hören, was Amazons Sprachassistent Alexa aufzeichnet. Beide Berichte lösten heftige Reaktionen aus. Verbraucherschützer empörten sich, Datenschützer kündigten Untersuchungen an, Medien überboten sich mit Schlagzeilen: "Wanzen im Wohnzimmer", "Spione im Schlafzimmer".

Was sagen die Unternehmen dazu? Die Antworten der Pressesprecher sind länger als die der Assistenten, der Erkenntnisgewinn hält sich dennoch in Grenzen. Google arbeite mit "Experten auf der ganzen Welt zusammen, um die Sprachtechnologie zu verbessern", nennt aber keine Details. Amazon teilt mit: "Grundsätzlich können wir zur Größe einzelner Teams keine Auskunft geben." Die "große Mehrheit" der Menschen, die Sprachaufnahmen abhörten, seien Vollzeitbeschäftige von Amazon. Google macht keine Angaben, wie viele der zuständigen Mitarbeiter für externe Dienstleister tätig sind.

Apple und Microsoft, die mit Siri und Cortana ebenfalls Sprachassistenten anbieten, antworten noch ausweichender. Apple lege großen Wert auf Sicherheit und Privatsphäre, sagt ein Sprecher, und verweist auf ein Sicherheits-Whitepaper (PDF). Microsoft konnte innerhalb von zwei Wochen gar keine Antworten zu Verfügung stellen. Als Vice im April wissen wollte, wie viele Menschen Cortanas Aufzeichnungen hören können, sagte eine Sprecherin nur: "Microsoft weiß zu keinem Zeitpunkt, wer Fragen an Cortana gestellt hat." Sowohl bei Apple als auch bei Microsoft bleibt also unklar, ob und wie viele Menschen die Sprachaufzeichnungen hören.

Das Herumdrucksen der Unternehmen lässt nur einen Schluss zu

Grundsätzlich kann man davon ausgehen, dass Unternehmen ein Interesse daran haben, eindeutige Auskunft zu geben, wenn sie glauben, dass die Antwort das Vertrauen der Nutzer steigert. "Kein Mensch bekommt die Aufnahmen zu hören, die unsere Mikrofone aufzeichnen", dürfte vertrauenssteigernd wirkend. Dass der Satz nicht fällt, spricht für sich.

Im Umkehrschluss bedeutet das: Wer Sprachassistenten nutzt, kann sich relativ sicher sein, dass früher oder später auch ein Mensch zuhört. Google sagt, dass 0,2 Prozent aller Aufnahmen von Menschen analysiert würden. Absolute Zahlen nennt das Unternehmen nicht "Wir versehen nur den Bruchteil eines Prozents der Interaktionen mit Anmerkungen", teilt Amazon mit, sagt an anderer Stelle aber auch: "Kunden sprechen mit Alexa Milliarden Male im Monat." Selbst bei einem sehr geringen Anteil an abgehörten Aufnahmen kommt eine Menge Material zusammen - genug, um Tausende Menschen zu beschäftigen, die Bloomberg zufolge täglich jeweils tausend Aufzeichnungen bearbeiten.

Liest man die Stellungnahmen der Unternehmen und spricht mit aktuellen und ehemaligen Mitarbeitern, wird klar: Sie halten die teils entsetzten Reaktionen für übertrieben. Für sie ist es selbstverständlich, dass Menschen helfen, die Technik zu verbessern. Dagegen sind die meisten Nutzer überzeugt, dass hinter smarten Geräten ausschließlich Maschinen stecken. Sie hören "Algorithmus" oder "künstliche Intelligenz", denken vielleicht noch an Science-Fiction-Filme und kommen nicht auf die Idee, dass es Menschen braucht, um die Systeme weiterzuentwickeln.

Vier Dinge, die Google und Amazon besser machen müssen

Mit Deep-Learning-Methoden können Maschinen ihre Fähigkeiten selbständig verbessern, doch komplett autonome Systeme sind selten. Gerade Sprachassistenten brauchen menschliche Ohren zur Unterstützung. Wer schon einmal versucht hat, ein Gespräch mit schlechter Tonqualität von einer Spracherkennungs-Software transkribieren zu lassen, weiß, wie fehleranfällig das ist. Smarte Lautsprecher nehmen meist Hintergrundgeräusche auf, nur selten sprechen Nutzer direkt ins Mikrofon. Deshalb müssen Menschen einen Teil der Aufzeichnungen abtippen, damit die Maschinen die Protokolle als Trainingsmaterial nutzen können.

Wenn die Tech-Unternehmen sagen, dass sie die manuellen Transkripte nicht verwenden, um noch mehr über einzelne Nutzer zu erfahren, ist das glaubwürdig: Sie wissen ohnehin genug. Um ihre Angebote zu personalisieren und Werbekunden anzulocken, die nach möglichst passgenauen Anzeigen verlangen, reichen die vorhandenen Daten allemal. Dennoch verdienen Google und Amazon zumindest einen Teil der Kritik. Das hat vier Gründe:

1. Unklare Datenschutzerklärungen verschleiern den Faktor Mensch

Die Unternehmen klären Nutzer unzureichend auf, was mit ihren Sprachaufnahmen passiert. Google hat eine Seite zu "Datensicherheit & Datenschutz bei Google Home" und eine allgemeine Datenschutzerklärung. Amazon informiert über "Alexa, Echo-Geräte und Ihre Privatsphäre" und beantwortet "Häufig gestellte Fragen zu Alexa und Alexa-Geräten". Der simple Satz, dass unter Umständen Menschen zuhören, steht nirgends.

Mit dieser Information rücken die Unternehmen erst heraus, wenn Journalisten nachfragen. So befeuern sie die Illusion, die sich die meisten Menschen machen: dass sie mit einer nahezu magischen künstlichen Intelligenz interagieren. Google und Amazon profitieren davon: Wenn alle Nutzer wüssten, wie die Technik tatsächlich funktioniert, wären wohl weniger als 100 Millionen Alexa-Geräte verkauft worden.

2. Die Mikrofone nehmen mehr auf als sie sollten

Beide Unternehmen tun so, als seien Alexa und der Google Assistant nahezu perfekte Systeme. Schließlich zeichneten die Assistenten nur auf, wenn man sie bewusst mit einem Signalwort aktiviere. Doch das stimmt nur in der Theorie: Als Rishi Chandra, Leiter von Googles Nest-Sparte, während des Gesprächs mit der SZ versehentlich sein Smartphone aufweckte, bekam er das immerhin sofort mit: Der Google Assistant fragte ihn laut und deutlich, wie er ihm helfen könne.

Millionen Menschen haben weniger Glück. Vergangenes Jahr stellten die Marktwächter der Verbraucherzentrale NRW fest, dass Sprachassistenten auf viele Wörter ansprechen, die der Aktivierungsphrase nur ähneln. Alexa reagiert etwa auf "Alexandra" und "Ham wa schon" (statt "Amazon"). Googles Assistent fühlt sich auch bei "Okay Kuchen" angesprochen.

Digitale Privatsphäre Gutachten: Alexa birgt Risiken für Kinder — Sprachassistent von Amazon

Gutachten: Alexa birgt Risiken für Kinder

Der Sprachassistent von Amazon sammelt auch Daten von Personen, die nicht zugestimmt haben. Zudem sei unklar, wie der Konzern die Aufzeichnungen nutze. Nun hat sich Amazon geäußert.

Die smarten Lautsprecher geben dann ein optisches Signal und spielen auf Wunsch einen Ton ab. Doch das reicht offenbar nicht. Von etwa 1000 Aufnahmen, die dem flämischen VRT zugespielt wurden, seien rund 150 versehentlich auf Googles Servern gelandet. Bloomberg nennt einen Anteil von zehn Prozent unbeabsichtigter Alexa-Aktivierungen. Immer wieder sollen sensible Momente eingefangen worden sein: Schlafzimmergeflüster, Streitgespräche, berufliche Telefonate. Beide Medien berichten von verstörenden Aufzeichnungen: Ein Kind habe nach Hilfe gerufen, eine Frau sei offenbar bedrängt worden. Amazon-Mitarbeiter sollen Zeugen einer Vergewaltigung geworden sein.

Hersteller von Sprachassistenten müssen eine Entscheidung treffen: Wie sensibel sollen die Mikrofone auf das Signalwort reagieren? Liegt die Schwelle zu hoch, frustriert das die Nutzer. Umgekehrt kann es zu versehentlichen Aktivierungen kommen. "In seltenen Fällen" könne Alexa unbeabsichtigt aufwachen, sagt Amazon. "Ein großes Team arbeitet daran, die Wahrscheinlichkeit ungewollter Aktivierungen kontinuierlich zu minimieren." Auch Google spricht von Einzelfällen. Mitarbeiter seien angewiesen, ausschließlich Aufnahmen zu transkribieren, bei denen Nutzer bewusst mit dem Sprachassistenten interagiert hätten.

3. Google und Amazon beschwichtigen statt aufzuklären

Menschen hören Korrektur. Maschinen machen Fehler. Das sind keine Skandale. Problematisch ist, wie die Konzerne damit umgehen. Google beteuert, man wolle künftig klarer machen, wie Daten genutzt werden. Amazon erklärt: "Wir suchen kontinuierlich nach Möglichkeiten, Kunden einen besseren Zugang zu Informationen über die Funktionsweise von Alexa zu geben." Alexa wird im November fünf Jahre alt, auch Google entwickelt seit vielen Jahren sprachgesteuerte Assistenten. Warum fällt den Unternehmen erst jetzt auf, dass sie Nutzer besser aufklären sollten?

Auch die Stellungnahmen auf die Enthüllungen enthalten Widersprüche. Erst dementierte Amazon, dass Mitarbeiter einzelne Nutzer identifizieren können. Eine weitere Bloomberg-Recherche belegte das Gegenteil: Einige Angestellte konnten mit Hilfe von Geodaten die Privatadressen von Nutzern rekonstruieren, deren Sprachaufnahmen sie anhörten.

Noch im Frühjahr behauptete Google, die Audiosequenzen seien verzerrt und nicht mit persönlich identifizierbaren Informationen verknüpft. VRT berichtet dagegen von "sehr klarer" Tonqualität. Im Google-System mögen Nutzerprofile und Sprachaufnahmen getrennt sein, doch teils enthalten die Tonschnipsel Adressen und andere sensible Informationen. So konnten die Journalisten einzelne Menschen identifizieren und ihnen ihre eigenen Stimmen vorspielen.

4. Pannen untergraben das Vertrauen

Oktober 2017: Etwa 4000 Exemplare des Google Home Mini nehmen rund um die Uhr unkontrolliert die Umgebung auf und übertragen alles auf Googles Server.

Mai 2018: Alexa zeichnet unbemerkt das Privatgespräch eines Paares auf und verschickt es an einen Bekannten aus dem Adressbuch des Mannes.

Januar 2019: Amazon sendet bei einer DSGVO-Abfrage 1700 teils intime Sprachnachrichten an einen Nutzer, der damit nichts zu tun hat.

Februar 2019: In Googles Alarmanlage Nest Secure steckt ein Mikrofon - von dem Nutzer nichts wussten.

Bei Hunderten Millionen vernetzten Geräten geht immer etwas schief. Doch wenn Unternehmen wollen, dass Menschen sich Mikrofone und Kameras anschaffen, die zumindest theoretisch alles aufnehmen können, sollten sie solche Fälle tunlichst vermeiden. "Wer Google-Geräte ins Schlafzimmer stellt, muss Vertrauen haben", sagt Google-Manager Chandra. "Deshalb ist für uns wichtig, dass wir dabei absolut transparent sind und erklären, was wir aufzeichnen und auswerten."

Für Google und Amazon wäre es ein guter Anfang, mit den Fragen ihrer eigenen Nutzer anzufangen. Bloomberg berichtet, dass Echo-Besitzer auf der ganzen Welt immer wieder wissen wollten: "Alexa, hört uns noch jemand anderes zu?"