Kommentar:Der Mensch lehrt die Maschine

Um ihre Sprachassistenten zu trainieren, belauschten Konzerne wie Microsoft ihre Kunden. Skandalös ist, dass die Firmen das nicht offenlegen.

Von Philipp Bovermann

Es ist der vorerst letzte Akt in einem Schauspiel, das einen Blick hinter die Kulissen der smarten, digitalen Gegenwart gewährt: Bereits seit 2014 hat Microsoft seine Nutzer belauscht und die Gespräche durch externe Dienstleister auswerten lassen - über die Sprachsteuerung seiner Spielekonsole Xbox One. So sollte die Funktionsweise der Spracherkennung verbessert werden, möglicherweise für Microsofts digitalen Sprachassistenten Cortana, der 2016 erstmals das Wort an Windows-Nutzer richtete. Wie kam das heraus? Einer der damaligen Xbox-Auswerter sprach nun anonym mit dem Onlinemagazin Vice. In den seinerzeit mitgeschnittenen Gesprächen waren hauptsächlich Kinder und Jugendliche zu hören - kein Wunder bei Spielekonsolen.

Sprachassistenten-Trainer berichteten anonym, sie hätten Telefonsex über Skype mitgehört

Die Enthüllung hätte eigentlich alles, um die Öffentlichkeit zu empören: Microsoft hat Kinder belauscht! Dass dies jetzt, wenn überhaupt, nur noch als Randnotiz läuft, liegt daran, dass bereits seit Monaten tröpfchenweise ans Licht kommt, wie sich die großen Techunternehmen über die Mikrofone ihrer Geräte hemmungslos in die Wohnzimmer geschaltet haben. Hinter den KI-Sprachassistenten Siri von Apple, Alexa von Amazon, Microsofts Cortana und dem Google Assistant steckten Menschen, die Teile der Aufnahmen anhörten, um zu prüfen, ob der digitale Helfer die Eingabe richtig verstanden hat. Wenn nicht, sorgten sie mit Korrekturen dafür, dass er für das nächste Mal lernt. Ungefähr so, wie man auch andere mehr oder minder intelligente Systeme trainiert. Zum Beispiel Kinder, wenn sie nicht gerade vor der Spielekonsole hängen.

In den Enthüllungen der vergangenen Monate wurden Sprachassistenten-Trainer zitiert. Sie berichteten anonym, sie hätten Telefonsex über Skype mitgehört, Suchanfragen für Pornografie an Cortana oder auch Ausschnitte aus dem ganz normalen Alltag am anderen Ende der Leitung. Manches davon war gar nicht für die Geräte bestimmt - die Spracherkennung aktiviert sich oft versehentlich, wenn jemand in Hörweite Worte fallen lässt, die den Einschalt-Kommandos ("Hey Siri", "Okay Google") ähneln. Die Entrüstung darüber ist verständlich. Aber sie zeigt auch, wie naiv die meisten Menschen immer noch der künstlichen Intelligenz gegenüberstehen, wie einer Zauberbude. Und wie sehr die Unternehmen auf diese Naivität angewiesen sind.

Der Skandal ist nicht, dass die intelligenten Sprachsysteme trainiert wurden. Künstliche Intelligenz funktioniert nicht wie ein Computerprogramm, das jemand programmiert, dann ist es fertig, läuft - und wird in dem, was es tut, ganz von selbst, kraft seiner "Intelligenz", immer besser. Die Unternehmen brauchen, und zwar auf absehbare Zeit, immer noch Menschen hinter den Kulissen, die in stupider Arbeit durch Parameter definieren, was die Systeme lernen sollen; sie brauchen Menschen, die beispielsweise unzählige Male festlegen, wie ungefähr ein "Hallo" klingt, um der KI zu zeigen, auf welche "hallohaften" Merkmale in einer Sprachaufzeichnung sie künftig zu achten hat.

Der Skandal dabei ist, wie intransparent die Techkonzerne mit diesen grundlegenden Funktionsweisen ihrer Sprachassistenten umgehen - und das noch als digitale "Smartness" vermarkten.

Es gibt eine riesige Nachfrage nach Menschen, die künstlichen Intelligenzen zuarbeiten, sogenannte "Clickworker". Amazon hat seinen Marktplatz, auf dem Unternehmen und Wissenschaftler Clickworking-Jobs ausschreiben können, "Mechanical Turk" genannt. Der Name bezieht sich auf den "Mechanischen Türken", eine Art allerersten Schachcomputer in Gestalt eines Türken in traditioneller Kluft, der im 18. Jahrhundert ganz von selbst seinen Arm bewegte und Schachpartien bestritt. Es dauerte Jahrzehnte, bis herauskam, dass im Inneren der Zahnräder ein kleinwüchsiger Schachmeister verborgen war. Hinter dem technischen Wunder steckte profane menschliche Arbeit - wenn man so will, "künstliche künstliche" Intelligenz.

Amazon-Mitarbeiter sollen beim Abhören der Sprachaufzeichnungen Zeuge einer Vergewaltigung geworden sein. Das ist schwer zu verkraften. Und was für Löhne werden den Clickworkern gezahlt? In dem Vice-Artikel über die lauschenden Xboxes berichtet einer der Sprachassistenten-Trainer, er habe für seine Arbeit zehn Dollar die Stunde erhalten. Die Unternehmen profitieren davon, dass so selten über die Menschen berichtet wird, die hinter den Kulissen aufräumen, mithören und so die digitalen Zahnräder in Bewegung halten. Dadurch wirkt "Smartness" wie ein Wunder - bis jemand die Klappe des "Mechanischen Türken" öffnet.

Zur SZ-Startseite
Jetzt entdecken

Gutscheine: