Analysen:Sie wissen alles

Lesezeit: 2 min

Algorithmen ziehen aus wenigen Daten mehr korrekte Schlüsse als man ahnt - das kann gefährliche Folgen nach sich ziehen.

Von Helmut Martin-Jung, München

Die Geschichte ist schon einige Jahre her. Aber sie illustriert eindrucksvoll, wie eine Technik funktioniert, die mit Big Data zwar ganz treffend, aber ziemlich abstrakt beschrieben ist. Die Geschichte geht so: Der Vater einer 17-Jährigen kam wutentbrannt in die Filiale einer amerikanischen Einzelhandelskette. Seine Tochter hatte eine E-Mail bekommen, in der ihr zur Schwangerschaft gratuliert und für Babyprodukte geworben wurde. Was der Vater nicht wusste: Das Mädchen war tatsächlich schwanger. Der Einzelhändler wusste das auch nicht, schloss es aber aus den Daten, die er über die Einkäufe des Mädchens gesammelt hatte.

Wie der verantwortliche Programmierer der New York Times erzählte, reichen einige wenige Daten aus, um mit hoher Wahrscheinlichkeit vorherzusagen, dass eine Schwangerschaft bevorsteht - ja sogar, wann es ungefähr so weit sein wird. Wenn schon wenige Datensätze genügen, um so bedeutende Dinge vorherzusagen, um wie viel wertvoller muss das sein, was jene Firmen an Daten horten, denen die Menschen des Internetzeitalters ihre privatesten Angelegenheiten anvertrauen - Firmen wie Facebook, Google und andere?

Internetkonzerne lassen sich ihre Dienste mit Daten der Nutzer bezahlen

Der große Unterschied zu Vorhaben wie dem der Bundesbank, die über die Kreditsituation der Deutschen informiert sein möchte, ist dieser: Die Zentralbank sammelt diese Daten, um daraus Risiken für die Finanzstabilität zu berechnen. Welcher Mensch welche Kredite zu welchem Zweck aufgenommen hat, interessiert die Bundesbank nicht. Bei den Internetkonzernen ist das anders. Sie bieten innovative, teils auch sehr nützliche Dienste an, lassen sich deren Nutzung aber mit Daten bezahlen. So werden dann beispielsweise Mails von Computern daraufhin durchgescannt, für welche Werbung sich die Menschen interessieren könnten.

Oder es werden Suchen, die jemand bei Google oder einer anderen werbefinanzierten Suchmaschine vorgenommen hat, dazu benutzt, Werbung einzuspielen, die sich genau auf diese Suche bezieht. Das ist der Grund dafür, dass einen Werbung für Sneakers, nach denen man mal gegoogelt hat, über Tage im Netz verfolgt.

Wenn es tatsächlich so kommt, wie es viele Technikforscher und -firmen vorhersagen, und mehr und mehr Alltagsgegenstände vernetzt werden, dann wird auch die Menge an Daten steigen, die diese Geräte produzieren. Und damit wachsen auch die Möglichkeiten, aus diesen Daten Schlüsse zu ziehen. Das machen natürlich nicht Menschen, sondern Maschinen. Menschen programmieren nur die Regeln - im Fachjargon spricht man von Algorithmen -, nach denen die Computer sich durch die Datenberge fressen.

Wer annimmt, dies sei umständlich und zeitraubend, kennt nicht die Möglichkeiten, die sich heute bieten. Es gibt Systeme zur Datenbankanalyse, die nahezu verzögerungsfrei solche Auswertungen vornehmen können. Mathematiker und Physiker, die solche Algorithmen entwickeln, sind überaus gefragt, nicht bloß bei Internet-Unternehmen, sondern auch in der Finanzbranche.

Dass dies Risiken birgt, liegt auf der Hand. Nicht nur auf den Finanzplätzen, wo superschnelle Computer viel Schaden anrichten können, bevor überhaupt ein Mensch reagieren kann. Auch die Datenschätze, die sich bei Privatfirmen anhäufen, verraten mehr über die Nutzer, als die meisten ahnen.

© SZ vom 10.09.2015 - Rechte am Artikel können Sie hier erwerben.
Zur SZ-Startseite
Jetzt entdecken

Gutscheine: