Die Forscher von Deepmind haben zwei verschiedene neuronale Netze programmiert. Diese simulieren, grob vereinfacht, ein menschliches Gehirn. Die Netzwerke bestehen aus mehreren Schichten und Knotenpunkten. Die Schichten werten Informationen aus, zum Beispiel das Aussehen des Spielbretts und die Farbe der Steine (hier gibt es eine detailliertere Erklärung). Die Knotenpunkte entscheiden, welchen Zug die Maschine ausführen wird.
Um den Algorithmus zu trainieren, haben die Forscher 100 000 Amateurspiele aus einer öffentlichen Datenbank analysiert. Auf Grundlage dieser Daten ließen sie die Maschine ein paar Millionen Mal gegen sich selbst antreten. "Danach hatten wir eine Datenmenge, die groß genug war", sagte Hassabis in seiner Oxford-Rede.
Das erste neuronale Netz entscheidet über die bestmöglichen Züge, Deepmind nennt es das "Policy Network". Parallel dazu gibt ein zweiter Algorithmus bei sämtlichen Zügen Tipps, wer am Ende das Match für sich entscheidet. Diese Bewertungen nennt Deepmind entsprechend "Value Network". Beide Netzwerke werden dann mit dem Monte-Carlo-Verfahren kombiniert, eine in der Wissenschaft übliche Methode, um zufällige statistische Vorgänge zu simulieren.
Für die wahrscheinlichsten Züge simuliert der Algorithmus die möglichen Auswirkungen und gibt Tipps ab, ob und wie sich das Ergebnis ändern würde. "Unser AlphaGo-System muss nicht 200 Züge in Betracht ziehen, sondern die Top 3 der wahrscheinlichsten", sagte Hassabis.
"Eine Meta-Lösung für jedes Problem"
Für Hassabis ist das Spiel gegen Sedol nur eine Zwischenstation. Er will mehr, als die Leistungsfähigkeit von Deepminds KI zu beweisen. Algorithmen waren bis dato immer auf ein einzelnes Problem spezialisiert. Hassabis' Ziel sind universelle Algorithmen, die für unterschiedliche Zwecke eingesetzt werden können. "Woran wir arbeiten, ist potentiell eine Meta-Lösung für jedes Problem", sagte er kürzlich im Interview mit dem Guardian.
Es ist unklar, ob es jemals eine künstliche Intelligenz geben wird, die derart allgemein vorgehen kann, wie Hassabis es beschreibt. Führende Forscher gehen aber davon aus. Ebenfalls überzeugt sind Google und Facebook, die deshalb Millionen Dollar in Forschung investieren.
Elon Musk warnt vor der Macht der Maschinen
Die Fortschritte bei der Entwicklung der KI sind beeindruckend und beängstigend zugleich. Sobald Maschinen genauso intelligent sind wie Menschen, dauert es Experten zufolge nicht mehr lange, bis uns die Maschinen weit abgehängt haben werden. Das liegt an der immensen Rechenkraft, die sich exponentiell entwickelt. Forschungsinstitute und Visionäre wie Elon Musk überlegen bereits heute, wie man KI bändigen könnte.
Hassabis ist etwas entspannter: Im Gespräch mit dem Guardian sagte er, dass die Forschung noch Jahrzehnte von derart intelligenten Maschinen entfernt sei. Auch Gary Marcus, der an der New York University Psychologie unterrichtet und ein Start-up für KI gegründet hat, relativiert die Macht der KI: "Go ist erfolgreich und das hat mich überrascht", gesteht er Gespräch mit der SZ ein. "Aber der Algorithmus musste Millionen Spiele absolvieren müssen. Die Realität sieht so aus, dass es für viele Probleme diese Datenmassen nicht gibt."