AlphaGo Zero:Computer spielt Go gegen sich selbst - und wird unschlagbar

AlphaGo Zero: Go besteht aus nur vier Grundregeln, gilt aber als eines der komplexesten Brettspiele der Welt.

Go besteht aus nur vier Grundregeln, gilt aber als eines der komplexesten Brettspiele der Welt.

(Foto: Ed Jones/AFP)
  • AlphaGo Zero ist eine Künstliche Intelligenz, die jeden Go-Spieler der Welt schlägt.
  • Das Programm wird unschlagbar, indem es gegen sich selbst spielt. Menschliches Eingreifen ist nicht mehr nötig.
  • Seinen Vorgänger AlphaGo besiegt Alpha Go Zero mit 100 zu 0.

Von Christian Weber

Ein kleiner Trost war der Menschheit noch geblieben, als im vergangenen Jahr der koreanische Weltmeister im Go-Spiel, Lee Sedol, reihenweise Niederlagen gegen die Künstliche-Intelligenz-Software Alpha Go einstecken musste: Das Programm war nur deshalb so gut, weil es zuvor mit Millionen Partien des asiatischen Brettspiels trainiert wurde, die zuvor von menschlichen Meistern gespielt worden waren.

Ernüchternd klingt da die neueste Nachricht aus dem Google-Kosmos: In der aktuellen Ausgabe des Wissenschaftsmagazins Nature stellt ein Team um Demis Hassabis und David Silver von Googles KI-Forschungszentrum Deep Mind in London ein Nachfolgeprogramm vor, das ganz ohne menschliche Nachhilfe auskommt und dennoch seinen Vorgänger deklassiert.

Das Alpha Go Zero getaufte System bekam lediglich ein Spielbrett mit schwarzen und weißen Steinen vorgesetzt, außerdem wurden ihm die simplen Spielregeln von Go mitgeteilt. Dann fing es an, gegen sich selbst zu spielen: Mithilfe eines neuronalen Netzwerkes und ausgefeilter Algorithmen entschied es über den nächsten Zug. Dabei belohnte es sich für gewonnene Spiele mit Siegespunkten. Und da es darauf ausgerichtet war, Punkte zu sammeln, wurden automatisch Erfolg versprechende Strategien verstärkt. Forscher sprechen deshalb von Reinforcement Learning. Es schöpft Wissen aus dem Nichts.

Wahrscheinlich werden in Zukunft KI-Programme die Go-Meister trainieren

Alpha Go Zero brauchte während des Trainings durchschnittlich 0,4 Sekunden Denkzeit pro Zug, und nach nur drei Tagen war er der beste Go-Spieler, den es jemals gegeben hat. Selbst den vor einem Jahr noch gefeierten Alpha Go schlug er in einer ersten Spielserie mit schlappen 100 zu 0.

Die Leistung ist umso erstaunlicher, als Alpha Go Zero mit einer sparsameren Hardware auskommt als sein Vorgänger und nur 3,9 Millionen statt 30 Millionen Trainingsspiele benötigte. Endgültig beendet sein dürfte nun die Diskussion, ob Computer selbst bei komplexen Brettspielen übermenschliche Leistungen zeigen. Offensichtlich tun sie das. Wahrscheinlicher ist es, dass KI-Systeme in Zukunft die menschlichen Go-Meister trainieren.

Deutsche Experten sind zwar beeindruckt von Alpha Go Zero, warnen aber, den menschlichen Geist all zu schnell zur Seite zu legen: "Zwar spielt dieses System besser Go als jeder Mensch, aber diese Fähigkeit ist nur ein minimaler Aspekt aller menschlichen Fähigkeiten", sagt der Informatiker Philipp Slusallek vom Deutschen Forschungszentrum für Künstliche Intelligenz (DFKI) in Saarbrücken. "Die menschlichen Fähigkeiten sind offensichtlich dramatisch viel breiter, allgemeiner und flexibler, als es jeder Computer auf absehbare Zeit sein wird."

Und auch über den Nutzen von Systemen wie Alpha Go Zero jenseits der Brettspiele wird noch zu diskutieren sein. Denn sein Erfolg beruht auf Kenntnis der Spielregeln, bemerkt Christian Bauckhage von Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme in Sankt Augustin: "Doch in welcher Situation in der echten Welt kennen wir schon alle Regeln?"

Zur SZ-Startseite

Lesen Sie mehr zum Thema

Jetzt entdecken

Gutscheine: