Google-Software meistert selbständig "Space Invaders"

Wer bei "Space Invaders" richtig gut sein will, braucht Zeit und Geld. Als das Videospiel 1978 Japan eroberte, wurden die 100-Yen-Münzen knapp, weil sie nun überwiegend an Automaten in den Kampf gegen außerirdische Angreifer flossen. Der Rekordhalter hielt 38 Stunden am Stück durch - vor dem Highscore hatte er selbstverständlich tausende Stunden geübt.

Wenn man einem Computer die Sache überlässt, geht das Lernen deutlich schneller, berichten Forscher der Google-Tochterfirma "Deep Mind". Das Team hat eine spezielle Software 49 Spieleklassiker der Konsole "Atari" zocken lassen. Mehr als die Hälfte der Spiele beherrschte das Programm bald auf dem Level eines professionellen Videospieletesters, darunter auch "Space Invaders". In 14 Spielen betrug der Highscore des Computers mindestens das Doppelte des menschlichen Profis, berichten die Forscher im Fachmagazin Nature.

Die SZ-Redaktion hat diesen Artikel mit einem Inhalt von YouTube angereichert

Um Ihre Daten zu schützen, wurde er nicht ohne Ihre Zustimmung geladen.

Ich bin damit einverstanden, dass mir Inhalte von YouTube angezeigt werden. Damit werden personenbezogene Daten an den Betreiber des Portals zur Nutzungsanalyse übermittelt. Mehr Informationen und eine Widerrufsmöglichkeit finden Sie untersz.de/datenschutz.

Dabei ist das "Deep-Q-Netzwerk" völlig anders aufgebaut als klassische Systeme mit künstlicher Intelligenz. Die Entwickler haben ihm keinerlei Informationen über mögliche Strategien eingegeben. Stattdessen lernt Deep-Q selbstständig, indem es die Bildinformationen der Konsole verarbeitet. Das System bekommt also das zu sehen, was auch ein menschlicher Spieler auf dem Bildschirm sieht, und kann mit den gleichen Befehlen darauf reagieren. Einzig die Punktezahl soll der Computer in die Höhe treiben - wie er das erreicht, bleibt ihm überlassen.

"Langfristige Strategie"

Im Spiel "Breakout" etwa musste Deep-Q mit einer Kugel eine Reihe Steine am oberen Rand des Spielfelds zerstören; die Kugel darf dabei nicht zu Boden fallen. Nach einigen hundert Spieldurchgängen begann Deep Q damit, die Kugel nur in eine Ecke zu schleudern, um dort einen Tunnel durch die Reihe zu graben. Oben angekommen, zerstörte die Kugel die Steine von ganz allein.

Die SZ-Redaktion hat diesen Artikel mit einem Inhalt von YouTube angereichert

Um Ihre Daten zu schützen, wurde er nicht ohne Ihre Zustimmung geladen.

"In manchen Spielen entdeckt Deep-Q eine relativ langfristige Strategie", schreiben die Entwickler. Ihre Eindrücke gleicht die Software mit Erfahrungen vergangener Highscores und Gameovers ab, um den nächsten Zug zu berechnen. "Herkömmliche Künstliche-Intelligenz-Systeme sind ausschließlich für das jeweilige Spiel geschrieben", erklärt Stefan Höltgen, Chefredakteur des Spielemagazins Retro.

Deep-Q dagegen kann eine ganze Reihe Spiele meistern - die KI kann boxen, schießen, aber auch Autorennen fahren. Schwierigkeiten bereiteten Rätselspiele wie "Montezuma's Revenge", in denen der Spieler nach Schlüsseln fahndet und Fallen ausweicht. Ergebnis des Computers bei dieser Knobelei: null Prozent.