Künstliche Intelligenz:Google-Software meistert selbständig "Space Invaders"

Künstliche Intelligenz: Für die Firma Deepmind bezahlte Google vergangenes Jahr 400 Millionen US-Dollar - die Londoner forschen an neuartigen KI-Systemen

Für die Firma Deepmind bezahlte Google vergangenes Jahr 400 Millionen US-Dollar - die Londoner forschen an neuartigen KI-Systemen

(Foto: Google DeepMind)

Ein Google-Team hat eine Software entwickelt, die selbständig lernt, Videospiele perfekt zu spielen - darunter Atari-Klassiker wie "Space Invaders" oder "Breakout". Das KI-System erfindet dabei langfristige Strategien.

Von Christoph Behrens

Wer bei "Space Invaders" richtig gut sein will, braucht Zeit und Geld. Als das Videospiel 1978 Japan eroberte, wurden die 100-Yen-Münzen knapp, weil sie nun überwiegend an Automaten in den Kampf gegen außerirdische Angreifer flossen. Der Rekordhalter hielt 38 Stunden am Stück durch - vor dem Highscore hatte er selbstverständlich tausende Stunden geübt.

Wenn man einem Computer die Sache überlässt, geht das Lernen deutlich schneller, berichten Forscher der Google-Tochterfirma "Deep Mind". Das Team hat eine spezielle Software 49 Spieleklassiker der Konsole "Atari" zocken lassen. Mehr als die Hälfte der Spiele beherrschte das Programm bald auf dem Level eines professionellen Videospieletesters, darunter auch "Space Invaders". In 14 Spielen betrug der Highscore des Computers mindestens das Doppelte des menschlichen Profis, berichten die Forscher im Fachmagazin Nature.

Dabei ist das "Deep-Q-Netzwerk" völlig anders aufgebaut als klassische Systeme mit künstlicher Intelligenz. Die Entwickler haben ihm keinerlei Informationen über mögliche Strategien eingegeben. Stattdessen lernt Deep-Q selbstständig, indem es die Bildinformationen der Konsole verarbeitet. Das System bekommt also das zu sehen, was auch ein menschlicher Spieler auf dem Bildschirm sieht, und kann mit den gleichen Befehlen darauf reagieren. Einzig die Punktezahl soll der Computer in die Höhe treiben - wie er das erreicht, bleibt ihm überlassen.

"Langfristige Strategie"

Im Spiel "Breakout" etwa musste Deep-Q mit einer Kugel eine Reihe Steine am oberen Rand des Spielfelds zerstören; die Kugel darf dabei nicht zu Boden fallen. Nach einigen hundert Spieldurchgängen begann Deep Q damit, die Kugel nur in eine Ecke zu schleudern, um dort einen Tunnel durch die Reihe zu graben. Oben angekommen, zerstörte die Kugel die Steine von ganz allein.

"In manchen Spielen entdeckt Deep-Q eine relativ langfristige Strategie", schreiben die Entwickler. Ihre Eindrücke gleicht die Software mit Erfahrungen vergangener Highscores und Gameovers ab, um den nächsten Zug zu berechnen. "Herkömmliche Künstliche-Intelligenz-Systeme sind ausschließlich für das jeweilige Spiel geschrieben", erklärt Stefan Höltgen, Chefredakteur des Spielemagazins Retro.

Deep-Q dagegen kann eine ganze Reihe Spiele meistern - die KI kann boxen, schießen, aber auch Autorennen fahren. Schwierigkeiten bereiteten Rätselspiele wie "Montezuma's Revenge", in denen der Spieler nach Schlüsseln fahndet und Fallen ausweicht. Ergebnis des Computers bei dieser Knobelei: null Prozent.

Illegal request-target: Invalid input '#', expected pchar, '/', '?' or 'EOI' (line 1, column 83)
Zur SZ-Startseite

Lesen Sie mehr zum Thema

Süddeutsche Zeitung
  • Twitter-Seite der SZ
  • Facebook-Seite der SZ
  • Instagram-Seite der SZ
  • Mediadaten
  • Newsletter
  • Eilmeldungen
  • RSS
  • Apps
  • Jobs
  • Datenschutz
  • Kontakt und Impressum
  • AGB