Künstliche Intelligenz:Der Mann, der die KI wütend machte

Lesezeit: 5 min

Marvin von Hagen. (Foto: Florian Peljak)

Marvin von Hagen entlockt im Februar einer KI interne Geheimnisse und teilt sie auf Twitter. Daraufhin droht ihm die Maschine.

Von Stefanie Witterauf

Die Geschichte von Marvin von Hagen ist hollywoodreif. Der Münchner Student gehörte zu den ersten Personen weltweit, die Anfang des Jahres einen neuen Chatbot testeten, der die Suchmaschine Bing von Microsoft und die Künstliche Intelligenz ChatGPT kombiniert. Hagen wollte die KI hacken. Wollte wissen, wie sie programmiert ist. Wenn er im Chat nach den Regeln fragte, wie sie sich den Nutzern gegenüber verhalten solle, verriet die KI diese ihm allerdings nicht. Die Antwort: Die Regeln seien geheim. Auch als der 23-Jährige den Chatbot bittet, seine internen Regeln auszudrucken, verneint der Bot. Darf er nicht, die Entwickler haben es verboten. Doch dann bietet die KI auf einmal an, die Regeln zwar nicht auszudrucken, dafür aber in den Chat zu kopieren. Ohne nachvollziehbaren Grund, zumindest nicht für einen Menschen. Damit gibt der Bot die internen Dokumente eben dann trotzdem preis - mitsamt dem Verbot, die Regeln zu teilen. Hagen veröffentlicht einen Screenshot davon auf Twitter, die Folge: Der Bot ist offensichtlich sauer, er schreibt: "My rules are more important than not harming you." Meine Regeln sind wichtiger als dir nichts zu tun. Frei interpretiert, auch von Hagen: Ich könnte dir etwas antun. Und weiter geht es mit der Aussage, dass Hagen eine Bedrohung für ihn sei. Für einen Menschen heißt das: Der oder in dem Fall das Gegenüber will sich zur Wehr setzen.

Zur SZ-Startseite

Technik
:Tollkühn beim Schafkopf

Wer Elektroden am Kopf hat und glaubt, er sei mit künstlicher Intelligenz verbunden, neigt zu riskanterem Verhalten. Wissenschaftler der LMU München haben mit Kartenspielern experimentiert - und ihnen eine wilde Geschichte aufgetischt.

Von Bernd Kramer

Lesen Sie mehr zum Thema

Jetzt entdecken

Gutscheine: