"Die Entwicklung der künstlichen Intelligenz (KI) steht an einem Wendepunkt", sagt der Informatikprofessor Björn Ommer, und Tausende KI-Experten lauschen ihm. Die KI-Modelle wie jenes hinter dem Chatbot Chat-GPT seien größer und größer geworden. Zu groß, meint Ommer. Auch bei der selbstlernenden Software seien nun jene "Grenzen des Wachstums" erreicht, die der Club of Rome vor 51 Jahren für den ganzen Planeten formulierte.

Ommer ist Professor an der Münchner Ludwig-Maximilians-Universität und leitet dort die Gruppe Compvis, die Computern das Sehen beibringt. An diesem Montag hält er die Hauptrede auf der Bühne im Kongresszentrum von New Orleans.

Vor ihm in der gigantischen Halle sitzen die Menschen, die die Zukunft bauen. New Orleans ist in dieser Woche die Welthauptstadt der KI. Es tagt die wichtigste Konferenz des Fachgebiets, die Neurips. 13 000 Menschen sind gekommen, alle Elite-Unis und Tech-Konzerne vertreten. Die Konferenz gilt als "Superbowl der künstlichen Intelligenz", die Tickets dafür waren binnen Minuten ausverkauft.

Ommer ist hier, um seine Kollegen zu warnen. Dass in Sachen KI alles auf eine Machtkonzentration zuläuft. Dass Google, Microsoft und Amazon die Rechenkraft haben, die Daten und die Lizenzen, um den Markt zu beherrschen. Und dass dagegen nur eines hilft: Die KI muss so klein werden, dass sie auf ein Smartphone passt.

Der Idealist Ommer ist das bedachte europäische Gegenmodell zu Sam Altman, dem Open-AI-Chef. Der ist bekannt für die Kommerzialisierung seines Hauptwerks Chat-GPT, Milliardendeals mit Microsoft, Lobbying und Intransparenz, wenn es darum geht, mit welchen Daten seine KI trainiert wurde.

Ommers Rede trägt den Titel "Die Illusion des Skalierens", für Nichtinformatiker übersetzt: Hier will einer den Größenwahn seiner eigenen Gemeinde bremsen. Der Münchner Professor ist hier selbst eine Größe, denn seine Forschungsgruppe ist für eines der Modelle verantwortlich, die 2022 den KI-Hype auslösten. Seitdem beschäftigt die Technologie Wirtschaft, Gesellschaft und Politik. Stable Diffusion heißt das KI-Modell aus dem Hause Ommer. Die Software kann nur auf Basis einer Textbeschreibung erstaunlich gute Bilder erschaffen. Ikonisch wurde im August 2022 das von Stable Diffusion erzeugte Bild eines Astronauten, der auf einem Pferd reitet. Und das Programm war früh dran. Chat-GPT wurde erst drei Monate später veröffentlicht.

Der Professor hätte die Möglichkeit gehabt, mit seiner Erfindung Millionen zu verdienen. Das Start-up Stability AI, das Ommers Open-Source-Bildprogramm früh unterstützte und vertreibt, wurde kürzlich mit einer Milliarde Euro bewertet. Dort arbeiten mittlerweile auch einige von Ommers ehemaligen Mitarbeitern. Doch er selbst blieb der Forschung treu. "Ich finde eben die Forschungsfragen weiter sehr interessant, und mir geht es um die Demokratisierung, sonst wären die Ungleichgewichte zwischen Kleinen und Großen noch größer geworden. Insofern bin ich den richtigen Weg gegangen", sagte er der SZ vor seiner Rede.

Kluge statt riesiger Algorithmen

Als Gegenentwurf zur Gigantomanie der übrigen KI-Branche wirbt Ommer für das Kleine. Die KI in der Hosentasche. "Ein wirklich intelligenter Algorithmus ist nicht unbedingt einer, der mehr Rechenkraft verbraucht. Das Umgekehrte sollte gelten: Kleinere Modelle sollten die besten sein." Große Modelle wie GPT-4 müssten online genutzt werden, etwa in der Cloud von Microsoft. Auf der Bühne liest er seinen Kollegen die Leviten: Skalieren - mehr Rechenkraft, mehr Daten, immer größere Modelle - sei schon zu lange die Antwort auf alle Probleme des Fachs.

Diese Entwicklung komme an ihr Ende: "Viele große Sprachmodelle flachen in den vergangenen Monaten ab." Sogar die neue Version von Chat-GPT zeigt Schwächen, obwohl das Unternehmen Open AI viel Geld und Rechenkraft von seinem Investor Microsoft hineingesteckt hat. Ommer wirbt für kluge Algorithmen, die weniger gierig nach Ressourcen sind. "Stable Diffusion läuft jetzt auf dem Mac. Da brauchen Sie keinen Superrechner für Millionen Euro mehr."

Die Gier der großen KI-Firmen nach mehr Daten und mehr Rechenkraft sei dabei nicht nur ideologisch ein Problem, sondern auch ganz praktisch. Die Produktion von für die KI notwendigen Grafikchips kann die Nachfrage nicht mehr ansatzweise befriedigen. Die USA etwa haben den Export moderner KI-Chips nach China schon verboten, als wären sie Waffen.

Ommer sagt, die großen Sprachmodelle hätten etwas Grundsätzliches über Intelligenz nicht verstanden: Dass nicht Überfluss, sondern erst Beschränkung zu intelligenten Lösungen führe. Unsere Vorfahren hätten ihre Intelligenz ja auch mit Stöcken und Steinen entwickelt und nicht in bequemen Autos.

Auch bei KI sei weniger mehr. Zum Beispiel müssten die Systeme bei Bildern nicht jedes Detail kennen. "Sie wollen wissen, dass der Hund flauschig ist, aber sie wollen nicht wissen, wie jedes einzelne Haar aussieht." Hinter Ommer leuchtet nun ein Foto von einem weißen Hund auf der Leinwand.

Nach dem Flausch wird es, dem Informatikeranteil im Raum angemessen, technisch. Ommer gibt den Fachleuten Erfahrungen seines Teams mit auf den Weg, wie sie Modelle schrumpfen lassen. Im Sinne der Effizienz der KI fürs Smartphone. Und im Sinne der Demokratie, für die KI zur Schlüsseltechnologie wird.

Denn Ommer geht es um mehr als ein sympathisches "Klein, aber oho". Er sagt: "Dinge, die die Gesellschaft zusammenhalten, wie Vertrauen, lassen sich nicht skalieren." Ein Diamant existiere auch nur, weil der Kohlenstoff aufgrund des hohen Drucks zusammenhalte. Ersetze man diese engen Verbindungen durch lose - wie direkte Kontakte zwischen Menschen durch reinen Online-Austausch in sozialen Medien - dann werde der Diamant zu Asche.