Die Zellen des menschlichen Körpers sind vollgestopft mit molekularen Maschinen: Pumpen und Kopierapparaten, Wächter, Regulatoren und Signalgeber, kleine Kraftwerke sind auch noch dabei. Jeder Zelltyp hat seine eigene Ausstattung, die festgelegt wird durch das genetische Programm, das im jeweiligen Gewebe aktiv ist. Wer weiß, wie die Maschinerie des Lebens aussieht, und wie sie funktioniert, kann auch reparieren, wenn einmal etwas schiefläuft, wie zum Beispiel bei manchen Krankheiten. Im Fachblatt Nature wurde nun eine neue Version der KI Alphafold präsentiert , die das Zusammenspiel mehrere Biomoleküle simulieren können soll. Alexander Schug, Experte für biomolekulare Simulation am Forschungszentrum Jülich, kennt die Vorgänger der Software. Ein Gespräch über die Fähigkeiten der KI, wieweit man den Ergebnissen trauen kann, und warum es ein Problem ist, wenn der Hersteller den Programmcode geheim hält.

SZ: Wozu faltet man Proteine am Computerbildschirm?

Auf der molekularen Ebene ist das Leben von Proteinen dominiert. Das bekannteste Beispiel ist wohl Hämoglobin, der Blutfarbstoff, der Sauerstoff in molekularen Taschen durch den Körper transportiert. Auch Haare bestehen aus Proteinen und Enzyme sind Proteine. Proteine erfüllen vielfältige Aufgaben, sind aber aus wenigen Grundbausteinen immer ähnlich aufgebaut. Ihre dreidimensionale Struktur ist direkt mit ihrer Funktion verknüpft. Daher wollen wir verstehen, wie sich die Grundbausteine zu den funktionellen Einheiten falten. Dabei sind Computer in den letzten Jahren eine unentbehrliche Hilfe geworden.

Wie hat man denn früher Gestalt und Funktionsweise von Proteinen erforscht? Für ein normales Mikroskop sind diese Biomaschinen ja zu klein.

Es hieß früher immer, wenn ein Doktorand es in seiner Promotionsarbeit schafft, die Struktur eines Proteins aufzuklären, dann wäre das ein Erfolg. So eine Arbeit dauert mehrere Jahre. Dazu muss man zunächst das Protein herstellen, reinigen und dann so präparieren, dass man die biomolekulare Struktur zum Beispiel mit Röntgenstrahlen aufklären kann. Diese Aufbereitung ist bei einigen Proteinen unglaublich komplex und scheitert auch häufig. Heute lassen sich viele dieser Schritte automatisieren, aber eine Erfolgsgarantie gibt es nicht.

Und jetzt kommt das Google-Unternehmen Deepmind und sagt, mit ihrer KI Alphafold 3 geht das alles viel einfacher, in Minuten mit ein paar Mausklicks.

Alphafold ist nicht das erste Programm, dass dieses Problem angeht, aber das Erste, das es mithilfe Künstlicher Intelligenz in dieser Qualität schafft. Es gab vorher viele Ansätze zur Proteinstrukturvorhersage, aber die Qualität der Vorhersagen war durchaus ein Glücksspiel. Inzwischen gibt es verschiedenen Softwareversionen. Alphafold 2 war in der Lage, die Struktur eines Proteins aus der vorgegebenen Aminosäurensequenz vorherzusagen. Die Version 3 ist jetzt in der Lage, das strukturelle Zusammenspiel mehrerer Moleküle zu bestimmen. Das ist wirklich ein großer Schritt.

Detailansicht öffnen Physiker Alexander Schug, Leiter der Forschungsgruppe "Computational Structural Biology" am Forschungszentrum Jülich. (Foto: Alexander Schug)

Weil man so zum Beispiel prüfen kann, wie Arzneimittelmoleküle an Proteine binden?

Auch, aber nicht nur. Man kann verschiedenen Varianten des Moleküls mit Bindungspartnern konfrontieren und schauen, wie sich die Situationen jeweils unterscheiden. Dabei können wir in Alphafold jetzt zusätzliche Moleküle wie DNS oder RNS hinzufügen, was bislang nicht ohne Weiteres möglich war. Wir arbeiten zum Beispiel viel mit RNS und untersuchen, wie sich diese Moleküle zu dreidimensionalen Strukturen falten und dabei unterschiedliche Funktionen bekommen. Ich bin gespannt, wie gut sich Alphafold 3 bei diesen Aufgaben schlägt.

Dann braucht es keine Laborarbeit mehr, man kann alle molekularen Fragen am Computer untersuchen?

Doch, um sicherzugehen, müssen wir die Modelle im Labor mit echten Molekülen überprüfen. Die KI macht nur Vorhersagen, die die Realität sehr unterschiedlich zuverlässig abbilden. Zum Glück gibt die KI an, in welchen Bereichen der Moleküle sie sich sehr sicher ist und welches die eher fraglichen Regionen sind.

Woher weiß die KI das?

Die Proteine sind im Laufe langer evolutionärer Prozesse entstanden und sie ähneln sich zwischen den Organismen. Das gleiche Protein in verschiedenen Organismen verfügt aber immer auch über sehr ähnliche Sequenzen und damit auch einen ähnlichen Aufbau. Die KI vergleicht das Protein, mit dem sie sich gerade beschäftigt mit all den Sequenzen in der Datenbank und kann ähnliche Muster erkennen. Mithilfe der KI können wir schnell Hypothesen der Struktur vorhersagen und nur mit den besten Kandidaten zurück ins Labor gehen.

Weil nur die Laborergebnisse hundert Prozent zuverlässig sind?

Leider lassen auch die Laboruntersuchungen oft viele Fragen offen. Manche Bereiche von großen Proteinen lassen sich einfach schlecht abbilden. Man darf auch nicht vergessen, dass die Proteine ja nicht starr sind. In den Zellen herrscht viel Bewegung, die Maschinen verändern ihre Form, wenn sie arbeiten. All das lässt sich mithilfe der KI jetzt viel besser zu einem vollständigeren Bild zusammensetzen. Insofern ergänzen sich Labor und rechnergestützte Analysen komplementär.

Auf ein Atom genau?

Es gibt verschiedenen Methoden, die Genauigkeit der Modelle zu bestimmen und man wird immer sehr unterschiedliche Werte bekommen, je nachdem, welchen Aspekt man betrachtet. Aber das Ziel ist, die Natur so exakt wie möglich abzubilden.

SZ Plus Klimawandel : Dieser Ozeanwirbel könnte unser Leben auf den Kopf stellen Alle reden vom möglichen Kollaps der Atlantischen Umwälzströmung, doch wahrscheinlicher ist ein baldiges Kippen des weniger bekannten Subpolarwirbels im Nordatlantik. Die Folgen wären erheblich - auch für Deutschland. Von Benjamin von Brackel

Wenn man mit Alphafold Medikamente in silico testen kann, dann könnte man doch auch Biowaffen entwickeln, oder?

Es ist leider relativ leicht, etwas Gefährliches zu entwickeln, aber zum Glück oft sehr schwierig, diese Substanzen dann auch herzustellen.

Kann man Filter in die Software einbauen, die einen solchen Missbrauch verhindern?

Ich bin skeptisch, ob sich das leicht reglementieren lässt. Filter lassen sich oft umgehen, indem man einfach die Frage etwas ändert.

Deepmind veröffentlicht den Programmcode nicht, der hinter Alphafold 3 steht. Ist das für Sie als Nutzer ein Problem?

Ja, das war bereits bei der ersten Version eine Befürchtung unter Wissenschaftlern. Um nachvollziehen zu können, wie die KI arbeitet brauchen wir nicht nur den Quellcode, sondern auch noch die Trainingsdaten der KI und die Anweisungen, wie die KI damit trainiert wurde. Ich will verstehen, welchen Regeln die KI folgt, schließlich will ich auch lernen, was die Prinzipien der Proteinfaltung sind, eventuell sogar die physikalischen Grundlagen, welche Art von Kräften spielen eine Rolle und so weiter. Ich finde es keine schöne Lösung, dass man seine Analysen auf den fremden Servern laufen lassen muss. Ich hoffe, das ändert sich noch.

Werden Sie Alphafold 3 trotzdem ausprobieren?

Ich bin sehr gespannt und freue mich darauf. Es ist wichtig, dass auch die öffentliche Forschung die Ressourcen und Kompetenz hat, um solche Entwicklungen zu realisieren und nicht auf das Wohlwollen eines Konzerns angewiesen ist.

Rechnen Sie jetzt mit einem Schub für die Medikamentenentwicklung?

Die KI hilft sicher dabei, Vorschläge für neue Wirkstoffe zu machen und vielleicht lassen sich auch unerwünschte Effekte schon erahnen, dann kann man diese Substanzen gleich wieder fallen lassen. Aber am Ende müssen alle Wirkstoffe durch die klinische Prüfung, die aufwendig und teuer ist. Klar glaube ich, dass es zu neuen Medikamenten führt, aber es ist weiterhin nicht mit einem Fingerschnippen getan.