Informatik Künstliche Intelligenz im Chemielabor

Bei der Arbeit im Chemielabor spielen bisher Bauchgefühl, Erfahrung und Kreativität der Wissenschaftler eine entscheidende Rolle.

(Foto: Alessandra Schellnegger)

Lernfähige Software kann nicht nur Schach- und Go-Weltmeister besiegen, sondern auch chemische Synthesen vereinfachen. Werden bald intelligente Maschinen neue Moleküle erschaffen?

Von Andrea Hoferichter

Der Chemiker Marwin Segler von der Universität Münster braucht für seine Arbeit weder Kittel noch Kolben, sondern lediglich einen Computer. Im Rahmen seiner Doktorarbeit hat er ein selbstlernendes Programm entwickelt, das bei der Planung chemischer Synthesen hilft und ähnlich wie die Google-Spielesoftware Alpha Go funktioniert. Davon berichten Segler, Mike Preuß und Mark Waller von der Shanghai University im Fachmagazin Nature.

Die Verbindung zur Spielewelt liegt den Forschern zufolge auf der Hand. Denn wie Schach- oder Go-Spieler brauchen auch Chemiker, die etwa einen neuen medizinischen Wirkstoff herstellen wollen, viel Erfahrung und ein gutes Bauchgefühl. Zug für Zug müssen sie auf dem Weg zum Zielmolekül aus einer Unmenge an Möglichkeiten die vermutlich besten Reaktionsschritte auswählen und im Labor testen. Eine Erfolgsgarantie gibt es dabei nicht, weil gerade organische Moleküle, also solche mit einem Skelett aus Kohlenstoff, oft sehr komplexe Gebilde aus Hunderten Atomen sind, mit zum Teil voluminösen Verzweigungen und elektrischen Teilladungen in verschiedenen Bereichen. Ob sich zwei Teilchen wie gewünscht vereinen, ist nur schwer vorherzusehen.

"Unser System könnte für Chemiker das werden, was ein Navi für Autofahrer ist. Wenn man unkompliziert von A nach B fahren möchte, spart es eine Menge Zeit und Geld", sagt Segler. Gerade sei man noch eher im Zeitalter der Autoatlanten. Zwar gibt es schon seit vielen Jahren Software, die bei der Syntheseplanung hilft. Sie kann sogar etablierte industrielle Prozesse vereinfachen, wie Anfang März im Fachmagazin Chem zu lesen war.

Wie schlau ist die künstliche Intelligenz?

Kann eine Maschine so gut denken wie ein Mensch? Diese Frage soll der Turing-Test beantworten. Doch mittlerweile zweifeln immer mehr Wissenschaftler an seinem Nutzen. Von Boris Hänssler mehr ...

Doch damit Programme dieser Art funktionieren, müssen Chemiker vorab zigtausende Planungsregeln in das System speisen. "Ein Riesenaufwand, der mit unserem System nicht mehr nötig ist", betont Segler, der seit einiger Zeit auch in London für ein Pharma-Start-up arbeitet und dort das Verfahren schon anwendet. Auch andere Chemieunternehmen hätten es schon aufgegriffen, erzählt er. Das Programm kann zudem leicht mit der stark steigenden Zahl publizierter Synthesen Schritt halten, die sich alle zehn Jahre verdoppelt.

Die Grundlage für das Programm aus Münster ist eine Methode namens Retrosynthese, die schon in den 1960ern entwickelt wurde, ihrem Erfinder Elias James Corey einen Nobelpreis einbrachte und heute zum Handwerkszeug eines jeden Chemikers gehört. "Retro" heißt die Methode allerdings nicht wegen ihres vintageverdächtigen Alters, sondern weil es darum geht, Synthesen rückwärts zu denken. Chemiker zerlegen dabei ein Zielmolekül gedanklich in immer kleinere Molekülbauteile, bis sie zu gängigen Ausgangschemikalien gelangen. Von diesen bauen sie dann im Labor Schritt für Schritt den angestrebten Stoff auf. "Für die meisten chemischen Synthesen sind fünf bis 15 verschiedene Reaktionsschritte erforderlich", berichtet Segler. Und für jeden Schritt gilt es, aus Hunderttausenden bereits bekannten Reaktionen die jeweils am besten geeigneten zu finden.

Das System kennt die Daten aller seit 1771 publizierten chemischen Reaktionen

Diese Arbeit soll nun das neue Programm übernehmen. Die nötigen Erfahrungswerte bringt es sich in ein paar Tagen selbst bei, studiert dafür alle seit dem Jahr 1771 publizierten und in einer Online-Datenbank dokumentierten Reaktionen. Es ermittelt Ähnlichkeiten, leitet daraus Übertragbarkeiten ab und wählt schließlich für jeden Reaktionsschritt die wahrscheinlich besten 50 aus. Außerdem kommt ein Simulationswerkzeug namens Monte-Carlo-Baumsuche zum Einsatz. "Damit wird die Retrosynthese vom ersten Zerlegungsschritt bis zum Ziel, also bis zu den kommerziell erhältlichen Ausgangssubstanzen, immer wieder durchgespielt. So ermittelt das Programm, welcher Lösungsweg der wahrscheinlich beste ist", erklärt Preuß, der Informatiker im Team.

Ein Problem bei der Entwicklung des Programms war, dass für den Lernprozess auch Negativbeispiele nötig sind, also Reaktionen, die eben nicht funktionieren. "Aber was nicht klappt, wird in der Regel auch nicht veröffentlicht", schildert Segler das Dilemma. Die Forscher halfen sich deshalb mit einem Kniff, ließen den Rechner aus erfolgreichen Reaktionen jene ableiten, die offenbar nicht funktioniert hatten, und schufen so den fehlenden Datensatz.

Schließlich testeten die Wissenschaftler die Tauglichkeit ihres Programms. Dazu fütterten sie es mit bis zum Jahr 2014 veröffentlichten Reaktionsdaten und stellten ihm dann eine Syntheseaufgabe, deren Lösung Chemiker erst 2015 oder später publiziert hatten. "In gut 73 Prozent der Fälle kam unsere Software zum gleichen Ergebnis", sagt Segler. Zudem ließ das Team 45 erfahrene Chemiker für ein Zielmolekül zwischen publizierten und virtuell ermittelten Syntheseplänen wählen, ohne dass diese die Herkunft kannten. Gut jeder Zweite votierte für das virtuelle Rezept.

Gleichwohl hat das System noch Schwächen. Zum Beispiel kann es keine Pläne für den Nachbau von Naturstoffen entwerfen, die etwa von Bakterien oder Pilzen produziert werden und oft als Wirkstoffe in der Medizin zum Einsatz kommen. "Dafür ist die Datenlage noch zu dünn", sagt Segler. Und das System könne auch keine neuen Reaktionsmechanismen erarbeiten. Diese Aufgabe lasse sich nach wie vor nur im Labor lösen, von kreativen Chemikern mit viel Erfahrung und einem guten Bauchgefühl.

Die Maschine ist unbesiegbar

Die Software "Alpha-Go" hat innerhalb kürzester Zeit sämtliche "Go"-Profis überflügelt. Jetzt soll das Programm größere Probleme der Menschheit lösen. Von Patrick Illinger mehr...