Maschinelles Lernen hat die Proteinforschung revolutioniert – doch wie tief das Verständnis der KI tatsächlich reicht, ist fraglich.
Ein Team der Universität Basel in einer
Studie nun nachgewiesen, dass selbst modernste KI-Modelle nur bekannte Muster wiederholen, statt physikalisch-chemische Zusammenhänge zu begreifen.
Damit stossen sie bei neuartigen Proteinen an ihre Grenzen – genau dort, wo sie für die Medikamentenentwicklung am wertvollsten wären.
Maschinelles Lernen in der Proteinforschung
Proteine sind zentrale Bausteine des Lebens – und der Medizin. Sie dienen als Wirkstoffe oder Zielstrukturen für Medikamente. Wer neue Therapien entwickeln will, muss ihre dreidimensionale Struktur verstehen.
Lange war das ein mühsames Unterfangen – bis Deep-Learning-Modelle wie
AlphaFold oder
RosettaFold das Feld umkrempelten. Diese Programme berechnen, wie sich Aminosäureketten zu komplexen Proteinstrukturen falten. 2024 wurde diese Leistung sogar
mit dem Chemie-Nobelpreis ausgezeichnet.
Inzwischen gehen die Modelle noch weiter: Sie versuchen, die Wechselwirkung zwischen Proteinen und Liganden – also den Andockpartnern von Wirkstoffen – vorherzusagen. Genau hier setzten die Forschenden um Markus Lill vom Departement für Pharmazeutische Wissenschaften der Universität Basel an.
«Wir wollten herausfinden, ob diese KI-Modelle anhand der Trainingsdaten wirklich die physikalisch-chemischen Grundlagen lernen und richtig anwenden»,
sagt Lill in einer Mitteilung.
Wenn die KI nur auswendig lernt
Um das zu testen, veränderte das Team hunderte bekannter Proteine so, dass ihre Bindungsstellen unbrauchbar wurden – etwa durch andere Ladungsverteilungen oder blockierte Zugänge. Trotzdem sagten die KI-Modelle dieselben Protein-Ligand-Strukturen voraus, als wäre keine Veränderung erfolgt. Auch bei manipulierten Liganden – die eigentlich nicht mehr andocken dürften – blieben die Vorhersagen gleich.
«Das zeigt uns, dass selbst die modernsten KI-Modelle nicht wirklich verstehen, warum ein Medikament an ein Protein bindet; sie erkennen nur Muster, die sie schon einmal gesehen haben.» Markus Lill, Universität Basel.
In mehr als der Hälfte der Fälle ignorierten die Systeme die Veränderungen vollständig und sagten die Struktur so voraus, als hätte es die störenden Eingriffe in die Aminosäureabfolge nie gegeben. Für die Forschenden ein klarer Hinweis: Die Modelle erkennen Muster, die sie schon einmal gesehen haben, statt die zugrunde liegende Physik zu begreifen.
Besonders schlecht schnitten die KI-Modelle bei neuartigen Proteinen ab – also solchen, die nicht in den Trainingsdatensätzen vorkommen. «Wenn sie etwas völlig Neues sehen, liegen sie schnell daneben; genau dort liegt aber der Schlüssel zu neuen Medikamenten», betont Lill.
KI bleibt wertvoll – mit Vorbehalt
Für die Wirkstoffentwicklung bleiben die Modelle dennoch hilfreich – vorausgesetzt, ihre Vorhersagen werden durch physikalisch basierte Simulationen oder Experimente überprüft.
Langfristig sollten KI-Systeme so erweitert werden, dass sie physikalisch-chemische Gesetzmässigkeiten integriert lernen, fordert das Team. Dann könnten sie tatsächlich eine solide Basis für die Entwicklung neuartiger Therapien liefern – insbesondere bei schwer zugänglichen Proteinstrukturen, die heute noch als unlösbar gelten.