Philipp Seidl absolviert sein Doktorat am Institut für Machine-Learning.
Foto: Seidl

Um neue Wirkstoffe für Medikamente zu finden, müssen Forschende eine geradezu unendliche Anzahl verschiedener Moleküle auf deren Auswirkungen auf verschiedene Zellen testen. Die Arzneimittelforschung nutzt schon lange Computerprogramme, um diese Eigenschaften von Molekülen vorherzusagen, damit nicht alle davon im Labor einzeln getestet werden müssen. Dabei geht es zum Beispiel darum, ob ein Wirkstoff die Blut-Hirn-Schranke überwinden kann oder auf bestimmte Marker des Coronavirus reagiert.

In den vergangenen Jahren haben Machine-Learning-Algorithmen dieses Feld vorangetrieben. Die Trainingsdaten darüber, welche Moleküle sich wie und auf welche Zellen auswirken, müssen durch Experimente gesammelt werden. Die Textbeschreibungen dieser Experimente können jedoch von herkömmlichen Machine-Learning-Modellen nicht einfach zum Trainieren benutzt werden. Daher bedienen sich Forschende nun Natural-Language-Processing-Modellen – ähnlich ChatGPT.

Verfeinerter Algorithmus

Philipp Seidl, Doktorand am Institut für Machine-Learning an der Universität Linz, hat mit Kollegen nun einen neuen Algorithmus entwickelt, der mehrere Ansätze zusammenführt. Ihre Methode kombiniert Daten über Moleküle mit einem Sprachmodell, das auf Textbeschreibungen von Experimenten basiert. Seidl erklärt, dass ihr Modell damit wesentlich korrektere und schnellere Voraussagen über die Auswirkungen von Molekülen machen kann als vergleichbare Methoden – besser sogar als der Galactica-Algorithmus, den Meta Ende 2022 veröffentlichte und der wegen inkorrekter und verzerrter Ergebnisse unter schwere Kritik geriet.

Die Forscher testeten ihr Modell, indem sie es Experimente beschreiben ließen, deren Ergebnisse schon bekannt, aber nicht Teil der Trainingsdaten waren. Das Modell kann auch Wahrscheinlichkeiten bezüglich der Auswirkungen von Molekülen auf Zellen in Experimente liefern, die noch nie durchgeführt wurden. Das soll Forschenden helfen, neue Moleküle für Arzneimittel zu finden.

Medikamentenstudien verkürzen

Ganz ohne menschliche Eingriffe geht es in der Praxis jedoch noch nicht. Man kann das Modell genauer machen, indem man die Trainingsdaten an die jeweilige Fragestellung anpasst. Seidl und seine Kollegen arbeiten nun daran, ihren Algorithmus zu verfeinern und praxistauglich zu machen.

Seidl studierte zuerst Wirtschaftsinformatik in Linz und dazu Medizintechnik an der Fachhochschule Oberösterreich und kam dadurch zum Machine-Learning. Danach absolvierte er ein Masterstudium in Bioinformatik an der Uni Linz. Darüber gelangte er zur Arzneimittelforschung und zu einem Doktorat am Institut für Machine-Learning. Er möchte die Medizin mit neuen Methoden zum Finden von Wirkstoffen voranbringen und gleichzeitig dazu beitragen, die Anzahl langwieriger Medikamentenstudien an Tieren und Menschen zu verringern. (Thomas Zauner, 21.5.2023)