Ein 3D-Modell eines Schnupfenvirus. Die farbige Modellrechnung der Alphafold-3-KI und das in Grau gehaltene Modell der tatsächlichen Form sind kaum zu unterscheiden.
Google DeepMind

Als ein Algorithmus des IT-Riesen Google vor vier Jahren die Faltung von Eiweißmolekülen vorhersagte, sorgte das zu Recht für Begeisterung. Sie bestehen eigentlich aus Ketten von kleineren Bausteinen, den Aminosäuren, bilden dabei aber extrem komplexe Formen. Gerade die Form ist oft entscheidend für ihre Funktion im Körper, sie nur aus der Kenntnis der einzelnen Aminosäuren vorherzusagen ist allerdings extrem schwierig und überfordert normalerweise selbst die leistungsfähigsten Computer.

Doch eine Künstliche Intelligenz des 2014 von Google übernommenen Unternehmens Deep Mind Technologies schaffte das, was zuvor unmöglich schien. Die Software war eine Weiterentwicklung von Programmen, die sich durch überlegene Fähigkeiten in den Spielen Go, Schach und Shogi ausgezeichnet hatten.

Verbesserter Nachfolger

Im Mai 2024 ging Deep Mind noch einen Schritt weiter. Im Fachjournal Nature berichtete eine Studie von der neuen Generation des Programms, Alphafold 3. Dem Programm gelingt es, überhaupt alle Moleküle lebender Organismen sowie viele ihrer Wechselwirkungen in bisher unerreichter Genauigkeit zu simulieren. "Bei den Wechselwirkungen von Proteinen mit anderen Molekül-Arten sehen wir eine Verbesserung von mindestens 50 Prozent im Vergleich zu bestehenden Vorhersagemethoden, und bei einigen wichtigen Kategorien von Wechselwirkungen haben wir die Vorhersagegenauigkeit verdoppelt", berichtet das Team von Deep Mind.

Eines der Ziele des Google-Unternehmens ist laut dem Firmenmotto, "der Wissenschaft zu helfen, zum Wohle der Menschheit". Diesem Credo folgend, verpasste man dem Code der älteren Alphafold-Version 2021 eine Open-Source-Lizenz und legte ihn offen.

Code unter Verschluss

Auch diesmal soll die gesamte Menschheit profitieren. Das Unternehmen will mit dem "Alphafold Server" eine Plattform zur Verfügung stellen, auf der das Tool für nicht kommerzielle Forschung verwendet werden kann.

Der Code selbst ist aber nicht zugänglich, und das wird gerade zum Problem für das Journal Nature. Der Blog Retraction Watch, der eigentlich über zurückgezogene Publikationen informiert, berichtet nun von einem offenen Brief, den mehrere Fachleute, darunter Gutachter der neuen Studie, an Nature richteten.

Hier erklärt ein Podcast des Journals "Nature" ab Minute 13:48 die Möglichkeiten der neuen Software.
Nature Podcast

Schon allein, dass sich die Gutachter zu erkennen geben, ist ungewöhnlich. Normalerweise bleibt die Identität der Fachleute, die wissenschaftliche Veröffentlichungen vor dem Erscheinen im Peer-Review-Prozess prüfen, geheim.

Roland Dunbrack vom Fox Chase Cancer Center im US-amerikanischen Philadelphia lüftete jedoch den Schleier und beklagt, er habe für die Begutachtung "keinen Zugang zum Code erhalten". Weiter heißt es in dem Brief, die Studie sei veröffentlicht worden, "ohne eine Möglichkeit, die Software mit hohem Datendurchsatz zu testen".

Konkret bezieht sich die Kritik auf ein Limit von zehn Vorhersagen der Software pro Tag. Das stehe nicht im Einklang mit wissenschaftlichen Prinzipien, denn die wissenschaftliche Gemeinschaft müsse neue Methoden ausführlich testen können. "Die hochkarätige Publikation macht also Werbung für Fähigkeiten, die hinter den Türen des Mutterunternehmens verschlossen bleiben", schreiben die Fachleute.

Rechtfertigung der Herausgeberin

Die Chefherausgeberin Magdalena Skipper reagiert auf die Vorwürfe mit einem Hinweis auf die Nature-Policy zur Herausgabe von Code. Dort ist aber explizit davon die Rede, dass Autoren den Code auf Wunsch der Gutachter zur Verfügung zu stellen hätten. Andernfalls könnten die Herausgeber die Studie ablehnen.

Von diesem Recht machten die Nature-Herausgeber offenbar keinen Gebrauch. Skipper sagt dazu in einem vorbereiteten Statement: "Nature akzeptiert, dass es Umstände geben kann, unter denen Daten oder Code nicht offen verfügbar sind." Wenn man über die Forderung nach Herausgabe des Codes entscheide, reflektiere man über viele verschiedene Faktoren, "etwa die Biosicherheit und die ethischen Fragen, die damit verbunden sind".

Skipper sorgt sich also offenbar um Missbrauch des mächtigen Tools. Sie verweist darauf, dass ein Pseudocode zur Verfügung gestellt wurde, der die Funktionsweise illustriert. Dieser erfordere aber "Monate an Arbeit, um daraus funktionsfähigen Code zu erstellen, der eine ähnliche Performance zeigt", schreiben die Kritiker.

Deep Mind hat inzwischen auf die Vorwürfe reagiert. Ein Mitarbeiter verspricht auf X, vormals Twitter, die Zahl der möglichen Abfragen auf 20 pro Tag zu erhöhen. Innerhalb von sechs Monaten sollen detailliertere Informationen zum Modell veröffentlicht werden. Von einer Veröffentlichung des Quellcodes ist aber auch dort nicht die Rede.

Eigene Richtlinien gebrochen

Letztlich breche Nature seine eigenen Vorgaben, heißt es in dem Brief. Wenn ein Journal es verabsäume, die Einhaltung seiner eigenen geschriebenen Richtlinien einzufordern, demonstriere es, dass es mit mehrerlei Maß messe. Der Code sollte nicht nur den Gutachtern zur Verfügung stehen, sondern auch als Zusatz zur eigentlichen Studie veröffentlicht werden.

Es ist nicht die einzige Kritik an der Veröffentlichungspraxis des renommierten Journals. Nachdem sich Nature in den letzten Monaten gezwungen gesehen hatte, mehrere Studien mit aufsehenerregenden Ergebnissen zu Supraleitern zurückzuziehen, zeigten nachfolgende Recherchen unter anderem einen eher laxen Umgang mit den Empfehlungen der Referees. Die Studien des inzwischen diskreditierten Forschers Ranga Dias waren trotz negativer Einschätzung einzelner Gutachter veröffentlicht worden. Bei Nature gelobte man daraufhin, daraus Lehren für die Zukunft zu ziehen.

In jedem Fall ist die Geschichte ein Beispiel für die Macht des IT-Riesen Google, für den man offenbar eine Ausnahme von den Veröffentlichungsrichtlinien des Journals machte. Wer den kritischen Brief lesen will, findet ihn übrigens auf einem Google-Server und kann ihn dort unterschreiben, sofern er oder sie einen Google-Account besitzt und sich damit einloggt. (Reinhard Kleindl, 15.5.2024)