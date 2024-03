Pleiades ist einer der Supercomputer der Nasa. NASA

Das High-End-Computing-Programm (HEC) der Nasa hat ein Problem: Es ist kein wirkliches High-End-Programm, wie aus einem Bericht des Generalinspekteurs der US-Weltraumbehörde hervorgeht. Schlimmer noch: Die Nasa könne ihre Aufgaben dadurch nur noch unzureichend erfüllen, was wiederum aktuelle Missionen verzögere.

Das geht aus einem Sonderbericht hervor, über den "Golem" als Erster berichtete. Darin heißt es, dass die Supercomputer der Nasa sich immer noch hauptsächlich auf CPUs stützen. So verwendet einer der Supercomputer 18.000 CPUs, aber nur 48 GPUs.

Alte Hardware, lange Wartezeiten

Die Ursachen für den technischen Rückstand sind zahlreich, sie werden in dem Audit aufgeführt. Zum einen gebe es Bedenken, was die Zuverlässigkeit von Lieferketten der Hardware betrifft. Es mangle aber auch an qualifiziertem Personal, das für die Implementierung neuer Technologie nötig sei. Gleichzeitig blieb auch die US-Weltraumbehörde nicht vom KI-Hype verschont, und nun müsse man KI-Berechnungen auf Systemen vornehmen, die dafür nicht gedacht seien.

All diese Probleme würden dazu führen, dass Missionen ernsthaft gefährdet seien und es immer wieder zu Verzögerungen komme. Außerdem seien die Supercomputer der Nasa hoffnungslos überbucht, und freie Slots für Zugriff auf die Rechner gebe es so gut wie keine. Kämen dann noch Systemausfälle dazu, führe dies nur zu weiteren Verzögerungen. Die Warteschlange für Jobs, die etwa 2.000 Rechenkerne benötigten, sei mehrere Wochen lang, heißt es in dem Bericht.

Aber auch der organisatorische Bereich birgt enorme Probleme, so gibt es keinen Plan für Neuanschaffungen im High-End-Computing-Programm, was zu fragmentierten Investitionen führt. Dazu kommt auch noch mangelndes Management: Weil niemand die Übersicht habe, werde Software etwa mehrfach lizenziert, obwohl sie eigentlich schon zur Verfügung stehe.

Sicherheitsregeln werden ignoriert

Noch schlimmer scheint es um den Bereich Cybersicherheit zu stehen. Laut der Untersuchung würden die Teams häufig Cybersicherheitsregeln missachten oder ignorieren, weil sie als zu streng angesehen werden, was das Risiko eines Cyberangriffs enorm erhöhe. Die Zusammenfassung liest sich dann auch dementsprechend: "Obwohl das HEC-Ökosystem der Nasa für die Aufrechterhaltung der Missionsprioritäten und den Fortschritt der Wissenschaft von entscheidender Bedeutung ist, haben wir festgestellt, dass es an Führungskräften und Engagement mangelt und kein einheitlicher Ansatz für das HEC-Management über Organisationsgrenzen hinweg verfolgt wird." Deshalb empfiehlt der Generalinspekteur den Umstieg auf GPUs und dringende Reformen in der Verwaltung der Computerressourcen.

Die Nasa betreibt aktuell fünf zentrale High-End-Computer. Der aktuell leistungsfähigste von ihnen ist Aitken. Er kann 13,12 Petaflops durchführen. Aitken wird aktuell unter anderem für das Artemis-Programm eingesetzt, das eine dauerhafte Präsenz des Menschen auf dem Mond zum Ziel hat. Dieser Cluster belegt aktuell den 85. Platz in der Rangliste der leistungsfähigsten Supercomputer. Discover (8,1 Petaflops) wird zur Erstellung von Klimamodellen genutzt, Pleiades mit 7,09 Petaflopfs dient unter anderem der Analyse von Bildern des Kepler-Teleskops und sucht nach neuen Planeten. Darüber hinaus betreibt die Nasa noch Electra mit 8,32 Petaflops und Endeavour mit 154,8 Teraflops. (red, 20.3.2024)