Das Cern bietet Einblick in seine wissenschaftlichen Daten.

Foto: imago/frans lanting

Die Europäische Organisation für Kernforschung Cern stellt Daten des Großen Hadronen-Speicherrings (Large Hadron Collider, LHC) für jedermann zum Download zur Verfügung. Mit Hilfe von angebotener Software lassen sich diese Datensätze sogar visualisieren.

250 Billionen Kollisionen

Die Daten stammen vorwiegend von Compact-Muon-Solenoid-Experimenten (CMS) aus dem Jahr 2011. In den 300 Terabyte sollen unter anderem Informationen zu mehr als 250 Billionen Partikel-Kollisionen enthalten sein.

Zum Download stehen dabei unterschiedliche Datensätze der CMS-Collaboration bereit. Zum einen "primäre Datensätze", die für die Forschung verwendet werden, zum anderen ausgewählte Datenpakete, die viel weniger Rechenleistung benötigen und zum Beispiel von Studenten verwendet werden können.

Wissenschaftlicher Nutzen

CMS stellt darüber hinaus Software zur Verfügung, um diese Datensätze analysieren zu können und um Simulationen zu erstellen. Dass zwei Studenten unter der Leitung eines CMS-Physikers in Deutschland bereits in der Vergangenheit in der Lage waren, CMS-Daten graphisch so aufzubereiten, dass sie denen der Forschungsorganisation fast identisch waren, hätte gezeigt, dass man daraus Nutzen ziehen könne.

"Event-Display" einer Partikelkollision.
Foto: cern/cms

Nach der erschöpfenden Erforschung der Daten "sehen wir keinen Grund, diese nicht öffentlich zu machen", meint CMS-Physikerin Kati Lassila-Perini, die für die Erhaltung der Daten zuständig ist. Dadurch können etwa Schüler und Studenten für das Thema interessiert werden, außerdem bleiben die Informationen dadurch langfristig verfügbar.

Open Data

"Als Wissenschaftler sollten wir die Veröffentlichung von Daten aus von öffentlicher Hand finanzierter Forschung sehr ernst nehmen", wird ein anderer CMS-Physiker in der Pressemitteilung zitiert. Darüber hinaus bringe die Veröffentlichung wissenschaftliche Vorteile für den ganzen Bereich.

Es ist nicht ungewöhnlich, dass das Cern Daten seiner Experimente und Forschungen veröffentlicht. Erst im November 2014 wurden etwa 27 Terabyte Daten veröffentlicht, die 2010 gesammelt wurden. In der jetzigen Größe ist dies aber bisher noch nie geschehen. (fps, 25.4.2016)