Historische Dokumente digital zu archivieren ist eine Sache. Aber was tun mit den Unmengen an Daten, die bereits im Netz vorhanden sind und eines Tages verschwinden könnten?

Foto: AP/Sebastian Scheiner

Ende des vergangenen Jahres machten Archäologinnen und Archäologen eine erstaunliche Entdeckung: Mitten im kolumbianischen Amazonasgebiet fanden sie tausende Felsmalereien, von denen die ältesten bis zu 12.500 Jahre alt sein dürften. Es ist ein Kunstwerk aus der Vergangenheit, das viele bereits ausgestorbene Tiere zeigt und den Forschern und Forscherinnen einiges über das Leben der Menschen von damals verrät.

Wie vergänglich wirkt im Vergleich zu Zeitspannen wie diesen der Informationsaustausch der heutigen Zeit: Fotos landen in Ordnern, die kaum ein ganzes Jahrzehnt überstehen, Textnachrichten geraten schon Tage nach dem Senden in Vergessenheit, Onlineprofile werden nach Inaktivität gelöscht und Websites für immer heruntergefahren. Millionen an Daten gehen so gänzlich und in vielen Fällen unwiederbringlich verloren. Sollte uns das etwas kümmern?

Verlust von Wissen

Über die vergangenen Jahrhunderte und Jahrtausende betrachtet ist der Verlust von Informationen und Wissen freilich nichts Neues. Eines der berühmtesten Beispiele ist die Zerstörung der bedeutenden Bibliothek von Alexandria, wahrscheinlich irgendwann zwischen 48 vor Christus und dem siebten Jahrhundert, bei der womöglich zigtausende Schriftrollen für die Nachwelt verloren gingen.

Ungezählte Augenzeugenberichte von vielen wichtigen Ereignissen haben es dagegen überhaupt nie geschafft, zu Papier gebracht zu werden, hunderte Sprachen sind mit dem Tod von jenen Menschen, die sie sprachen, ausgestorben, ungezählte Gemälde, Schriftstücke und Dokumente in der Vergangenheit Bränden, Plünderungen, Insekten oder der Witterung zum Opfer gefallen.

Immer mehr Speicher

Seit damals sind die Möglichkeiten, unsere Daten zu speichern und aufzubewahren, wesentlich umfangreicher geworden. Gewaltige Mengen an Informationen, die selbst noch vor 30 Jahren hunderte Quadratmeter an Datenzentren voraussetzten, passen heute auf USB-Sticks in die Hosentasche. In ihrer digitalen Form sind unsere Daten nicht mehr als eine Aneinanderreihung von Einsen und Nullen, ein Aufleuchten auf unseren Bildschirmen – und als elektrischer Strom ebenso wenig für die Ewigkeit gemacht, wie es damals die Schriftrollen in Alexandria waren.

Das haben auch Beispiele aus den vergangenen Jahren gezeigt: 2011 etwa verlor der E-Mail-Dienst Gmail nach einem Software-Update die E-Mails von 150.000 Nutzern und Nutzerinnen und konnte die Daten nur mithilfe eines Back-ups, das auf Magnetband (!) gespeichert war, wiederherstellen. Auch dutzende andere Google-Dienste sind in den vergangenen Jahren eingestellt worden und haben dazugehörige Daten von Millionen Nutzern und Nutzerinnen mit in ihr Grab genommen.

2019 gingen bei der Plattform Myspace 50 Millionen Songs verloren, von denen nur ein Bruchteil wiederhergestellt werden konnte. Und selbst einige Anbieter von Online-Cloud-Speichern, die Kunden eine sorgenfreie Langzeitspeicherung ihrer Daten versprachen, gingen in der Vergangenheit in Insolvenz, was für viele Nutzer und Nutzerinnen eine böse Überraschung rund um ihre Daten zur Folge hatte.

Wichtige und nichtige Daten

Was für den Einzelnen eine Katastrophe sein kann, muss gesellschaftlich keine große Rolle spielen. Immerhin produziert jeder Mensch, jedes Unternehmen und jede Organisation Unmengen an Daten, die nicht alle gespeichert werden können und müssen.

Viele würden sogar meinen, dass das Problem eher darin besteht, dass einige Daten zu lange im Internet gespeichert werden. Nicht zuletzt deshalb soll das Recht auf Vergessenwerden, das seit einigen Jahren Teil der Datenschutzgrundverordnung der EU ist, sicherstellen, dass persönliche Informationen im Netz irgendwann auch wieder gelöscht werden.

Liegt das Problem also darin, dass teilweise wichtige Informationen gelöscht werden und verloren gehen, während Nichtiges oder Privates zu lange im Netz verharrt? Wie können wir entscheiden, welche Informationen wichtig sind, um sie für unsere Gesellschaft und die Nachwelt aufzubewahren? Haben wir gar eine Verpflichtung, bestimmte Konversationen, Dokumente und andere Dateien im Netz für möglichst lange Zeit zu speichern, damit künftige Generationen besser aus der Vergangenheit lernen können?

15 Jahre sind eine Ewigkeit

"Verlust ist bei der Archivierung allgegenwärtig", sagt Vrääth Öhner, Medienwissenschafter am Ludwig-Boltzmann-Institut für Geschichte und Gesellschaft. Das Versprechen, Dinge zu bewahren, könne nie zu hundert Prozent eingehalten werden. Was die Digitalisierung betrifft, seien 15 Jahre Bestand bereits eine Ewigkeit. "Für länger sind die Dinge meist nicht konzipiert." Zu schnell sei der technische und digitale Fortschritt.

Technisch betrachtet sei die Speicherung der Daten selten das Problem, sagt Andreas Rauber, Wissenschafter und Datenexperte an der TU Wien. Es gehe vor allem darum, in Zukunft auf Daten noch zugreifen und diese nutzen zu können. Häufig fehlen wichtige semantische Informationen, wodurch es bei der späteren Analyse zu Fehlinterpretationen kommen könne. "Die Daten und Formate sind in den vergangenen Jahren viel komplexer geworden", sagt er. Auch die Quellen hinter den Daten seien heute schwerer nachvollziehbar.

Filmarchiv Youtube

In Österreich ist beispielsweise das Staatsarchiv für die digitale Archivierung von Dokumenten von Ministerien, Behörden, Stiftungen oder Bundesbetrieben zuständig. Daneben kümmern sich die Nationalbibliothek, andere Bibliotheken, Museen, Vereine, Unternehmen und Organisationen ebenfalls darum, digitale Inhalte über längere Zeit für die eigene Sammlung zu speichern. Freilich macht diese Speicherung nur einen Bruchteil von dem aus, was an Informationen in Österreich und im Netz verfügbar ist.

"Eines der größten Filmarchive der Welt ist Youtube", sagt Öhner – nur dass es streng genommen gar kein Archiv sei. Denn Nutzer können ihre Videos jederzeit von der Plattform herunternehmen. "Es besteht keine Garantie, dass ich ein Video in ein paar Jahren noch finde." Bei einem Großteil der Videos auf der Plattform würde ein Verlust der Menschheit wohl wenig schaden. Aber was ist mit jenen Inhalten, die durchaus von Relevanz sind oder es einmal sein könnten?

Kampf ums kollektive Gedächtnis

Um zumindest einige Onlinedaten vor dem Verlust zu bewahren, sind in den vergangenen Jahren dutzende staatliche und private Initiativen mit diesem Ziel entstanden. In den USA beispielsweise führt die Library of Congress seit 2010 ein digitales Archiv von Tweets der Nachrichtenplattform Twitter, um laut eigenen Angaben "einen Bestand an Wissen und Kreativität für die amerikanische Bevölkerung zu bewahren". Allerdings kündigte die Institution 2017 an, nicht mehr jeden Tweet zu speichern, sondern nur mehr "sehr selektiv" auszuwählen. Die Zahl der Nachrichten auf der Plattform war schier unbewältigbar geworden.

Die privat organisierte Gruppe Archive Team wiederum hat seit ihrer Gründung im Jahr 2009 viele Inhalte von Websites archiviert, die vor dem Verschwinden standen, beispielsweise von Yahoo! Video, Geo Cities, Google Video, Soundcloud und anderen. Bereits zuvor gründete die US-amerikanische Organisation Internet Archive 2001 die "Wayback Machine", die es Nutzern und Nutzerinnen erlaubt, frühere Versionen von Websites zu betrachten.

Private Archive

"Gesammelt und gespeichert wird meist das, was aus Sicht der Archivare und Institutionen relevant erscheint", sagt Öhner. In den vergangenen Jahren hätten jedoch auch viele Menschen selbst begonnen, Archive aufzubauen, um Informationen über Minderheiten, politisch Verfolgte oder brisante Ereignisse aufzubewahren, zu denen sie meist einen persönlichen Bezug haben.

Das Speichern von Online-Inhalten wirft aber auch rechtliche und ethische Fragen auf. "Ist es legitim, dass Nachrichten oder Videos von Nutzern und Nutzerinnen ohne ihr Wissen archiviert werden?", fragt Rauber. Das Recht, eigene und private Inhalte wieder zu löschen, müsse jedenfalls gewahrt werden.

Wichtiger als die Sammlung und Speicherung an sich ist Experten wie Öhner aber ohnehin der Zugriff auf die Informationen. "Dieser sollte einfach sein und jedem offenstehen." Besonders in der Corona-Krise, in der Archive geschlossen oder beschränkt wurden, habe sich gezeigt, wie leicht sich Zugänge zu Daten einschränken lassen. "Das behindert die Möglichkeiten, Wissen für die Zukunft zu gewinnen." (Jakob Pallinger, 29.7.2021)