Wien - Die Auswertung der Daten über das riesige globale Steuerhinterziehernetzwerk war wahrlich eine Sisyphusarbeit. Immerhin waren die brauchbaren Informationen 260 Gigabyte groß und beinhalteten 2,5 Millionen Dateien, davon mehr als 2 Millionen E-Mails, anhand derer die rasante Entwicklung einer riesigen Offshore-Industrie über einen langen Zeitraum hinweg nachvollzogen werden konnte, wie das Internationale Konsortium für investigative Journalisten (ICIJ) in Washington auf seiner Homepage schreibt.

ICIJ-Direktor Gerard Ryle hat das Datenkonvolut in Folge seiner dreijährigen Recherche zum australischen Firepower-Betrugsskandal zugespielt bekommen. An der Aufarbeitung der Daten waren in der ICIJ organisierte 86 Journalisten aus 46 Ländern beteiligt. Es handelt sich dabei um eine der größten grenzüberschreitenden Kooperationen im investigativen Journalismus.

Matching-Software im Einsatz

Mit einfachem "Durchschauen" a la Strg+F der Daten nach berühmten Namen es war bei derlei Datenmengen nicht getan. Da bedurfte es schon eigener Programme. Mithilfe von spezieller Matching Software war bald klar, dass 40 Prozent der Dateien und E-Mails Duplikate waren. Sogenannte FTR-Systeme (free text retrieval) sind imstande, riesige Mengen an unsortierten Daten zu durchforsten. Jede Nummer, jedes Wort und jeder Name wird indexiert, sodass später komplexe Suchanfragen möglich sind. Im Grunde gehe es darum, herauszufinden, wer was wann wusste - eine der wichtigsten Fragen im investigativen Journalismus, so das 1997 gegründete ICIJ, ein Netzwerk von 160 Reportern in mehr als 60 Ländern. Aus Österreich sind keine Medien dabei.

Ein wichtiges Suchwerkzeug wurde den Journalisten von einer australischen Firma kostenlos zur Verfügung gestellt, High-End-FTR-Versionen, wie sie etwa Anwaltskanzleien benutzen, wären für die Journalisten-Organisation unleistbar gewesen. Zusätzlich haben Programmierer aus Deutschland, Costa Rica und Großbritannien eigene Anwendungen für das ICIJ geschrieben. Im Dezember 2012 hat ein britischer Informatiker in weniger als zwei Wochen ein Tool namens Interdata entwickelt, das den global verstreuten Journalisten Zugang zu den geleakten Dateien ermöglichte. Mehr als 28.000 Suchanfragen haben die ICIJ-Mitglieder bis dato gestartet und über 53.000 Dokumente heruntergeladen.

Zahlreiche Daten waren unlesbar, da es sich um Bilddateien oder Scans handelte. Da kam dann wieder eine spezielle Software (OCR, optical character recognition) zum Einsatz. Weitere Programme ermöglichten es, Namen oder Adressen zu identifizieren und zu matchen, die unzählige Male anders eingegeben wurden. Ein Teil der Daten ist aber nach wie vor unlesbar und die Programme konnten nicht alle Duplikate als solche ausmachen.

Offshore-Firmen und ihre Gründer

In den Leaks waren auch große Datenbanken über Offshore-Firmen und deren Gründer enthalten, die das ICIJ binnen drei Monaten lesbar machen konnte. Dann kam allerdings die böse Überraschung: Die wirtschaftlich Berechtigten schienen vielfach nicht auf. Gelegentlich poppte aber dann doch ein Alarm mit Kontaktdaten von Personen auf, die wirklich hinter den Offshore-Firmen steckten. Für die Journalisten war dies ein frustrierender, aber sich lohnender Weg, wie das ICIJ schreibt. Was man wirklich gelernt habe, seien Geduld und Ausdauer.

Mit 260 GB war die Offshore-Leaks-Datenmenge nach Berechnung des ICIJ mehr als 160 mal größer als die Depeschen des US State Department, die 2010 von der Aufdeckerplattform Wikileaks veröffentlicht wurden. (APA, 4.4.2013)