Lorenz Matzat: "Wenn man Datensätze veröffentlicht, wird klar werden, dass ein Teil der Verwaltung nicht gut arbeitet oder dass man sie eigentlich gar nicht mehr braucht, weil sie Sachen machen, die eine Maschine wesentlich besser könnte."
Der in Berlin ansässige Mitgründer von Open Data City, Lorenz Matzat, sinnierte bei seinem Wien-Besuch über Generationenkonflikte, teure Versäumnisse in Redaktionen und das semantische Web.
derStandard.at: Infografiken werden stark von gewissen Moden bestimmt. Welcher Style ist derzeit vorherrschend?
Lorenz Matzat: Es gibt Leute, die schon unglaublich davon genervt sind, dass alles, was nicht bei drei auf den Bäumen ist, in eine Infografik verpackt wird. Es wird mittlerweile alles visualisiert, weil Infografiken offensichtlich gut klicken und das ja immer ein wichtiger Aspekt für Leute aus dem Online-Bereich ist. Der Style sind diese Verlaufgeschichten, also dass du runterscrollst, und es wird immer weiter erzählt, alles von Kulturannäherung bis Politik - es gibt eigentlich kein Thema, das sich nicht visualisieren lässt. Das ist aber für mich, muss ich dazusagen, nicht Datenjournalismus.
derStandard.at: Wie definieren Sie Datenjournalismus?
Matzat: Es gibt verschiedene Schulen, wenn man so will. Ich bin da sehr orthodox: Für mich ist richtiger Datenjournalismus, wirklich interaktive Geschichten zu machen. Das heißt nicht, dass man irgendwohin klicken kann und es passiert etwas. Für mich ist interaktiv, dass sich der Nutzer sehr frei in den Daten bewegen kann - ich schaffe faktisch eine Umgebung, in der diese Daten nach diversen Kriterien betrachtet werden können, bestenfalls nach den Kriterien, die ich als Nutzer mitbringe.
derStandard.at: Welche Möglichkeiten gibt es zu überprüfen, ob die Daten wirklich das halten, was sie versprechen?
Matzat: Grundsätzlich muss man sich als Datenjournalist mit Tabellenkalkulation beschäftigen. Statistik braucht man als Handwerkszeug, und je mehr man Programmieren lernt oder zumindest versteht, wie es funktioniert, umso besser ist man ausgestattet. Des Weiteren kann man bei vielen Statistiken überprüfen, ob sie plausibel sind, und einfach mal durchrechnen, ob da überhaupt hundert Prozent rauskommen. Oft merkt man dann, da fehlt was oder hier sind Zahlen falsch. Es passieren bei großen Datensätzen schlicht Fehler. Ich kann sie aber beispielsweise verschränken und mit anderen Datensätzen kreuzen, da können Fehler noch mal anders sichtbar werden.
derStandard.at: Gibt es eine Möglichkeit, bereits vorhandene Redaktionsarchive mit Metadaten aufzuladen?
Matzat: Jein. In den Redaktionen, die ich in den letzten zwei Jahren kennengelernt habe, gibt es das Problem, dass die Archive nicht richtig ausgezeichnet sind, damit man sie redaktionell abgreifen könnte. Es ist richtig teuer, das im Nachhinein zu machen, und macht Bauchschmerzen. Das zweite Problem ist, dass Redaktionen zwar Daten im Sinne von Artikeldatenbanken oder Bilderdatenbanken haben, aber sie in ihren Datenbanken keine Datensätze sammeln, obwohl die ihnen eigentlich täglich über den Tisch laufen, wie zum Beispiel Excel-Sheets von Pressestellen. Soweit ich weiß, gibt es keine Redaktion, die diese systematisch in einer zentralen Organisation sammelt, sondern sie werden einfach immer wieder abgefragt. Das ist, meiner Meinung nach, ein Fehler.
derStandard.at: Wie sollte man es richtig machen?
Matzat: Ich würde ein Archiv schaffen, in das man Statistiken über Gesundheit, Steuergeschichten, Kriminalität einarbeiten kann, damit andere Leute aus der Redaktion wissen, dass es diesen Datensatz gibt, und zugreifen können. Die Alternative wäre, die Berichte automatisch einfließen zu lassen, damit ich Artikel damit anreichere, zum Teil Lesern zugänglich mache oder einfach mal die Datenbank öffne. Es ist ja ein Trend, dass durch den Open-Data-Gedanken Datenbanken demnächst miteinander sprechen. Stichwort semantisches Web, ein großes Thema, das auch für den Journalismus unheimlich wichtig werden wird.
derStandard.at: Welches Content-Management-System (CMS) könnte man Zeitungen empfehlen, um zu einer mehrdimensionalen Art des Geschichtenerzählens zu kommen?
Matzat: CMS ist ein schwieriges Thema bei den Zeitungen, es gibt da so eine Art Hassliebe. Manche Leute reden bereits jetzt von einem Data-Management-System, und wir sehen schon Anfänge davon, dass bestimmte Tools immer wieder eingesetzt werden, um verschiedene Geschichten zu erzählen. Ich kann mir vorstellen, dass Redaktionen anfangen werden, eine Middleware zu nutzen, und es gibt auch schon Firmen, die versuchen, in diesen Markt zu gehen. Im Open-Data-Bereich gibt es beipielweise Socrata, die Open-Data-Portale für Staaten oder Länder machen, sicher aber auch journalistisch einsetzbar sind, und dann gibt es eine Open-Source-Variante namens ckan von der Open Knowledge Foundation. In zwei bis drei Jahren wird sich sicher jemand als Marktführer durchsetzen, im Augenblick ist aber alles noch sehr rudimentär.
derStandard.at: Als eine der größten Hürden wird immer wieder über die Verfügbarkeit von Daten in Europa gejammert. Wie geht die Entwicklung in Richtung Open Data voran?
Matzat: Ich bin da recht positiv. Es dauert allerdings länger als in den angelsächsischen Ländern, wo das von oben nach unten durchgedrückt wird. In Deutschland kann ich beobachten, dass es erst vereinzelte Zellen in der Verwaltung gibt, da die Führungsriegen, wie in fast allen anderen Branchen auch, zur Generation 50+ gehören. Die wurden auf dem falschen Fuß damit erwischt. Die nachrückende Generation versucht das jetzt zu etablieren. Das sind letztendlich Generationenkonflikte.
derStandard.at: Alles nur eine Frage der Zeit?
Matzat: Ich glaube, dass das Potenzial für Leute, die täglich mit dem Internet arbeiten, auf der Hand liegt. Man merkt, dass Ressourcen verschwendet werden und dort ungehobene Schätze liegen. Für Leute aber, die das Medium in seiner ganzen Komplexität gar nicht verstehen, die es sich ausdrucken lassen, um es mal gemein zu sagen, für die ist das natürlich sehr schwer zu verstehen, was die Leute überhaupt wollen und wovon sie reden. Das geht gar nicht von einer Bosheit aus, sondern es ist ein Unverständnis.
derStandard.at: Wenn man Daten nicht zur Verfügung gestellt bekommt, kann man sie auch "scrapen". Wie funktioniert das genau?
Matzat: Eine Webseite wird ja nicht so ausgeliefert, wie wir sie letztlich sehen, sondern der Browser kriegt eigentlich eine Zeichenkette, also HTML-Code geliefert. Jede Seite hat dadurch eine Struktur und ist in Teilen ausgezeichnet, so dass ich bestimmte Elemente identifizieren kann. Es gibt die Möglichkeit, dass ich eine Software baue, einen Scraper, den "Schaber", dem ich sagen kann: "Besuche diese Webseite und versuche einen bestimmten Teil zu identifizieren. Wenn du ihn gefunden hast, dann lies aus, was dort steht, und schreib das in eine Datenbank mit einem Zeitstempel. Mach das alle fünf Minuten. Wenn du einen Link findest, folge dem Link."
derStandard.at: Ist das legal?
Matzat: Kommt darauf an.
derStandard.at: Worauf?
Matzat: Ob es legal ist. Tatsächlich gibt es in Deutschland viele Graubereiche, was öffentliche Daten angeht, und auch ein Datenbankschutzrecht, das teilweise abstrus ist. Manchmal wird Urheberrecht erhoben, wo es gar nicht erlaubt ist, beispielsweise bei den Gesetzestexten oder Protokollen aus den Parlamenten. Außerdem gibt es in Deutschland keine Public Domain, also keine Lizenzform, die es einem rechtlich erlaubt, solches Material nach Lust und Laune weiterzunutzen. Ich glaube, dass es im EU-Bereich durch Initiativen wie von Neelie Kroes für Public Sector Information, was der formale Begriff für Open Data ist, in zwei bis drei Jahren mehr Klarheit geben wird.
derStandard.at: Manche Leute in der EU arbeiten an einer Durchsetzung von Open Data auf europäischer Ebene. Kann man die Protagonisten an politischen Lagern festmachen?
Matzat: Es ist aufgrund mehrerer Dimensionen schwer, Open Data an einem Links-rechts-Schema durchzudeklinieren. Wenn man sich Großbritannien ansieht, ist dort eine konservativ-liberale Regierung am Ruder, und die pushen das unheimlich. Da geht es nicht darum, dass sie demokratieförderlich sein wollen, sondern sie unterstützen das aufgrund von wirtschaftlichen Aspekten. Es gibt Leute, die wollen Open Data fördern, weil sie meinen, dass es gut für Demokratie ist, manche, weil es gut für die Wirtschaft ist, und manche sagen, das ist für beides gut, eigentlich eine Win-Win-Situation. Und dann gibt es welche, denen ist das alles viel zu transparent und die finden Open Data bedrohlich, weil es an ihren Pfründen, an ihren Posten kratzt.
derStandard.at: Mit welchen Konsequenzen wäre zu rechnen?
Matzat: Wenn man Datensätze veröffentlicht, wird klar werden, dass ein Teil der Verwaltung nicht gut arbeitet oder dass man sie eigentlich gar nicht mehr braucht, weil sie Sachen machen, die eine Maschine wesentlich besser könnte. Solange das nicht von außen ersichtlich ist, sondern innerhalb des Verwaltungsapparates verborgen liegt, kann das auch niemand kritisieren oder versuchen zu ändern. Viele dieser Institutionen sind über Jahrzehnte oder gar Jahrhunderte gewachsen. In dieser Hinsicht ist es natürlich immer eine wichtige Motivation, den Wandel zu verhindern. (Tatjana Rauth, derStandard.at, 26.3.2012)