Damit Hochwasserwarnungen jeder versteht, werden Daten-netze geknüpft.

Grafik: DER STANDARD/Beigelbeck
Satelliten, Sensoren und Sonden vermessen die Erde mit zuvor unerreichter Genauigkeit. Doch die gesammelte Information ist nur schwer zugänglich. Ein von österreichischen Forschern koordiniertes EU-Projekt soll nun Abhilfe schaffen.

*****

Mitte der Vorwoche trafen ein-ander Forscher von 16 Institutionen aus acht Ländern in Wien. Eingeladen hatte Denis Havlik, Wissenschafter bei den Austrian Research Centers (ARC) und Leiter des Projekts SANY. Gemeinsam wollen die IT-Experten Datenbanken vernetzen, und so Leben retten.

Und das geht so: Zwar gibt es eine Unzahl von Umwelt-Messnetzen, die erheben, wie etwa die Qualität der Atemluft oder der Pegel großer Flüsse schwanken. Doch in Krisenzeiten dauert es viel zu lange, bis diese Daten auch wirklich zugänglich sind. "Wenn ein Einsatzleiter dagegen mit einem Blick sehen könnte, dass da eine Giftwolke aus dem Nachbarland herankommt, hätte er viel mehr Zeit zu reagieren", sagt Havlik. Deshalb sucht er mit seinen Mitstreitern nach Methoden, die vorhandenen Daten besser austauschbar und verknüpfbar zu machen.

Mit diesem Anliegen ist Havlik nicht allein. Weltweit erlebt die Forschung zur Vernetzung von Datenbeständen einen regelrechten Boom, sagt Thomas Eiter vom Institut für Informationssysteme an der Technischen Universität Wien. Auslöser dafür sei eigentlich das Internet. "Erst dadurch wird die Verbindung von Datenbanken möglich, die ursprünglich völlig autonom entwickelt worden sind und deshalb auch völlig unterschiedlich strukturiert sind."

Ozon-Daten live austauschen

Johann Weigl, im Umweltbundesamt zuständig für Informationstechnologie und Mitglied der SANY-Gruppe kann das bestätigen. "Schon jetzt können wir in Europa Aufzeichnungen über die Luftqualität austauschen", so Weigl. "Aber das ist ein behäbiger Prozess, das taugt nur zur retrospektiven Analyse." Wünschenswert wäre dagegen ein Verfahren, bei dem etwa im Hochsommer die Ozon-Daten live international ausgetauscht werden könnten.

Auch in den Wissenschaften tauchen ähnliche Probleme auf. So plagen sich US-Forscher gerade mit der Erforschung der Biodiversität im Boden. Dazu müssen Daten über die Hydrologie, das Klima, die Artenvielfalt und der Biogeochemie miteinander ver-knüpft werden. Das sei "mühsam, es gibt keine einheitlichen Standards, auf die wir uns berufen können", schrieben kürzlich die mit dem Problem befassten Wissenschafter Alexander Szalay und Jim Gray im renommierten Wissenschaftsjournal nature.

Prinzipiell gibt es zwei Möglichkeiten: Entweder die einzelnen Datenbanken werden aneinander angepasst. Dazu bedarf es jedoch einer zentralen, normierenden Stelle mit Durchgriffsmöglichkeit, und diese gibt es nur selten. Die zweite Möglichkeit: Es werden Programme entwickelt, die aus den unterschiedlichen Datenbanken Informationen saugen und in standardisierter Form weiterreichen. Die Datenbanken selbst behalten dabei ihre Struktur.

Datenbanken abfragen

Beispiele für beide Lösungsmethoden gibt es bereits in der Forschung: Biologen einigten sich auf die GeneBank, ein einheitliches Verzeichnis aller bekannten Gene. Astronomen wiederum entwickelten ein unter www.ivoa.net zugängliches System, mit dem alle mittleren und größeren Datenbanken ihres Fachgebietes nach einem Muster abgefragt werden können.

Auch dem ARC-Forscher De-nis Havlik schwebt eine solche "föderalistische" Lösung vor. Im Endausbau könnten tausende Online-Quellen so organisiert sein, dass ihre Daten leicht verknüpft werden können.

Im kleineren Maßstab wird die Integration von Datenbanken bereits kommerziell angeboten. An den nächsten Schritten wird dagegen erst geforscht - zum Beispiel über das Problem fehlerhafter Datenbestände: Was tun, wenn zwei Quellen auf eine Anfrage voneinander abweichende Antworten liefern? "Ein Mensch kann in einer solchen Situation zum Beispiel die Zuverlässigkeit der Datenbanken abschätzen", sagt TU-Wien-Forscher Thomas Eiter. "Oder er begnügt sich einfach mit einer Kombination der beiden Antworten."

Um auch Rechnern solche Softskills beizubringen, hat er im Rahmen eines EU-Projekts ("Infomix") gemeinsam mit Partnern aus Polen, Italien und Spanien einen "sehr erfolgreichen" Prototypen programmiert.

Denis Havlik und seine rund 50 Mitstreiter haben bis zum Ende ihres Projektes immerhin noch drei Jahre Zeit, danach will die EU, die das Projekt mit sieben Millionen Euro fördert, Resultate sehen. Immerhin, der Start scheint geglückt zu sein: Die erste Publikation der Gruppe liegt bereits vor - veröffentlicht nur drei Tage nach dem offiziellen SANY-Startschuss. (Gottfried Derka/DER STANDARD, Printausgabe, 27. September 2006)