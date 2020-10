Fein verästelt wie Wanderkarten: die Familienstammbäume der TU Graz. Alle Personen, die innerhalb einer Dekade geboren wurden, liegen in demselben durch Höhenlinien abgegrenzten Bereich. Foto: TU Graz

Eigentlich wollte Reinhold Preiner nur ein wenig Licht in seinen Familienstammbaum bringen. Dazu stöberte er in den bekannten genealogischen Datenbanken und trug die gefundenen Informationen in handelsübliche Genealogie-Software ein. Bald umfasste seine Ahnenreihe rund 400 Personen.

Doch an diesem Punkt erkannte Preiner ein grundsätzliches Problem genealogischer Forschung: Mit steigender Größe des Datensatzes wird dessen Darstellung hoffnungslos unübersichtlich. Glücklicherweise ist Preiner Experte für Visualisierung. Und so machte der Mitarbeiter des Instituts für Computergrafik und Wissensvisualisierung der TU Graz sein persönliches Projekt kurzerhand zu einem beruflichen.

Das Resultat ist eine völlig neue Art der Visualisierung genealogischer Daten. Im Mai dieses Jahres wurde sie auf der Fachkonferenz Eurovis der wissenschaftlichen Community präsentiert.

Der klassische Stammbaum

Klassischerweise stellt man derartige Daten als Stammbaum dar. Diese Form der Visualisierung ist intuitiv, da sie den zeitlichen Verlauf deutlich veranschaulicht: Wer im Baum weiter oben steht, ist später geboren als darunter stehende Personen. Außerdem ist leicht erkennbar, wie viele Generationen zwischen zwei Personen liegen.

Dennoch ist der Stammbaum in seiner Anwendbarkeit begrenzt. Nicht nur deshalb, weil jedes Kind einen neuen Ast erfordert und die Darstellung bei kinderreichen Familien unübersichtlich wird. "Das Problem beim klassischen Stammbaum ist, dass er die realen Verhältnisse häufig sehr naiv vereinfacht", sagt Preiner.

"Wenn man weit in der Zeit zurückgeht, stellt man oft fest, dass der vermeintliche Baum gar kein Baum ist." So finden sich bei genauerer Betrachtung in Ahnenreihgen oft zyklische Verbindungen. Zudem gibt es nicht selten komplexe Querbeziehungen zwischen Familienzweigen, die sich im Stammbaum nicht sinnvoll darstellen lassen.

Möglichst übersichtlich

Mathematisch gesprochen ist ein Stammbaum ein Graph, also eine Struktur, die aus Knoten und diese verbindenden Kanten besteht. Die Knoten repräsentieren Personen, während die Kanten für die Eltern-Kind-Relation stehen. Da diese Relation nicht umkehrbar ist, werden die Kanten als Pfeil dargestellt, der zum Kind zeigt.

Auch Preiners neuer Ansatz basiert auf dieser Graph-Struktur. Der erste Schritt ist also, die Daten als möglichst übersichtlichen Graph darzustellen. Dafür gibt es bewährte Algorithmen, welche die Daten automatisch so in einer zweidimensionalen Ebene verteilen, dass die Unterschiede der einzelnen Kantenlängen möglichst gering sind und es außerdem möglichst wenige Kantenüberkreuzungen gibt.

Diese Verteilung heißt in der Fachsprache Layout. "Das Hauptproblem ist jetzt, wie man bei einem gegebenen Layout intuitiv veranschaulichen kann, was früher und was später war", so Preiner. Dafür erstellen die Grazer Forscher ein sogenanntes Höhenfeld und legen es unter das Layout.

Zeit als Landschaft

Man kennt das aus topografischen Wanderkarten, in denen die Höhe des jeweiligen Geländes durch Höhenlinien und farblich unterschiedliche Bereiche gekennzeichnet ist. Möglich ist das bei genealogischen Daten, weil jeder Knoten, der ja für eine reale, historische Person steht, mit einer Zahl assoziiert werden kann, nämlich deren jeweiligem Geburtsjahr.

Entscheidet man sich beispielsweise für eine zeitliche Auflösung von zehn Jahren, liegen alle Personen, die innerhalb dieser Dekade geboren wurden in demselben, durch zwei Höhenlinien abgegrenzten Bereich.

Zur besseren Übersichtlichkeit werden die verschiedenen Höhenbereiche zusätzlich durch unterschiedliche Farbschattierungen markiert. "Wir stellen also die Zeit als Landschaft dar, die aus den punktuellen Zeitinformationen an den Knoten generiert wird", erklärt Preiner.

Abbild des direkten Ahnenbaums von Marie Antoinette, Tochter von Maria Thersia von Habsburg. Foto: TU Graz

Damit ist allerdings ein Problem noch nicht gelöst: Die zeitliche Information ist genau genommen nur in den einzelnen Personen gespeichert, eben als deren Geburtsjahr. Die Bereiche dazwischen sind undefiniert.

Die Grazer Wissenschafter haben deshalb ein Verfahren entwickelt, um die "leeren" Bereiche zwischen den Knoten sinnvoll mit Zeitinformationen zu füllen. Dafür werden die Linien zwischen zwei Knoten als monoton steigend oder fallend gezeichnet. Umgangssprachlich gesprochen sind die Höhenlinien also "geglättet", es gibt keine plötzlichen Berge oder Täler.

"Die Grundidee unseres Ansatzes ist sehr simpel, aber in der praktischen Umsetzung gab es einige Probleme zu lösen", so Preiner. Wie geht man mit sich kreuzenden Kanten um, die mehrere Dekaden auseinanderliegende Personen verbinden?

Hierbei haben sich die Forscher ebenfalls einer topografischen Kategorie bedient, in diesem Fall jener des Tunnels: "Wenn eine ältere Kante unter einer jüngeren Kante liegt, dann schütten wir das Gelände auf. So hat die jüngere Kante einen ebenen Boden und die frühere Kante wird als Tunnel darunter durchgeführt."

Große Vereinfachung

Der Datensatz, mit dem Preiner und seine Kollegen gearbeitet haben, umfasst 5000 Personen aus 1000 Familien. Der Grazer Genealoge Gerd Herud hat ihn den Wissenschaftern zur Verfügung gestellt. Für Vertreter dieser Hilfswissenschaft in der Familienforschung bietet die neue Visualisierungsform eine große Vereinfachung.

Sie erhalten nicht nur einen intuitiven Gesamtüberblick über ihre Daten. Sie können außerdem Teilcluster von besonderer Relevanz sofort lokalisieren. Man denke nur an isolierte Bereiche, bei denen es noch keine, oder erst wenige Kanten gibt, weil die familiären Beziehungen noch nicht aufgeklärt sind. Genealogen kommen dadurch wesentlich schneller mit der Erstellung von Ahnenreihen voran. (Raimund Lang, 1.10.2020)