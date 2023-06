Wenn Kriminologen und Ermittlerinnen in Film- und Fernsehproduktionen auf Verbrecherjagd gehen und sich dabei moderner Computertechnologie bedienen, dann wird es gern einmal eigenwillig. Ein Paradebeispiel dafür war "CSI: Cyber". Das kurzlebige Spin-off der Serie holte sich mit der Bedienung allerlei Klischees und technischem Unverständnis viel Spott und Hohn ab.

Aber vielleicht war die Produktion ja doch visionärer, als man glauben möchte. Denn Forscher der University of Maryland ermöglichen mithilfe von KI nun, was bislang als Science-Fiction einzuordnen war. Sie können aus den Reflektionen in Augen die Umgebung rekonstruieren, in der sich eine Person zum Zeitpunkt der Aufnahme befand. Ihr Projekt haben sie "Seeing The World Through Your Eyes" (Die Welt durch deine Augen sehen) getauft.

Filter, virtueller Augapfel und 3D-Modell

Verwendet wird dafür idealerweise die Aufnahme einer sich bewegenden Person, was das Einfangen mehrerer indirekter Blickwinkel ermöglicht. In Tests reichten aber auch schon Porträtfotos, um Gesehenes plastisch nachzubauen. Hierzu nutzt man ein Verfahren, das man "Eye Pose Optimization Ablation" nennt.

Dieses Diagramm zeigt, wie das System funktioniert. University of Maryland

Die Umsetzung funktioniert so: Ein Bild wird ausgewertet und die Pixel der Hornhaut, die die Iris und die Pupille bedeckt, gezählt. Da die grundsätzliche Form der Hornhaut bei den meisten Menschen in etwa gleich ist, ermöglicht das eine genaue Nachverfolgung der Augen.

Das System nimmt zudem eine Schätzung zur Oberflächentextur von Iris und Pupille vor und versucht, diese zu filtern, um eine "reine" Abbildung der Reflexion zu erzeugen. Über ein 3D-Modell eines Augapfels wird der Winkel der Spiegelung ermittelt, das Bild entzerrt und damit die Teile der Umgebung räumlich verortet.

Mittels volumetrischen Renderings erfolgt schließlich die Rekonstruktion in Form einer dreidimensionalen Szene durch die KI. Diese kann dabei auf Basis ihrer Lerndaten auch Lücken auffüllen. Das ist vergleichbar mit Inpainting, bei dem man etwa von einer KI den Hintergrund erweitern kann, um zum Beispiel einen Gegenstand aus seiner Szene verschwinden zu lassen.

Beispiel einer Rekonstruktion, diese zeigt ein Klassenzimmer.



Auflösung als Hürde

Die Ergebnisse der "Labortests" sehen bereits vielversprechend aus, für den Realeinsatz ist das junge System aber noch nicht geeignet. Das Team versuchte sich an einer Umgebungsrekonstruktion anhand von Musikvideos von Lady Gaga und Miley Cyrus. Die dabei erzeugten Szenen – eine könnte einen Kameramann zeigen – erwiesen sich allerdings als wenig brauchbar. Derzeit ist eine gute Rekonstruktion nur mit hoch aufgelöstem Quellmaterial möglich, was in vielen Anwendungsfällen ein limitierender Faktor sein dürfte.

Das Paper mit der Vorstellung des Verfahrens wurde auf Arxiv zugänglich gemacht. Den dazugehörigen Quellcode will man bald auf Github veröffentlichen. (gpi, 21.6.2023)