In einem der Testszenarien wurde ein simples Muster über das Mikrofon eines Smartphones identifiziert.

Foto: Studie

Es klingt zunächst nach einer ziemlich abstrusen Idee, wie sie aus der Feder eines in technischer Hinsicht unbedarften Hollywood-Autors stammen könnte: Einem Team aus Forschern US-amerikanischer und israelischer Universitäten ist es gelungen in Videochats Informationen über den Bildschirminhalt des Gegenübers zu bekommen – und zwar mithilfe des Mikrofons.

Hintergrund

Hinter all dem stehen aber durchaus nachvollziehbare wissenschaftliche Fakten, nämlich dass jeder Monitor Geräusche abgibt, die vom jeweiligen dargestellten Inhalt abhängig sind. Das war schon bei alten Röhrenmonitoren so – wo es für Menschen noch deutlich hörbarer war – und ist auch bei LCDs so geblieben. Der Grund dafür ist, dass die einzelnen Pixel je nach Intensität auch mit unterschiedlicher Spannung angesteuert werden. Und das führt wiederum zu Fluktuationen bei den Tönen, die die Stromversorgung des Monitors von sich gibt. Da nun bei einem Monitor – für das menschliche Auge weitgehend unsichtbar – ein Pixel nach dem anderen aktualisiert wird, ist es damit möglich Muster zu erkennen.

Trotzdem können Menschen mit diesen Informationen nur begrenzt etwas anfangen, immerhin müsste man massenhaft Vergleichsmaterial zu Rate ziehen, um Ähnlichkeiten zu erkennen. Dazu greifen die Forscher auf Maschinenlernen zurück, womit sich in einem ersten Schritt Teststreifen auf einem Monitor identifizieren ließen. Mit weiteren Verbesserungen war es dann aber möglich, wesentlich präzisere Informationen auszulesen. So konnten schlussendlich mit einer Wahrscheinlichkeit von 96,4 Prozent die Top 10 Webseiten im Alexa-Ranking auseinander gehalten werden, wenn sie gerade auf dem Bildschirm der Zielperson geöffnet waren.

Schrittweise

Eine exakte Reproduktion des Geschehens ist das natürlich noch nicht, aber die Forscher sehen hier noch weiteres Potential. So konnten bei einem anderen Test von 100 Worten auf dem Bildschirm 56 richtig erkannt werden. Zuvor war die Künstliche Intelligenz gezielt auf dieses 100 englischsprachigen Begriffe trainiert wurden. Dabei gilt natürlich, dass die Forscher hier ideale Bedingungen vorfanden. Sie wussten das betreffende Monitor-Modell und es wurde auch ein spezifische Schrift in Großbuchstaben verwendet. Ein Angriff unter realistischen Bedingungen wäre also erheblich schwieriger. Trotzdem liefert man mit all dem die Grundlage für neue Seitenkanalattacken, auf der nun andere versuchen können dies zu verfeinern.

Basis

Die Forscher betonen, dass für all das ein relativ billiges Mikrofon, wie es in den meisten Laptops verbaut ist, ausreicht. Zudem klappt ein solcher Angriff auch über Videochat, konkret hat man das mit Skype und Google Hangouts ausprobiert. Aber auch andere Audioquellen wären theoretisch ausreichend – etwa smarte Lautsprecher von Amazon oder Google. Bei allem ist natürlich Voraussetzung, dass ein Angreifer eine aufrechte Tonverbindung hat, das könnte also bei diesen Szenarien ein Audio- oder Video-Chat beziehungsweise ein Anruf via des smarten Lautsprechers sein. (apo, 30.8.2018)