Das Bild zeigt ein Auge, in dem sich das Logo von OpenAI spiegelt
Das KI-Modell GPT-4 von OpenAI kann auch Gesichter identifizieren. Freigeschaltet ist die Funktion allerdings noch nicht.
APA/AFP/Saget

Multimodale KI-Modelle, die auch Bildmaterial interpretieren können, gelten als nächster Evolutionsschritt für KI-Tools. Für OpenAI, den Entwickler von ChatGPT, scheinen sie allerdings noch zu unsicher zu sein, zumindest aus rechtlicher Sicht. Zwar habe man bereits im März das KI-Modell GPT-4 veröffentlicht, das neben der Textverarbeitung auch die Bildanalyse beherrscht. Allerdings hat das Unternehmen das Freischalten dieser Funktion aus Datenschutzbedenken bisher zurückgehalten, wie die "New York Times" berichtet.

Die Sorge besteht darin, dass GPT-4 in der Lage sein könnte, bestimmte Personen zu erkennen und wiederzufinden, was potenziell ihre Privatsphäre gefährden könnte. Aufgefallen ist die bewusste Limitierung des KI-Modells im Rahmen der Zusammenarbeit mit "Be my Eyes" – das Start-up nutzt die Erweiterung der Bildverarbeitungsfähigkeiten von GPT-4, um Menschen mit Sehbehinderungen zu helfen, ihre Umgebung besser zu verstehen. Tester der "Be My Eyes"-App stellten fest, dass Gesichter aus Datenschutzgründen nicht angezeigt wurden, was auf die Fähigkeit von GPT-4 zur Gesichtserkennung hindeutet.

Sorge wegen Fehlinterpretationen

OpenAI bestätigte auf Nachfrage der "New York Times", dass das Modell bekannte Persönlichkeiten identifizieren kann, hinsichtlich möglicher Missbräuche und Verstöße gegen Datenschutzgesetze in einigen Regionen, wie in Teilen der USA und in Europa, wurden aber Bedenken geäußert.

OpenAI zeigt sich bereit, in einen offenen Dialog mit der Öffentlichkeit zu treten und Funktionen zurückzuhalten, wenn diese nicht gewünscht oder aus Sicherheitsgründen problematisch sind. Es wird jedoch auch betont, dass GPT-4 wie andere KI-Modelle dazu neigt, "halluzinierte" Informationen zu generieren, was im konkreten Fall zu Fehlinterpretationen von Bildern führen kann.

Andere Feldexperimente

Neben OpenAI setzen auch andere Unternehmen auf multimodale KI-Funktionen. Microsoft testet bereits eine Bildverarbeitungsfunktion in seiner Suchmaschine Bing, die auf GPT-4 basiert, während Google über Bard eine ähnliche Funktionalität anbietet. Bisher haben diese Unternehmen noch keine spezifischen rechtlichen Vorwürfe in Bezug auf ihre Bildverarbeitungsfunktionen erhalten.

Obwohl die Integration von KI-gestützter Bildverarbeitung in zukünftigen Systemen wahrscheinlich ist, müssen noch einige ethische und rechtliche Herausforderungen bewältigt werden, bevor diese Funktionen breitflächig und bedenkenlos zugänglich gemacht werden können. Jedenfalls ist es auch nicht das erste Mal, dass OpenAI Bedenken hinsichtlich KI-Entwicklungen äußert – zu starke Einschränkungen gegen eigene Produkte sieht man aber offenbar auch nicht gerne und tritt mit entsprechendem Lobbying gezielt dagegen an. (red, 20.7.2023)