Am 20. September hat OpenAI, das Unternehmen hinter ChatGPT, mit Dall-E 3 die neueste Version seines KI-Tools für die Generierung von Bildern vorgestellt. Laut Sam Altman, Gründer und CEO von OpenAI, wird das Werkezeug für alle User von ChatGPT Plus in den kommenden Wochen verfügbar sein. ChatGPT ist die kostenpflichtige Version von ChatGPT, deren Userinnen und User unter anderem früher Zugriff auf neue Funktionen bekommen. Das Abo kostet 20 Dollar pro Monat.

Zusätzlich wird Dall-E im Oktober für Userinnen und User von ChatGPT Enterprise sowie via API und über die Labs von OpenAI verfügbar sein, wie das Unternehmen mitteilt. Im Fall der API und der Labs wird das Service über Credits abgerechnet, man zahlt also mit jeder Nutzung einen geringfügigen Betrag.

Dall-E 3 versteht Prompts besser

Mit Dall-E 3 soll ein Problem adressiert werden, mit dem viele andere Bildgeneratoren kämpfen: die Tatsache, dass Anweisungen in Prompts von der KI falsch oder schlichtweg gar nicht aufgenommen werden. Das soll mit dem neuen Tool von OpenAI nicht mehr vorkommen. Die noch vor wenigen Wochen gefeierte neue Kompetenz des "Prompt-Designs" soll im Arbeitsleben wieder überflüssig werden, indem Menschen schlichtweg ihre Vorstellungen formulieren und die KI kompetent liefert. Auch soll es nun möglich sein, dass die KI verlässlich Text in Bilder integriert – bisher wurde bei solchen Fällen oft ein unverständlicher Mischmasch aus beliebigen Buchstaben produziert.

Dall-E 3
So soll Dall-E 3 Bilder genau auf Basis jener Anweisungen generieren, welche die KI erhält.
Open AI

Und auch mit dem gleichen Prompt soll Dall-E 3 deutlich bessere Ergebnisse als der Vorgänger liefern, wie Open AI mit einem direkten Vergleich auf der eigene Website demonstriert.

Dall-E 2 und Dall-E 3 im Vergleich
Gleicher Prompt, anderes Ergebnis: Dall-E 2 (links) im Vergleich zu Dall-E 3 (rechts).
Open AI

Auch soll es möglich sein, die Ergebnisse in ChatGPT nachträglich mit gezielten Anweisungen zu editieren. Zudem dürfte es laut einem Artikel von Mashable möglich sein, innerhalb von ChatGPT zwischen den einzelnen Modellen zu wechseln. Was bedeuten würde: Zum generierten Bild lässt sich dann auch gleich der passende Text erstellen.

Rechtliche Aspekte

Und auf rechtlicher Ebene wird betont, dass die Nutzerinnen und die Nutzer die Werke frei verwenden können. Es muss keine Erlaubnis von OpenAI eingeholt werden, um die Bilder zu drucken, zu verkaufen oder anderweitig zu monetarisieren. Zuvor hatte es Rechtsstreitigkeiten zwischen Anbietern derartiger Software und etablierten Bildagenturen gegeben: Streitpunkt ist, dass teils urheberrechtlich geschütztes Bildmaterial zum Trainieren der KIs verwendet wurde. Bei OpenAI können Künstler nun bewusst ein Opt-out für die zukünftige Generierung von KI-Modellen mithilfe ihrer Werke beantragen.

Betont wird seitens OpenAI außerdem unter dem Punkt "Ein Fokus auf Sicherheit", dass Dall-E 3 bestimmte Prompts auch ablehnen kann, um sexuell anrüchige, gewaltverherrlichende oder auf Hass im Netz ausgelegte Inhalte zu verhindern. Hierzu gehört auch, dass Anfragen zu bestimmten in der Öffentlichkeit stehenden Personen ebenso abgelehnt werden wie jene, bei denen Bilder im Stil eines noch lebenden Künstlers erstellt werden sollen.

In Arbeit ist ein Tool, mit dem nachträglich identifiziert werden soll, ob ein Werk mit Dall-E 3 erstellt wurde. Dieser Aspekt ist vor allem im Kontext von Fake News relevant. (stm, 21.9.2023)