Sora: Neues KI-Modell zeigt eindrucksvolle Videos, basierend auf Textbefehlen

"Eine stylische Frau geht eine Straße in Tokio entlang, die mit warm leuchtendem Neonlicht und leuchtenden Stadtschildern gefüllt ist. Sie trägt eine schwarze Lederjacke, ein langes rotes Kleid und schwarze Stiefel und hat eine schwarze Handtasche dabei. Sie trägt eine Sonnenbrille und roten Lippenstift. Sie geht selbstbewusst und lässig."

Mit Prompts, also textlichen Erklärungen, wie diesem wurden im letzten Jahr vor allem eindrucksvolle Bilder erstellt. Mit Sora stellte OpenAI am Donnerstag eine neue Software vor, die aus solchen Prompts bis zu einminmütige Videos erstellt. Auffällig dabei ist, dass die Szenen von echten kaum noch zu unterscheiden sind. Auch das Software-Unternehmen weiß um die Macht von Sora, weshalb im ersten Schritt nur sehr ausgewählte Personen Zugang erhalten werden.

Die Macher des Chatbots ChatGPT schließen damit eine Lücke in ihrem Angebot mit einer Software, die Videos aus Text-Vorgaben erzeugen kann. Das KI-Modell mit dem Namen Sora werde zunächst ausgewählten Kreativen zur Verfügung gestellt, schrieb OpenAI-Chef Sam Altman am Donnerstag auf der Online-Plattform X (ehemals Twitter). Auch sollen Experten mögliche Sicherheitsrisiken ausloten, bevor das Programm breit genutzt werden kann.

Auf der Website zur Software veröffentlichte OpenAI mehrere Beispiele zusammen mit der Beschreibung, die ihnen zugrunde lag, darunter auch die eingangs beschriebene Szene mit der Frau, die durch die japanische Stadt geht. Andere Videos zeigen unter anderem Mammuts, die im Schnee laufen, sowie eine Stadt in Kalifornien zu Zeiten des Goldrauschs.

Noch Schwächen

Mehrere andere Unternehmen entwickelten bereits Software, die Videos aus Text erzeugen kann. OpenAI schränkt ein, dass Sora noch Schwächen habe: So mache das Modell manchmal Fehler bei der Umsetzung von Physik-Regeln. Auch könne es zum Beispiel passieren, dass jemand im Video von einem Keks abbeiße - und der Keks später immer noch ganz aussehe.

KI-Technologie, die bewegte Bilder aus Text-Vorgaben generiert, könnte mit der Zeit die Videoproduktion verändern. Zugleich sind die Sorgen groß, dass damit in großem Stil Fake-Videos erzeugt werden können, die von echten Aufnahmen kaum zu unterscheiden wären. Die Entwickler der Technologie arbeiten deshalb an Wegen, in die Videos eindeutige Erkennungsmerkmale wie Wasserzeichen einzubauen. Auch bei Sora-Videos solle erkennbar sein, dass sie von KI erzeugt wurden.

ChatGPT löste vor gut einem Jahr den Hype um Künstliche Intelligenz aus. Genauso wie solche KI-Chatbots wird auch die Software zum Erzeugen von Fotos und Videos mit gewaltigen Mengen an Informationen angelernt. (APA/dpa, red, 16.2.2024)

Künstliche Intelligenz

Sora: Neues KI-Modell zeigt eindrucksvolle Videos, basierend auf Textbefehlen

Noch Schwächen

Forum: 200 Postings

Ihre Meinung zählt.