Fast fünf Monate ist es inzwischen her, dass OpenAI sein Videomodell Sora vorgestellt hat. Das Programm kann aus einfachen Texteingaben realistische (oder auf Wunsch auch sehr fantasievolle) Videos generieren. Große Augen machten nicht nur Hollywood-Produzenten, die ihr Geschäftsmodell in Gefahr sahen.

Einige Wochen nach der Vorstellung veröffentlichte OpenAI dann noch einige Videos, die in Zusammenarbeit mit Kunstschaffenden produziert – und teilweise wohl stark von Menschenhand nachbearbeitet – waren. Ansonsten ist es ruhiger geworden um Sora. Eine öffentlich zugängliche Version gibt es bis heute nicht. Diese soll aber "definitiv" noch dieses Jahr kommen, hieß es Mitte März.

Neues Modell von Runway

Was natürlich nicht heißt, dass die Konkurrenz schläft. Der Softwarehersteller Adobe hat etwa angekündigt, KI-Funktionen in seine Videoschnittsoftware Premiere Pro, quasi der Branchenstandard, einzubauen, um zum Beispiel Objekte in Videos nachträglich hinzufügen oder entfernen zu können.

RunwayML mischt bereits seit längerem, nämlich seit 2018, im Markt für KI-Videotools mit. Seit einigen Tagen ist nun ein neues Modell, Gen 3 Alpha verfügbar. Das Vorstellungsvideo sieht zunächst vielversprechend aus: Wilde Kamerafahrten durch Wälder und beleuchtete Großstädte, Schlachtfelder und ein Ameisenbau sind da zu sehen. Nicht mit Kameras gefilmt, sondern per Texteingabe erzeugt.

62 Sekunden für 15 Dollar

Im Gegensatz zu den bisherigen Modellen von Runway ist das Gen 3 Alpha allerdings kostenpflichtig. Für 15 US-Dollar im Monat bekommt man derzeit 62 Sekunden Video. Das klingt nach wenig und ist noch weniger – denn wie bei Dall-E oder Midjourney braucht es in der Regel mehrere, wenn nicht dutzende Anläufe, bis das Ergebnis passt.

Keine Frage, für große Filmproduktionsfirmen sind diese Beträge verschwindend gering. Aber kleinere Content-Produzenten müssen sich wohl genau überlegen, wo sich der Einsatz von Video-KIs lohnt. Insbesondere da das Prompten nicht nur Geld, sondern auch Zeit kostet – und Stock-Videos oft schon um wenige Euro zu haben sind.

Kostenlos ist hingegen Kling AI aus China, die in die App Kuaishou integriert ist. Die in Europa wohl unbekannte Videoplattform erinnert an Tiktok und hat rund 600 Millionen User. Diese können nun über Prompts kurze Videos für die Plattform erzeugen. Auch Tiktok soll an einer Video-KI für die eigene Plattform arbeiten.

Ein bisschen Gedankenlesen

Vielleicht muss man in Zukunft aber auch gar nicht mehr händisch prompten. Denn deutsche Forscher behaupten, dass sie durch eine Analyse von EEG-Daten bestimmte Teile des Bewusstseins sichtbar gemacht haben. So lasse sich etwa feststellen, ob jemand eine Serie gesehen habe oder nicht, oder ob man einen bestimmten Menschen wiedererkenne.

Noch weiter gehen die Arbeiten eines niederländischen Forschungsteams. Es will ein KI-System entwickelt haben, das aus Hirnaufzeichnungen rekonstruieren könne, was jemand gesehen habe. Zumindest vorerst muss man sich aber wohl keine Sorgen über Gedankenklau machen – denn um die Daten zu gewinnen, wurden Makaken Elektroden eingesetzt und Menschen unter ein MRT-Gerät gelegt. Das dürfte im Alltag beides ziemlich unpraktisch sein. (Philip Pramer, 6.7.2024)