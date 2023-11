Noch während man eine Idee für ein Kunstwerk skizziert und/oder mit Worten beschreibt, wird sie vom KI-Modell bereits umgesetzt. Screenshot via X/krea.ai

In einer Welt, in der für Nutzerinnen und Nutzer gefühlt alles sofort passieren muss, könnte sich ein neues Modell für generative KI-Kunst bald als bahnbrechend erweisen. Hinter der sperrigen Bezeichnung "LCM-Lora" steckt verkürzt formuliert die Möglichkeit, KI-Kunst nicht nur multimodal, also über unterschiedliche Eingabemöglichkeiten, sondern vor allem in Echtzeit zu erschaffen und zu verändern. Künstlerinnen und Künstler können ihre Visionen sofort zum Leben zu erwecken – eine Art Kunststück also, das die Grenze zwischen Vorstellungskraft und digitalem Ausdruck verwischen möchte.

Bis vor kurzem musste man in der generativen KI-Kunst – egal ob beispielsweise Stable Diffusion, Midjourney oder Dall-E – eine kurze Wartezeit in Kauf nehmen, während Algorithmen textuelle Beschreibungen in visuelle Kunst umsetzten. Auch wenn solche Verzögerungen oft nur verhältnismäßig gering ausfallen, ist die fehlende Unmittelbarkeit ein spürbarer Bruch im kreativen Prozess. LCM-Lora, kurz für "Latent Consistency Model-Low-Rank Adaptation", entwickelt vom Institut für Interdisziplinäre Informationswissenschaften (IIIS) an der Tsinghua-Universität in China und Hugging Face, will diese Unterbrechung auflösen.

Die Innovation ermöglicht es Benutzern, Kunst in Echtzeit zu generieren, und verspricht damit die Art und Weise neu zu lernen, wie wir mit KI im kreativen Bereich interagieren. Benutzerinnen und Benutzer können dabei zum Beispiel grundlegende Formen und Linien skizzieren und sie mit kurzen Textbeschreibungen ergänzen.

Plattformen wie krea.ai und fal.ai, die LCM-Lora bereits nutzen, rendern auf Grundlage dieser Eingaben sich sofort entwickelnde Kunstwerke. Sollte ein Sketch nicht passen, lässt er sich – auch in Echtzeit – so lange korrigieren, bis das gewünschte Resultat erzielt ist. Der Anwendungsbereich von LCM-Lora erstreckt sich über 2D-Bilder hinaus auf 3D-Objekte und ebnet somit auch den Weg zum Erstellen immersiver Umgebungen in Augmented, Virtual oder Mixed Reality. Der Einsatz für Videospiele und in der Filmproduktion dürfte nur eine Frage der Zeit sein.

Optimierte Prozesse

Im Kern verwendet LCM-Lora einen ausgeklügelten Algorithmus, der den Prozess der Umwandlung von Text oder grundlegenden visuellen Eingaben in detaillierte KI-generierte Kunstwerke beschleunigt. Es optimiert die Verarbeitungsschritte des KI-Modells, sodass Stable Diffusion und seine Varianten detaillierte Bilder mit geringeren Rechenanforderungen produzieren können. Diese Effizienz ermöglicht eine bis zu zehnmal schnellere Arbeitsweise und weniger Belastung der Computerressourcen des Benutzers.

Das universelle Anwendungspotenzial von LCM-Lora auf verschiedenen Plattformen mit Stable-Diffusion-Modellen ist gewaltig und steht erst am Anfang. Wer es jetzt schon ausprobieren möchte, kann dies eingeschränkt auf der Website von fal.ai tun. Für einen Zugang zu krea.ai muss man sich erst anmelden und kann sich damit auf eine Warteliste setzen lassen. In der Fachwelt ist man sich jedenfalls jetzt schon sicher, dass dadurch "viele neue User-Experiences" entstehen können. Manche glauben daran, dass LCM-Lora in dieser Hinsicht sogar alles verändern wird. (bbr, 21.11.2023)