Dreiäugige Katze und Knautschgesicht: Kann eine Gratis-KI Fotos in 3D-Modelle verwandeln?

Ende 2023 ist es ein alter Hut, dass KI-Tools Texte schreiben, Bilder generieren, Stimmen imitieren und Melodien komponieren können. Schwieriger wird es, wenn die Software auch komplexe 3D-Modelle erstellen soll, wie sie in allen möglichen Lebens- und Industriebereichen verwendet werden – von der Entwicklung von Computerspielen bis zum Produktdesign und der Innenarchitektur. Über entsprechende Gehversuche hatte DER STANDARD bereits Ende 2022 berichtet, damals war aber eher noch das Scannen von Objekten mit Apps wie Scaniverse das prägende Thema, während die Erstellung von Objekten via KI noch in den Kinderschuhen steckte.

KI-Tools zum Erstellen von 3D-Modellen

Im sich rasant wandelnden Feld der KI-Tools sind nun aber einige Werkzeuge präsentiert worden, die genau diese Lücke füllen sollen: entweder auf Textbefehl oder auf Basis eines Fotos 3D-Modelle generieren, die anschließend in Computerprogramme und -spiele integriert oder mit einem 3D-Drucker ausgedruckt werden können. Design-Platzhirsch Adobe bietet mit Substance 3D ein Softwarepaket, das diese Aufgaben erfüllen soll, mit 47,99 Euro pro Monat für Privatpersonen aber recht teuer ausfällt.

Das Start-up Masterpiece X wiederum ermöglicht das Generieren von 3D-Modellen auf Basis von Textbefehlen, von denen manche auf Wunsch sogar animiert werden können. Außerdem ist es möglich, die erstellten Modelle nicht nur in PC-Tools wie Blender, sondern auch in einer Virtual-Reality-Umgebung mit Metas Quest-Brillen zu bearbeiten. Das Metaversum wird also zum Atelier für 3D-Modelle. Auch hier muss man jedoch Geld einwerfen. Das Generieren eines Modells per Texteingabe kostet 50 Credits, welche wiederum erneut im Abo erhältlich sind: Für 10,99 Dollar pro Monat kann man 750 Credits verbrauchen, bzw. 15 Modelle generieren. Nicht unbedingt günstig, wenn man bedenkt, dass sicher nicht jeder Befehl ein perfektes Modell hervorbringt.

Über die Website 3Druck.com findet man schließlich den Verweis auf ein Tool namens Voxcraft, das stark an eine eierlegende Wollmilchsau erinnert: 3D-Modelle können entweder mit Textbefehlen oder auf Basis von hochgeladenen Fotos generiert werden. Die Benutzung ist derzeit noch kostenlos und funktioniert - ähnlich wie die Bild-KI Midjourney – über einen Discord-Chat. Die fertigen 3D-Modelle können später im gängigen .obj-Format heruntergeladen und anschließend verwendet oder am PC weiterverarbeitet werden.

So funktioniert Voxcraft

Hat man bei Voxcraft die Anmeldung vollzogen und Angaben zu den eigenen Interessen gemacht, so findet man sich im "Getting started"-Chat wieder, in dem erklärt wird, was mit Voxcraft möglich ist. Die Möglichkeiten der Objekterstellung via Text sind dabei noch relativ beschränkt. So kann man der eigenen Fantasie nicht freien Lauf lassen, sondern wählt aus vier Objekttypen – Flugzeug, Sessel, Auto, Tisch – und definiert dessen Stil. Das Ergebnis ist nach rund vier Minuten verfügbar. Eine andere Funktion ist "Text to texture", bei der eine bestehende .obj-Datei hochgeladen und mit einer beliebigen neuen Textur versehen wird.

Am interessantesten ist aber wohl die "Image to 3D"-Funktion, bei der ein Bild in ein 3D-Modell verwandelt wird, indem nach Eingabe des Befehls "/img3d" das gewünschte Bild einfach hochgeladen wird. Hier ist das Ergebnis nach 30 Minuten verfügbar, es können auch mehrere Bilder nacheinander hochgeladen und somit parallel verarbeitet werden. Damit das möglichst gut funktioniert, werden die folgenden Anforderungen gestellt:

Abgelehnt werden außerdem schädliche, beleidigende und obszöne Inhalte. Und scheinbar gibt es auch einen Filter für religiöse Motive: Fotos, die ich auf Asienreisen von diversen Buddhastatuen gemacht hatte, wurden von der Software abgelehnt. Bei Shinto-Tempeln agiert die Software eher willkürlich: Eine Darstellung von Inari Ōkami wurde abgelehnt, eine andere fotografierte Skulptur hingegen angenommen. Weiters habe ich zwecks Test ein in der Nacht bei beschränkten Lichtverhältnissen geschossenes Selfie sowie zwei Fotos meiner Katzen hochgeladen.

Die Ergebnisse

Was spuckt die Software aus? Nach kurzer Wartezeit erscheinen tatsächlich die 3D-Modelle, die als ZIP-Datei heruntergeladen und entpackt werden können, neben dem eigentlichen Modell erhalten sie auch eine Datei für die Textur des Modells. Relativ gut gelungen ist dabei die Umwandlung der besagten Statue aus einem Tempel, bei der das Originalfoto über klare Formen ohne Reflexionen verfügt und vor einem blauen Himmel ohne Wolken fotografiert wurde.

Noch halbwegs in Ordnung, wenn auch deutlich verzerrter ist das erste Katzenmodell, bei dem das Originalfoto den felinen Overlord miauend auf dem Balkon mit unscharfem Hintergrund zeigte. Die Körperform wurde nicht ganz exakt erkannt, und der geöffnete Mund wurde von der Software schließlich doch mit Polygonen gefüllt. Interessant ist aber, dass auch jene Aspekte großteils korrekt modelliert werden, die auf den Fotos nicht sichtbar sind, im vorliegenden Fall etwa der Rücken des Tieres.

Schlechter schneidet hingegen das Foto der anderen Katze ab, das vor einem unruhigen Hintergrund aufgenommen wurde, welcher auf dem Smartphone nachträglich unscharf gestellt wurde. Vielleicht liegt es aber auch gar nicht am Hintergrund, sondern zum Beispiel am Blickwinkel, dass das finale 3D-Modell drei statt zwei Augen hat.

Mein bei schlechtem Licht aufgenommenes Selfie schließlich resultiert in einem 3D-Modell, bei dem unter anderem Haut- und Haarfarbe halbwegs richtig getroffen wurden, das Gesicht im Vergleich zum Original aber recht zerknautscht wirkt. Dies dürfte wohl auf die Reflexionen des Kunstlichts in meinem Gesicht zurückzuführen sein.

Wozu das alles?

Man muss nicht zwingend in der Kreativbranche tätig sein, um solche Objekte anschließend – freilich nach reiflicher Überarbeitung – in zum Beispiel eigene Computerspiele zu integrieren. Auch für Privatpersonen ist die Anwendung interessant, indem sie mit VR-Brillen wie nun der Meta Quest 3 oder künftig der Apple Vision Pro Erinnerungen als Mixed-Reality-Objekte in die eigene Wohnung projizieren.

Oder aber man druckt die Objekte in einem 3D-Drucker aus. Hierzu ist es nötig, die Unterseite der Modelle zu begradigen und in einem für 3D-Druck tauglichen Format – klassischerweise .stl – zu speichern. Im vorliegenden Projekten geschah dies mit wenigen Klicks in der Software 3D Builder, die in Windows bereits integriert ist. Anschließend können die Objekte in einer speziellen Software (Slicer) wie gewohnt für den 3D-Druck vorbereitet werden.

Profis in diesem Segment sehen es bereits am Screenshot: Aufgrund der viele Überhängen in den Objekten wurde viel Unterstützungsmaterial benötigt, welches bei den finalen Skulpturen entsprechende Rückstände hinterließ. Aufgrund der sehr kleinen Layer-Höhe von 0,1 Millimeter war der Drucker für die vier nur wenige Zentimeter hohen Figuren eine ganz Nacht aktiv. Das Ergebnis ist Geschmackssache, der Autor würde über sein Werk niemals schimpfen, so wie auch gute Eltern ihre Kinder niemals öffentlich als hässlich bezeichnen würden – dem Forum sei an dieser Stelle aber freilich Tür und Tor für allerlei Beschimpfungen geöffnet.

Das Fazit aus der Geschichte? Noch nie war es so einfach, mit wenigen Klicks eigene 3D-Modelle zu erstellen. Sicher, die Ergebnisse sind nicht perfekt, aber die Technologie entwickelt sich rasant und wird in den kommenden Monaten noch deutlich besser werden. In Kombination mit entsprechender Hardware – VR-Brille oder 3D-Drucker – ergeben sich somit amüsante Anwendungsszenarien, die vor ein paar Jahren noch undenkbar erschienen. Wer weiß: Vielleicht spart man sich auf Reisen ja künftig den Weg zum Souvenirshop und druckt sich stattdessen das individuelle Souvenir später zu Hause selbst aus. Auf Basis eines einfachen Schnappschusses, den man mit dem Smartphone gemacht hat. (Stefan Mey, 23.10.2023)

Selbstversuch