VALL-E

Neue Microsoft-KI kann Stimmen nach nur drei Sekunden imitieren

Bereits ein kleines Audiosample reicht, um ein verblüffend echt klingendes Stimmmodell zu erstellen, das beliebige Sätze sagen kann

Foto: APA/AFP/STR
Foto: APA/AFP/STR

Im vergangenen Jahr hat sich rund um das Thema künstliche Intelligenz eine ganze Menge getan: Während Stable Diffusion oder Midjourney eindrücklich demonstrieren, wie gut KIs mittlerweile bei der Erstellung von Bildern geworden sind, brilliert ChatGPT bei der Textkonversation und dem Lösen unterschiedlicher Aufgaben. Bei Microsoft beackert man nun noch ein weiteres Themenfeld.