Roboter diskutiert mit Mensch
Ein Siegeszug synthetischer Stimmen könnte menschliche Sprecherinnen und Sprecher den Job kosten.
Midjourney/Stefan Mey

Die Autorin Anna Mocikat hat Cyberpunk-Romane wie "Space Punks" und "Behind Blue Eyes" geschrieben und ist stolz darauf, in ihrer Nische bei Amazon als Bestsellerautorin zu gelten. Außerdem kooperiert sie mit professionellen Sprechern, um ihre Werke auch als Hörbücher zu publizieren. Diese Herangehensweise verfolgen allerdings nicht alle Indie-Autoren, wie sie beim Durchstöbern des Katalogs von Amazon Audible feststellte und sogleich im Social Network X bekanntmachte: Im Hörbuchabo des US-Konzerns finden sich demnach zahlreiche Audiobücher, die nicht von Menschen eingesprochen, sondern über synthetische KI-Stimmen vertont wurden.

Fakten zu den KI-Audiobüchern

Bei Amazon bestätigt man auf Anfrage des STANDARD, dass aktuell ein derartiges Programm läuft. So gehören Hörbücher zu den am schnellsten wachsenden Formaten, allerdings sind aktuell nur für vier Prozent der via Kindle Direct Publishing (KDP) selbstveröffentlichten Titel als Hörbücher verfügbar. Dementsprechend möchte man den Autorinnen und Autoren die Möglichkeit geben, mit einer synthetischen Sprachtechnologie schnell und einfach eine Hörbuchversion ihres E-Books zu erstellen.

Die Hörbücher sollen überall verfügbar sein, wo Audible-Bücher abgerufen werden können. Dadurch soll sich nicht nur eine neue Einnahmequelle für die Autoren ergeben, sondern auch die Auswahl für die Endkunden gesteigert werden. Die Werke sind klar gekennzeichnet als solche, die mit synthetischen Stimmen erstellt wurden. Derzeit wird eine Beta-Testphase über den KDP-Dienst in den USA durchgeführt, an der Autoren nur auf Einladung teilnehmen können. Über einen breiten Start im deutschen Sprachraum ist nichts bekannt, er dürfte bei Erfolg des Betatests aber in absehbarer Zeit folgen.

40 Prozent Umsatzbeteiligung

Wie das Publizieren abläuft und was für Autoren dabei finanziell herausspringt, lässt sich schon jetzt in einem Betrag von Amazon nachlesen. Demnach wählen sie ein Buch aus, das sie über Amazons Selfpublishing-Plattform KDP veröffentlicht haben, anschließend können sie Stimmen auswählen, sich das Audiobuch vorab anhören und es editieren. Nach der Veröffentlichung soll das Hörbuch innerhalb von 72 Stunden überall verfügbar sein, wo Audible-Titel angehört werden können.

Der Preis für die Audiobücher soll zwischen 3,99 und 14,99 Dollar liegen, die Autoren erhalten vom Verkaufspreis einen Anteil von 40 Prozent. Eine Besonderheit gibt es noch für Bücher, die in KDP Select enthalten sind. Wählen Autoren dieser Bücher diese Option, so können Amazon-Prime-Kunden ihre E-Books gratis lesen. Das Budget aus einem "KDP Select Global Fund" wird an die Autoren verteilt, basierend darauf, wie viele Seiten von ihren Büchern gelesen wurden.

Ähnliches gilt auch für die Audiobücher: Werden diese in KDP Select platziert, so können sie von Kunden gratis gehört werden, die Audible Plus abonniert haben. Dabei handelt es sich um ein zusätzliches Abo, das nach einer 30-tägigen Probezeit 7,95 Dollar im Monat kostet. Hier äußert die Autorin Mocikat Kritik: Da künftig mehr KI-generierte Hörbücher die Plattform fluten dürften und diese ebenfalls aus dem Budget von KDP Select bedient werden, reduziert sich automatisch das Einkommen jener Indie-Autoren, die ihr Buch nur in geschriebener Form anbieten.

Was passiert mit den Menschen?

Hinzu kommt ein anderer Kritikpunkt, den Mocikat anführt: dass durch dieses Vorhaben den menschlichen Sprecherinnen und Sprechern zunehmend die Lebensgrundlage entzogen wird. Viele Indie-Autoren würden nun lieber auf die KI-generierte Variante zugreifen, anstatt in Sprecherinnen und Sprecher zu investieren. Dies gehe jedoch auch auf Kosten der Qualität, da die synthetischen Stimmen nicht an jene der menschlichen Profis heranreichten. Den Schaden hat somit auch der Endkunde.

Bei Amazon wiederum heißt es, dass man nach wie vor die Möglichkeit biete, mit menschlichen Sprechern zu kooperieren. Dabei kommt "Audiobook Creation Exchange (ACX)" zum Einsatz: ein Marktplatz, bei dem die schreibende mit der sprechenden Zunft vernetzt wird, um die geschriebenen Werke gemeinsam in Audiobücher zu verwandeln und zu publizieren. Laut Website steht diese Option derzeit aber nur Autoren aus den USA, Großbritannien, Kanada und Irland zur Verfügung. Die Sprecher werden entweder direkt bezahlt oder am Umsatz beteiligt, je nach Modell bekommt der Autor 20 bis 40 Prozent vom Umsatz.

Trotz dieser Option ist wohl anzunehmen, dass viele Indie-Autoren die KI-Route einschlagen werden, wie auch Mocikat im Chat mit dem STANDARD prognostiziert. Viele Autoren würden KI nutzen, weil andere es auch tun, und irgendwann werde dies der einzige Weg für sie sein, Geld zu verdienen. Während das Sprechergeschäft kollabiert. Mocikat: "Es besteht kein Zweifel daran, dass uns allen eine schwere Zeit bevorsteht." (Stefan Mey, 27.1.2024)