Bild nicht mehr verfügbar.

Digitale Assistenten – Siri, Cortana und Google Now – kommunizieren zunehmend per Sprachausgabe

Foto: AP/Risberg

Wie soll ein Gerät "klingen", das mit seinen Nutzern spricht und per Sprachausgabe kommuniziert? Mit dieser Frage beschäftigen sich momentan Forscher intensiv, etwa bei IBM. Sie berichten in der New York Times über die lange Suche nach der "perfekten" Stimme. Wer denkt, dass eine möglichst dem Menschen nahe Aussprache die Lösung ist, irrt: Nutzer fühlen sich von "zu menschlicher" Sprachausgabe abgestoßen. Sie irritiert etwa, dass der Computer dann doch eine falsche Aussprache von bestimmten Worten vornimmt oder mitten im Satz abbricht und überlegt.

Aussprache bringt große Probleme

Gleichzeitig sei es schwierig, Programmen die richtige Dosis Emotionen in der Aussprache beizubringen. Man könne Computern ja nicht einfach – wie etwa Regisseure zu Schauspielern – sagen, dass sie "mehr Gefühl" zeigen sollen, sagt etwa der IT-Professor Alan Black von der Carnegie Mellon University zur New York Times. Aber auch die Aussprache per se bereitet Probleme. Als IBM den Supercomputer Watson für die Spieleshow "Jeopardy" trainierte, merkten sie schnell, dass sich die Aussprache an Sonderfällen wie "Carpe Diem" oder "Champagner" spießt. Mehr als ein Jahr lang mussten Forscher an einer entsprechenden Datenbank arbeiten.

Engadget

Nicht zu menschlich

Grundsätzlich gilt: Klingt der Computer zu sehr nach Computer, fühlen sich Nutzer von ihm nicht angesprochen. Klingt der Computer zu sehr nach Mensch, gruseln sich die Nutzer – vor allem, wenn der Computer dennoch Fehler macht. Denn von einer "natürlichen Konversation", wie sie beispielsweise im Film "Her" porträtiert wird, ist Künstliche Intelligenz noch immer entfernt. Da die Sprachausgabe aber immer populärer wird – man denke beispielsweise ans Smart Home – sind in nächster Zukunft Investitionen in angenehmere Sprachausgabe zu erwarten. (red, 15.2.2016)