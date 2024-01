Wer mit Duolingo eine Sprache lernt, kann danach nicht unbedingt ein Gespräch in dieser führen. Duolingo

Bei den aktuellen Temperaturen scheint der Sommerurlaub zwar noch in weiter Ferne zu liegen – doch wer sich am Gardasee oder auf Mallorca auch in der Landessprache unterhalten möchte, der sollte bereits jetzt mit dem Pauken von Grammatik und Vokabeln beginnen. Oder nicht? Immerhin versprechen Anbieter von Apps wie Duolingo oder Babbel, dass damit auf spielerische Weise verschiedene Sprachen gelernt werden können. Unterwegs, auf dem Handy, während man gerade auf den Bus wartet.

Verstehen: Ja. Kommunizieren: Nein

Dass dieses Versprechen nur bedingt eingehalten wird, hat DER STANDARD bereits im vergangenen Herbst in einem Artikel anhand mehrerer internationaler Studien dargelegt. Demnach verbesserten sich die Sprachkenntnisse der Probanden nach wenigen Wochen bereits merklich, für eine Konversation reichte es jedoch auch nach mehreren Monaten noch nicht.

Der Grund: Eine Sprache besteht nicht nur aus Grammatik und Vokabeln, sondern auch aus diversen Feinheiten, die man nur in der direkten Konversation erlernt. Für kontextbezogene Anwendungen, etwa das Verstehen von Gelesenem und Gehörtem, reichte das erworbene Wissen laut einer 2021 veröffentlichten Studie allerdings sehr wohl. Bis zum finalen Level eines Spanischkurses brauchten die Probanden im Schnitt 100 Tage, beim Französischkurs waren es 150 Tage. Größer ist der Lernerfolg, wenn die App nicht alleinstehend, sondern als begleitendes Tool zu einem Sprachkurs verwendet wird.

Wenn aber genau für diesen Sprachkurs Zeit und Muße fehlen und Sprachlern-Apps alleinstehend nicht dazu führen, dass man in einer Sprache flüssig kommunizieren kann, dann stellt sich auch die Frage: Warum sich überhaupt die Mühe machen? Denn wenn es nur darum geht, unterwegs Phrasen fremder Sprachen in die eigene zu übersetzen und darauf vielleicht auch noch halbwegs eloquent in der Landessprache zu antworten, dann gibt es dafür schon jetzt diverse Hilfsmittel. Und in Zukunft dürften weitere hinzukommen.

Google Translate: Der Übersetzer in der Hosentasche

Beginnen wir mit einem Klassiker: Google Translate. In seiner ursprünglichen Version bereits im April 2006 veröffentlicht, unterstützt das Tool inzwischen 133 Sprachen und wird täglich von rund 610 Millionen Menschen genutzt. Die browserbasierte Version ermöglicht es, die Sprache von in ein Textfeld eingegebenen Wörtern und Phrasen automatisch zu erkennen und sie zu übersetzen. Auch können Dokumente hochgeladen und anschließend in der Zielsprache heruntergeladen werden, und in Bildern vorhandener Text kann ebenfalls in die gewünschte Sprache übersetzt werden. Und auch manche Websites lassen sich durch Eingabe der URL komplett übersetzen.

Doch auch wenn das Tool bereits weit fortgeschritten ist, so ist es längst nicht perfekt. Und das zeigt sich unter anderem darin, dass es mit dem Erkennen von Kontext und Intentionen noch immer Probleme gibt. So gibt es in der Türkei eine Speise namens "Tavuk Şiş", das sind äußerst schmackhafte Spieße aus Hühnerfleisch. Wer allerdings die entsprechenden Sonderzeichnen nicht auf der Tastatur findet, der wird wohl kurzerhand "Tavuk Sis" – also ohne die Sonderzeichen – ins Eingabefeld eintippen und erfährt sodann, dass das Beisl in Istanbul auch Hühnernebel im Angebot hat. Alternativen werden von Google Translate nicht genannt. Dass der User eventuell eher nach einer Speise als nach einem Titel für einen (noch) nicht existierenden Horrorfilm suchen würde, wird vom Tool nicht berücksichtigt.

"Einmal Hühnernebel, bitte!" Screenshot

Seit 2010 ist Google Translate auch als App für Android und seit 2011 für iPhone verfügbar, und die wird auf Reisen wohl eher zum Einsatz kommen als die Browserversion. Hier können wie gehabt Wörter und Sätze eingetippt oder eingesprochen werden, damit diese übersetzt werden, auf Wunsch kann die Eingabesprache auch automatisch erkannt werden. Sprachenpakete können heruntergeladen werden, damit die Übersetzung auch offline funktioniert, was gerade bei Urlauben außerhalb der EU nützlich ist.

Zudem verfügt die App über eine "Unterhalten"-Funktion. Hier können zwei Menschen vor dem Smartphone sitzen und in ihrer Muttersprache sprechen, die App übersetzt das Gesprochene in die Sprache des Gegenübers und gibt die Übersetzung in Schrift- ebenso wie in Audioform aus. Im Test dauerte das immer ein paar Sekunden, was eine Echtzeitkonversation im Alltag erschweren dürfte. Zum Abstimmen bei grundlegenden Verständnisfragen reicht es aber allemal.

Die Kamera als Übersetzer

Und schließlich ermöglicht die Translate-App, fremde Sprachen unter Nutzung der Kamera zu übersetzen. Hierzu wird die entsprechende Option in der App gewählt, die Berechtigungen akzeptiert, anschließend ist der übersetzte Text live auf dem Bildschirm sichtbar. Wie bei der nachfolgenden Übersetzung eines englischsprachigen Pen-&-Paper-Rollenspiels ersichtlich, ist das Ergebnis auch hier nicht perfekt, aber die Message kommt so klar rüber, wie es bei einem Lovecraft-Zitat überhaupt möglich sein kann.

Am Ende holpert es a bissl. Screenshot

Die Kamerafunktion führt uns wiederum zu einer anderen Anwendung, die für Übersetzungen Sinn macht: Google Lens. Diese integriert sich in die Foto-Apps von Android- und iOS-Smartphones und ermöglicht es, die Inhalte der Bilder zu analysieren. An anderer Stelle haben wir bereits gezeigt, wie mit dieser Funktion auch Pflanzen und Tiere identifiziert werden können (was im Urlaub auch gelegentlich praktisch sein kann), und natürlich kann damit auch Text in Fotos erkannt, kopiert und bei Bedarf übersetzt werden.

Neu ist die Funktion "Circle to Search", die Anfang 2024 ihre Premiere auf dem Samsung Galaxy S24 feierte und schrittweise in andere Android-Geräte integriert werden soll. Hier können in diversen Apps – also etwa auch in Tiktok oder Instagram – Objekte eingekreist werden, um danach zu suchen. Und auch wenn es nicht die Kernfunktion ist, so kann auch Text auf diese Weise eingekreist werden, um ihn zu kopieren oder zu übersetzen.

KI-Alternativen: DeepL und die LLMs

Doch Google Translate und Google Lens sind nicht das Ende der Fahnenstange, und durch den Siegeszug von Anwendungen wie ChatGPT sind auch andere Anbieter im Bereich der künstlichen Intelligenz (KI) vor den Vorhang getreten. Gerade im Kontext von Übersetzungen muss daher an dieser Stelle die aus Deutschland stammende Anwendung DeepL genannt werden, die längere Texte oft besser übersetzen kann als Google Translate. Auch hier gibt es auf Wunsch mobile Apps.

Den zuvor erwähnten Hühnerfehler macht DeepL allerdings auch und übersetzt "Tavuk Sis" mit "Hühnernebel", bietet zudem aber auch alternative Übersetzungen an: "Hühnerdunst" und "Hühnerfieber". Das wird auch nicht besser, wenn der Begriff in den Kontext eines Satzes gesetzt wird: "bir tane tavuk sis, lütfen" wird auch bei DeepL nicht mit "Einen Hühnerspieß, bitte", sondern mit "Einen Hühnernebel, bitte" oder alternativ mit "Einen Hühnerfusel, bitte" übersetzt. Sonderzeichen können Leben retten.

In einem Forum des Anbieters OpenAI diskutieren Entwickler wiederum darüber, ob Large Language Models (LLMs) wie OpenAIs ChatGPT gar die besseren Übersetzer seien. Der Grund: Sie können Texte nicht nur übersetzen, sondern auch längere Beiträge zusammenfassen oder die Übersetzung in einen Kontext setzen. Wohlgemerkt immer unter Berücksichtigung der Tatsache, dass diese Anwendungen zum Halluzinieren leiden, also manchmal Inhalte ausspielen, die inhaltlich falsch sind.

Bing und Bard als Reiseführer

Im Test wurde dies mit Microsofts Bing Copilot, der auf OpenAIs GPT-4 und somit auf dem gleichen Modell wie die kostenpflichtige Version von ChatGPT basiert, ebenso wie mit Googles LLM namens Bard ausprobiert. Beide Bots haben zufriedenstellende Resultate produziert. So ließen wir von Bard einen Artikel des STANDARD auf Englisch übersetzen und zusammenfassen, das Ergebnis war inhaltlich korrekt und verständlich. Daraufhin sollte der Bot in deutscher Sprache zum Ausdruck bringen, dass man sich angesichts des kommenden AI Act Sorgen um Datenschutz mache. Hier wurden gleich mehrere Optionen inklusive der englischen Bedeutung genannt.

Microsofts Copilot wurde wiederum mit dem Eintrag über Istanbul aus der englischsprachigen Wikipedia gefüttert und gebeten, diesen in die deutsche Sprache zu übersetzen und zusammenzufassen. Hier wurde das Essentielle in einem korrekten, wenn auch etwas oberflächlichen Absatz dargestellt. Anschließend beantwortete der Bot auch Fragen wie jene, wie man auf Englisch in höflichem Tonfall nach dem Eintrittspreis für die Hagia Sophia fragt. Bei dieser und auch bei anderen Fragen wurde stets versucht, weiteren Kontext beizusteuern. Wie bereits angeführt, sollte von LLMs bereitgestellten Antworten nie blind vertraut werden.

Bing möchte die Frage gerne selbst beantworten, damit wir keinen Menschen fragen müssen. Die Antwort ist in diesem Fall übrigens korrekt. Screenshot

An dieser Stelle auch ein Blick in die Zukunft: Microsoft arbeitet intensiv daran, seine KI-Systeme tief in Windows und in diverse Office-Programme zu integrieren. Es ist also davon auszugehen, dass der Copilot künftig auch bei Videokonferenzen protokolliert und übersetzt. Google wiederum hat zuletzt Personal in jener Abteilung abgebaut, die am Google Assistant arbeitet. Das ist ein weiteres Indiz dafür, dass der Assistant in Zukunft durch Bard oder ein ähnliches Modell ersetzt wird. Und das könnte auch die Konversation im Urlaub noch einmal deutlich vereinfachen.

Die smarte Sonnenbrille

Innovationen gibt es aber nicht nur bei der Software, sondern auch bei der Hardware. Und hier ist vor allem Meta, der Mutterkonzern von Facebook und Instagram, zuletzt vorgeprescht. So wurde die smarte Sonnenbrille des Konzerns, Rayban Stories, mit KI-Funktionen ausgestattet, bei welchen die integrierten Kameras die Umgebung filmen, und die Software analysiert, um welches Objekt es sich handelt. Einer der ersten Tester, der prominente Tech-Youtuber Marques Brownlee, zeigt sich in einem Video begeistert.

Für die Zukunft sieht der Youtuber weitere Anwendungsszenarien, wie etwa dass die KI beim Blick auf eine Speisekarte warnt, falls eine Mahlzeit Allergene enthält. Und vermutlich ist auch das Übersetzen von Text auf diese Weise möglich. Und zwar ohne dass dafür das Smartphone aus der Hosentasche gezogen werden muss. Kritik an den Brillen gibt es aber auch: So werden angesichts der integrierten Kameras massive Datenschutzbedenken geäußert, und bis zur Beschreibung des Bilds vergehen immer ein paar Sekunden. Auch hier wird wohl noch viel Zeit vergehen, bis eine flüssige Konversation mit einer fremdsprachigen Person möglich ist.

Vielleicht doch ernsthaft lernen?

Was bedeutet das nun alles für den nächsten Urlaub, wenn er dann endlich vor der Tür steht? Ganz einfach: dass man die Qual der Wahl hat. Wen es nicht stört, vor Ort mit dem Smartphone zu hantieren, um Texte einzugeben, einzusprechen oder Speisekarten zu fotografieren, der kann sich den professionellen Sprachkurs ebenso wie das Eintauchen in Apps wie Duolingo oder Babbel ersparen. Falsche oder unvollständige Übersetzungen sind dabei ein Kollateralschaden, mit dem man leben muss.

Wer sich hingegen in einem fremdsprachigen Land in digitaler Abstinenz üben möchte, für den oder die gilt: Vorarbeit leisten. Und da können Apps zumindest eine gewisse Basis schaffen, oder es wird gar Geld und Zeit in einen professionellen Sprachkurs investiert. Oder eine Zeitmaschine erfunden, um in die eigene Schulzeit zurückzureisen und dort der Französischlehrerin die gebührende Aufmerksamkeit zu schenken. (Stefan Mey, 27.1.2024)