Gboard jetzt mit Offline-Spracherkennung.

Foto: Proschofsky / STANDARD

Ob Amazon Echo, Google Home oder auch Siri: Spracherkennung erfolgt bisher üblicherweise in der Cloud. Der Grund dafür ist ein simpler: Dort gibt es die nötigen Rechenressourcen, um solch komplexe Aufgaben flott abwickeln zu können. Doch einer der großen Player in diesem Bereich will diese Abhängigkeit nun loswerden, und macht erste Schritte in diese Richtung.

Gboard

Mit einem aktuellen Update für Gboard bringt Google seiner Tastatur-App Offline-Spracherkennung bei. Die Spracheingabe erfolgt hier also komplett am lokalen Gerät. Möglich wird dies dank Maschinenlernen, in einem Hintergrundartikel erläutert Google die technischen Details. Die theoretische Machbarkeit eines solchen Ansatzes hat das Unternehmen schon vor einiger Zeit demonstriert, nun ist es aber auch gelungen, das dafür notwendige Sprachmodell auf eine für ein Smartphone realistische Größe zu kondensieren. Statt zuvor mehrere GB kommt man nun mit 80 Megabyte aus.

Stärken

Die Spracherkennung direkt am Smartphone bietet in mehrerlei Hinsicht zentrale Vorteile. So ist zunächst die Performance erheblich besser. Da die Netzwerklatenz als Faktor entfällt, erfolgt die Erkennung praktisch in Echtzeit. Zudem stellt das Ganze aber auch einen erheblichen Privatsphärengewinn dar, da die Daten eben nicht mehr an die Server des Herstellers übertragen werden müssen.

Pixel und US only

Zum Start ist die Verfügbarkeit der Offline-Spracherkennung allerdings stark begrenzt. So gibt es das Feature zunächst nur für Besitzer von Googles eigenen Pixel-Smartphones und auch dort nur für US-amerikanisches Englisch. Der Softwarehersteller betont aber, dass Ganze natürlich auch für andere Sprachen entwickelt werden soll. (apo, 13.3.2019)