Google Bard
Bard ist Googles Konkurrenz zu ChatGPT.
IMAGO/Jonathan Raa

Google hat seinen ChatGPT-Konkurrenten Bard deutlich aufgewertet. So bekommt der KI-Chatbot in zahlreichen weiteren Ländern und Sprachen Zugriff auf das KI-Modell Gemini Pro, darunter auch in deutscher Sprache in Deutschland, Österreich und der Schweiz. Außerdem können User in vielen Ländern – aber offiziell noch nicht in Österreich – mit einfachen Prompts Bilder in Bard generieren. Anders als bei OpenAIs ChatGPT ist die Nutzung hier kostenlos, es ist kein kostenpflichtiger Pro-Account erforderlich.

Bard mit Gemini Pro

Bei Gemini Pro handelt es sich um das mittlere der drei Gemini-Modelle mit den Bezeichnungen Ultra, Pro und Nano. Das größte Modell, Gemini Ultra, ist für leistungsfähige Aufgaben gedacht, das kleinste Modell mit dem Namen Gemini Nano soll hingegen direkt auf den Endgeräten zum Einsatz kommen. Gemini Pro ist hingegen für die Anwendung in der breiten Masse in Tools wie Google Bard gedacht.

Unter anderem soll Gemini Pro besser im Schreiben von Programmiercode sein und multimodal arbeiten können, also zum Beispiel hochgeladene Bilder interpretieren. Im Test konnte der STANDARD zum Beispiel rasch einen Javascript-Code für das Computerspiel "Pong" erstellen. Die Interpretation eines hochgeladen Fotos funktionierte gut, aber nicht perfekt: Zwar erkannte die KI, dass es sich um eine Sofortbildkamera des Herstellers Leica handelt und dass diese auf einem hölzernen Untergrund liegt, bei diversen Details haperte es aber, zum Beispiel halluzinierte die KI einen nicht vorhandenen Filmzähler und Fokusring hinzu.

Screenshot

Da generative KIs nicht nur in diesem, sondern auch in anderen Fällen zu Falschaussagen neigen, hat Google außerdem hierzulande ein weiteres Feature verfügbar gemacht: Nach dem Erhalt einer Antwort kann auf das kleine Google-Logo am Ende des Textes geklickt werden, um sich durch eine Google-Suche entsprechende Inhalte im Web anzeigen zu lassen.

Bilder erstellen mit Google Bard

Noch nicht in Österreich verfügbar ist die Bilderstellung via Google Bard, der STANDARD konnte diese Funktion aber unter Verwendung eines VPN-Tools nutzen. Hier wird der Befehl in das Bard-Eingabefeld eingetippt, wie etwa "Create an image of a dog eating ice cream", sodann erhält man das gewünschte Werk. Mit nachfolgenden Befehlen wie "The dog wears a hat" oder "It sits at the beach" lassen sich weitere Details hinzufügen, die Bild-KI merkt sich also das zuvor erstellte Bild und bearbeitet dieses weiter. Auch stilistische Wünsche wie "make that picture in the style of Van Gogh" können nachträglich geäußert werden.

Screenshot

Auf technischer Ebene läuft die Bildgenerierung auf dem Imagen-2-Modell, welches auf eine Balance zwischen Qualität und Geschwindigkeit ausgerichtet ist. Tatsächlich dauerte im STANDARD-Test die Generierung eines Bildes nur knapp 15 Sekunden. Auch die Erstellung von äußerst fotorealistisch wirkenden Bildern war im Test unter Verwendung eines passenden Befehls (Prompt) möglich – sieht man mal davon ab, dass das zweite Bild nicht wie gefordert einen Mann, sondern eine Frau zeigt.

Screenshot

Diese hohe Qualität in Kombination mit der freien Zugänglichkeit erhöht natürlich die Gefahr einer weiter steigenden Verbreitung von Fake-Inhalten. Laut Google nutzt man hier eine Technologie namens SynthID, um ein digital lesbares Wasserzeichen in die Bilder zu integrieren. Auch verweigerte die KI im Test die Generierung von Bildern mit prominenten Personen wie etwa "Donald Trump am Strand".

Neue Tools aus den Google Labs

Ebenfalls vorerst noch nicht in Österreich verfügbar sind KI-Tools, die aktuell in den Google Labs ausprobiert werden können: ImageFX, TextFX und MusicFX. Diese werden gerade erst getestet und sind daher noch nicht in breit verfügbare Anwendungen wie Bard integriert.

Das neue Tool ImageFX ermöglicht das Erstellen von Bildern via KI, anders als bei der bereits in Bard integrierten Technologie stehen jedoch weitere Optionen zur Verfügung. Unter anderem werden dem User Vorschläge für zu verwendende Stile gemacht, was die Formulierung des Prompts erleichtern soll.

MusicFX ist wiederum ein auf KI basierender Text-to-Music-Generator, der Melodien mit bis zu 70 Sekunden Länge generieren kann. Bisher seien über zehn Millionen Tracks auf diese Weise erschaffen worden, heißt es von Google.

Google

Wer hingegen mit Worten anstatt mit Melodien arbeitet, der soll laut Googles Vorstellung von TextFX profitieren. So ist eine Art Reimwörterbuch integriert, das ähnlich klingende Wörter ausspuckt, nüchterne Phrasen können mit blumigeren Inhalten angereichert werden, Begriffe aus verschiedenen Perspektiven beschrieben und Szenen um sensorische Details ergänzt werden. Akronyme und Alliterationen kann das Tool ebenfalls erstellen. Als Zielgruppe nennt Google unter anderem Dichter und Rapper. (Stefan Mey, 2.2.2024)