Neue KI-Tools wie Chat GPT oder Midjourney sind eine Kiste voller Überraschungen. Sämtliche Illustrationen auf Seite haben wir mit Midjourney generiert. Foto: DerStandard/martinjan/Midjourney

Hier schreiben Menschen. Das ist wichtig zu sagen bei einem Artikel, in dem es um künstliche Intelligenz geht. Denn Medienleute machen sich seit einiger Zeit einen Spaß dar aus, den ersten Absatz eines Artikels über KI von einer KI selbst generieren zu lassen – und niemand hatte es gemerkt.

Düstere Prognosen



In den vergangenen Monaten ist der Hype um künstliche Intelligenz geradezu explodiert. Das Internet wird mit bunten, künstlich generierten Bildern geflutet, eine Software namens Chat GPT produziert verblüffend menschliche Texte. Grafiker, Journalistinnen, Texter, Anwältinnen, Sekretäre – kaum ein Schreibtischjob wurde von düsteren Prognosen verschont, die diese Berufe bald von Computern ersetzt sehen. Gleichzeitig grübeln Lehrer und Uni-Lektorinnen, wie sie künftig überprüfen können, ob Hausübungen und Seminararbeiten aus menschlicher Feder stammen. Was ist da plötzlich passiert, und was kommt da noch auf uns zu?

Künstliche Intelligenz ist per se nicht neu. Beforscht und entwickelt wird sie bereits seit Jahrzehnten – mit stetigen Fortschritten. Das Paradox: Je weiter sich künstliche Intelligenz entwickelt, desto weniger nehmen wir sie wahr. Als 1997 erstmals ein Schachcomputer einen amtierenden Schachweltmeister schlug, waren das große Neuigkeiten, heute ist das ein alter Hut. Als Gesichtserkennung erstmals brauchbare Ergebnisse lieferte, war die Überraschung groß, heute entsperren wir unser Smartphone dutzende Male täglich per Face-ID. Mit jeder weiteren Entwicklung in der KI erscheinen uns frühere Meilensteine plötzlich nicht mehr intelligent. Forschende nennen das den KI-Effekt.

Algorithmen mit Wow-Effekt

KI-Anwendungen waren in der Regel praktische Fachidioten. Gesichter erkennen, Sprache transkribieren, persönliche Video-Empfehlungen – das alles mag das Leben leichter machen, doch der Wow-Effekt blieb aus. Das änderte sich vergangenes Jahr, als der Chatbot Chat GPT und Bildgeneratoren wie Stable Diffusion oder Midjourney auftauchten.

Plötzlich ist nur noch die eigene Fantasie die Grenze. Ein Bild einer futuristischen Me tropole im Stile mittelalterlicher Gemäldekunst? Ein Gedicht zur Mondlandung, so geschrieben, als stammte es aus der Feder von Shakespeare? Eine kurze Eingabe genügt, und die Maschine schreitet zur Tat.

Wer ein bisschen programmieren kann oder sich Code-Schnipsel zusammekopierte, konnte die neuesten KI-Entwicklungen bereits seit Jahren testen. Doch selbst die kürzeste Zeile Code ist für die meisten eine zu große Hürde.

Das neue iPhone



Warum gerade Bilder- und Text-KIs so ins Gespräch gekommen sind, ist deshalb leicht zu erklären. Das Revolutionäre an den Tools ist nicht nur die KI, die in ihnen arbeitet, sondern auch die Benutzerfreundlichkeit. Sie generieren Werke, die für jeden greifbar sind, und können auch von jedem genutzt werden. Der Bildgenerator Midjourney ermöglicht es, den eigenen Dienst auszuprobieren, und verkauft ein Abo mit umfangreicherem Zugriff. Mit Stable Diffusion gibt es gar eine quell offene Bilder-KI, die man kostenlos nutzen kann – einen passend ausgestatteten PC vor ausgesetzt. Auch mit Chat_GPT konnte man experimentieren, ehe die Entwickler von Open AI aufgrund des Ansturms den Zugang begrenzen mussten.

Manche vergleichen Chat GPT und Konsorten bereits mit dem iPhone. Apple hat zwar nicht das Smartphone erfunden, aber es benutzerfreundlich, hipp und damit groß gemacht. Das Gleiche könnte für Chat GPT und KI gelten.

E-Mails ex machina

Denn bereits nach kürzester Zeit werden die Programme für eine Vielzahl von Aufgaben eingesetzt: Die KIs fungieren etwa als Chatbots im Kundensupport, die Problemlösungen ganz ohne menschliche Intervention aufzeigen oder Hilfesuchende wenigstens an die richtige Stelle vermitteln. Sie können auch helfen, Marketingtexte zu verfassen, oder Journalisten Inputs für knackigere Überschriften liefern. Bilder-KIs lassen sich als In spirationsquelle nutzen, liefern Symbolbilder für Berichterstattung und illustrieren Bücher, die sonst unbebildert geblieben wären.

Das dürfte erst der Anfang sein. Microsoft, einer der Hauptfinanciers der Organisation Open AI, die unter anderem Chat GPT und den Bildgenerator Dall-e entwickelt, überlegt bereits, wie sich die neuen KIs, die offiziell immer noch Forschungsprojekte sind, zu Geld machen lassen. Angeblich soll Chat_GPT in Word und Outlook integriert werden. Einfache E-Mails, etwa zur Terminfindung, wie sie täglich zu Millionen verschickt werden, könnten bald automatisiert geschrieben und verarbeitet werden. Ein Geschäftsbericht in Word? Schreibt vielleicht künftig Chat_GPT statt der Assistenz der Geschäftsführung. "2023 wird das spannendste KI-Jahr jemals", zitiert das Onlineportal The Decoder den Mi crosoft-Technikchef Scott Stein.

Für die KI ist Kurz noch Kanzler

Wer genauer hinsieht, findet aber auch schnell ihre Limitationen, die aufzeigen, dass uns so schnell noch keine Herrschaft der Maschinen à la Terminator droht. Moderne KIs setzen auf die Auswertung und Verknüpfung von Daten zum Zwecke der Mustererkennung. Diese Mechanismen werden auf spezielle Einsatzzwecke hin trainiert. Midjourney und Chat GPT sind in ihrem Bereich also bereits recht mächtig, wären als KI aber fehl am Platz, wenn es etwa darum geht, ein Auto zu lenken oder einen Roboter gehen zu lassen.

Aber auch beim Erstellen von Bildern und Schreiben von Texten gibt es deutliche Einschränkungen. Sprachliche Modelle ermitteln etwa mithilfe von Wahrscheinlichkeiten, welches Wort auf das vorige folgen könnte – basierend auf Milliarden von Texten. Die Antworten scheinen deshalb logisch – doch das sind sie nicht immer. Bilder- und Text-KIs fehlt immer noch das grundlegende Verständnis für ihre Werke. Dementsprechend scheitern sie oft an komplexeren Aufgaben. Hände mit sechs oder mehr Fingern oder Tiere mit ungerader Beinanzahl zeigen diese Defizite ebenso auf wie Textpassagen mit massenhaft Füllwörtern oder sich häufig wiederholenden Satzstrukturen. Noch fataler neben wenig Inhalt sind vor allem Falschinformationen.

Nützliche Helfer



Denn die Algorithmen sind nicht allwissend: Im Falle von Chat GPT enden die Trainingsdaten im Jahr 2021. Für das Programm ist Sebastian Kurz immer noch Bundeskanzler, unter dem Krieg in der Ukraine versteht Chat GPT nur die seit 2014 schwelenden Konflikte im Osten des Landes und nicht den großflächigen Angriffskrieg im ganzen Land.

Zu Massenarbeitslosigkeit dürften die neuen KI-Tools also vorerst nicht führen. Eher werden sie uns in vielen Bereichen zur Seite stehen. Es werden auch weiterhin Menschen sein, die KI-Texte auf ihre Fakten prüfen oder Schlüsse aus ihnen ziehen, die automatisch generierte Bilder weiterbearbeiten, wichtige Entscheidungen treffen. Im Gegenteil, vielleicht entstehen auch neue Jobs, etwa "prompt engineers", die wissen, wie man mit den KIs am besten kommuniziert.

Für Missbrauch bitte nett fragen

Die Vielseitigkeit von Chat_GPT hat auch eine dunkle Seite. Spam-Mails, Hasspostings, Fake News – all das kann Chat_GPT am laufenden Band generieren. Chat_GPT hat zwar Mechanismen eingebaut, um solchen Missbrauch zu verhindern. Fragt man den Algorithmus aber, wie er missbraucht werden kann, schlägt er sogar Ideen vor. Man kann das Programm auch überreden, wenn man nett fragt oder gute Argumente vorbringt.

Den Befehl der Erstellung einer Phishing-Mail, in der nach Kreditkartendaten gefragt wird, verweigert das Programm etwa. Wer aber nach einer Geschichte verlangt, in der jemand eine Phishing-Mail bekommt, erzählt die Software von einem Max, der eines Tages eine betrügerische E-Mail bekam, die so aussah wie von seiner Bank. Fragt man nach, was denn genau in dieser Mail stand, spuckt Chat GPT die perfekte Vorlage für einen Internetbetrug dann doch aus. User in Hacker foren prahlen bereits damit, den Bot dazu über redet zu haben, eine Erpressersoftware zu programmieren, welche den Computer von Opfern verschlüsselt und erst nach Zahlung von Kryptowährungen wieder freigibt.

Vor Missbrauch schützen



Open AI, das Unternehmen hinter Chat GPT, arbeitet zwar daran, Missbrauch besser zu verhindern. Doch selbst wenn es gelingt und sich nicht jeder und jede die dunklen Seiten der KI zunutze machen kann – die Technologie existiert, und alles, was existiert, wird von irgendjemandem eingesetzt. Das zeigen Plattformen wie Clearview AI, das nach eigenen Angaben Millionen von Menschen anhand eines einzelnen Fotos identifizieren kann.

Viele rechtliche Fragen sind dabei noch ungeklärt. Handelt es sich bei Bildern, die aus einer Texteingabe generiert wurden, um künstlerisches Handwerk? Wem gehört das Copyright? Wie umgehen damit, dass die KIs die Stile von Künstlern imitieren können, deren Werke sie zuvor, ohne zu fragen, ausgewertet haben? Bildagenturen und Onlineplattformen ringen um Richtlinien, ob und wie mithilfe solcher Software entstandene Werke zugelassen werden. Datenschützer befassen sich mit der Frage, wie man der künftig dräuenden Deepfake-Gefahr begegnen sollte.

Ähnliche Problemstellungen werfen auch Text-KIs auf. Abseits der Schöpfungshöhe der Ergüsse von Chat GPT häufen sich hier Berichte über Schüler, die sich ihre Hausübungen vom Computer schreiben lassen. Tatsächlich liefern sie durchdacht wirkende Texte, wenn man etwa nach einer Hamlet-Zusammenfassung fragt. Eindeutig nachzuweisen, dass hinter dem Geschriebenen kein Mensch steckt, ist allerdings kaum möglich.

Die Benutzerfreundlichkeit der Programme in Kombination mit den verblüffenden künstlerischen Ergebnissen eröffnet viele neue Möglichkeiten. Foto: DerStandard/martinjan/Midjourney

Filter gegen die Bilderflut

Es gibt aber Lösungsoptionen. Jene Verfahren, mit denen diese KIs "angelernt" werden, lassen sich auch einsetzen, um Erkennungssysteme mit hoher Treffsicherheit zu schaffen, erklärt dazu Sven Bliedung von der Heide gegenüber dem STANDARD. Er ist CEO von Volucap, einem deutschen Unternehmen, das im Auftrag von Hollywood-Studios professionelle Deepfakes für Filmproduktionen wie Matrix Resurrections erstellt. Seiner Ansicht nach werden soziale Netzwerke und große Plattformen wie Youtube früher oder später solche Mechanismen implementieren müssen. Auch die Politik ist gefordert, Richtlinien für den Einsatz von KI zu schaffen.

Überraschungskiste



Das Jahr 2023 wird also nicht nur das Jahr der KI, sondern auch das der KI-Regulierung. Geht es nach der EU, sollen Anwendungen etwa nach "europäischen Werten" entwickelt werden. Bei Hochrisikoanwendungen, etwa solchen, die Bewerbungen vorsortieren oder das Verhalten von Straftätern prognostizieren, sollen besondere Regeln gelten. Ein Gesetzespaket aus dem vergangenen Jahr soll nun noch einmal nachgeschärft werden.

Bis es so weit ist, bleibt die Entwicklung freilich nicht stehen. Midjourney hat kürzlich Version 4 seines Bildgenerators freigegeben. Er kennt sich nun mit vierbeinigen Tieren aus. (Georg Pichler/Philip Pramer, 15.1.2023)