ChatGPT ist ein schlechter Kinderarzt

Kinderärztin mit Patientin — Menschliche Kinderärztinnen und -ärzte können Zusammenhänge teils besser herstellen als die KI.

Nimmt künstliche Intelligenz (KI) uns unsere Jobs weg? Zumindest Kinderärztinnen und -ärzte können in dieser Hinsicht noch entspannt sein, wie das Tech-Portal "Ars Technica" mit Bezug auf eine im Fachmedium "JAMA Pediatrics" veröffentlichte Studie berichtet. Hatte KI-Bot ChatGPT bei einer Studie im vergangenen Jahr mit einer Erfolgsquote von 39 Prozent bereits schlecht abgeschnitten, wenn es um medizinisch komplexere Fälle ging, so fiel das Ergebnis in Bezug auf Kinderkrankheiten noch schlechter aus: Hier lag die Erfolgsquote bei nur 17 Prozent.

83 Prozent unnütze Diagnosen

In dem besagten medizinischen Fachjournal werden regelmäßig Fälle aus kinderärztlichen Praxen vorgestellt, welche die Leserinnen und Leser lösen können. ChatGPT wurde aufgefordert, 100 dieser zwischen 2013 und 2023 publizierten Aufgaben zu lösen. Die Studienautoren kopierten zu diesem Zweck die Aufgabe als Prompt in das ChatGPT-Eingabefeld. Zum Einsatz kam dabei GPT-4, also das aktuellste und fortschrittlichste KI-Modell des ChatGPT-Anbieters OpenAI.

Die Ergebnisse wurden in "Wahr", "Falsch" und "Hatte die Diagnose nicht voll erfasst" unterteilt. Im letzten Fall lieferte ChatGPT eine Diagnose, die aber zu breit oder unspezifisch war, um als richtig zu gelten. Insgesamt lag der Bot in 17 Fällen richtig, in 72 Prozent komplett falsch und in elf Fällen war die Diagnose zu breit gefasst. Von den somit 83 faktisch unnützen Diagnosen schaffte es ChatGPT in 57 Prozent der Fälle, das Problem wenigstens im korrekten Organsystem zu verorten.

Der KI fehlt die menschliche Qualität

Doch warum ist selbst das fortschrittlichste KI-Modell von Open AI, GPT-4, noch nicht bereit für die Behandlung von Kinderkrankheiten? Den Grund sehen die Autoren der Studie, Forscher des Cohen Children's Medical Center in New York, in den Besonderheiten der kinderärztlichen Tätigkeit. Denn im Vergleich zu anderen Patienten spielt hier das Alter der erkrankten Person eine große Rolle, um Symptome korrekt zu deuten. Hinzu kommt, was viele Eltern wissen: Gerade Kleinkinder tun sich oft schwer damit, Symptome korrekt zu beschreiben.

Die Forscher stellten somit fest, dass ChatGPT manche Zusammenhänge nicht herstellen konnte, mit denen ein menschlicher Arzt keine Probleme gehabt hätte. Dazu gehört etwa das Erkennen eines Zusammenhangs zwischen Autismus und Vitaminmangel, heißt es in dem Beitrag: Neuropsychiatrische Erkrankungen könnten häufig zu ungewöhnlichen Ernährungsweisen führen, was wiederum zu Vitaminmangel führen kann. Somit gelten diese Erkrankungen als mögliche Ursache für Vitaminmangel in entwickelten Ländern, weshalb erfahrene Kinderärzte oft gezielt danach suchen. ChatGPT hingegen diagnostizierte eine Autoimmunerkrankung.

KI hat trotzdem Potenzial

Auch wenn der Chatbot in diesem Test versagt hat, so sehen die Forscher Potenzial, denn immerhin wird KI in anderen medizinischen Bereichen bereits erfolgreich eingesetzt, von administrativen Aufgaben bis zur Interpretation von Röntgenbildern. Spezifisch für den Einsatz zur Diagnose von Kinderkrankheiten empfehlen die Forscher, die KI gezielt mit korrekter und vertrauenswürdiger medizinischer Fachliteratur zu trainieren. Zudem könnte die Genauigkeit der Modelle verbessert werden, wenn sie in Echtzeit auf medizinische Daten zugreifen können. (red, 5.1.2024)

Hohe Fehlerquote

ChatGPT ist ein schlechter Kinderarzt

83 Prozent unnütze Diagnosen

Der KI fehlt die menschliche Qualität

KI hat trotzdem Potenzial

Forum: 62 Postings

Ihre Meinung zählt.