AMS-Algorithmus: Wo die Statistik aufhört, beginnt die Politik

Problematisch an der Kategorisierung der AMS-Kunden durch einen Algorithmus ist, dass an den Grenzwerten zwischen den Gruppen harte Schnitte erfolgen, die durch die Datenlage schwer zu rechtfertigen sind.

1. Das AMS bedient sich keiner Zauberei, sondern einer Standardmethode der Sozialwissenschaft

Künstliche Intelligenz, Data-Mining, maschinelles Lernen – mit der schönen neuen Welt der Computerwissenschaft hat der AMS-Algorithmus nichts zu tun. Die Methode des Arbeitsmarktservice (eine Serie von logistischen Regressionsmodellen) ist seit Jahrzehnten Standard in den Sozialwissenschaften und wird etwa an der Universität Wien regulär im Masterstudium Politikwissenschaft gelehrt. Im Prinzip handelt es sich dabei um eine mathematische Gleichung, bei der auf der linken Seite ein Wert für den Wiedereinstieg in den Arbeitsmarkt steht (1 für Erfolg, 0 für Misserfolg) und auf der rechten eine Reihe von persönlichen Merkmalen (Alter, Geschlecht, Ausbildung, berufliche Laufbahn, Staatsbürgerschaft und so weiter). Anhand von vorhandenen AMS-Daten kann man für jedes dieser Merkmale einen Koeffizienten berechnen, der angibt, wie sich dieses Merkmal auf die Chance auswirkt, innerhalb einer bestimmten Zeit wieder Arbeit zu finden. So kommt man zu der hier abgebildeten Gleichung, die eine stark simplifizierte Variante des verwendeten Modells (oder eher: der verwendeten Modelle) darstellt. Es wird sowohl die Chance auf kurzfristige (binnen sieben Monaten) als auch auf langfristige Integration (binnen zwei Jahren) in den Arbeitsmarkt berechnet.

2. Neue Fälle werden auf Basis älterer Fälle eingestuft

Die anhand existierender AMS-Klienten aufgestellten Gleichungen errechnen dann für jede neu beim AMS gemeldete Person einen Prozentwert (oder mehrere, zum Beispiel kurzfristige und langfristige Prognosen), der die Einstellungschancen beziffert. Es werden also immer Daten aus der Vergangenheit herangezogen, um für gegenwärtige AMS-Kunden Vorhersagen zu erstellen. Das ist auch gar nicht anders möglich, weil man zur Schätzung der Regressionsgleichungen die Information zu erfolgter oder nicht erfolgter Wiedereingliederung in den Arbeitsmarkt braucht.

3. Die Einstufung von AMS-Kunden in drei Gruppen ist problematisch

Alle beim AMS gemeldeten Fälle werden durch den Algorithmus in drei Kategorien einstuft: Hohe Chancen (H) hat, wem eine Wahrscheinlichkeit größer 66 Prozent vorhergesagt wird, binnen sieben Monaten 90 Beschäftigungstage vorzuweisen. Niedrige Chancen (N) hat man, wenn die vorhergesagte Wahrscheinlichkeit, binnen zweier Jahre 180 Beschäftigungstage zu erreichen, weniger als 25 Prozent beträgt. Alle anderen kommen in eine Mittelkategorie. Wichtig ist, dass diese drei Gruppen bei weitem nicht gleich groß sind. Laut diesem Dokument (Seite 15) wurden bei der Berechnung für 2018 nur vier Prozent der Fälle in die N-Gruppe eingestuft, jedoch 32 Prozent in die H-Gruppe. Die Mittelgruppe macht folgerichtig also mit 64 Prozent den Löwenanteil aller Fälle aus. Problematisch an dieser Kategorisierung ist, dass an den Grenzwerten zwischen den Gruppen harte Schnitte erfolgen (wobei AMS-Berater jede Person gemäß persönlicher Einschätzung umstufen können), die durch die Datenlage wohl schwer zu rechtfertigen sind. Eine Person mit 25 Prozent Wiedereinstiegswahrscheinlichkeit braucht wohl ähnliche AMS-Angebote wie eine mit 24 Prozent, kommt aber durch die Kategorisierung in denselben Topf wie jemand mit einem Wert von 60 Prozent.

4. Jede Prognose ist unsicher – auch bei guten Modellen

Ein weiteres Problem ist, dass jede der vorhergesagten Wahrscheinlichkeiten mit einer gewissen Unsicherheit behaftet ist. Vielleicht ist also die tatsächliche Wiedereinstiegschance einer Person mit Wert 24 Prozent nicht 24 Prozent, sondern 20, 28 oder 36 Prozent. Das verschärft das oben beschriebene Problem der Kategorisierung, weil wir nicht sicher sein können, dass die Person mit Prognose 24 Prozent tatsächlich eine (geringfügig) schlechtere Aussicht hat als jene mit 25 Prozent. Die Vorhersagekraft des Modells insgesamt liegt für die N-Gruppe (geringe Chancen auf Wiedereinstieg) bei 85 Prozent, für die H-Gruppe (hohe Chancen) bei 80 Prozent (siehe wiederum hier, Seite 15). Das sind für sozialwissenschaftliche Modelle vergleichsweise hohe Werte. Dennoch gilt: Von fünf Personen mit hoher Einstufung findet eine wider Erwarten keinen Job im anvisierten Zeitraum, während von sieben Personen mit schlechter Prognose eine wider Erwarten doch in Beschäftigung kommt (für die Mittelgruppe gibt es hier keine Zahlen). Besonders wichtig ist also, dass aus der Modellprognose keine sich selbst erfüllende Prophezeiung wird – das würde die Schwächsten besonders hart treffen.

5. Algorithmen verleiten zu strategischem Verhalten der Betroffenen

Vor allem wenn ihre Funktionsweise öffentlich bekannt ist, bieten Algorithmen Anreize für Betroffene, sich strategisch zu verhalten. Es ist nur logisch, dass AMS-Kunden danach trachten werden, eine möglichst günstige Einstufung zu erhalten (etwa wenn teurere Kurse verstärkt der Mittelgruppe angeboten werden). Viele Merkmale, mit denen der Algorithmus gefüttert wird, sind zwar nicht veränderbar (Geschlecht, Alter, Berufslaufbahn), manche aber schon. So hat etwa die AMS-Regionalstelle, bei der man vorstellig wird, einen großen Einfluss auf die Chancenberechnung (siehe Punkt 5 hier). Nicht unvorstellbar also, dass manche – so die Möglichkeit besteht – ihren Hauptwohnsitz gezielt verlegen (etwa zu Verwandten oder Bekannten), um bessere Einstufungen zu bekommen.

6. Menschen haben genauso ihre "Algorithmen"

Ein oft gehörtes Argument gegen das Verwenden von Algorithmen ist, dass diese bestehende Ungleichheiten verfestigen würden. Der AMS-Algorithmus weist etwa Frauen schlechtere Chancen zu – ganz einfach, weil Frauen etwas geringere Wiedereinstiegswahrscheinlichkeiten haben und die statistischen Modelle versuchen, diese Tatsache "korrekt" abzubilden. Frauen werden etwa im 2018er-Modell nur zu 21 Prozent in die Gruppe mit hohen Vermittlungschancen kategorisiert, Männer hingegen zu 39 Prozent (siehe wiederum hier, Seite 15). Diesem Vorwurf kann man allerdings entgegenhalten, dass Menschen ähnliche – vielleicht sogar schlimmere – Tendenzen haben. Jeder AMS-Berater wird die Arbeitsmarktchancen einer 40-jährigen alleinerziehenden Pflichtschulabgängerin mit Migrationshintergrund a priori niedriger einschätzen als die eines "hiesigen" 27-jährigen alleinstehenden HTL-Absolventen. Dabei ist die Grenze zwischen nützlichem Erfahrungswissen und hinderlichen Stereotypen fließend. Der Algorithmus birgt genauso die Gefahr, bestehende Benachteiligungen zu verfestigen, er muss diese Dinge aber explizit machen und ist daher transparenter (soweit er nicht geheim gehalten wird) und somit leichter kritisier- und änderbar.

7. Es geht weniger um den Algorithmus als darum, was man damit tut

Grundsätzlich ist es ein lobenswerter Schritt, dass das AMS versucht, die Jobchancen seiner Kunden möglichst objektiv zu bewerten. Damit schafft man eine solide Grundlage für die aktive Arbeitsmarktpolitik. Die größten Bedenken gegenüber einem solchen Algorithmus beginnen in der Regel dort, wo es heißt: Was jetzt tun damit? Kein Algorithmus kann AMS-Beratern, der AMS-Führung oder der Regierung die Entscheidungen über die Ressourcenzuweisung an einzelne Personen, bestimmte Zielgruppen oder das AMS insgesamt abnehmen. Mit anderen Worten: Dort, wo die Statistik aufhört, beginnt die Politik. (Laurenz Ennser-Jedenastik, 23.10.2018)

Blog: Standardabweichung

AMS-Algorithmus: Wo die Statistik aufhört, beginnt die Politik

Forum:

Ihre Meinung zählt.