Kleiner Mann mit Lupe steht in einem riesigen Buch
Auf der Suche nach Plagiaten in wissenschaftlichen Arbeiten helfen keine Männchen mit Lupen, sondern Software.
Getty Images

Wenn von Plagiaten die Rede ist, kommt man an Plagiatssoftware nicht vorbei. Doch was macht diese Software eigentlich genau, und welche Rolle spielt sie bei der Entdeckung von Plagiaten? Der Platzhirsch auf dem Gebiet der akademischen Plagiatsprüfung ist die 1997 entwickelte Software Turnitin. Der Name ist Programm: "Turn it in" ist Englisch für "Reiche es ein". Ironischerweise kann "to turn in" aber auch im Zusammenhang mit "sich stellen" oder "jemanden ausliefern" verwendet werden. Ebenfalls von Turnitin wird der Dienst Ithenticate angeboten, der vor allem zur Plagiatserkennung im Forschungsbereich und bei Fachjournalen zum Einsatz kommt.

Auch in Österreich stellen Turnitin und Ithenticate die am meisten verbreiteten Plagiatssoftwaresysteme, wie aus einer Überblicksstudie zu Plagiatsprävention und -prüfung an österreichischen Universitäten und Hochschulen hervorgeht, die 2021 vom IHS im Auftrag des Wissenschaftsministeriums erstellt wurde. Wie die Plagiatsprüfung abläuft, ist nicht zentral organisiert, sondern liegt in der autonomen Handhabe der Hochschulen.

Die Universität Wien als größte heimische Uni etwa prüft seit 2008 per Software jede eingereichte Abschlussarbeit, also Diplom-, Master- und Doktorarbeiten, auf Textgleichheit. Im Einsatz sind dabei Ithenticate und zusätzlich die Software Docoloc, wie Studienpräses Peter Lieberzeit von der Uni Wien im Gespräch mit dem STANDARD schildert. "Wir arbeiten mit zwei Anbietern, um die Chance zu verringern, dass man etwas übersieht, und andererseits, um ein Backup zu haben, falls eine Software aus irgendwelchen Gründen ausfällt", sagt Lieberzeit.

Die Abschlussarbeiten durchlaufen zunächst einen automatisierten Workflow: Die Studierenden laden sie hoch, dann werden sie anonymisiert an die Softwarefirma übermittelt, wo sie mit dem Textkorpus in ihren Datenbanken verglichen werden. Nach Angaben von Turnitin umfasst die Datenbank Milliarden an aktuellen und archivierten Webseiten und Dokumenten aus Zeitschriften sowie die bereits eingereichten Arbeiten. Ithenticate hat zusätzlich einen Fokus auf wissenschaftliche Literatur.

Maschine und Mensch

"Man kann eine Mindestlänge der Wortfolgen einstellen, die verglichen werden. Bei uns sind das fünf oder sechs Wörter, und das funktioniert erstaunlich gut, wenn es um die Übernahme von Texten und leichte Paraphrasierungen geht", sagt Lieberzeit. Am Ende spuckt die Plagiatssoftware einen Prozentsatz zur textlichen Übereinstimmung aus. Diese Zahl alleine sage aber noch nicht viel aus, betont Lieberzeit. Denn darin enthalten sind natürlich auch wörtliche Zitate und Paraphrasierungen, also nicht wörtlich übernommene Passagen, die korrekt zitiert und gekennzeichnet sind.

"Ich habe schon Arbeiten mit 20 Prozent Übereinstimmungen gesehen, die problematisch waren, und solche mit 70 bis 80 Prozent, die kein Problem waren", sagt Lieberzeit. Gerade bei kumulativen Arbeiten, die den Forschungsstand in einem Gebiet zusammenfassen, oder bei naturwissenschaftlichen Arbeiten, bei denen beispielsweise typische Versuchsanordnungen dargelegt werden, die nicht "erkenntnisprägend" sind, seien größere Überschneidungen durchaus möglich. Deshalb landen die Arbeiten in einem zweiten Schritt immer bei einer fachkundigen Person, an der Uni Wien üblicherweise bei der zuständigen Studienprogrammleitung. Dann wird überprüft, ob ein Plagiat vorliegt, ob vorsätzlich geschummelt wurde, und ob die Arbeit im Fall eines Plagiats korrigiert werden darf oder zurückgewiesen wird.

Diese Abgrenzungen bedürfen eines gewissen Fingerspitzengefühls und Einschätzungsvermögens, räumt Lieberzeit ein. "Oft ist es nicht einfach zu unterscheiden, ob es sich um qualitativ schlechtes Arbeiten und Schlamperei oder um ein vorsätzliches Plagiat handelt", sagt der Studienpräses. "Darum ist es wichtig, dass die Überprüfung nicht rein maschinenbasiert läuft, sondern sich Menschen mit ihrer Fachexpertise die von der Software erstellten Berichte ansehen." Gerade in textbasierten Wissenschaften gehe es um korrekte Quellenangaben und wissenschaftliche Sauberkeit.

Was ändert ChatGPT?

Apropos textbasiert: Generative KI-Systeme wie ChatGPT, die Texte beliebig zusammenwürfeln, abstrahieren und vor allem schreiben können, stellen das gesamte Bildungssystem, das zu einem guten Teil auf schriftlichen Arbeiten fußt, vor – gelinde gesagt – große Herausforderungen. "Das bedeutet für uns, dass das Generieren des Textes und die Betreuung des Prozesses im Vergleich zum Endergebnis noch wichtiger werden", sagt Lieberzeit. Sollte etwas in der Arbeit verdächtig erscheinen oder sich der Text stark vom mündlichen Ausdruck und der Mitarbeit während des Studiums unterscheiden, gibt es schon jetzt den sogenannten Plausibilitätscheck. "Dabei wird in einem direkten Gespräch abgeklopft, ob die Person überhaupt weiß, was in dem Text steht."

Den Einsatz von KI-Sprachmodellen an den Unis zu verbieten hält Lieberzeit nicht für sinnvoll. "Es ist eine technische Realität. Das ist eine ähnliche Revolution, wie es Wikipedia für die Literaturbeschaffung war." Es gehe nun darum, die Lehrenden zu sensibilisieren, KI-generierte Texte zu erkennen und zu diskutieren, was eine zulässige und was eine nicht zulässige Anwendung von KI-Tools im jeweiligen Fach sein könnte. Fest steht nur, dass von ChatGPT erstellte Texte keine Plagiate sind, sondern unter Ghostwriting fallen – was allerdings dieselben Konsequenzen wie ein Plagiat nach sich zieht, sofern es auffliegen sollte.

Turnitin wie auch andere Firmen haben zwar bereits KI-Detektoren gelauncht, die angeblich erkennen, mit welcher Wahrscheinlichkeit ein Text von einer KI geschrieben wurde. Doch ebenso findet man schon Softwaretools, die anpreisen, die KI-Erkennung von Turnitin umgehen zu können. Die technologische Entwicklung einzuholen erscheint also aussichtslos. Da ist es noch besser, die Verwendung von ChatGPT und Co offen zu deklarieren. Die Harvard Library, Instanz für gute wissenschaftliche Praxis, hat dazu bereits Zitierregeln vorgeschlagen. Letztlich laufe es aber darauf hinaus, dass Abschlussarbeiten intensiver begleitet werden müssen, meint Peter Lieberzeit. "Das ist das Extra der Präsenzuniversität. Man lernt die Personen kennen, mit denen man arbeitet. Am Ende des Tages ist es der Mensch, der sich am besten ein Bild machen kann."

Anderes Interesse als Plagiatsjäger

Ob es sich nun um Täuschung, Ghostwriting oder um ein Plagiat handelt: Stellt sich heraus, dass vorsätzlich abgeschrieben, gefälscht oder auf unlautere Hilfsmittel zurückgegriffen wurde, wird die Arbeit mit einem Nicht Genügend beurteilt, und die betroffene Person muss sich ein neues Thema und eine neue Betreuung suchen. Die meisten Plagiatsverdachtsfälle, die auf seinem Schreibtisch landen, beträfen allerdings Dissertationen und andere Abschlussarbeiten aus der Vergangenheit, also aus der Zeit vor der automatisierten Prüfung, sagt Studienpräses Lieberzeit.

Laut Statistik der Universität Wien gab es seit dem Wintersemester 2005/06 60 Verfahren, davon mündeten bisher 33 darin, dass die Arbeit für nichtig erklärt wurde, 27 akademische Grade wurden aberkannt. Einige Verfahren sind derzeit noch anhängig. Zum Vergleich: Pro Jahr werden rund 4.500 Abschlussarbeiten (ohne Bachelorarbeiten) an der Uni Wien eingereicht. Genaue Zahlen darüber, wie viele Plagiate österreichweit entdeckt werden, gibt es nicht. Die Einführung einer Verjährungsfrist hat sich bisher nicht durchgesetzt – auch wenn sich der Verband der Universitätsprofessoren und -professorinnen zuletzt wieder dafür ausgesprochen hat.

Öffentliche Diskussionen über Plagiatsverdachtsfälle prominenter Personen sieht Lieberzeit in dem Sinne positiv, als dass damit ein Bewusstsein geschaffen wurde, dass Copy & Paste kein Kavaliersdelikt ist. Private Plagiatsjäger, die etwa mithilfe der Plattform Vroniplag Dissertationen von Personen vornehmlich aus der Politik überprüfen, hätten aber andere Intentionen als die Plagiatsprüfer an den Hochschulen. "Wir sind nicht an der Öffentlichkeit im Einzelfall interessiert", sagt Lieberzeit. "Wir sind verpflichtet, ein ordentliches Verfahren zu führen und auch den Persönlichkeitsschutz zu wahren. Wir haben ein rein sachliches Interesse." (Karin Krichmayr, 13.3.2024)