Wissen

Schon mal gesehen? Jagd auf Plagiate

In vielen Laboren dürfte sich dieser Tage große Unsicherheit breitmachen. Weltweit werden sich Forscher fragen, ob auch ihre unmoralische Schummelei auffliegen und sie an den elektronischen Pranger bringen wird. Wahrscheinlich sind auch Deutsche Teil des Problems. Ursache der Ängste ist die Arbeit von Mounir Errami und Harold Garner, zwei Forscher der Universität von Texas in Dallas. Ihre Gruppe hat ein Computerprogramm geschrieben, das Ähnlichkeiten zwischen zwei Texten erkennt - und das mit großer Zuverlässigkeit. Damit lassen sich viele Tausend wissenschaftliche Studien miteinander vergleichen - schnell, automatisch, unbestechlich.

Das Ziel: Die Software eTBLAST soll Plagiate und anderen Missbrauch bei der Publikation wissenschaftlicher Arbeiten aufdecken. Wird das Programm fündig, landen die verdächtigen Studien bei einer Redaktion. Deren Mitarbeiter beurteilen die auffälligen Inhalte und klassifizieren sie - im schlimmsten Fall als Plagiat.

Nachlässige Herausgeber, unmoralische Forscher

Die bisherige Fahndung in mehreren Millionen wissenschaftlichen Texten der weltweit größten Datenbank für solche Publikationen zeigt einen beunruhigenden Trend: Die Zahl doppelter Veröffentlichungen steigt, berichten die Forscher im renommierten Journal "Nature". Um das Problem zu erfassen, gilt es zunächst, die Währung des wissenschaftlichen Erfolgs zu verstehen. Der Stellenwert eines Forschers bemisst sich - leicht zählbar, leicht nachzuschlagen und leicht verständlich - nach der Zahl seiner Publikationen. Dabei zählt einerseits, wie viele Artikel von ihm wo erschienen sind und andererseits, wie oft diese Arbeiten von Kollegen zitiert werden. Beides lässt sich aus dem "Science Citation Index" ablesen, der Datenbank des Institute for Scientific Information in Philadelphia (US-Staat Pennsylvania), das tausende Fachzeitschriften auswertet. Arbeiten in den großen Fachblättern "Nature", "Science" oder "Cell" bringen dabei besonders viele Punkte, denn sie haben einen hohen "Impact Factor", werden also besonders häufig zitiert. Weniger beachtete Spezialjournale bringen weniger Punkte, entsprechend weniger Ansehen und in der Folge weniger Geld zum Forschen, weniger Berufungen auf neue Stellen, weniger Aufstiegschancen und weniger Einkommen. Daher versuchen Forscher, ihre Resultate möglichst in den renommierten Journalen unterzubringen.

Gene und Grundrechenarten

Naturwissenschaftler beherrschen außer Genen, Teilchenstrahlen und Strömungsgleichungen natürlich auch die vier Grundrechenarten. Daraus resultiert ein nahe liegender Gedanke: Die eigenen Forschungsresultate einfach zu verdoppeln, sprich, sie in ähnlicher Form in zwei Journalen zu veröffentlichen und so die Publikationsliste aufzupeppen. Errami und Garner wollten nun wissen, wie sehr sich dieses Vorgehen bereits etabliert hat, und welche Autoren und Arbeiten betroffen sind. Und sie legen den Journalen nahe, dem Missbrauch mit Hilfe von eTBLAST künftig einen Riegel vorzuschieben. Das gleichzeitige Einreichen ähnlicher Texte bei zwei Journalen haben deren Herausgeber meist verboten, es lässt sich aber nur schwer aufdecken.

Größte Artikelsammlung

Für ihre Untersuchung ließen die Programmierer eTBLAST auf die größte biomedizinische Artikelsammlung der Welt los. Diese elektronische Kollektion namens Medline wird von der National Library of Medicine in Bethesda (US-Staat Maryland) betreut und umfasst derzeit rund 17 Millionen Artikel. Zunächst wurde eine zufällige Auswahl von 62 000 Artikeln aus zwölf Jahren vom Rechner miteinander verglichen. Nach der manuellen Durchsicht der Resultate erwiesen sich 0,04 Prozent der Studien mit verschiedenen Autoren als sehr ähnlich und damit als potenzielle Plagiate. 1,35 Prozent stammten von dem oder den gleichen Autoren. Der Anteil mag nicht signifikant erscheinen, aber hochgerechnet auf die rund 17 Millionen Artikel in Medline ergibt sich die Zahl von 7000 Plagiaten. Die potenziellen Duplikate wurden in eine neue öffentliche Datenbank namens "Dej-vu" gestellt.

70.458 auffällige Einträge

In einem zweiten Versuch nutzte die Gruppe eine Besonderheit von Medline. Die Datenbank schlägt aufgrund von Stichwörtern von sich aus für jede Studie einen weiteren, besonders nahe verwandten Artikel vor. Diese nutzte die Gruppe und ließ eTBLAST rund sieben Millionen Artikel mit deren nächstem Verwandten vergleichen. Das dauerte etwa zehn Tage und förderte weitere 70.458 sich auffällig gleichende Einträge zutage. Die US-Forscher gehen davon aus, dass sich 50.000 davon als echte Duplikate erweisen werden und stellten auch diesen Bestand in Dj-vu ein.

Beurteilung bleibt beim Menschen

Errami und Garner nehmen, so heißt es in "Nature" weiter, Kontakt zu Journalen auf, wenn sie verdächtige Paper finden. In einem Fall habe das bereits zu einer Untersuchung geführt. Vollends automatisieren lässt sich ihre Suche nicht: Es gibt auch legitime Duplikate. Dazu zählen Aktualisierungen oder Korrekturen, die Teil des normalen wissenschaftlichen Prozesses sind. Zwar könne die Suchmaschine Duplikate finden, die Beurteilung müsse aber immer einem Menschen überlassen bleiben, etwa Ethikkommissionen oder den Herausgebern der Journale, schreiben die Duplikat-Fahnder. Ohne stärkere Abschreckung, so erklären Errami und Garner, würden skrupellose Forscher weiterhin Duplikate veröffentlichen. Und sie ergänzen: "Automatische Textvergleich-Systeme werden von Oberschulen und Universitäten genutzt. Wir verlangen von unseren Kindern einen höheren Standard als von unseren Forschern."

Quelle: ntv.de, Thilo Resenhoeft, dpa

Newsletter
Ich möchte gerne Nachrichten und redaktionelle Artikel von der n-tv Nachrichtenfernsehen GmbH per E-Mail erhalten.
Nicht mehr anzeigen