ZMBP

Wissenschaftlich Arbeiten mit Computer und Internet

Uni Tuebingen

Kursübersicht

Im Skript suchen

Tools


Tools

Übungsfragen


Software um Plagiate zu entdecken

2011 ein an den Universitäten heiß diskutiertes Thema sind Plagiate.
Das betrifft Seminar- Hausarbeiten genauso wie in Bachelor und Doktorarbeiten.

Was sind eigentlich Plagiate?
Wie können die Plagiate erkannt werden?
Das versucht Daniel Strobel unten in seinem Artikel zu beantworten. Dazu hat er eine zugängliche Software und Google getestet.

Inzwischen wird auch an den Universitäten Software und Datenbanken zur Erkennung von Plagiaten eingesetzt. Dabei können auch frühere Hausarbeiten in eine Datenbank eingegeben werden und ermöglichen den Abgleich mit einer eingereichten Hausarbeit. Es wird also nicht nur über das Internet verglichen.
Siehe zum Beispiel Referenzliste Euphorus

"Die Nature Publishing Group, die Verlage Springer und Elsevier sowie über 3000 weitere Herausgeber und Gesellschaften nutzen etwa den Plagiat-Erkennungsdienst Crosscheck."
(Michelle Röttger in http://www.capital.de/auto_technik/:Erkennungsprogramme--So-enttarnt-Schnueffelsoftware-Plagiate/100036330.html)
Es wird daher schon beim Einreichen eines wissenschaftlichen Artikels sichergestellt, dass Plagiate erkannt werden.
Autoren können ihren wissenschaftlichen Artikel überprüfen lassen. Es wird eine Plattform vom Betreiber von crosscheck angeboten.
http://www.ithenticate.com/
Es kostet 50 USD pro Artikel in der einfachsten Lizenzvariante. Ich konnte das System daher nicht testen. Ich bin interessiert an Erfahrungsberichten.

Übersichtsartikel
http://m.ftd.de/artikel/60013559.xml?v=2.0

Prof. Dr. Debora Weber-Wulff
http://www.f4.htw-berlin.de/~weberwu/
Auf diesem Gebiet sehr aktive Wissenschaftlerin. Sie erstellt regelmässig einen Test von Plagiatssoftwareerkennungsprogrammen
Test von Plagiatssoftware
http://plagiat.htw-berlin.de/software/

Wissenschaftliches Fehlverhalten / Betrug in den Wissenschaften
http://de.wikipedia.org/wiki/Wissenschaftliches_Fehlverhalten
http://en.wikipedia.org/wiki/Scientific_misconduct


http://www.science-fraud.org/
http://retractionwatch.wordpress.com/

Meine Linksammlung
http://www.delicious.com/dibico/plagiat




Plagiate und Plagiaterkennungssoftware (PlagiarismFinder 2.0)

                                

von Daniel Strobel

15.07.2011

Plagiate

Definition

„Ein Plagiat ist die widerrechtliche Übernahme und Verbreitung von fremden Texten jeglicher Art und Form ohne Kenntlichmachung der Quelle. Dies gilt für alle Medien, d.h. Bücher, wissenschaftliche und andere Zeitschriften, Zeitungen und alle anderen Druckerzeugnisse sowie das Internet.“ (siehe http://www.uni-hannover.de/imperia/md/content/pruefungsamt/formulare/magister/02_plagiat.pdf)

Es werden verschiedene Formen des Plagiats unterschieden:

Neben der wörtlichen Übernahme einer Textstelle (Textplagiat), der nicht wortwörtlichen Wiedergabe eines Gedankengangs (Ideenplagiat) und der Verwendung in Sekundärliteratur vorkommender Zitate, ohne die Sekundärliteratur anzugeben (Zitatplagiat), spricht man auch bei übersetzten Textstellen oder Ideen eines fremdsprachigen Werkes ohne Nennung der Quelle von einem Plagiat (vgl.: http://www.uni-hannover.de/imperia/md/content/pruefungsamt/formulare/magister/02_plagiat.pdf).

Wie können Plagiate erkannt werden? Plagiaterkennungssoftware

Es gibt eine Vielzahl von Plagiaterkennungssoftware auf dem Markt, die mehr oder weniger gute Ergebnisse liefern. Die Professorin für Medieninformatik Debora Weber-Wulff der HTW Berlin testet seit 2004 regelmäßig die Qualität solcher Software und stellt die Ergebnisse im Internet zur Einsicht zur Verfügung: http://plagiat.htw-berlin.de/software/. Die Bewertung reicht von „für Lehre nutzlose Systeme“ bist zu“ teilweise nützliche Systeme“

Die besten, „teilweise nützlichen Systeme“ 2010 waren (http://plagiat.htw-berlin.de/software/2010-2/):

1. PlagAware       2. Turnitin             3. Ephorus            4. PlagScan         5. Urkund

Unter den „für Lehre nutzlosen Software-Programmen“ wurden auch einige Betrüger ausfindig gemacht (iPlagiarismCheck: verwendet die Software von Turnitin, http://plagiat.htw-berlin.de/software/2010-2/s10-20-iplagiarismcheck/; Plagiarism Detector: Installation eines Trojaners  beim Online-Download, http://plagiat.htw-berlin.de/software/2010-2/s10-19-plagiarismdetector/; PercentDupe: Laut Nutzungsbedingungen kann der eingereichte Text „in jeder gewünschten Weise“ von der Firma verwendet werden; siehe http://plagiat.htw-berlin.de/software/2010-2/s10-47-percentdupe/).



PlagiarismFinder 2.0 (http://www.plagiarismfinder.de/)

PlagiarismFinder 2.0 ist das neuste Produkt der deutschen Firma Mediaphor Software Entertainment AG. Neben einer 30-Tage-Testversion (http://www.plagiarismfinder.de/produkte/download) werden zwei verschiedene Vollversionen angeboten (CD-ROM: 149 €, Aktivierung notwendig (nur 1 Lizenz); USB-Stick: 299 €, keine Aktivierung und Installation notwendig (mobile Version für mehrere Personen)). 



Funktionsumfang (http://www.plagiarismfinder.de/produkte/features)

Die Plagiaterkennungssoftware durchsucht mithilfe von Suchmaschinen (Google oder Yahoo; http://www.sueddeutsche.de/wissen/plagiate-aus-dem-netz-fremde-federn-ausrupfen-1.912737)   Online-Datenbanken und vergleicht damit den zu untersuchenden Text (mit einer Länge von bis zu 1000 Seiten). Dabei werden immer Sequenzen von fünf bis sieben Wörtern aus dem zu untersuchenden Text in die Suchmaschine eingegeben und ein Bericht erstellt.

In dem Analysebericht sind die untersuchten Textstellen unterschiedlich farblich markiert, je nachdem, ob eine Übereinstimmung vorliegt oder nicht. Neben der Darstellung der Internetquellen von Dokumenten mit übereinstimmenden Textstellen wird auch der Grad der Übereinstimmung angegeben und aufgrund der Übereinstimmung ein Urteil für die Wahrscheinlichkeit eines Plagiates abgegeben.

Weitere Funktionen

-       Erkennung einer Vielzahl von (Text-)Formaten (doc(x), ppt(x), xls(x), rtf, txt, htm(l)) und Pdf-Dateien.

-       Text aus der Zwischenablage kann einfach (Copy & Paste) eingefügt werden

-       Automatische Erkennung der im Text verwendeten Sprache

-       Zu untersuchender Text wird nicht online zwischengespeichert



Software-Test

Plagiaterkennungstest eines Wikipediaartikels und zweier Textstellen, die wörtlich aus zwei verschiedenen Paper übernommen wurden mithilfe der Plagiatsoftware PlagiarismFinder 2.0 und mit Google:

Originaltext verändert? Wortanzahl PlagiarismFinder (Plagiat erkannt?) Übereinstimmung (%) Google
(mehrere Wörter)
Google
(einzelne Fachwörter)
nein (original) 162 ja 32,26: Es handelt sich sicher um ein Plagiat ja ja 
nein (aber nur einen Satz übernommen; 40 Wörter) 147 ja (Satzlänge 5) (/ nein (Satzlänge 6)) 13,79: Es handelt sich wahrscheinlich um ein Plagiat  ja (wenn richtige Textstelle ausgewählt) ja (wenn richtige Textstelle ausgewählt)
ja (einzelne Synonyme verwendet) 156 ja 12: Es handelt sich wahrscheinlich um ein Plagiat ja  ja 
ja (viele Synonyme verwendet) 160 jein (aber: Quelle wurde gefunden) 7,69: Es handelt sich wahrscheinlich nicht um ein Plagiat jein (je nachdem, wie stark der Satz verändert wurde ja 
ja (sinngemäß; Satzgefüge verändert) 123 nein (bei Satzlänge 5 und 6) 4,17: Es handelt sich sehr wahrscheinlich nicht um ein Plagiat ja (nach mehrmaligem Suchen) ja (nach mehrmaligem Suchen)
nein (original): PDF (Pubmed)   nein 4,17: Es handelt sich sehr wahrscheinlich nicht um ein Plagiat ja -
nein (original): PDF (JournalOfVirology)   ja 44,12: Es handelt sich sicher um ein Plagiat ja -



-       die Plagiatsoftware erkennt zwar nicht alle Stellen (immer nur 6 Wörter), zeigt jedoch übereinstimmende Internetquellen an, mit denen Texte verglichen werden können

-       es gab auch vereinzelt Fehlprognosen: a) Plagiat nicht erkannt, sobald einige Wörter ersetzt wurden; b) Plagiat scheinbar erkannt (obwohl keines): bei Verwendung von Standardformulierungen

Google

Gute Trefferquote durch spezifisch ausgewählte Fachausdrücke. Entgegen der Erwartung wurden auch Textstellen aus zwei wissenschaftlichen Publikationen erkannt. Ein Problem von Google ist jedoch, dass einige (wissenschaftliche) Datenbanken noch nicht in die Suche integriert werden, da diese nicht frei zugänglich sind.  

Fazit

Derzeitige Software ist zum Erkennen von Plagiaten nur eingeschränkt hilfreich. Schon geringfügige Veränderungen des Originaltextes bewirkten eine deutliche Verschlechterung der Trefferquote. Bis jetzt werden immer noch Menschen gebraucht, die die Ergebnisse auswerten und die scheinbar plagiierten Textstellen überprüfen. (Vermeidung von falsch-positiven/ falsch-negativen Ergebnissen.)

Vor allem, wenn nur sinngemäß Text übernommen wird, erkennt die (getestete) Software dies nicht. Außerdem können nur Texte verglichen werden, die im Internet vorhanden und frei zugänglich sind und somit über Suchmaschinen angesprochen werden können.

->  Gutachter sind (bis jetzt) noch nicht wegzudenken.

Internetseiten zu Plagiate

Im Internet haben sich einige Websites (GuttenPlag Wiki, http://de.guttenplag.wikia.com/wiki/GuttenPlag_Wiki; VroniPlag Wiki, http://de.vroniplag.wikia.com/wiki/Home) entwickelt, die es sich zum Ziel gemacht haben, Plagiate durch Kooperation vieler (anonymer) Gutachter ausfindig zu machen. Bis jetzt wurden schon einige Politiker überführt. Die Darstellung der Ergebnisse (Seiten, die Plagiate enthalten) werden in Form eines Barcodes angezeigt (http://images.wikia.com/guttenplag/de/images/1/1f/Barcode_zeilen.png).


Weitere Infos

Dieter Steinmetz

Das Ziel ein „Plagiatfreies Deutschland“ verfolgt die Vereinigung Profnet, Vorsitzender Prof. Uwe Kamenz.

Webseite http://www.profnet.de

Presseerklärung http://www.profnet.de/dokumente/2011/Web-HS-Presse-111.pdf
Jeder Bundestagsabgeordneter wurde aufgefordert seine Dissertation zur Überprüfung bei Profnet einzureichen.
Einige Abgeordnete sind dem nachgekommen.
Auch jeder Mitarbeiter einer angeschlossenen Universität kann seine Disertation einreichen und überprüfen lasse. Es wird eine eigene Software(?) benutzt. Bei bestandener Prüfung wird ein "Zertifikat" ausgestellt.
Zur besseren Überprüfung wurde ein Bücherscanner besorgt, der auch die nicht digitalisierte Literatur erfasst.
Südwest-Presse online 1.3.12
Was ist ein Plagiat
Annette Schavan - Gedanken früherer Autoren nicht kenntlich gemacht
Heise Online 3.5.12 - http://www.heise.de/newsticker/meldung/Schavan-wehrt-sich-gegen-anonyme-Plagiatsvorwuerfe-1566143.html
Maßnahmen an den Berliner Unis
Heise Online 7.4.13 - http://www.heise.de/newsticker/meldung/Schutz-vor-Plagiaten-Berliner-Unis-wollen-Betrug-vorbeugen-1836607.html


Dieter Steinmetz, Universität Tübingen, ZMBP - Kursübersicht - Im Skript suchen