Nowe prawo ZMUSZA uczelnie do walki z plagiatami. Jakie sztuczki stosują studenci?

Od października zeszłego roku wszystkie uczelnie muszą korzystać z systemów antyplagiatowych. Tymczasem wykrywalność nadużywania "zapożyczeń" wciąż jest niska, bo studenci znają swoje sztuczki. Na przykład... dodatkowe spacje. Jakie jeszcze?

Polskie uczelnie są zobligowane przepisami prawa do zwalczania plagiatów. Oznacza to, że każda praca, może zostać sprawdzona pod kątem jej oryginalności. W założeniu jeśli student "pożyczy" sobie całe strony, akapity z innej pracy oprogramowanie to wychwyci. Jak to zwykle jednak bywa diabeł tkwi w szczegółach. Po pierwsze: systemy antyplagiatowe działają z różną skutecznością, a studenci znają sztuczki na ich oszukanie.

Różne systemy - różna wykrywalność

Analizy funkcjonujących w Polsce systemów antyplagiatowych podjął się profesor Tadeusz Grabiński z Uniwersytetu Ekonomicznego w Krakowie. W swoim raporcie informuje, że w Polsce dostępnych jest kilka systemów.  Uczelnie mogą korzystać z Plagiat.pl, Otwartego Systemu Antyplagiatowego (OSA), Podkarpackiej Platformy Antyplagiatowej (PPA) i Genuino. Nikt wcześniej nie próbował ocenić skuteczności poszczególnych systemów, okazuje się tymczasem, że każdy cechuje się inną "wykrywalnością" plagiatów

Sztuczki studentów

Studenci zdają sobie sprawę z funkcjonowania systemów antyplagiatowych, dlatego niektórzy próbują je przechytrzyć. Stosują kilka sztuczek: wstawiają dodatkowe spacje między słowami, wstawiają znaki pochodzące z innych alfabetów, znaki formatujące tekst. Zmieniają też szyk zdań, stosują synonimy.

"Aby oszukać system i osiągnąć współczynnik podobieństwa 0 proc. dla tego samego tekstu wystarczyło podmienić litery: a, c, e, i, j, o, p na ich graficzne odpowiedniki w cyrylicy." - wyjaśniała Gazeta w swoim materiale o problemach z systemami antyplagiatowymi.

Fora internetowe są pełne wskazówek jak takie systemy oszukać.

"Te programy działają na zasadzie że wrzucają zdania w Google więc wystarczy zmienić początek każdego zdania lub nawet wyrazy albo na lub itp i już program nie wykryje zdania jako plagiat".

Na innym forum czytamy:

Białe znaki są sposobem, ale są do szybkiego wyłapania i mogą Ci w zasadzie kazać napisać pracę od nowa (pozbyć się tych znaków)...najwięcej wartości do plagiatu dają 4 i więcej wyrazów obok siebie - nie umieszczonych w cudzysłowie [...] Jeden z najprostszych sposobów to szyk przestawny. 10% plagiat nie dopuszcza pracy, oczywiście są wyjątki"

Jak wykryć plagiat?

Idealne narzędzie antyplagiatowe potrafi wychwycić wszystkie powyższe niuanse w tekście i pomimo zastosowania "sztuczek" odkryć, że fragment danej pracy nie jest stworzony przez studenta. Zadanie nie jest łatwe, czego dowodzą dwa poniższe cytaty.

Oryginał:

"Poświęcenie czasu temu problemowi wydaje się interesujące a także niezbędne w kwestii podążania przedsiębiorstw do uzyskania jak najlepszych wyników".

Zapożyczenie

"Wgłębienie się w tę problematykę wydaje się być ciekawe. A także niezbędne w zagadnieniu podążania firm w zakresie osiągania wyników".

Powyższe zdania posłużyły za próbę dla systemów antyplagiatowych. Każdy z nich inaczej ocenił stopień plagiatu.

"System Plagiat.pl nie zauważył oszustwa, podczas gdy system Genuino wykrył bardzo wysoki konflikt semantyczny. Całą pracę z tym zdaniem Plagiat.pl określił na 12,3 proc. zapożyczeń. Genuino potraktował jako w plagiat w 100 proc. Lepiej wypadł w teście system OSA. Nie wykrył co prawda zmian w szyku zdań, synonimy i mikrospacje przeszły też bez zauważenia. Za to OSA nie dała się nabrać na podstawione obce litery i wykryła fragment w całości skopiowany. W całej pracy OSA określiła stopień podobieństwa na poziomie 74 proc. - czyli wysoki. Genuino dało się zwieść tylko w części z białymi znakami - uznało podobieństwo na poziomie 83 proc. Pozostałe oszustwa w tym fragmencie Genuino wykryło. Natomiast Podkarpacka Platforma Antyplagiatowa zaakceptowała dosłowny fragment z własnego zbioru bez zastrzeżeń i cienia podejrzenia o plagiat." - pisze w swoim raporcie profesor Grabiński.

Analiza porównawcza nie może jednak odbyć się bez dostępu oprogramowania do bazy danych. Tymczasem nie dysponujemy ogólnopolską bazą zawierającą wszystkie place dyplomowe.

Profesor Grabiński zwraca uwagę na system Genuino, który jako jedyny z dostępnych systemów wskazuje na skalę manipulacji dokonanej w pracy. Wyłapuje przy tym sztuczki takie jak dodatkowe spacje czy znaki pochodzące z innych języków. System ten wyświetla też listę źródeł, z których pochodzą zapożyczone informacje. Technika pisania pracy polegająca na kompilowaniu kilku źródeł jest przez system łatwo identyfikowana.

Wiele do zrobienia

System zwalczania plagiatów w Polsce jest mocno niedopracowany. Najwyższa Izba Kontroli w swoim raporcie z 2014 roku określiła to nawet znacznie dosadniej.

"Wykorzystywane przez uczelnie wyższe do weryfikacji prac dyplomowych komputerowe programy antyplagiatowe okazały się mało przydatne i nieskuteczne. Programy można łatwo oszukać, nie wykrywają nawet prymitywnych zapożyczeń z popularnych portali, a rezultaty ich pracy są nieporównywalne pomiędzy uczelniami"

Wykrywaniu plagiatów nie pomaga brak jednorodnej bazy danych prac dyplomowych ani niezwykle zróżnicowane działanie algorytmów. Jedne ten sam tekst uznają za plagiat, inne nie. Dlatego idealnym rozwiązaniem byłoby stworzenie systemu, który potrafi wskazać ile w danej pracy jest oryginalnej myśli autora. Potrzebne byłyby też osobne narzędzia dostosowane do różnych dziedzin  nauki - pracy z zakresu matematyki nie sposób badać w ten sam sposób jak pracę z zakresu biologii czy historii.

Więcej o: