Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

Marek Kowalski Uniwersytet Kardynała Stefana Wyszyńskiego w Warszawie

Podobne prezentacje


Prezentacja na temat: "Marek Kowalski Uniwersytet Kardynała Stefana Wyszyńskiego w Warszawie"— Zapis prezentacji:

1 Marek Kowalski Uniwersytet Kardynała Stefana Wyszyńskiego w Warszawie
Otwarty System Antyplagiatowy v.2.3.x Marek Kowalski Uniwersytet Kardynała Stefana Wyszyńskiego w Warszawie PREZENTACJA DLA MEDIÓW

2 Obecny kształt systemu OSA jest wynikiem współpracy pomiędzy Międzyuniwersyteckim Centrum Informatyzacji i Instytutem Podstaw Informatyki Polskiej Akademii Nauk. Postępy prac można śledzić na stronie internetowej

3 OSA nie korzysta bezpośrednio z oryginalnych tekstów lecz z map (zwanych też wektorami), które są strukturami danych przechowującymi częściową informacje o tekstach. Z bazy tych struktur nie można odtworzyć żadnego z tekstów, który posłużył do jej utworzenia. Porównanie map wystarcza do wskazania zapożyczeń między badanymi pracami z lepszą efektywnością niż porównanie oryginalnych tekstów jeden do jednego.

4 W równoległej implementacji porównanie mapy pojedynczej pracy z milionem map prac referencyjnych odbywa się w mgnieniu oka. System umożliwia dokładniejsze przyjrzenie się oryginałom prac, w odniesieniu do których stwierdził zbyt wysoki poziom podobieństwa map. Tekst badanej pracy można porównać, jeden do jednego, z oryginalnym tekstem każdej z podzbioru prac referencyjnych wyselekcjonowanych przez system na bazie podobieństwa map.

5 Testy wykazały wielką odporność systemu na wszelkie – znane jego autorom – metody kamuflażu nieuprawnionych zapożyczeń (zmiana szyku, przestawianie zdań, zastąpienie części słów ich synonimami, kompilacja z wielu źródeł, podstawienia czcionek). W aktualnej wersji system współpracuje z opracowaną przez IPI PAN bazą tekstów wyszukiwarki NEKST, obejmującą ponad ½ miliarda polskojęzycznych stron internetowych.

6 OSA ma rekomendację Polskiej Komisji Akredytacyjnej.
Docelową efektywność system osiągnie, gdy uczelniane bazy map (wektorów) prac dyplomowych zostaną połączone logicznie lub fizycznie. Porównania pomiędzy pracami tworzonymi w różnych uczelniach i zawartością zasobów Internetu pozwolą na efektywną kontrolę oryginalności prac.

7 Metody wyszukiwania zbieżności tekstów wykorzystują:
analizę częstościową, funkcje haszujące, analizę semantyczną, logikę rozmytą, wyszukiwanie podobieństw łańcuchów znaków, analizę struktury, stylometrię. ← preselekcja analiza szczegółowa ↓

8 migawki z prezentacji na żywo,
A teraz … migawki z prezentacji na żywo, czyli o tym, że lepiej zapobiegać niż leczyć.

9

10

11

12

13

14

15

16

17

18

19 Wyniki krzyżowego porównania 20 autentycznych, ale zanonimizowanych, prac dyplomowych z różnych uczelni. Poprzez PODGLĄD PRACY można się przekonać o zatrważającym rozmiarze zapożyczeń z Internetu, W zestawieniu są dwie pary prac o niemal identycznej treści (zapewne kupione). Kiedyś trafią do Centralnego Repozytorium Prac Dyplomowych …

20 Krzyżowe porównanie 44 autentycznych prac domowych z informatyki, dotyczących standardu IEEE 754.
Wyniki, w graficznej formie, prezentuje następna strona. Ich wyliczenie zajmuje … 37 sekund.

21 Każda linia, niezależnie od koloru, łączy numery prac, które mają poważne części wspólne, słowo w słowo. 21 22 23 20 24 19 25 18 26 17 27 16 28 15 29 14 30 13 31 12 32 Wszystkie prace oznaczone czarnymi numerami mają poważne części wspólne z tekstami z Internetu. 11 33 10 34 9 35 8 36 7 37 6 38 5 39 4 40 3 41 2 1 44 43 42

22 Kiedy będzie można korzystać z Ogólnopolskiego Repozytorium Pisemnych Prac Dyplomowych?
Trudno powiedzieć, bo… oficjalne informacje z OPI Na razie … system został udostępniony Polskiej Komisji Akredytacyjnej.

23 (powinna być gotowa do testów na 28.02.2015 r.)
OSA 3.0.0 (powinna być gotowa do testów na r.) Wielowątkowa wersja silnika Analiza kilku dokumentów jednocześnie Analiza jednego dokumentu w kilku wątkach Multiplatformowość Praca pod dowolnym system obsługujący JAVA 1.7, PHP 5 oraz PostgreSQL 9.x Zarządzanie kolejką prac Przegląd kolejki zleceń Możliwość zmiany priorytetów w kolejce Możliwość instalacji na klastrze Modyfikacja panelu administratora zgodnie z postulatami Uczelni

24 na razie trudno sprecyzować terminy
W perspektywie na razie trudno sprecyzować terminy Integracja z Ogólnopolskim Repozytorium Pisemnych Prac Dyplomowych postęp w tym zakresie zależy głównie od OPI; pierwsze spotkanie w sprawie dostępu do ORPPD dla systemów antyplagiatowych odbyło się w MNISW 15 stycznia br. Uruchomienie Centralnego Repozytorium Map jest to powiązane z integracją z ORPPD Uzupełnienie systemu funkcjonalnością weryfikacji prac w języku angielskim dysponujemy już lematyzatorem j. angielskiego

25 Jak skorzystać z systemu?
Droga dla uczelni w MUCI opłacić wpisowe, jeśli uczelnia nie współfinansowała projektu OSA, Droga dla uczelni spoza MUCI wystąpić o status członka stowarzyszonego MUCI, opłacić wpisowe, zainstalować produkcyjną wersję systemu i dokonywać aktualizacji, używać zgodnie z aktualną instrukcją, corocznie opłacać składkę na rzecz rozwoju projektu OSA.

26 WYSZUKIWANIA PODOBIEŃSTW DOKUMENTÓW
KONFERENCJA NARZĘDZIA, ZASTOSOWANIA I IMPLEMENTACJE METOD WYSZUKIWANIA PODOBIEŃSTW DOKUMENTÓW kwietnia 2015 r.

27 Zapraszam i dziękuję za uwagę!


Pobierz ppt "Marek Kowalski Uniwersytet Kardynała Stefana Wyszyńskiego w Warszawie"

Podobne prezentacje


Reklamy Google