Marek Kowalski Uniwersytet Kardynała Stefana Wyszyńskiego w Warszawie

Slides:



Advertisements
Podobne prezentacje
I część 1.
Advertisements

WYNIKI EGZAMINU GIMNAZJALNEGO Z JĘZYKA NOWOŻYTNEGO ROK SZKOLNY 2009/2010.
Klasyfikacja roczna w roku szkolnym 2012/2013
Znaki informacyjne.
Joanna Sawicka Wydział Nauk Ekonomicznych, Uniwersytet Warszawski
Wprowadzenie do informatyki Wykład 6
Obserwowalność System ciągły System dyskretny
Ludwik Antal - Numeryczna analiza pól elektromagnetycznych –W10
Filtracja obrazów cd. Filtracja obrazów w dziedzinie częstotliwości
Liczby pierwsze.
PROGRAM OPERACYJNY KAPITAŁ LUDZKI Priorytet III, Działanie 3.2
1 Stan rozwoju Systemu Analiz Samorządowych czerwiec 2009 Dr Tomasz Potkański Z-ca Dyrektora Biura Związku Miast Polskich Warszawa,
KONKURS WIEDZY O SZTUCE
Ksantypa2: Architektura
Systemy operacyjne Copyright, 2000 © Jerzy R. Nawrocki Wprowadzenie do informatyki.
Praca Inżynierska „Analiza i projekt aplikacji informatycznej do wspomagania wybranych zadań ośrodków sportowych” Dyplomant: Marcin Iwanicki Promotor:
UKŁADY SZEREGOWO-RÓWNOLEGŁE
Przykładowe zastosowania równania Bernoulliego i równania ciągłości przepływu 1. Pomiar ciśnienia Oznaczając S - punkt spiętrzenia (stagnacji) strugi v=0,
E-learning czy kontakt bezpośredni w szkoleniu nowych użytkowników bibliotek uczelni niepaństwowych? EFEKTYWNOŚĆ OBU FORM SZKOLENIA BIBLIOTECZNEGO W ŚWIETLE.
Klasyfikacja systemów
Transformacja Z (13.6).
Pytania konkursowe.
Tytuł prezentacji Warszawa, r..
Efektywność zdawania egzaminu zawodowego w ZSP w Bytowie w roku szkolnym 2008/2009.
Wykonawcy:Magdalena Bęczkowska Łukasz Maliszewski Piotr Kwiatek Piotr Litwiniuk Paweł Głębocki.
Ogólnopolski Konkurs Wiedzy Biblijnej Analiza wyników IV i V edycji Michał M. Stępień
Agnieszka Jankowicz-Szymańska1, Wiesław Wojtanowski1,2
Wyrażenia algebraiczne
Raport z badań termowizyjnych – RECTICEL Rys. 1a. Rozdzielnia RS14 Temperatura maksymalna 35,27 o C Rys. 1b. Rozdzielnia RS14 (wizyjny) 3.
Wykonanie: Iwona Szatkowska. Uwaga! Wszystkie opisane w instrukcji operacje oparte są o zapowiedzi oraz projekty odpowiednich ustaw i rozporządzeń. Te.
Podsumowanie działalności Zarządu Banku za okres
Kalendarz 2011 Real Madryt Autor: Bartosz Trzciński.
KALENDARZ 2011r. Autor: Alicja Chałupka klasa III a.
1 ANALIZA STANU BEZROBOCIA NA TERENIE MIASTA I GMINY GOŁAŃCZ ANALIZA STANU BEZROBOCIA NA TERENIE MIASTA I GMINY GOŁAŃCZ ZA ROK 2004 ORAZ PORÓWNANIE Z LATAMI.
Galeria zdjęć Projekt edukacyjny „Wiem, co jem” realizowany w ramach
Rozwiązania informatyczne dla przedsiębiorstw
1/34 HISTORIA BUDOWY /34 3/34 6 MAJA 2011.
WYNIKI ANKIETY PRZEPROWADZONEJ WŚRÓD DZIENNIKARZY OCENIAJĄCYCH PRACĘ DZIAŁÓW PR SPÓŁEK GRUPY PKP OPRACOWANIE: BIURO MARKETINGU I KOMUNIKACJI SPOŁECZNEJ.
KOLEKTOR ZASOBNIK 2 ZASOBNIK 1 POMPA P2 POMPA P1 30°C Zasada działanie instalacji solarnej.
ŻYWE JĘZYKI PROGRAMOWANIA LIVING IT UP WITH A LIVE PROGRAMMING LANGUAGE Sean McDirmid Ecole Polytechnique Fédérale de Lausanne (EPFL)
Analiza wpływu regulatora na jakość regulacji (1)
Analiza wpływu regulatora na jakość regulacji
Dekompozycja Kalmana systemów niesterowalnych i nieobserwowalnych
MATURA 2007 raport ZESPÓŁ SZKÓŁ I PLACÓWEK KSZTAŁCENIA ZAWODOWEGO.
Kalendarz 2011r. styczeń pn wt śr czw pt sb nd
1.
1. ŁATWOŚĆ ZADANIA (umiejętności) 2. ŁATWOŚĆ ZESTAWU ZADAŃ (ARKUSZA)
Obserwowalność i odtwarzalność
-17 Oczekiwania gospodarcze – Europa Wrzesień 2013 Wskaźnik > +20 Wskaźnik 0 a +20 Wskaźnik 0 a -20 Wskaźnik < -20 Unia Europejska ogółem: +6 Wskaźnik.
1 Jak by tu po-współpracować z innymi ? a może coś jeszcze… Word 2007.
+21 Oczekiwania gospodarcze – Europa Grudzień 2013 Wskaźnik > +20 Wskaźnik 0 do +20 Wskaźnik 0 do -20 Wskaźnik < -20 Unia Europejska ogółem: +14 Wskaźnik.
Wstępna analiza egzaminu gimnazjalnego.
EGZAMINU GIMNAZJALNEGO 2013
EcoCondens Kompakt BBK 7-22 E.
EcoCondens BBS 2,9-28 E.
W2 Modelowanie fenomenologiczne I
Projekt Badawczo- Rozwojowy realizowany na rzecz bezpieczeństwa i obronności Państwa współfinansowany ze środków Narodowego Centrum Badań i Rozwoju „MODEL.
User experience studio Użyteczna biblioteka Teraźniejszość i przyszłość informacji naukowej.
I ROK MINISTRA GIERTYCHA Warszawa, 5 maja dni Wrzesień dni, tu jesteśmy 365 dni, tu jesteśmy.
Obliczalność czyli co da się policzyć i jak Model obliczeń sieci liczące dr Kamila Barylska.
Wizerunki polityków. Zmiana postrzegania premier Kopacz po expose 1-5 października 2014 roku.
Testogranie TESTOGRANIE Bogdana Berezy.
Jak Jaś parował skarpetki Andrzej Majkowski 1 informatyka +
Treści multimedialne - kodowanie, przetwarzanie, prezentacja Odtwarzanie treści multimedialnych Andrzej Majkowski 1 informatyka +
ZOSTAŃ SPORTOWYM KOKSEM SP 11 TYM KTÓRY OCZARUJE KOMISJĘ SĘDZIOWSKĄ.
Systemy dynamiczne 2014/2015Obserwowalno ść i odtwarzalno ść  Kazimierz Duzinkiewicz, dr hab. in ż. Katedra In ż ynierii Systemów Sterowania 1 Obserwowalność.
Kalendarz 2020.
Ankieta dotycząca kart bankomatowych i kont bankowych.
Elementy geometryczne i relacje
Strategia pomiaru.
Zapis prezentacji:

Marek Kowalski Uniwersytet Kardynała Stefana Wyszyńskiego w Warszawie Otwarty System Antyplagiatowy v.2.3.x Marek Kowalski Uniwersytet Kardynała Stefana Wyszyńskiego w Warszawie PREZENTACJA DLA MEDIÓW

Obecny kształt systemu OSA jest wynikiem współpracy pomiędzy Międzyuniwersyteckim Centrum Informatyzacji i Instytutem Podstaw Informatyki Polskiej Akademii Nauk. Postępy prac można śledzić na stronie internetowej http://osaweb.pl.

OSA nie korzysta bezpośrednio z oryginalnych tekstów lecz z map (zwanych też wektorami), które są strukturami danych przechowującymi częściową informacje o tekstach. Z bazy tych struktur nie można odtworzyć żadnego z tekstów, który posłużył do jej utworzenia. Porównanie map wystarcza do wskazania zapożyczeń między badanymi pracami z lepszą efektywnością niż porównanie oryginalnych tekstów jeden do jednego.

W równoległej implementacji porównanie mapy pojedynczej pracy z milionem map prac referencyjnych odbywa się w mgnieniu oka. System umożliwia dokładniejsze przyjrzenie się oryginałom prac, w odniesieniu do których stwierdził zbyt wysoki poziom podobieństwa map. Tekst badanej pracy można porównać, jeden do jednego, z oryginalnym tekstem każdej z podzbioru prac referencyjnych wyselekcjonowanych przez system na bazie podobieństwa map.

Testy wykazały wielką odporność systemu na wszelkie – znane jego autorom – metody kamuflażu nieuprawnionych zapożyczeń (zmiana szyku, przestawianie zdań, zastąpienie części słów ich synonimami, kompilacja z wielu źródeł, podstawienia czcionek). W aktualnej wersji system współpracuje z opracowaną przez IPI PAN bazą tekstów wyszukiwarki NEKST, obejmującą ponad ½ miliarda polskojęzycznych stron internetowych.

OSA ma rekomendację Polskiej Komisji Akredytacyjnej. Docelową efektywność system osiągnie, gdy uczelniane bazy map (wektorów) prac dyplomowych zostaną połączone logicznie lub fizycznie. Porównania pomiędzy pracami tworzonymi w różnych uczelniach i zawartością zasobów Internetu pozwolą na efektywną kontrolę oryginalności prac.

Metody wyszukiwania zbieżności tekstów wykorzystują: analizę częstościową, funkcje haszujące, analizę semantyczną, logikę rozmytą, wyszukiwanie podobieństw łańcuchów znaków, analizę struktury, stylometrię. ← preselekcja analiza szczegółowa ↓

migawki z prezentacji na żywo, A teraz … migawki z prezentacji na żywo, czyli o tym, że lepiej zapobiegać niż leczyć.

Wyniki krzyżowego porównania 20 autentycznych, ale zanonimizowanych, prac dyplomowych z różnych uczelni. Poprzez PODGLĄD PRACY można się przekonać o zatrważającym rozmiarze zapożyczeń z Internetu, W zestawieniu są dwie pary prac o niemal identycznej treści (zapewne kupione). Kiedyś trafią do Centralnego Repozytorium Prac Dyplomowych …

Krzyżowe porównanie 44 autentycznych prac domowych z informatyki, dotyczących standardu IEEE 754. Wyniki, w graficznej formie, prezentuje następna strona. Ich wyliczenie zajmuje … 37 sekund.

Każda linia, niezależnie od koloru, łączy numery prac, które mają poważne części wspólne, słowo w słowo. 21 22 23 20 24 19 25 18 26 17 27 16 28 15 29 14 30 13 31 12 32 Wszystkie prace oznaczone czarnymi numerami mają poważne części wspólne z tekstami z Internetu. 11 33 10 34 9 35 8 36 7 37 6 38 5 39 4 40 3 41 2 1 44 43 42

Kiedy będzie można korzystać z Ogólnopolskiego Repozytorium Pisemnych Prac Dyplomowych? Trudno powiedzieć, bo… oficjalne informacje z OPI Na razie … system został udostępniony Polskiej Komisji Akredytacyjnej.

(powinna być gotowa do testów na 28.02.2015 r.) OSA 3.0.0 (powinna być gotowa do testów na 28.02.2015 r.) Wielowątkowa wersja silnika Analiza kilku dokumentów jednocześnie Analiza jednego dokumentu w kilku wątkach Multiplatformowość Praca pod dowolnym system obsługujący JAVA 1.7, PHP 5 oraz PostgreSQL 9.x Zarządzanie kolejką prac Przegląd kolejki zleceń Możliwość zmiany priorytetów w kolejce Możliwość instalacji na klastrze Modyfikacja panelu administratora zgodnie z postulatami Uczelni  

na razie trudno sprecyzować terminy W perspektywie na razie trudno sprecyzować terminy Integracja z Ogólnopolskim Repozytorium Pisemnych Prac Dyplomowych postęp w tym zakresie zależy głównie od OPI; pierwsze spotkanie w sprawie dostępu do ORPPD dla systemów antyplagiatowych odbyło się w MNISW 15 stycznia br. Uruchomienie Centralnego Repozytorium Map jest to powiązane z integracją z ORPPD Uzupełnienie systemu funkcjonalnością weryfikacji prac w języku angielskim dysponujemy już lematyzatorem j. angielskiego

Jak skorzystać z systemu? Droga dla uczelni w MUCI opłacić wpisowe, jeśli uczelnia nie współfinansowała projektu OSA, Droga dla uczelni spoza MUCI wystąpić o status członka stowarzyszonego MUCI, opłacić wpisowe, zainstalować produkcyjną wersję systemu i dokonywać aktualizacji, używać zgodnie z aktualną instrukcją, corocznie opłacać składkę na rzecz rozwoju projektu OSA.

WYSZUKIWANIA PODOBIEŃSTW DOKUMENTÓW KONFERENCJA NARZĘDZIA, ZASTOSOWANIA I IMPLEMENTACJE METOD WYSZUKIWANIA PODOBIEŃSTW DOKUMENTÓW 21 - 22 kwietnia 2015 r.

Zapraszam i dziękuję za uwagę! 2015-02-05