P LAGIATY Mid-Point presentation
O RGANIZACJA PRACY SCRUM w wersji studenckiej Weekly Scrum + Assembla Sprinty Podział pracy na małe zadania Wspólne szacowanie czasu wykonania Samodzielny wybór zadań przez członków zespoł
O RGANIZACJA PRACY – PRAKTYKI INNE Osoby, a odpowiedzialności Extreme programming i algorytmiczne burze mózgów Ciągły kontakt i bieżące rozwiązywanie problemów Test Driven Development
U LUBIONE NARZĘDZIA SVN Messages, Files, Dashboard Mail / Telefon / GG
N ARZĘDZIA - NIEWYPAŁ Stand – Up Google Wave
N APOTKANE PROBLEM - RYZYKA Brak czasu Problemy współpracy Problemy z szacowaniem
O BSERWACJE - WNIOSKI Krótkie zadania vs. duże odpowiedzialności Spotkania face-to-face vs. Assembla Ograniczenie formalności do minimum Problem ze sztywnymi ramami czasowymi
P LAGIATY – DOTYCHCZASOWE OSIĄGNIĘCIA Zapewnienie natywności aplikacji – instalatory Wstępna wersja GUI Algorytm porównywania dwóch plików Słowa kluczowe Opracowanie bazy prac
P LAGIATY – A PLIKACJA NATYWNA, INSTALACJA JAVY Instalacja krok po kroku
P LAGIATY – INSTALACJA ZAKOŃCZONA SUKCESEM
P LAGIATY – PORÓWNYWANIE DWÓCH PLIKÓW Podział tekstu na porównywalne fragmenty Zapewnienie podobnej struktury i długości tekstu Minimalizacja wpływu podziału na ocenę podobieństwa Ustalenie podobieństwa fragmentów Odległość levenshteina Odległość levenshteina w programach Sprowadzenie nazw zmiennych do jednej formy Usunięcie komentarzy
P ORÓWNYWANIE DWÓCH PLIKÓW - PRZYKŁAD Tekst oryginalny Fryderyk Nietzsche urodził się w 1844 roku, żył do 1900 roku, wychowywał się w saksońskim mieście Rocken, jego ojciec był pastorem, tak więc Nietzsche został wychowany w atmosferze religijnej opartej zapewne na autorytecie ojca. Plagiat Fryderyk Nietzsche ( ), filozof, filolog klasyczny, pisarz i poeta. Wychowywal się w saksońskim miescie Rocken. Jego ojciec był pastorem, toteż Nietzsche zostal wychowawny w atmosferze religijnej, opartej zapewne na autorytecie ojca. Wynik 74%
S ŁOWA KLUCZOWE Wstępna obróbka dokumentu: Stop-lista – usunięcie zbędnych wyrazów Stemming – sprowadzenie do formy podstawowej Thesaurius – nadrzędność treści nad formą Dwa algorytmy wyboru słów kluczowych Wersja podstawowa: słowa kluczowe wg. ilości wystąpień wyrazów w dokumencie Wersja zaawansowana: słowa kluczowe wg. ilości wystąpień wyrazów w dokumencie oraz ich rankingu
R ANKING WYRAZÓW Mniej popularne słowa – łatwiej rozpoznawalne Ranking słów na podstawie dokumentów w Internecie: Pająk zbierający dokumenty Wstępna obróbka dokumentu Zliczanie wystąpień wyrazów Tworzenie bazy – rankingu słów Efekt – ignorowanie słów często powtarzalnych oraz popularnych, większa waga słów charakterystycznych Słowa kluczowe: słowa ważne wg. rankingu i możliwie często występujące w dokumencie
W YSZUKIWANIE ŹRÓDEŁ POTENCJALNEGO PLAGIATU Mniej popularne słowa – łatwiej rozpoznawalne Ranking słów na podstawie dokumentów w Internecie: Pająk zbierający dokumenty Wstępna obróbka dokumentu Zliczanie wystąpień wyrazów Tworzenie bazy – rankingu słów Efekt – ignorowanie słów często powtarzalnych oraz popularnych, większa waga słów charakterystycznych Słowa kluczowe: słowa ważne wg. rankingu i możliwie często występujące w dokumencie
P LAGIATY – B AZA PRAC Struktura bazy
P LAGIATY – BAZA PRAC Opis bazy Plik database.xml: Nazwa pliku Data dodania Ścieżka Słowa kluczowe Rozszerzenie Długość
P LAGIATY – BAZA PRAC Interfejs Klasa DatabaseSearcher: Tworzenie obiektów na podstawie database.xml Interfejs do komunikacji z bazą: Dodawanie dokumentów Przeszukiwanie bazy Wyciąganie zawartości dokumentów