Autorzy : Bartosz Rybicki, Paweł Ślusarczyk. Motywacje  Problemy: Różne formy danych tego samego pola (nazwa województwa w formie pełnej, bądź skrótowej)

Slides:



Advertisements
Podobne prezentacje
Ewa Skrenty Uczelniane Centrum Informatyczne UMK
Advertisements

Projektowanie systemowe
Projektowanie w cyklu życia oprogramowania
OiZPI Część 5 narzędzia CASE w materiałach wykorzystano:
Wykonawca główny: Włoska Agencja Narodowa Wykonawcy współuczestniczący: Austriacka Agencja Narodowa Grecka Agencja Narodowa Polska Agencja Narodowa Idea.
1 / 47 WARSZAWA 2005 Przemysław Siekierko Stanisław Andraszek Rational Unified Process.
Referat 3. Planowanie zadań i metody ich obrazowania
Willy Aastrup, Centre Director Czy dysleksja jest wyzwaniem dla uczelni wyższych? Konferencja, Kraków października 2009 r. Willy Aastrup Dyrektor.
Programowanie Obiektowe w Javie (c.d.)
Architektura systemu Gra strategiczna „Strusia Jama”
Dokumentowanie wymagań w języku XML
WekaSQL Język i aplikacja przetwarzania oraz eksploracji danych.
Autorzy : Bartosz Rybicki, Paweł Ślusarczyk. Motywacje Problemy: Różne formy danych tego samego pola (nazwa województwa w formie pełnej, bądź skrótowej)
PROTEIN MODEL PLATFORM WEBMOBIS Krzysztof Gapiński Marcin Różański Paweł Ślusarczyk Magdalena Ziębińska Promotor: dr inż. Piotr Łukasiak.
Internetowy System Informacyjny POZ
C.a.R.Metal czyli Cyrkiel i Linijka
Rynek tłumaczeń i lokalizacji w Polsce, Wrocław marca 2009r. Lokalizacja plików interfejsu użytkownika Autor: Marcin Stankiewicz.
Budowa Komputera.
Projekt zaliczeniowy z przedmiotu "Inżynieria oprogramowania"
REPOZYTORIA 1. Co to są repozytoria?
Analiza, projekt i częściowa implementacja systemu obsługi kina
Projekt i implementacja aplikacji wspomagającej testowanie oprogramowania, zgodne z metodologią Unified Software Development Process (RUP). Włodzimierz.
Wykład 2 Cykl życia systemu informacyjnego
Projekt i implementacja aplikacji wspomagającej testowanie oprogramowania, zgodne z metodologią Unified Software Development Process (RUP). Włodzimierz.
Xls2html – biblioteka do konwersji arkuszy Excela do postaci HTML Raport z gry planistycznej Autorzy: Grzegorz Wolak Aleksander Migul.
AUTORZY: Paulina Pluta kl. 3c Agata Łoboda kl.3c
Inżynieria Oprogramowania
IT Asset Management Service
Protokół Komunikacyjny
Microsoft Expression Studio
Metody lokalizacji węzłów ruchomych w sieci ZigBee
Model przestrzenny Diagramu Obiegu Dokumentów
Zarządzanie danymi biznesowymi za pomocą usług EIM serwera SQL 2012, czyli jak SSIS, MDM i DQS rozwiązują problem błędnych danych Marcin Szeliga
EasyMOD kontrola modyfikacji i rozszerzeń systemu SAP
Analiza możliwości tworzenia aplikacji typu RIA na przykładzie portalu ogrodniczego Autor: Łukasz Strzelecki Promotor: dr inż. Paweł Kasprowski.
Budowa komputera.
Opracowanie powłoki bazy danych MySQL
Podstawowe informacje o maturze dla gimnazjalistów.
Microsoft Office Publisher
„Kalkulator zużycia oraz kosztu energii elektrycznej online „
Bazy danych - podstawowe pojęcia
Studia Podyplomowe IT w Biznesie Inżynieria Oprogramowania
SPECJALNOŚĆ: Oprogramowanie Systemowe
SERIO Wzmocnienie umiejętności pracowników budowlanych w ramach BHP przy użyciu multimedialnego szkolenia opartego na przykładach zaczerpniętych z życia.
Aplikacje internetowe
Seminarium Dyplomowe Jacek Fohs.
Projekt rozwojowy finansowany przez MNiSW pt.: Geoinformatyczny system zabezpieczenia działań operacyjnych związanych z ochroną portów od strony morza.
Komputerowe wspomaganie projektowania
Diagram klas Kluczowymi elementami są: klasy (class)
Proces tworzenia oprogramowania Proces tworzenia oprogramowania jest zbiorem czynności i związanych z nimi wyników, które prowadzą do powstania produktu.
Aplikacje mobilne w zastosowaniach medycznych
1. Promotor i skład zespołu menedżerskiego 2. Rozwiązywany problem 3. Wymagania 4. Narzędzia / Technologie 5. Harmonogram 6. Nowe problemy 7. Podsumowanie.
Obszary, w których ryzyko może obejmować dane zgromadzone w systemie informacyjnym.
Podstawy programowania
„Jeden gram praktyki jest lepszy niż tona teorii” Swami Shivananda Kompetencje dyrektora poradni niezbędne w procesie wspomagania rozwoju szkół – dobra.
Zarządzanie wdrożeniem oprogramowania w organizacji w oparciu o metodykę ITIL Michał Majewski s4440 Praca magisterska napisana pod kierunkiem dr inż. Tomasza.
MAS Rafał Hryniów. Agenda  Zasady  Referaty  Projekt  Kolosy.
Zintegrowane systemy informatyczne
1. Promotor i skład zespołu menedżerskiego 2. Rozwiązywany problem 3. Wymagania 4. Wybór zespołu programistów 5. Narzędzia / Technologie 6. Przypadki.
Weed Wizualna eksploracja danych Andrzej Bartoszek Adam Dudczak Przemysław Gwóźdz Jakub Jankowski.
Kompilator eBook w technologii Java Dyplomant: Maciej Bagrowski Promotor: dr inż. Walery Susłow Politechnika Koszalińska Wydział Elektroniki i Informatyki.
Agile Programming a jakość
Protokoły używane w sieciach LAN Funkcje sieciowego systemu komputerowego Wykład 5.
Otwarta infrastruktura hurtowni danych
Projekt modułu BANK INTERNETOWY Moduł funkcji banku
IV Konferencja Naukowo-Techniczna "Nowoczesne technologie w projektowaniu, budowie.
JavaBeans by Paweł Wąsala
Jak używać 1 Usuń linie i tekst, których nie potrzebujesz 2
Platforma LearningApps
Zapis prezentacji:

Autorzy : Bartosz Rybicki, Paweł Ślusarczyk

Motywacje  Problemy: Różne formy danych tego samego pola (nazwa województwa w formie pełnej, bądź skrótowej) Niespójność danych spowodowana błędami przy wprowadzaniu danych Nieodpowiednia kolejność danych Duplikaty

Podstawowe metody czyszczenia danych  Parsowanie, konwersja i standaryzacja formatów danych  Poprawianie wartości pól na podstawie słownika synonimów  Czyszczenie oparte na wyuczonych regułach  Deduplikacja

Zadania do wykonania  Implementacja szkieletu systemu  Implementacja interfejsu użytkownika  Implementacja modułów: parsującego oraz czyszczącego  Implementacja modułu odpowiedzialnego za uczenie się nowych reguł czyszczenia danych

Wymagania  System ma być prototypem potrafiącym nauczyć się prostych przekształceń czyszczenia danych  System ma umożliwiać podanie informacji uczącej  System ma umożliwiać jego przetestowanie na nieznanych frazach

Planowane technologie  Java / J2EE  Pakiet WEKA

Harmonogram prac PraceTermin Zgłębienie problematyki czyszczenia danych oraz pakietu oprogramowania WEKA Projektowanie systemu Implementacja Prezentacja końcowa

Dziękujemy za uwagę