System eksploracji danych z wykorzystaniem dokumentów XML Kamil Litman
Plan prezentacji Wstęp Cel pracy dyplomowej Harmonogram działań Założenia Postępy prac Spis literatury
Wstęp Temat pracy: System eksploracji danych z wykorzystaniem dokumentów XML Kierujący pracą: dr inż. Jacek Rumiński
Cel pracy dyplomowej Stworzenie systemu wydobywania wiedzy z hurtowni danych opartej o dane historyczne i raporty zawarte w dokumentach XML. Zbadanie i zaproponowanie możliwości wykorzystania omawianych rozwiązań w diagnostyce medycznej.
Cel pracy dyplomowej Istotnym celem pracy jest również zapoznanie się z funkcjonującymi obecnie metodami budowy hurtowni danych. Zaproponowanie wykorzystania dokumentów XML do raportowania w medycynie. Zapoznanie się i wykorzystanie metod wydobywania wiedzy (data mining) z hurtowni danych.
Cel pracy - podsumowanie Ostatecznym celem pracy jest działający system informatyczny wraz z zestawem danych testowych i ich wyjaśnieniem ich znaczenia oraz dokumentacją (w postaci pracy dyplomowej) zgodną z regulacjami CMMI level 2, Project Planning
Harmonogram działań Zapoznanie z literaturą Analiza rozwiązań Projekt systemu Implementacja i opis Sposoby testowania i interpretacji wyników Dokumentowanie
Założenia Podstawowym założeniem jest zapewnienie możliwości wykorzystania stworzonego systemu w medycynie. Kształt i szczegółowa architektura systemu zależna będzie od dostępnego zestawu danych.
Postępy prac Zapoznanie z literaturą Analiza rozwiązań Projekt systemu Implementacja i opis Sposoby testowania i interpretacji wyników Dokumentowanie
Postępy prac – stan wiedzy Przegląd architektur hurtowni danych Modele relacyjne (superrelacyjne) Modele wielowarstwowe MOLAP Podsumowanie Wprowadzenie do XML Podstawowe założenia normy XML Zastosowania XML do raportowania w medycynie Sposoby integracji danych zawartych w XML z hurtownią danych
Postępy prac – stan wiedzy Przegląd metody eksploracji danych OLAP Sieci neuronowe Możliwości zastosowań w medycynie Podsumowanie
Postępy prac – ponadto Information Manifold firmy AT&T: Pytanie: Projekt o podobnych założeniach; Wykorzystanie dokumentów SGML; Fizyczna struktura hurtowni; Aktualizacja danych poza systemem; System uniwersalny; Pytanie: Czy da się wykorzystać w medycynie?
Spis literatury Data Mining: Concepts and Techniques, Jiawei Han i Micheline Kamber, Morgan Kaufmann Publishers, August 2000 Hurtownie danych. Podstawy organizacji i funkcjonowania, Matthias Jarke, Maurizio Lenzerini, Yannis Vassiliou, Panos Vassiliadis, Wydawnictwo Szkolne i Pedagogiczne, Warszawa 2003 XML. Wprowadzenie, Erik T. Ray, Wydawnictwo Helion, Warszawa 2004 Czasopisma dostępne w czytelni Internet Pozycja o eksploracji danych w medycynie
Dziękuję za uwagę! Zapraszam do zadawania pytań.