RS-lib Nowa biblioteka skalowalnych metod przeznaczonych do analizy tablic danych.

Slides:



Advertisements
Podobne prezentacje
Data Mining w e-commerce
Advertisements

Kurs języka C++ Paweł Rzechonek Instytut Informatyki
Informacji Geograficznej
Sztuczna Inteligencja Reprezentacja wiedzy I Logika przybliżona
Role w zespole projektowym
PROGRAMOWANIE STRUKTURALNE
Sztuczna Inteligencja Reprezentacja wiedzy I Logika przybliżona
Platforma .Net i Vs.Net.
ZBIORY PRZYBLIŻONE.
Zarządzanie konfiguracją Doskonalenie Procesów Programowych Wykład 6 Copyright, 2001 © Jerzy.
Spośród 80 szkół, które przystąpiły do realizacji projektu, znalazła się również nasza szkoła – Zespół Szkół nr 3 w Kędzierzynie-Koźlu.
Seminarium dyplomowe dr inż. Ewa Więcek-Janka
Wykład 6 Wojciech Pieprzyca
Wstęp do programowania obiektowego
Projektowanie i programowanie obiektowe II - Wykład II
Projektowanie - wprowadzenie
Wykład 2 Cykl życia systemu informacyjnego
Instytut Tele- i Radiotechniczny WARSZAWA
Podstawy programowania. Język C i C++– podstawy Temat: 1
Istota i zastosowanie platformy e-learningowej Moodle
EasyMOD kontrola modyfikacji i rozszerzeń systemu SAP
Informatyczny system edukacyjny do przedmiotu „Multimedia”
Zespół Fizyki Stosowanej i Podstaw Mikroelektroniki
Tworzenie przedmiotów, zajęć i protokołów
Programowanie obiektowe – język C++
Programowanie obiektowe 2013/2014
Na wysokościach myślenia jest sfera,
SPECJALNOŚĆ: Oprogramowanie Systemowe
Politechniki Poznańskiej
Programowanie w języku C++
Kurs języka C++ – organizacja zajęć ( )
Metody numeryczne metody rozwiązywania problemów matematycznych za pomocą operacji na liczbach. Otrzymywane tą drogą wyniki są na ogół przybliżone, jednak.
W W W Łukasz Stochniał.
Treści multimedialne - kodowanie, przetwarzanie, prezentacja Odtwarzanie treści multimedialnych Andrzej Majkowski 1 informatyka +
Model obiektowy bazy danych
Treści multimedialne - kodowanie, przetwarzanie, prezentacja Odtwarzanie treści multimedialnych Andrzej Majkowski 1 informatyka +
Projektowanie Aplikacji Internetowych
Temat 1: Ogólne cechy języka PHP
Dokumentacja obsługi programów Kamil Smużyński Piotr Kościński.
Iga Lewandowska I EMII MU
KOMPANIA WĘGLOWA S.A..
Joanna Kwiatkowska Biblioteka Narodowa
Systemy zarządzania przepływem pracy i systemy zarządzania procesami biznesowymi Karolina Muszyńska.
Podstawy programowania
Informatyka – szkoła gimnazjalna – Scholaris - © DC Edukacja Tworzenie stron WWW w programie Microsoft FrontPage Informatyka.
Moduł e-Kontroli Grzegorz Dziurla.
Dokumentacja programu komputerowego i etapy tworzenia programów.
Wstęp do programowania Wykład 1
Temat: Porównanie technologii php,c# oraz javascript na przykładzie webaplikacji typu społecznościowy agregator treści Autor: Wojciech Ślawski.
Nikogo nie trzeba przekonywać, że eksperymenty wykonywane samodzielnie przez ucznia czy prezentowane przez nauczyciela sprawiają, że lekcje są bardziej.
K URS JĘZYKA C++ – ORGANIZACJA ZAJĘĆ ( ) Paweł Rzechonek Instytut Informatyki Uniwersytetu Wrocławskiego.
Excel 2007 dla średniozaawansowanych Zajęcia z Prowadzący: Artur Kołos.
Sieci współpracy i samokształcenia. SIEĆ to statek, na którym nie ma pasażerów, wszyscy jesteśmy załogą.
Temat: Tworzenie bazy danych
Wyższa Szkoła Informatyki i Zarządzania W Bielsku-Białej Kierunek informatyka Specjalność : Systemy informatyczne Praca dyplomowa inżynierska : System.
Programowanie strukturalne i obiektowe Klasa I. Podstawowe pojęcia dotyczące programowania 1. Problem 2. Algorytm 3. Komputer 4. Program komputerowy 5.
Kompilator eBook w technologii Java Dyplomant: Maciej Bagrowski Promotor: dr inż. Walery Susłow Politechnika Koszalińska Wydział Elektroniki i Informatyki.
Praca metodą projektu edukacyjnego
Publiczna Szkoła Podstawowa nr 3 w Obornikach Śląskich
Programowanie Obiektowe – Epilog
T. 18. E Proces DGA - Działania (operatorka).
Kurs języka C++ – organizacja zajęć ( )
Hipertekst HTML WWW.
IV Konferencja Naukowo-Techniczna "Nowoczesne technologie w projektowaniu, budowie.
Tworzenie stron WWW w programie Microsoft FrontPage
Systemy eksperckie i sztuczna inteligencja
- Krajowe Repozytorium Obiektów Nauki i Kultury
Sztuczna Inteligencja Reprezentacja wiedzy I Logika przybliżona
Zapis prezentacji:

RS-lib Nowa biblioteka skalowalnych metod przeznaczonych do analizy tablic danych

Plan prezentacji Cel – biblioteka oprogramowania Przeznaczenie i możliwości biblioteki Kto miałby pracować w zespole? Zadania do wykonania Korzyści dla uczestników Przygotowania do uruchomienia i uruchomienie projektu Dlaczego Java? Dyskusja

Nasz cel: RS-lib Zespół roboczy pracujący nad nową biblioteką oprogramowania: oprogramowanie, dokumentacja, tutoriale, dema... Później: zintegrowany interfejs graficzny

Czym miałaby być RS-lib? Biblioteka oprogramowania napisanego w języku Java przeznaczona do analizy zbiorów danych Tworzona od początku według standardu Java Data Mining (JDM) Nastawiona szczególnie na metody skalowalne analizy danych Technicznie - umieszczona na witrynie internetowej ulokowanej w Rzeszowie wraz z dokumentacjami, samouczkami, przykładami itd.

Klasyfikatory - narzędzia do aproksymacji pojęć na podstawie zbiorów danych, czyli o co głównie chodzi... Motywacja: - Potrzeba aproksymowania pojęć przy niepełnej informacji o obiektach i pojęciach - Niski koszt obliczeniowy i wysoka efektywność wnioskowań aproksymacyjnych prowadzonych w oparciu o aproksymacje pojęć Obiekt testowy Generowanie decyzji dla obiektu testowego Klasyfikator Konstrukcja klasyfikatora Metody rozwijane w: Wnioskowania statystyczne Uczenie maszynowe (ang. machine learning) Eksploracja danych (ang. data mining) Rozpoznawanie wzorców (ang. pattern recognition) Odkrywanie wiedzy (ang. knowledge discovery) Sterowanie niekonwencjonalne (ang. soft control) Informacja o przynależności testowanego obiektu do pojęcia Dana tablica decyzyjna (przykłady obiektów) Przykładowe podejścia do tworzenia klasyfikatorów: - metody statystyczne - drzewa decyzyjne - reguły decyzyjne - sieci neuronowe ...

Ilustracja problemu konstruowania klasyfikatora System informacyjny jako para (U, A) U - niepusty zbiór obiektów (wierszy) A - niepusty zbiór atrybutów (kolumn) takich, że a: U  Va dla każdego atrybutu a Va jest nazywany zbiorem wartości atrybutu a. W systemie informacyjnym (U, A{d}) atrybut decyzyjny d (decyzja eksperta) jest wyróżniony; elementy A są nazywane atrybutami warunkowymi. Wartości decyzji d definiują tzw. klasy decyzyjne. W przykładzie, dla atrybutu decyzyjnego Grypa są dwie klasy decyzyjne: Grypa(Nie)={u1,u4, u5} oraz Grypa(Tak)={u2, u3, u6} Problem: Jak skonstruować algorytm (klasyfikator) pozwalający na predykcję wartości atrybutu decyzyjnego na podstawie wartości atrybutów warunkowych? Reguły decyzyjne (propozycja rozwiązania) (temp=Normalna)=>(Grypa=Nie) 2 (temp=Bardzo_wys)=>(Grypa=Tak) 2 (bol_glowy=Tak)&(temp=Wysoka)=>(Grypa=Tak) 1 (bol_miesni=Tak)&(temp=Wysoka)=>(Grypa=Tak) 1 (bol_miesni=Nie)=>(Grypa=Nie) 1 (bol_glowy=Nie)&(temp=Wysoka)=>(Grypa=Nie) 1

Teoria zbiorów przybliżonych Zaproponowany w 1982r przez prof. Zdzisława Pawlaka formalizm matematyczny, stanowiący rozwinięcie klasycznej teorii zbiorów. Zbiór przybliżony (ang. rough set) to obiekt matematyczny zbudowany z pary klasycznych zbiorów: przybliżenia dolnego i przybliżenia górnego. Dany element może należeć do obydwu przybliżeń, do żadnego lub tylko do przybliżenia górnego. Modelowanie niepewności

Przyszłe możliwości RS-liba Importowanie danych z plików tekstowych oraz z formatów innych systemów Wstępna obróbka danych (np. wypełnianie pustych miejsc, dyskretyzacja, filtracja itd). Klasyczne metody analizy danych (wykrywanie zależności w danych, tworzenie i testowanie klasyfikatorów i wiele innych) Zaawansowane metody analizy danych nowej generacji powiązane z wiedzą dziedzinową (metody z RoughICE i nowe !!!)

Kto miałby pracować nad biblioteką? Pracownicy KI UR Studenci UR (Informatyka, Matematyka,...) Dodatkowe osoby z Rzeszowa Dodatkowe osoby z innych miast Polski a szczególnie z grupy prof. Andrzeja Skowrona z Wydziału MIM Uniwersytetu Warszawskiego Osoby z zagranicy...

Zadania do wykonania Przygotowanie przez ustalone osoby oprogramowania podstawowego wraz z dokumentacją Podstawa biblioteki używana przez wszystkich Przykłady obowiązującego stylu tworzenia klas (wg. zaleceń firmy Sun) Postawienie witryny internetowej w której będą: źródła oprogramowania wraz systemem kontroli wersji, materiały na temat biblioteki, lista dyskusyjna Opracowanie w języku Java przez ustalone osoby głównych modułów wraz z ich dokumentacją Konserwacja utworzonych modułów oraz dorabianie nowych modułów Promocja biblioteki w Polsce i na świecie utrzymywanie na wysokim poziomie witryny internetowej biblioteki, prezentacje na konferencjach samej biblioteki oraz wyników badawczych uzyskanych przy jej użyciu, organizowanie tutoriali

Korzyści dla uczestników Każdy uczestnik zespołu będzie widoczny jako twórca swojego modułu i będzie identyfikowany z tym modułem Powstanie kolejnych modułów będzie wiązało się z powstaniem prac dyplomowych (licencjackich i inżynierskich), magisterskich i doktorskich Studenci będą mogli zaliczyć praktykę Będzie miało miejsce wzajemne wsparcie członków zespołu przy tworzeniu nowych modułów Zwiększenie szybkości tworzenia i niezawodności oprogramowania Nastąpi zwiększenie liczby publikacji członków zespołu Współautorami każdej publikacji powstającej na bazie biblioteki będą wszystkie osoby pracujące nad modułem, który został wykorzystany Wzrośnie zainteresowanie prowadzonymi w zespole pracami badawczymi oraz pojawią się liczne zastosowania wykonanych modułów Kwalifikacje członków zespołu będą się ustawicznie zwiększać

Przygotowanie do uruchomienia Wybór funkcjonalności dotychczasowego oprogramowania, które powinny się znaleźć w nowej bibliotece jako jej moduły Na początek zalecana ostrożność i powściągliwość aby nie było ich zbyt dużo Pomoc w douczeniu się języka Java oraz w opanowaniu potrzebnych narzędzi Książki, materiały, spotkania edukacyjne Doradztwo i pomoc merytoryczna i techniczna w wykonaniu modułów

Etapy techniczne uruchomienia projektu Uruchomienie systemu kontroli wersji źródeł Gdy będzie dostępne oprogramowanie stanowiące podstawę biblioteki Ograniczone uruchomienie całej witryny wraz z grupą dyskusyjną Tylko dla z góry zarejestrowanych użytkowników będących członkami zespołu Gdy powstaną pierwsze wersje modułów Dodanie możliwości rejestrowania się osób spoza zespołu Gdy wszystko będzie już sprawnie funkcjonować...

Co jest potrzebne i czego oczekujemy? Szeroka dyskusja nad projektem Gruntowne własne przemyślenie własnego udziału w projekcie Deklaracja uczestnictwa w projekcie lub rezygnacja z uczestnictwa w nim Ustalenie terminu spotkań

Dlaczego Java? Java jest pochodną starszych języków, tzn. C i C++ Znając te języki łatwo się jej nauczyć Jednak różni ją od nich przede wszystkim uproszczoną składnią programowania obiektowego Stosuje bogaty zestaw bibliotek, które, w odróżnieniu od języka C++, wszystkie są standardowe na każdej ważniejszej platformie sprzętowej. Dostarcza rozbudowane i zaawansowane narzędzia do takich działań jak: tworzenie graficznego interfejsu użytkownika, programowanie internetowe, wielowątkowość, multimedia i wiele innych. Doskonale nadaje się do programowania zespołowego.

TIOBE Spośród wielu analiz „aktualności” nowoczesnych języków programowania szczególnie wyróżnia się analiza zwana „TIOBE Programming Community index“ Prezentuje wskaźnik „popularności“ języków programowania na podstawie światowego zainteresowania w danym zakresie wykształconymi programistami, szkoleniami i literaturą Sposobem zbierania informacji są specyficzne zapytania do wyszukiwarek: Google, MSN i Yahoo Wynik - to procentowy wskaźnik popularności języków, publikowany w każdym miesiącu We wcześniejszych miesiącach wynik był jeszcze bardziej korzystny dla języka Java

Tymczasowa witryna projektu http://lambda.univ.rzeszow.pl/~bazan/rslib/ Użytkownik: rslib Hasło: roughsets Materiały wprowadzające i pomocnicze