Klasyfikacja dokumentów za pomocą sieci radialnych Paweł Rokoszny Emil Hornung Michał Ziober Tomasz Bilski.

Slides:



Advertisements
Podobne prezentacje
Zakład Mechaniki Teoretycznej
Advertisements

Modelowanie zależności ekspresji genów
Wprowadzenie do optymalizacji wielokryterialnej.
Zmienne losowe i ich rozkłady
Inteligencja Obliczeniowa Metody oparte na podobieństwie do wzorców.
Inteligencja Obliczeniowa Sieci dynamiczne cd.
Uczenie konkurencyjne.
Inteligencja Obliczeniowa Metody probabilistyczne.
Inteligencja Obliczeniowa Perceptrony
Badania operacyjne. Wykład 1
o radialnych funkcjach bazowych
Elementy Modelowania Matematycznego
Elementy Modelowania Matematycznego
Sztuczna Inteligencja Reprezentacja wiedzy I Logika przybliżona
Wnioskowanie Bayesowskie
WEDT Klasyfikacja i grupowanie dokumentów
Statystyka w doświadczalnictwie
Ulepszenia metody Eigenfaces
Rozpoznawanie Twarzy i Systemy Biometryczne, 2005/2006
Rozpoznawanie Twarzy i Systemy Biometryczne, 2005/2006
Jakość sieci geodezyjnych. Pomiary wykonane z największą starannością, nie dostarczają nam prawdziwej wartości mierzonej wielkości, lecz są zwykle obarczone.
Wprowadzenie do budowy usług informacyjnych
Niepewności przypadkowe
Krzysztof Suchecki wybrana prezentacja z konferencji ECCS'07 w Dreźnie Interacting Random Boolean Networks.
Wykład 3 Wzór Bayesa – wpływ rozkładu a priori.
Paweł Kramarski Seminarium Dyplomowe Magisterskie 2
mgr inż. Rafał Komański styczeń 2004
Klasyfikacja Obcinanie drzewa Naiwny klasyfikator Bayes’a kNN
Pobieranie próby Populacja generalna: zbiór wyników wszystkich możliwych doświadczeń określonego typu. Próba n-wymiarowa: zbiór n wyników doświadczeń.
6. Pochodne cząstkowe funkcji n zmiennych
Additive Models, Trees, and Related Methods
Sieci neuronowe jednokierunkowe wielowarstwowe
Typy systemów informacyjnych
Zastosowanie technologii CUDA w sztucznej inteligencji
Klasyfikacja dokumentów za pomocą sieci radialnych Paweł Rokoszny Emil Hornung Michał Ziober Tomasz Bilski.
Klasyfikacja dokumentów za pomocą sieci radialnych
Klasyfikacja dokumentów za pomocą sieci radialnych Paweł Rokoszny Emil Hornung Michał Ziober Tomasz Bilski.
Dane oraz ich preprocessing
formalnie: Budowa i zasada funkcjonowania sztucznych sieci neuronowych
Systemy wspomagania decyzji
Elementy Rachunku Prawdopodobieństwa i Statystyki
Sztuczne Sieci Neuronowe
Elementy Rachunku Prawdopodobieństwa i Statystyki
Opiekun: dr inż. Maciej Ławryńczuk
formalnie: Uczenie nienadzorowane
Detekcja twarzy w obrazach cyfrowych
Sieci bayesowskie Wykonali: Mateusz Kaflowski Michał Grabarczyk.
Techniki eksploracji danych
formalnie: Naiwny klasyfikator Bayesa
Model I/O bazujący na HSWN Problem uczenia sieci HSWN
Dana jest sieć dystrybucji wody w postaci: Ø      m- węzłów,
Marcin Jaruszewicz Jacek Mańdziuk
Źródła błędów w obliczeniach numerycznych
Spis treści W świecie algortmów -Budowa algorytmu
SYSTEMY EKSPERTOWE I SZTUCZNA INTELIGENCJA
VII EKSPLORACJA DANYCH
Politechniki Poznańskiej
Metody numeryczne metody rozwiązywania problemów matematycznych za pomocą operacji na liczbach. Otrzymywane tą drogą wyniki są na ogół przybliżone, jednak.
Sieci neuronowe, falki jako przykłady metod analizy sygnałów
Mgr inż. Paweł Ziółkowski
Metody Matematyczne w Inżynierii Chemicznej Podstawy obliczeń statystycznych.
Mateusz Wawrzyniak & Michał Warzocha
Rozkład wariancji z próby (rozkład  2 ) Pobieramy próbę x 1,x 2,...,x n z rozkładu normalnego o a=0 i  =1. Dystrybuanta rozkładu zmiennej x 2 =x 1 2.
Adaptacyjne Systemy Inteligentne Maciej Bielski, s4049.
Warstwowe sieci jednokierunkowe – perceptrony wielowarstwowe
GeneracjeTechnologia Architektura przetwarzania 0. Przekaźniki elektromechaniczne 1. Lampy elektronowe 2. Tranzystory 3. Układy scalone 3.5.Układy dużej.
Belief Nets Autor: inż. 2013r źródło tła:
Systemy neuronowo – rozmyte
Systemy Ekspertowe i Sztuczna Inteligencja trudne pytania
Programowanie sieciowe Laboratorium 4
Zapis prezentacji:

Klasyfikacja dokumentów za pomocą sieci radialnych Paweł Rokoszny Emil Hornung Michał Ziober Tomasz Bilski

Plan prezentacji Model sieci neuronowej z neuronami radialnymi Naiwny klasyfikator bayesowski jako alternatywa Dane oraz ich preprocessing Wyniki implementacji Wnioski

Model sieci neuronowej z neuronami radialnymi

Naiwny klasyfikator bayesowski Tw. Bayesa P(C) - prawdopodobieństwo wystąpienia klasy C P(X|C) - prawdopodobieństwo, że X należy do klasy C, P(X) - prawdopodobieństwo wystąpienia przykładu X

Naiwny klasyfikator bayesowski Założenie: Atrybuty definiujące klasę są niezależne. Powyższe założenie redukuje obliczenia Jeśli założenie jest spełnione, naiwny klasyfikator Bayesa jest optymalny Klasyfikator Bayesa jest zadziwiająco dokładny. Używany do rozpoznawania spamu

Naiwny klasyfikator bayesowski

Dane oraz ich preprocessing

Wyniki implementacji Skuteczność uczenia dla różnych typów słowników i różnej reprezentacji dokumentów (dla dwóch klas dokumentów) CTF-IDFFIXEDFREQUENCY TF-IDF60%52%57% Binary79%55%85% Own65%74%60%

Wyniki implementacji Ogólna tendencja skuteczności w funkcji ilości klas dokumentów (n) Ogólnie sieć około dwukrotnie skuteczniejsza od losowego wyboru. Skuteczność sieci jeszcze wyższa, jeśli odizolujemy ją od reprezentacji danych wejściowych podając np. podając wektory spełniające pewne ścisłe kryteria

Wnioski Osiągnięta skuteczność niższa, niż oczekiwano Długi czas uczenia sieci Struktura bardziej skomplikowana, niż analogicznych niemyślących algorytmów Trudne do wychwycenia błędy Dopóki sieć nie działa, nie na pewności, co zawiodło

Wnioski Co poszło nie tak? (potencjalne problemy) Dokumenty zawierające w większości to samo słownictwo a tylko pojedyncze słowa świadczące o przynależności do klasy Liczność neuronów ograniczona czasem nauki Potencjalnie skomplikowany rozkład przestrzeni na klasy wymagający użycia wielu neuronów

DZIĘKUJEMY ZA UWAGĘ!