Metody Inteligencji Obliczeniowej Adrian Horzyk Adrian Horzyk Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii.

Slides:



Advertisements
Podobne prezentacje
Data Mining w e-commerce
Advertisements

Planowanie bezkolizyjnego ruchu w środowisku wielu robotów z wykorzystaniem gier niekooperacyjnych OWD
Inteligencja Obliczeniowa Metody oparte na podobieństwie do wzorców.
Algorytm Dijkstry (przykład)
SZTUCZNA INTELIGENCJA ARTIFICIAL INTELLIGENCE
Katedra Informatyki Stosowanej UMK
Uczenie konkurencyjne.
Samoorganizacja: uczenie bez nadzoru.
Inteligencja Obliczeniowa Perceptrony o dużym marginesie błędu
Inteligencja Obliczeniowa Perceptrony
Badania operacyjne. Wykład 1
o radialnych funkcjach bazowych
Ulepszenia metody Eigenfaces
Rozpoznawanie Twarzy i Systemy Biometryczne, 2005/2006
Sztuczna Inteligencja Reprezentacja wiedzy I Wstęp. Włodzisław Duch Katedra Informatyki Stosowanej UMK Google: W. Duch.
Czy potrafimy obliczyć wartość wyjścia sieci znając wartości jej wejść? Tak, przy założeniu, że znamy aktualne wartości wag i progów dla poszczególnych.
Metody Sztucznej Inteligencji w Sterowaniu 2009/2010 Metoda propagacji wstecznej Dr hab. inż. Kazimierz Duzinkiewicz, Katedra Inżynierii Systemów Sterowania.
Eksperymentalna ocena jakości rozpoznawania
Linear Methods of Classification
Mirosław ŚWIERCZ Politechnika Białostocka, Wydział Elektryczny
Sieci Hopfielda.
Sieci neuronowe jednokierunkowe wielowarstwowe
Klasyfikacja dokumentów za pomocą sieci radialnych
Seminarium 2 Krzywe kalibracyjne – rodzaje, wyznaczanie, obliczanie wyników Równanie regresji liniowej Współczynnik korelacji.
Opiekun: dr inż. Maciej Ławryńczuk
MECHANIKA NIEBA WYKŁAD r.
Ocena przydatności algorytmu – czas działania (złożoność czasowa)
AI w grach komputerowych
Detekcja twarzy w obrazach cyfrowych
Modelowanie populacji i przepływu opinii pomiędzy aktorami sztucznej inteligencji za pomocą sieci społecznej Wojciech Toman.
GŁOSOWA ŁĄCZNOŚĆ Z KOMPUTEREM
Modelowanie i Identyfikacja 2011/2012 Metoda propagacji wstecznej Dr hab. inż. Kazimierz Duzinkiewicz, Katedra Inżynierii Systemów Sterowania 1 Warstwowe.
ZWIĄZKI MIĘDZY KLASAMI KLASY ABSTRAKCYJNE OGRANICZENIA INTERFEJSY SZABLONY safa Michał Telus.
MS Excel - wspomaganie decyzji
VI EKSPLORACJA DANYCH Zadania eksploracji danych: klasyfikacja
VII EKSPLORACJA DANYCH
Politechniki Poznańskiej
Treści multimedialne - kodowanie, przetwarzanie, prezentacja Odtwarzanie treści multimedialnych Andrzej Majkowski 1 informatyka +
Dane – informacje - wiadomości Kodowanie danych i problem nadmiarowości.
Warstwowe sieci jednokierunkowe – perceptrony wielowarstwowe
Metody Sztucznej Inteligencji – technologie rozmyte i neuronowe Wnioskowanie Mamdani’ego - rozwinięcia  Dr hab. inż. Kazimierz Duzinkiewicz, Katedra Inżynierii.
Metody sztucznej inteligencji – technologie rozmyte i neuronoweReguła propagacji wstecznej  Dr hab. inż. Kazimierz Duzinkiewicz, Katedra Inżynierii Systemów.
Wybrane zagadnienia inteligencji obliczeniowej Zakład Układów i Systemów Nieliniowych I-12 oraz Katedra Mikroelektroniki i Technik Informatycznych proponują.
BAZY DANYCH Microsoft Access Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej Katedra Automatyki i.
SZTUCZNA INTELIGENCJA
SZTUCZNA INTELIGENCJA
SZTUCZNA INTELIGENCJA
BAZY DANYCH Microsoft Access Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej Katedra Automatyki i.
SZTUCZNA INTELIGENCJA
BAZY DANYCH Microsoft Access Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej Katedra Automatyki i.
Temat 3: Podstawy programowania Algorytmy – 2 z 2 _________________________________________________________________________________________________________________.
SZTUCZNA INTELIGENCJA
SZTUCZNA INTELIGENCJA
Metody Inteligencji Obliczeniowej
BAZY DANYCH Microsoft Access Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej Katedra Automatyki i.
BAZY DANYCH ZAAWANSOWANE MECHANIZMY Microsoft Access Adrian Horzyk
BAZY DANYCH Microsoft Access Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej Katedra Automatyki i.
SZTUCZNA INTELIGENCJA
© Kazimierz Duzinkiewicz, dr hab. inż. Katedra Inżynierii Systemów Sterowania Modelowanie i podstawy identyfikacji 2015/2016 Modele neuronowe – podstawy,
GeneracjeTechnologia Architektura przetwarzania 0. Przekaźniki elektromechaniczne 1. Lampy elektronowe 2. Tranzystory 3. Układy scalone 3.5.Układy dużej.
Metody sztucznej inteligencji - Technologie rozmyte i neuronowe 2015/2016 Systemy rozmyte – wnioskowanie Mamdani’ego II © Kazimierz Duzinkiewicz, dr hab.
Inteligencja Obliczeniowa Perceptrony o dużym marginesie błędu
Systemy neuronowo – rozmyte
Perceptrony o dużym marginesie błędu
Co do tej pory robiliśmy:
Perceptrony o dużym marginesie błędu
Koszyk danych – miejsce tymczasowego przechowywania ręcznie wybranych zmiennych : Funkcje koszyka Przekształcanie koszyka w grupę danych.
Inteligencja Obliczeniowa Perceptrony
Zapis prezentacji:

Metody Inteligencji Obliczeniowej Adrian Horzyk Adrian Horzyk Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej Katedra Automatyki i Inżynierii Biomedycznej Laboratorium Biocybernetyki Kraków, al. Mickiewicza 30, paw. C3/205 Google: Adrian Horzyk Metoda K Najbliższych Sąsiadów K-Nearest Neighbours (KNN)

WSTĘP Metoda K Najbliższych Sąsiadów (k-Nearest Neighbors) należy do grupy algorytmów leniwych (lazy algorithms), czyli takich, które nie tworzą wewnętrznej reprezentacji danych uczących, lecz szukają rozwiązania dopiero w momencie pojawienia się wzorca testowego w trakcie klasyfikacji. Metoda przechowuje wszystkie wzorce uczące, względem których wyznacza odległość wobec wzorca testowego. Metoda K Najbliższych Sąsiadów (k-Nearest Neighbors) należy do grupy algorytmów leniwych (lazy algorithms), czyli takich, które nie tworzą wewnętrznej reprezentacji danych uczących, lecz szukają rozwiązania dopiero w momencie pojawienia się wzorca testowego w trakcie klasyfikacji. Metoda przechowuje wszystkie wzorce uczące, względem których wyznacza odległość wobec wzorca testowego. Do której klasy należy gwiazdka (kółeczek, trójkątów czy kwadratów)? Do której klasy należy gwiazdka (kółeczek, trójkątów czy kwadratów)? Istnieje też grupa metod gorliwych (eager learning algorithms). Należą tutaj takie algorytmy uczące, które wewnętrzną reprezentację danych uczących (swoisty rodzaj wiedzy o problemie). Następnie w momencie pojawienia się wzorca testującego korzystając z tej wewnętrznej reprezentacji dokonują jego np. klasyfikacji. Do tej grupy metod należą wszystkie rodzaje sieci neuronowych oraz systemy rozmyte, drzewa decyzyjne i wiele innych. Po zakończonej nauce (adaptacji modelu), dane uczące mogą zostać usunięte. Istnieje też grupa metod gorliwych (eager learning algorithms). Należą tutaj takie algorytmy uczące, które wewnętrzną reprezentację danych uczących (swoisty rodzaj wiedzy o problemie). Następnie w momencie pojawienia się wzorca testującego korzystając z tej wewnętrznej reprezentacji dokonują jego np. klasyfikacji. Do tej grupy metod należą wszystkie rodzaje sieci neuronowych oraz systemy rozmyte, drzewa decyzyjne i wiele innych. Po zakończonej nauce (adaptacji modelu), dane uczące mogą zostać usunięte.

ZBIÓR WZORCÓW UCZĄCYCH

DIAGRAMY VORONOI Diagramy Voronoi (Voronoi diagrams) ilustrują obszary przyciągania (attraction areas) do najbliższych pojedynczych elementów w przestrzeni: Diagramy Voronoi (Voronoi diagrams) ilustrują obszary przyciągania (attraction areas) do najbliższych pojedynczych elementów w przestrzeni:

METODA K NAJBLIŻSZYCH SĄSIADÓW Metoda k Najbliższych Sąsiadów (k-Nearest Neighbors) wyznacza k sąsiadów, do których badany element (gwiazdka) ma najbliżej dla wybranej metryki (np. Euklidesowej), a następnie wyznacza wynik w oparciu o głos większości: Metoda k Najbliższych Sąsiadów (k-Nearest Neighbors) wyznacza k sąsiadów, do których badany element (gwiazdka) ma najbliżej dla wybranej metryki (np. Euklidesowej), a następnie wyznacza wynik w oparciu o głos większości: Do którego zbioru należy gwiazdka? Wynik działania zależy to od tego, ilu najbliższych sąsiadów weźmiemy pod uwagę.

METODA K NAJBLIŻSZYCH SĄSIADÓW Metoda k Najbliższych Sąsiadów (k-Nearest Neighbors) daje różne wyniki w postaci obszarów przyciągania, co determinuje wynik klasyfikacji: Metoda k Najbliższych Sąsiadów (k-Nearest Neighbors) daje różne wyniki w postaci obszarów przyciągania, co determinuje wynik klasyfikacji: Większe wartości k umożliwiają wygładzenie obszarów podziału, usunięcie szumu i artefaktów, lecz również prowadzą do błędów w klasyfikacji rzadszych wzorców. Pojawia się problem ich poprawnej dyskryminacji i uogólniania. Większe wartości k umożliwiają wygładzenie obszarów podziału, usunięcie szumu i artefaktów, lecz również prowadzą do błędów w klasyfikacji rzadszych wzorców. Pojawia się problem ich poprawnej dyskryminacji i uogólniania.

Dobieranie wartości k Jeślibyśmy wzięli pod uwagę k=N, gdzie N to ilość wszystkich elementów zbioru wzorców uczących, wtedy zawsze wynik klasyfikacji będzie określony przez najliczniej reprezentowaną klasę w tym zbiorze uczących, a więc w tym przykładzie: kwadraciki. Jeślibyśmy wzięli pod uwagę k=N, gdzie N to ilość wszystkich elementów zbioru wzorców uczących, wtedy zawsze wynik klasyfikacji będzie określony przez najliczniej reprezentowaną klasę w tym zbiorze uczących, a więc w tym przykładzie: kwadraciki. Przykładowy wykres zależności wyników adaptacji od wartości k:

MODYFIKACJE METODY K NAJBLIŻSZYCH SĄSIADÓW Metoda Ważonych Odległości Najbliższych Sąsiadów (Distance Weighted Nearest Neighbors) prowadzi do głosowania na temat klasyfikacji gwiazdki biorąc pod uwagę k najbliższych sąsiadów lub nawet wszystkie wzorce, lecz ich głosy są ważone w zależności od ich odległości (dla wybranej metryki) do gwiazdki: im dalej jest głosujący wzorzec tym ma mniejszą wagę. A więc wzorce położone najbliżej będą miały największy wpływ na wynik klasyfikacji: Metoda Ważonych Odległości Najbliższych Sąsiadów (Distance Weighted Nearest Neighbors) prowadzi do głosowania na temat klasyfikacji gwiazdki biorąc pod uwagę k najbliższych sąsiadów lub nawet wszystkie wzorce, lecz ich głosy są ważone w zależności od ich odległości (dla wybranej metryki) do gwiazdki: im dalej jest głosujący wzorzec tym ma mniejszą wagę. A więc wzorce położone najbliżej będą miały największy wpływ na wynik klasyfikacji: w5w5 w6w6 w4w4 w3w3 w2w2 w1w1 w7w7

TRUDNOŚCI METOD K NAJBLIŻSZYCH SĄSIADÓW Metody Najbliższych Sąsiadów ponoszą karę za swoje „lenistwo”, związane z brakiem budowy modelu generalizującego wzorce uczące. Wymagają przeglądania w pętlach wszystkich wzorców uczących dla wszystkich wymiarów (złożoność wielomianowa). Metody Najbliższych Sąsiadów ponoszą karę za swoje „lenistwo”, związane z brakiem budowy modelu generalizującego wzorce uczące. Wymagają przeglądania w pętlach wszystkich wzorców uczących dla wszystkich wymiarów (złożoność wielomianowa). Nawet w przypadku poindeksowania wzorców względem każdego wymiaru/parametru w bazie danych, trzeba przejść po każdym z wymiarów, w celu określenia najbliższych sąsiadów, co też jest czasochłonne w zależności od wyboru k. W metodach sprawdzających ważone odległości do wszystkich wzorców i tak trzeba przejść po nich wszystkich każdorazowo. Nawet w przypadku poindeksowania wzorców względem każdego wymiaru/parametru w bazie danych, trzeba przejść po każdym z wymiarów, w celu określenia najbliższych sąsiadów, co też jest czasochłonne w zależności od wyboru k. W metodach sprawdzających ważone odległości do wszystkich wzorców i tak trzeba przejść po nich wszystkich każdorazowo. W przypadku dużej ilości wzorców lub dużego wymiaru danych klasyfikacja realizacja klasyfikacji wiąże się z ogromnym narzutem czasowym. Od tego wolne są inne modele, które dla wzorców uczących najpierw budują model (zwykle jednokrotnie pewnym nakładem czasowym), lecz potem klasyfikacja przebiega już bardzo szybko! W przypadku dużej ilości wzorców lub dużego wymiaru danych klasyfikacja realizacja klasyfikacji wiąże się z ogromnym narzutem czasowym. Od tego wolne są inne modele, które dla wzorców uczących najpierw budują model (zwykle jednokrotnie pewnym nakładem czasowym), lecz potem klasyfikacja przebiega już bardzo szybko! Metoda jest ponadto wrażliwa na dane zaszumione lub błędne, np. w odniesieniu do niektórych cech wzorców (noisy features). Mogą one zmienić wynik klasyfikacji. Metoda jest ponadto wrażliwa na dane zaszumione lub błędne, np. w odniesieniu do niektórych cech wzorców (noisy features). Mogą one zmienić wynik klasyfikacji. Metoda k-NN natomiast stosunkowo dobrze działa dla dużej ilości klas. Metoda k-NN natomiast stosunkowo dobrze działa dla dużej ilości klas. PRÓBY ROZWIĄZANIA: Adaptacja sposobu określania odległości poprzez adaptacyjne ważenie cech, odległości, wartości k. Adaptacja sposobu określania odległości poprzez adaptacyjne ważenie cech, odległości, wartości k.

MODYFIKACJE METODY K NAJBLIŻSZYCH SĄSIADÓW Korzystając np. z asocjacyjnego sortowania ASSORT oraz neuronowych struktur AANG można by było bardzo szybko wyznaczyć najbliższych sąsiadów na podstawie podobieństwa do prezentowanego wzorca na wejściu, lecz po co, skoro sama sieć AANG również umożliwia klasyfikację, zwykle nie gorszą niż k-NN, a w dodatku tworzy model na podstawie danych uczących, co znacznie przyspiesza końcowy proces klasyfikacji. Korzystając np. z asocjacyjnego sortowania ASSORT oraz neuronowych struktur AANG można by było bardzo szybko wyznaczyć najbliższych sąsiadów na podstawie podobieństwa do prezentowanego wzorca na wejściu, lecz po co, skoro sama sieć AANG również umożliwia klasyfikację, zwykle nie gorszą niż k-NN, a w dodatku tworzy model na podstawie danych uczących, co znacznie przyspiesza końcowy proces klasyfikacji.

PORÓWNANIE WYNIKÓW KLASYFIKACJI AANG i kNN