SZTUCZNA INTELIGENCJA ARTIFICIAL INTELLIGENCE

Slides:



Advertisements
Podobne prezentacje
Joanna Sawicka Wydział Nauk Ekonomicznych, Uniwersytet Warszawski
Advertisements

Reinhard Kulessa1 Wykład Środek masy Zderzenia w układzie środka masy Sprężyste zderzenie centralne cząstek poruszających się c.d.
Metody badania stabilności Lapunowa
Obserwowalność System ciągły System dyskretny
Inteligencja Obliczeniowa Metody oparte na podobieństwie do wzorców.
WYKŁAD 6 ATOM WODORU W MECHANICE KWANTOWEJ (równanie Schrődingera dla atomu wodoru, separacja zmiennych, stan podstawowy 1s, stany wzbudzone 2s i 2p,
Katedra Informatyki Stosowanej UMK
Badania operacyjne. Wykład 2
Komponenty bazy danych Baza danych Jest to uporządkowany zbiór powiązanych ze sobą danych charakterystycznych dla pewnej klasy obiektów lub zdarzeń,
Rozpoznawanie Twarzy i Systemy Biometryczne, 2005/2006
Dr hab. Ewa Popko pok. 231a
Metody Sztucznej Inteligencji w Sterowaniu 2009/2010 Metoda propagacji wstecznej Dr hab. inż. Kazimierz Duzinkiewicz, Katedra Inżynierii Systemów Sterowania.
Proces analizy i rozpoznawania
Paweł Kramarski Seminarium Dyplomowe Magisterskie 2
Klasyfikacja Obcinanie drzewa Naiwny klasyfikator Bayes’a kNN
Grupowanie Wprowadzanie Definicja problemu
SZTUCZNA INTELIGENCJA ARTIFICIAL INTELLIGENCE
SZTUCZNA INTELIGENCJA ARTIFICIAL INTELLIGENCE
SZTUCZNA INTELIGENCJA ARTIFICIAL INTELLIGENCE
Projektowanie i programowanie obiektowe II - Wykład IV
Sieci Hopfielda.
UKŁADY SZEREGOWO-RÓWNOLEGŁE
Przykładowe zastosowania równania Bernoulliego i równania ciągłości przepływu 1. Pomiar ciśnienia Oznaczając S - punkt spiętrzenia (stagnacji) strugi v=0,
Paweł Stasiak Radosław Sobieraj Michał Wronko
Klasyfikacja dokumentów za pomocą sieci radialnych
Metody Symulacyjne w Telekomunikacji (MEST) Wykład 4: Generowanie zdarzeń  Dr inż. Halina Tarasiuk p. 337, tnt.tele.pw.edu.pl.
Wykonawcy:Magdalena Bęczkowska Łukasz Maliszewski Piotr Kwiatek Piotr Litwiniuk Paweł Głębocki.
Automatyka Wykład 3 Modele matematyczne (opis matematyczny) liniowych jednowymiarowych (o jednym wejściu i jednym wyjściu) obiektów, elementów i układów.
POJĘCIE ALGORYTMU Pojęcie algorytmu Etapy rozwiązywania zadań
O relacjach i algorytmach
Analiza współzależności cech statystycznych
Metody Lapunowa badania stabilności
Wykład 25 Regulatory dyskretne
Obserwatory zredukowane
MECHANIKA 2 Wykład Nr 11 Praca, moc, energia.
Elementy Rachunku Prawdopodobieństwa i Statystyki
Podstawy działania wybranych usług sieciowych
Systemy wspomagania decyzji
Modelowanie i Identyfikacja 2011/2012 Metoda propagacji wstecznej Dr hab. inż. Kazimierz Duzinkiewicz, Katedra Inżynierii Systemów Sterowania 1 Warstwowe.
Miary efektywności/miary dobroci/kryteria jakości działania SSN
Dekompozycja Kalmana systemów niesterowalnych i nieobserwowalnych
Wykład 22 Modele dyskretne obiektów.
II. Matematyczne podstawy MK
Obserwowalność i odtwarzalność
Sterowanie – metody alokacji biegunów II
Źródła błędów w obliczeniach numerycznych
ZWIĄZKI MIĘDZY KLASAMI KLASY ABSTRAKCYJNE OGRANICZENIA INTERFEJSY SZABLONY safa Michał Telus.
Modelowanie obiektowe Diagramy klas
SYSTEMY EKSPERTOWE I SZTUCZNA INTELIGENCJA
SYSTEMY EKSPERTOWE I SZTUCZNA INTELIGENCJA
VI EKSPLORACJA DANYCH Zadania eksploracji danych: klasyfikacja
Elementy geometrii analitycznej w przestrzeni R3
SYSTEMY EKSPERTOWE I SZTUCZNA INTELIGENCJA
Obliczalność czyli co da się policzyć i jak Model obliczeń sieci liczące dr Kamila Barylska.
Model obiektowy bazy danych
Systemy dynamiczne 2014/2015Obserwowalno ść i odtwarzalno ść  Kazimierz Duzinkiewicz, dr hab. in ż. Katedra In ż ynierii Systemów Sterowania 1 Obserwowalność.
Warstwowe sieci jednokierunkowe – perceptrony wielowarstwowe
Metody Inteligencji Obliczeniowej
GeneracjeTechnologia Architektura przetwarzania 0. Przekaźniki elektromechaniczne 1. Lampy elektronowe 2. Tranzystory 3. Układy scalone 3.5.Układy dużej.
 Formuła to wyrażenie algebraiczne (wzór) określające jakie operacje ma wykonać program na danych. Może ona zawierać liczby, łańcuchy znaków, funkcje,
Metody Inteligencji Obliczeniowej Adrian Horzyk Adrian Horzyk Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii.
Metody sztucznej inteligencji - Technologie rozmyte i neuronowe 2015/2016 Systemy rozmyte – wnioskowanie Mamdani’ego II © Kazimierz Duzinkiewicz, dr hab.
STATYSTYKA – kurs podstawowy wykład 8 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Programowanie strukturalne i obiektowe Klasa I. Podstawowe pojęcia dotyczące programowania 1. Problem 2. Algorytm 3. Komputer 4. Program komputerowy 5.
Systemy neuronowo – rozmyte
Wstęp do Informatyki - Wykład 6
Systemy Ekspertowe i Sztuczna Inteligencja trudne pytania
Selekcja danych Korelacja.
POJĘCIE ALGORYTMU Wstęp do informatyki Pojęcie algorytmu
Podstawy teorii spinu ½
Zapis prezentacji:

SZTUCZNA INTELIGENCJA ARTIFICIAL INTELLIGENCE WYKŁAD 8 METODY ROZPOZNAWANIA OBRAZÓW Dr hab. inż. Barbara Dębska, prof. PWSZ KROSNO Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

Atrybut Klasa KNN LLM Macierz odległości MLC WYKAZ UŻYWANYCH SKRÓTÓW I POJĘĆ W SYSTEMACH KLASYFIKACJI I ROZPOZNAWANIA OBRAZÓW Atrybut – składowa wektora opisująca badany obiekt. Klasa – zbiór obiektów mających taką samą wartość atrybutu decyzyjnego. KNN – metoda K – tego najbliższego sąsiada (ang. K – Nearest Neighbor). LLM – algorytm uczącej się maszyny (ang. Linear Learning Machine). Macierz odległości – macierz o rozmiarach n  n, której elementami są wartości odległości pomiędzy obiektami, należącymi do badanego zbioru. MLC – moduł systemu SCANKEE, jego skrót pochodzi od słów: Multistrategy Learning Classifier, czyli Podsystem Uczenia Komputera wykorzystujący w tym celu algorytmy rozpoznawania obrazów. Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

Obiekt Obraz Zbiór testowy Zbiór treningowy WYKAZ UŻYWANYCH SKRÓTÓW I POJĘĆ W SYSTEMACH KLASYFIKACJI I ROZPOZNAWANIA OBRAZÓW c.d. Obiekt – badany element zbioru, związek, materiał (wyrób), któremu przypisuje się cechy (właściwości, atrybuty). Obraz – zbiór wartości cech opisujących jeden obiekt. Zbiór testowy – stanowi plik zawierający nowe, nie znane obiekty służące do sprawdzania poprawności procesu „uczenia się” komputera.  Zbiór treningowy – zbiór przykładów stanowiących bazę danych wykorzystywanych w procesie „uczenia się” komputera. Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

Metody rozpoznawania obrazów Ogólnie, celem rozpoznawania obrazów jest pogrupowanie obiektów do poszczególnych klas, na podstawie zaobserwowanych danych. W związku z tym proces rozpoznawania obrazów (ang. pattern recognition) musi obejmować: wykrycie, percepcję i rozpoznawanie prawidłowości w zbiorze parametrów, opisujących obiekt lub zdarzenie. Nazwa systemy „uczące się” rozpoznawania obrazów, obejmuje grupę systemów informatycznych wykorzystujących metodę rozpoznawania obrazów, i pochodzi ona od wzrastającej zdolności poprawnej klasyfikacji obiektów w miarę wzrostu doświadczenia systemu. Sposób działania oparty jest o tzw. uczenie nadzorowane, w którym badaniu podlega wewnętrzna struktura zbioru zdefiniowanych danych, która może być wykorzystana w procesie klasyfikacji. Systemy rozpoznawania obrazów składają się z trzech współzależnych bloków, są to: przetwornik, procesor i klasyfikator. Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

Ogólny schemat systemu rozpoznawania obrazów Dane wejściowe Przetwornik Procesor Klasyfikator Dane wyjściowe Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

Wyznaczanie funkcji decyzyjnej to tzw. proces „uczenia się”. Przetwornik – przekształca źródłowe dane w postać czytelną dla komputera, najczęściej jest to n – elementowy wektor obrazu, gdzie n oznacza liczbę cech opisujących dany przedmiot lub zjawisko. Procesor – przygotowuje wektory obrazu do klasyfikacji. Klasyfikator – klasyfikuje przetworzone obiekty. Klasyfikacja odbywa się za pomocą funkcji decyzyjnej F(X), wyznaczonej na podstawie zbioru uczącego, zawierającego przetworzone wektory obrazów. Funkcja ta musi spełnić dwa warunki: F(X) > 0 dla X będących elementami klasy 1, F(X)  0 dla X będących elementami klasy 2. Wyznaczanie funkcji decyzyjnej to tzw. proces „uczenia się”. Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

Binarne klasyfikatory obrazów LLM (Linear Learning Machine) Obiekty dzieli się na dwie klasy (klasę (+) i klasę (–)) wyznaczając, tzw. liniową funkcję rozdzielającą, zwaną też funkcją wagową. Oblicza się iloczyn skalarny wektora wagowego i wektora obrazu: S = w1 x1 + w2 x2 + ... + wd xd Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

Zasada klasyfikacji dwójkowej: Wektor obrazu charakteryzujący obiekt Klasyfikator dwójkowy Decyzja, do której klasy należy obiekt Schemat algorytmu uczenia i oceny klasyfikatora binarnego Zbiór obrazów o znanej przynależności do klas Zbiór uczący Zbiór testujący Klasa 1 Klasa 2 Klasa 1 Klasa 2 Uczenie Ocena Klasyfikator S = w * x = w * x* cos() Ocena klasyfikatora polegająca na określeniu jego zdolności przewidywania (procentu poprawnie sklasyfikowanych obrazów zbioru testującego) Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

INDEKSY OCENY KALSYFIKATORA N – liczba klasyfikowanych obiektów N1 – liczba obiektów należących do klasy 1 N2 – liczba obiektów należących do klasy 2 Poprawna klasyfikacja: N1cN1 – liczba obiektów należących do klasy 1 i zakwalifikowanych do klasy 1 N2cN2 – liczba obiektów należących do klasy 2 i zakwalifikowanych do klasy 2 Błędna klasyfikacja: N1cN2 – liczba obiektów należących do klasy 1 i zakwalifikowanych do klasy 2 N2cN1 – liczba obiektów należących do klasy 2 i zakwalifikowanych do klasy 1 GQ (Global Quality) – ogólny (globalny) indeks poprawnej klasyfikacji ERC (Error Classifier) – ogólny indeks błędnej klasyfikacji QI (Quality Index) – indeks poprawności Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

INDEKSY OCENY KALSYFIKATORA c.d. (Zachodzi: GQ + ERC = 100%) Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

W procesie uczenia wektor wagowy poddawany jest korekcji: Od wartości iloczynu skalarnego S wektora wagowego W i wektora X obrazu zależy klasyfikacja obiektu: Jeżeli S > 0 to X należy do klasy 1. Jeżeli S  0 to X należy do klasy 2. Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

Liniowy podział z martwą strefą Gdy nie można dokonać jednoznacznego podziału zbioru na dwie klasy, wyznacza się tzw. wartość progową t. Jeśli: S > t to X należy do klasy 1, S  - t to X należy do klasy 2, - t< S < t to X należy do tzw. obszaru martwego i nie podlega klasyfikacji. Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

KLASYFIKACJA METODĄ POMIARU ODLEGŁOŚCI OD ŚRODKA CIĘŻKOŚCI Jeżeli punkty odpowiadające obrazom pewnej klasy tworzą zwarte skupienia w przestrzeni obrazów, to klasę tę można przedstawić za pomocą obliczonego środka ciężkości c (c1 i c2). Nieznany obiekt x zalicza się do tej klasy, która ma najbliżej położony środek ciężkości. Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

KLASYFIKACJA METODĄ KNN (K-Nearest Neighbour) Algorytm KNN (k-tego najbliższego sąsiada) jest metodą w której wyszukuje się K – przykładów (obiektów) należących do zbioru treningowego (K – jest zawsze nieparzyste), a obiektowi badanemu przypisuje się tę klasę, którą wykazuje ważona większość odszukanych, najbliżej położonych przykładów treningowych, zwanych często najbliższymi sąsiadami – jest tzw. metoda głosowania. Podstawową rolę w algorytmie najbliższego sąsiada odgrywa miara odległości pomiędzy obiektem nieznanym, a przykładami zbioru treningowego (uczącego). Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

KLASYFIKACJA METODĄ KNN (K-Nearest Neighbour) c.d. Niech X (x1,x2,x3, … ,xd), Z (z1, z2, z3, … ,zd) i U (u1, u2,u3, … , ud) będą punktami w d – wymiarowej przestrzeni przykładów. Dowolna funkcja D (X, Z) spełniająca następujące warunki: jest funkcją odległości. Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

dla k = 2, wzór przedstawia, tzw. odległość Euklidesową, Miara odległości w d-wymiarowej przestrzeni obrazów wyraża się wzorem Minkowskiego: dla k = 2, wzór przedstawia, tzw. odległość Euklidesową, Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

dla k = 1 otrzymujemy, tzw. odległość City – Block (inaczej Manhatan): jeśli Xi oraz Zi są kodowane binarnie (0 lub 1), mamy odległość Hamminga: gdzie: XOR – to operacja logiczna, której wynikiem jest zero, jeśli xi = zi a jeden jeśli xi  zi Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

znormalizowana odległość Hamminga (zwana odległością Tanimoto), używana wtedy, gdy jedynie niewielka liczba współrzędnych wektorów x, z przyjmuje wartość jeden: gdzie: ‘AND’ – koniunkcja cech xi , zi, ‘OR” – alternatywa cech xi , zi, Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

Moduł MLC systemu SCANKEE Zaimplementowano dwa algorytmy : LLM oraz KNN Reprezentacja wiedzy jest tutaj przedstawiona za pomocą formalizmu zwanego: asocjacją wiedzy. Powstał on z myślą rozwiązywania problemów klasyfikacji, w których można dokonać się logicznego podziału składowych opisujących obiekt na trzy rozłączne zbiory A, B i C: Przyczyna A Przyczyna B Rezultat C Potrzeby i doświadczenie badacza określają, które atrybuty (składowe wektora opisującego pojedynczy przykład) należy umieścić w zbiorach A, B i C. Gdy podział atrybutów na zbiory A i B nie odgrywa wyraźnej roli, można trójelementową asocjację uprościć do dwuelementowej: Przyczyna A i Przyczyna B Rezultat C daje Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

Stosowanie trójelementowej asocjacji może być jednak w szczególności ważne dla przypadków w których, np. gdy zmieniają się wartości atrybutów w zbiorze B (podczas gdy wartości atrybutów w zbiorze A są stałe) w efekcie otrzymujemy różny rezultat C: Przyczyna B Przyczyna A Rezultat C Moduł MLC umożliwia budowanie baz i przetwarzanie wiedzy zgromadzonej w bazach danych analitycznych. Bazy te opisują parametry badanego procesu i mogą być z łatwością aktualizowane i rozszerzane (MLC ma własny edytor). Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

W procesie przetwarzania danych, zarówno algorytm LLM jak i KNN wykorzystuje specjalnie tworzone dla jego potrzeb kopie danych zwane zbiorami roboczymi, które zawierają skompresowane i skompilowane dane pobrane z bazy wiedzy. Podczas tworzenia zbioru roboczego obliczane są dodatkowo parametry statystyczne oraz wyszukiwane są korelacje pomiędzy poszczególnymi atrybutami, w efekcie czego mogą być usuwane atrybuty lub przykłady Ważną cechą procesu przetwarzania wiedzy w module KNN jest możliwość wędrowania (termin ang.: walk) w obu kierunkach: od lewej do prawej (klasyfikacja) lub z prawej do lewej (predykcja), stąd też wywodzi się nazwa omawianego algorytmu „patrz – w – przód – i – wstecz – KNN”. Algorytm ten wywodzi się z klasycznej metody jednego sąsiada. Przyjęty formalizm wiedzy umożliwia prowadzenie badań w dwóch kierunkach: w przód – czyli odpowiedź na pytanie: do jakiej klasy będzie należał nieznany obiekt (przykład), wstecz – czyli odpowiedź na pytanie: jakie powinny być wartości atrybutów opisujących nieznany obiekt (przykład), by warunkowały klasę do której powinien należeć. Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

Algorytm ten może mieć szczególne znaczenie w rozwiązywaniu zagadnień klasyfikacji, dla których nie poznano modelu matematycznego, lub – gdy opracowanie takiego modelu jest zbyt skomplikowane. Wnioskowanie, oparte na logice asocjacyjnej, ma szczególne znaczenie w technologii materiałowej, jak: metalurgia, przemysł szkła, ceramiki, przemysł gumowy, czy technologia tworzyw sztucznych – tam, gdzie poszukuje się związków pomiędzy składem mieszaniny i parametrami procesu technologicznego, a właściwościami wyrobów. Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

Algorytmy przetwarzające dane w module MLC: klasyfikacja metodą LLM, klasyfikacja metodą KNN, obsługa bazy danych, kreowanie zbioru roboczego, obsługa zbioru roboczego utworzonego dla metody LLM, obsługa zbioru roboczego utworzonego dla metody KNN. Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

Zakładanie nowej bazy danych wymaga w pierwszej kolejności zdefiniowania cech typu A, B oraz C lub tylko cech A i C. Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

Należy również dokładnie zdefiniować każdą z cech: Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

Każdy z obiektów wprowadzany jest oddzielnie przez podanie wartości atrybutów definiujących wektory danych typu A, B oraz C: Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

W ten sposób definiowane są kolejne asocjacje bazy danych: Utworzony zbiór przykładów stanowi tzw. bazę źródłową. Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

Na jej podstawie kreowane są zbiory robocze odrębne dla metody LLM oraz KNN na których przeprowadza się uczenie komputera. Mogą być automatyczne weryfikowane metodami statystycznymi umożliwiającymi krytyczną ocenę danych, wykrycie błędów, redundantnych parametrów oraz zbędnych danych. Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

Trzeba zadać liczbę najbliższych sąsiadów badanego obiektu. Wybrane z okna podmenu klasyfikacji powoduje wyświetlenie danych klasyfikowanego wektora. Trzeba zadać liczbę najbliższych sąsiadów badanego obiektu. Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

Zbiorcze wyniki klasyfikacji w postaci listy „najbliższych sąsiadów”: Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

Szczegółowe wyniki klasyfikacji - właściwości produktu obliczone jako średnia ważona, wyznaczona na podstawie listy najbliższych sąsiadów: Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

Można również zobaczyć położenie klasyfikowanego obiektu na tle zbioru treningowego (uczącego): Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

W procesie predykcji zadaje się oczekiwane wartości cech produktu, czyli współrzędne wektora typu C: Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

W rezultacie otrzymuje się przedziały zmienności cech określających wartości współrzędnych wektorów typu A i B, czyli np. proponowany skład mieszaniny surowców i parametry procesu produkcji: Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

Dziękuję za uwagę Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno