SZTUCZNA INTELIGENCJA ARTIFICIAL INTELLIGENCE

SZTUCZNA INTELIGENCJA ARTIFICIAL INTELLIGENCE
WYKŁAD 8 METODY ROZPOZNAWANIA OBRAZÓW Dr hab. inż. Barbara Dębska, prof. PWSZ KROSNO Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

Atrybut Klasa KNN LLM Macierz odległości MLC
WYKAZ UŻYWANYCH SKRÓTÓW I POJĘĆ W SYSTEMACH KLASYFIKACJI I ROZPOZNAWANIA OBRAZÓW Atrybut – składowa wektora opisująca badany obiekt. Klasa – zbiór obiektów mających taką samą wartość atrybutu decyzyjnego. KNN – metoda K – tego najbliższego sąsiada (ang. K – Nearest Neighbor). LLM – algorytm uczącej się maszyny (ang. Linear Learning Machine). Macierz odległości – macierz o rozmiarach n  n, której elementami są wartości odległości pomiędzy obiektami, należącymi do badanego zbioru. MLC – moduł systemu SCANKEE, jego skrót pochodzi od słów: Multistrategy Learning Classifier, czyli Podsystem Uczenia Komputera wykorzystujący w tym celu algorytmy rozpoznawania obrazów. Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

Obiekt Obraz Zbiór testowy Zbiór treningowy
WYKAZ UŻYWANYCH SKRÓTÓW I POJĘĆ W SYSTEMACH KLASYFIKACJI I ROZPOZNAWANIA OBRAZÓW c.d. Obiekt – badany element zbioru, związek, materiał (wyrób), któremu przypisuje się cechy (właściwości, atrybuty). Obraz – zbiór wartości cech opisujących jeden obiekt. Zbiór testowy – stanowi plik zawierający nowe, nie znane obiekty służące do sprawdzania poprawności procesu „uczenia się” komputera. Zbiór treningowy – zbiór przykładów stanowiących bazę danych wykorzystywanych w procesie „uczenia się” komputera. Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

Metody rozpoznawania obrazów
Ogólnie, celem rozpoznawania obrazów jest pogrupowanie obiektów do poszczególnych klas, na podstawie zaobserwowanych danych. W związku z tym proces rozpoznawania obrazów (ang. pattern recognition) musi obejmować: wykrycie, percepcję i rozpoznawanie prawidłowości w zbiorze parametrów, opisujących obiekt lub zdarzenie. Nazwa systemy „uczące się” rozpoznawania obrazów, obejmuje grupę systemów informatycznych wykorzystujących metodę rozpoznawania obrazów, i pochodzi ona od wzrastającej zdolności poprawnej klasyfikacji obiektów w miarę wzrostu doświadczenia systemu. Sposób działania oparty jest o tzw. uczenie nadzorowane, w którym badaniu podlega wewnętrzna struktura zbioru zdefiniowanych danych, która może być wykorzystana w procesie klasyfikacji. Systemy rozpoznawania obrazów składają się z trzech współzależnych bloków, są to: przetwornik, procesor i klasyfikator. Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

Ogólny schemat systemu rozpoznawania obrazów
Dane wejściowe Przetwornik Procesor Klasyfikator Dane wyjściowe Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

Wyznaczanie funkcji decyzyjnej to tzw. proces „uczenia się”.
Przetwornik – przekształca źródłowe dane w postać czytelną dla komputera, najczęściej jest to n – elementowy wektor obrazu, gdzie n oznacza liczbę cech opisujących dany przedmiot lub zjawisko. Procesor – przygotowuje wektory obrazu do klasyfikacji. Klasyfikator – klasyfikuje przetworzone obiekty. Klasyfikacja odbywa się za pomocą funkcji decyzyjnej F(X), wyznaczonej na podstawie zbioru uczącego, zawierającego przetworzone wektory obrazów. Funkcja ta musi spełnić dwa warunki: F(X) > 0 dla X będących elementami klasy 1, F(X)  0 dla X będących elementami klasy 2. Wyznaczanie funkcji decyzyjnej to tzw. proces „uczenia się”. Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

Binarne klasyfikatory obrazów LLM (Linear Learning Machine)
Obiekty dzieli się na dwie klasy (klasę (+) i klasę (–)) wyznaczając, tzw. liniową funkcję rozdzielającą, zwaną też funkcją wagową. Oblicza się iloczyn skalarny wektora wagowego i wektora obrazu: S = w1 x1 + w2 x wd xd Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

Zasada klasyfikacji dwójkowej:
Wektor obrazu charakteryzujący obiekt Klasyfikator dwójkowy Decyzja, do której klasy należy obiekt Schemat algorytmu uczenia i oceny klasyfikatora binarnego Zbiór obrazów o znanej przynależności do klas Zbiór uczący Zbiór testujący Klasa 1 Klasa 2 Klasa 1 Klasa 2 Uczenie Ocena Klasyfikator S = w * x = w * x* cos() Ocena klasyfikatora polegająca na określeniu jego zdolności przewidywania (procentu poprawnie sklasyfikowanych obrazów zbioru testującego) Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

INDEKSY OCENY KALSYFIKATORA
N – liczba klasyfikowanych obiektów N1 – liczba obiektów należących do klasy 1 N2 – liczba obiektów należących do klasy 2 Poprawna klasyfikacja: N1cN1 – liczba obiektów należących do klasy 1 i zakwalifikowanych do klasy 1 N2cN2 – liczba obiektów należących do klasy 2 i zakwalifikowanych do klasy 2 Błędna klasyfikacja: N1cN2 – liczba obiektów należących do klasy 1 i zakwalifikowanych do klasy 2 N2cN1 – liczba obiektów należących do klasy 2 i zakwalifikowanych do klasy 1 GQ (Global Quality) – ogólny (globalny) indeks poprawnej klasyfikacji ERC (Error Classifier) – ogólny indeks błędnej klasyfikacji QI (Quality Index) – indeks poprawności Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

INDEKSY OCENY KALSYFIKATORA c.d.
(Zachodzi: GQ + ERC = 100%) Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

W procesie uczenia wektor wagowy poddawany jest korekcji:
Od wartości iloczynu skalarnego S wektora wagowego W i wektora X obrazu zależy klasyfikacja obiektu: Jeżeli S > 0 to X należy do klasy 1. Jeżeli S  0 to X należy do klasy 2. Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

Liniowy podział z martwą strefą
Gdy nie można dokonać jednoznacznego podziału zbioru na dwie klasy, wyznacza się tzw. wartość progową t. Jeśli: S > t to X należy do klasy 1, S  - t to X należy do klasy 2, - t< S < t to X należy do tzw. obszaru martwego i nie podlega klasyfikacji. Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

KLASYFIKACJA METODĄ POMIARU ODLEGŁOŚCI OD ŚRODKA CIĘŻKOŚCI
Jeżeli punkty odpowiadające obrazom pewnej klasy tworzą zwarte skupienia w przestrzeni obrazów, to klasę tę można przedstawić za pomocą obliczonego środka ciężkości c (c1 i c2). Nieznany obiekt x zalicza się do tej klasy, która ma najbliżej położony środek ciężkości. Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

KLASYFIKACJA METODĄ KNN (K-Nearest Neighbour)
Algorytm KNN (k-tego najbliższego sąsiada) jest metodą w której wyszukuje się K – przykładów (obiektów) należących do zbioru treningowego (K – jest zawsze nieparzyste), a obiektowi badanemu przypisuje się tę klasę, którą wykazuje ważona większość odszukanych, najbliżej położonych przykładów treningowych, zwanych często najbliższymi sąsiadami – jest tzw. metoda głosowania. Podstawową rolę w algorytmie najbliższego sąsiada odgrywa miara odległości pomiędzy obiektem nieznanym, a przykładami zbioru treningowego (uczącego). Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

KLASYFIKACJA METODĄ KNN (K-Nearest Neighbour) c.d.
Niech X (x1,x2,x3, … ,xd), Z (z1, z2, z3, … ,zd) i U (u1, u2,u3, … , ud) będą punktami w d – wymiarowej przestrzeni przykładów. Dowolna funkcja D (X, Z) spełniająca następujące warunki: jest funkcją odległości. Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

dla k = 2, wzór przedstawia, tzw. odległość Euklidesową,
Miara odległości w d-wymiarowej przestrzeni obrazów wyraża się wzorem Minkowskiego: dla k = 2, wzór przedstawia, tzw. odległość Euklidesową, Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

dla k = 1 otrzymujemy, tzw. odległość City – Block (inaczej Manhatan):
jeśli Xi oraz Zi są kodowane binarnie (0 lub 1), mamy odległość Hamminga: gdzie: XOR – to operacja logiczna, której wynikiem jest zero, jeśli xi = zi a jeden jeśli xi  zi Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

znormalizowana odległość Hamminga (zwana odległością Tanimoto), używana wtedy, gdy jedynie niewielka liczba współrzędnych wektorów x, z przyjmuje wartość jeden: gdzie: ‘AND’ – koniunkcja cech xi , zi, ‘OR” – alternatywa cech xi , zi, Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

Moduł MLC systemu SCANKEE
Zaimplementowano dwa algorytmy : LLM oraz KNN Reprezentacja wiedzy jest tutaj przedstawiona za pomocą formalizmu zwanego: asocjacją wiedzy. Powstał on z myślą rozwiązywania problemów klasyfikacji, w których można dokonać się logicznego podziału składowych opisujących obiekt na trzy rozłączne zbiory A, B i C: Przyczyna A Przyczyna B Rezultat C Potrzeby i doświadczenie badacza określają, które atrybuty (składowe wektora opisującego pojedynczy przykład) należy umieścić w zbiorach A, B i C. Gdy podział atrybutów na zbiory A i B nie odgrywa wyraźnej roli, można trójelementową asocjację uprościć do dwuelementowej: Przyczyna A i Przyczyna B Rezultat C daje Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

Stosowanie trójelementowej asocjacji może być jednak w szczególności ważne dla przypadków w których, np. gdy zmieniają się wartości atrybutów w zbiorze B (podczas gdy wartości atrybutów w zbiorze A są stałe) w efekcie otrzymujemy różny rezultat C: Przyczyna B Przyczyna A Rezultat C Moduł MLC umożliwia budowanie baz i przetwarzanie wiedzy zgromadzonej w bazach danych analitycznych. Bazy te opisują parametry badanego procesu i mogą być z łatwością aktualizowane i rozszerzane (MLC ma własny edytor). Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

W procesie przetwarzania danych, zarówno algorytm LLM jak i KNN wykorzystuje specjalnie tworzone dla jego potrzeb kopie danych zwane zbiorami roboczymi, które zawierają skompresowane i skompilowane dane pobrane z bazy wiedzy. Podczas tworzenia zbioru roboczego obliczane są dodatkowo parametry statystyczne oraz wyszukiwane są korelacje pomiędzy poszczególnymi atrybutami, w efekcie czego mogą być usuwane atrybuty lub przykłady Ważną cechą procesu przetwarzania wiedzy w module KNN jest możliwość wędrowania (termin ang.: walk) w obu kierunkach: od lewej do prawej (klasyfikacja) lub z prawej do lewej (predykcja), stąd też wywodzi się nazwa omawianego algorytmu „patrz – w – przód – i – wstecz – KNN”. Algorytm ten wywodzi się z klasycznej metody jednego sąsiada. Przyjęty formalizm wiedzy umożliwia prowadzenie badań w dwóch kierunkach: w przód – czyli odpowiedź na pytanie: do jakiej klasy będzie należał nieznany obiekt (przykład), wstecz – czyli odpowiedź na pytanie: jakie powinny być wartości atrybutów opisujących nieznany obiekt (przykład), by warunkowały klasę do której powinien należeć. Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

Algorytm ten może mieć szczególne znaczenie w rozwiązywaniu zagadnień klasyfikacji, dla których nie poznano modelu matematycznego, lub – gdy opracowanie takiego modelu jest zbyt skomplikowane. Wnioskowanie, oparte na logice asocjacyjnej, ma szczególne znaczenie w technologii materiałowej, jak: metalurgia, przemysł szkła, ceramiki, przemysł gumowy, czy technologia tworzyw sztucznych – tam, gdzie poszukuje się związków pomiędzy składem mieszaniny i parametrami procesu technologicznego, a właściwościami wyrobów. Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

Algorytmy przetwarzające dane w module MLC:
klasyfikacja metodą LLM, klasyfikacja metodą KNN, obsługa bazy danych, kreowanie zbioru roboczego, obsługa zbioru roboczego utworzonego dla metody LLM, obsługa zbioru roboczego utworzonego dla metody KNN. Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

Zakładanie nowej bazy danych wymaga w pierwszej kolejności zdefiniowania cech typu A, B oraz C lub tylko cech A i C. Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

Należy również dokładnie zdefiniować każdą z cech:
Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

Każdy z obiektów wprowadzany jest oddzielnie przez podanie wartości atrybutów definiujących wektory danych typu A, B oraz C: Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

W ten sposób definiowane są kolejne asocjacje bazy danych:
Utworzony zbiór przykładów stanowi tzw. bazę źródłową. Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

Na jej podstawie kreowane są zbiory robocze odrębne dla metody LLM oraz KNN na których przeprowadza się uczenie komputera. Mogą być automatyczne weryfikowane metodami statystycznymi umożliwiającymi krytyczną ocenę danych, wykrycie błędów, redundantnych parametrów oraz zbędnych danych. Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

Trzeba zadać liczbę najbliższych sąsiadów badanego obiektu.
Wybrane z okna podmenu klasyfikacji powoduje wyświetlenie danych klasyfikowanego wektora. Trzeba zadać liczbę najbliższych sąsiadów badanego obiektu. Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

Zbiorcze wyniki klasyfikacji w postaci listy „najbliższych sąsiadów”:

Szczegółowe wyniki klasyfikacji - właściwości produktu obliczone jako średnia ważona, wyznaczona na podstawie listy najbliższych sąsiadów: Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

Można również zobaczyć położenie klasyfikowanego obiektu na tle zbioru treningowego (uczącego):

W procesie predykcji zadaje się oczekiwane wartości cech produktu, czyli współrzędne wektora typu C:

W rezultacie otrzymuje się przedziały zmienności cech określających wartości współrzędnych wektorów typu A i B, czyli np. proponowany skład mieszaniny surowców i parametry procesu produkcji: Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

Dziękuję za uwagę Dr hab. inż. Barbara Dębska, prof. PWSZ Krosno

SZTUCZNA INTELIGENCJA ARTIFICIAL INTELLIGENCE

Podobne prezentacje

Prezentacja na temat: "SZTUCZNA INTELIGENCJA ARTIFICIAL INTELLIGENCE"— Zapis prezentacji:

Podobne prezentacje

О projekcie

Zwrotny adres

Wejść

Zaloguj się poprzez sieć społeczną:

SZTUCZNA INTELIGENCJA ARTIFICIAL INTELLIGENCE

Podobne prezentacje

Prezentacja na temat: "SZTUCZNA INTELIGENCJA ARTIFICIAL INTELLIGENCE"— Zapis prezentacji:

Podobne prezentacje

О projekcie

Zwrotny adres