Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

Inteligencja Obliczeniowa Reguły logiczne i ich stosowanie. Wykład 22 Włodzisław Duch Uniwersytet Mikołaja Kopernika.

Podobne prezentacje


Prezentacja na temat: "Inteligencja Obliczeniowa Reguły logiczne i ich stosowanie. Wykład 22 Włodzisław Duch Uniwersytet Mikołaja Kopernika."— Zapis prezentacji:

1 Inteligencja Obliczeniowa Reguły logiczne i ich stosowanie. Wykład 22 Włodzisław Duch Uniwersytet Mikołaja Kopernika

2 Co było Neuro-fuzzy Feature Space Mapping - motywacje Funkcje transferu

3 Co będzie Stosowanie reguł: niepewność pomiaru. Dokładność - prostota reguł. Odrzucanie i stopień zaufania do reguł. Od danych do systemu ekspertowego.

4 Stosowanie reguł Dane: obarczone nieznanym błędem; zakładamy Gaussowski rozkład: x - liczba rozmyta, z Gaussowską funkcją przynależności. Zestaw reguł logicznych R zastosowany do liczb rozmytych: jeśli wykonać symulacje Monte Carlo da p(C i |X). Analityczna ocena p(C|X) oparta jest na f. kumulującej: dokładność przybliżenia f. błędu logistyczną < 0.02

5 Rozmywanie reguł Reguła R a (x) = {x a} spełniona jest przez G x z prawd. F. błędu jest przybliżoną f. logistyczną; odpowiada to założeniu rozkładu błędu typu (x)(1- (x)), dla s 2 =1.7 przybliża f. Gaussa z dokładnością <3.5% Różnica dwóch sigmoid, f. przynależności typu miękkiego trapezoidu. Wniosek: logika rozmyta z f. przynależności (x) (x-b) jest równoważna klasycznej przy założeniu Gaussowskich niepewności rozkładu.

6 Optymalizacja reguł Fuzzy: duże pola recepcyjne, ocena z grubsza. G x - niepewność pomiaru, małe pola recepcyjne. Minimalizacja liczby błędów dla klasyfikatora regułowego: trudna, metody niegradientowe, wolno zbieżne. Minimalizacja z uwzględnieniem niepewności: Optymalizacja gradientowa, działa nawet dla >1000 parametrów (opisujących kształt i położenie przedziałów dla przesłanek). Najprościej: wspólny parametr s x dla grupy cech. Możliwe inne funkcje błędu.

7 Zalety 1) Zbiór ciągłych prawd. zamiast 0,1 ocen; 2) Niesklasyfikowane wektory mają niezerowe prawd. 3) Dyspersje s x mogą być parametrami adaptacyjnymi. Obliczanie prawdopodobieństw dla wielu przesłanek. Dla koniunkcji przesłanek R=r 1 (x 1 ) r 2 (x 2 ).. r k (x k ) jeśli r i są niezależne (ortogonalne) wystarczy iloczyn p(r i ). Jeśli reguły się nakrywają nie można dodawać p bo policzymy wielokrotnie to samo. Odtworzenie symulacji Monte Carlo wymaga: (R C - reguły dla klasy C)

8 Odrzucanie Prostota reguł vs. dokładność. Zaufanie do reguł vs. wektory odrzucone. Zdefiniujmy macierz rozrzutu F(C i,C j |M) = N ij /N częstość przypisania klasy C j do klasy C i przez reguły M. Dla 2 klas: Wrażliwość reguł: S e =F ++ /(F ++ +F + ) [0,1] Specyficzność: S p =F /(F +F ) [0,1] S e =1 klasa nigdy nie jest przypisywana do + S p =1 klasa + nigdy nie jest przypisywana do Minimalizacja l. pomyłek: możliwe wektory odrzucone, węższe przedziały. Max. liczby poprawnych wektorów.

9 Zastosowania Szczegółowy przykład dla danych Iris.dla danych Iris Przykłady rzeczywistych zastosowań:rzeczywistych zastosowań Grzyby: dane czysto symboliczne. 3 Mnichów: sztuczne dane symboliczne. Dane Medyczne: Rak piersi - nawroty (Ljubliana) Rak piersi - złośliwość (Wisconsin) Badania przesiewowe tarczycy. Badania psychometryczne Dane techniczne: NASA Shuttle

10 Grzyby Dane z książki, w której wyraźnie napisano: nie ma łatwego sposobu odróżnienia jadalnych od niejadalnych i trujących przypadki, 22 cechy symboliczne, razem 118 wartości logicznych, czyli = możliwych wektorów binarnych.22 cechy symboliczne 2480 brakujących wartości cechy stalk-root 51.8% jadalnych, 48.2% niejadalnych. Grzyb jest jadalny jeśli: odor = (almond anise none) spore-print-color = green 48 błędów, 99.41% dokładności Węch - najważniejszy zmysł; Jakie receptory pozwalają odróżnić zapach anyżu i migdałów? Reguła z MLP2LN. Prosta sieć, automatyczna analiza funkcji logicznych i sprawdzania ich poprawności (program w Prologu).

11 Grzyby - reguły Reguły dla grzybów trujących R 1 ) odor = (almond anise none); 120 błędów, 98.52% R 2 ) spore-print-color = green48 błędów, 99.41% R 3 ) odor = none stalk-surface-below-ring = scaly stalk-color-above-ring = brown 8 błędów, 99.90% R 4 ) habitat = leaves cap-color = white0 błędów! R 1 + R 2 stabilne, wychodzą nawet na 10% danych; R 3 i R 4 można zamienić na: R' 3 ): gill-size = narrow stalk-surface-above-ring = (silky scaly) R' 4 ): gill-size = narrow population = clustered Wystarczy 5 cech! 100% dokładności w testach CV. Dane całkowicie zrozumiałe.

12 Rak piersi - nawroty (Ljubliana) Po wycięciu guza zdarzają się nawroty: czy można je przewidzieć? 286 przypadków, 201 bez nawrotów (70.3%), 85 z nawrotami (29.7%) 9 cech symbolicznych, 2 do 13 wartości: wiek (9 przedziałów), wielkość guza (12 przedziałów), liczba guzów (13 przedziałów), złośliwość (1,2,3), kwadrant lub centrum; napromieniowanie itd. Reguła: Jeśli (l. guzów > [0,2] złośliwość = 3 To nawrót ELSE brak nawrotu ma dokładność 77% na całym zbiorze; najlepsze systemy nie dają więcej niż 78% przy bardziej złożonym opisie. Cała wiedza zawarta w tej bazie to: Złośliwe raki z przerzutami dają nawroty. Problem: jak znaleźć jedną, stabilną regułę w kroswalidacji?

13 Budowa systemów regułowych Analiza psychometrycznych kwestionariuszy: jak zbudować system wspomagający diagnozy w oparciu o interpretację danych tekstowych? System analizy danych i indukcji reguł pozwalający na wspomaganie decyzji - IDSS (Intelligent Decision Support System)

14 Psychometria Test: kwestionariusz, odpowiedzi na pytania.odpowiedzi na pytania MMPI (Minnesota Multiphasic Personality Inventory) - typowy test. Skanowanie formularzySkanowanie formularzy. 1.Odpowiedzi na 550 pytań - czyste dane. 2.Rezultaty kombinuje się liniowo z współczynnikami ustalonymi przez psychometrów, tworząc 14 skal. 3.Każda skala mierzy tendencje do oszukiwania, unikania odpowiedzi, hipochondrii, depresji, paranoi, schizofrenii itp.Każda skala 4.Interpretacji podlega psychogram, czyli histogram skal. Interpretacja zależy od intuicji i doświadczenia psychometry.psychogram Czy można zrobić sztucznego psychometrę? Dokładność interpretacji: < 70% zgodności pomiędzy dwoma ekspertami?

15 Dane do analizy. Około 1600 przypadków dla kobiet i tyle samo dla mężczyzn. 27 klas: norma, psychopatia, zespół urojeniowy, schizofrenia, paranoja, nerwica, stan maniakalny, symulacja, dyssymulacja, alkoholizm, narkomania, skłonności przestępcze, zmiany organiczne w mózgu... Etap tworzenia reguł: przesłanki to wartości ciągłe, 14 skal. FSM, MLP2LN, drzewo decyzji - około 2-3 reguł/klasę. SystemDaneL. regułDokładność %Po rozmyciu % C FSM CV daje 82-85% z FSM i 79-84% z C4.5. Rozmycie poprawia wyniki dla FSM do 90-92%

16 Wyniki Prawdopodobieństwa przynależności do klas. Analiza dopasowania reguł i szczegółowa analiza przyczyn. Werbalne interpretacje przypadków. Prezentacja danego przypadku w relacji do pozostałych. relacji do pozostałych

17 Koniec wykładu 22 Dobranoc !


Pobierz ppt "Inteligencja Obliczeniowa Reguły logiczne i ich stosowanie. Wykład 22 Włodzisław Duch Uniwersytet Mikołaja Kopernika."

Podobne prezentacje


Reklamy Google