Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

Sztuczna Inteligencja Szukanie, gry i ludzkie myślenie Włodzisław Duch Katedra Informatyki Stosowanej UMK Google: W. Duch.

Podobne prezentacje


Prezentacja na temat: "Sztuczna Inteligencja Szukanie, gry i ludzkie myślenie Włodzisław Duch Katedra Informatyki Stosowanej UMK Google: W. Duch."— Zapis prezentacji:

1 Sztuczna Inteligencja Szukanie, gry i ludzkie myślenie Włodzisław Duch Katedra Informatyki Stosowanej UMK Google: W. Duch

2 Co będzie Gry planszowe. Szukanie i ludzkie myślenie. Paradoksy kognitywne. Reprezentacja wiedzy...

3 Warcaby 1952, Samuel, pierwszy program uczący się gry w warcaby. 1992, Chinook (J. Schaeffer, UoA) wygrywa US. Open. Program używa szukania Mistrzostwa człowiek-maszyna, Londyn 1992 Dr. Marion Tinsley, wygrał z Chinookiem 4-2, 33 remisy. Użyto 8-proc. stacji Silicon Graphics 4D/480, 256 MB RAM, baza danych wszystkich końcówek z 1-7 figurami + prawie połowa wszystkich partii z 8 figurami. 1994, remis 1-1 i 18 remisów. 1995, wygrana Chinooka 1-0 i 31 remisów. Użyto komputera SGI z 512 MB RAM. 2007, udowodniono, że najnowsza wersja Chinook nie może przegrać partii, warcaby uznano za w pełni rozwiązane.

4 Trik-trak, Othello Trik-trak (backgammon), popularny w Japonii. Zawiera element niepewności (rzut kostką). 1980, program BKG wygrał raz z mistrzem świata. 1992, program Tesauro, techniki jak dla warcabów + uczenie się (sieć neuronowa) lepszych ocen, ranking wśród 3 najlepszych graczy. 1995, Logistello zwycięża mistrza świata Takeshi Murakami do 6 do 0! Program grał parę tygodni sam z sobą poprawiając swoje funkcje oceny heurystycznej. Mistrzowskie rezultaty w wielu grach osiągnięto dopiero w latach 1990.w wielu grach Moc obliczeniowa to warunek konieczny, ale nie wystarczający...

5 Szachy – ogólnie Statyczna ocena sytuacji na planszy: liczba figur, wartość figur, położenie figur, możliwości ruchów. Funkcja oceny: suma W i F i, dobierz wsp. W i Zależność liczba ruchów - siła programu.liczba ruchów - siła Mistrz świata > 2800 punktów. Przewidywania na: 5 pełnych ruchów (10 poziomów) punktów. Od 5-10 poziomów mamy 200 p/poziom. Dla 10 ruchów ok punktów. Ok. 35 ruchów/poziom, heurystyki redukują to do 6/poz; dla 1000 ocen/sek, 150 sek/ruch, b=35, ok. 3-4 ruchy - nowicjusz. Zależność jakość-szybkość obliczeń.jakość-szybkość obliczeń

6 Szachy - historia. 1958, pierwszy program szachowy, Alex Bernstein. Szkocki międzynarodowy mistrz szachowy funduje nagrodę dla programu, który ogra go chociaż raz na cztery partie. W 1985 roku przegrał wszystkie cztery partie. 1985, HiTech wśród najlepszych 800 graczy, oceniał ok. 10 mln pozycji, w 1988 roku wygrał z arcymistrzem. Intel+IBM: szachy to dobra reklama Chess Genius na PC Pentium, kilka razy zwyciężył Gary Kasparova; czas grania ograniczono do 25 minut na zawodnika – Deep Blue przegrał z Kasparowem 2: – Deep Blue wygrał 3.5: – program Deep Fritz na PC remisuje z Vladimirem Kramnikiem Przez dwa miesiące Kramink trenował z programem Deep Fritz.

7 Deep Thought i Deep Blue Deep Thought, od 1985 roku, 4 studentów z USA (T. Hsu, T. Anantharaman, M. Campbell, A. Nowatzyk). Program Deep Blue (nowsze Deep Thought) + hardware do gry w szachy: 32 procesory IBM RS6000/SP ASIC. Ocenia milionów pozycji/sek! Duża biblioteka otwarć i końcówek. Deep Thought – szukanie alfa-beta, ok. 10 ruchów w skomplikowanych sytuacjach. Deep Blue - ok. 14 ruchów, 3000 punktów, pobił Kasparova. Reakcja prasy – potworna szybkość i pamięć zwyciężyły. Mózg: razy większa pamięć/szybkość więc to uwagi bez sensu!większa pamięć/szybkość Moc już nadchodziMoc już nadchodzi i będzie z nami …

8 Ostatni mecz... Kasparov vs. X3D Deep Fritz junior. Nowy Jork, listopad Mecz zakończył się remisem; główną atrakcją była gra w wirtualnej rzeczywistości. Komputer, na którym zainstalowany był program Fritz był około 100 razy wolniejszy niż Deep Blue i do tego zajęty generowaniem obrazu w 3 wymiarach, nic więc dziwnego, że mecz zakończył się remisem. PC stoi w kącie... następny taki mecz odbędzie się z programem działającym na telefonie? Najwięcej punktów Elo w historii miał Kasaprov, 2851, tylko 4 osoby w historii miały ponad 2800 punktów.punktów Elo Program Rybka oceniany jest (4/2011) na 3261 punktów a Houdini 3309 punktów.Rybkajest (4/2011)

9 Go: większe wyzwanie Liczba ruchów w Go to średnio 260 (szachy tylko 35). Liczba partii: (szachy ). Liczba różnych pozycji na planszy: (szachy ). Techniki szukania są mało przydatne: obecne programy są kiepskie na standardowej planszy 19x19, ale na poziomie mistrzowskim na planszach 9x9. Pierwszy program w 1968 roku, najlepszy obecnie Go4++ napisał M. Reiss, program jest znacznie lepszy od swojego twórcy. Konieczne do dobrego grania w Go jest: rozpoznawanie struktur (typ lokalnych konfiguracji), reprezentacja relacji przestrzennych, uczenie maszynowe, strategie i planowanie, metody reprezentacje wiedzy. Nagroda 1 mln $ dla programu, który pokona mistrza z Taiwanu! MoGoMoGo (Many Faces of Go, Ver. 12) na komputerze 15Tfl, Monte Carlo Tree Search (MCTS), wygrał z mistrzem Myungwan Kim (8 Dan), przy handicapie 9 kamieni. Więcej rezultatów komputerowego go.komputerowego go

10 Szukanie a ludzkie myślenie Jak ludzie rozwiązują problemy wymagające myślenia? Intuicja? Szachy: człowiek stosuje zmodyfikowane progresywne pogłębianie, ograniczone poszukiwanie w głąb, ocena w oparciu o heurystyki z doświadczenia. Intuicja = ogromna pamięć, rozpoznawanie wzorców – inne ograniczenia sprzętowe niż AI. ograniczenia sprzętowe Liczba pamiętanych prototypowych wzorców ~ Mistrz szachowy po 5-sek. ekspozycji układa średnio 23 figury z 25 na pokazanych pozycjach, nowicjusz 3 lub 4 figury. Figury ułożone przypadkowo taka sama liczba błędów. Szybki test poziomu gry w szachy.

11 Badania psychologiczne. Prezentacja 5 sekund, ruchy oczu mistrza i nowicjusza. Prezentacja dłuższa, od nowicjusza do mistrza. Największe różnice są w czasach reakcji i liczbie prawidłowo zapamiętanych figur.

12 Szukanie a ludzkie myślenie. Mechanizm porcjowania przy pamiętaniu złożonych struktur, mała pamięć robocza wymaga ciągłego porcjowania. Działa to trochę jak kompilacja przyrostowa. Szachy: uczenie + pamięć, rozpoznawanie wzorców, ocena sytuacji oparta na pamięci. Uwaga skupiona jest (rozwijana jest gałąź grafu) na obszarach słabszych, ocena wzrokowa wzorców struktur. Ekspert lepiej rozpoznaje i lepiej pamięta, ale tylko istotne struktury, znane z doświadczenia, a nie struktury przypadkowe. Porcjowanie jest wykorzystywane w mnemotechnice. Inteligencja jest ściśle związana z sytuacją, domeną wiedzy.

13 Złudzenia zmysłowe Zmysły często nas zwodzą, np. na tych obrazkach.

14 Złudzenia kognitywne Przeczytaj zdanie: FINISHED FILES ARE THE RE- SULT OF YEARS OF SCIENTIF- IC STUDY COMBINED WITH THE EXPERIENCE OF YEARS. Teraz policz ile jest liter F w tym zdaniu. Policz je TYLKO RAZ, nie cofaj się i nie powtarzaj liczenia.

15 Paradoksy ludzkiego myślenia Myślenie przebiega schematycznie, możliwe są złudzenia poznawcze. Przykład wnioskowania łatwy, trudniejszy i b. trudny (niemożliwy?) Każdy człowiek jest ssakiem. Sokrates jest człowiekiem. Wniosek: Sokrates jest ssakiem. Schemat: A => B, C=>A, więc C=>B Wniosek: żaden Rurytanin nie jest żeglarzem. Schemat: ~ A => B, C=>A, więc ~ C => B Żaden rolnik nie jest żeglarzem. Wszyscy Rurytanie to rolnicy.

16 Niemożliwy ? Wszyscy członkowie gabinetu to złodzieje. Żaden muzyk nie jest członkiem gabinetu. Wniosek:... muzycy ??? złodzieje Takie sylogizmy rozważano już w starożytności. Jest 256 możliwości ale tylko 24 poprawne. Pytanie: czemu jest tak trudno przeprowadzić proste rozumowanie?

17 Test karciany (Wason 1960) Na jednej stronie kart są cyfry, na drugiej litery. Które karty należy obrócić, by sprawdzić prawdziwość reguły: jeśli jest samogłoska to cyfra jest parzysta AK27 Ile minimalnie kart trzeba przewrócić?

18 Wariant Wasona W barze piją różni ludzie a nadchodzi policja. Przy stolikach mamy: 1.Pijących gin, nieznany wiek. 2.Pijących sok pomarańczowy, nieznany wiek. 3.Dorosły, nie wiadomo co pije. 4.Młodociany, nie wiadomo co pije. GS>< Kogo trzeba sprawdzić by się upewnić, że tylko dorośli piją alkohol? Znacznie łatwiej jest zgadnąć w tej sytuacji.

19 Martwić się czy nie? Załóżmy, że w Polsce 1 na 1000 osób ma wirusa HIV. Nowy test polegający na badaniu śliny, o dokładności 99.5%, wprowadzono do obowiązkowych badań okresowych. Test wypadł pozytywnie. Jakie jest prawdopodobieństwo, że osoba ma HIV?

20 Obiekty w przestrzeni cech Opis matematyczny reprezentuje obiekty O przy pomocy pomiarów, jakie na nich przeprowadzono, podając wartości cech {O i } => X(O i ), gdzie X j (O i ) jest wartością j-tej cechy opisującej O i Atrybut i cecha są często traktowane jako synonimy, chociaż ściśle ujmując wiek jest atrybutem a młody cechą, wartością. Typy atrybutów: kategoryczne: symboliczne, dyskretne – mogą mieć charakter nominalny (nieuporządkowany), np. słodki, kwaśny, gorzki, albo porządkowy, np. kolory w widmie światła, albo: mały < średni < duży (drink). ciągłe: wartości numeryczne, np. wiek. x2x2 x1x1 x3x3 x(O) Wektor cech X =(x 1,x 2,x 3... x d ), o d-składowych wskazuje na punkt w przestrzeni cech.

21 Przykład: ryby Chapter 1.2, Pattern Classification (2nd ed) by R. O. Duda, P. E. Hart and D. G. Stork, John Wiley & Sons, 2000 Automatyzacja sortowania dwóch gatunków ryb, łososia i suma morskiego, które przesuwają się na pasie sortownika. Czujniki oceniają różne cechy: długość, jasność, szerokość, liczbę płetw Patrzymy na histogramy. Wybieramy liczbę przedziałów, np. n =20 (dyskretne dane) obliczamy szerokość przedziału =( x max x min )/n, obliczamy N (C, r i ) = #sztuk C {łosoś, sum} w każdym przedziale r i = [ x min +(i-1), x min +i i=1...n prawdopodobieństwo łączne P(C,r i )=N(C,r i )/N, gdzie N = liczba ryb Łączne prawdopodobieństwo P(C,r i ) = P(r i |C)P(C)

22 Przykład histogramów Rozkład liczby ryb w dwóch wymiarach w 20 przedziałach:l długość i jasność. Zaznaczono optymalne progi podziału. P ( r i |C ) przybliża rozkład prawdopodobieństwa dla klasy P ( x|C ). Możemy go dokładnie obliczyć tylko w granicy nieskończenie wielu przykładów i podziału na nieskończenie wiele przedziałów. W praktyce zawsze dzielimy na niewielką liczbę przedziałów.

23 Rodzaje prawdopodobieństwa Tablica współwystępowania klasa-cecha: P ( C,r i )= N ( C,r i )/N N ( C, r i ) = macierz, rzędy = klasy, kolumny = cechy r i P ( C, r i ) – prawdopodobieństwo łączne, P obserwacji obiektu z klasy C dla którego cecha x r i P ( C ) to prawd. a priori pojawienia się obiektów z danej klasy, przed wykonaniem pomiarów i określeniem, że x r i ma jakąś wartość. To suma w danym rzędzie: P ( x r i ) to prawd że znajdujemy jakąś obserwację dla które cecha x r i czyli suma dla danej kolumny.

24 Prawdopodobieństwa warunkowe Jeśli znana jest klasa C (rodzaj obiektu) to jakie jest prawdopodobieństwo że ma on własność x r i ? P ( x r i |C ) oznacza warunkowe prawdopodobieństwo, że znając C cecha x będzie leżała w przedziale r i. Suma po wszystkich wartościach cech: P C ( x )= P ( x|C ) rozkład prawd. warunkowego to po prostu przeskalowane prawdopodobieństwo łączne, trzeba podzielić P ( C,x )/ P ( C ) i dla łącznego prawdopodobieństwa Dlatego mamy:

25 Formuły probabilistyczne Relacje probabilistyczne wynikają z prostych reguł sumowania! Macierz rozkładu łącznych prawdopodobieństw: P ( C, x ) dla dyskretnych wartości obserwacji x, liczymy ile razy zaobserwowano łącznie N(C,x), skalujemy tak by prawdop. sumowało się do 1, czyli P ( C, x ) = N(C,x)/N Rząd macierzy P ( C, x ) sumuje się do: dlatego P(x|C)=P(C, x)/P(C) sumuje się do Kolumna macierzy P ( C, x ) sumuje się do: dlatego P(C|x)=P(C, x)/P(x) sumuje się do

26 Twierdzenie Bayesa Formuła Bayesa pozwala na obliczenie prawdopodobieństwa a posteriori P ( C|x ) (czyli po dokonaniu obserwacji) znając łatwy do zmierzenia rozkład warunkowy P ( x| C ). Sumują się do 1 bo wiemy, że jeśli obserwujemy x i to musi to być jedna z C klas, jak też wiemy, że jeśli obiekt jest z klasy C to x musi mieć jedną z wartości x i Obydwa prawdopodobieństwa są wynikiem podzielenia P ( C,x i ). Formułka Bayesa jest więc oczywista.

27 Kwiatki Mamy dwa rodzaje Irysów: Irys Setosa oraz Irys Virginica Długość liści określamy w dwóch przedziałach, r 1 =[0,3] cm i r 2 =[3,6] cm. Dla 100 kwiatów dostajemy następujące rozkłady (Setosa, Virginica): Therefore probabilities for finding different types of Iris flowers is: Stąd

28 Martwić się czy nie? Naiwnie: 1 na 1000 osób ma wirusa HIV, czyli Test ma dokładność 99.5%, więc na 1000 osób wykaże 5 z HIV, a ponieważ jest tylko 1 ma wirusa to dokładność ~20%. Dokładniej: dwie klasy H+, H-, dwie obserwacje T+, T- Interesuje nas P(HIV+|T+): P(HIV+)=0.001 a P(HIV )=0.999 oraz P(T+|HIV+)=0.995 P(HIV+|T+) P(T+) = P(HIV+,T+) = P(T+|HIV+) P(HIV+) P(HIV+|T+) P(T+) = * P(T+)=P(T+|HIV+)+P(T+|HIV-) P(HIV+|T+)=0.995, Prawdopodobieństwo, że osoba ma HIV

29 Paradoks Monty Hall Monty Hall Paradox, czyli przykład złudzenia kognitywnego. Stosowany np. w teleturnieju idź na całość. Reguły zabawy: Mamy 3 kubki i złota monetę. Wychodzisz z pokoju, ja pod jednym z kubków ukrywam monetę. Wracasz i wybierasz jeden z kubków. Ja, wiedząc, pod którym jest moneta, odkrywam jeden z pustych kubków. Masz teraz szansę zmienić swoją decyzję i pozostać przy już wybranym kubku lub wybrać pozostały. Czy najlepszą strategią jest: 1.zawsze trzymanie się pierwotnego wyboru, 2.zawsze zmiana, 3.czy przypadkowy wybór? Zajrzyj tu by zagrać samemuZajrzyj tu by zagrać samemu.

30 Swobodny wybór Eksperymenty psychologiczne: Wybieramy cukierki różnych kolorów, wydaje się, że kolory R, G, B wybierane są równie często, zakładamy równe preferencje. Dajemy do wyboru R i G, wybierane jest np. R Dajemy do wyboru G i B, wybierane jest zwykle B. Wnioski psychologów: mamy tu dysonans poznawczy, wybieramy B bo jak się raz decydujemy że nie chcemy G to później też nie wybieramy G. Czy naprawdę? Dopiero w 2008 roku zauważono, że:w 2008 roku zauważono Jeśli początkowo były słabe preferencje R > G to są 3 możliwości: R>G>B, R>B>G, lub B>R>G, czyli 2/3 szans na wybór B zamiast G. Być może wszystkie podobne psychologiczne eksperymenty były źle przeanalizowane? Inverse base rates i inne?

31 Gry komputerowe Inny rodzaj testu Turinga: czy walczę z człowiekiem czy z programem? Botprize: sterowane są postaci z Unreal Tournament Po 5 latach od rozpoczęcia dwie drużyny w 2012 roku; dwie drużyny (3 osoby z Univ. of Texas at Austin i Mihai Polceanu, rumunski student z Brest, Francja) przekonały sędziów, że ich bot jest człowiekiem.

32 Wnioski Myślenie jest rzeczą trudną... prościej jest używać schematów. Tylko w kontekście naturalnych sytuacji myślenie przychodzi nam łatwo.

33 Przykładowe pytania Jak działa Teoretyk Logiki? Jakie były cele GPS? Czego nas nauczył GPS? Jaka jest kolejność ocen węzłów grafu w strategii minimaksu? Podać przykładowe funkcje oceny dla szachów. Do czego służy technika alfa-beta? Co umożliwia sprawne działanie w grach pomimo niewielkiej pojemności pamięci roboczej? Jaka jest pojemność pamięci roboczej człowieka i jakie inspiracje dla AI z tego wynikają? Jaką strategię stosują ludzie w grze w szachy? Wszyscy A to B. Żaden C nie jest A. Jaki stąd wniosek? Oszacuj jaka jest szansa choroby mając częstość jej występowania i dokładność testu, który wypadł pozytywnie. Oszacuj liczbę operacji wykonywanych przez mózg Kasparowa i wytłumacz, dlaczego przegrał z systemem Deep Blue. Narysować zależność stopnia kompetencji programu od szybkości szukania i wielkości jego bazy wiedzy.


Pobierz ppt "Sztuczna Inteligencja Szukanie, gry i ludzkie myślenie Włodzisław Duch Katedra Informatyki Stosowanej UMK Google: W. Duch."

Podobne prezentacje


Reklamy Google