Sztuczna Inteligencja Szukanie, gry i ludzkie myślenie

Sztuczna Inteligencja Szukanie, gry i ludzkie myślenie
Włodzisław Duch Katedra Informatyki Stosowanej UMK Google: W. Duch

Co będzie Gry planszowe. Szukanie i ludzkie myślenie.
Paradoksy kognitywne. Reprezentacja wiedzy ...

Warcaby 1952, Samuel, pierwszy program uczący się gry w warcaby.
1992, Chinook (J. Schaeffer, UoA) wygrywa US. Open. Program używa szukania a-b Mistrzostwa człowiek-maszyna, Londyn 1992 Dr. Marion Tinsley, wygrał z Chinookiem 4-2, 33 remisy. Użyto 8-proc. stacji Silicon Graphics 4D/480, 256 MB RAM, baza danych wszystkich końcówek z 1-7 figurami + prawie połowa wszystkich partii z 8 figurami. 1994, remis 1-1 i 18 remisów. 1995, wygrana Chinooka 1-0 i 31 remisów. Użyto komputera SGI z 512 MB RAM. 2007, udowodniono, że najnowsza wersja Chinook nie może przegrać partii, warcaby uznano za w pełni rozwiązane.

Trik-trak, Othello Trik-trak (backgammon), popularny w Japonii. Zawiera element niepewności (rzut kostką). 1980, program BKG wygrał raz z mistrzem świata. 1992, program Tesauro, techniki jak dla warcabów + uczenie się (sieć neuronowa) lepszych ocen, ranking wśród 3 najlepszych graczy. 1995, Logistello zwycięża mistrza świata Takeshi Murakami do 6 do 0! Program grał parę tygodni sam z sobą poprawiając swoje funkcje oceny heurystycznej. Mistrzowskie rezultaty w wielu grach osiągnięto dopiero w latach 1990. Moc obliczeniowa to warunek konieczny, ale nie wystarczający ...

Szachy – ogólnie Statyczna ocena sytuacji na planszy: liczba figur, wartość figur, położenie figur, możliwości ruchów. Funkcja oceny: suma Wi Fi, dobierz wsp. Wi Zależność liczba ruchów - siła programu. Mistrz świata > 2800 punktów. Przewidywania na: 5 pełnych ruchów (10 poziomów) punktów. Od 5-10 poziomów mamy 200 p/poziom. Dla 10 ruchów ok punktów. Ok. 35 ruchów/poziom, heurystyki redukują to do 6/poz; dla 1000 ocen/sek, 150 sek/ruch, b=35, ok. 3-4 ruchy - nowicjusz. Zależność jakość-szybkość obliczeń.

Szachy - historia. 1958, pierwszy program szachowy, Alex Bernstein.
Szkocki międzynarodowy mistrz szachowy funduje nagrodę dla programu, który ogra go chociaż raz na cztery partie. W 1985 roku przegrał wszystkie cztery partie. 1985, HiTech wśród najlepszych 800 graczy, oceniał ok. 10 mln pozycji, w 1988 roku wygrał z arcymistrzem. Intel+IBM: szachy to dobra reklama. 1994 Chess Genius na PC Pentium, kilka razy zwyciężył Gary Kasparova; czas grania ograniczono do 25 minut na zawodnika. 1996 – Deep Blue przegrał z Kasparowem 2:3 1997 – Deep Blue wygrał 3.5:2.5 2002 – program Deep Fritz na PC remisuje z Vladimirem Kramnikiem Przez dwa miesiące Kramink trenował z programem Deep Fritz.

Deep Thought i Deep Blue
Deep Thought, od 1985 roku, 4 studentów z USA (T. Hsu, T. Anantharaman, M. Campbell, A. Nowatzyk). Program Deep Blue (nowsze Deep Thought) + hardware do gry w szachy: 32 procesory IBM RS6000/SP ASIC. Ocenia milionów pozycji/sek! Duża biblioteka otwarć i końcówek. Deep Thought – szukanie alfa-beta, ok. 10 ruchów w skomplikowanych sytuacjach. Deep Blue - ok. 14 ruchów, 3000 punktów, pobił Kasparova. Reakcja prasy – potworna szybkość i pamięć zwyciężyły. Mózg: razy większa pamięć/szybkość więc to uwagi bez sensu! Moc już nadchodzi i będzie z nami …

Ostatni mecz ... Kasparov vs. X3D Deep Fritz junior.
Nowy Jork, listopad 2003. Mecz zakończył się remisem; główną atrakcją była gra w wirtualnej rzeczywistości. Komputer, na którym zainstalowany był program Fritz był około 100 razy wolniejszy niż Deep Blue i do tego zajęty generowaniem obrazu w 3 wymiarach, nic więc dziwnego, że mecz zakończył się remisem. PC stoi w kącie ... następny taki mecz odbędzie się z programem działającym na telefonie? Najwięcej punktów Elo w historii miał Kasaprov, 2851, tylko 4 osoby w historii miały ponad 2800 punktów. Program Rybka oceniany jest (4/2011) na 3261 punktów a Houdini 3309 punktów.

Go: większe wyzwanie Liczba ruchów w Go to średnio 260 (szachy tylko 35). Liczba partii: (szachy 10123). Liczba różnych pozycji na planszy: (szachy 1046). Techniki szukania są mało przydatne: obecne programy są kiepskie na standardowej planszy 19x19, ale na poziomie mistrzowskim na planszach 9x9. Pierwszy program w 1968 roku, najlepszy obecnie Go4++ napisał M. Reiss, program jest znacznie lepszy od swojego twórcy. Konieczne do dobrego grania w Go jest: rozpoznawanie struktur (typ lokalnych konfiguracji), reprezentacja relacji przestrzennych, uczenie maszynowe, strategie i planowanie, metody reprezentacje wiedzy. Nagroda 1 mln $ dla programu, który pokona mistrza z Taiwanu! MoGo (Many Faces of Go, Ver. 12) na komputerze 15Tfl, Monte Carlo Tree Search (MCTS), wygrał z mistrzem Myungwan Kim (8 Dan), przy handicapie 9 kamieni. Więcej rezultatów komputerowego go.

Szukanie a ludzkie myślenie
Jak ludzie rozwiązują problemy wymagające myślenia? Intuicja? Szachy: człowiek stosuje „zmodyfikowane progresywne pogłębianie”, ograniczone poszukiwanie w głąb, ocena w oparciu o heurystyki z doświadczenia. Intuicja = ogromna pamięć, rozpoznawanie wzorców – inne ograniczenia sprzętowe niż AI. Liczba pamiętanych „prototypowych” wzorców ~ Mistrz szachowy po 5-sek. ekspozycji układa średnio 23 figury z 25 na pokazanych pozycjach, nowicjusz 3 lub 4 figury. Figury ułożone przypadkowo  taka sama liczba błędów. Szybki test poziomu gry w szachy.

Badania psychologiczne.
Prezentacja 5 sekund, ruchy oczu mistrza i nowicjusza. Prezentacja dłuższa, od nowicjusza do mistrza. Największe różnice są w czasach reakcji i liczbie prawidłowo zapamiętanych figur.

Szukanie a ludzkie myślenie.
Mechanizm „porcjowania” przy pamiętaniu złożonych struktur, mała pamięć robocza wymaga ciągłego porcjowania. Działa to trochę jak kompilacja przyrostowa. Szachy: uczenie + pamięć, rozpoznawanie wzorców, ocena sytuacji oparta na pamięci. Uwaga skupiona jest (rozwijana jest gałąź grafu) na obszarach słabszych, ocena wzrokowa wzorców struktur. Ekspert lepiej rozpoznaje i lepiej pamięta, ale tylko istotne struktury, znane z doświadczenia, a nie struktury przypadkowe. Porcjowanie jest wykorzystywane w mnemotechnice. Inteligencja jest ściśle związana z sytuacją, domeną wiedzy.

Złudzenia zmysłowe Zmysły często nas zwodzą, np. na tych obrazkach.

Złudzenia kognitywne FINISHED FILES ARE THE RE-
Przeczytaj zdanie: FINISHED FILES ARE THE RE- SULT OF YEARS OF SCIENTIF- IC STUDY COMBINED WITH THE EXPERIENCE OF YEARS. Teraz policz ile jest liter F w tym zdaniu. Policz je TYLKO RAZ, nie cofaj się i nie powtarzaj liczenia.

Paradoksy ludzkiego myślenia
Myślenie przebiega schematycznie, możliwe są złudzenia poznawcze. Przykład wnioskowania łatwy, trudniejszy i b. trudny (niemożliwy?) Każdy człowiek jest ssakiem. Sokrates jest człowiekiem. Wniosek: Sokrates jest ssakiem. Schemat: A => B, C=>A, więc C=>B Żaden rolnik nie jest żeglarzem. Wszyscy Rurytanie to rolnicy. Wniosek: żaden Rurytanin nie jest żeglarzem. Schemat: ~A => B, C=>A, więc ~C => B

Niemożliwy ? Wszyscy członkowie gabinetu to złodzieje.
Żaden muzyk nie jest członkiem gabinetu. Wniosek: ... muzycy ??? złodzieje Takie sylogizmy rozważano już w starożytności. Jest 256 możliwości ale tylko 24 poprawne. Pytanie: czemu jest tak trudno przeprowadzić proste rozumowanie? Najlepiej użyć diagramów by wyciągnąć wnioski

A K 2 7 Test karciany (Wason 1960)
Na jednej stronie kart są cyfry, na drugiej litery. Które karty należy obrócić, by sprawdzić prawdziwość reguły: jeśli jest samogłoska to cyfra jest parzysta A K 2 7 Ile minimalnie kart trzeba przewrócić?

G S > < Wariant Wasona
W barze piją różni ludzie a nadchodzi policja. Przy stolikach mamy: Pijących gin, nieznany wiek. Pijących sok pomarańczowy, nieznany wiek. Dorosły, nie wiadomo co pije. Młodociany, nie wiadomo co pije. G S > < Kogo trzeba sprawdzić by się upewnić, że tylko dorośli piją alkohol? Znacznie łatwiej jest zgadnąć w tej sytuacji.

Martwić się czy nie? Załóżmy, że w Polsce 1 na 1000 osób ma wirusa HIV. Nowy test polegający na badaniu śliny, o dokładności 99.5%, wprowadzono do obowiązkowych badań okresowych. Test wypadł pozytywnie. Jakie jest prawdopodobieństwo, że osoba ma HIV?

Obiekty w przestrzeni cech
Opis matematyczny reprezentuje obiekty O przy pomocy pomiarów, jakie na nich przeprowadzono, podając wartości cech {Oi} => X(Oi), gdzie Xj(Oi) jest wartością j-tej cechy opisującej Oi Atrybut i cecha są często traktowane jako synonimy, chociaż ściśle ujmując “wiek” jest atrybutem a “młody” cechą, wartością. Typy atrybutów: kategoryczne: symboliczne, dyskretne – mogą mieć charakter nominalny (nieuporządkowany), np. “słodki, kwaśny, gorzki”, albo porządkowy, np. kolory w widmie światła, albo: mały < średni < duży (drink). ciągłe: wartości numeryczne, np. wiek. x2 x1 x3 x(O) Wektor cech X =(x1,x2,x3 ... xd), o d-składowych wskazuje na punkt w przestrzeni cech. (c) Tralvex Yeap. All Rights Reserved

Przykład: ryby Chapter 1.2, Pattern Classification (2nd ed) by R. O. Duda, P. E. Hart and D. G. Stork, John Wiley & Sons, 2000 Automatyzacja sortowania dwóch gatunków ryb, łososia i suma morskiego, które przesuwają się na pasie sortownika. Czujniki oceniają różne cechy: długość, jasność, szerokość, liczbę płetw Patrzymy na histogramy. Wybieramy liczbę przedziałów, np. n=20 (dyskretne dane) obliczamy szerokość przedziału D=(xmax- xmin)/n, obliczamy N(C,ri) = #sztuk C  {łosoś, sum} w każdym przedziale ri = [xmin+(i-1)D, xmin+iD], i=1...n prawdopodobieństwo łączne P(C,ri)=N(C,ri)/N, gdzie N = liczba ryb Łączne prawdopodobieństwo P(C,ri) = P(ri|C)P(C) (c) Tralvex Yeap. All Rights Reserved

Przykład histogramów Rozkład liczby ryb w dwóch wymiarach w 20 przedziałach:l długość i jasność. Zaznaczono optymalne progi podziału. P(ri|C) przybliża rozkład prawdopodobieństwa dla klasy P(x|C). Możemy go dokładnie obliczyć tylko w granicy nieskończenie wielu przykładów i podziału na nieskończenie wiele przedziałów. W praktyce zawsze dzielimy na niewielką liczbę przedziałów. (c) Tralvex Yeap. All Rights Reserved

Rodzaje prawdopodobieństwa
Tablica współwystępowania klasa-cecha: P(C,ri)=N(C,ri)/N N(C, ri) = macierz, rzędy = klasy, kolumny = cechy ri P(C, ri) – prawdopodobieństwo łączne, P obserwacji obiektu z klasy C dla którego cecha xri P(C) to prawd. a priori pojawienia się obiektów z danej klasy, przed wykonaniem pomiarów i określeniem, że xri ma jakąś wartość. To suma w danym rzędzie: P(xri) to prawd że znajdujemy jakąś obserwację dla które cecha xri czyli suma dla danej kolumny. (c) Tralvex Yeap. All Rights Reserved

Prawdopodobieństwa warunkowe
Jeśli znana jest klasa C (rodzaj obiektu) to jakie jest prawdopodobieństwo że ma on własność xri ? P(xri|C) oznacza warunkowe prawdopodobieństwo, że znając C cecha x będzie leżała w przedziale ri. Suma po wszystkich wartościach cech: i dla łącznego prawdopodobieństwa Dlatego mamy: PC(x)=P(x|C) rozkład prawd. warunkowego to po prostu przeskalowane prawdopodobieństwo łączne, trzeba podzielić P(C,x)/P(C) (c) Tralvex Yeap. All Rights Reserved

Formuły probabilistyczne
Relacje probabilistyczne wynikają z prostych reguł sumowania! Macierz rozkładu łącznych prawdopodobieństw: P(C, x) dla dyskretnych wartości obserwacji x, liczymy ile razy zaobserwowano łącznie N(C,x), skalujemy tak by prawdop. sumowało się do 1, czyli P(C, x) = N(C,x)/N Rząd macierzy P(C, x) sumuje się do: dlatego P(x|C)=P(C, x)/P(C) sumuje się do Kolumna macierzy P(C, x) sumuje się do: dlatego P(C|x)=P(C, x)/P(x) sumuje się do (c) Tralvex Yeap. All Rights Reserved

Twierdzenie Bayesa Formuła Bayesa pozwala na obliczenie prawdopodobieństwa a posteriori P(C|x) (czyli po dokonaniu obserwacji) znając łatwy do zmierzenia rozkład warunkowy P(x|C). Sumują się do 1 bo wiemy, że jeśli obserwujemy xi to musi to być jedna z C klas, jak też wiemy, że jeśli obiekt jest z klasy C to x musi mieć jedną z wartości xi Obydwa prawdopodobieństwa są wynikiem podzielenia P(C,xi). Formułka Bayesa jest więc oczywista. (c) Tralvex Yeap. All Rights Reserved

Kwiatki Mamy dwa rodzaje Irysów: Irys Setosa oraz Irys Virginica
Długość liści określamy w dwóch przedziałach, r1=[0,3] cm i r2=[3,6] cm. Dla 100 kwiatów dostajemy następujące rozkłady (Setosa, Virginica): Therefore probabilities for finding different types of Iris flowers is: Stąd (c) Tralvex Yeap. All Rights Reserved

Martwić się czy nie? Naiwnie: 1 na 1000 osób ma wirusa HIV, czyli
Test ma dokładność 99.5%, więc na 1000 osób wykaże 5 z HIV, a ponieważ jest tylko 1 ma wirusa to dokładność ~20%. Dokładniej: dwie klasy H+, H-, dwie obserwacje T+, T- Interesuje nas P(HIV+|T+): P(HIV+)=0.001 a P(HIV-)= oraz P(T+|HIV+)=0.995 P(HIV+|T+) P(T+) = P(HIV+,T+) = P(T+|HIV+) P(HIV+) P(HIV+|T+) P(T+) = * 0.001 P(T+)=P(T+|HIV+)+P(T+|HIV-) P(HIV+|T+)=0.995, Prawdopodobieństwo, że osoba ma HIV

Paradoks Monty Hall Monty Hall Paradox, czyli przykład złudzenia kognitywnego. Stosowany np. w teleturnieju „idź na całość”. Reguły zabawy: Mamy 3 kubki i złota monetę. Wychodzisz z pokoju, ja pod jednym z kubków ukrywam monetę. Wracasz i wybierasz jeden z kubków. Ja, wiedząc, pod którym jest moneta, odkrywam jeden z pustych kubków. Masz teraz szansę zmienić swoją decyzję i pozostać przy już wybranym kubku lub wybrać pozostały. Czy najlepszą strategią jest: zawsze trzymanie się pierwotnego wyboru, zawsze zmiana, czy przypadkowy wybór? Zajrzyj tu by zagrać samemu.

Swobodny wybór Eksperymenty psychologiczne:
Wybieramy cukierki różnych kolorów, wydaje się, że kolory R, G, B wybierane są równie często, zakładamy równe preferencje. Dajemy do wyboru R i G, wybierane jest np. R Dajemy do wyboru G i B, wybierane jest zwykle B. Wnioski psychologów: mamy tu dysonans poznawczy, wybieramy B bo jak się raz decydujemy że nie chcemy G to później też nie wybieramy G. Czy naprawdę? Dopiero w 2008 roku zauważono, że: Jeśli początkowo były słabe preferencje R > G to są 3 możliwości: R>G>B, R>B>G, lub B>R>G, czyli 2/3 szans na wybór B zamiast G. Być może wszystkie podobne psychologiczne eksperymenty były źle przeanalizowane? Inverse base rates i inne?

Gry komputerowe Inny rodzaj testu Turinga: czy walczę z człowiekiem czy z programem? Botprize: sterowane są postaci z Unreal Tournament 2004. Po 5 latach od rozpoczęcia dwie drużyny w 2012 roku; dwie drużyny (3 osoby z Univ. of Texas at Austin i Mihai Polceanu, rumunski student z Brest, Francja) przekonały sędziów, że ich bot jest człowiekiem.

Wnioski Myślenie jest rzeczą trudną ...
prościej jest używać schematów. Tylko w kontekście naturalnych sytuacji myślenie przychodzi nam łatwo.

Przykładowe pytania Jak działa Teoretyk Logiki?
Jakie były cele GPS? Czego nas nauczył GPS? Jaka jest kolejność ocen węzłów grafu w strategii minimaksu? Podać przykładowe funkcje oceny dla szachów. Do czego służy technika alfa-beta? Co umożliwia sprawne działanie w grach pomimo niewielkiej pojemności pamięci roboczej? Jaka jest pojemność pamięci roboczej człowieka i jakie inspiracje dla AI z tego wynikają? Jaką strategię stosują ludzie w grze w szachy? Wszyscy A to B. Żaden C nie jest A. Jaki stąd wniosek? Oszacuj jaka jest szansa choroby mając częstość jej występowania i dokładność testu, który wypadł pozytywnie. Oszacuj liczbę operacji wykonywanych przez mózg Kasparowa i wytłumacz, dlaczego przegrał z systemem Deep Blue. Narysować zależność stopnia kompetencji programu od szybkości szukania i wielkości jego bazy wiedzy.

Sztuczna Inteligencja Szukanie, gry i ludzkie myślenie

Podobne prezentacje

Prezentacja na temat: "Sztuczna Inteligencja Szukanie, gry i ludzkie myślenie"— Zapis prezentacji:

Podobne prezentacje

О projekcie

Zwrotny adres

Wejść

Zaloguj się poprzez sieć społeczną:

Sztuczna Inteligencja Szukanie, gry i ludzkie myślenie

Podobne prezentacje

Prezentacja na temat: "Sztuczna Inteligencja Szukanie, gry i ludzkie myślenie"— Zapis prezentacji:

Podobne prezentacje

О projekcie

Zwrotny adres