Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

Sztuczna Inteligencja - wykład 2 Teoria grafów - dokończenie Teoria gier.

Podobne prezentacje


Prezentacja na temat: "Sztuczna Inteligencja - wykład 2 Teoria grafów - dokończenie Teoria gier."— Zapis prezentacji:

1 Sztuczna Inteligencja - wykład 2 Teoria grafów - dokończenie Teoria gier

2 Przeszukiwanie grafów

3 Algorytm przeszukiwania w głąb Jest to podstawowa metoda badania grafów skierowanych. Bardzo podobna do stosowanych dla drzew, w których startuje się od korzenia i rekurencyjnie bada wierzchołki potomne każdego odwiedzonego wierzchołka. Trudność polega na tym ze w grafie mogą pojawiać się cykle... należy wobec tego znaczyć wierzchołki już odwiedzone i nie powracać więcej do takich wierzchołków. Z uwagi na fakt, że w celu uniknięcia dwukrotnego odwiedzenia tego samego wierzchołka jest on odpowiednio oznaczany, graf w trakcie jego badania zachowuje się podobnie do drzewa. W rzeczywistości można narysować drzewo, którego krawędzie rodzic-potomek będą niektórymi krawędziami przeszukiwanego grafu G. Takie drzewo nosi nazwę drzewa przeszukiwania w głąb (ang. depth-first-search-first) dla danego grafu.

4 Znajdowanie maksymalnego przepływu

5 Teoria gier Jak grać by wygrać (czyli stracić jak najmniej)

6 Co to jest gra? W każdej grze występuje konflikt interesów (cele każdego z graczy są inne) W każdej grze uczestniczy co najmniej dwóch graczy (jednym z nich może być natura)

7 Trochę historii 1713 — J. Waldegrave, pierwsza znana dyskusja na temat teorii gier, w swoim liście zaprezentował mieszane rozwiązanie minimaksowe wersji dwuosobowej gry karcianej le Her 1838 — A.A. Cournot w pracy Researches into the Mathematical Principles of the Theory of Wealth prezentuje ogólną analizę teorii gier, m.in. rozważa uproszczoną wersję równowagi Nasha 1928— John von Neumann prezentuje serię artykułów dających początek teorii gier Lata 50 XXw — John Nash prezentuje coś, co dziś znamy jako równowagę Nasha

8 Przykład gry Dwie osoby grają w grę Kamień (K), Nożyczki (N), Papier (P). W przypadku wygranej przegrywający płaci wygrywającemu 10 zł. Decyzje: K, N, P D1D1 D2D2 NPK K KK NNNPPP Zysk D 1 Zysk D

9 Przykład gry Zysk D 1 Zysk D 2 D1D1 D2D2 NPK K KK NNNPPP Macierz zysków dla D 1 Macierz zysków dla D 2 D 2 D 1 KNP K N 0-10 P 100 D 2 D 1 KNP K N 010 P -100

10 Gry o sumie zerowej 1. W najprostszym przypadku jest dwóch graczy — decydenci (D 1, D 2 ) 2. Występuje konflikt interesów między D 1 i D 2: Wygrana jednego jest przegraną drugiego 3. Każdy z decydentów ma do wyboru różne możliwości - decyzje, strategie 4. Decydenci podejmują swoje decyzje równocześnie - gra statyczna

11 Gra o sumie zerowej Macierz strat dla D 1, zysków dla D 2 D 1 minimalizuje wynik, D 2 - maksymalizuje wynik gry D 2 D 1 KNP K N 0-10 P 100 Zapis (i, j) oznacza, że D 1 wybrał wiersz i, a D 2 wybrał kolumnę j Rezultat gry wynosi a ij

12 Gra o sumie zerowej Macierz gry A całkowicie opisuje grę A - postać normalna statycznej skończonej gry o sumie zerowej Strategie bezpieczne: Dla D 1 - zapewnienie jak najmniejszej straty niezależnie od decyzji D 2 (a w zasadzie w przypadku najgorszej dla D 1 decyzji D 2 ) Dla D 2 - zapewnienie najwyższego minimalnego zysku niezależnie od decyzji D 1 (a w zasadzie w przypadku najgorszej dla D 2 decyzji D 1 )

13 Strategia bezpieczna dla D 1 i 0 - strategia bezpieczna dla D 1 i 0 zapewnia D 1 jak najmniejsze straty w przypadku najbardziej konfliktowego (czyli nastawionego na największy zysk) działania D 2 Należy wybrać taki wiersz macierzy A, którego największy element jest nie większy niż największy element pozostałych wierszy i = 1, 2,..., m Poziom bezpieczeństwa dla D 1

14 Strategia bezpieczna dla D 2 j 0 - strategia bezpieczna dla D 2 j 0 zapewnia D 2 jak największy zysk w przypadku najbardziej konfliktowego (czyli nastawionego na minimalne straty) działania D 1 Należy wybrać taką kolumnę macierzy A, której najmniejszy element jest nie mniejszy niż najmniejszy element pozostałych kolumn j = 1, 2,..., n Poziom bezpieczeństwa dla D 1

15 Istnienie strategii bezpiecznych Jeżeli macierz A reprezentuje proces decyzyjny dwuosobowy, to poziom bezpieczeństwa dla każdego z graczy jest określony jednoznacznie, istnieje co najmniej jedna odpowiadająca mu strategia (strategia bezpieczna dla danego decydenta). Poziom bezpieczeństwa dla D 1 jest nie mniejszy od poziomu dla D 2, tzn.

16 Gra o sumie zerowej - przykład 2 Strategie bezpieczne: j 0 = 3 (poziom bezpieczeństwa dla D 2 = 3) i 0 = 2 lub i 0 = 3 (poziom bezpieczeństwa dla D 1 = 5) D 2 D D 1 - skup - minimalizuje koszty - decyzja dotyczy nastawienia się na skup drobiu dorosłego (1), jaj (2) lub kurcząt (3) D 2 - producent drobiu - maksymalizuje zysk - decyzja dotyczy rasy drobiu, który będzie hodowany

17 Rozwiązanie równowagi D 2 D Strategie bezpieczne nie mają charakteru równowagi !!!

18 Rozwiązanie równowagi D 2 D i 0 = 2, j 0 = 2; Strategia punktu siodłowego (w strategiach czystych)

19 Strategia punktu siodłowego Definicja W macierzy A = {a ij }, reprezentującej proces decyzyjny, element a ij jest wartością punktu równowagi siodłowej, jeśi dla każdego i oraz j zachodzi nierówność:

20 Wymienialność strategii równowagi Warunkiem koniecznym i wystarczającym istnienia równowagi siodłowej jest równość poziomów bezpieczeństwa obu graczy W grach o sumie zerowej strategie równowagi są wymienialne tzn. jeśli pary (i 1, j 1 ) oraz (i 2, j 2 ) są strategiami równowagi siodłowej, to również są nimi pary (i 1, j 2 ) i (i 2, j 1 )

21 Brak strategii równowagi Nie ma rozwiązania w klasie strategii czystych Jeśli jeden z graczy czeka na zagranie drugiego i wówczas odpowiada najkorzystniejszą dla siebie strategią gracz, który zagrywa jako pierwszy musi wybrać strategię bezpieczną w takim przypadku gra przestaje być grą statyczną — gracz działający jako drugi korzysta dynamicznie ze znajomości decyzji swojego przeciwnika

22 Strategie mieszane Jeśli gra rozgrywana jest wielokrotnie w tych samych warunkach i graczy interesuje średni wynik gry można wprowadzić losowanie poszczególnych strategii czystych i i j z prawdopodobieństwem, odpowiednio, y i i z j Gdy gra rozgrywana jest jednokrotnie, ale decyzje nie muszą mieć charakteru binarnego (tak/nie) — przykładem może być decyzja o alokacji środków w różne rodzaje inwestycji lub decyzja o zakupie towarów u różnych producentów bądź w różnych terminach - w takim przypadku wartość y i i z j przypisane strategiom czystym i i j oznaczają stopień udziału danej strategii w rozwiązaniu W obu przypadkach mamy do czynienia z grami o sumie zerowej z rozwiązaniem w strategiach mieszanych

23 Strategie mieszane Strategią mieszaną nazywamy rozkład prawdopodobieństwa opisany na przestrzeni strategii czystych

24 Strategie mieszane Zmienne losowe y i z są niezależne - wartość oczekiwana gry wynosi Podobnie jak w przypadku strategii czystych można zdefiniować strategie mieszane bezpieczne i odpowiadające im średnie poziomy bezpieczeństwa

25 Strategie mieszane - minimax Twierdzenie o minimaksie: Wnioski: każda gra macierzowa ma jednoznacznie określony punkt siodłowy S m w strategiach mieszanych mieszane strategie równowagi siodłowej zawsze istnieją, choć nie muszą być określone jednoznacznie, mają jednak własności wymienialności

26 Strategie mieszane Strategie mieszanych dla gier n = m = 2 można znaleźć metodą graficzną D 2 D Dla D 1 Dla D 2

27 Gry o sumie niezerowej Jeśli role graczy są symetryczne - równowaga Nasha Jeśli podejrzewamy, że przeciwnik będzie „złośliwy” - strategia minimaksowa - sprowadzamy właściwie problem do gry o sumie zerowej Jeśli w grze występuje hierarchia w procesie decyzyjnym oraz pozycja graczy nie jest identyczna (symetrycza) - równowaga w sensie von Stackelberga

28 Gry o sumie niezerowej Równowaga Nasha osiągnięta jest wówczas gdy jednostronne naruszenie równowagi (odejście od strategii dającej równowagę) pogarsza rezultat gracza podejmującego taką decyzję Założenia: Rozpatrywać będziemy gry dwuosobowe, skończone i statyczne, w których gracze nie kooperują ze sobą Obaj gracze D 1 i D 2 chcą minimalizować swoje straty; ich macierze wypłat to odpowiednio A i B; strategie D 1 są w wierszach, a D 2 w kolumnach

29 Równowaga Nasha Para strategii (i 0, j 0 ) określa rozwiązanie równowagi Nasha w grze dwumacierzowej (A, B) jeśli spełnione są warunki

30 Równowaga Nasha - przykład Dwaj użytkownicy korzystają ze wspólnego magazynu. Ich koszty związane są z kosztami pobierania z magazynu i stratami związanymi z niezaspokojeniem potrzeb, przy czym zależą od tego, jaką decyzję (1- pobrać, 2 - nie pobrać) podjął drugi użytkownik: D 2 D D 2 D A =B = Są dwa położenia równowagi Nasha 1. dla pary strategii (1,1), z rezultatem (15,20) 2. dla pary strategii (2,2), z rezultatem (-15,0) para strategii (2,2) jest lepsza dla obu użytkowników

31 Strategie dopuszczalne Dopuszczalność strategii Para strategii Nasha jest dopuszczalna, jeśli nie istnieje para strategii od niej lepsza Ocena strategii Para strategii (i 1, j 1 ) jest lepsza niż (i 2, j 2 ) jeśli oraz i przynajmniej jedna z tych nierówności jest ostra

32 Walka płci D 2 D D 2 D A =B = Istnieją dwie dopuszczalne pary strategii dopuszczalnych (1,1) i (2,2) z rezultatami odpowiednio (-2,-1) i (-1,-2) Gracze nie mogą się porozumieć — jeśli zagrają na różne punkty równowagi mogą uzyskać wynik niekorzystny dla obu stron tzn. (1,1)

33 Dylemat więźnia Strategiami równowagi Nasha jest para (2, 2) dająca wynik (8, 8) Dla obu graczy lepszym wynikiem jest (2, 2) uzyskiwany przy parze strategii (1,1). Tu konieczne jest całkowite zaufanie graczy do siebie - jednostronne odstępstwo dla drugiego z graczy grozi wynikiem 30. Para strategii (2, 2) jest natomiast bezpieczna. Zostałaby uzyskana, gdyby każdy z graczy uważał grę za problem o sumie zerowej i wybierał strategię minimaksową dla odpowiedniej gry D 2 D D 2 D A =B =

34 Równowaga von Stackelberga Role graczy są niesymetryczne —jeden z graczy, leader, ma możliwość forsowania swojej strategii w stosunku do drugiego gracza followera Wymagamy równowagi hierarchicznej Zadaniem followera jest racjonalna reakcja na decyzje leadera

35 Równowaga von Stackelberga Zbiór racjonalnych reakcji (optymalnych odpowiedzi) followera (gracz D 2 ) Strategie von Stackelberga dla leadera i 0 (S* - koszt dla leadera) Element j  R(i 0 ) to odpowiedź followera na strategię i 0 leadera Para (i 0, j 0 ) jest rozwiązaniem równowagi Stackelberga

36 Równowaga von Stackelberga - przykład Para (2,2) jest w równowadze Nasha, wynik (1,0) Para (1,1) jest w równowadze von Stackelberga z D1 jako leaderem z wynikiem (0,-1) Para (1,3) jest w równowadze von Stackelberga z D2 jako leaderem z wynikiem (1½, -⅔)

37

38 Drzewa decyzyjne

39 Postać ekstensywna gry Proces decyzyjny w postaci ekstensywnej ma formę drzewa o skończonej liczbie wierzchołków Możemy opisać tak gry N-osobowe Można wprowadzić różne zbiory informacyjne dla różnych poziomów procesu Dogodna prezentacja gier jedno- i wielokrokowych o sumie zerowej i niezerowej D1D1 D2D2 BCA

40 Network Flows Source s Sink t ac bd Let G = [V,E] be a directed graph with capacity cap(v,w) on edge [v,w]. A flow is an (integer) function, f, that is chosen for each edge so that We wish to maximize the flow allocation.

41 A maximum network flow example By inspection Source s Sink t ac bd Step 1: Source s Sink t ac bd 10, , , 10 Flow is of size 10

42 A maximum network flow example Source s Sink t ac bd 10, 10 10, 1 10, , 1 10, 1 10, 10 Step 2: Flow is of size 10+1 = 11 Source s Sink t ac bd 10, 10 10, 2 10, 9 1,1 10, 2 10, 10 Maximum flow: Flow is of size 10+2 = 12 Not obvious

43 Ford-Fulkerson Method of Augmenting Paths 1.Set f(v,w) = -f(w,v) on all edges. 2.Define a Residual Graph, R, in which res(v,w) = cap(v,w) – f(v,w) 3.Find paths from s to t for which there is positive residue. 4.Increase the flow along the paths to augment them by the minimum residue along the path. 5.Keep augmenting paths until there are no more to augment.

44 Example of Residual Graph st ac bd 10, , , 10 Flow is of size 10 t ac bd s res(v,w) = cap(v,w) – f(v,w) Residual Graph, R Augmenting path

45 Example of Residual Graph st ac bd 10, 10 10, 1 10, , 1 10, 1 10, 10 Step 2: Flow is of size 10+1 = 11 st ac bd Residual Graph 9 9

46 Complexity of network flow problems In general, it is possible to find a solution by considering at most |V|.|E| paths, by picking shortest augmenting path first. There are many variations, such as picking most augmenting path first.


Pobierz ppt "Sztuczna Inteligencja - wykład 2 Teoria grafów - dokończenie Teoria gier."

Podobne prezentacje


Reklamy Google