Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

Sztuczna Inteligencja - wykład 2

Podobne prezentacje


Prezentacja na temat: "Sztuczna Inteligencja - wykład 2"— Zapis prezentacji:

1 Sztuczna Inteligencja - wykład 2
Teoria grafów - dokończenie Teoria gier

2 Przeszukiwanie grafów

3 Algorytm przeszukiwania w głąb
Jest to podstawowa metoda badania grafów skierowanych. Bardzo podobna do stosowanych dla drzew, w których startuje się od korzenia i rekurencyjnie bada wierzchołki potomne każdego odwiedzonego wierzchołka. Trudność polega na tym ze w grafie mogą pojawiać się cykle... należy wobec tego znaczyć wierzchołki już odwiedzone i nie powracać więcej do takich wierzchołków. Algorytm przeszukiwania w głąb Z uwagi na fakt, że w celu uniknięcia dwukrotnego odwiedzenia tego samego wierzchołka jest on odpowiednio oznaczany, graf w trakcie jego badania zachowuje się podobnie do drzewa. W rzeczywistości można narysować drzewo, którego krawędzie rodzic-potomek będą niektórymi krawędziami przeszukiwanego grafu G. Takie drzewo nosi nazwę drzewa przeszukiwania w głąb (ang. depth-first-search-first) dla danego grafu.

4 Znajdowanie maksymalnego przepływu

5 Teoria gier Jak grać by wygrać (czyli stracić jak najmniej)

6 Co to jest gra? W każdej grze występuje konflikt interesów (cele każdego z graczy są inne) W każdej grze uczestniczy co najmniej dwóch graczy (jednym z nich może być natura)

7 Trochę historii 1713 — J. Waldegrave, pierwsza znana dyskusja na temat teorii gier, w swoim liście zaprezentował mieszane rozwiązanie minimaksowe wersji dwuosobowej gry karcianej le Her 1838 — A.A. Cournot w pracy Researches into the Mathematical Principles of the Theory of Wealth prezentuje ogólną analizę teorii gier, m.in. rozważa uproszczoną wersję równowagi Nasha 1928— John von Neumann prezentuje serię artykułów dających początek teorii gier Lata 50 XXw — John Nash prezentuje coś, co dziś znamy jako równowagę Nasha

8 Przykład gry Dwie osoby grają w grę Kamień (K), Nożyczki (N), Papier (P). W przypadku wygranej przegrywający płaci wygrywającemu 10 zł. Decyzje: K, N, P D1 D2 N P K Zysk D1 Zysk D2 10 -10

9 Przykład gry Macierz zysków dla D2 Macierz zysków dla D1 D1 D2 D2 D1 K
N P 10 -10 D2 D1 K N P -10 10 Macierz zysków dla D2 Macierz zysków dla D1 D1 D2 N P K 10 -10 Zysk D1 Zysk D2

10 Gry o sumie zerowej 1. W najprostszym przypadku jest dwóch graczy — decydenci (D1, D2) 2. Występuje konflikt interesów między D1 i D2: Wygrana jednego jest przegraną drugiego 3. Każdy z decydentów ma do wyboru różne możliwości - decyzje, strategie 4. Decydenci podejmują swoje decyzje równocześnie - gra statyczna

11 Gra o sumie zerowej • Macierz strat dla D1, zysków dla D2
D2 D1 K N P -10 10 • Macierz strat dla D1, zysków dla D2 • D1 minimalizuje wynik, D2 - maksymalizuje wynik gry • Zapis (i, j) oznacza, że D1 wybrał wiersz i, a D2 wybrał kolumnę j • Rezultat gry wynosi aij

12 Gra o sumie zerowej Macierz gry A całkowicie opisuje grę
A - postać normalna statycznej skończonej gry o sumie zerowej Strategie bezpieczne: Dla D1 - zapewnienie jak najmniejszej straty niezależnie od decyzji D2 (a w zasadzie w przypadku najgorszej dla D1 decyzji D2) Dla D2 - zapewnienie najwyższego minimalnego zysku niezależnie od decyzji D1 (a w zasadzie w przypadku najgorszej dla D2 decyzji D1)

13 Strategia bezpieczna dla D1
i0 - strategia bezpieczna dla D1 i0 zapewnia D1 jak najmniejsze straty w przypadku najbardziej konfliktowego (czyli nastawionego na największy zysk) działania D2 Należy wybrać taki wiersz macierzy A, którego największy element jest nie większy niż największy element pozostałych wierszy i = 1, 2, ... , m Poziom bezpieczeństwa dla D1

14 Strategia bezpieczna dla D2
j0 - strategia bezpieczna dla D2 j0 zapewnia D2 jak największy zysk w przypadku najbardziej konfliktowego (czyli nastawionego na minimalne straty) działania D1 Należy wybrać taką kolumnę macierzy A, której najmniejszy element jest nie mniejszy niż najmniejszy element pozostałych kolumn j = 1, 2, ... , n Poziom bezpieczeństwa dla D1

15 Istnienie strategii bezpiecznych
Jeżeli macierz A reprezentuje proces decyzyjny dwuosobowy, to poziom bezpieczeństwa dla każdego z graczy jest określony jednoznacznie, istnieje co najmniej jedna odpowiadająca mu strategia (strategia bezpieczna dla danego decydenta). Poziom bezpieczeństwa dla D1 jest nie mniejszy od poziomu dla D2, tzn.

16 Gra o sumie zerowej - przykład 2
D1 - skup - minimalizuje koszty - decyzja dotyczy nastawienia się na skup drobiu dorosłego (1), jaj (2) lub kurcząt (3) D2 - producent drobiu - maksymalizuje zysk - decyzja dotyczy rasy drobiu, który będzie hodowany D2 D1 1 2 3 4 6 5 Strategie bezpieczne: j0 = 3 (poziom bezpieczeństwa dla D2 = 3) i0 = 2 lub i0 = 3 (poziom bezpieczeństwa dla D1 = 5)

17 Rozwiązanie równowagi
D2 D1 1 2 3 4 6 5 Strategie bezpieczne nie mają charakteru równowagi !!!

18 Rozwiązanie równowagi
D2 D1 1 2 3 -1 i0 = 2, j0 = 2; Strategia punktu siodłowego (w strategiach czystych)

19 Strategia punktu siodłowego
Definicja W macierzy A = {aij}, reprezentującej proces decyzyjny, element aij jest wartością punktu równowagi siodłowej, jeśi dla każdego i oraz j zachodzi nierówność:

20 Wymienialność strategii równowagi
Warunkiem koniecznym i wystarczającym istnienia równowagi siodłowej jest równość poziomów bezpieczeństwa obu graczy W grach o sumie zerowej strategie równowagi są wymienialne tzn. jeśli pary (i1, j1) oraz (i2, j2) są strategiami równowagi siodłowej, to również są nimi pary (i1, j2) i (i2, j1)

21 Brak strategii równowagi
• Nie ma rozwiązania w klasie strategii czystych • Jeśli jeden z graczy czeka na zagranie drugiego i wówczas odpowiada najkorzystniejszą dla siebie strategią • gracz, który zagrywa jako pierwszy musi wybrać strategię bezpieczną • w takim przypadku gra przestaje być grą statyczną — gracz działający jako drugi korzysta dynamicznie ze znajomości decyzji swojego przeciwnika

22 Strategie mieszane • Jeśli gra rozgrywana jest wielokrotnie w tych samych warunkach i graczy interesuje średni wynik gry można wprowadzić losowanie poszczególnych strategii czystych i i j z prawdopodobieństwem, odpowiednio, yi i zj • Gdy gra rozgrywana jest jednokrotnie, ale decyzje nie muszą mieć charakteru binarnego (tak/nie) — przykładem może być decyzja o alokacji środków w różne rodzaje inwestycji lub decyzja o zakupie towarów u różnych producentów bądź w różnych terminach - w takim przypadku wartość yi i zj przypisane strategiom czystym i i j oznaczają stopień udziału danej strategii w rozwiązaniu W obu przypadkach mamy do czynienia z grami o sumie zerowej z rozwiązaniem w strategiach mieszanych

23 Strategie mieszane Strategią mieszaną nazywamy rozkład prawdopodobieństwa opisany na przestrzeni strategii czystych

24 Strategie mieszane Zmienne losowe y i z są niezależne - wartość oczekiwana gry wynosi Podobnie jak w przypadku strategii czystych można zdefiniować strategie mieszane bezpieczne i odpowiadające im średnie poziomy bezpieczeństwa

25 Strategie mieszane - minimax
Twierdzenie o minimaksie: Wnioski: • każda gra macierzowa ma jednoznacznie określony punkt siodłowy Sm w strategiach mieszanych • mieszane strategie równowagi siodłowej zawsze istnieją, choć nie muszą być określone jednoznacznie, mają jednak własności wymienialności

26 Strategie mieszane Strategie mieszanych dla gier n = m = 2 można znaleźć metodą graficzną D2 D1 1 2 3 -1 Dla D1 Dla D2

27 Gry o sumie niezerowej • Jeśli role graczy są symetryczne - równowaga Nasha • Jeśli podejrzewamy, że przeciwnik będzie „złośliwy” - strategia minimaksowa - sprowadzamy właściwie problem do gry o sumie zerowej • Jeśli w grze występuje hierarchia w procesie decyzyjnym oraz pozycja graczy nie jest identyczna (symetrycza) - równowaga w sensie von Stackelberga

28 Gry o sumie niezerowej • Równowaga Nasha osiągnięta jest wówczas gdy jednostronne naruszenie równowagi (odejście od strategii dającej równowagę) pogarsza rezultat gracza podejmującego taką decyzję Założenia: • Rozpatrywać będziemy gry dwuosobowe, skończone i statyczne, w których gracze nie kooperują ze sobą • Obaj gracze D1 i D2 chcą minimalizować swoje straty; ich macierze wypłat to odpowiednio A i B; strategie D1 są w wierszach, a D2 w kolumnach

29 Równowaga Nasha Para strategii (i0, j0) określa rozwiązanie równowagi Nasha w grze dwumacierzowej (A, B) jeśli spełnione są warunki

30 Równowaga Nasha - przykład
Dwaj użytkownicy korzystają ze wspólnego magazynu. Ich koszty związane są z kosztami pobierania z magazynu i stratami związanymi z niezaspokojeniem potrzeb, przy czym zależą od tego, jaką decyzję (1- pobrać, 2 - nie pobrać) podjął drugi użytkownik: D2 D1 1 2 15 30 -15 D2 D1 1 2 20 30 10 A = B = Są dwa położenia równowagi Nasha 1. dla pary strategii (1,1), z rezultatem (15,20) 2. dla pary strategii (2,2), z rezultatem (-15,0) para strategii (2,2) jest lepsza dla obu użytkowników

31 Strategie dopuszczalne
Ocena strategii Para strategii (i1, j1) jest lepsza niż (i2, j2) jeśli oraz i przynajmniej jedna z tych nierówności jest ostra Dopuszczalność strategii Para strategii Nasha jest dopuszczalna, jeśli nie istnieje para strategii od niej lepsza

32 Walka płci D2 D1 1 2 -2 -1 D2 D1 1 2 -1 -2 A = B = Istnieją dwie dopuszczalne pary strategii dopuszczalnych (1,1) i (2,2) z rezultatami odpowiednio (-2,-1) i (-1,-2) Gracze nie mogą się porozumieć — jeśli zagrają na różne punkty równowagi mogą uzyskać wynik niekorzystny dla obu stron tzn. (1,1)

33 Dylemat więźnia D2 D1 1 2 30 8 D2 D1 1 2 30 8 A = B = • Strategiami równowagi Nasha jest para (2, 2) dająca wynik (8, 8) • Dla obu graczy lepszym wynikiem jest (2, 2) uzyskiwany przy parze strategii (1,1). Tu konieczne jest całkowite zaufanie graczy do siebie - jednostronne odstępstwo dla drugiego z graczy grozi wynikiem 30. • Para strategii (2, 2) jest natomiast bezpieczna. Zostałaby uzyskana, gdyby każdy z graczy uważał grę za problem o sumie zerowej i wybierał strategię minimaksową dla odpowiedniej gry

34 Równowaga von Stackelberga
• Role graczy są niesymetryczne —jeden z graczy, leader, ma możliwość forsowania swojej strategii w stosunku do drugiego gracza followera •Wymagamy równowagi hierarchicznej • Zadaniem followera jest racjonalna reakcja na decyzje leadera

35 Równowaga von Stackelberga
Zbiór racjonalnych reakcji (optymalnych odpowiedzi) followera (gracz D2) Strategie von Stackelberga dla leadera i0 (S* - koszt dla leadera) Element jR(i0) to odpowiedź followera na strategię i0 leadera Para (i0, j0) jest rozwiązaniem równowagi Stackelberga

36 Równowaga von Stackelberga - przykład
• Para (2,2) jest w równowadze Nasha, wynik (1,0) • Para (1,1) jest w równowadze von Stackelberga z D1 jako leaderem z wynikiem (0,-1) • Para (1,3) jest w równowadze von Stackelberga z D2 jako leaderem z wynikiem (1½, -⅔)

37

38 Drzewa decyzyjne

39 Postać ekstensywna gry
• Proces decyzyjny w postaci ekstensywnej ma formę drzewa o skończonej liczbie wierzchołków • Możemy opisać tak gry N-osobowe • Można wprowadzić różne zbiory informacyjne dla różnych poziomów procesu • Dogodna prezentacja gier jedno- i wielokrokowych o sumie zerowej i niezerowej D1 D2 B C A 1 2 5 7 8 4 3

40 Network Flows a c Source s Sink t b d
10 1 Source s Sink t b d Let G = [V,E] be a directed graph with capacity cap(v,w) on edge [v,w]. A flow is an (integer) function, f, that is chosen for each edge so that We wish to maximize the flow allocation.

41 A maximum network flow example By inspection
10 1 Source s Sink t b d Step 1: Source s Sink t a c b d 10, 10 10 1 Flow is of size 10

42 A maximum network flow example
Step 2: a c 10, 10 Source s Sink t 10, 10 1 10, 10 1 10, 1 b d 10, 1 1, 1 Source s Sink t a c b d 10, 10 10, 2 10, 9 1,1 1, 1 Maximum flow: Flow is of size 10+2 = 12 Not obvious Flow is of size 10+1 = 11

43 Ford-Fulkerson Method of Augmenting Paths
Set f(v,w) = -f(w,v) on all edges. Define a Residual Graph, R, in which res(v,w) = cap(v,w) – f(v,w) Find paths from s to t for which there is positive residue. Increase the flow along the paths to augment them by the minimum residue along the path. Keep augmenting paths until there are no more to augment.

44 Example of Residual Graph
c 10, 10 10, 10 1 s 10, 10 t 1 10 10 b d 1 Flow is of size 10 Residual Graph, R res(v,w) = cap(v,w) – f(v,w) a c 10 10 10 1 s t 1 10 10 b d 1 Augmenting path

45 Example of Residual Graph
Step 2: a c 10, 10 s t 10, 10 1 10, 10 1 10, 1 b d 10, 1 1, 1 Flow is of size 10+1 = 11 Residual Graph a c 10 s t 10 10 1 1 1 1 b d 1 9 9

46 Complexity of network flow problems
In general, it is possible to find a solution by considering at most |V|.|E| paths, by picking shortest augmenting path first. There are many variations, such as picking most augmenting path first.


Pobierz ppt "Sztuczna Inteligencja - wykład 2"

Podobne prezentacje


Reklamy Google