Stochastyczne modele gier ewolucyjnych Jacek Miękisz Instytut Matematyki Stosowanej i Mechaniki Uniwersytet Warszawski
Princeton meeting 1949 John von Neumann 1903-1957 John Forbes Nash 1928-
Jak grać? Równowaga Nasha Przypisanie graczom strategii, tak iż żadnemu z graczy, przy ustalonych strategiach wszystkich innych graczy, nie opłaca się zmienić swojej strategii
problem wyboru równowagi Formalnie gra w jelenia i zająca (St,St) równowaga efektywna (H,H) równowaga bezpieczna średnia St - 5/2 Średnia H - 3 problem wyboru równowagi
Dynamika populacji A i B - dwa możliwe zachowania, czas A i B - dwa możliwe zachowania, fenotypy, strategie osobników
Prosty model ewolucji Selekcja osobnicy oddziałują w parach – grają w gry uzyskują wypłaty = liczba potomstwa Fenotypy są dziedziczone Potomstwo może mutować
Dobór osobników do gry każdy gra z każdym losowe spotkania graczy gry na grafach, populacje ze strukturą przestrzenną
selekcja mutacje Stochastyczna dynamika skończonych populacji n - liczba osobników zt - liczba osobników grających A w czasie t Ω ={0,…,n} - przestrzeń stanów selekcja zt+1 > zt jeśli „średnia” z A > „średnia z B mutacje Każdy osobnik może zmienić swoją strategię z prawdopodobieństwem ε
Łańcuch Markowa z jedyną miarą stacjonarną μεn
Klasyczne wyniki Każdy gra z każdym, Kandori-Mailath-Rob 1993 A B A a b B c d a>c i d>b, (A,A) i (B,B) – równowagi Nasha A jest stategią efektywną, a>d B jest strategią dominującą ze względu na ryzyko c+d>a+b
Losowy dobór graczy, Robson - Vega Redondo, 1996 pt liczba krzyżowych spotkań
JM J. Theor. Biol, 2005 Twierdzenie
Lemat drzewny (Freidlin and Wentzell) ergodyczny łańcuch Markowa ze skończona przestrzenią Ω, macierzą przejścia Pε , i jedyną miarą stacjonarną με z1 z2 z3 Pε (z4|z1) z4 z5 x
Gry przestrzenne z lokalnymi oddziaływaniami
Dynamika deterministyczna reguła najlepszej odpowiedzi i Br(St,St)=St Br(H,H)=H Br(H,St)=Br(St,H)=H
Dynamika stochastyczna a) zaburzona najlepsza odpowiedź z prawdopodobieństwem 1-ε gracz wybiera najlepszą odpowiedź z prawdopodobieństwem ε gracz myli się , b) reguła log-linear
Jeleń i zając na Z, z oddziaływaniem najbliższych sąsiadów i zaburzoną najlepszą odpowiedzią liczenie błędów
Otwarty problem konstrukcja gry przestrzennej z jedyną miarą stacjonarną μεΛ która ma następujące własności
Dylemat Więźnia na grafach losowych wspólna praca z Bartoszem Sułkowskim C D C 3 0 D 5 1 (D,D) jest jedyną równowagą Nasha
Bezskalowe grafy typu Barabasi-Alberty Grafy Poissona Każdą parę wierzchołków łączymy krawędzią z prawdopodobieństwem p Rozkład stopni wierzchołków jest rozkładem Poissona Bezskalowe grafy typu Barabasi-Alberty Reguła preferencyjnego linkowania Rozkład stopni wierzchołków ~ k-λ
dynamika imitacji C C D C 3 0 D 5 1 C 2 -1 D 4 0 gracze z lewej dostają 3 środkowy gracz 6 prawy gracz dostaje 5 gracze z lewej dostają 2 środkowy gracz 3 prawy gracz dostaje 4 D zmienia się w C środkowe C zmienia się w D
C D C 1 0 D T 0 C D C 1-γ -γ D T-γ -γ γ - koszt połączenia dynamika imitacji najlepszej strategii z otoczenia średni poziom współpracy w stanie stacjonarnym
Co dalej? gry na grafach losowych koewolucja sieci powiązań i strategii
Deterministyczna dynamika replikatorowa A B A a b U = B c d pA(t) – liczba osobników grających A w czasie t pB(t) – liczba osobników grających B w czasie t Proponujemy UA = ax + b(1-x) UB = cx + d(1-x) Uav = xUA +(1-x)UB pA(t+ε)=(1-ε)pA(t) + εpA(t)UA(t)
pA(t+ε) = (1-ε)pA(t) + εpA(t)UA(t) pB(t+ε) = (1-ε)pB(t) + εpB(t)UB(t) p(t+ε) = (1-ε)p(t) + εp(t)Uav(t)
∙←←←←←∙→→→∙ ∙→→→→∙←←←←∙ Jeleń - Zając Jastrząb - Gołąb J G dx/dt = x(1-x)(UA – UB) Jeleń - Zając J Z J 5 0 Z 3 3 ∙←←←←←∙→→→∙ 0 3/ 5 1 mieszana równowaga jest niestabilna Jastrząb - Gołąb J G J -1 2 G 0 1 ∙→→→→∙←←←←∙ 0 1/2 1 mieszana równowaga jest stabilna
Opóźnienia ( dla Jastrzębia i Gołębia) →→→→x*←←←← opóźnienie społeczne Zakładamy, że osobnicy w czasie t naśladują strategie, które miały większe wypłaty w czasie t- τ. Proponujemy
odpowiednie równanie replikatorowe w czasie ciągłym ma postać Twierdzenie (Jan Alboszta i JM, J. Theor. Biol. 231: 175-179, 2004) x* jest asymptotycznie stabilny jeśli τ jest odpowiednio małe x* jest niestabilny dla odpowiednio dużego τ
Biologiczne opóźnienie Zakładamy,że osobnicy rodzą się τ czasu po tym jak ich rodzice grali i uzyskali wypłaty. Proponujemy Twierdzenie (JA i JM, JTB 2004) x* jest asymptotycznie stabilny dla każdego opóźnienia τ
Stochastyczna dynamika z opóźnieniem na grafach a) zaburzona najlepsza odpowiedź na stan w t-τ , z prawdopodobieństwem 1-ε gracz wybiera najlepszą odpowiedź z prawdopodobieństwem ε gracz myli się b) zaburzona imitacja stanu w t-τ z prawdopodobieństwem 1-ε gracz imituje najlepszego gracza z prawdopodobieństwem ε gracz myli się
Dziękuję za uwagę www.mimuw.edu.pl/~miekisz