Stochastyczne modele gier ewolucyjnych Jacek Miękisz Instytut Matematyki Stosowanej i Mechaniki Uniwersytet Warszawski.

Slides:



Advertisements
Podobne prezentacje
Modelowanie kursu walutowego- perspektywa krótkookresowa
Advertisements

Z. Gburski, Instytut Fizyki UŚl.
Metody badania stabilności Lapunowa
Model Konkurujących Gatunków
Aukcja o dolara $$$ P. Jaworska W. Filipowicz.
Topology of the World Trade Web. Świat jako twór stawiający wysokie wymagania Świat staje się globalną wioską- global village Ogromne znaczenie handlu.
HERD BEHAVIOR AND AGGREGATE FLUCTUATIONS IN FINANCIAL MARKETS Rama Cont & Jean-Philipe Bouchaud. Macroeconomic Dynamics, 4, 2000, Cambridge University.
Uczenie ze wzmocnieniem
Autorzy: Piotr Dudojć Emil Somnicki
Zmienne losowe i ich rozkłady
Model immunologiczny.
Gry o sumie niezerowej Dla 2 graczy trzeba zdefiniować 2 macierze
Statystyczne parametry akcji
Zagadnienie niedokładności w GIS
Jakub M. Gac Wydział Fizyki Politechniki Warszawskiej
Błądzenie przypadkowe i procesy transportu w sieciach złożonych
Krzysztof Suchecki wybrana prezentacja z konferencji ECCS'07 w Dreźnie Interacting Random Boolean Networks.
Od gier mniejszościowych do prawdziwych rynków From Minority Games to real markets D. Challet, A. Chessa, M. Marsili, Y-C. Zhang Wojciech Dzikowski 26.
Wykład 4 Rozkład próbkowy dla średniej z rozkładu normalnego
Wykład 3 Wzór Bayesa – wpływ rozkładu a priori.
Wykład 3 Rozkład próbkowy dla średniej z rozkładu normalnego
Wykład 3 Wzór Bayesa, cd.: Wpływ rozkładu a priori.
Wykład 6 Metody Monte Carlo
Analiza sieci genowych Agnieszka Marmołowska Jacek Ławrynowicz.
Metody Symulacyjne w Telekomunikacji (MEST) Wykład 6/7: Analiza statystyczna wyników symulacyjnych  Dr inż. Halina Tarasiuk
Nauka Podejście klasyczne (XVI – XX w)
Konkurencja niedoskonała
Epidemie w sieciach złożonych
Teorie gier w socjobiologii (BPZ – ćwiczenia)
Algorytm mini-max.
dr Grzegorz Szafrański
Elementy Rachunku Prawdopodobieństwa i Statystyki
Wstęp do Teorii Gier.
Elementy Rachunku Prawdopodobieństwa i Statystyki
Algorytmy memetyczne i ich zastosowania
Metody Lapunowa badania stabilności
Strategie stabilne ewolucyjnie w oparciu o przykłady zwierzęce
IV OTWARTE MISTRZOSTWA OPOLA W PROGRAMOWANIU ZESPOŁOWYM
AUTOMATYKA i ROBOTYKA (wykład 6)
na podstawie materiału – test z użyciem komputerowo generowanych prób
Homogenizacja Kulawik Krzysztof.
Łukasz Balbus Anna Jaśkiewicz
Elementy Rachunku Prawdopodobieństwa i Statystyki
Stabilność Stabilność to jedno z najważniejszych pojęć dynamiki systemów i teorii sterowania W większości przypadków, stabilność jest warunkiem koniecznym.
SYSTEMY EKSPERTOWE I SZTUCZNA INTELIGENCJA
Teoriogrowe modele popromiennego efektu sąsiedztwa (bystander effect) Andrzej Świerniak, Michał Krześlak Politechnika Śląska Instytut Automatyki.
Seminarium licencjackie Beata Kapuścińska
D. Ciołek BADANIA OPERACYJNE – wykład 4
P. Jaworska W. Filipowicz. Nasi gracze nazywają się Przemek (gracz 1) i Kasia (gracz 2). Wyobraźmy sobie sytuację, w której Przemek i Kasia maja zadecydować.
Strategie stabilne ewolucyjnie.  Znajduje szerokie zastosowanie w wyjaśnieniu zjawisk badanych przez biologię ewolucyjną.  Stosowane w badaniach behawioralnych.
Wnioskowanie statystyczne
Matematyka Starzenia – Modele Skracania Telomerów Andrzej Świerniak Politechnika Śląska, Instytut Automatyki.
GRA CHOMP. Czym jest chomp? Jest to gra dla dwóch osób, rozgrywana na prostokątnej tablicy, zwanej „tabliczką czekolady”
C(r) całka korelacji: – norma badanej wielkości fizycznej
Proste strategiczne gry decyzyjne 1.Inwestor dysponuje opcją na zasadzie wyłączności, chronionej patentem licencją, itp.; model jednookresowy – decyzja.
Autor: Michał Salewski
Teoria GIER.
Podstawy zarządzania ćwiczenia nr 4 Temat: p rogramowanie dynamiczne, macierz wypłat, techniki drzew decyzyjnych Horacy Dębowski Horacy.
Modele sieci społecznych
Oligopol oferentów Założenia modelu: 1.Na rynku danego dobra jest kilku dużych oferentów i bardzo wielu drobnych nabywców. 2.Na rynku a) nie ma preferencji.
Rozkłady statystyk z próby dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium.
Fizyka komputerowa 2005 Katarzyna Weron, W sieci.
STATYSTYKA – kurs podstawowy wykład 11
Biomatematyka Dr Wioleta Drobik-Czwarno
Teoria sterowania Wykład /2016
Statystyka matematyczna
Sterowanie procesami ciągłymi
Jednorównaniowy model regresji liniowej
Własności asymptotyczne ciągów zmiennych losowych
Zapis prezentacji:

Stochastyczne modele gier ewolucyjnych Jacek Miękisz Instytut Matematyki Stosowanej i Mechaniki Uniwersytet Warszawski

Princeton meeting 1949 John von Neumann 1903-1957 John Forbes Nash 1928-

Jak grać? Równowaga Nasha Przypisanie graczom strategii, tak iż żadnemu z graczy, przy ustalonych strategiach wszystkich innych graczy, nie opłaca się zmienić swojej strategii

problem wyboru równowagi Formalnie gra w jelenia i zająca (St,St) równowaga efektywna (H,H) równowaga bezpieczna średnia St - 5/2 Średnia H - 3 problem wyboru równowagi

Dynamika populacji A i B - dwa możliwe zachowania, czas A i B - dwa możliwe zachowania, fenotypy, strategie osobników

Prosty model ewolucji Selekcja osobnicy oddziałują w parach – grają w gry uzyskują wypłaty = liczba potomstwa Fenotypy są dziedziczone Potomstwo może mutować

Dobór osobników do gry każdy gra z każdym losowe spotkania graczy gry na grafach, populacje ze strukturą przestrzenną

selekcja mutacje Stochastyczna dynamika skończonych populacji n - liczba osobników zt - liczba osobników grających A w czasie t Ω ={0,…,n} - przestrzeń stanów selekcja zt+1 > zt jeśli „średnia” z A > „średnia z B mutacje Każdy osobnik może zmienić swoją strategię z prawdopodobieństwem ε

Łańcuch Markowa z jedyną miarą stacjonarną μεn

Klasyczne wyniki Każdy gra z każdym, Kandori-Mailath-Rob 1993 A B A a b B c d a>c i d>b, (A,A) i (B,B) – równowagi Nasha A jest stategią efektywną, a>d B jest strategią dominującą ze względu na ryzyko c+d>a+b

Losowy dobór graczy, Robson - Vega Redondo, 1996 pt liczba krzyżowych spotkań

JM J. Theor. Biol, 2005 Twierdzenie

Lemat drzewny (Freidlin and Wentzell) ergodyczny łańcuch Markowa ze skończona przestrzenią Ω, macierzą przejścia Pε , i jedyną miarą stacjonarną με z1 z2 z3 Pε (z4|z1) z4 z5 x

Gry przestrzenne z lokalnymi oddziaływaniami

Dynamika deterministyczna reguła najlepszej odpowiedzi i Br(St,St)=St Br(H,H)=H Br(H,St)=Br(St,H)=H

Dynamika stochastyczna a) zaburzona najlepsza odpowiedź z prawdopodobieństwem 1-ε gracz wybiera najlepszą odpowiedź z prawdopodobieństwem ε gracz myli się , b) reguła log-linear

Jeleń i zając na Z, z oddziaływaniem najbliższych sąsiadów i zaburzoną najlepszą odpowiedzią liczenie błędów

Otwarty problem konstrukcja gry przestrzennej z jedyną miarą stacjonarną μεΛ która ma następujące własności

Dylemat Więźnia na grafach losowych wspólna praca z Bartoszem Sułkowskim C D C 3 0 D 5 1 (D,D) jest jedyną równowagą Nasha

Bezskalowe grafy typu Barabasi-Alberty Grafy Poissona Każdą parę wierzchołków łączymy krawędzią z prawdopodobieństwem p Rozkład stopni wierzchołków jest rozkładem Poissona Bezskalowe grafy typu Barabasi-Alberty Reguła preferencyjnego linkowania Rozkład stopni wierzchołków ~ k-λ

dynamika imitacji C C D C 3 0 D 5 1 C 2 -1 D 4 0 gracze z lewej dostają 3 środkowy gracz 6 prawy gracz dostaje 5 gracze z lewej dostają 2 środkowy gracz 3 prawy gracz dostaje 4 D zmienia się w C środkowe C zmienia się w D

C D C 1 0 D T 0 C D C 1-γ -γ D T-γ -γ γ - koszt połączenia dynamika imitacji najlepszej strategii z otoczenia średni poziom współpracy w stanie stacjonarnym

Co dalej? gry na grafach losowych koewolucja sieci powiązań i strategii

Deterministyczna dynamika replikatorowa A B A a b U = B c d pA(t) – liczba osobników grających A w czasie t pB(t) – liczba osobników grających B w czasie t Proponujemy UA = ax + b(1-x) UB = cx + d(1-x) Uav = xUA +(1-x)UB pA(t+ε)=(1-ε)pA(t) + εpA(t)UA(t)

pA(t+ε) = (1-ε)pA(t) + εpA(t)UA(t) pB(t+ε) = (1-ε)pB(t) + εpB(t)UB(t) p(t+ε) = (1-ε)p(t) + εp(t)Uav(t)

∙←←←←←∙→→→∙ ∙→→→→∙←←←←∙ Jeleń - Zając Jastrząb - Gołąb J G dx/dt = x(1-x)(UA – UB) Jeleń - Zając J Z J 5 0 Z 3 3 ∙←←←←←∙→→→∙ 0 3/ 5 1 mieszana równowaga jest niestabilna Jastrząb - Gołąb J G J -1 2 G 0 1 ∙→→→→∙←←←←∙ 0 1/2 1 mieszana równowaga jest stabilna

Opóźnienia ( dla Jastrzębia i Gołębia) →→→→x*←←←← opóźnienie społeczne Zakładamy, że osobnicy w czasie t naśladują strategie, które miały większe wypłaty w czasie t- τ. Proponujemy

odpowiednie równanie replikatorowe w czasie ciągłym ma postać Twierdzenie (Jan Alboszta i JM, J. Theor. Biol. 231: 175-179, 2004) x* jest asymptotycznie stabilny jeśli τ jest odpowiednio małe x* jest niestabilny dla odpowiednio dużego τ

Biologiczne opóźnienie Zakładamy,że osobnicy rodzą się τ czasu po tym jak ich rodzice grali i uzyskali wypłaty. Proponujemy Twierdzenie (JA i JM, JTB 2004) x* jest asymptotycznie stabilny dla każdego opóźnienia τ

Stochastyczna dynamika z opóźnieniem na grafach a) zaburzona najlepsza odpowiedź na stan w t-τ , z prawdopodobieństwem 1-ε gracz wybiera najlepszą odpowiedź z prawdopodobieństwem ε gracz myli się b) zaburzona imitacja stanu w t-τ z prawdopodobieństwem 1-ε gracz imituje najlepszego gracza z prawdopodobieństwem ε gracz myli się

Dziękuję za uwagę www.mimuw.edu.pl/~miekisz