Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

Gry o sumie niezerowej Dla 2 graczy trzeba zdefiniować 2 macierze (wypłat lub strat) dla każdego z graczy Zakładamy – obydwaj gracze minimalizują straty.

Podobne prezentacje


Prezentacja na temat: "Gry o sumie niezerowej Dla 2 graczy trzeba zdefiniować 2 macierze (wypłat lub strat) dla każdego z graczy Zakładamy – obydwaj gracze minimalizują straty."— Zapis prezentacji:

1 Gry o sumie niezerowej Dla 2 graczy trzeba zdefiniować 2 macierze (wypłat lub strat) dla każdego z graczy Zakładamy – obydwaj gracze minimalizują straty Macierz A – straty gracza D1 Macierz B – straty gracza D2

2 Gry o sumie niezerowej Jeśli role graczy są symetryczne - równowaga Nasha Jeśli podejrzewamy, że przeciwnik będzie złośliwy - strategia minimaksowa - sprowadzamy właściwie problem do gry o sumie zerowej Jeśli w grze występuje hierarchia w procesie decyzyjnym oraz pozycja graczy nie jest identyczna (symetrycza) - równowaga w sensie von Stackelberga

3 John F. Nash, When the 21-year old John Nash wrote his 27-page dissertation outlining his "Nash Equilibrium" for strategic non-cooperative games, the impact was enormous. Słowa kluczowe: równowaga Nasha, Nash equilibrium

4 Równowaga Nasha osiągnięta jest wówczas gdy jednostronne naruszenie równowagi (odejście od strategii dającej równowagę) pogarsza rezultat gracza podejmującego taką decyzję Założenia: Rozpatrywać będziemy gry dwuosobowe, skończone i statyczne, w których gracze nie kooperują ze sobą Obaj gracze D 1 i D 2 chcą minimalizować swoje straty; ich macierze wypłat to odpowiednio A i B; strategie D 1 są w wierszach, a D 2 w kolumnach Równowaga Nasha

5 Para strategii (i 0, j 0 ) określa rozwiązanie równowagi Nasha w grze dwumacierzowej (A, B) jeśli spełnione są warunki

6 Równowaga Nasha - przykład Dwaj użytkownicy korzystają ze wspólnego magazynu. Ich koszty związane są z kosztami pobierania z magazynu i stratami związanymi z niezaspokojeniem potrzeb, przy czym zależą od tego, jaką decyzję (1- pobrać, 2 - nie pobrać) podjął drugi użytkownik: D 2 D D 2 D A =B = Są dwa położenia równowagi Nasha 1. dla pary strategii (1,1), z rezultatem (15,20) 2. dla pary strategii (2,2), z rezultatem (-15,0) para strategii (2,2) jest lepsza dla obu użytkowników

7 Strategie dopuszczalne Dopuszczalność strategii Para strategii Nasha jest dopuszczalna, jeśli nie istnieje para strategii od niej lepsza Ocena strategii Para strategii (i 1, j 1 ) jest lepsza niż (i 2, j 2 ) jeśli oraz i przynajmniej jedna z tych nierówności jest ostra

8 W przykładzie jedyną dopuszczalną parą strategii Nasha Jest para (2,2), stąd Jest ona "najrozsądniejsza". Nie zawsze Jednak wybór strategii "rozsądnej" Jest możliwy, problem może posiadać bowiem więcej niż jedną dopuszczalną parę strategii, będących rozwiązaniem równowagi Nasha. Przykładem takiego problemu może być para macierzy opisujących straty w jednym z klasycznych problemów teorii gier zwanym "walką płci".

9 Walka płci Świerniak A.: Podejmowanie decyzji w sytuacjach konfliktowych. Skrypt Uczelniany Politechniki Śląskiej Nr 1791, Gliwice 1993

10 Walka płci D 2 D D 2 D A =B = Istnieją dwie dopuszczalne pary strategii dopuszczalnych (1,1) i (2,2) z rezultatami odpowiednio (-2,-1) i (-1,-2) Gracze nie mogą się porozumieć jeśli zagrają na różne punkty równowagi mogą uzyskać wynik niekorzystny dla obu stron tzn. (1,1)

11 UWAGI: Strategie punktu siodłowego są strategiami bezpiecznymi decydentów (z poprzedniego wykładu). W problemach o sumie niezerowej można również zdefiniować strategie bezpieczne, przy czym strategie równowagi Nasha tylko w niektórych przypadkach są bezpieczne. Oczywiście strategie bezpieczne decydentów muszą być odnie­sione do ich macierzy strat, tzn. dla D^ do macierzy A dla D2 do B. W przykładzie para strategii bezpiecznych wyznaczała punkt równowagi Nasha (1,1), ale nie było to rozwiązanie dopuszczalne. Inaczej jest w problemie zwanym w literaturze jako dylemat więźnia.

12 Dylemat więźnia Strategiami równowagi Nasha jest para (2, 2) dająca wynik (8, 8) Dla obu graczy lepszym wynikiem jest (2, 2) uzyskiwany przy parze strategii (1,1). Tu konieczne jest całkowite zaufanie graczy do siebie - jednostronne odstępstwo dla drugiego z graczy grozi wynikiem 30. Para strategii (2, 2) jest natomiast bezpieczna. Zostałaby uzyskana, gdyby każdy z graczy uważał grę za problem o sumie zerowej i wybierał strategię minimaksową dla odpowiedniej gry D 2 D D 2 D A =B =

13 UWAGI: Wybór strategii bezpiecznych w problemie o sumie niezerowej bywa uzasadniony, nawet gdy strategie te nie prowadzą do równowagi niekooperacyjnej (Nasha). Jest tak zwłaszcza w przypadku, gdy istnieją dwie lub więcej nie­wymienialnych par równowagi Nasha lub gdy decydenci nie są całkowicie pewni rozumowania konkurentów, czy wartości strat. Mówimy wówczas o parze strategii minimaksowych dla decydentów w problemie o sumie niezerowej, a poziomy bez­ pieczeństwa decydentów nazywane są wartościami minimax. Działanie takie odpowiada założeniu, że przeciwnik nie tyle dba o minimalizację swoich strat, ile chce nam przeszkodzić w realizowaniu najlepszych dla nas rozwiązań. Wartości rozwiązań minimaksowych są nie lepsze (a więc nie mniejsze) niż pary wartości jakiegokolwiek rozwiązania równowagi Nasha

14 Równowaga von Stackelberga Role graczy są niesymetryczne jeden z graczy, leader, ma możliwość forsowania swojej strategii w stosunku do drugiego gracza followera Wymagamy równowagi hierarchicznej Zadaniem followera jest racjonalna reakcja na decyzje leadera

15 Born October 31, 1905) Moscow, Russian Empire MoscowRussian Empire Died October 12, 1946 (aged 40) Madrid, Spain MadridSpain Heinrich Freiherr von Stackelberg

16 Równowaga von Stackelberga Zbiór racjonalnych reakcji (optymalnych odpowiedzi) followera (gracz D 2 ) Strategie von Stackelberga dla leadera i 0 (S* - koszt dla leadera) Element j R(i 0 ) to odpowiedź followera na strategię i 0 leadera Para (i 0, j 0 ) jest rozwiązaniem równowagi Stackelberga

17 Przykład 1 Para (1,1) jest w równowadze von Stackelberga z D 1 jako leaderem z wynikiem (0,-1) Para (1,3) jest w równowadze von Stackelberga z D 2 jako leaderem z wynikiem (1.5, -0.75) D 2 D A = D 2 D B = Para (2,2) jest w równowadze Nasha, wynik (1,0)

18 Przykład 2 - problem przydziału wody Decydent D 1 : Otwiera tamę (1) Zamyka tamę (2) Decydent D 2 : Pobór pełny (P) Pobór ciągły (C) Pobór okresowy (T) Miara strat D 1 : odchyłka od przyjętej polityki retencjonowania zbiorników Miara strat D 2 : niezaspokojenie własnego zapotrzebowania na wodę

19 Przykład 2 - problem przydziału wody D 2 D 1 PCT A = D 2 D 1 PCT B = D 1 - leader Jeśli D 1 zadeklaruje strategię 1, to D 2 ma do dyspozycji dwie strategie: P oraz T. R(1) = {P, T} Jeśli D 1 zadeklaruje strategię 2, to D 2 ma do dyspozycji dwie strategie: P oraz C. R(2) = {P, C}

20 Przykład 2 - problem przydziału wody D 2 D 1 PCT A = D 2 D 1 PCT B = Decyzja D 1 : 2, Koszt Stackelberga dla leadera wynosi S(A)=3 D 1 może osiągnąć niższy koszt, w zależności od tego, czy D 2 wybierze P, czy C R(1) = {P, T} R(2) = {P, C}

21 Uwagi Jak łatwo zauważyć każdorazowo leader osiąga wynik lepszy niż odpowiadający mu wynik w równowadze Nasha. Własność ta jest zachowana jednak tylko wówczas, gdy zbiór racjonalnych reakcji followera na i-te zagranie leadera jest jednoelementowy i to dla wszystkich możliwych strategii leadera. Nawet w przypadku, gdy odpowiedź na strategię Stackelberga leadera jest określona jednoznacznie wynik równowagi Nasha może być korzystniejszy niż koszt Stackelberga dla leadera, jeśli zbiory reakcji racjonalnych na inne zagrania nie są jednoelementowe

22 Przykład 3 D 2 D D 2 D A =B =

23 Równowaga Nasha określona jest przez parę strategii (2, 1) i daje wynik (-1, 1) podczas gdy równowaga Stackelberga z D1 jako leaderem zdefiniowana jest parą (1, 1) i wynikiem (0, 0) - gorszym dla leadera niż wynik Nasha !


Pobierz ppt "Gry o sumie niezerowej Dla 2 graczy trzeba zdefiniować 2 macierze (wypłat lub strat) dla każdego z graczy Zakładamy – obydwaj gracze minimalizują straty."

Podobne prezentacje


Reklamy Google