Gry o sumie niezerowej Dla 2 graczy trzeba zdefiniować 2 macierze (wypłat lub strat) dla każdego z graczy Zakładamy – obydwaj gracze minimalizują straty Macierz A – straty gracza D1 Macierz B – straty gracza D2
Gry o sumie niezerowej • Jeśli role graczy są symetryczne - równowaga Nasha • Jeśli podejrzewamy, że przeciwnik będzie „złośliwy” - strategia minimaksowa - sprowadzamy właściwie problem do gry o sumie zerowej • Jeśli w grze występuje hierarchia w procesie decyzyjnym oraz pozycja graczy nie jest identyczna (symetrycza) - równowaga w sensie von Stackelberga
John F. Nash, 1928- When the 21-year old John Nash wrote his 27-page dissertation outlining his "Nash Equilibrium" for strategic non-cooperative games, the impact was enormous. Słowa kluczowe: równowaga Nasha, Nash equilibrium
Równowaga Nasha • Równowaga Nasha osiągnięta jest wówczas gdy jednostronne naruszenie równowagi (odejście od strategii dającej równowagę) pogarsza rezultat gracza podejmującego taką decyzję Założenia: • Rozpatrywać będziemy gry dwuosobowe, skończone i statyczne, w których gracze nie kooperują ze sobą • Obaj gracze D1 i D2 chcą minimalizować swoje straty; ich macierze wypłat to odpowiednio A i B; strategie D1 są w wierszach, a D2 w kolumnach
Równowaga Nasha Para strategii (i0, j0) określa rozwiązanie równowagi Nasha w grze dwumacierzowej (A, B) jeśli spełnione są warunki
Równowaga Nasha - przykład Dwaj użytkownicy korzystają ze wspólnego magazynu. Ich koszty związane są z kosztami pobierania z magazynu i stratami związanymi z niezaspokojeniem potrzeb, przy czym zależą od tego, jaką decyzję (1- pobrać, 2 - nie pobrać) podjął drugi użytkownik: D2 D1 1 2 15 30 -15 D2 D1 1 2 20 30 10 A = B = Są dwa położenia równowagi Nasha 1. dla pary strategii (1,1), z rezultatem (15,20) 2. dla pary strategii (2,2), z rezultatem (-15,0) para strategii (2,2) jest lepsza dla obu użytkowników
Strategie dopuszczalne Ocena strategii Para strategii (i1, j1) jest lepsza niż (i2, j2) jeśli oraz i przynajmniej jedna z tych nierówności jest ostra Dopuszczalność strategii Para strategii Nasha jest dopuszczalna, jeśli nie istnieje para strategii od niej lepsza
W przykładzie jedyną dopuszczalną parą strategii Nasha Jest para (2,2), stąd Jest ona "najrozsądniejsza". Nie zawsze Jednak wybór strategii "rozsądnej" Jest możliwy, problem może posiadać bowiem więcej niż jedną dopuszczalną parę strategii, będących rozwiązaniem równowagi Nasha. Przykładem takiego problemu może być para macierzy opisujących straty w jednym z klasycznych problemów teorii gier zwanym "walką płci".
Walka płci Świerniak A.: Podejmowanie decyzji w sytuacjach konfliktowych. Skrypt Uczelniany Politechniki Śląskiej Nr 1791, Gliwice 1993
Walka płci D2 D1 1 2 -2 -1 D2 D1 1 2 -1 -2 A = B = Istnieją dwie dopuszczalne pary strategii dopuszczalnych (1,1) i (2,2) z rezultatami odpowiednio (-2,-1) i (-1,-2) Gracze nie mogą się porozumieć — jeśli zagrają na różne punkty równowagi mogą uzyskać wynik niekorzystny dla obu stron tzn. (1,1)
UWAGI: Strategie punktu siodłowego są strategiami bezpiecznymi decydentów (z poprzedniego wykładu). W problemach o sumie niezerowej można również zdefiniować strategie bezpieczne, przy czym strategie równowagi Nasha tylko w niektórych przypadkach są bezpieczne. Oczywiście strategie bezpieczne decydentów muszą być odniesione do ich macierzy strat, tzn. dla D^ do macierzy A dla D2 do B. W przykładzie para strategii bezpiecznych wyznaczała punkt równowagi Nasha (1,1), ale nie było to rozwiązanie dopuszczalne. Inaczej jest w problemie zwanym w literaturze jako „dylemat więźnia”.
Dylemat więźnia D2 D1 1 2 30 8 D2 D1 1 2 30 8 A = B = • Strategiami równowagi Nasha jest para (2, 2) dająca wynik (8, 8) • Dla obu graczy lepszym wynikiem jest (2, 2) uzyskiwany przy parze strategii (1,1). Tu konieczne jest całkowite zaufanie graczy do siebie - jednostronne odstępstwo dla drugiego z graczy grozi wynikiem 30. • Para strategii (2, 2) jest natomiast bezpieczna. Zostałaby uzyskana, gdyby każdy z graczy uważał grę za problem o sumie zerowej i wybierał strategię minimaksową dla odpowiedniej gry
UWAGI: Wybór strategii bezpiecznych w problemie o sumie niezerowej bywa uzasadniony, nawet gdy strategie te nie prowadzą do równowagi niekooperacyjnej (Nasha). Jest tak zwłaszcza w przypadku, gdy istnieją dwie lub więcej niewymienialnych par równowagi Nasha lub gdy decydenci nie są całkowicie pewni rozumowania konkurentów, czy wartości strat. Mówimy wówczas o parze strategii minimaksowych dla decydentów w problemie o sumie niezerowej, a poziomy bezpieczeństwa decydentów nazywane są wartościami minimax. Działanie takie odpowiada założeniu, że przeciwnik nie tyle dba o minimalizację swoich strat, ile chce nam przeszkodzić w realizowaniu najlepszych dla nas rozwiązań. Wartości rozwiązań minimaksowych są nie lepsze (a więc nie mniejsze) niż pary wartości jakiegokolwiek rozwiązania równowagi Nasha
Równowaga von Stackelberga • Role graczy są niesymetryczne —jeden z graczy, leader, ma możliwość forsowania swojej strategii w stosunku do drugiego gracza followera •Wymagamy równowagi hierarchicznej • Zadaniem followera jest racjonalna reakcja na decyzje leadera
Heinrich Freiherr von Stackelberg Born October 31, 1905) Moscow, Russian Empire Died October 12, 1946 (aged 40) Madrid, Spain
Równowaga von Stackelberga Zbiór racjonalnych reakcji (optymalnych odpowiedzi) followera (gracz D2) Strategie von Stackelberga dla leadera i0 (S* - koszt dla leadera) Element jR(i0) to odpowiedź followera na strategię i0 leadera Para (i0, j0) jest rozwiązaniem równowagi Stackelberga
Przykład 1 A = B = Para (2,2) jest w równowadze Nasha, wynik (1,0) D2 D1 1 2 3 1.5 -1 D2 D1 1 2 3 -1 -0.75 -0.5 A = B = Para (2,2) jest w równowadze Nasha, wynik (1,0) Para (1,1) jest w równowadze von Stackelberga z D1 jako leaderem z wynikiem (0,-1) Para (1,3) jest w równowadze von Stackelberga z D2 jako leaderem z wynikiem (1.5, -0.75)
Przykład 2 - problem przydziału wody Decydent D2: Pobór pełny (P) Pobór ciągły (C) Pobór okresowy (T) Decydent D1: Otwiera tamę (1) Zamyka tamę (2) Miara strat D1: odchyłka od przyjętej polityki retencjonowania zbiorników Miara strat D2: niezaspokojenie własnego zapotrzebowania na wodę
Przykład 2 - problem przydziału wody D2 D1 P C T 1 2 4 3 D2 D1 P C T 1 2 A = B = D1 - leader Jeśli D1 zadeklaruje strategię 1, to D2 ma do dyspozycji dwie strategie: P oraz T. R(1) = {P, T} Jeśli D1 zadeklaruje strategię 2, to D2 ma do dyspozycji dwie strategie: P oraz C. R(2) = {P, C}
Przykład 2 - problem przydziału wody D2 D1 P C T 1 2 4 3 D2 D1 P C T 1 2 A = B = R(1) = {P, T} R(2) = {P, C} Decyzja D1: 2, Koszt Stackelberga dla leadera wynosi S(A)=3 D1 może osiągnąć niższy koszt, w zależności od tego, czy D2 wybierze P, czy C
Uwagi Jak łatwo zauważyć każdorazowo leader osiąga wynik lepszy niż odpowiadający mu wynik w równowadze Nasha. Własność ta jest zachowana jednak tylko wówczas, gdy zbiór racjonalnych reakcji followera na i-te zagranie leadera jest jednoelementowy i to dla wszystkich możliwych strategii leadera. Nawet w przypadku, gdy odpowiedź na strategię Stackelberga leadera jest określona jednoznacznie wynik równowagi Nasha może być korzystniejszy niż koszt Stackelberga dla leadera, jeśli zbiory reakcji racjonalnych na inne zagrania nie są jednoelementowe
Przykład 3 D2 D1 1 2 -1 D2 D1 1 2 A = B =
Równowaga Nasha określona jest przez parę strategii (2, 1) i daje wynik (-1, 1) podczas gdy równowaga Stackelberga z D1 jako leaderem zdefiniowana jest parą (1, 1) i wynikiem (0, 0) - gorszym dla leadera niż wynik Nasha !