Gry o sumie niezerowej Dla 2 graczy trzeba zdefiniować 2 macierze

Slides:

Advertisements

Podobne prezentacje

Leszek Smolarek Akademia Morska w Gdyni 2005/2006

Advertisements

OLIGOPOLE WNE UW 3 GRUDNIA 2005.

Sterowanie – metody alokacji biegunów II

Planowanie bezkolizyjnego ruchu w środowisku wielu robotów z wykorzystaniem gier niekooperacyjnych OWD

Aukcja o dolara $$$ P. Jaworska W. Filipowicz.

Analiza współzależności zjawisk

Obserwowalność System ciągły System dyskretny

Wybrane zastosowania programowania liniowego

Rachunek prawdopodobieństwa 2

Metody rozwiązywania układów równań liniowych

Badania operacyjne. Wykład 1

Badania operacyjne. Wykład 2

Stochastyczne modele gier ewolucyjnych Jacek Miękisz Instytut Matematyki Stosowanej i Mechaniki Uniwersytet Warszawski.

Wykład nr 4 Rynek pracy W prezentacji zostały wykorzystane slajdy pomocnicze do książki: Microeconomics, R.S.Pindyck D.L.Rubinfeld.

WYKŁAD 7. Spójność i rozpięte drzewa

Paradoks partycypacji wyborczej

Wykonała: Aleksandra Śmieciuch

Od gier mniejszościowych do prawdziwych rynków From Minority Games to real markets D. Challet, A. Chessa, M. Marsili, Y-C. Zhang Wojciech Dzikowski 26.

Elementy Kombinatoryki (c.d.)

Problem transportowy opracowanie na podstawie „Metody wspomagające podejmowanie decyzji w zarządzaniu” D. Witkowska, Menadżer Łódź 2000.

Konkurencja niedoskonała

Elementy Rachunku Prawdopodobieństwa i Statystyki

Strategie stabilne ewolucyjnie w oparciu o przykłady zwierzęce

Podstawy analizy matematycznej II

Programowanie liniowe w teorii gier

Dood.pl Modele biznesowe wyszukiwarek internetowych w teorii i praktyce.

Elementy Rachunku Prawdopodobieństwa i Statystyki

Elementy Rachunku Prawdopodobieństwa i Statystyki

Zagadnienie transportowe

M.STAŃCZYK M. JÓZEFIAK A. MISZTAL

Łukasz Balbus Anna Jaśkiewicz

Sterowanie – metody alokacji biegunów

Obserwowalność i odtwarzalność

Model relacyjny.

Sterowanie – metody alokacji biegunów II

Działanie racjonalne w polityce

PODEJMOWANIE DECYZJI W WARUNKACH PEWNOŚCI (MODEL EV)

PROBLEM DUOPOLU Agnieszka Baraniak Karina Borkowska

MS Excel - wspomaganie decyzji

Drgania punktu materialnego

II Zadanie programowania liniowego PL

Sztuczna Inteligencja - wykład 2

STREFA DYLEMATU Prezentację wykonali studenci specjalności DUA gr. 2:

D. Ciołek BADANIA OPERACYJNE – wykład 4

Gry różniczkowe i ich zastosowania w Automatyce i Robotyce

D. Ciołek BADANIA OPERACYJNE – wykład 4

P. Jaworska W. Filipowicz. Nasi gracze nazywają się Przemek (gracz 1) i Kasia (gracz 2). Wyobraźmy sobie sytuację, w której Przemek i Kasia maja zadecydować.

Strategie stabilne ewolucyjnie.  Znajduje szerokie zastosowanie w wyjaśnieniu zjawisk badanych przez biologię ewolucyjną.  Stosowane w badaniach behawioralnych.

Systemy dynamiczne 2014/2015Obserwowalno ść i odtwarzalno ść  Kazimierz Duzinkiewicz, dr hab. in ż. Katedra In ż ynierii Systemów Sterowania 1 Obserwowalność.

Wspomaganie Decyzji IV

D. Ciołek EKONOMETRIA – wykład 5

Zagadnienie i algorytm transportowy

GRA CHOMP. Czym jest chomp? Jest to gra dla dwóch osób, rozgrywana na prostokątnej tablicy, zwanej „tabliczką czekolady”

Dane – informacje - wiadomości Kodowanie danych i problem nadmiarowości.

Proste strategiczne gry decyzyjne 1.Inwestor dysponuje opcją na zasadzie wyłączności, chronionej patentem licencją, itp.; model jednookresowy – decyzja.

Warstwowe sieci jednokierunkowe – perceptrony wielowarstwowe

Badania operacyjne i teoria optymalizacji semestr zimowy 2015/2016

Podstawy zarządzania ćwiczenia nr 4 Temat: p rogramowanie dynamiczne, macierz wypłat, techniki drzew decyzyjnych Horacy Dębowski Horacy.

Oligopol oferentów Założenia modelu: 1.Na rynku danego dobra jest kilku dużych oferentów i bardzo wielu drobnych nabywców. 2.Na rynku a) nie ma preferencji.

BYĆ PRZEDSIĘBIORCZYM - nauka przez praktykę Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.

Zdefiniować problem Jaki jest problem? Jakie są główne założenia? Jak chcesz śledzić przebieg funkcjonowania projektu ? metody ewaluacji Budżet Jakie źródła.

GRY DWUOSOBOWE O SUMIE NIEZEROWEJ Równowaga Nasha i rozwiązania niekooperacyjne. Dylemat więźnia. Piotr Włodarek, Piotr Stasiołek Matematyka finansowa.

GRY DWUOSOBOWE O SUMIE NIEZEROWEJ

Mikroekonomia Wykład 3.

Podstawy teorii spinu ½

Zapis prezentacji:

Gry o sumie niezerowej Dla 2 graczy trzeba zdefiniować 2 macierze (wypłat lub strat) dla każdego z graczy Zakładamy – obydwaj gracze minimalizują straty Macierz A – straty gracza D1 Macierz B – straty gracza D2

Gry o sumie niezerowej • Jeśli role graczy są symetryczne - równowaga Nasha • Jeśli podejrzewamy, że przeciwnik będzie „złośliwy” - strategia minimaksowa - sprowadzamy właściwie problem do gry o sumie zerowej • Jeśli w grze występuje hierarchia w procesie decyzyjnym oraz pozycja graczy nie jest identyczna (symetrycza) - równowaga w sensie von Stackelberga

John F. Nash, 1928- When the 21-year old John Nash wrote his 27-page dissertation outlining his "Nash Equilibrium" for strategic non-cooperative games, the impact was enormous. Słowa kluczowe: równowaga Nasha, Nash equilibrium

Równowaga Nasha • Równowaga Nasha osiągnięta jest wówczas gdy jednostronne naruszenie równowagi (odejście od strategii dającej równowagę) pogarsza rezultat gracza podejmującego taką decyzję Założenia: • Rozpatrywać będziemy gry dwuosobowe, skończone i statyczne, w których gracze nie kooperują ze sobą • Obaj gracze D1 i D2 chcą minimalizować swoje straty; ich macierze wypłat to odpowiednio A i B; strategie D1 są w wierszach, a D2 w kolumnach

Równowaga Nasha Para strategii (i0, j0) określa rozwiązanie równowagi Nasha w grze dwumacierzowej (A, B) jeśli spełnione są warunki

Równowaga Nasha - przykład Dwaj użytkownicy korzystają ze wspólnego magazynu. Ich koszty związane są z kosztami pobierania z magazynu i stratami związanymi z niezaspokojeniem potrzeb, przy czym zależą od tego, jaką decyzję (1- pobrać, 2 - nie pobrać) podjął drugi użytkownik: D2 D1 1 2 15 30 -15 D2 D1 1 2 20 30 10 A = B = Są dwa położenia równowagi Nasha 1. dla pary strategii (1,1), z rezultatem (15,20) 2. dla pary strategii (2,2), z rezultatem (-15,0) para strategii (2,2) jest lepsza dla obu użytkowników

Strategie dopuszczalne Ocena strategii Para strategii (i1, j1) jest lepsza niż (i2, j2) jeśli oraz i przynajmniej jedna z tych nierówności jest ostra Dopuszczalność strategii Para strategii Nasha jest dopuszczalna, jeśli nie istnieje para strategii od niej lepsza

W przykładzie jedyną dopuszczalną parą strategii Nasha Jest para (2,2), stąd Jest ona "najrozsądniejsza". Nie zawsze Jednak wybór strategii "rozsądnej" Jest możliwy, problem może posiadać bowiem więcej niż jedną dopuszczalną parę strategii, będących rozwiązaniem równowagi Nasha. Przykładem takiego problemu może być para macierzy opisujących straty w jednym z klasycznych problemów teorii gier zwanym "walką płci".

Walka płci Świerniak A.: Podejmowanie decyzji w sytuacjach konfliktowych. Skrypt Uczelniany Politechniki Śląskiej Nr 1791, Gliwice 1993

Walka płci D2 D1 1 2 -2 -1 D2 D1 1 2 -1 -2 A = B = Istnieją dwie dopuszczalne pary strategii dopuszczalnych (1,1) i (2,2) z rezultatami odpowiednio (-2,-1) i (-1,-2) Gracze nie mogą się porozumieć — jeśli zagrają na różne punkty równowagi mogą uzyskać wynik niekorzystny dla obu stron tzn. (1,1)

UWAGI: Strategie punktu siodłowego są strategiami bezpiecznymi decydentów (z poprzedniego wykładu). W problemach o sumie niezerowej można również zdefiniować strategie bezpieczne, przy czym strategie równowagi Nasha tylko w niektórych przypadkach są bezpieczne. Oczywiście strategie bezpieczne decydentów muszą być odniesione do ich macierzy strat, tzn. dla D^ do macierzy A dla D2 do B. W przykładzie para strategii bezpiecznych wyznaczała punkt równowagi Nasha (1,1), ale nie było to rozwiązanie dopuszczalne. Inaczej jest w problemie zwanym w literaturze jako „dylemat więźnia”.

Dylemat więźnia D2 D1 1 2 30 8 D2 D1 1 2 30 8 A = B = • Strategiami równowagi Nasha jest para (2, 2) dająca wynik (8, 8) • Dla obu graczy lepszym wynikiem jest (2, 2) uzyskiwany przy parze strategii (1,1). Tu konieczne jest całkowite zaufanie graczy do siebie - jednostronne odstępstwo dla drugiego z graczy grozi wynikiem 30. • Para strategii (2, 2) jest natomiast bezpieczna. Zostałaby uzyskana, gdyby każdy z graczy uważał grę za problem o sumie zerowej i wybierał strategię minimaksową dla odpowiedniej gry

UWAGI: Wybór strategii bezpiecznych w problemie o sumie niezerowej bywa uzasadniony, nawet gdy strategie te nie prowadzą do równowagi niekooperacyjnej (Nasha). Jest tak zwłaszcza w przypadku, gdy istnieją dwie lub więcej niewymienialnych par równowagi Nasha lub gdy decydenci nie są całkowicie pewni rozumowania konkurentów, czy wartości strat. Mówimy wówczas o parze strategii minimaksowych dla decydentów w problemie o sumie niezerowej, a poziomy bezpieczeństwa decydentów nazywane są wartościami minimax. Działanie takie odpowiada założeniu, że przeciwnik nie tyle dba o minimalizację swoich strat, ile chce nam przeszkodzić w realizowaniu najlepszych dla nas rozwiązań. Wartości rozwiązań minimaksowych są nie lepsze (a więc nie mniejsze) niż pary wartości jakiegokolwiek rozwiązania równowagi Nasha

Równowaga von Stackelberga • Role graczy są niesymetryczne —jeden z graczy, leader, ma możliwość forsowania swojej strategii w stosunku do drugiego gracza followera •Wymagamy równowagi hierarchicznej • Zadaniem followera jest racjonalna reakcja na decyzje leadera

Heinrich Freiherr von Stackelberg Born October 31, 1905) Moscow, Russian Empire Died October 12, 1946 (aged 40) Madrid, Spain

Równowaga von Stackelberga Zbiór racjonalnych reakcji (optymalnych odpowiedzi) followera (gracz D2) Strategie von Stackelberga dla leadera i0 (S* - koszt dla leadera) Element jR(i0) to odpowiedź followera na strategię i0 leadera Para (i0, j0) jest rozwiązaniem równowagi Stackelberga

Przykład 1 A = B = Para (2,2) jest w równowadze Nasha, wynik (1,0) D2 D1 1 2 3 1.5 -1 D2 D1 1 2 3 -1 -0.75 -0.5 A = B = Para (2,2) jest w równowadze Nasha, wynik (1,0) Para (1,1) jest w równowadze von Stackelberga z D1 jako leaderem z wynikiem (0,-1) Para (1,3) jest w równowadze von Stackelberga z D2 jako leaderem z wynikiem (1.5, -0.75)

Przykład 2 - problem przydziału wody Decydent D2: Pobór pełny (P) Pobór ciągły (C) Pobór okresowy (T) Decydent D1: Otwiera tamę (1) Zamyka tamę (2) Miara strat D1: odchyłka od przyjętej polityki retencjonowania zbiorników Miara strat D2: niezaspokojenie własnego zapotrzebowania na wodę

Przykład 2 - problem przydziału wody D2 D1 P C T 1 2 4 3 D2 D1 P C T 1 2 A = B = D1 - leader Jeśli D1 zadeklaruje strategię 1, to D2 ma do dyspozycji dwie strategie: P oraz T. R(1) = {P, T} Jeśli D1 zadeklaruje strategię 2, to D2 ma do dyspozycji dwie strategie: P oraz C. R(2) = {P, C}

Przykład 2 - problem przydziału wody D2 D1 P C T 1 2 4 3 D2 D1 P C T 1 2 A = B = R(1) = {P, T} R(2) = {P, C} Decyzja D1: 2, Koszt Stackelberga dla leadera wynosi S(A)=3 D1 może osiągnąć niższy koszt, w zależności od tego, czy D2 wybierze P, czy C

Uwagi Jak łatwo zauważyć każdorazowo leader osiąga wynik lepszy niż odpowiadający mu wynik w równowadze Nasha. Własność ta jest zachowana jednak tylko wówczas, gdy zbiór racjonalnych reakcji followera na i-te zagranie leadera jest jednoelementowy i to dla wszystkich możliwych strategii leadera. Nawet w przypadku, gdy odpowiedź na strategię Stackelberga leadera jest określona jednoznacznie wynik równowagi Nasha może być korzystniejszy niż koszt Stackelberga dla leadera, jeśli zbiory reakcji racjonalnych na inne zagrania nie są jednoelementowe

Przykład 3 D2 D1 1 2 -1 D2 D1 1 2 A = B =

Równowaga Nasha określona jest przez parę strategii (2, 1) i daje wynik (-1, 1) podczas gdy równowaga Stackelberga z D1 jako leaderem zdefiniowana jest parą (1, 1) i wynikiem (0, 0) - gorszym dla leadera niż wynik Nasha !