Gry w postaci ekstensywnej

Slides:



Advertisements
Podobne prezentacje
TRADYCYJNE METODY PLANOWANIA I ORGANIZACJI PROCESÓW PRODUKCYJNYCH
Advertisements

OLIGOPOLE WNE UW 3 GRUDNIA 2005.
Planowanie bezkolizyjnego ruchu w środowisku wielu robotów z wykorzystaniem gier niekooperacyjnych OWD
Aukcja o dolara $$$ P. Jaworska W. Filipowicz.
Uczenie ze wzmocnieniem
Wykład 6 Najkrótsza ścieżka w grafie z jednym źródłem
Minimalne drzewa rozpinające
Gry o sumie niezerowej Dla 2 graczy trzeba zdefiniować 2 macierze
Badania operacyjne. Wykład 1
ALGORYTMY I STRUKTURY DANYCH
Stochastyczne modele gier ewolucyjnych Jacek Miękisz Instytut Matematyki Stosowanej i Mechaniki Uniwersytet Warszawski.
Wykład nr 6 W prezentacji zostały wykorzystane slajdy pomocnicze do książki: Microeconomics, R.S.Pindyck D.L.Rubinfeld.
WYKŁAD 8. Siła spójności A,B – dowolne podzbiory V(G)
WYKŁAD 3. Kliki i zbiory niezależne
Szachy komputerowe. Ogólna idea silnika szachowego.
Dariusz Odejewski Krzysztof Wójcik
Paradoks partycypacji wyborczej
Dodawanie i odejmowanie wektorów
Wykład 10 Prowadzący: dr Paweł Drozda
Od gier mniejszościowych do prawdziwych rynków From Minority Games to real markets D. Challet, A. Chessa, M. Marsili, Y-C. Zhang Wojciech Dzikowski 26.
1 Kryteria wyboru systemów: Przystępując do procesu wdrażania zintegrowanego systemu zarządzania, należy odpowiedzieć na następujące pytania związane z.
Ewaluacja projektów badawczo-rozwojowych w oparciu o wybrane metody
Problem rozbieżności czasów jednym z wielu problemów pojawiających się w systemach rozproszonych jest rozbieżność wartości zegarów na poszczególnych węzłach-maszynach.
FP-Growth Adam Pieśkiewicz Kamil Niezręcki Krzysztof Grześkowiak
FP-Growth Adam Pieśkiewicz Kamil Niezręcki Krzysztof Grześkowiak Michał Kucal
FP-Growth Adam Pieśkiewicz Kamil Niezręcki Krzysztof Grześkowiak Michał Kucal
Algorytm mini-max.
Wstęp do Teorii Gier.
Rozliczanie etapów studentów
Strategie stabilne ewolucyjnie w oparciu o przykłady zwierzęce
Pole i objętość graniastosłupów i ostrosłupów- powtórzenie wiadomości
Sekwencyjne problemy decyzyjne Wykład 7
Badania operacyjne Wykład 5.
A. Sumionka. Starodawna gra marynarska; Gra dwu i wieloosobowa; Gracze wykonują ruchy naprzemian; Złożona ze stosów, w których znajduje się pewna ilość
Dood.pl Modele biznesowe wyszukiwarek internetowych w teorii i praktyce.
ALGORYTMY ROZWIĄZYWANIA GIER C.D.
Metody analizy decyzji Wykład 7 – sekwencyjne problemy decyzyjne
Projekt AS KOMPETENCJI jest współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego Program Operacyjny Kapitał Ludzki.
MECHANIKA NIEBA WYKŁAD r.
DOŚWIADCZENIA LOSOWE.
Najbardziej Lukratywny i etyczny Plan Kompensacyjny
IV EKSPLORACJA DANYCH Zadania eksploracji danych: klasyfikacja
Sztuczna Inteligencja - wykład 2
Opcje egzotyczne, Strategie opcyjne i ich zastosowania
Treści multimedialne - kodowanie, przetwarzanie, prezentacja Odtwarzanie treści multimedialnych Andrzej Majkowski informatyka +
P. Jaworska W. Filipowicz. Nasi gracze nazywają się Przemek (gracz 1) i Kasia (gracz 2). Wyobraźmy sobie sytuację, w której Przemek i Kasia maja zadecydować.
Strategie stabilne ewolucyjnie.  Znajduje szerokie zastosowanie w wyjaśnieniu zjawisk badanych przez biologię ewolucyjną.  Stosowane w badaniach behawioralnych.
Witam na szkoleniu Colway
Excel Filtrowanie Funkcje bazodanowe
Samorząd Uczniowski.
Treści multimedialne - kodowanie, przetwarzanie, prezentacja Odtwarzanie treści multimedialnych Andrzej Majkowski 1 informatyka +
Autor: Grzegorz Flor THIS IS WAR! CEL GRY: Zdobycie 8 terytoriów ŻÓŁTY - 2 FIOLETOWY - 3 FIOLETOWY - 8.
Projektowanie relacyjnych baz danych – diagramy związków encji
DEBATA Jak przygotować i zorganizować wybory do władz samorządu uczniowskiego, żeby były świętem demokracji w szkole?
D. Ciołek EKONOMETRIA – wykład 5
GRA CHOMP. Czym jest chomp? Jest to gra dla dwóch osób, rozgrywana na prostokątnej tablicy, zwanej „tabliczką czekolady”
Ćwiczenia 7 Bilans Płatniczy
Proste strategiczne gry decyzyjne 1.Inwestor dysponuje opcją na zasadzie wyłączności, chronionej patentem licencją, itp.; model jednookresowy – decyzja.
Autor: Michał Salewski
Monopol Wykonały: Natalia Tyburska Marcelina Falkowska.
7 nawyków lidera.
SZTUCZNA INTELIGENCJA
D. Ciołek BADANIA OPERACYJNE – wykład 2
Podstawy zarządzania ćwiczenia nr 4 Temat: p rogramowanie dynamiczne, macierz wypłat, techniki drzew decyzyjnych Horacy Dębowski Horacy.
Oligopol oferentów Założenia modelu: 1.Na rynku danego dobra jest kilku dużych oferentów i bardzo wielu drobnych nabywców. 2.Na rynku a) nie ma preferencji.
Spotkanie Jaworzno liderem e-mobilności rozpoczęliśmy o godz
Listy.
Joanna Kosik Marta Gomułka
GRY DWUOSOBOWE O SUMIE NIEZEROWEJ
Zapis prezentacji:

Gry w postaci ekstensywnej Wykład 5

Trzy firmy Równowaga indukcji wstecznej: (OUT; OUT; AAF) Jest jednak dużo więcej równowag Nasha, na przykład (IN; IN; AFA) – niewiarygodna groźba Tesco.

Forma standardowa BILLA IN OUT Albert AAA -1 5 6 -2 2 4 AAF 7 AFA 3 1 4 AAF 7 AFA 3 1 FAA AFF FAF FFA FFF

Dr Strangelove Komandor floty powietrznej Stanów Zjednoczonych rozkazuje 34 B-52, aby rozpocząć nuklearny atak na Związek Radziecki Zamyka wszystkie kanały komunikacji z bazą i samolotami Amerykański prezydent zaprasza rosyjskiego ambasadora do war room i wyjaśnia sytuację Decydują się zadzwonić do rosyjskiego premiera Dimitrija

Dr Strangelove Co jest wynikiem jeśli Stany Zjednoczone nie wiedzą o istnieniu doomsday device? Co jest wynikiem jeśli wiedzą? Zobowiązanie (commitment) musi być obserwowalne Co jeśli Związek Sowiecki może zdezaktywować urządzenie? Zobowiązanie musi być nieodwracalne Thomas Schelling: The power to constrain an adversary depends upon the power to bind oneself

Wiarygodne zobowiązania (groźby) W sytuacjach nie-strategicznych więcej opcji nigdy nie zaszkodzi Tak nie jest w sytuacjach strategicznych Można zmienić działanie swojego przeciwnika eliminując niektóre swoje opcje działania

Przykłady 1066: William Zdobywca rozkazał swoim żołnierzom spalić statki po wylądowaniu, aby uniemożliwić im odwrót 1519: Hernan Cortes zatopił swoje statki po wylądowaniu w Meksyku z tego samego powodu Sun-tzu w The art of war, 400 przed Chrystusem: At the critical moment, the leader of an army acts like one who has climbed up a height, and then kicks away the ladder behind him

Skarb piratów 5 racjonalnych piratów Adam, Bogdan, Czesio, Dzidek i Eustachy znajdują wielką skrzynię ze skarbem a w niej 200 sztuk złota. Piraci mają ścisły porządek starszeństwa odpowiadający przeszłym zasługom i sile: Adam jest nad Bogdanem, Bogdan nad Czesiem, Czesio nad Dzidkiem a Dzidek nad Eustachym. Najpierw Adam proponuje jak rozdzielić 200 sztuk złota między pozostałych Wszyscy piraci głosują demokratycznie Jeśli większość zaakceptuje – propozycja przechodzi Jeśli większość odrzuci – zabijają Adama i następny w kolejności pirat proponuje podział

Skarb piratów Gra sekwencyjna – znajdziemy SPNE poprzez indukcję wsteczną: 4 krok: zostało tylko dwóch piratów, Dzidek przydziela sobie cały skarb – remis, propozycja przechodzi 3 krok: zostało trzech piratów, Czesio proponuje – nie może dać Dzidkowi więcej niż miał, ale może dać Eustachemu

Skarb piratów 2 krok: czterech piratów zostało, Bogdan musi przekonać przynajmniej jednego – najlepiej Dzidka

Skarb piratów 1 krok: pięciu piratów zostało, Adam nie przekona Bodzia, ale może przekonać Czesia i Eustachego

Gry w formie ekstensywnej (drzewo) vs gry w formie strategicznej (tabelka) Gra w postaci strategicznej składa się z: Zbiór graczy Dla każdego gracza: Zbiór akcji Funkcja wypłat dla każdego profilu akcji Gry w postaci ekstensywnej zawierają więcej informacji: Kolejność ruchów Akcje, które mają do dyspozycji gracze na różnych etapach gry Informacja dostępna dla graczy podczas gry

Drzewo – graf acykliczny Wierzchołki: Wierzchołki decyzyjne oraz losowe Korzeń i liście Krawędzie (gałęzie) Etykiety graczy Etykiety akcji Wypłaty Zbiory informacji

Strategie w grach ekstensywnych Strategia czysta gracza jest to plan akcji w każdym wierzchołku decyzyjnym tego gracza W równowadze indukcji wstecznej każdy gracz gra optymalnie w każdym wierzchołku decyzyjnym (gra sekwencyjnie racjonalną strategię) Równowaga a wynik gry w równowadze

Inny przykład Kodak zastanawia się, czy wejść na rynek fotografii natychmiastowej a Polaroid zastanawia się czy walczyć czy się zgodzić

Analiza Zbiór równowag Nasha = {(In, A), (Out,F)} (Out, F) jest oparte na niewiarygodnej groźbie Polaroida Równowaga indukcji wstecznej eliminuje równowagi Nasha, które są oparte na niewiarygodnej groźbie. Równowaga Nasha wymaga racjonalności Równowaga indukcji wstecznej wymaga racjonalności sekwencyjnej Gracze muszą grać optymalnie w każdym punkcie gry

Gra w formie ekstensywnej z niedoskonałą informacją Nie możemy zastosować indukcji wstecznej, ponieważ K nie może znaleźć optymalnej strategii znajdując się w zbiorze informacji, który zawiera dwa wierzchołki

Subgame perfect Equilibrium Podgra to część drzewa gry taka, że: Zaczyna się od pojedynczego wierzchołka decyzyjnego Zawiera każdy następnik tego wierzchołka Jeśli zawiera jakiś wierzchołek w zbiorze informacji, wtedy zawiera wszystkie wierzchołki w tym zbiorze informacji Jet podgrą Nie jest podgrą

Subgame Perfect Nash Equilibrium Czysta strategia gracza to plan akcji w każdym zbiorze informacji tego gracza Profil strategii jest SPNE jeśli w każdej podgrze jest równowagą Nasha

Bank run

Panika finansowa Dwóch inwestorów – każdy z nich zdeponował sumę D w banku. Bank zainwestował w długoterminowy projekt. Jeśli bank będzie zmuszony upłynnić inwestycję przed terminem zapadalności, wówczas będzie w stanie odzyskać tylko 2r, gdzie D>r>D/2 Jeśli inwestycja „dotrwa” do końca, wypłata będzie równa 2R, gdzie R>D Są dwa okresy, w których inwestorzy mogą wycofać swój wkład: Okres 1, przed okresem zapadalności inwestycji Okres 2, po okresie zapadalności Nie ma dyskontowania

Niestandardowy sposób reprezentacji gry OKRES 1 Jeśli oboje wypłacą, każdy otrzyma r Jeśli jeden wypłaci a drugi nie, to ten pierwszy otrzyma D a drugi 2r-D i gra się kończy Jeśli nikt nie wypłaci, wówczas przechodzimy do kolejnego etapu OKRES 2 Jeśli oboje wypłacą, każdy otrzyma R Jeśli jeden wypłaci a drugi nie, to ten pierwszy otrzyma 2R-D a drugi D Jeśli żaden nie wypłaci, wówczas bank zwraca każdemu R wypłaca nie wypł. r, r D, 2r-D 2r-D, D do okresu 2 R>D>r>D/2 wypłaca nie wypł. R, R 2R-D, D D, 2R-D

Rozwiązujemy od tyłu R>D>r>D/2 wypłaca nie wypł. R, R 2R-D, D OKRES 2 Ponieważ R>D, “wypłaca” ściśle dominuje “nie wypł.”, dlatego (wypłaca, wypłaca) jest równowagą w strategiach ściśle dominuj. OKRES 1 Nie ma dyskontowania, więc po prostu wstawiamy (R,R) Dwie równowagi Nasha: (nie wypł. nie wypł.) z wypłatą (R,R) (wypłaca, wypłaca) z wypłatą (r,r) [panika finansowa] wypłaca nie wypł. r, r D, 2r-D 2r-D, D R, R

Równowaga induckji wstecznej vs SPNE Równowaga indukcji wstecznej występuje w grach dynamicznych z doskonałą informacją SPNE bardziej ogólna – także dla gier z niedoskonałą informacją Od teraz nie będę robił rozróżnienia, tylko będę zawsze mówił SPNE

Gra ultimatum Gracz 1 proponuje podział 100 złotych (liczonych w dziesiątkach) Gracz 2 akceptuje podział – każdy dostaje to co przewiduje podział, lub odrzuca – wtedy 100 złotych przepada Jakie gracze mają strategie? Ile ich jest? Co jest równowagą SPNE? Ile ich jest?

Gra ultimatum Jedyne równowagi SPNE to (0, AAAAAAAAAAA)

Gra ultimatum (5,OOOOOAAAAAA) jest równowagą Nasha (czemu?), ale groźba gracza drugiego, że odrzuci wszystko poniżej 50 złotych jest niewiarygodna, nie jest SPNE ponieważ nie jest optymalna w drugiej podgrze. Ile jest równowag Nasha?

Stonoga (Centipede) Co jest równowagą indukcji wstecznej? Krytyka: Jakiego rodzaju racjonalność jest wymagana?

Gry statyczne vs gry dynamiczne Gracze ruszają się jednocześnie Wybierają jedną akcję Równowaga Nasha – profil akcji (jedna akcja najlepszej odpowiedzi dla każdego gracza Gry dynamiczne Gracze ruszają się sekwencyjnie Wybierają jedną akcję w każdym swoim zbiorze informacyjnym SPNE – profil strategii (jedna strategia najlepszej odpowiedzi w każdej podgrze dla każdego gracza