ZASTOSOWANIE GIER O SUMIE ZEROWEJ Katarzyna Urbańska.

ZASTOSOWANIE GIER O SUMIE ZEROWEJ Katarzyna Urbańska

Gra o sumie zerowej – niezależnie od wybranych strategii, to co
wygrał jeden z graczy, drugi musi przegrać. Gry o sumie zerowej najłatwiej jest przedstawić w postaci macierzy wypłat. Tak przedstawioną grę nazywamy grą w postaci normalnej. Macierz wypłat zawiera wartości wypłat dla wszystkich możliwych kombinacji strategii obu graczy.

W opisie każdej gry powinny się znaleźć następujące elementy:
wyszczególnienie uczestników gry; wyszczególnienie możliwości postępowania każdego gracza (dostępne strategie); opis dostępnej graczom informacji; możliwie precyzyjne określenie celów, do których dążą gracze (wypłaty).

Wypłaty określają wartość wyniku gry dla poszczególnych graczy
Wypłaty określają wartość wyniku gry dla poszczególnych graczy. Teoria gier bada jak gracze powinni racjonalnie rozgrywać grę . Każdy z nich powinien dążyć do takiego jej zakończenia, które daje mu możliwie najwyższą wypłatę . Gracz wpływa na przebieg gry wybierając swoją strategię . Ostateczny wynik zależy od decyzji wszystkich uczestników gry. Strategia dominująca – strategia zapewniająca najlepszy wynik niezależnie od wyboru strategii partnera. Strategia zdominowana - strategia B jest bezpośrednio zdominowana przez strategię A, jeżeli dla każdej dostępnej kombinacji strategii innego gracza, funkcja wypłat gracza przy przyjęciu strategii B jest mniejsza niż funkcja wypłat przy przyjęciu strategii A. Strategia czysta – gracz wybiera bez losowania jedną konkretną strategię. Strategia mieszana – gracz wybiera strategie z pewnym prawdopodobieństwem.

Strategie optymalne w grze o sumie zero i macierzy wypłat W, to takie strategie (czyste lub mieszane) X oraz Y obu graczy, że: i) jeśli Gracz A zagra swoją strategię optymalną X, to jego oczekiwane wypłaty są większe lub równe liczbie w: XW ≥ w (niezależnie od postępowania Gracza B), ii) jeśli Gracz B zagra swoją strategię optymalną Y, to jej oczekiwana wypłata będzie mniejsza lub równa w: WY ≤ w (niezależnie jak postąpi Gracz A). Liczbę w o własności opisanej w definicji strategii optymalnej nazywamy wartością gry. Twierdzenie o minimaksie (John von Neumann, 1928 r.) Dowolna gra o sumie zerowej ma dokładnie jedną swoją wartość oraz istnieją strategie optymalne obu graczy.

Główne gałęzie zastosowań teorii gier to:
ekonomia; polityka; wojskowość; antropologia; psychologia; socjologia; biologia; statystyka; filozofia; sport.

„Rybołówstwo na Jamajce”
ANTROPOLOGIA „Rybołówstwo na Jamajce” Dwadzieścia sześć załóg łowiło ryby za pomocą specjalnych koszy. Łowiska dzieliły się na leżące wewnątrz i na zewnątrz laguny. Ze względu na ukształtowanie dna morza oraz przebieg linii brzegowej, w wodach zewnętrznych łowisk regularnie wzbudzały się bardzo silne prądy, natomiast na łowiskach wewnętrznych prądy te były w zasadzie nieodczuwalne. Dowódcy łodzi mogli stosować trzy różne strategie: „wewnętrzną”: ustawić wszystkie kosze na łowiskach wewnętrznych, „zewnętrzną”: ustawić wszystkie kosze na łowiskach zewnętrznych, „pośrednią”: ustawić część koszy na łowiskach wewnętrznych, a pozostałe na zewnętrznych.

Każda z tych strategii miała swoje wady i zalety:
Ponieważ dopłynięcie do łowisk zewnętrznych było czasochłonne, załogi stosujące strategię „zewnętrzną” bądź „pośrednią” ustawiały mniejszą liczbę koszy. Aktywność prądów przynosiła rybakom działającym na łowiskach zewnętrznych wiele szkód: boje oznaczające miejsce ustawienia kosza mogły zostać przesunięte, uniemożliwiając potem jego odnalezienie, kosze mogły zostać uszkodzone, a złowione ryby zginąć z powodu zmian temperatury lub innych czynników związanych z ruchem wody. Połowy na łowiskach zewnętrznych dawały lepsze ryby, zarówno ze względu na ich wielkość, jak i różnorodność gatunków. Ryby z zewnętrznych łowisk, gdyby były dostępne w odpowiedniej ilości, mogłyby praktycznie wyprzeć z rynku ryby z łowisk wewnętrznych. Do wypływania na łowiska zewnętrzne potrzebne są lepsze łodzie. Rybacy, którzy łowią na łowiskach wewnętrznych, często kupują używane łodzie od tych, którzy łowią dalej od brzegu. Ze względu na posiadanie lepszego sprzętu, rybacy działający na łowiskach zewnętrznych z reguły wygrywają zawody żeglarskie – zdobywając prestiż oraz wartościowe nagrody.

Tabela przedstawiająca wypłaty odpowiadające średniemu dochodowi w funtach szterlingach, uzyskiwanemu przez dowódcę łodzi w ciągu miesiąca. prądy aktywne nieaktywne wewnętrzna 17,3 11,5 zewnętrzna - 4,4 20,6 pośrednia 5,2 17,0 rybacy Znając teorią gier możemy opisać tę sytuację jako grę 2 x 3, znaleźć optymalną strategię rybaków i porównać ją z rzeczywistym postępowaniem mieszkańców wioski. Gra nie ma punktu siodłowego ani strategii zdominowanych. Jej graficzne rozwiązanie przedstawia rysunek poniżej.

Diagram wypłat Najniższy punkt górnej łamanej leży na przecięciu strategii wewnętrznej i pośredniej. Rozwiązując właściwą grę 2x2, znajdujemy optymalną strategię rybaków: w 67% przypadków powinni stosować strategię „wewnętrzną”, a w 33% „pośrednią”. Optymalną strategią dla prądów jest „być aktywnym” przez 31% czasu i „być nieaktywnym” przez 69% czasu. Wartość gry wynosi 13,3.

„Problem ataku rakietowego”
WOJSKOWOŚĆ „Problem ataku rakietowego” W grze biorą udział dwa państwa – nazwijmy je „Czerwoni” i „Niebiescy”. Załóżmy, że Czerwoni chcą zniszczyć bazę wojskową Niebieskich i w tym celu odpalają po kolei cztery rakiety, z których dwie uzbrojone są w głowice bojowe, a pozostałe to atrapy. Niebiescy dysponują dwoma pociskami antyrakietowymi – każdy z nich może namierzyć dwie rakiety Czerwonych i zniszczyć tę z nich, która jest uzbrojona w prawdziwą głowicę bojową. Czerwoni muszą podjąć decyzję, w jakiej kolejności odpalać pociski. Ich wybór będziemy zapisywali według konwencji, w której „A” oznacza atrapę, a „G” rakietę z głowicą bojową. Niebiescy z kolei muszą zdecydować, w którym momencie odpalać antyrakiety. Zapis „13” oznacza, że antyrakiety zostały odpalone po zauważeniu pierwszej i trzeciej rakiety Czerwonych. Niebiescy wygrywają (wypłata +1), jeżeli uda im się zniszczyć wszystkie rakiety Czerwonych, natomiast przegrywają (wypłata 0), jeżeli chociaż jedna rakieta Czerwonych osiągnie cel.

Kompletna macierz gry przedstawia się następująco:
Czerwoni GGAA GAGA GAAG AGGA AGAG AAGG 12 1 13 14 23 24 34 Niebiescy

Przyglądając się uważnie macierzy możemy zauważyć, że strategia Niebieskich 14 jest zdominowana przez strategię 13, natomiast strategie 24 i 34 są zdominowane przez 23. Niebiescy nigdy nie powinni czekać z odpaleniem antyrakiety na pojawienie się czwartego pocisku Czerwonych – nie mieliby w takim przypadku pożytku z możliwości jednoczesnego zaatakowania przez jedna antyrakietę dwóch potencjalnych celów. Po wykreśleniu strategii 14, 24 i 34, zdominowane stają się z koleitrzy strategie Czerwonych: GAGA, AGGA i AGAG. Możemy zatem zredukować grę do postaci: Czerwoni GGAA GAAG AAGG 12 1 13 23 Niebiescy

Rozwiązaniem tej gry jest para strategii zarówno dla
Czerwonych, jak i dla Niebieskich, przy wartości gry wynoszącej Strategię Czerwonych można streścić następująco: rakiety – atrapy należy wystrzelić bezpośrednio po sobie tak, aby stworzyć sytuację, w której będzie szansa, że Niebiescy zmarnują chociaż jedną antyrakietę. Zauważmy ponadto, że Niebiescy mają tylko jedną szansę na trzy, by obronić swoją bazę przed zniszczeniem.

„Licytacja ataków hokejowych”
SPORT „Licytacja ataków hokejowych” W grze trenerzy dwóch drużyn hokejowych zastanawiają się, jakich hokeistów wystawić w kolejnych fazach gry. Dla uproszczenia załóżmy, że każdy z nich ma do wyboru atak I i atak II. Skuteczność gry ataków zależy od tego, co zrobi przeciwnik. Bj Ai B1 – wystawić atak I B2 – wystawić atak II A1 – wystawić 3 - 1 A2 – wystawić 1 2 Tabela: Licytacja ataków hokejowych (wypłaty dla grypy A)

Czystą strategią maksyminową dla trenera I jest A2, która zapewnia wygraną wysokości 1 punktu, strategią minimaksową dla trenera II jest B2, ktra spowoduje, że nie przegra on więcej niż 2 punkty. Załóżmy, że początkowo obaj trenerzy wybrali czyste strategie minimaksowe A2 i B2. Skoro trener pierwszy wprowadził do gry atak II, to trenerowi drugiemu opłaca się odstąpić od strategii B2 i wystawić atak I, co zmniejszy jego przegraną z 2 do 1 punktu. W nowej sytuacji trener pierwszy z kolei przejdzie do strategii A1, która zapewni mu wygraną wysokości punktów; na co trener drugi zareaguje strategią B2, co pozwoli mu zdobyć 1 punkt. W tej sytuacji trener pierwszy wybierze strategię A2, dającą mu znów 2 punkty przewagi. Tak więc zmiana strategii będzie się odbywać po zamkniętym kole od A2, B2 do A2, B2, czyli:

Wiadomo, że jeśli trener pierwszy wybierze strategię optymalną, to niezależnie od tego, co zrobi jego przeciwnik, trener ten wygra co najmniej 1,4 punkta. Zatem trener pierwszy powinien w 20% gier wprowadzić do gry atak I, a w 80% gier – atak II. Pozwoli mu to na wygranie w tej grze przeciętnie 1,4 punkta. Trener drugi zatem powinien w 60% gier wprowadzić atak I, a w 40% - atak II, co zagwarantuje mu, że przegrana nie będzie większa od wartości gry, czyli 1,4 punkta.

FILOZOFIA „Problem Newcomba”
Załóżmy, że leżą przed tobą dwa czarne, nieprzezroczyste pudełka. W pudełku 1 znajduje się tysiąc dolarów. W pudełku 2 znajduje się albo milion, albo nie ma w nim nic. Możesz zrobić jedną z dwóch rzeczy: i) wziąć oba pudełka ii) wziąć tylko pudełko 2. Wczoraj Istota dokonała przewidywania decyzji, którą podejmiesz dzisiaj. Jeżeli Istota przewidziała, że weźmiesz oba pudełka, drugie jest puste. Jeżeli natomiast przewidziała, że weźmiesz tylko drugie pudełko, umieściła w nim milion dolarów. (Jeśli Istota przewidzi, że decyzję podejmujesz przez losowanie, drugie pudełko będzie puste).

Istota TY Tabela: Ruch Istoty przewiduje, że weźmiesz oba pudełka
przewiduje, że weźmiesz tylko pudełko 2 bierzesz oba pudełka 1 000 $ $ bierzesz tylko pudełko 2 0 $ $ TY Tabela: Ruch Istoty

Teraz pora na wykonanie przez nas ruchu
Teraz pora na wykonanie przez nas ruchu. W tym celu można sformułować poważne argumenty za przyjęciem jednego z dwóch odmiennych sposobów dalszego postępowania: Argument 1: „Załóżmy, że wezmę oba pudełka. W takim razie, Istota prawie na pewno przewidziała to i zostawiła pudełko 2 puste – prawie na pewno dostanę 1000$. Z drugiej strony, jeśli wezmę tylko pudełko 2, Istota prawie na pewno wsadziła w nie milion dolarów – dostanę więc milion dolarów. Wolę dostać milion dolarów niż tysiąc – powinien wziąć tylko pudełko 2”. Argument 2: „Istota dokonała swojego przewidywania wczoraj, teraz zaś w pudełku 2 albo jest milion dolarów, albo nie. Jeśli tak, to pieniądze te nie znikną tylko dlatego, że wezmę oba pudełka, a uzyskam w ten sposób o tysiąc dolarów więcej. Jeżeli natomiast pudełko 2 jest puste, to z pewnością lepiej wziąć oba pudełka i dostać chociaż tysiąc dolarów. W obu przypadkach lepiej jest wziąć oba pudełka”.

Oba te argumenty można sformułować w terminach teorii gier.
Argument 1: opiera się na kryterium wartości oczekiwanej (Jeżeli wiesz, że twój przeciwnik gra określoną strategią mieszaną i będzie ją stosować niezależnie od tego, jak ty grasz, powinieneś stosować strategię dającą ci największą wartość oczekiwaną). Należy wziąć tylko pudełko 2. Argument 2: opiera się na kryterium dominacji (Racjonalny gracz nigdy nie wybiera strategii zdominowanej). Strategia „wziąć oba pudełka” dominuje strategię „wziąć tylko pudełko 2” – należy wybrać zatem strategię dominującą. W normalnych warunkach nigdy nie zachodzi konflikt tych dwóch podstawowych dla teorii gier kryteriów. Wartość oczekiwana dla pierwszej strategii („wziąć oba pudełka”) jest większa niż dla drugiej („wziąć tylko pudełko 2”). Problem w tym, że nie mamy do czynienia z normalnymi warunkami. Konflikt obu kryteriów wynika z naszego przekonania, ze istnieje związek pomiędzy naszym wyborem a przewidywaniem dokonanym przez Istotę.

Jest to problem, którego nie można rozwiązać oraz nie można rozstrzygnąć problemu istnienia wolnej woli. Jednak ujęcie tego problemu z perspektywy teorii gier może dać nam nową , oryginalną wizję zasadniczego problemu filozoficznego. Niektórzy filozofowie tacy jak Nozick, Levi uważali, że należy wziąć oba pudełka, natomiast Newcomb, Maregalit, Brams radzą, żeby wziąć tylko pudełko 2.

„Podejmowanie decyzji w warunkach konkurencji”
BIZNES „Podejmowanie decyzji w warunkach konkurencji” Firma Zeus Music jest liderem w produkcji nowoczesnego sprzętu audio, a jej marka należy do najlepiej rozpoznawalnych. Atena jest firmą mniejszą, ale cenioną ze względu na innowacyjność i wysoką jakość produktów. Obie firmy opracowały nowy, obiecujący „heksafoniczny” system dźwiękowy. Ten rewolucyjny pomysł „totalnego otoczenia muzycznego” polega na tym, że słuchacza zawiesza się na pewnej wysokości, tak by mógł słuchać muzyki płynącej z sześciu głośników, umieszczonych z lewej, prawej, przodu, tyłu, góry, dołu. Czynnikiem niepewności jest wielkość rynku na tego typu urządzenia: może być on mały (potencjalne zyski około 24 mln dolarów rocznie) lub duży (40 mln dolarów).

Zeus i Atena muszą zdecydować, jakiego typu produkt wypuścić na rynek: najwyższej jakości system skierowany do audiofilów czy też system tańszy, skierowany do odbiorców poszukujących nowości, ale o mniejszych wymaganiach co do jakości dźwięku. Jeżeli rynek jest mały, lepiej będzie sprzedawać system wyższej jakości, jeżeli jednak rynek byłby duży, większym powodzeniem cieszyłby się system tańszy. Atena jest lepiej od Zeusa przygotowana do produkcji sprzętu najwyższej jakości, natomiast przewagą Zeusa jest powszechnie znana marka i większy potencjał marketingowy w przypadku sprzedaży systemów tańszych. Uwzględniając wszystkie te czynniki, analitycy Zeusa oszacowali udziały w rynku obu firm w różnych sytuacjach – wyniki przedstawia rysunek poniżej.

gdzie: T – należy produkować sprzęt tańszy
NJ – należy produkować sprzęt najwyższej jakości

Przeanalizujmy tę grę przyjmując różne założenia co do posiadanych przez graczy informacji.
Podejście 1: Obie firmy trzymają w tajemnicy swoje decyzje co do kierunku produkcji – żadna nie zna decyzji drugiej, nie zna także decyzji „Losu”. W efekcie oba węzły Zeusa znajdują się w jednym zbiorze informacyjnym; to samo dotyczy także wszystkich czterech węzłów Ateny. Obie firmy mają dwie strategie: produkować sprzęt najwyższej jakości, bądź też tańszy. Macierz gry wtedy przedstawia się następująco: Atena T NJ (23, 9) (18, 14) (20, 12) Zeus Podane w macierzy wypłaty to wartości oczekiwane. Ponieważ jest to gra o sumie stałej, możemy wyznaczyć strategie optymalne – dla obu graczy są nimi T, NJ. Wartość gry to dla Zeusa i dla Ateny.

Podejście 2: Zeus, jako firma wiodąca musi podjąć decyzję co do wyboru produktu wcześniej, a Atena – firma mniejsza i bardziej elastyczna – może zdecydować na tyle późno, by poznać najpierw decyzję podjętą przez Zeusa. W efekcie węzły Ateny tworzą teraz dwa zbiory informacyjne: zawierający pierwszy i trzeci węzeł (gdy Zeus wybrał strategię T), oraz zawierający węzeł drugi i czwarty (gdy Zeus wybrał NJ). W każdym ze zbiorów informacyjnych Atena ma do wyboru jeden z dwóch ruchów, ma zatem łącznie cztery strategie. Gra wtedy przyjmuje postać: Atena T/T T/NJ NJ/T NJ/NJ T 23 18 NJ 20 Zeus

Gra ma dwa punkty siodłowe, optymalną strategią Ateny jest „zawsze przeciwnie niż Zeus”. Wartość gry wynosi 18 dla Zeusa (czyli dla Ateny pozostaje 14). Tak więc elastyczność Ateny, pozwalająca jej czekać, aż Zeus wykona pierwszy ruch, kosztowała Zeusa 1,43 mln dolarów. Podejście 3: Zeus wykonuje pierwszy ruch, ale zanim go wykona, przeprowadza dokładne badania rynku, które pozwolą mu określić, czy rynek jest duży, czy mały. Atena nie będzie znała wyników badań W efekcie oba węzły Zeusa będą tworzyły osobne zbiory informacyjne, a Zeus będzie wybierał spośród czterech strategii. Atena T/T T/NJ NJ/T NJ/NJ 23 18 16 20 12 25 24 22 Zeus

Strategie Ateny w dalszym ciągu uzależniają jej decyzję od uprzedniej decyzji Zeusa, natomiast strategie Zeusa uzależniają jego posunięcie od tego, co Los zdecydował o wielkości rynku. Strategia NJ/T Zeusa „produkować systemy najwyższej jakości, jeśli rynek jest mały, a systemy tańsze, jeśli rynek jest duży” jest strategią dominującą. Optymalną strategią Ateny jest zawsze produkować systemy najwyższej jakości, zaś oczekiwane wypłaty wynoszą 22 dla Zeusa, 10 dla Ateny. Zwróćmy jeszcze uwagę, że optymalna strategia Ateny uległa zmianie z „zawsze wybierać przeciwnie niż Zeus” na „zawsze wybierać NJ”, pomimo iż jedyną informacją, jaką uzyskała Atena było to, że Zeus przeprowadził badanie rynku. W sytuacji, gdy Zeus wybiera strategię NJ, Atena wygrywa na wybraniu strategii T tylko wtedy, gdy rynek jest duży. Ponieważ Atena wie o badaniach rynku, dla jej zarządu jest jasne, ze jeśli Zeus wybierze NJ, oznacza to, że wyniki badania wskazały na istnienie małego rynku, a jeśli tak, to również Atena więcej zarobi na produkcji sprzętu NJ – choć wymaga to subtelnego rozumowania. Ponadto, opierając swoją decyzję na wynikach badań rynku, Zeus może powiększyć wartość oczekiwaną swoich zysków z 18 do 22 mln dolarów. Zatem przeprowadzenie badań jest opłacalne, gdy ich koszt nie przekracza 4 mln dolarów.

KONIEC

ZASTOSOWANIE GIER O SUMIE ZEROWEJ Katarzyna Urbańska.

Podobne prezentacje

Prezentacja na temat: "ZASTOSOWANIE GIER O SUMIE ZEROWEJ Katarzyna Urbańska."— Zapis prezentacji:

Podobne prezentacje

О projekcie

Zwrotny adres

Wejść

Zaloguj się poprzez sieć społeczną:

ZASTOSOWANIE GIER O SUMIE ZEROWEJ Katarzyna Urbańska.

Podobne prezentacje

Prezentacja na temat: "ZASTOSOWANIE GIER O SUMIE ZEROWEJ Katarzyna Urbańska."— Zapis prezentacji:

Podobne prezentacje

О projekcie

Zwrotny adres