D. Ciołek BADANIA OPERACYJNE – wykład 4 Wykład 4: Podstawy teorii gier. dr Dorota Ciołek Katedra Ekonometrii Wydział Zarządzania UG http://wzr.pl/dc
D. Ciołek BADANIA OPERACYJNE – wykład 4 Podstawowe pojęcia Z „grą” mamy do czynienia wtedy, gdy musimy podjąć pewną decyzję nie znając wszystkich czynników, przy czym wynik zależy nie tylko od naszej decyzji, ale od decyzji innych osób lub też od zachowania się czynników niekontrolowanych. Sytuacja do której można zastosować teorię gier strategicznych: skończona liczba uczestników, zarówno zainteresowanych jak i niezainteresowanych, każdy uczestnik dysponuje skończoną liczbą sposobów działania, każdy z uczestników zna wszystkie możliwe sposoby działania innych uczestników, nie wie jednak, które z nich zostaną wybrane, każdej kombinacji sposobów działania wszystkich uczestników odpowiada określona korzyść, korzyść (wygrana) uczestnika zależy zarówno od jego działania jak i od działań wszystkich pozostałych, wszystkie możliwe wyniki podjętych decyzji dają się wyliczyć. Sytuację spełniającą powyższe warunki można nazwać grą.
D. Ciołek BADANIA OPERACYJNE – wykład 4 Podstawowe pojęcia Graczem nazywamy każdą zainteresowaną stronę. Gry o sumie zero to takie gry, w których algebraiczna suma wygranych vi jest równa zeru: Gry dwuosobowe o sumie zero to takie gry, w których udział biorą tylko dwie strony, a suma wygranych obu graczy równa się zeru. Partia to jednokrotny wybór sposobu działania przez wszystkich graczy. Strategia to reguła podejmowania decyzji, określająca sposób działania gracza.
D. Ciołek BADANIA OPERACYJNE – wykład 4 Podstawowe pojęcia Strategia mieszana polega na zastosowaniu wszystkich lub niektórych sposobów działania w pewnej ustalonej proporcji. Jeśli gracz postanawia zastosować tylko jeden sposób działania, mówimy, że stosuje on strategią czystą. Wartość gry to przeciętna kwota, którą gracz mógłby wygrać w ciągu wielu powtarzanych partii, jeżeli wszyscy gracze stosują optymalne strategie. Macierz wypłat (korzyści) to tabela określająca wygrane gracza G1 przy wszystkich możliwych sposobach działania obydwu graczy. Wartość liczbowa aij określona wyborem graczy, reprezentuje kwotę, którą gracz G2 powinien przekazać swojemu przeciwnikowi - graczowi G1.
D. Ciołek BADANIA OPERACYJNE – wykład 4 Definicje Rozwiązanie gry wymaga określenia: wartości gry (v), strategii gracza G1 zapewniającej, że przeciętna wygrana w grze jest co najmniej równa wartości gry, strategii gracza G2 zapewniającej, że przeciętna przegrana w grze jest co najwyżej równa wartości gry. Definicja 1 Mówimy, że określona jest gra macierzowa, jeżeli dana jest macierz wypłat A = [aij] o wymiarze m × n, gdzie aij – dowolne liczby rzeczywiste, aij oznacza wypłatę gracza G2 na rzecz gracza G1 przy wyborze odpowiednich sposobów działania, tzn. gracz G1 wybiera wiersz „i”, a gracz G2 – kolumnę „j” w macierzy wypłat.
D. Ciołek BADANIA OPERACYJNE – wykład 4 Definicje Definicja 2 Przez strategię mieszaną gracza G1 rozumiemy wektor wierszowy x = [x1, x2, ・ ・ ・ , xm] nieujemnych liczb xi takich, że: Definicja 3 Przez strategię mieszaną gracza G2 rozumiemy wektor kolumnowy u, o elementach uj takich, że:
D. Ciołek BADANIA OPERACYJNE – wykład 4 Definicje Definicja 4 Strategia mieszana, której k-ty element jest równy jeden, a pozostałe są równe zeru, jest k-tą strategią czystą gracza. Definicja 5 Jeżeli rozwiązanie gry wymaga, aby każdy z graczy stosował tylko jeden ze sposobów działania, to grę taką nazywamy grą z punktem siodłowym. Definicja 6 Punkt siodłowy to taki punkt w macierzy wypłat, dla którego: gdzie minj maxi aij = v2 to górna wartość, a maxi minj aij = v1 dolna wartość gry.
D. Ciołek BADANIA OPERACYJNE – wykład 4 Definicje Twierdzenie von Neumanna I: Jeżeli w macierzy wypłat gry istnieje punkt siodłowy to czyste strategie minimaksowe są optymalne. Jeżeli w macierzy wypłat gry nie istnieje punkt siodłowy, to zachodzi: v1 < v < v2 . Definicja 7 Funkcję wypłaty gracza G1 definiujemy jako: Funkcja wypłaty określa oczekiwaną wartość wygranej gracza G1 w jednej partii przy wielokrotnym podejmowaniu decyzji w sposób losowy.
D. Ciołek BADANIA OPERACYJNE – wykład 4 Definicje Twierdzenie von Neumanna II Niech oznaczają mieszane strategie optymalne. Można wykazać, że dla mieszanych strategii optymalnych zachodzi: Ponieważ , to oznacza, że funkcja wypłaty gracza G1 dla mieszanych strategii optymalnych jest równa wartości gry.
D. Ciołek BADANIA OPERACYJNE – wykład 4 Definicje Definicja 8 reguła dominacji Jeżeli wszystkie elementy pewnej kolumny w macierzy wypłat są większe lub równe odpowiednim elementom innej kolumny, to pierwszą z nich nazywamy kolumną zdominowaną. Jeżeli wszystkie elementy pewnego wiersza są mniejsze lub równe odpowiednim elementom innego wiersza, to pierwszy z nich nazywamy wierszem zdominowanym. Zdominowane wiersze lub kolumny usuwamy z macierzy wypłat, co oznacza, że dane sposoby działania będą stosowane z prawdopodobieństwem zero.
D. Ciołek BADANIA OPERACYJNE – wykład 4 Przykład 1 Dwóch graczy rozgrywa następującą grę. Każdy gracz wybiera niezależnie od drugiego gracza, jeden z trzech kolorów: biały (B), czarny (C) lub zielony (Z). Po niezależnym dokonaniu wyboru koloru przez obu graczy porównuje się wybrane kolory. Jeżeli obaj gracze wybrali biały, nikt nie wygrywa, jeżeli gracz G1 wybrał biały, a gracz G2 czarny, gracz G1 przegrywa 1 punkt. Wszystkie możliwe wyniki zawarte są w tablicy. B C Z Minimum -1 6 2 4 5 1 -2 8 Maksimum
D. Ciołek BADANIA OPERACYJNE – wykład 4 Przykład 2 Należy rozwiązać grę dwuosobową o sumie zero, gdzie symbolami A i B oznaczono obu graczy, a wektory X i Y oznaczają odpowiednio strategie gracz A i B. Wszystkie możliwe wyniki zawarte są w tablicy. Y1 Y2 Y3 Minimum X1 2 4 6 X2 3 1 X3 Maksimum
D. Ciołek BADANIA OPERACYJNE – wykład 4 Algorytm rozwiązywania gry Algorytm postępowania: czy w macierzy wypłat występuje punkt siodłowy, jeżeli tak – to czyste strategie minimaksowe są optymalne. czy występują wiersze lub kolumny zdominowane, jeżeli tak to usuwamy je z macierzy wypłat. sprawdzić, w jakim przedziale znajduje się wartość gry, zapewnić jej nieujemność, poprzez przekształcenie macierzy A na macierz: A′ = A + |v1|
D. Ciołek BADANIA OPERACYJNE – wykład 4 Zastosowanie programowania liniowego Każdą grę dwuosobową o sumie zero, można przedstawić w postaci dwóch modeli programowania liniowego: Dla gracza G1: Dla gracza G2: znaleźć taki nieujemny znaleźć taki nieujemny wektor x, który: wektor u, który: Oba modele są wobec siebie dualne.
D. Ciołek BADANIA OPERACYJNE – wykład 4 Przykład 3 Każdy z graczy wybiera liczbę ze zbioru {1, 2, 3}. Gracz, który wybrał mniejszą liczbę wygrywa 2 punkty z wyjątkiem przypadku, gdy jego liczba jest dokładnie mniejsza o jeden, wtedy przegrywa 4 punkty. Jeżeli liczby są równe nikt nie wygrywa. Wszystkie możliwe wyniki zawarte są w tablicy. „1” „2” „3” Minimum -4 2 4 -2 Maksimum
D. Ciołek BADANIA OPERACYJNE – wykład 4 Czym jest gra? Teoria gier: – teoria podejmowania decyzji w warunkach interaktywnych (gry strategicznej) - matematyczna teoria sytuacji konfliktowych Stworzona przez J. von Neumanna. Podstawowym założeniem teorii gier jest racjonalne działanie wszystkich podmiotów decyzyjnych (graczy). Wyniki i wypłaty. Działania wszystkich graczy określają wynik walki konkurencyjnej (zwany wartością gry). Każdemu możliwemu wynikowi odpowiada określona wypłata, która jest miarą stopnia osiągnięcia celu każdego z rywali; najczęściej wyrażona pieniężnie, gdy mowa o przedsiębiorstwie, a w wartościach użyteczności, gdy dotyczy konsumenta.
D. Ciołek BADANIA OPERACYJNE – wykład 4 Sformułowanie gry Punktem wyjścia w każdej analizie konkurencji jest: - opis graczy, stosowanych przez nich strategii, rozumianych jako plan działań, uwzględniający wszystkie ewentualności, w jakich gracz może się znaleźć, oraz uzyskanych przez każdego z nich wypłat. Walka konkurencyjna może mieć charakter jednorazowego posunięcia lub wielu działań rozłożonych w czasie (konkurencja sekwencyjna i powtarzalna). Możemy mieć do czynienia z grą niekooperacyjną lub kooperacyjną.
D. Ciołek BADANIA OPERACYJNE – wykład 4 Gra niekooperacyjna – dylemat więźnia Złapano dwóch przestępców. Każdemu z nich niezależnie prokurator oświadcza, że ma przeciwko niemu wystarczająco wiele dowodów by zamknąć go na rok do więzienia. Jeśli jednak zezna on (tylko on), obciążając drugiego więźnia, to wina zostanie mu darowana, drugi przestępca otrzyma zaś wyrok 10 lat. Jeśli przyznają się obaj do winy, to obaj otrzymają po 5 lat więzienia. - Paradoks występuje w ekonomii, gdy partnerzy skazani są na nieoptymalny wynik. - Ze względu na brak bodźców, żaden nie zamierza jednostronnie zmienić swojego zachowania, chyba że w drodze podjęcia skoordynowanej współpracy, opartej na zaufaniu. Więzień I Więzień II Nie przyznawać się Wsypać kompana 1 rok 1 rok 10 lat 0 lat 0 lat 10 lat 5 lat 5 lat
D. Ciołek BADANIA OPERACYJNE – wykład 4 Dylemat więźnia w ekonomii Dwa przedsiębiorstwa stworzyły kartel, dający zyski na poziomie 6 mln zł, dzielone po połowie, to uwzględniono by to w polu a (3, 3). Rywale zdają sobie sprawę, że jeśli zwiększą sprzedaż, a konkurent pozostanie wierny umowie, to ich zyski wzrosną do 3,5 mln zł, lecz uczciwym spadną do 1,5 mln zł. Jeśli obaj będą oszukiwać, to zrealizują zyski na poziomie 2 mln zł. Zysk kartelu jest maksymalny, gdy oba przedsiębiorstwa postępują zgodnie z umową kartelową, a najniższy, gdy oba oszukują partnera. Równowaga ukształtuje się w najgorszym, pod względem wyniku, polu, ponieważ partnerzy dostrzegają możliwość zwiększenia swojego zysku przez nielojalność wobec siebie. Firma I Firma II Oszustwo Uczciwość (2; 2) (3,5; 1,5) (1,5, 3,5) (3, 3)
D. Ciołek BADANIA OPERACYJNE – wykład 4 Decyzje zapewniające równowagę (1) Powinny być stosowane, gdy konkurenci podejmują decyzje niezależnie od siebie (brak zmowy). Wówczas są odzwierciedleniem „optymalnej” reakcji obu graczy, czyli pozwalają one zmaksymalizować wielkość wypłaty każdego z nich w warunkach, określonych przez wybór decyzji, dokonany przez przeciwnika (równowaga Nasha). Inaczej, równowaga Nasha oznacza taką parę decyzji, że żaden z graczy nie ma motywacji do jednostronnego odejścia od przyjętej decyzji, biorąc pod uwagę strategię zastosowaną przez drugiego. Najlepszym wynikiem, jakiego może oczekiwać gracz uczestniczący w grze o sumie zerowej przeciwko jednakowo nastawionemu rywalowi, jest osiągnięcie stanu równowagi.
D. Ciołek BADANIA OPERACYJNE – wykład 4 Decyzje zapewniające równowagę (2) Gdyby któryś z graczy odstąpił od realizacji strategii prowadzącej do równowagi, ograniczyłby wielkość własnych wypłat i pozwoliłby na zwiększenie wypłat rywala. Ponieważ równowaga Nasha może się ukształtować w położeniu nieoptymalnym dla podmiotów rynkowych, ekonomiści zwracają uwagę na strukturę rynku i konkurencję między podmiotami, w której najkorzystniejsze rozwiązanie łączy się z wyczerpaniem potencjału rynku w poszukiwaniu okazji do poprawy alokacji, jeżeli nie da się współpracować. Równowaga Nasha jest uogólnieniem zarówno równowagi Cournota, jak i Bertranda, które zachodzą, gdyż każde przedsiębiorstwo maksymalizuje zyski przy oczekiwanym zachowaniu drugiego przedsiębiorstwa. Równowaga występuje, gdy oczekiwania uczestników rynku potwierdza rzeczywistość.
D. Ciołek BADANIA OPERACYJNE – wykład 4 Koncepcja równowagi Nasha Prostym przykładem gry, w której przynajmniej dwaj gracze dokonują jednego, jednoczesnego ruchu, dotyczącego podjęcia jednej decyzji, jest konkurencja między Hondą i Toyotą w Ameryce Północnej pod koniec lat 90. związana z budową nowych zakładów produkcyjnych Z opisanego przykładu wynika, że jeśli gracze oczekują racjonalnego zachowania się przeciwnika, to obaj „optymalizując” wybór, osiągają równowagę Nasha. Honda Toyota Budować nową wytwórnię Nie budować (16 mln $; 16 mln $) (20 mln $; 15 mln $) (15 mln $, 20 mln $) (18 mln $, 18 mln $)
D. Ciołek BADANIA OPERACYJNE – wykład 4 Więcej niż jedna równowaga Gra w tchórza, w której dwóch nastolatków najeżdża na siebie samochodami po jednopasmowej drodze. Pierwszy, który zjedzie z drogi zostaje tchórzem, drugi – bohaterem. Jeżeli obaj zjadą z drogi, to obaj zostają tchórzami. Jeżeli żaden nie zjedzie – obaj lądują w szpitalu. - Nie występują strategie dominujące, lecz dwie równowagi Nasha. - Ekonomistów zawsze intrygowało poszukiwanie przykładów zachowań, które odpowiadałyby postawom brawurowych graczy. Wydaje się, że najbardziej zbliżona jest sytuacja monopolu naturalnego, w którym wysokie koszty wejścia i malejące koszty przeciętne nie pozwalają realizować rentowności umożliwiającej funkcjonowanie na rynku dwóch firm. Sasza Olek Zjechać Nie zjechać (1; 1) (1; 2) (2, 1) (0, 0)
D. Ciołek BADANIA OPERACYJNE – wykład 4 Monopol naturalny (1) Telewizja kablowa jest branżą wymagającą wysokich nakładów kapitału (kosztów stałych) i relatywnie niskich kosztów krańcowych wraz z podłączeniem następnego subskrybenta do odbioru programów. Zatem próg rentowności wymaga znacznej liczby odbiorców (gospodarstw domowych). Ponieważ rynek telewizji satelitarnej w Wielkiej Brytanii na przełomie lat 90. XX. wieku wydawał się potencjalnie ogromny, więc dwie firmy postanowiły go podbić. Specyfikę sytuacji kształtowała odmienna, niekompatybilna technologia obu konkurentów zniechęcająca odbiorców do opłacenia 200 funtów opłaty wstępnej z ryzykiem braku możliwości wykorzystania sprzętu, gdyby zaszła konieczność przestawienia się na odbiór proponowany przez inną firmę. Ponadto, firma Sky Television planowała wziąć w leasing już krążącego w przestrzeni satelitę, a British Satellite Broadcasting (BSB) zamierzała umieścić w przestrzeni własnego satelitę, co znacznie podnosiło jej koszty.
D. Ciołek BADANIA OPERACYJNE – wykład 4 Monopol naturalny (2) W tabeli zamieszczono szacunek wartości zaktualizowanej wartości netto NPV za lata 1989 – 1999 uwzględniającej koszty satelitów, oprogramowania, reklamy, sprzedaży i kosztów administracyjnych w warunkach dwóch strategii każdej z firm (wejścia na rynek i pozostania poza nim). Układ efektów (wypłat) wskazuje, że występuje podwójna równowaga Nasha. Teoria gier nie podpowiada, która równowaga jest lepsza. To zależy od uwzględnienia dodatkowych informacji (szczegółów). W opisywanym przypadku nie ma miejsca na rynku dla dwóch przedsiębiorstw. Ze względu na opóźnienie techniczne w wystrzeleniu satelity i wysoki poziom dziennych strat z tego tytułu doprowadziły do przejęcia BSB przez Sky. W rezultacie od 1993 roku brytyjski rynek telewizji kablowej jest znacząco rentownym monopolem. SKY BSB Wejść Nie wjechać (-118 -747) (673 0) Nie wchodzić (0 137) (0 0)
D. Ciołek BADANIA OPERACYJNE – wykład 4 Gry z naturą – podejmowanie decyzji w warunkach ryzyka Ryzyko oznacza możliwość osiągnięcia wartości końcowej kapitału (inwestycji, instrumentu finansowego) różniącej się od wartości oczekiwanej. Działanie w warunkach ryzyka, dotyczy podejmowania decyzji odnośnie do zdarzeń, które mogą wystąpić z określonym prawdopodobieństwem. Dwaj gracze: decydent i natura. Natura - nie jest zainteresowana wynikiem gry Reguły decyzyjne: kryterium Walda (reguła maxmin), kryterium Laplace'a - Bayesa, kryterium Hurwicza, kryterium Savage'a,
D. Ciołek BADANIA OPERACYJNE – wykład 4 Gry z naturą Niech A = [aij ] oznacza macierz wypłat (korzyści). 1. Kryterium Walda Podejmujemy taką decyzję, przy której minimalna wygrana (ze względu na stan natury) przyjmie wartość największą, tzn. szukamy takiego i0, dla którego: 2. Kryterium Laplace'a - Bayesa Zakładamy, że wszystkie stany natury są jednakowo prawdopodobne, możliwe jest wyliczenie wartości oczekiwanej wygranej. Najlepsza decyzja, to ta dla której oczekiwany rezultat jest największy. Szukamy takiego i0, dla którego:
D. Ciołek BADANIA OPERACYJNE – wykład 4 Gry z naturą 3. Kryterium Hurwicza Wprowadzamy współczynnik optymizmu - skłonności do ryzyka , wybieramy tę decyzję i0, dla której: W zależności od wartości współczynnika optymizmu, otrzymujemy: - reguła pesymistyczna (Walda), - reguła optymistyczna
D. Ciołek BADANIA OPERACYJNE – wykład 4 Gry z naturą 4. Kryterium Savage'a Definiujemy macierz żalu lub strat relatywnych. Strata relatywna - różnica pomiędzy maksymalną wygraną przy danym stanie natury, a wygraną wynikającą z podjętej decyzji. Macierz strat relatywnych gdzie: Wybieramy tę strategię i0, która spełnia postulat minimalizacji strat relatywnych (minimalny maksymalny żal).
D. Ciołek BADANIA OPERACYJNE – wykład 4 Przykład 4 Istnieje możliwość zbudowania czterech typów zakładu usługowego. Koszt eksploatacji zależy od różnych czynników, takich jak: rozwój sytuacji gospodarczej w regionie, stan rynku pracy, przyszłe ceny surowców, oraz efektywny popyt na dany rodzaj usług. Dla każdego z projektowanych zakładów oszacowano koszty eksploatacji w trzech wariantach: najmniej korzystnym (S1), umiarkowanym (S2), sprzyjającym (S3). Tablica prezentuje oszacowane poziomy kosztów eksploatacji zakładów. „S1” „S2” „S3” „Z1” 40 35 25 „Z2” 50 30 „Z3” 65 20 „Z4” 70 14