Dualność Wykład 4.

Slides:



Advertisements
Podobne prezentacje
Materiały pochodzą z Platformy Edukacyjnej Portalu Wszelkie treści i zasoby edukacyjne publikowane na łamach Portalu
Advertisements

DMBO Dualność i gry.
BLOOD DONATION.
Przygotował: Adrian Walkowiak
Czyli jak zrobić prezentację komputerową?
Co można zwiedzić w WIELKIEJ BRYTANII Pamiętajmy o miejscach które możemy zwiedzić na przykład w WIELKIEJ BRYTANII. I też czym różni się ta wyspa od naszego.
Moja Prezentacja Aleksandra Skorupa.
Małgorzata Pietroczuk
FUNKCJA L I N I O W A Autorzy: Jolanta Kaczka Magdalena Wierdak
DYFRAKCJA ŚWIATŁA NA SIATCE DYNAMICZNEJ
- Jak mężczyzna może najszybciej popełnić samobójstwo
Problem obiadu Przykład. Pan domu został słomianym wdowcem i postanowił sam ugotować sobie obiad. Porównamy je-go działanie z organizacją pracy jego żony.
Analiza matematyczna III. Funkcje Funkcje I – własności podstawowe
Analiza matematyczna III. Funkcje Funkcje II – własności podstawowe
AUTOR :WOJTEK NOWIK REPORTER : PATRYK SORMAN LUK SMIS PIOTREK COLO (KOLO) MAX SOWT.
Elektronika cyfrowa Prezentacja Remka Kondrackiego.
AUTOR :WOJTEK NOWIK REPORTER : LUK SMIS PATRYK SORMAN PIOTREK COLO (KOLO)
AUTOR :WOJTEK NOWIK REPORTER : LUK SMIS PATRYK SORMAN PIOTREK COLO (KOLO)
Podstawowe jednostki informacji, co to jest bit i bajt?
WNIOSKI Z PRZEPROWADZONEJ ANKIETY NA TEMAT SAMORZĄDU UCZNIOWSKIEGO ORAZ GAZETKI SZKOLNEJ „KUJONEK”
PREZENTACJA WYKORZYSTANA PODCZAS DEBATY W SALI PATRONA SZKOŁY.
Młodzież a wolontariat.. Opracowanie: Judyta Szłapa Urszula Buczek.
Pomoc słabszym w nauce Sprzątanie pobliskiego terenu Pomoc starszym.
Silnik kondensatorowy
Powiedzmy, że jest i wracasz do domu samochodem (oczywiście sam) po niezwykle ciężkim dniu pracy. Jesteś naprawdę zmęczony i sfrustrowany.
Podstawy programowania
Teoria gier a psychologia społeczna
fotografie - Marcel Cohen
Prawa Dziecka.
Zielone płuca Amazonii
Nieformalne miejsca spotkań. ANKIETY Przeprowadziliśmy wśród uczniów gimnazjum ankietę na temat nieformalnych miejsc spotkań. Przedstawimy przykładowe.
Ach te baby... Ach te baby....
The Grumpy Test If at least one of these pictures does not make you smile, then you are grumpy and need to go back to bed. Test na ponuraka Jak nie usmiechniesz.
Uwaga !!! Uczniowie SP 32 w Toruniu ! Zapraszamy was i Wasze rodziny do wzięcia udziału w Festynie Zdrowia, który odbędzie się 31 maja 2013 roku podczas.
Analiza stanu naprężenia
Wykonała Sylwia Kozber
Prąd elektryczny.
Antonie de Saint-Exupery
Powrót do sukcesu Analiza przypadku Princessy (rola badań marketingowych podczas rozwoju produktu: ) Powrót do sukcesu Analiza przypadku Princessy.
System gospodarki rynkowej
Fotografia.
HTML Podstawy języka hipertekstowego Damian Urbańczyk.
Ruch jednostajny po okręgu Ciało porusza się ruchem jednostajnym oraz torem tego ruchu jest okrąg.
PATOLOGIE SPOŁECZNE. Ubóstwo i bezrobocie SPOSOBY ZWALCZANIA UBÓSTWA I BEZROBOCIA System opieki społecznej Programy aktywneProgramy pasywne.
Jan Paweł II orędownik prawdy
Jak się uchronić przed zagrożeniami wynikającymi z użytkowania sieci?
Klaudia Sodzawiczny kl.3 AE Adrianna Kuwałek kl. 3 AE
Warsztaty C# Część 3 Grzegorz Piotrowski Grupa.NET PO
BEZPIECZNY INTERNET. PRZEGLĄDANIE STRON INTERNETOWYCH.
SKALA MAPY Skala – stosunek odległości na mapie do odpowiadającej jej odległości w terenie. Skala najczęściej wyrażona jest w postaci ułamka 1:S, np. 1:10.
To śmieszne...
1 Strategia dziel i zwyciężaj Wiele ważnych algorytmów ma strukturą rekurencyjną. W celu rozwiązania rozwiązania problemu algorytm wywołuje sam siebie.
Kiedy mówisz: "Nie potrafię rozwikłać problemów..."
Narodowy Fundusz Ochrony Środowiska i Gospodarki Wodnej UNIA EUROPEJSKA FUNDUSZ SPÓJNOŚCI Kwalifikowanie wydatków c.d. ( najczęściej występujące problemy.
„Bezpieczny Internet każdego dnia”
Łamana Anna Gadomska S.P. 79 Łódź.
Są w życiu chwile, kiedy tak bardzo odczuwamy brak obecności innych,
Weronika Schneider. Na fotografiach widać obecne budynki Polpharmy.
Amatciems (Łotwa) Raj niedaleko Polski.
CZY JESTEŚMY DLA SIEBIE ŻYCZLIWI?
W.K. (c) Bazy danych Access. 2W.K. (c) 2007 Baza danych - definicje Baza danych to zbiór informacji dotyczących określonego tematu (stanowiących.
Temat 1: Składnia języka HTML
Instrukcja switch switch (wyrażenie) { case wart_1 : { instr_1; break; } case wart_2 : { instr_2; break; } … case wart_n : { instr_n; break; } default.
GABRIEL GARCÍA MÁRQUEZ
Pozyskiwanie partnerów. Model popytowego podejścia do tworzenia innowacji Definicja Dwa podejścia do UDI –Głos konsumenta –Przewodnictwo konsumenta Cechy.
Bardzo pożyteczna rzecz, czy narzędzie zbrodni?
w/g Grzegorz Gadomskiego
Największym bólem w życiu nie jest śmierć, lecz bycie ignorowanym.
Gry o sumie zerowej.
Zapis prezentacji:

Dualność Wykład 4

Problem pakowania plecaka – ilustracja dualności Złodziej napada na magazyn z plecakiem. Plecak nie może być zbyt ciężki, bo złodziej go nie uniesie. W magazynie znajduje się dużo dobrze podzielnych towarów np. złoto, srebro, pył diamentowy. Złodziej chce zapełnić plecak najbardziej cennymi towarami. Jak zdecyduje co wziąć do plecaka?

Przykład problemu prymalnego: Problem złodzieja Podstawmy N=3, W=4, w=(2,3,4) i v=(5,20,3) złoto, diamenty i srebro. max p.w. Rozwiązanie problemu złodzieja: (x1,x2,x3)=(0.5, 1, 0) Wartość funkcji celu: 22.5

Syndyk wykupuje złodzieja Przypuśćmy, że syndykat przestępczy chce wykupić skradzione towary od złodzieja. Proponują ceny y1 za złoto, y2 za diamenty, y3 za srebro oraz y4 za kilogram plecaka. Ale złodziej może użyć 2 kilogramy pojemności plecaka i całe swoje złoto, aby wygenerować zysk 5 jednostek, czyli 2y4+y1 powinno wynosić przynajmniej 5. Podobnie w przypadku pozostałych towarów. Syndykat chciałby zminimalizować całkowitą cenę, którą płaci złodziejowi y1+y2+y3+4y4 Ceny powinny być nieujemne, inaczej złodziej nie sprzeda towarów i plecaka.

Przykład problemu dualnego: Problem syndyka Problem syndyka można zatem przedstawić następująco: min p.w. Rozwiązanie problemu syndyka: (y1,y2,y3,y4)=(0,12.5,0,2.5) Optymalna wartość funkcji celu: 22.5

Problem złodzieja: Jest równoważny: Ponieważ np. Przekształcamy: To jest równoważny problemowi syndyka

Rozwiązanie problemu złodzieja: (x1,x2,x3)=(0.5, 1, 0) Optymalna wartość funkcji celu: 22.5 Rozwiązanie problemu syndyka: (y1,y2,y3,y4)=(0,12.5,0,2.5) ceny dualne Optymalna wartość funkcji celu: 22.5 PROBLEM PRYMALNY: ZŁODZIEJA Microsoft Excel 14.1 Sensitivity Report Worksheet: [Workbook3]Sheet1 Report Created: 11/1/2011 1:53:00 PM Variable Cells   Final Reduced Objective Allowable Cell Name Value Cost Coefficient Increase Decrease $B$2 x1 0.5 5 8.333333333 3.5 $B$3 x2 1 20 1E+30 12.5 $B$4 x3 -7 3 7 Constraints Shadow Constraint Price R.H. Side $F$6 waga plecaka 4 2.5 $F$7 ilość x1 $F$8 ilość x2 0.333333333 $F$9 ilość x3

Rozwiązanie problemu złodzieja: (x1,x2,x3)=(0.5, 1, 0) Optymalna wartość funkcji celu: 22.5 Rozwiązanie problemu syndyka: (y1,y2,y3,y4)=(0,12.5,0,2.5) ceny dualne Optymalna wartość funkcji celu: 22.5 PROBLEM DUALNY: SYNDYKA Microsoft Excel 14.1 Sensitivity Report Worksheet: [Workbook3]Sheet5 Report Created: 11/1/2011 4:06:44 PM Variable Cells   Final Reduced Objective Allowable Cell Name Value Cost Coefficient Increase Decrease $B$2 y1 0.5 1 1E+30 $B$3 y2 12.5 0.333333333 $B$4 y3 $B$5 y4 2.5 4 Constraints Shadow Constraint Price R.H. Side $F$7 min cena za złoto 5 8.333333333 3.5 $F$8 min cena za diamenty 20 $F$9 min cena za srebro 10 3 7

Gry o sumie zerowej W grach o sumie zerowej wypłaty sumują się do zera w każdym stanie Diagram przesunięć

Gry o sumie zerowej Minimax = maximin = wartość gry Gra może mieć wiele punktów siodłowych

Gry o sumie zerowej Albo nie mieć ich wcale Jaka jest wartość gry w takim przypadku? Jeśli gra nie ma punktu siodłowego, trzeba wprowadzić strategie mieszane

Strzelanie karnych P L min wiersza -1 1 max kolumny Załóżmy, że Tytoń stosuje strategię mieszaną: P z prawdopodobieństwem x L z prawdopodobieństwem 1-x Wtedy oczekiwana wypłata Karagounisa wynosi: Wypłaty Karagounisa Jeśli x>0,5 Karagounis wybierze L (wypłata K >0) Jeśli x<0,5 Karagounis wybierze P (wypłata K >0) Jeśli x=0,5 jest mu wszystko jedno (wypłata =0)

Strzelanie karnych P L min wiersza -1 1 max kolumny Załóżmy, że Karagounis stosuje strategię mieszaną: P z prawdopodobieństwem y L z prawdopodobieństwem 1-y Wtedy oczekiwana wypłata Tytonia wynosi: Wypłaty Karagounisa Jeśli y>0,5 Tytoń wybierze P (wypłata T >0) Jeśli y<0,5 Tytoń wybierze L (wypłata T >0) Jeśli y=0,5 jest mu wszystko jedno (wypłata =0)

Strzelanie karnych P L min wiersza -1 1 max kolumny P L (P,1/2; L,1/2) max kolumny maximin minimax

Gry o sumie zerowej Jeśli jest więcej niż dwie strategie dla jednego gracza i gra nie ma punktu siodłowego, nie wiadomo, które strategie będą częścią optymalnej strategii mieszanej Niech mieszana strategia Kolumny będzie (x,1-x) Wypłata Wiersza dla każdej jego strategii

Gry o sumie zerowej Kolumna będzie wybierała x, aby zmaksymalizować „górną kopertę” (upper envelope)

Gry o sumie zerowej Przekształcamy w problem programowania liniowego

Studium przypadku: Teoria gier i dualność W latach pięćdziesiątych, Davenport studiował zachowanie rybaków w małej wiosce na Jamajce.

Twenty-six fishing crews in sailing, dugout canoes fish this area [fishing grounds extend outward from shore about 22 miles] by setting fish pots, which are drawn and reset, weather and sea permitting, on three regular fishing days each week … The fishing grounds are divided into inside and outside banks. The inside banks lie from 5-15 miles offshore, while the outside banks all lie beyond … Because of special underwater contours and the location of one prominent headland, very strong currents set across the outside banks at frequent intervals … These currents are not related in any apparent way to weather and sea conditions of the local region. The inside banks are almost fully protected from the currents. [Davenport 1960]

Jamajka

Strategie 26 drewnianych kanoe. Kapitanowie tych kanoe mają do dyspozycji 3 strategie połowu: IN – ustawić wszystkie kosze w zatokach OUT – ustawić wszystkie kosze na wodach odsłoniętych IN-OUT – część koszy w zatokach część na zewnątrz

Zalety i wady połowu na otwartym morzu Dopłynięcie do łowiska zabiera więcej czasu, więc można postawić mniej koszy Jak prąd jest aktywny, powoduje duże zagrożenie dla koszy ustawionych na otwartym morzu Znosi znaczniki Uszkadza kosze podczas przesuwania Zmiany temperatury wody mogą zabijać ryby wewnątrz koszy ZALETY Ryby na łowiskach zewnętrznych są dużo lepszej jakości Jeśli jest ich dosyć, mogą wyprzeć ryby z łowisk wewnętrznych zupełnie z rynku Rybołóstwo na łowiskach zewnętrznych wymaga dużo lepszych kanoe Zazwyczaj ci, którzy łowią na łowiskach wewnętrznych kupują używane kanoe od tych, którzy łowią na łowiskach zewnętrznych Posiadanie lepszych kanoe daje dużo prestiżu, ponieważ ich kapitanowie dominują w corocznych wyścigach kanoe

Dane Davenport zebrał dane dotyczące średnich dziennych zysków w zależności od strategii połowu oraz obecności/nieobecności prądu Rybacy\Prąd Płynie Nie płynie IN 17,3 11,5 OUT -4,4 20,6 IN-OUT 5,2 17,0

Strategia OUT

1 Gra o sumie zerowej?? Nie ma punktu siodłowego Strategia mieszana – załóżmy, że „złośliwy” prąd „stosuje” strategię „Płynę” z prawdopodobieństwem p1, „Nie płynę” z prawdopodobieństwem p2 Strategia rybaków: IN z prawd. q1, OUT z prawd. q2, IN-OUT z prawd. Q3 Dla każdego p rybacy wybierają strategię (q) z maksymalną wypłatą A „złośliwy” prąd wybiera p tak, aby rybacy zarobili jak najmniej

Rozwiązanie graficzne problemu prądu Solution: p=0.31 Optymalna strategia mieszana prądu

Podobnie w przypadku odwrotnym: Dla każdej strategii rybaków q, prąd „wybiera” taką, dla której rybacy zarobią najmniej: Rybacy natomiast będą się starali tak wybrać q, aby zmaksymalizować swoją wypłatę

Maxmin i minimax funkcja celu Strategia prądu p 1-p minimalizuj 13.31 0.31 0.69 Oczekiwana wypłata ze strategii wewnętrznej <= zewnętrznej 12.79 in-out prawdopodobieństwa 1.00 = funkcja celu Strategia rybaków q1 q2 q3 maksymalizuj 13.31 0.67 0.00 0.33 Oczekiwana wypłata prądu gdy: płynę >= nie płynę prawdopodobieństwa 1.00 =

Raport wrażliwości minimax Microsoft Excel 14.1 Sensitivity Report Worksheet: [maximinnowe.xlsx]minimax Report Created: 11/16/2011 12:19:08 PM Variable Cells   Final Reduced Objective Allowable Cell Name Value Cost Coefficient Increase Decrease $B$3 minimalizuj funkcja celu 13.3125 1 1E+30 $C$3 minimalizuj p 0.3125 11.8 5.8 $D$3 minimalizuj 1-p 0.6875 Constraints Shadow Constraint Price R.H. Side $B$6 wewnętrznej funkcja celu -0.670454545 12.1 0.7 $B$7 zewnętrznej funkcja celu 12.7875 0.525 $B$8 in-out funkcja celu -0.329545455 0.3 $B$9 prawdopodobieństwa funkcja celu

Raport wrażliwości maximin Microsoft Excel 14.1 Sensitivity Report Worksheet: [maximinnowe.xlsx]maximin Report Created: 11/16/2011 12:20:13 PM Variable Cells   Final Reduced Objective Allowable Cell Name Value Cost Coefficient Increase Decrease $B$3 maksymalizuj funkcja celu 13.3125 1 1E+30 $C$3 maksymalizuj q1 0.670454545 0.7 12.1 $D$3 maksymalizuj q2 -0.525 0.525 $E$3 maksymalizuj q3 0.329545455 0.3 Constraints Shadow Constraint Price R.H. Side $B$6 płynę funkcja celu -0.3125 5.8 11.8 $B$7 nie płynę funkcja celu -0.6875 $B$8 prawdopodobieństwa funkcja celu

Prognoza i obserwacja Gra o sumie zerowej Obserwacja Nikt nie ryzykuje zastawiania koszy na zewnętrznych łowiskach Optymalna strategia rybaków: 67% IN, 33% IN-OUT [Oczekiwana wypłata: 13.31] Optymalna strategia prądu: 31% PŁYNIE, 69% NIE PŁYNIE Nikt nie ryzykuje zastawiania koszy na zewnętrznych łowiskach Strategia rybaków: 69% IN, 31% IN-OUT [Oczekiwana wypłata: 13.38] Prąd: 25% PŁYNIE, 75% NIE PŁYNIE Konkluzja Davenporta: rybacy są dobrze przystosowani Odkrycie Davenporta przez parę lat nie zostało zakwestionowane aż do momentu …

Prąd nie jest złośliwy Kozelka 1969 oraz Read, Read 1970 zauważyli, że Prąd nie dostosowuje swojej „strategii” do działań rybaków Dlatego rybacy powinni zastosować zasadę oczekiwanych zysków Oczekiwane zyski rybaków IN: 0.25 x 17.3 + 0.75 x 11.5 = 12.95 OUT: 0.25 x (-4.4) + 0.75 x 20.6 = 14.35 IN-OUT: 0.25 x 5.2 + 0.75 x 17.0 = 14.05 Czyli wszyscy rybacy powinni łowić na zewnętrznych łowiskach Może jednak nie są zbyt dobrze przystosowani Rybacy\Prąd Płynie (25%) Nie płynie (75%) IN 17,3 11,5 OUT -4,4 20,6 IN-OUT 5,2 17,0

Prąd może być jednak złośliwy Prąd nie rozumuje, ale łowienie na otwartym morzu jest bardzo ryzykowne. Nawet jeśli prąd płynie ŚREDNIO 25% czasu, to jednak może płynąć częściej w danym roku. Załóżmy, że w jednym roku prąd płynie 35% czasu. Oczekiwana wypłata: IN: 0.35 x 17.3 + 0.65 x 11.5 = 13.53 OUT: 0.35 x (-4.4) + 0.65 x 11.5 = 11.85 IN-OUT: 0.35 x 5.2 + 0.65 x 17.0 = 12.87. Poprzez potraktowanie prądu jak złośliwego gracza rybacy GWARANTUJĄ sobie wypłatę przynajmniej 13.31, niezależnie od tego, jak często płynie prąd Rybacy płacą $1.05 składki ubezpieczeniowej Rzeczywisty (25%) Złośliwy (31%) 35% Gra o sumie 0 13.3125 Rzcezywista 13.291 13.31164 13.3254 OUT 14.35 12.85 11.85