Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

DMBO Dualność i gry. Problem pakowania plecaka – ilustracja dualności Złodziej napada na magazyn z plecakiem. Plecak nie może być zbyt ciężki, bo złodziej.

Podobne prezentacje


Prezentacja na temat: "DMBO Dualność i gry. Problem pakowania plecaka – ilustracja dualności Złodziej napada na magazyn z plecakiem. Plecak nie może być zbyt ciężki, bo złodziej."— Zapis prezentacji:

1 DMBO Dualność i gry

2 Problem pakowania plecaka – ilustracja dualności Złodziej napada na magazyn z plecakiem. Plecak nie może być zbyt ciężki, bo złodziej go nie uniesie. W magazynie znajduje się dużo dobrze podzielnych towarów np. złoto, srebro, pył diamentowy. Złodziej chce zapełnić plecak najbardziej cennymi towarami. Jak zdecyduje co wziąć do plecaka?

3 Model Parametry: W – maksymalna waga plecaka N – ilość towarów w magazynie w i – waga dobra i v i – wartość dobra i Zmienne decyzyjne: x i – jak dużo towaru i włożyć do plecaka (udział całości tego co jest w magazynie) Funkcja celu: Maksymalizuj wartość towarów Ograniczenia: (a) Złodziej nie może wziąć więcej danego towaru niż jest w magazynie. (b)Złodziej nie uniesie więcej niż plecak i siły pozwolą. (c)Złodziej nie może ukraść ujemnej ilości towarów (jeśli jest złodziejem)

4 Model Problem można zatem sformułować jako ZPL: Max

5 Przykład problemu prymalnego: Problem złodzieja Podstawmy N=3, W=4, w=(2,3,4) i v=(5,20,3) złoto, diamenty i srebro. max p.w. Rozwiązanie problemu złodzieja: (x1,x2,x3)=(0.5, 1, 0) Wartość funkcji celu: 22.5

6 Analiza Tylko jeden towar (złoto) jest wybrany w części ułamkowej. Jest to ogólna zasada w problemach z pakowaniem plecaka z N towarami. Intuicja: – Optymalne rozwiązanie w tym przykładzie jest jednoznaczne. – Aby jednoznacznie wyznaczyć 3 niewiadome, potrzebujemy 3 równania liniowe. – Czyli przynajmniej 3 nasze ograniczenia muszą być spełnione w postaci równości. – Jedno ograniczenie to waga plecaka, ale pozostałe dwa dotyczą ilości towarów 0x i 1. – Zatem tylko jeden towar może być wybrany w postaci ułamkowej w optimum.

7 Syndyk wykupuje złodzieja Przypuśćmy, że syndykat przestępczy chce wykupić skradzione towary od złodzieja. Proponują ceny y 1 za złoto, y 2 za diamenty, y 3 za srebro oraz y 4 za kilogram plecaka. Ale złodziej może użyć 2 kilogramy pojemności plecaka i całe swoje złoto, aby wygenerować zysk 5 jednostek, czyli 2y 4 +y 1 powinno wynosić przynajmniej 5. Podobnie w przypadku pozostałych towarów. Syndykat chciałby zminimalizować całkowitą cenę, którą płaci złodziejowi y 1 +y 2 +y 3 +4y 4 Ceny powinny być nieujemne, inaczej złodziej nie sprzeda towarów i plecaka.

8 Przykład problemu dualnego: Problem syndyka Problem syndyka można zatem przedstawić następująco: min p.w. Rozwiązanie problemu syndyka: (y1,y2,y3,y4)=(0,12.5,0,2.5) Optymalna wartość funkcji celu: 22.5

9 Problem złodzieja: Jest równoważny: Ponieważ np. Przekształcamy: Ponieważ np. To jest równoważny problemowi syndyka:

10 PROBLEM DUALNY: SYNDYKA Microsoft Excel 14.1 Sensitivity Report Worksheet: [Workbook3]Sheet5 Report Created: 11/1/2011 4:06:44 PM Variable Cells FinalReducedObjectiveAllowable CellNameValueCostCoefficientIncreaseDecrease $B$2y E $B$3y $B$4y30111E+301 $B$5y Constraints FinalShadowConstraintAllowable CellNameValuePriceR.H. SideIncreaseDecrease $F$7min cena za złoto $F$8min cena za diamenty201 1E $F$9min cena za srebro100371E+30 Rozwiązanie problemu syndyka: (y1,y2,y3,y4)=(0,12.5,0,2.5) ceny dualne Optymalna wartość funkcji celu: 22.5 Rozwiązanie problemu złodzieja: (x1,x2,x3)=(0.5, 1, 0) Optymalna wartość funkcji celu: 22.5

11 PROBLEM PRYMALNY: ZŁODZIEJA Microsoft Excel 14.1 Sensitivity Report Worksheet: [Workbook3]Sheet1 Report Created: 11/1/2011 1:53:00 PM Variable Cells FinalReducedObjectiveAllowable CellNameValueCostCoefficientIncreaseDecrease $B$2x $B$3x210201E $B$4x E+30 Constraints FinalShadowConstraintAllowable CellNameValuePriceR.H. SideIncreaseDecrease $F$6waga plecaka $F$7ilość x E $F$8ilość x $F$9ilość x30011E+301 Rozwiązanie problemu złodzieja: (x1,x2,x3)=(0.5, 1, 0) Optymalna wartość funkcji celu: 22.5 Rozwiązanie problemu syndyka: (y1,y2,y3,y4)=(0,12.5,0,2.5) ceny dualne Optymalna wartość funkcji celu: 22.5

12 Gry o sumie zerowej W grach o sumie zerowej wypłaty sumują się do zera w każdym stanie Diagram przesunięć

13 Gry o sumie zerowej Minimax = maximin = wartość gry Gra może mieć wiele punktów siodłowych

14 Gry o sumie zerowej Albo nie mieć ich wcale Jaka jest wartość gry w takim przypadku? – Jeśli gra nie ma punktu siodłowego, trzeba wprowadzić strategie mieszane

15 Gry o sumie zerowej Jeśli jest więcej niż dwie strategie dla jednego gracza i gra nie ma punktu siodłowego, nie wiadomo, które strategie będą częścią optymalnej strategii mieszanej Niech mieszana strategia Kolumny będzie (x,1-x) Wypłata Wiersza dla każdej jego strategii

16 Kolumna będzie wybierała x, aby zmaksymalizować górną kopertę (upper envelope) Gry o sumie zerowej

17 Przekształcamy w problem programowania liniowego Gry o sumie zerowej

18 Studium przypadku: Teoria gier i dualność W latach pięćdziesiątych, Davenport studiował zachowanie rybaków w małej wiosce na Jamajce.

19 Twenty-six fishing crews in sailing, dugout canoes fish this area [fishing grounds extend outward from shore about 22 miles] by setting fish pots, which are drawn and reset, weather and sea permitting, on three regular fishing days each week … The fishing grounds are divided into inside and outside banks. The inside banks lie from 5-15 miles offshore, while the outside banks all lie beyond … Because of special underwater contours and the location of one prominent headland, very strong currents set across the outside banks at frequent intervals … These currents are not related in any apparent way to weather and sea conditions of the local region. The inside banks are almost fully protected from the currents. [Davenport 1960]

20 Jamajka

21 Strategie 26 drewnianych kanoe. Kapitanowie tych kanoe mają do dyspozycji 3 strategie połowu: IN – ustawić wszystkie kosze w zatokach OUT – ustawić wszystkie kosze na wodach odsłoniętych IN-OUT – część koszy w zatokach część na zewnątrz

22 Zalety i wady połowu na otwartym morzu WADY Dopłynięcie do łowiska zabiera więcej czasu, więc można postawić mniej koszy Jak prąd jest aktywny, powoduje duże zagrożenie dla koszy ustawionych na otwartym morzu – Znosi znaczniki – Uszkadza kosze podczas przesuwania – Zmiany temperatury wody mogą zabijać ryby wewnątrz koszy ZALETY Ryby na łowiskach zewnętrznych są dużo lepszej jakości – Jeśli jest ich dosyć, mogą wyprzeć ryby z łowisk wewnętrznych zupełnie z rynku Rybołóstwo na łowiskach zewnętrznych wymaga dużo lepszych kanoe – Zazwyczaj ci, którzy łowią na łowiskach wewnętrznych kupują używane kanoe od tych, którzy łowią na łowiskach zewnętrznych – Posiadanie lepszych kanoe daje dużo prestiżu, ponieważ ich kapitanowie dominują w corocznych wyścigach kanoe

23 Dane Davenport zebrał dane dotyczące średnich dziennych zysków w zależności od strategii połowu oraz obecności/nieobecności prądu Rybacy\PrądPłynieNie płynie IN17,311,5 OUT-4,420,6 IN-OUT5,217,0

24 Strategia OUT

25 1 Gra o sumie zerowej?? Nie ma punktu siodłowego Strategia mieszana – załóżmy, że złośliwy prąd stosuje strategię Płynę z prawdopodobieństwem p1, Nie płynę z prawdopodobieństwem p2 Strategia rybaków: IN z prawd. q1, OUT z prawd. q2, IN-OUT z prawd. Q3 Dla każdego p rybacy wybierają strategię (q) z maksymalną wypłatą A złośliwy prąd wybiera p tak, aby rybacy zarobili jak najmniej

26 Rozwiązanie graficzne problemu prądu Optymalna strategia mieszana prądu Solution: p=0.31

27 Podobnie w przypadku odwrotnym: Dla każdej strategii rybaków q, prąd wybiera taką, dla której rybacy zarobią najmniej: Rybacy natomiast będą się starali tak wybrać q, aby zmaksymalizować swoją wypłatę

28 Maxmin i minimax funkcja celu Strategia prądu p1-p minimalizuj Oczekiwana wypłata ze strategii wewnętrznej13.31<=13.31 zewnętrznej12.79<=13.31 in-out13.31<=13.31 prawdopodobieństwa1.00= funkcja celu Strategia rybaków q1q2q3 maksymalizuj Oczekiwana wypłata prądu gdy: płynę13.31>=13.31 nie płynę13.31>=13.31 prawdopodobieństwa1.00=

29 Raport wrażliwości minimax Microsoft Excel 14.1 Sensitivity Report Worksheet: [maximinnowe.xlsx]minimax Report Created: 11/16/ :19:08 PM Variable Cells FinalReducedObjectiveAllowable CellNameValueCostCoefficientIncreaseDecrease $B$3minimalizuj funkcja celu E+301 $C$3minimalizuj p $D$3minimalizuj 1-p Constraints FinalShadowConstraintAllowable CellNameValuePriceR.H. SideIncreaseDecrease $B$6wewnętrznej funkcja celu $B$7zewnętrznej funkcja celu E $B$8in-out funkcja celu $B$9prawdopodobieństwa funkcja celu E+301

30 Raport wrażliwości maximin Microsoft Excel 14.1 Sensitivity Report Worksheet: [maximinnowe.xlsx]maximin Report Created: 11/16/ :20:13 PM Variable Cells FinalReducedObjectiveAllowable CellNameValueCostCoefficientIncreaseDecrease $B$3maksymalizuj funkcja celu E+301 $C$3maksymalizuj q $D$3maksymalizuj q E+30 $E$3maksymalizuj q Constraints FinalShadowConstraintAllowable CellNameValuePriceR.H. SideIncreaseDecrease $B$6płynę funkcja celu $B$7nie płynę funkcja celu $B$8prawdopodobieństwa funkcja celu E+301

31 Prognoza i obserwacja Gra o sumie zerowej Nikt nie ryzykuje zastawiania koszy na zewnętrznych łowiskach Optymalna strategia rybaków: 67% IN, 33% IN-OUT [Oczekiwana wypłata: 13.31] Optymalna strategia prądu: 31% PŁYNIE, 69% NIE PŁYNIE Obserwacja Nikt nie ryzykuje zastawiania koszy na zewnętrznych łowiskach Strategia rybaków: 69% IN, 31% IN-OUT [Oczekiwana wypłata: 13.38] Prąd: 25% PŁYNIE, 75% NIE PŁYNIE Konkluzja Davenporta: rybacy są dobrze przystosowani Odkrycie Davenporta przez parę lat nie zostało zakwestionowane aż do momentu …

32 Prąd nie jest złośliwy Kozelka 1969 oraz Read, Read 1970 zauważyli, że – Prąd nie dostosowuje swojej strategii do działań rybaków – Dlatego rybacy powinni zastosować zasadę oczekiwanych zysków Oczekiwane zyski rybaków – IN: 0.25 x x 11.5 = – OUT: 0.25 x (-4.4) x 20.6 = – IN-OUT: 0.25 x x 17.0 = Czyli wszyscy rybacy powinni łowić na zewnętrznych łowiskach Może jednak nie są zbyt dobrze przystosowani Rybacy\PrądPłynie (25%)Nie płynie (75%) IN17,311,5 OUT-4,420,6 IN-OUT5,217,0

33 Prąd może być jednak złośliwy Prąd nie rozumuje, ale łowienie na otwartym morzu jest bardzo ryzykowne. Nawet jeśli prąd płynie ŚREDNIO 25% czasu, to jednak może płynąć częściej w danym roku. Załóżmy, że w jednym roku prąd płynie 35% czasu. Oczekiwana wypłata: – IN: 0.35 x x 11.5 = – OUT: 0.35 x (-4.4) x 11.5 = – IN-OUT: 0.35 x x 17.0 = Poprzez potraktowanie prądu jak złośliwego gracza rybacy GWARANTUJĄ sobie wypłatę przynajmniej 13.31, niezależnie od tego, jak często płynie prąd Rybacy płacą $1.05 składki ubezpieczeniowej Rzeczywisty (25%)Złośliwy (31%) 35% Gra o sumie Rzcezywista OUT

34 Skojarzenia xHelenaGosiaIrenarowsums Dawid1001 Edward0101 Filip0011 colsums111 kompatyblino śćHelenaGosiaIrena Dawid100.5 Edward Filip funkcja celu4.5


Pobierz ppt "DMBO Dualność i gry. Problem pakowania plecaka – ilustracja dualności Złodziej napada na magazyn z plecakiem. Plecak nie może być zbyt ciężki, bo złodziej."

Podobne prezentacje


Reklamy Google