Metody analizy decyzji Wykład 7 – sekwencyjne problemy decyzyjne

Slides:



Advertisements
Podobne prezentacje
Przykład liczbowy Rozpatrzmy dwuwymiarową zmienną losową (X,Y), gdzie X jest liczbą osób w rodzinie, a Y liczbą izb w mieszkaniu. Niech f.r.p. tej zmiennej.
Advertisements

TRADYCYJNE METODY PLANOWANIA I ORGANIZACJI PROCESÓW PRODUKCYJNYCH
Ocena wartości diagnostycznej testu – obliczanie czułości, swoistości, wartości predykcyjnych testu. Krzywe ROC. Anna Sepioło gr. B III OAM.
ANALIZA SIECIOWA PRZEDSIĘWZIĘĆ konstrukcja harmonogramu
Joanna Sawicka Wydział Nauk Ekonomicznych, Uniwersytet Warszawski
Analiza progu rentowności
Wybrane zastosowania programowania liniowego
KSZTAŁTOWANIE STRUKTURY KAPITAŁU A DŹWIGNIA FINANSOWA
Próg rentowności.
Programowanie sieciowe
Zarządzanie operacjami
WYKŁAD 6 ATOM WODORU W MECHANICE KWANTOWEJ (równanie Schrődingera dla atomu wodoru, separacja zmiennych, stan podstawowy 1s, stany wzbudzone 2s i 2p,
Ludwik Antal - Numeryczna analiza pól elektromagnetycznych –W10
Modele dwumianowe dr Mirosław Budzicki.
Inteligencja Obliczeniowa Metody probabilistyczne.
Pytanie 1.     Co to za trójkąt, który ma jeden kąt prosty?
Struktura problemu decyzyjnego
Analiza ryzyka projektu
BUDOWA MODELU EKONOMETRYCZNEGO
Badania operacyjne. Wykład 1
Materiały pochodzą z Platformy Edukacyjnej Portalu
Instrumenty o charakterze własnościowym Akcje. Literatura Jajuga K., Jajuga T. Inwestycje Jajuga K., Jajuga T. Inwestycje Luenberger D.G. Teoria inwestycji.
WYKŁAD 7. Spójność i rozpięte drzewa
Wpływ systemu rachunku kosztów na wynik finansowy
X* optymalna wielkość zapasu
Olimpia Markiewicz Dominika Milczarek-Andrzejewska NIEPEWNOŚĆ I RYZYKO
TEORIA PERSPEKTYWY D. KAHNEMAN A. TVERSKY
Wykład 10 Prowadzący: dr Paweł Drozda
Wzory ułatwiające obliczenia
Przykładowe zastosowania równania Bernoulliego i równania ciągłości przepływu 1. Pomiar ciśnienia Oznaczając S - punkt spiętrzenia (stagnacji) strugi v=0,
WYKŁAD 7. Spójność i rozpięte drzewa Graf jest spójny, gdy dla każdego podziału V na dwa rozłączne podzbiory A i B istnieje krawędź z A do B. Definicja.
© Victo Testowanie dla menedżerów Wersja TDM Slajd 1 (27) Testowanie oprogramowania dla menedżerów Co menedżerowie i kierownicy naprawdę potrzebują
Hipotezy statystyczne
POJĘCIE ALGORYTMU Pojęcie algorytmu Etapy rozwiązywania zadań
Dzisiaj powtarzamy umiejętności związane z tematem-
Etapy podejmowania decyzji
Elementy Rachunku Prawdopodobieństwa i Statystyki
Analiza współzależności cech statystycznych
Analiza sieciowa przedsięwzięć
Elementy Rachunku Prawdopodobieństwa i Statystyki
Metody analizy decyzji Wykład 6 – wybór w warunkach ryzyka
Sekwencyjne problemy decyzyjne Wykład 7
SPOTKANIE Z RODZICAMI OGÓLNE INFORMACJE O SPRAWDZIANIE Data sprawdzianu – 8 kwietnia 2008 roku Czas pracy – 60 minut Liczba punktów do uzyskania.
Elementy Rachunku Prawdopodobieństwa i Statystyki
WYNIKI ANKIETY PRZEPROWADZONEJ WŚRÓD DZIENNIKARZY OCENIAJĄCYCH PRACĘ DZIAŁÓW PR SPÓŁEK GRUPY PKP OPRACOWANIE: BIURO MARKETINGU I KOMUNIKACJI SPOŁECZNEJ.
ALGORYTMY ROZWIĄZYWANIA GIER C.D.
Opracowała Lidia Bissinger
1. ŁATWOŚĆ ZADANIA (umiejętności) 2. ŁATWOŚĆ ZESTAWU ZADAŃ (ARKUSZA)
PODEJMOWANIE DECYZJI W WARUNKACH PEWNOŚCI (MODEL EV)
MS Excel - wspomaganie decyzji
EcoCondens Kompakt BBK 7-22 E.
Ekonometryczne modele nieliniowe
User experience studio Użyteczna biblioteka Teraźniejszość i przyszłość informacji naukowej.
WYNIKI EGZAMINU MATURALNEGO W ZESPOLE SZKÓŁ TECHNICZNYCH
Obliczalność czyli co da się policzyć i jak Model obliczeń sieci liczące dr Kamila Barylska.
Testogranie TESTOGRANIE Bogdana Berezy.
Jak Jaś parował skarpetki Andrzej Majkowski 1 informatyka +
Teoria perspektywy Daniela Kahnemana i Amosa Tversky`ego
Studium osiągalności. Rozmiar projektu (np. w punktach funkcyjny projektu w porównaniu do rozmiaru zakładanego zespołu projektowego i czasu Dostępność.
Wspomaganie Decyzji IV
Elementy geometryczne i relacje
MACHINE REPAIR Symulacja z arkuszem kalkulacyjnym Magdalena Gołowicz Agnieszka Paluch.
Zarządzanie projektami
Metody Badań Operacyjnych Michał Suchanek Katedra Ekonomiki i Funkcjonowania Przedsiębiorstw Transportowych.
Oligopol oferentów Założenia modelu: 1.Na rynku danego dobra jest kilku dużych oferentów i bardzo wielu drobnych nabywców. 2.Na rynku a) nie ma preferencji.
Zagadnienia transportowe Katedra Ekonomiki i Funkcjonowania Przedsiębiorstw Transportowych.
BYĆ PRZEDSIĘBIORCZYM - nauka przez praktykę Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.
Modele nieliniowe sprowadzane do liniowych
POJĘCIE ALGORYTMU Wstęp do informatyki Pojęcie algorytmu
Zapis prezentacji:

Metody analizy decyzji Wykład 7 – sekwencyjne problemy decyzyjne

Cele dzisiejszego wykładu Specyfika sekwencyjnych problemów decyzyjnych Model sekwencyjnego problemu decyzyjnego Parametryzacja modelu Rozwiązywanie problemów sekwencyjnych (indukcja wsteczna)

Sekwencyjne sytuacje decyzyjne Problemy decyzyjne są często częścią większych problemów Wybór dotyczy ciągu działań odseparowanego w czasie Akcje spotykają się z reakcjami środowiska trudno podjąć wszystkie decyzje na zapas zależności strukturalne (dostępność akcji zależy od reakcji) – trudno postrzegać „jednocześnie” Akcje podejmowane po to, żeby zbadać stan świata (nawet bez 100% pewności)

Przykład Firma zdała sobie sprawę, że wypuściła na rynek wadliwy produkt. Nie jest pewna skali zjawiska – może być duża (40%) lub mała. Jeśli firma nie da po sobie znać, to wina za duży problem na 25% nie zostanie przypisana firmie (za mały na pewno nie). Firma może zignorować problem, upublicznić sprawę lub wszcząć wewnętrzne śledztwo. Wewnętrzne śledztwo na 80% faktycznie pozostanie w ukryciu i da pewną informację nt. skali problemu. Wtedy firma będzie mogła ponownie podjąć decyzję o upublicznieniu lub zignorowaniu przy zachowaniu ww. prawdopodobieństw. Jeśli śledztwo się wyda, pozostaje jedynie niepewność co do skali problemu i reakcji ludzi. Straty – konieczność rekompensat i wymiany sprzętu – wynikające z dużego problemu wynoszą 100 [wszystkie kwoty w mln $], z małego 30. Jeśli problem jest duży, to dodatkowa strata wyniesie: 100 – jeśli firma ignorowała problem, 50 – jeśli firma badała kwestię, ale w ukryciu. Koszt upublicznienia jest równy 1, zaś śledztwa 5.

Przykład – pytania Jakie warianty decyzyjne są dostępne, ile ich jest? Jakie są możliwe konsekwencje dla poszczególnych wariantów? Jakie są związane z nimi wypłaty i prawdopodobieństwa wystąpienia? Jaka jest optymalna decyzja? Jakie zachowania przewiduje? Jak wpływa wzrost prawdopodobieństwa przecieku ze śledztwa? Ile jest warta możliwość przeprowadzenia śledztwa? Ile maksymalnie warto zapłacić za informację o skali problemu?

Model sekwencyjnego problemu decyzyjnego – złe podejście Skala jest duża, ale sama z siebie nie wyjdzie; sekretne badania wyjdą na jaw … Zignoruj problem Prowadź badania, jeśli uda się utrzymać sekret i okaże się, że …, to … Brak uwidocznienia struktury Trudność odgadnięcia niezbędnych parametrów Trudność reewaluacji Niewidoczne współzależności między parametrami

Model sekwencyjnego problemu decyzyjnego – drzewa decyzyjne Elementy modelu: struktura (dostępne działania, następstwo czasowe) parametry (prawdopodobieństwa, koszty, wypłaty) Struktura: drzewo decyzyjne – graf (nieskierowany, spójny, acykliczny) korzeń reprezentuje początek sytuacji decyzyjnej wierzchołki reprezentują moment oczekiwania lub zakończenie problemu wierzchołki: decyzyjne, losowe, końcowe krawędzie między wierzchołkami reprezentują działania/reakcje odległość wierzchołków od korzenia reprezentuje następstwo czasowe

Model sekwencyjnego problemu decyzyjnego – drzewa decyzyjne, c.d. Elementy modelu: struktura (dostępne działania, następstwo czasowe) parametry (prawdopodobieństwa, koszty, wypłaty) Struktura: … Parametry: miary prawdopodobieństwa dla wierzchołków losowych …

Model sekwencyjnego problemu decyzyjnego – drzewa decyzyjne, c.d. Elementy modelu: struktura (dostępne działania, następstwo czasowe) parametry (prawdopodobieństwa, koszty, wypłaty) Struktura: … Parametry: miary prawdopodobieństwa dla wierzchołków losowych wypłaty dla wierzchołków końcowych koszty dla działań i reakcji (krawędzi wychodzących z odpowiednich węzłów)

Przyjęte uproszczenia modelu Stałość parametrów Czas tylko porządkowo (tylko następstwo czasowe) Jeden decydent Jedno kryterium Liniowa f. użyteczności (ew. wypłaty w węzłach końcowych jako użyteczność)

Model sekwencyjnych problemów decyzyjnych – warianty decyzyjne Wariant decyzyjny jednoznacznie określa zachowanie decydenta poprzez podanie reguł: „jeśli wystąpi stan świata X, podejmij działanie Y” Wariant decyzyjny to maksymalny spójny podgraf, w którym każdy wierzchołek decyzyjny ma dokładnie jeden następnik Ile jest wariantów decyzyjnych w naszym problemie?

Przykładowe warianty decyzyjne

Konsekwencje Każdemu wariantowi odpowiada co najmniej jedna konsekwencja, tj. ścieżka działań i reakcji, która może zajść w wyniku wybrania tego wariantu Konsekwencje reprezentowane są przez maksymalne spójne podgrafy, w których każdy węzeł (poza końcowymi) ma jeden następnik Każdy wariant ma tyle konsekwencji, ile węzłów końcowych Konsekwencjom odpowiadają wypłaty dla decydenta oraz prawdopodobieństwo (przy założeniu wybrania wariantu, dla którego dana konsekwencja możliwa)

Przykładowe konsekwencje

Konsekwencje, c.d. Każdemu wariantowi odpowiada co najmniej jedna konsekwencja, tj. ścieżka działań i reakcji, która może zajść w wyniku wybrania tego wariantu Konsekwencje reprezentowane są przez maksymalne spójne podgrafy, w których każdy węzeł (poza końcowymi) ma jeden następnik Każdy wariant ma tyle konsekwencji, ile węzłów końcowych Konsekwencjom odpowiadają wypłaty dla decydenta oraz prawdopodobieństwo (przy założeniu wybrania wariantu, dla którego dana konsekwencja możliwa) Ta sama konsekwencja może wynikać z kilku różnych wariantów (różniących się po reakcjach, które nie zaszły) – wtedy ma takie same wypłaty i prawdopodobieństwa dla każdego wariantu

Ocena wariantu i wybór Każdej konsekwencji odpowiada: koszt – suma kosztów na ścieżce konsekwencji wypłata – z węzła końcowego prawdopodobieństwo – iloczyn prawdopodobieństw Każdemu wariantowi przypisać można rozkład prawdopodobieństwa zysku (wypłat pomniejszonych o koszty) Przy porównywaniu można stosować metody poznane na poprzednim wykładzie,… …w dalszej części będziemy wykorzystywać wartość oczekiwaną zysku (liniowa funkcja użyteczności)

Wybór metodą indukcji wstecznej W dużych problemach łatwiej wybrać metodą indukcji wstecznej: przesuwamy się od węzłów końcowych do wierzchołka dla węzłów końcowych mamy zdefiniowaną wypłatę z każdym węzłem losowym utożsamiamy wypłatę jako wartość oczekiwaną wypłaty dla jego następników z każdym węzłem decyzyjnym utożsamiamy wypłatę jako najwyższą wypłatę dla któregoś następnika pomniejszoną o koszt działania Uwaga: dla każdego węzła decyzyjnego dokonaliśmy wyboru – te wybory definiują wariant decyzyjny, który jest rozwiązaniem! wartość obliczona w korzeniu drzewa definiuje oczekiwaną wypłatę przy wybraniu rozwiązania – to jest także wartość całego problemu

Podsumowanie rozwiązania Optymalny wariant przewiduje prowadzenie badań i upublicznienie wyników (o ile samoistnie nie nastąpił przeciek), jeśli okaże się, że skala problemu jest duża Oczekiwana strata w tej sytuacji decyzyjnej dla optymalnego wariantu wynosi 58,6 mln $ Druga najlepsza opcja to natychmiastowe upublicznienie wyników – oczekiwana strata jest wówczas równa 59 mln $

Przykład 2 – czarne złoto Rockefeller ma pole w umiarkowanie roponośnej okolicy. Zgłosił się do niego oferent, proponując mu za to pole od ręki 750 tys. $, jeśli do transakcji dojdzie natychmiast. Rockefeller może jednak próbować zarobić większe pieniądze. Wiadomo, że połowa pól w tej okolicy rzeczywiście obfituje w ropę. Można (za 250 tys. $) zbudować instalację pozwalającą na wydobycie. Jeśli pod polem znajdują się złoża, przychód wyniesie 2,5 mln. $. Jeśli nie, przychód wyniesie 0$. Co więcej, wykonanie odwiertu uniemożliwia sprzedaż pola (wszyscy wiedzą, że oznaczać to może wyłącznie to, że pole jest bezwartościowe) Alternatywnie można zdecydować się na próbne odwierty połączone z badaniami geologicznymi, które kosztują 100 tys. $. Wyniki takich badań są mylne w 10%, jeśli pole jest roponośne (sensitivity = 90%), i w 30%, jeśli ropy nie ma (specificity = 70%). Po wykonaniu badania można podjąć decyzję o budowaniu instalacji na powyższych warunkach lub sprzedaży pola. Co więcej, uzyskanie pozytywnego sygnału daje możliwość sprzedaży za wyższą kwotę, bo za 1 mln. $ (dostaje się odpowiedni certyfikat). Uzyskanie negatywnego wyniku można ukryć i sprzedać pole za 500 tys. $.

Ustal strukturę drzewa

Wpisz wypłaty i koszty

Podaj prawdopodobieństwa

Prawdopodobieństwo warunkowe Bayes Prawdopodobieństwo zdarzenia pod warunkiem innego zdarzenia Prawdopodobieństwo całkowite zdarzenia w zależności od zajścia którejś z rozłącznych możliwości Prawdopodobieństwo zajścia hipotezy pod warunkiem zajścia skutku

Paradox Monty Hall’a http://www.math.ucsd.edu/~crypto/Monty/montybg.html

Przykład z testowaniem wirusa HIV Prawdopodobieństwo, że dana osoba jest zakażona wirusem HIV w danej populacji jest 0,1% Test się myli w 1% przypadków, jeśli osoba jest zakażona (sensitivity = 99%) Test się myli w 5% przypadków, jeśli osoba jest niezakażona (specificity = 95%) Jakie jest prawdopodobieństwo, że dana osoba jest zakażona pod warunkiem, że test wskazał „positive”? Jakie jest prawdopodobieństwo, że dana osoba nie jest zakażona pod warunkiem, że test wskazał „negative”?

Probability tree flipping 0,099% 0,001% 4,995% 94,905% 0,099% 4,995% 0,001% 94,905%

Czarne złoto – prawdopodobieńśtwa Oznaczenia: hipotezy: H1 – jest ropa H2 – nie ma ropy zdarzenie A – pozytywny wynik testu Dane: P(H1)= 50% P(H2)= 50% P(A|H1)= 90% P(A|H2)= 30% P(~A|H1)= 10% P(~A|H2)= 70% Potrzebujemy: P(A)=… P(H1|A)=… P(H1|~A)=… Obliczenia: P(A) = P(A|H1)P(H1)+P(A|H2)P(H2)= =90%*50%+30%*50%=60% P(H1|A)=P(A|H1)P(H1)/P(A)= 90%*50%/60% = 75% P(H1|~A)=P(~A|H1)P(H1)/P(~A)= 10%*50%/40% = 12,5%

Prawdopodobieństwa warunkowe intuicyjnie Pr(test + | wiersz) Pr(test - | wiersz) Pr. wiersza jest ropa 90% 10% 50% nie ma 30% 70% SUMA n.a. 100% test + test - SUMA jest ropa 45% 5% 50% nie ma 15% 35% 60% 40% 100% test + test - SUMA Pr(jest ropa | kolumna) 75% 12,5% n.a. Pr(nie ma | kolumna) 25% 87,5% Pr. kolumny 60% 40% 100%

Podaj prawdopodobieństwa

Rozwiąż metodą indukcji wstecznej

Podsumowanie rozwiązania Optymalny wariant przewiduje prowadzenie badań i sprzedaż pola dla negatywnego wyniku oraz budowanie instalacji dla pozytywnego Oczekiwany zysk dla optymalnego wariantu wynosi 1,075 mln $ Druga najlepsza opcja to natychmiastowe budowanie instalacji – oczekiwany zysk jest wówczas równy 1 mln $

Narzędzia Darmowe (do celów niekomercyjnych): InsightTree: http://www.visionarytools.com/License.htm Płatne, wiele funkcji, dostępna wersja testowa: TreeAge: http://www.treeage.com/

Podsumowanie Drzewo decyzyjne jako model sekwencyjnego problemu decyzyjnego (to nie to samo co drzewo klasyfikacyjne z data miningu!) Drzewo decyzyjne ułatwia strukturyzację modelu, ale wciąż występują pułapki (jak zawsze) – trzeba zachować perspektywę decydenta Parametryzacja często wymaga metod bayesowskich Do rozwiązywania można podejść globalnie (wypisanie wariantów) albo rekurencyjnie (indukcja wsteczna) – w ramach modelu i ograniczeń stosowanych dzisiaj podejścia te są równoważne