Model Poissona w ujęciu bayesowskim

Slides:



Advertisements
Podobne prezentacje
Regresja i korelacja materiały dydaktyczne.
Advertisements

Badania statystyczne Wykłady 1-2 © Leszek Smolarek.
ESTYMACJA PRZEDZIAŁOWA
Statystyka Wojciech Jawień
Zmienne losowe i ich rozkłady
Zmienne losowe i ich rozkłady
BUDOWA MODELU EKONOMETRYCZNEGO
Estymacja przedziałowa
Wnioskowanie Bayesowskie
Metody wnioskowania na podstawie podprób
Symulacja zysku Sprzedaż pocztówek.
Model ciągły wyceny opcji Blacka – Scholesa - Mertona
Statystyka w doświadczalnictwie
Podstawowe pojęcia prognozowania i symulacji na podstawie modeli ekonometrycznych Przewidywaniem nazywać będziemy wnioskowanie o zdarzeniach nieznanych.
Uogólniony model liniowy
Analiza korelacji.
Numeryczne obliczanie całki oznaczonej
Wykład 6 Standardowy błąd średniej a odchylenie standardowe z próby
Wykład 4 Przedziały ufności
Metody Przetwarzania Danych Meteorologicznych Wykład 4
Pobieranie próby Populacja generalna: zbiór wyników wszystkich możliwych doświadczeń określonego typu. Próba n-wymiarowa: zbiór n wyników doświadczeń.
Modele (hipotezy) zagnieżdżone
Wykład 6 Metody Monte Carlo
Linear Methods of Classification
Wykład 4. Rozkłady teoretyczne
Metody Symulacyjne w Telekomunikacji (MEST) Wykład 4: Generowanie zdarzeń  Dr inż. Halina Tarasiuk p. 337, tnt.tele.pw.edu.pl.
Metody Symulacyjne w Telekomunikacji (MEST) Wykład 6/7: Analiza statystyczna wyników symulacyjnych  Dr inż. Halina Tarasiuk
Średnie i miary zmienności
Co to są rozkłady normalne?
Jednoczynnikowa analiza wariancji (ANOVA)
Hipotezy statystyczne
Konstrukcja, estymacja parametrów
dr hab. Ryszard Walkowiak prof. nadzw.
Elementy Rachunku Prawdopodobieństwa i Statystyki
i jak odczytywać prognozę?
Ekonometria. Co wynika z podejścia stochastycznego?
na podstawie materiału – test z użyciem komputerowo generowanych prób
1 Kilka wybranych uzupełnień do zagadnień regresji Janusz Górczyński.
Ekonometryczne modele nieliniowe
Regresja wieloraka.
Co to jest dystrybuanta?
Przedmiot: Ekonometria Temat: Szeregi czasowe. Dekompozycja szeregów
Dopasowanie rozkładów
Ekonometryczne modele nieliniowe
Wnioskowanie statystyczne
Ekonometria stosowana
Metody Matematyczne w Inżynierii Chemicznej Podstawy obliczeń statystycznych.
Program przedmiotu “Opracowywanie danych w chemii” 1.Wprowadzenie: przegląd rodzajów danych oraz metod ich opracowywania. 2.Podstawowe pojęcia rachunku.
Rozkład wariancji z próby (rozkład  2 ) Pobieramy próbę x 1,x 2,...,x n z rozkładu normalnego o a=0 i  =1. Dystrybuanta rozkładu zmiennej x 2 =x 1 2.
Przenoszenie błędów (rachunek błędów) Niech x=(x 1,x 2,...,x n ) będzie n-wymiarową zmienną losową złożoną z niezależnych składników o rozkładach normalnych.
Ekonometria Metody estymacji parametrów strukturalnych modelu i ich interpretacja dr hab. Mieczysław Kowerski.
Podstawowe pojęcia i terminy stosowane w statystyce. Rozkłady częstości Seminarium 2.
Statystyczna analiza danych w praktyce
Statystyczna analiza danych
Statystyczna analiza danych
Monte Carlo, bootstrap, jacknife. 2 Literatura Bruce Hansen (2012 +) Econometrics, ze strony internetowej :
Rozkłady statystyk z próby dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium.
Ekonometria stosowana Heteroskedastyczność składnika losowego Piotr Ciżkowicz Katedra Międzynarodowych Studiów Porównawczych.
STATYSTYKA – kurs podstawowy wykład 8 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Modele nieliniowe sprowadzane do liniowych
STATYSTYKA – kurs podstawowy wykład 11
Estymacja parametryczna dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium Analiz.
Wstęp do regresji logistycznej
Rozkład z próby Jacek Szanduła.
Statystyka matematyczna
Statystyka matematyczna
Jednorównaniowy model regresji liniowej
Analiza niepewności pomiarów Zagadnienia statystyki matematycznej
Model ekonometryczny z dwiema zmiennymi
Monte Carlo, bootstrap, jacknife
Zapis prezentacji:

Model Poissona w ujęciu bayesowskim Prezentacja na Ekonometrię Bayesowską semestr zimowy 2016/2017 Mikołaj Tchorzewski 53900

Plan Prezentacji Rozkład Poissona Klasyczny model regresji Poissona Podejście Bayesowskie – model Poissona Funkcja MCMCpoisson z pakietu MCMCpack Przykład estymacji w R Podsumowanie

Rozkład Poissona Zmienna losowa Y jest opisana rozkładem Poissona z parametrem μ, jeśli: przyjmuje nieujemne wartości całkowite y=0,1,2,…. z prawdopodobieństwem Średnia i wariancja rozkładu mogą być zapisana wzorem

Rozkład Poissona Jeśli E(Y)=var(Y)… Każdy czynnik mający wpływ na zmianę wartości średniej ma wpływ na wartość wariancji i vice versa Im większa wartość μ, tym bardziej dominanta oddala się od 0 i dystrybuanta rozkładu przypomina dystrybuantę rozkładu normalnego

Rozkład Poissona Zdarzenie będące przedmiotem badania występuje losowo w taki sposób, że: Prawdopodobieństwo wystąpienia co najmniej jednego zdarzenia w danym przedziale czasowym jest proporcjonalne do długości przedziału Prawdopodobieństwo wystąpienia dwóch i więcej zdarzeń w bardzo małym przedziale czasowym jest bardzo niskie Liczba wystąpień zdarzenia w sąsiadujących przedziałach czasowych jest wzajemnie niezależna Przykład: Feller (1957) Zaobserwowane liczby uderzeń zbliżone do rozkładu Poissona z μ=0,93

Klasyczny model regresji Poissona Próba n obserwacji y1, y2….,yn traktowana jako próba niezależnych zmiennych losowych Poissona z rozkładem Stosujemy logarytm, ponieważ μ>0. Parametr jest log-liniową funkcją zmiennych objaśniających. Estymacja modelu odbywa się MNW. Funkcja wiarygodności n niezależnych obserwacji Poissona wynika ze wzoru Jej logarytm po przekształceniu to

Podejście bayesowskie – model Poissona Dla jednoelementowej próby losowej z rozkładem Poissona, funkcja wiarygodności ma postać Z dokładnością do normalizującej stałej Dla n-elementowej próby losowej y1,…yn pobranej z rozkładu Poissona otrzymujemy Ostatnie wyrażenie przypomina rozkład gamma z parametrami kształtu k’ i skali s’

Podejście bayesowskie – model Poissona F.gęstości rozkładu gamma Zauważmy, że dla f.wiarygodności rozkładu Poissona Parametr kształtu rozkładu gamma Parametr skali rozkładu gamma s’=n Sprzężonym rozkładem a priori dla rozkładu Poissona z parametrem μ jest rozkład gamma Gdzie To funkcja gamma

Podejście bayesowskie – model Poissona Dla jednoelementowej próby losowej pobranej z rozkładu Poissona otrzymujemy z dokładnością do normalizującej stałej rozkład a posteriori: Dla n-elementowej próby losowej y1,y2,…,yn pobranej z rozkładu Poissona otrzymujemy rozkład z parametrami oraz s’=s+n gdzie k’=k+y oraz s’=s+1

Podejście bayesowskie – model Poissona Dla zmiennej losowej yi, i=1,2,…,n o rozkładzie Poissona z parametrem μi Obliczamy funkcję wiarygodności danych y=(y1,..,yn) oraz wektora B Wyliczamy łączną gęstość a priori dla niezależnych parametrów B1,..,Bk Następnie wyznaczamy rozkład a posteriori xij – zmienne objaśniające B=(B1,..,Bk) – wektor nieznanych parametrów

Podejście bayesowskie – model Poissona Dla parametrów regresji modeli typu GLM zazwyczaj ustala się rozkłady normalne a priori ze średnią 0 i pewną wariancją Dla rozkładów mało informacyjnych dla średniej przyjmujemy 0 a dla wariancji pewną dużą liczbę Dla niezależnych B1,…,Bk przyjmujemy rozkłady normalne a priori ze średnią i wariancją Wnioskowanie o dowolnym elemencie wektora B odbywa się z brzegowego rozkładu a posteriori Do estymacji modeli wykorzystuje się metodę Monte Carlo opartą na łańcuchach Markowa

Funkcja MCMCpoisson z pakietu MCMCpack Funkcja dostępna w pakiecie MCMCpack Funkcja generuje próbkę z rozkładu a posteriori modelu regresji Poissona przy użyciu algorytmu Metropolisa Algorytm ten służy do generacji liczb losowych zgodnych z zadanym rozkładem Idea algorytmu opiera się na błądzeniu losowym Funkcja generuje próbkę w postaci obiektu mcmc. Do jego analizy można użyć pakietu Coda

Funkcja MCMCpoisson z pakietu MCMCpack Seed – ziarno dla generatora liczb losowych. Dla „NA” używany jest seed=12345 Beta.start – wartość początkowa wektora Beta. Skalar lub wektor kolumnowy. Jeśli skalar to wartość służy jako wartość początkowa wszystkich Bet. „NA” używa Bety oszacowanej MNW jako wartość początkowa b0 – parametr a priori średniej dla Bety. Skalar lub wektor kolumnowy. Jeśli skalar to wartość służy jako wartość początkowa wszystkich Bet. B0 – precyzja a priori dla Bety. Domyślne 0 oznacza skrajnie nieinformacyjny rozkład a priori wektora Beta Marginal.likelihood – „none” – krańcowa wiarygodność nie będzie obliczona. „Laplace” stosuje aproksymację Laplace’a Formula – równanie modelu Data – dane Burnin – numer obciętych iteracji w próbce Mcmc – liczba iteracji algorytmu Metropolis w próbce Thin – wskazuje, co która obserwacja używana w symulacji. Mcmc/thin musi dać liczbę całkowitą Tune – Parametr Metropolisa. Dodatni skalar lub k- wektor, gdzie k to długość wektora Bet. Należy się upewnić, że wskaźnik akceptacji Metropolisa w przedziale <0,2;0,5> przed wnioskowaniem Verbose – jeśli większe niż 0 to, numer iteracji współczynnik akceptacji Metropolisa oraz obecny wektor Bet są printowane dla każdej iteracji

Przykłady zastosowania w R Dane w pliku help.csv pochodzące ze strony http://www.math.smith.edu/r/ Jest to strona zawierająca zbiory danych z książki „Using R for Data Management, Statistical Analysis, and Graphics” autorstwa Nicholas J. Horton and Ken Kleinman Przykład 2 pochodzi z http://cse.ffpri.affrc.go.jp/hiroki/stat/example1.R

DZIĘKUJĘ ZA UWAGĘ!

Bibliografia Frątczak E., Zaawansowane metody analiz statystycznych red. Ewa Frątczak, Oficyna Wydawnicza SGH 2013,Warszawa P.Allison, Logistic Regression Using SAS, Theory and Application, SAS Institue Inc.2012, Cary http://ramlegacy.marinebiodiversity.ca/courses/church-of-bayes/notes/week3-notes.pdf http://ebooks.narotama.ac.id/files/Econometric%20Analysis%20of%20Count%20Data%20(5nd%20Edition)/Chapt er%208%20Bayesian%20Analysis%20of%20Count%20Data.pdf Grzenda W., Analiza płodności kobiet w Polsce z wykorzystaniem bayesowskiego modelu regresji Poissona, Przegląd Statystyczny 2012 Poisson Model for Count Data, http://data.princeton.edu/wws509/notes/c4.pdf https://cran.r-project.org/web/packages/MCMCpack/index.html Zbiór danych do Przykładu 1 - http://www.math.smith.edu/r/ Przykład II - http://cse.ffpri.affrc.go.jp/hiroki/stat/example1.R