Model Poissona w ujęciu bayesowskim Prezentacja na Ekonometrię Bayesowską semestr zimowy 2016/2017 Mikołaj Tchorzewski 53900
Plan Prezentacji Rozkład Poissona Klasyczny model regresji Poissona Podejście Bayesowskie – model Poissona Funkcja MCMCpoisson z pakietu MCMCpack Przykład estymacji w R Podsumowanie
Rozkład Poissona Zmienna losowa Y jest opisana rozkładem Poissona z parametrem μ, jeśli: przyjmuje nieujemne wartości całkowite y=0,1,2,…. z prawdopodobieństwem Średnia i wariancja rozkładu mogą być zapisana wzorem
Rozkład Poissona Jeśli E(Y)=var(Y)… Każdy czynnik mający wpływ na zmianę wartości średniej ma wpływ na wartość wariancji i vice versa Im większa wartość μ, tym bardziej dominanta oddala się od 0 i dystrybuanta rozkładu przypomina dystrybuantę rozkładu normalnego
Rozkład Poissona Zdarzenie będące przedmiotem badania występuje losowo w taki sposób, że: Prawdopodobieństwo wystąpienia co najmniej jednego zdarzenia w danym przedziale czasowym jest proporcjonalne do długości przedziału Prawdopodobieństwo wystąpienia dwóch i więcej zdarzeń w bardzo małym przedziale czasowym jest bardzo niskie Liczba wystąpień zdarzenia w sąsiadujących przedziałach czasowych jest wzajemnie niezależna Przykład: Feller (1957) Zaobserwowane liczby uderzeń zbliżone do rozkładu Poissona z μ=0,93
Klasyczny model regresji Poissona Próba n obserwacji y1, y2….,yn traktowana jako próba niezależnych zmiennych losowych Poissona z rozkładem Stosujemy logarytm, ponieważ μ>0. Parametr jest log-liniową funkcją zmiennych objaśniających. Estymacja modelu odbywa się MNW. Funkcja wiarygodności n niezależnych obserwacji Poissona wynika ze wzoru Jej logarytm po przekształceniu to
Podejście bayesowskie – model Poissona Dla jednoelementowej próby losowej z rozkładem Poissona, funkcja wiarygodności ma postać Z dokładnością do normalizującej stałej Dla n-elementowej próby losowej y1,…yn pobranej z rozkładu Poissona otrzymujemy Ostatnie wyrażenie przypomina rozkład gamma z parametrami kształtu k’ i skali s’
Podejście bayesowskie – model Poissona F.gęstości rozkładu gamma Zauważmy, że dla f.wiarygodności rozkładu Poissona Parametr kształtu rozkładu gamma Parametr skali rozkładu gamma s’=n Sprzężonym rozkładem a priori dla rozkładu Poissona z parametrem μ jest rozkład gamma Gdzie To funkcja gamma
Podejście bayesowskie – model Poissona Dla jednoelementowej próby losowej pobranej z rozkładu Poissona otrzymujemy z dokładnością do normalizującej stałej rozkład a posteriori: Dla n-elementowej próby losowej y1,y2,…,yn pobranej z rozkładu Poissona otrzymujemy rozkład z parametrami oraz s’=s+n gdzie k’=k+y oraz s’=s+1
Podejście bayesowskie – model Poissona Dla zmiennej losowej yi, i=1,2,…,n o rozkładzie Poissona z parametrem μi Obliczamy funkcję wiarygodności danych y=(y1,..,yn) oraz wektora B Wyliczamy łączną gęstość a priori dla niezależnych parametrów B1,..,Bk Następnie wyznaczamy rozkład a posteriori xij – zmienne objaśniające B=(B1,..,Bk) – wektor nieznanych parametrów
Podejście bayesowskie – model Poissona Dla parametrów regresji modeli typu GLM zazwyczaj ustala się rozkłady normalne a priori ze średnią 0 i pewną wariancją Dla rozkładów mało informacyjnych dla średniej przyjmujemy 0 a dla wariancji pewną dużą liczbę Dla niezależnych B1,…,Bk przyjmujemy rozkłady normalne a priori ze średnią i wariancją Wnioskowanie o dowolnym elemencie wektora B odbywa się z brzegowego rozkładu a posteriori Do estymacji modeli wykorzystuje się metodę Monte Carlo opartą na łańcuchach Markowa
Funkcja MCMCpoisson z pakietu MCMCpack Funkcja dostępna w pakiecie MCMCpack Funkcja generuje próbkę z rozkładu a posteriori modelu regresji Poissona przy użyciu algorytmu Metropolisa Algorytm ten służy do generacji liczb losowych zgodnych z zadanym rozkładem Idea algorytmu opiera się na błądzeniu losowym Funkcja generuje próbkę w postaci obiektu mcmc. Do jego analizy można użyć pakietu Coda
Funkcja MCMCpoisson z pakietu MCMCpack Seed – ziarno dla generatora liczb losowych. Dla „NA” używany jest seed=12345 Beta.start – wartość początkowa wektora Beta. Skalar lub wektor kolumnowy. Jeśli skalar to wartość służy jako wartość początkowa wszystkich Bet. „NA” używa Bety oszacowanej MNW jako wartość początkowa b0 – parametr a priori średniej dla Bety. Skalar lub wektor kolumnowy. Jeśli skalar to wartość służy jako wartość początkowa wszystkich Bet. B0 – precyzja a priori dla Bety. Domyślne 0 oznacza skrajnie nieinformacyjny rozkład a priori wektora Beta Marginal.likelihood – „none” – krańcowa wiarygodność nie będzie obliczona. „Laplace” stosuje aproksymację Laplace’a Formula – równanie modelu Data – dane Burnin – numer obciętych iteracji w próbce Mcmc – liczba iteracji algorytmu Metropolis w próbce Thin – wskazuje, co która obserwacja używana w symulacji. Mcmc/thin musi dać liczbę całkowitą Tune – Parametr Metropolisa. Dodatni skalar lub k- wektor, gdzie k to długość wektora Bet. Należy się upewnić, że wskaźnik akceptacji Metropolisa w przedziale <0,2;0,5> przed wnioskowaniem Verbose – jeśli większe niż 0 to, numer iteracji współczynnik akceptacji Metropolisa oraz obecny wektor Bet są printowane dla każdej iteracji
Przykłady zastosowania w R Dane w pliku help.csv pochodzące ze strony http://www.math.smith.edu/r/ Jest to strona zawierająca zbiory danych z książki „Using R for Data Management, Statistical Analysis, and Graphics” autorstwa Nicholas J. Horton and Ken Kleinman Przykład 2 pochodzi z http://cse.ffpri.affrc.go.jp/hiroki/stat/example1.R
DZIĘKUJĘ ZA UWAGĘ!
Bibliografia Frątczak E., Zaawansowane metody analiz statystycznych red. Ewa Frątczak, Oficyna Wydawnicza SGH 2013,Warszawa P.Allison, Logistic Regression Using SAS, Theory and Application, SAS Institue Inc.2012, Cary http://ramlegacy.marinebiodiversity.ca/courses/church-of-bayes/notes/week3-notes.pdf http://ebooks.narotama.ac.id/files/Econometric%20Analysis%20of%20Count%20Data%20(5nd%20Edition)/Chapt er%208%20Bayesian%20Analysis%20of%20Count%20Data.pdf Grzenda W., Analiza płodności kobiet w Polsce z wykorzystaniem bayesowskiego modelu regresji Poissona, Przegląd Statystyczny 2012 Poisson Model for Count Data, http://data.princeton.edu/wws509/notes/c4.pdf https://cran.r-project.org/web/packages/MCMCpack/index.html Zbiór danych do Przykładu 1 - http://www.math.smith.edu/r/ Przykład II - http://cse.ffpri.affrc.go.jp/hiroki/stat/example1.R