Mikołaj Czajkowski Wiktor Budziński

Slides:



Advertisements
Podobne prezentacje
Regresja i korelacja materiały dydaktyczne.
Advertisements

ESTYMACJA PRZEDZIAŁOWA
Statystyka Wojciech Jawień
Analiza współzależności zjawisk
Zmienne losowe i ich rozkłady
Skale pomiarowe – BARDZO WAŻNE
BUDOWA MODELU EKONOMETRYCZNEGO
Modele logitowe i probitowe
Metody ekonometryczne
Metody ekonometryczne
Statystyka w doświadczalnictwie
Uogólniony model liniowy
Analiza korelacji.
Wykład 14 Liniowa regresja
Wykład 3 Wzór Bayesa – wpływ rozkładu a priori.
Wykład 3 Wzór Bayesa, cd.: Wpływ rozkładu a priori.
Prognozowanie na podstawie modelu ekonometrycznego
Wprowadzenie do statystycznej analizy danych (SPSS)
Wykład 4. Rozkłady teoretyczne
Metody Symulacyjne w Telekomunikacji (MEST) Wykład 4: Generowanie zdarzeń  Dr inż. Halina Tarasiuk p. 337, tnt.tele.pw.edu.pl.
Hipotezy statystyczne
Testowanie hipotez statystycznych
Analiza współzależności cech statystycznych
Elementy Rachunku Prawdopodobieństwa i Statystyki
i jak odczytywać prognozę?
Ekonometria. Co wynika z podejścia stochastycznego?
Mikroekonomia A.14 Maciej Wilamowski.
Irena Woroniecka EKONOMIA MENEDŻERSKA - dodatek do W2
Modelowanie ekonometryczne
Statystyka – zadania 4 Janusz Górczyński.
Prognozowanie (finanse 2011)
Szereg czasowy – czy trend jest liniowy?
Finanse 2009/2010 dr Grzegorz Szafrański pokój B106 Termin konsultacji poniedziałek:
Elementy Rachunku Prawdopodobieństwa i Statystyki
Kilka wybranych uzupelnień
Planowanie badań i analiza wyników
Modelowanie zmiennej licznikowej
Ekonometryczne modele nieliniowe
Regresja wieloraka.
Testowanie hipotez statystycznych
Dopasowanie rozkładów
Ekonometria stosowana
Metody Matematyczne w Inżynierii Chemicznej Podstawy obliczeń statystycznych.
D. Ciołek EKONOMETRIA – wykład 2
Analiza regresji wielokrotnej c.d.
Rozkład wariancji z próby (rozkład  2 ) Pobieramy próbę x 1,x 2,...,x n z rozkładu normalnego o a=0 i  =1. Dystrybuanta rozkładu zmiennej x 2 =x 1 2.
Weryfikacja hipotez statystycznych
Przenoszenie błędów (rachunek błędów) Niech x=(x 1,x 2,...,x n ) będzie n-wymiarową zmienną losową złożoną z niezależnych składników o rozkładach normalnych.
Modele zmienności aktywów Model multiplikatywny Parametry siatki dwumianowej.
MODELOWANIE ZMIENNOŚCI CEN AKCJI
Podstawowe pojęcia i terminy stosowane w statystyce. Rozkłady częstości Seminarium 2.
Statystyczne parametry akcji Średnie Miary rozproszenia Miary współzależności.
Statystyczna analiza danych w praktyce
Statystyczna analiza danych
Treść dzisiejszego wykładu l Weryfikacja statystyczna modelu ekonometrycznego –błędy szacunku parametrów, –istotność zmiennych objaśniających, –autokorelacja,
STATYSTYKA – kurs podstawowy wykład 8 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Modele nieliniowe sprowadzane do liniowych
STATYSTYKA – kurs podstawowy wykład 11
Treść dzisiejszego wykładu l Metoda Najmniejszych Kwadratów (MNK) l Współczynnik determinacji l Koincydencja l Kataliza l Współliniowość zmiennych.
Wstęp do regresji logistycznej
Mikołaj Czajkowski Wiktor Budziński
Model Poissona w ujęciu bayesowskim
Mikołaj Czajkowski Wiktor Budziński
Regresja wieloraka – służy do ilościowego ujęcia związków między wieloma zmiennymi niezależnymi (objaśniającymi) a zmienną zależną (objaśnianą) Regresja.
Regresja wieloraka – bada wpływ wielu zmiennych objaśniających (niezależnych) na jedną zmienną objaśnianą (zależą)
Jednorównaniowy model regresji liniowej
Model ekonometryczny z dwiema zmiennymi
PODSTAWY STATYSTYKI Wykład udostępniony przez dr hab. Jana Gajewskiego
Analiza współzależności zjawisk
Korelacja i regresja liniowa
Zapis prezentacji:

Mikołaj Czajkowski Wiktor Budziński Mikroekonometria 11 Mikołaj Czajkowski Wiktor Budziński

Wybór uporządkowany Wybór uporządkowany (ang. ordered choice) Wybór jednej z wielkości na podanej skali Skala – wartości są uporządkowane Przykłady: Oceny konsumenckie produktów (IMDB, Amazon, etc.) Ratingi (S&P, Moody’s) Dane ankietowe (satysfakcja z życia, stan zdrowia, etc.) Skala Likerta Nieco inaczej niż wielomianowy wybór dyskretny N14.4 dodać N14.5 N14.6

Wybór uporządkowany Model funkcji wskaźnikowej / użyteczności losowej X – charakterystyki konsumenta Zwykle – liniowa specyfikacja funkcji  – składnik losowy, nieobserwowalne indywidualne idiosynkratyczności Rozkład normalny – uporządkowany probit Rozkład logistyczny – uporządkowany logit Obserwujemy J różnych ocen Interesuje nas estymacja  oraz J-1 progów, które kategoryzują (cenzurują) y* na y

Wybór uporządkowany Obserwujemy Jeśli w modelu (X) jest stała, to tak jakby 1 = 0 (normalizacja)

Wybór uporządkowany Model jest nieliniowy … … ponieważ F (dystrybuanta rozkładu normalnego, logistycznego, … ) jest funkcją nieliniową Prawdopodobieństwa muszą być dodatnie, więc:

Wybór uporządkowany – funkcja ML Z prawdopodobieństw – funkcja największej wiarygodności Suma logarytmów prawdopodobieństw wybranych wartości I dalej estymacja normalnie

Zadanie 1. Analiza odpowiedzi na pytania światopoglądowe dotyczące Morza Bałtyckiego Ahtiainen et al. (2013) – badanie reprezentatywnej próby mieszkańców 9 krajów nadbałtyckich (n = 9627) Wśród pytań – pytania światopoglądowe, m.in.: Martwi mnie stan środowiska Morza Bałtyckiego Ja także wpływam na stan środowiska Morza Bałtyckiego Skala odpowiedzi: 1 – zdecydowanie się nie zgadzam 2 – raczej się nie zgadzam 3 – trudno powiedzieć 4 – raczej się zgadzam 5 – zdecydowanie się zgadzam

Zadanie 1. Analiza odpowiedzi na pytania światopoglądowe dotyczące Morza Bałtyckiego Wykorzystaj zbiór me.baltic.dta do przeanalizowania, jakie charakterystyki respondentów pozwalają wyjaśnić ich odpowiedzi na pytanie o to czy stan środowiska Bałtyku ich martwi (envw) Zinterpretuj wyniki jakościowo Zinterpretuj wyniki ilościowo Interpretacja wyników

Liczność zdarzeń Liczność zdarzeń (ang. count data) Zmienna objaśniana przyjmuje wartości całkowite (0,1,2,…) Liczby mają bezpośrednią interpretację Przykłady: liczba wizyt u lekarza, w parku narodowym, na basenie, liczba zachorowań w danym okresie / na jednostce powierzchni, liczba aresztowań, zabójstw, dzieci, liczba wadliwych sztuk w procesie produkcyjnym, …

Regresja Poissona Potrzebna metoda, która uwzględni charakter zmiennej zależnej Regresja Poissona Zmienna zależna yi traktowana jak zmienna losowa o rozkładzie Poissona Oczekiwana liczba zdarzeń w okresie Silne założenie modelu: średnia = wariancji rozkładu – wrócimy do tego Log-liniowa specyfikacja lambdy

Regresja Poissona – estymacja Model Poissona można estymować za pomocą regresji nieliniowej, ale prościej za pomocą metody ML Funkcja LL – suma logarytmów prawdopodobieństw zaobserwowanych ilości Gradient Hesjan Hesjan ujemnie określony dla wszystkich  i X Optymalizacja metodą Newtona Wzór bierze się z logarytmów prawdopodobieństw Jest pięknie – is bjutiful

Zadanie 2. Liczba podróży nad Morze Bałtyckie Ahtiainen et al. (2013) – badanie reprezentatywnej próby mieszkańców 9 krajów nadbałtyckich (n = 9627) Pytania dotyczące liczby podróży nad Morze Bałtyckie w ciągu ostatnich 12 miesięcy i szczegółów ostatniej podróży Dystans, środek transportu, czas, … Wykorzystaj zbiór me.baltic.dta do przeprowadzenia regresji Poissona liczby wizyt nad morze (TRIPS), wyjaśniając je stałą specyficzną dla kraju i kosztem podróży (TC_km) Zinterpretuj wyniki Wykini – analiza outputu

Nadwyżka konsumenta Oczekiwana liczba podróży jest funkcją m.in. kosztu podróży Funkcja popytu Parametr przy koszcie jest ujemny, więc funkcja ma taki kształt:

Nadwyżka konsumenta Funkcja popytu dana przez Nadwyżka konsumenta to: Nadwyżka konsumenta na jedną wizytę jest więc dana przez: Minus odwrotność parametru przy koszcie podróży! Oszacuj nadwyżkę konsumenta biorąc pod uwagę także koszt alternatywny czasu podróży (TC_time) Opis zmiennych

Regresja Poissa – ekwidyspersja Jednym z założeń modelu – ekwidyspersja Średnia = wariancja rozkładu To założenie może w praktyce nie być spełnione Test nadmiernej dyspersji: Prosta regresja liniowa zi na wi Gdzie: – średnia przewidywana przez model Sprawdzamy istotność współczynnika w regresji bez stałej Sprawdź czy regresja Poissona jest w naszym przypadku uzasadniona T-test.

Model ujemny dwumianowy Model ujemny dwumianowy – rozszerzenie modelu Poissona, poprzez wprowadzenie nieobserwowalnej heterogeniczności do średniej yi (pod warunkiem xi i ui) ma rozkład Poissona z warunkową średnią i wariancją i Bezwarunkowy rozkład

Model ujemny dwumianowy Funkcja gęstości ui determinuje bezwarunkowy rozkład yi Wygodnie założyć rozkład gamma, Wtedy bezwarunkowy rozkład yi dany jest przez Czyli istnieje formuła zamknięta dla tej całki – to dlatego jest ‘wygodnie’

Model ujemny dwumianowy Warunkowa średnia Warunkowa wariancja Uwagi: Ekwidyspersję można przetestować ex post jako Możliwe inne specyfikacje ui – np. rozkład normalny Model ujemny dwumianowy można interpretować jako model Poissona z heterogenicznością (o rozkładzie gamma) Jeśli przyjmiemy, że populacja ma rozkład ujemny dwumianowy to na to nakładamy jeszcze normalną heterogeniczność Można się spodziewać problemów, ale czasem działa.

Zadanie 2. Liczba podróży nad Morze Bałtyckie Skonstruuj model regresji ujemnej dwumianowej Czy restrykcja jest uzasadniona? Czy zmieniły się oszacowania CS?

Model ujemny dwumianowy – overdyspersja Jednym z możliwych rozszerzeń modelu – modelowanie overdyspersji Heterogeniczność średniej i wariancji zawsze ważna dla danych mikroekonomicznych Parametr dyspersji  wyłapuje ogólne skalowanie rozkładu (średnia vs. wariancja) Ogólnie wariancja to Zróbmy więc Teraz  (a więc ogólniej – wariancja) funkcją obserwowalnych zmiennych charakteryzujących respondentów Z Skonstruuj model regresji ujemnej dwumianowej z różnym poziomem overdyspersji dla różnych krajów

Zero inflated models Częstym problemem jest duża liczba obserwacji przyjmująca wartość 0 Znane rozkłady, takie jak Poisson czy ujemny dwumianowy, nie są w stanie tego dobrze modelować Możliwym rozwiązaniem są tzw. Zero Inflated Models Zakładają, że mamy dwa typy respondentów Uczestników rynku Nie uczestników rynku, np. niezależnie od ceny i tak nie pojadą nad Bałtyk

Zero inflated models 0 w danych może się więc pojawić z dwóch powodów Ktoś jest uczestnikiem rynku, ale tak się zdarzyło, że w ostatnim roku nie pojechał ani razu Ktoś nie jest uczestnikiem rynku, więc pojechał 0 razy Prawdopodobieństwo pojechania k razy będzie wtedy dane przez Gdzie to p-stwo bycia poza rynkiem, zazwyczaj modelowane binarnym logitem albo probitem to p-stwo zaobserwowania danej liczby zdarzeń, np. z modelu Poissona albo Ujemnego dwumianowego

Zero inflated models Dokonaj estymacji modelu Zero Inflated Negative Binomial Porównaj dopasowanie do danych ze wcześniejszymi modelami

Praca domowa ME.11 (grupy 2 lub 3-osobowe) Wykorzystaj projekt me.baltic.dta do przeanalizowania, jakie charakterystyki respondentów pozwalają wyjaśnić ich ocenę własnego wpływu na środowisko Bałtyku (ienv) Wybierz najlepszą, Twoim zdaniem, specyfikację Zinterpretuj wyniki używając interpretacji jakościowej oraz ilościowej (wykorzystując efekty krańcowe) Wykorzystując projekt me.usahealth.dta skonstruuj model liczności zdarzeń objaśniający liczbę wizyt u lekarza (mdu) Wybierz najlepszą, Twoim zdaniem, postać funkcyjną i specyfikację Uwzględnij zmienne socjodemograficzne, wskaźniki stanu zdrowia oraz udział własny w kosztach opieki medycznej 2017-05-03 20:37:06