Wykład - Badania panelowe.

Slides:



Advertisements
Podobne prezentacje
Regresja i korelacja materiały dydaktyczne.
Advertisements

Modele oparte o dane przekrojowo-czasowe
Analiza współzależności zjawisk
Jednorównaniowe modele zmienności
Metody ekonometryczne
Analiza wariancji jednoczynnikowa
BUDOWA MODELU EKONOMETRYCZNEGO
Metody ekonometryczne
Metody ekonometryczne
Metody ekonometryczne
Prognozowanie na podstawie modelu ekonometrycznego
Jednoczynnikowa analiza wariancji (ANOVA)
Hipotezy statystyczne
Metoda najmniejszych kwadratów dla jednej zmiennej objaśniającej
Testowanie hipotez statystycznych
Ekonometria szeregów czasowych
i jak odczytywać prognozę?
Ekonometria. Co wynika z podejścia stochastycznego?
BADANIE STATYSTYCZNE Badanie statystyczne to proces pozyskiwania danych na temat rozkładu cechy statystycznej w populacji. Badanie może mieć charakter:
Analiza wariancji jednoczynnikowa.
Irena Woroniecka EKONOMIA MENEDŻERSKA - dodatek do W2
Prognozowanie z wykorzystaniem modeli ekonometrycznych
Modelowanie ekonometryczne
Hipotezy statystyczne
Finanse 2009/2010 dr Grzegorz Szafrański pokój B106 Termin konsultacji poniedziałek:
Elementy Rachunku Prawdopodobieństwa i Statystyki
Kilka wybranych uzupelnień
Ekonometria stosowana
Ekonometria stosowana
Ekonometryczne modele nieliniowe
Regresja wieloraka.
Seminarium licencjackie Beata Kapuścińska
Konwergencja gospodarcza
D. Ciołek Analiza szeregów przekrojowo-czasowych – wykład 0
Ekonometryczne modele nieliniowe
Wnioskowanie statystyczne
D. Ciołek EKONOMETRIA – wykład 1
D. Ciołek EKONOMETRIA – wykład 0
Ekonometria stosowana
D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3
D. Ciołek Analiza szeregów przekrojowo-czasowych – wykład 2
D. Ciołek EKONOMETRIA – wykład 5
D. Ciołek EKONOMETRIA – wykład 6
D. Ciołek EKONOMETRIA – wykład 3
D. Ciołek EKONOMETRIA – wykład 2
D. Ciołek EKONOMETRIA – wykład 4
D. Ciołek Analiza danych przekrojowo-czasowych – wykład 5
WIELORÓWNANIOWE MODELE EKONOMETRYCZNE
1 D. Ciołek Analiza danych przekrojowo-czasowych – wykład 7 Analiza danych przekrojowo-czasowych Wykład 7: Testowanie integracji dla danych panelowych.
Ekonometria Metody estymacji parametrów strukturalnych modelu i ich interpretacja dr hab. Mieczysław Kowerski.
Model ekonometryczny Jacek Szanduła.
Treść dzisiejszego wykładu l Weryfikacja statystyczna modelu ekonometrycznego –błędy szacunku parametrów, –istotność zmiennych objaśniających, –autokorelacja,
Przeprowadzenie badań niewyczerpujących, (częściowych – prowadzonych na podstawie próby losowej), nie daje podstaw do formułowania stanowczych stwierdzeń.
Testy nieparametryczne – testy zgodności. Nieparametryczne testy istotności dzielimy na trzy zasadnicze grupy: testy zgodności, testy niezależności oraz.
Ekonometria Wykład 1 Uwarunkowania modelowania ekonometrycznego. Uogólniona metoda najmniejszych kwadratów dr hab. Mieczysław Kowerski.
Treść dzisiejszego wykładu l Klasyfikacja zmiennych modelu wielorównaniowego l Klasyfikacja modeli wielorównaniowych l Postać strukturalna i zredukowana.
Ekonometria WYKŁAD 3 Piotr Ciżkowicz Katedra Międzynarodowych Studiów Porównawczych.
Ekonometria stosowana Heteroskedastyczność składnika losowego Piotr Ciżkowicz Katedra Międzynarodowych Studiów Porównawczych.
Modele nieliniowe sprowadzane do liniowych
STATYSTYKA – kurs podstawowy wykład 11
Treść dzisiejszego wykładu l Metoda Najmniejszych Kwadratów (MNK) l Współczynnik determinacji l Koincydencja l Kataliza l Współliniowość zmiennych.
Ekonometria stosowana
EKONOMETRIA W3 prof. UG, dr hab. Tadeusz W. Bołt
EKONOMETRIA Wykład 2 prof. UG, dr hab. Tadeusz W. Bołt
Statystyka matematyczna
Regresja wieloraka – bada wpływ wielu zmiennych objaśniających (niezależnych) na jedną zmienną objaśnianą (zależą)
Jednorównaniowy model regresji liniowej
MNK – podejście algebraiczne
Analiza współzależności zjawisk
Korelacja i regresja liniowa
Zapis prezentacji:

Wykład - Badania panelowe. Ekonometryczne modele panelowe dr Dorota Ciołek Katedra Ekonometrii Wydział Zarządzania UG Copyright by Dorota Ciołek

Wykład - Badania panelowe. D. Ciołek Definicja danych panelowych dane przekrojowe - yi i=1,...,N szeregi czasowe - yt t=1,...,T dane przekrojowo-czasowe - yit i=1,...,N, t=1,...,T dane panelowe longitudinal data Copyright by Dorota Ciołek

Wykład - Badania panelowe. D. Ciołek Przykłady danych panelowych Dane miesięczne o wydatkach konsumpcyjnych dla 1000 gospodarstw domowych obserwowanych przez 5 lat – analiza preferencji konsumentów, badania skuteczności kampanii reklamowej. Makroekonomiczne wskaźniki dla 25 krajów UE w ostatnich 10 lat publikowane przez Eurostat – badanie skuteczności europejskich funduszy strukturalnych. Penn World Tables skonstruowana przez Summersa i Hestona baza porównywalnych danych makroekonomicznych zawierająca informacje dla ponad 200 krajów dla lat 1960-2000 - analiza czynników wzrostu gospodarczego, weryfikacja hipotezy konwergencji gospodarczej. Copyright by Dorota Ciołek

Wykład - Badania panelowe. D. Ciołek Przykłady danych panelowych Wskaźniki zatrudnienia i wynagrodzeń w Polsce w podziale na województwa za ostatnie 15 lat – badanie skuteczność polityki makroekonomicznej, szukanie czynników determinujących zmiany na rynku pracy. Liczba inwestorów zagranicznych inwestujących w poszczególnych województwach w latach 1993-2005 – modelowanie częstotliwości występowania określonego zdarzenia – badanie atrakcyjności inwestycyjnej poszczególnych województw. Dane firmy ubezpieczeniowej o ubezpieczeniach komunikacyjnych dotyczące np. szkodowości klientów w różnych latach – możliwość wykorzystania wyników do budowy systemu Bonus-Malus. Copyright by Dorota Ciołek

Wykład - Badania panelowe. D. Ciołek Przykłady danych panelowych Informacje banków o kredytach konsumpcyjnych, hipotecznych i ich spłacalności na przestrzeni kilkunastu miesięcy lub lat – budowa modeli skoringowych – modeli wstępnej oceny ryzyka kredytowego. Informacje firmy odzieżowej o przychodach i kosztach poszczególnych sklepów w sieci w różnych miastach lub dzielnicach dla szeregu miesięcy – ocena skuteczności poszczególnych kampanii reklamowych, szczegółowa analiza indywidualnej specyfiki poszczególnych sklepów lub miast. Copyright by Dorota Ciołek

Wykład - Badania panelowe. D. Ciołek Problem dostępności danych Zbilansowane panele Niezbilansowane panele Nie jest wskazane ograniczanie badania tylko do tych jednostek, dla których znane są obserwacje we wszystkich okresach – obciążenie wynikające z nieuwzględnienia przeżywalności poszczególnych jednostek – survivorship bias. Copyright by Dorota Ciołek

Wykład - Badania panelowe. Copyright by Dorota Ciołek

Wykład - Badania panelowe. D. Ciołek Dlaczego warto stosować dane panelowe Dane panelowe pozwalają na analizę zjawiska równocześnie w czasie jak i wymiarze przekrojowym lub przestrzennym. Dane panelowe pozwalają na wyodrębnienie indywidualnej specyfiki poszczególnych obiektów. Zastosowanie paneli danych pozwala na większą heterogeniczność (większe zróżnicowania) jednostek badania. Zapewnia większą liczbę stopni swobody oraz zwiększa efektywność oszacowania. Wyodrębnienie efektów okresowych ułatwia badanie dynamiki dostosowania. Dane panelowe pozwalają na wyodrębnienie wpływu nieobserwowalnych zmiennych lub efektów. Copyright by Dorota Ciołek

Wykład - Badania panelowe. D. Ciołek Specyfika danych panelowych Obserwacje dotyczące tej samej jednostki mogą (najprawdopodobniej są ze sobą skorelowane). Obserwacje dotyczące tego samego okresu mogą (najprawdopodobniej są ze sobą skorelowane). Czasami mamy do czynienia z przypadkami, gdzie nie występuje ani jeden, ani drugi rodzaj korelacji. Copyright by Dorota Ciołek

Wykład - Badania panelowe. D. Ciołek Ogólny zapis modelu panelowego Model statyczny: gdzie: - wektor parametrów; - macierz obserwacji na zmiennych objaśniających; - efekty indywidualne, część zmienności zmiennej y charakterystyczna dla i-tej jednostki; (N efektów) - efekty okresowe, część zmienności zmiennej y charakterystyczna dla okresu t; (T efektów) - czysto losowy składnik zakłócający. i=1,...,N, t=1,...,T Copyright by Dorota Ciołek

Wykład - Badania panelowe. D. Ciołek Rodzaje modeli panelowych 1a) Jeżeli efekty indywidualne i efekty okresowe są nieistotne, oznacza to, że mamy do czynienia z tzw. homogenicznym panelem – analizowana przez nas relacja jest taka sama w każdym okresie i dla każdej badanej jednostki – Model Łącznej Regresji (ang. pooled model). 2a) Jeżeli zarówno efekty indywidualne jak i efekty okresowe są istotne, mamy do czynienia z heterogenicznym panelem – Dwukierunkowy Model Panelowy (ang. two-way model). 3a) Jeżeli tylko jedna grupa efektów jest istotna – Jednokierunkowy Model Panelowy (ang. one-way model). Copyright by Dorota Ciołek

Wykład - Badania panelowe. D. Ciołek Rodzaje modeli panelowych 1b) Efekty indywidualne i (lub) okresowe mogą być efektami ustalonymi, czyli stałymi w czasie lub dla danej jednostki, nie zależą od czynników losowych – Model z Efektami Ustalonymi – (ang. Fixed Effects Model ) - FE . 2b) Efekty indywidualne i (lub) okresowe mogą być efektami losowymi, czyli zależą od czynników losowych i mogą się zmieniać, są zmiennymi losowymi o określonych rozkładach – Model z Efektami Losowymi – (ang. Random Effects Model) – RE. Copyright by Dorota Ciołek

Wykład - Badania panelowe. D. Ciołek Pozornie Niezależne Regresje Czasem dysponując danymi panelowymi nie jesteśmy zainteresowani budową jednego modelu ekonometrycznego dla wszystkich posiadanych informacji. Szacowane są wówczas oddzielne regresje dla każdej jednostki badania, ale dla podniesienia dokładności (efektywności) oszacowania, wykorzystywana jest dodatkowa informacja wynikająca faktu, że dla wszystkich jednostek badania można określić pewną strukturę stochastyczną, - stosujemy Model Pozornie Niezależnych Regresji (ang. Seemingly Unrelated Regressions Model) – SUR, zaproponowany przez Zellnera [1962]. Copyright by Dorota Ciołek

Wykład - Badania panelowe. D. Ciołek Model Regresji Łącznej (pooled model) Założenia: 1) Mamy do czynienia z homogeniczną próbą – wszystkie jednostki badania są do siebie podobne. - Oznacza to, że parametry szacowanego modelu są jednakowe dla wszystkich jednostek oraz we wszystkich okresach badania. 2) Różnice między empirycznymi wartościami zmiennej endogenicznej, a wartościami teoretycznymi są jedynie efektem działania zakłóceń losowych o tym samym rozkładzie dla każdej i-tej jednostki i dla każdego okresu t. Wybór takiego modelu może być poprzedzony odpowiednim testowaniem (testing poolability of the data). Copyright by Dorota Ciołek

Wykład - Badania panelowe. D. Ciołek Model Regresji Łącznej (pooled model) Model możemy zapisać jako: gdzie: N- liczba jednostek w próbie, T – liczba okresów, k – liczba zmiennych objaśniających w modelu. Metody estymacji: MNK lub UMNK w przypadku niesferycznego składnika losowego. Copyright by Dorota Ciołek

Wykład - Badania panelowe. D. Ciołek Model z Efektami Ustalonymi (FE) Jednokierunkowy (one-way) Model możemy zapisać: jest wektorem parametrów. Zapis macierzowy: Copyright by Dorota Ciołek

Wykład - Badania panelowe. D. Ciołek Model z Efektami Ustalonymi (FE) Założenia (do estymacji): 1) oraz są niezależne dla i=1,...,N - zmienne tworzące macierz X są ściśle egzogeniczne, czyli 2) 3) , i=1,...,N, j=1,...,N, gdzie I jest macierzą jednostkową, 4) rz(X) = N + K ≤ NT. Copyright by Dorota Ciołek

Wykład - Badania panelowe. D. Ciołek Model z Efektami Ustalonymi (FE) Wprowadzamy N zmiennych zerojedynkowych - każda zmienna przyjmuje wartość 1 dla danej jednostki i 0 dla pozostałych jednostek. Szacowanie: MNK (LSDV – LS with dummy variables) Estymator Wewnątrzgrupowy (Within) Copyright by Dorota Ciołek

Wykład - Badania panelowe. D. Ciołek Model z Efektami Losowymi (RE) Jednokierunkowy (one-way) Ogólna postać modelu: gdzie: jest dwuczęściowym składnikiem losowym. Dodatkowe założenia: 1) E(αi)=0, i=1,...,N 2) Efekty indywidualne αi są niezależne od ui oraz Xi dla i=1,...,N 3) Efekty indywidualne dla różnych jednostek są nieskorelowane ale występuje korelacja miedzy efektami z różnych okresów dla tej samej jednostki: Copyright by Dorota Ciołek

Wykład - Badania panelowe. D. Ciołek Model z Efektami Losowymi (RE) Wariancja składnika losowego w modelu RE składa się z dwóch części: gdzie: - wariancja składnika czysto losowego, - wariancja efektów indywidualnych. Uwaga: Składniki losowe w modelu RE są ze sobą skorelowane, czyli MNK przestaje być efektywny dlatego do oszacowania tego modelu musimy zastosować estymator Uogólnionej Metody Najmniejszych Kwadratów. Copyright by Dorota Ciołek

Wykład - Badania panelowe. D. Ciołek Model z Efektami Ustalonymi (FE) Dwukierunkowy (two-way) Jeżeli efekty okresowe maja być efektami ustalonymi to, wyraz wolny modelu dzielony jest na dwie części. Możemy zatem zapisać: gdzie: αi- ustalony efekt indywidualny stały w każdym okresie czasu, ale inny (może być inny) dla każdego obiektu w panelu. λt- ustalony efekt okresowy, który ma tę samą wartość dla wszystkich jednostek w panelu w tym samym okresie, ale jest różny (może być różny) w każdym okresie czasu. Należy pamiętać, że nie możemy wprowadzić równocześnie N efektów indywidualnych oraz T efektów okresowych jeżeli chcemy oszacować model - dokładna współliniowość. Copyright by Dorota Ciołek

Wykład - Badania panelowe. D. Ciołek Porównanie Można wykazać następujące zależności: Jeżeli T jest duże, lub jest duża w stosunku do , estymator UMNK dla modelu RE jest bardzo zbliżony do wyników estymacji FE. Jeżeli wariancja efektów indywidualnych jest stosunkowo mała wówczas wyniki oszacowania RE są zbliżone do wyników estymacji modelu regresji łącznej. Zalety i wady modeli FE i RE: Własność Model FE Model RE Efekt indywidualny - możliwości estymacji Może być oszacowany dla poszczególnych jednostek Mogą być oszacowane parametry jego rozkładu w próbie Efekt indywidualny - założenia Niezależny od składnika losowego Niezależny od składnika losowego i zmiennych objaśniających Precyzja oszacowań (przy spełnionych założeniach) Niższa Wyższa Inne ograniczenia Niemożliwość wprowadzenia zmiennych stałych w czasie Copyright by Dorota Ciołek

Wykład - Badania panelowe. D. Ciołek 1) Istotności efektów w modelu FE Czy wprowadzenie różnych dla poszczególnych jednostek wyrazów wolnych prowadzi do uzyskania dokładniejszych oszacowań? Test Walda (test F) Według hipotezy zerowej wszystkie wyrazy wolne (dla wszystkich jednostek i okresów) mają tę samą wartość. Według hipotezy alternatywnej wyrazy wolne są stałe w czasie lecz mogą różnić się dla poszczególnych jednostek. Copyright by Dorota Ciołek

Wykład - Badania panelowe. D. Ciołek 1) Istotności efektów w modelu FE cd. Statystyka z próby: gdzie oznacza wartość współczynnika determinacji dla modelu prawidłowego według hipotezy zerowej, czyli: wartość współczynnika determinacji dla modelu prawidłowego według hipotezy alternatywnej, czyli: Copyright by Dorota Ciołek

Wykład - Badania panelowe. D. Ciołek 1) Istotności efektów w modelu FE cd. Można również skorzystać z następującej statystyki: gdzie oznacza sumę kwadratów reszt dla modelu prawidłowego według hipotezy zerowej, zaś - dla modelu prawidłowego według hipotezy alternatywnej. W obu przypadkach obszar krytyczny testu jest prawostronny określony przez wartość krytyczną: Copyright by Dorota Ciołek

Wykład - Badania panelowe. D. Ciołek 2) Istotności efektów okresowych Czy właściwy jest model jednokierunkowy, czy dwukierunkowy? gdzie Według hipotezy zerowej właściwy jest model jednokierunkowy, a według hipotezy alternatywnej model dwukierunkowy. Statystyka z próby: Copyright by Dorota Ciołek

Wykład - Badania panelowe. D. Ciołek 3) Istotności efektów w modelu RE W modelu z efektami losowymi zakładamy, że składnik losowy zawiera w sobie zarówno efekty indywidualne jak i okresowe. Należy zbadać, czy wariancja składników losowych dla wszystkich obserwacji jest stała. Jeżeli jest stała tzn. że brak istotnego zróżnicowania efektów i należy zastosować model regresji łącznej. Test Breuscha-Pagana (z testu mnożnika Lagrange'a): Copyright by Dorota Ciołek

Wykład - Badania panelowe. D. Ciołek 3) Istotności efektów w modelu RE cd. Statystka z próby: gdzie wartości reszt eit to reszty z modelu regresji łącznej. Przy prawdziwości hipotezy zerowej powyższa statystyka ma rozkład z jednym stopniem swobody. Copyright by Dorota Ciołek

Wykład - Badania panelowe. D. Ciołek 4) Model FE czy model RE I) Jakie założenia można przyjąć co do efektów indywidualnych? Czy można je ocenić jako nieprzypadkowo związane z poszczególnymi jednostkami? II) Testowanie statystyczne – czy są spełnione przyjęte założenia? Kluczowym założeniem dla modelu RE jest założenie o niezależności efektów indywidualnych i zmiennych objaśniających. Jeżeli założenie to nie jest spełnione wówczas estymator UMNK staje się estymatorem obciążonym. W przypadku spełnienia tego założenia zarówno estymator UMNK jak i estymator Within dla modelu FE są zgodne i nieobciążone, jednak estymator UMNK jest bardziej lub przynajmniej tak samo efektywny. Copyright by Dorota Ciołek

Wykład - Badania panelowe. D. Ciołek 4) Model FE czy model RE cd. Test Hausmana Polega na porównaniu wartości ocen parametrów uzyskanych przy pomocy obu estymatorów. gdzie . H0 – oba estymatory są zgodne i nieobciążone, ale UMNK dla modelu RE jest bardziej efektywny. H1 – estymator UMNK jest obciążony, zatem należy stosować model FE, którego estymator jest nieobciążony. Copyright by Dorota Ciołek

Wykład - Badania panelowe. D. Ciołek 4) Model FE czy model RE cd. Statystyka z próby: gdzie - wektor ocen parametrów z modelu RE - wektor ocen parametrów z modelu FE. - macierze wariancji i kowariancji obu estymatorów. Jeżeli hipoteza H0 jest prawdziwa to statystyka m1 ma rozkład z k stopniami swobody. Copyright by Dorota Ciołek

Wykład - Badania panelowe. D. Ciołek 5) Współczynnik determinacji Dla modeli panelowych definiujemy różne współczynniki determinacji Ogólny współczynnik determinacji: Wewnątrzgrupowy współczynnik determinacji: gdzie Copyright by Dorota Ciołek

Wykład - Badania panelowe. D. Ciołek 5) Współczynnik determinacji cd. Międzygrupowy współczynnik determinacji: Wszystkie współczynniki wyznaczane są jako kwadraty współczynnika korelacji liniowej Pearsona i przyjmują wartości z przedziału <0, 1>. Wartości przedstawionych współczynników mogą istotnie się różnić w zależności od postaci wybranego estymatora. Ogólny współczynnik determinacji przyjmuje z reguły największe wartości dla modelu regresji łącznej. Zastosowanie modelu FE pozwala na maksymalizację R2 wewnątrzgrupowego. W regresji międzygrupowej uzyskamy najwyższą wartości współczynnika determinacji międzygrupowego. Copyright by Dorota Ciołek