D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3

Slides:



Advertisements
Podobne prezentacje
Regresja i korelacja materiały dydaktyczne.
Advertisements

Modele oparte o dane przekrojowo-czasowe
Jednorównaniowe modele zmienności
Metody ekonometryczne
BUDOWA MODELU EKONOMETRYCZNEGO
Metody ekonometryczne
Metody ekonometryczne
Metody ekonometryczne
Metody ekonometryczne
Dzisiaj na wykładzie Regresja wieloraka – podstawy i założenia
Analiza korelacji.
Hipotezy statystyczne
Analiza wariancji jednoczynnikowa
Testowanie hipotez statystycznych
Ekonometria szeregów czasowych
i jak odczytywać prognozę?
Ekonometria. Co wynika z podejścia stochastycznego?
BADANIE STATYSTYCZNE Badanie statystyczne to proces pozyskiwania danych na temat rozkładu cechy statystycznej w populacji. Badanie może mieć charakter:
Irena Woroniecka EKONOMIA MENEDŻERSKA - dodatek do W2
Prognozowanie z wykorzystaniem modeli ekonometrycznych
Modelowanie ekonometryczne
Hipotezy statystyczne
Finanse 2009/2010 dr Grzegorz Szafrański pokój B106 Termin konsultacji poniedziałek:
Elementy Rachunku Prawdopodobieństwa i Statystyki
Kilka wybranych uzupelnień
Ekonometria stosowana
Ekonometria stosowana
Ekonometria stosowana
Ekonometryczne modele nieliniowe
Regresja wieloraka.
Seminarium licencjackie Beata Kapuścińska
Wykład - Badania panelowe.
Konwergencja gospodarcza
Testowanie hipotez statystycznych
Przedmiot: Ekonometria Temat: Szeregi czasowe. Dekompozycja szeregów
D. Ciołek Analiza szeregów przekrojowo-czasowych – wykład 0
Ekonometryczne modele nieliniowe
Wnioskowanie statystyczne
D. Ciołek EKONOMETRIA – wykład 1
Ekonometria stosowana
D. Ciołek Analiza szeregów przekrojowo-czasowych – wykład 2
D. Ciołek EKONOMETRIA – wykład 5
D. Ciołek EKONOMETRIA – wykład 6
D. Ciołek EKONOMETRIA – wykład 3
D. Ciołek EKONOMETRIA – wykład 2
D. Ciołek EKONOMETRIA – wykład 4
D. Ciołek Analiza danych przekrojowo-czasowych – wykład 5
1 D. Ciołek Analiza danych przekrojowo-czasowych – wykład 7 Analiza danych przekrojowo-czasowych Wykład 7: Testowanie integracji dla danych panelowych.
Weryfikacja hipotez statystycznych dr hab. Mieczysław Kowerski
Badanie własności składnika losowego dr hab. Mieczysław Kowerski
Model ekonometryczny Jacek Szanduła.
Treść dzisiejszego wykładu l Weryfikacja statystyczna modelu ekonometrycznego –błędy szacunku parametrów, –istotność zmiennych objaśniających, –autokorelacja,
Przeprowadzenie badań niewyczerpujących, (częściowych – prowadzonych na podstawie próby losowej), nie daje podstaw do formułowania stanowczych stwierdzeń.
Testy nieparametryczne – testy zgodności. Nieparametryczne testy istotności dzielimy na trzy zasadnicze grupy: testy zgodności, testy niezależności oraz.
Ekonometria Wykład 1 Uwarunkowania modelowania ekonometrycznego. Uogólniona metoda najmniejszych kwadratów dr hab. Mieczysław Kowerski.
Ekonometria WYKŁAD 3 Piotr Ciżkowicz Katedra Międzynarodowych Studiów Porównawczych.
Ekonometria stosowana Heteroskedastyczność składnika losowego Piotr Ciżkowicz Katedra Międzynarodowych Studiów Porównawczych.
Weryfikacja hipotez statystycznych „Człowiek – najlepsza inwestycja”
Modele nieliniowe sprowadzane do liniowych
STATYSTYKA – kurs podstawowy wykład 11
Estymacja parametryczna dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium Analiz.
Treść dzisiejszego wykładu l Metoda Najmniejszych Kwadratów (MNK) l Współczynnik determinacji l Koincydencja l Kataliza l Współliniowość zmiennych.
Ekonometria WYKŁAD 7 Piotr Ciżkowicz Katedra Międzynarodowych Studiów Porównawczych.
Ekonometria stosowana
EKONOMETRIA W3 prof. UG, dr hab. Tadeusz W. Bołt
Statystyka matematyczna
Regresja wieloraka – bada wpływ wielu zmiennych objaśniających (niezależnych) na jedną zmienną objaśnianą (zależą)
Jednorównaniowy model regresji liniowej
Analiza współzależności zjawisk
Korelacja i regresja liniowa
Zapis prezentacji:

D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Wykład - Badania panelowe. D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Analiza szeregów przekrojowo-czasowych Wykład 3: Weryfikacja w modelach FE i RE. dr Dorota Ciołek Katedra Ekonometrii Wydział Zarządzania UG Konsultacje: p. 112 http://wzr.pl/dc dorota.ciolek@ug.edu.pl Copyright by Dorota Ciołek

D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Wykład - Badania panelowe. D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Istotności efektów w modelu FE Czy wprowadzenie różnych dla poszczególnych jednostek wyrazów wolnych prowadzi do uzyskania dokładniejszych oszacowań? Test Walda (test F) Według hipotezy zerowej wszystkie wyrazy wolne (dla wszystkich jednostek i okresów) mają tę samą wartość. Według hipotezy alternatywnej wyrazy wolne są stałe w czasie lecz mogą różnić się dla poszczególnych jednostek. Copyright by Dorota Ciołek

D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Wykład - Badania panelowe. D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Istotności efektów w modelu FE cd Statystyka z próby: gdzie oznacza wartość współczynnika determinacji dla modelu prawidłowego według hipotezy zerowej, czyli: wartość współczynnika determinacji dla modelu prawidłowego według hipotezy alternatywnej, czyli: Copyright by Dorota Ciołek

D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Wykład - Badania panelowe. D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Istotności efektów w modelu FE cd Można również skorzystać z następującej statystyki: gdzie oznacza sumę kwadratów reszt dla modelu prawidłowego według hipotezy zerowej, zaś - dla modelu prawidłowego według hipotezy alternatywnej. W obu przypadkach obszar krytyczny testu jest prawostronny określony przez wartość krytyczną: Copyright by Dorota Ciołek

D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Wykład - Badania panelowe. D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Istotności efektów okresowych Czy właściwy jest model jednokierunkowy, czy dwukierunkowy? gdzie Według hipotezy zerowej właściwy jest model jednokierunkowy, a według hipotezy alternatywnej model dwukierunkowy. Statystyka z próby: Copyright by Dorota Ciołek

D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Wykład - Badania panelowe. D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Przykład 1. (Greene 2003 s. 292) W oparciu o dane o sześciu przewoźnikach lotniczych w latach 1970-1984 (15 lat) oszacowano model objaśniający całkowity koszt działalności firm (K) w zależności od liczby "pasażerokilometrów" (PKM, suma odległości przebytych samolotami przez wszystkich pasażerów), ceny paliwa (PAL) i średniego poziomu wykorzystania miejsc (WYK, przeciętne zapełnienia startujących samolotów w kolejnych latach). Przyjęto następującą postać modelu: log(Kit) = αi + β1 log (PKMit) + β2 log(PALit) + β3 log(WYKit) + εit Copyright by Dorota Ciołek

D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Wykład - Badania panelowe. D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Przykład 1. (Greene 2003 s. 292) Wyniki oszacowania modelu regresji łącznej i modelu z efektami ustalonymi zamieszono w tablicy: Model Model regresji łącznej Model FE jednokierunkowy Model FE dwukierunkowy STAŁA 9,517 (0,22924) - 12,667 (2,0811) PKM 0,88274 (0,013255) 0,91930 (0,02989) 0,81725 (0,03185) PAL 0,45398 (0,0203) 0,41749 (0,015199) 0,16861 (0,16348) WYK -1,6275 (0,3453) -1,0704 (0,20169) -0,88281 (0,26174) R2 0,98829 0,99743 0,99845 S2 0,015528 0,003625 0,002727 Copyright by Dorota Ciołek

D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Wykład - Badania panelowe. D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Przykład 1. (Greene 2003 s. 292) Efekty indywidualne oszacowane z modelu FE jednokierunkowym przedstawiają się następująco: Różnice w efektach indywidualnych nie wydają się być zbyt istotne, co sugeruje że właściwszy jest model regresji łącznej. 1) Przeprowadzimy test istotności efektów indywidualnych. Statystyka F tego testu: Wartość krytyczna testu: 2,327. a1 a2 a3 a4 a5 a6 9,706 9,665 9,497 9,891 9,730 9,793 Copyright by Dorota Ciołek

D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Wykład - Badania panelowe. D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Przykład 1. (Greene 2003 s. 292) 2) Drugie pytanie: czy lepszy jest model jednokierunkowy, czy dwukierunkowy? Statystyka z próby testu F: Wartość krytyczna testu: 1,84 Brak podstaw do odrzucenia hipotezy zerowej o braku zróżnicowania efektów w czasie. Wniosek: Właściwym modelem do analizy kosztów w badanych przedsiębiorstwach lotniczych jest model z ustalonymi efektami indywidualnymi, bez efektów okresowych. Copyright by Dorota Ciołek

D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Wykład - Badania panelowe. D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Istotności efektów w modelu RE W modelu z efektami losowymi zakładamy, że składnik losowy zawiera w sobie zarówno efekty indywidualne jak i okresowe. Należy zbadać, czy wariancja składników losowych dla wszystkich obserwacji jest stała. Jeżeli jest stała tzn. że brak istotnego zróżnicowania efektów i należy zastosować model regresji łącznej. Test Breuscha-Pagana (z testu mnożnika Lagrange'a): Copyright by Dorota Ciołek

D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Wykład - Badania panelowe. D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Istotności efektów w modelu RE cd Statystka z próby: gdzie wartości reszt eit to reszty z modelu regresji łącznej. Przy prawdziwości hipotezy zerowej powyższa statystyka ma rozkład z jednym stopniem swobody. Copyright by Dorota Ciołek

D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Wykład - Badania panelowe. D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Przykład 1. cd Zbadamy, czy w analizowanym modelu losowe efekty indywidualne można uznać za istotne, tzn. czy łączna wariancja składników zakłócających jest zmienna. Wartość statystyki z próby testu B-P wynosi: LM = 334,85 Wartość krytyczna dla poziomu istotności 0,05 i jednego stopnia swobody wynosi: 3,84. Oznacza to, że należy odrzucić hipotezę zerową testu i uznać, że losowe efekty indywidualne są istotne. Jednakże należy przeprowadzić kolejny test, aby sprawdzić, czy w przypadku tego modelu można zastosować estymator UMNK dla modelu z efektami losowymi. Copyright by Dorota Ciołek

D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Wykład - Badania panelowe. D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Model FE czy model RE I) Jakie założenia można przyjąć co do efektów indywidualnych? Czy można je ocenić jako nieprzypadkowo związane z poszczególnymi jednostkami? II) Testowanie statystyczne – czy są spełnione przyjete założenia? Kluczowym założeniem dla modelu RE jest założenie o niezależności efektów indywidualnych i zmiennych objaśniających. Jeżeli założenie to nie jest spełnione wówczas estymator UMNK staje się estymatorem obciążonym. W przypadku spełnienia tego założenia zarówno estymator UMNK jak i estymator Within dla modelu FE są zgodne i nieobciążone, jednak estymator UMNK jest bardziej lub przynajmniej tak samo efektywny. Copyright by Dorota Ciołek

D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Wykład - Badania panelowe. D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Model FE czy model RE cd Test Hausmana Polega na porównaniu wartości ocen parametrów uzyskanych przy pomocy obu estymatorów. gdzie . H0 – oba estymatory są zgodne i nieobciążone, ale UMNK dla modelu RE jest bardziej efektywny. H1 – estymator UMNK jest obciążony, zatem należy stosować model FE, którego estymator jest nieobciążony. Copyright by Dorota Ciołek

D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Wykład - Badania panelowe. D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Model FE czy model RE cd Statystyka z próby: gdzie - wektor ocen parametrów z modelu RE - wektor ocen parametrów z modelu FE. - macierze wariancji i kowariancji obu estymatorów. Jeżeli hipoteza H0 jest prawdziwa to statystyka m1 ma rozkład z k stopniami swobody. Copyright by Dorota Ciołek

D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Wykład - Badania panelowe. D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Przykład 1. cd Oszacowane macierze wariancji i kowariancji estymatorów FE i RE dla omówionego modelu kosztów w przemyśle lotniczym są następujące: oraz Obliczona wartość statystyki m1 wynosi 3,25, zaś wartość krytyczna testu z trzema stopniami swobody wynosi 7,814 (α=0,05). Brak podstaw do odrzucenia hipotezy zerowej oznacza to, że model z efektami losowymi jest modelem lepszym w tym przypadku. Copyright by Dorota Ciołek

D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Wykład - Badania panelowe. D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Współczynnik determinacji Dla modeli panelowych definiujemy różne współczynniki determinacji Ogólny współczynnik determinacji: Wewnątrzgrupowy współczynnik determinacji: gdzie Copyright by Dorota Ciołek

D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Wykład - Badania panelowe. D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Współczynnik determinacji cd Międzygrupowy współczynnik determinacji: Wszystkie współczynniki wyznaczane są jako kwadraty współczynnika korelacji liniowej Pearsona i przyjmują wartości z przedziału <0, 1>. Wartości przedstawionych współczynników mogą istotnie się różnić w zależności od postaci wybranego estymatora. Ogólny współczynnik determinacji przyjmuje z reguły największe wartości dla modelu regresji łącznej. Zastosowanie modelu FE pozwala na maksymalizację R2 wewnątrzgrupowego. W regresji międzygrupowej uzyskamy najwyższą wartości współczynnika determinacji międzygrupowego.

D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Wykład - Badania panelowe. D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Założenia modelu panelowego Definiując model jako: Formułujemy następujące założenia: dla modelu FE: i=1,...,N, t=1,...,T

D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Wykład - Badania panelowe. D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Założenia modelu panelowego cd. dla modelu RE:

D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Wykład - Badania panelowe. D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Macierz wariancji i kowariancji gdzie macierz Ωi jest w przypadku stałych efektów indywidualnych macierzą jednostkową rzędu T, a w przypadku losowych efektów indywidualnych macierzą: gdzie .

D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Wykład - Badania panelowe. D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Niespełnienie założeń heteroskedastyczność: – groupwise heteroscedasticity – macierze Ωi są różne dla poszczególnych jednostek, co może być spowodowane zmiennością wariancji czysto losowego składnika lub (w modelu random effects) zmiennością wariancji efektów indywidualnych. – cross-sectional correlation – w macierzy blokowej V poza przekątną występują macierze niezerowe; sytuację taką najczęściej opisuje się poprzez współczynnik korelacji równoczesnych realizacji „czystego” zaburzenia losowego . autokorelacja – ; mogą wystąpić np. procesy autoregresyjne i/lub średniej ruchomej.

D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Wykład - Badania panelowe. D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Konsekwencje niespełnienia założeń Jeśli założenia o strukturze wariancji zaburzenia losowego są błędne, to: Estymatory parametrów modelu pozostają nieobciążone, zgodne i asymptotycznie normalne, lecz są nieefektywne w porównaniu z estymatorem uwzględniającym strukturę prawdziwa. Dodatkowo obciążony jest estymator macierzy wariancji kowariancji parametrów, zatem mogą okazać się błędne wnioski o istotności zmiennych wyciągane na podstawie statystyki t.

D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Wykład - Badania panelowe. D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Macierz wariancji i kowariancji parametrów Ogólna formuła wyznaczania macierzy wariancji i kowariancji parametrów strukturalnych: gdzie Ω jest macierzą wariancji i kowariancji składników losowych. Tylko wtedy, gdy Ω = σ2I redukuje się do:

D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Wykład - Badania panelowe. D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Sposoby rozwiązania problemu 1) Zastosowanie Uogólnionej Metody Najmniejszych Kwadratów z estymacją (FGLS): dla modelu w którym występuje autokorelacja rzędu pierwszego: np. metoda Cochrana-Orcutta, dla modelu ze zmienną wariancją tzw. Ważona Metoda Najmniejszych Kwadratów. 2) Estymacja macierzy wariancji i kowariancji parametrów (czyli również błędów szacunku parametrów strukturalnych) w taki sposób, że byłaby odporna (robust) na niespełnienie założeń o sferyczności składnika losowego (i.i.d.).

D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Wykład - Badania panelowe. D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Estymatory odporne (robust) 1) Metoda zaproponowana przez Arellano (2003) (szczególnie dla paneli o dużym N i małym T) Macierz wariancji i kowariancji może być szacowna jako: gdzie jest zgodnym estymatorem macierzy wariancji składnika losowego i dla wszelkich postaci heteroskedastyczności i autokorelacji „czystego” zaburzenia losowego uit ma postać: gdzie są resztami modelu, xti to obserwacje na zmiennych objaśniających. Jest to tzw. korekta White’a uogólniona dla danych panelowych.

D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Wykład - Badania panelowe. D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Estymatory odporne (robust) cd 2) Metoda Arellano niedoszacowuje błędów w przypadku wystąpienia znaczącej autokorelacji zakłóceń pomiędzy jednostkami w tym samym momencie czasu. W takich przypadkach stosuje się (Beck, Katz(1995)) : gdzie T oznacza długość szeregu czasowego dla każdej jednostki.

D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Wykład - Badania panelowe. D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Estymatory odporne (robust) cd Uwaga: Estymatory odporne dla błędów parametrów strukturalnych dają dobre asymptotycznie właściwości statystyczne dla modeli, których specyfikacja jest właściwa, ale składniki losowe nie są i.i.d. „Asymptotycznie” oznacza, że nie mają zastosowanie dla małych prób. „Właściwa specyfikacja” oznacza, że jeżeli składniki losowe są skorelowane ze zmiennymi objaśniającymi (regresorami), to „nie ma cudów”, estymacja parametrów sama w sobie jest obciążona i niezgodna.

D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Wykład - Badania panelowe. D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Heteroskedastyczność Dwa źródła: duże zróżnicowanie jednostek w panelu, duża zmienność zakłóceń losowych w czasie. Przy dużym N i małym T uwzględnienie zmienności wariancji w modelu RE wiąże się z estymacją zbyt dużej liczby parametrów, stąd w takim przypadku powinno się stosować model FE. Wówczas macierz wariancji i kowariancji składników losowych:

D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Wykład - Badania panelowe. D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Heteroskedastyczność cd Dla znacznego zróżnicowania pomiędzy grupami macierz Σ: i dodatkowo jeżeli istnieje korelacja (współzależność) pomiędzy jednostkami:

D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Wykład - Badania panelowe. D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Heteroskedastyczność cd Model taki możemy szacować Uogólnioną MNK : gdzie macierz wariancji i kowariancji parametrów: a elementy macierzy obliczamy na podstawie reszt z oszacowania wstępnej regresji metodą MNK:

D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Wykład - Badania panelowe. D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Testowanie heteroscedatyczości Występowanie heteroskedastyczności możemy testować za pomocą trzech klasycznych testów ekonometrycznych, które są asymptotycznie równoważne (przy T → ∞), jednak przy niewielkiej ilości okresów czasu mogą dawać różne rezultaty. We wszystkich przypadkach testujemy: H0: σi = σ dla każdego i H1: σi ≠ σj dla i ≠ j. i wszystkie trzy statystyki testujące mają rozkład .

D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Wykład - Badania panelowe. D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Testowanie heteroscedatyczości cd 1) Dysponując resztami z modelu z ograniczeniami (restricted), czyli zakładającej homoskedastyczność metody MNK, możemy znaleźć statystykę testu mnożnika Lagrange’a: gdzie: 2) Wstawiając estymatory uzyskane analogicznie na podstawie reszt z modelu bez ograniczeń (FGLS), otrzymamy statystykę Walda:

D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Wykład - Badania panelowe. D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Testowanie heteroscedatyczości cd 3) I wreszcie, estymując oba modele za pomocą metody największej wiarygodności (lub iteracyjnej FGLS) i znajdując z restricted model oraz i z unrestricted model, możemy obliczyć statystykę testu ilorazu wiarygodności: Niestety, wszystkie trzy statystyki są wrażliwe na założenie o normalności reszt. Jeżeli założenie to nie jest spełnione, możemy posłużyć się skorygowaną statystyką Walda:

D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Wykład - Badania panelowe. D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Szacowanie modelu z heteroscedastycznością Zjawisko heteroscedastyczności grupowej jest szczególnym przypadkiem heteroscedastyczności składnika losowego. W takim przypadku do estymacji wykorzystać można Ważoną Metodę Najmniejszych Kwadratów (WMNK): - próba dzielona jest w sposób naturalny na podpróby składające się z obserwacji w czasie dla poszczególnych jednostek, - na podstawie reszt KMNK z kolejnych podprób, wyznacza się wariancje próbkowe , które określają wagi przypisywane kolejnym jednostkom. Wówczas estymator WMNK:

D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Wykład - Badania panelowe. D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Testowanie korelacji międzygrupowej Testowanie korelacji miedzygrupowej (przekrojowej miedzy-jednostkowej, cross-sectional, contemporaneous) – korelacja składników losowych pochodzących z różnych obiektów, ale z tego samego okresu. Najczęściej testowaniu podlega hipoteza o istnieniu cross-sectional correlation przeciwko hipotezie o istnieniu zwykłej heteroskedastyczności:

D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Wykład - Badania panelowe. D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Testowanie korelacji międzygrupowej 1) Test mnożnika Lagrange’a Breucha-Pagana będzie miał postać: gdzie rij, to współczynniki korelacji reszt miedzy obiektami i-tym i j-tym uzyskanymi z oszacowania UMNK (ze względu na założenie stałości parametrów strukturalnych względem obiektów. Statystyka z próby ma rozkład:

D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Wykład - Badania panelowe. D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Testowanie korelacji międzygrupowej 2) Test ilorazu wiarygodności: gdzie: wyliczane są z modelu oszacowanego z uwzględnieniem zjawiska heteroscedastyczności grupowej, - elementami tej macierzy są oceny kowariancji wyznaczone na podstawie reszt modelu oszacowanego z uwzględnieniem zjawiska heteroscedastyczności i korelacji przekrojowej, Obie powyższe estymacje wykonane są przy pomocy Metody Największej Wiarygodności. Rozkład statystyki z próby:

D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Wykład - Badania panelowe. D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Szacowanie modelu z korelacją przekrojową i heteroscedastyczności grupową 1) Metoda UMNK z estymacją (FGLS) – metoda Parksa: Krok 1: wyznacza się oceny kowariancji pomiędzy obiektami i-tym i j-tym na podstawie reszt uzyskanych ze zgodnego, choć obciążonego estymatora KMNK, Krok 2: wyznacza się oceny parametrów struktralnych według wzoru: gdzie elementami V są kowariancje wyznaczone w pierwszym kroku estymacji.

D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Wykład - Badania panelowe. D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Szacowanie modelu z korelacją przekrojową i heteroscedastyczności grupową 2) Technika Panel-Corrected Standard Errors (PCSE) (Beck, Katz (1995)) - Parametry strukturalne modelu szacowane są przy pomocy KMNK – oceny są zgodne i nieobciążone; - Problem nieefektywności rozwiązany jest poprzez zastosowanie specyficznej formuły obliczania średnich błędów szacunku parametrów, tzw. „skorygowanych błędów standardowych dla danych panelowych”. - Efektywności estymatora rośnie wraz ze wzrostem wymiaru czasowego danych względem liczby jednostek.

D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Wykład - Badania panelowe. D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Szacowanie modelu z korelacją przekrojową i heteroscedastyczności grupową 2) Technika Panel-Corrected Standard Errors (PCSE) (Beck, Katz (1995)) cd. Macierz wariancji i kowariancji estymatorów: gdzie: E jest macierzą reszt modelu oszacowanego KMNK, w której kolumna o numerze i zawiera reszty pochodzące z i-tego obiektu.

D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Wykład - Badania panelowe. D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Testowanie autokorelacji składnika zakłócającego Dodatkowo w modelu panelowym może występować jeszcze klasyczna autokorelacja zakłóceń losowych. Możliwe warianty: 1a) Składniki losowe z różnych obiektów są nieskorelowane, autokorelacja występuje tylko „wewnątrz” poszczególnych obiektów. 2a) Oprócz autokorelacji dopuszcza się też występowanie korelacji przekrojowej. Ponadto: 1b) Współczynnik autokorelacji może być jednakowy dla wszystkich obiektów. 2b) Współczynnik autokorelacji może być różnych dla różnych obiektów.

D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Wykład - Badania panelowe. D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Testowanie autokorelacji składnika zakłócającego 1) Test seryjnej autokorelacji dowolnego rzędu Breuscha-Godfreya (oparty na mnożniku Lagrange’a); stosowany w modelach regresji łącznej, FE i RE; 2) Test Baltagi-Li (oparty na mnożniku Lagrange’a)– bada składniki losowy dla poszczególnych jednostek, czy nie mają charakteru AR(1) lub MA(1); stosowany w modelach RE; 3) Test Durbina-Watsona, stosowany w modelach regresji łącznej, FE i RE; W wariancie (1b) – do wyznaczenia statystyki wykorzystuje się reszty modelu wyliczone z KMNK na podstawie całej próby. W wariancie (2b) – wykorzystuje się reszty z modeli szacowanych KMNK dla oddzielnie dla poszczególnych jednostek. Wyniki Monte-Carlo sugerują stosowanie wariantu (1b).

D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Wykład - Badania panelowe. D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Szacownie modelu z autokorelacją W celu usunięcia autokorelacji stosuje się zazwyczaj przekształcenie Praisa-Winstena – szeregi czasowe dotyczące kolejnych obiektów transformuje się w następujący sposób: gdzie ri jest oceną współczynnik autokorelacji, xit jest wektorem wartości wszystkich zmiennych objaśniających przyjmowanych dla i-tego obiektu w okresie t. W modelu szacowanym na przetransformowanych danych nie występuje już autokorelacja.