Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

Copyright by Dorota Ciołek 1 D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Analiza szeregów przekrojowo-czasowych Wykład 3: Weryfikacja w modelach.

Podobne prezentacje


Prezentacja na temat: "Copyright by Dorota Ciołek 1 D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Analiza szeregów przekrojowo-czasowych Wykład 3: Weryfikacja w modelach."— Zapis prezentacji:

1 Copyright by Dorota Ciołek 1 D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Analiza szeregów przekrojowo-czasowych Wykład 3: Weryfikacja w modelach FE i RE. dr Dorota Ciołek Katedra Ekonometrii Wydział Zarządzania UG Konsultacje: p

2 Copyright by Dorota Ciołek 2 D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Istotności efektów w modelu FE Czy wprowadzenie różnych dla poszczególnych jednostek wyrazów wolnych prowadzi do uzyskania dokładniejszych oszacowań? Test Walda (test F) Według hipotezy zerowej wszystkie wyrazy wolne (dla wszystkich jednostek i okresów) mają tę samą wartość. Według hipotezy alternatywnej wyrazy wolne są stałe w czasie lecz mogą różnić się dla poszczególnych jednostek.

3 Copyright by Dorota Ciołek 3 D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Istotności efektów w modelu FE cd Statystyka z próby: gdzie oznacza wartość współczynnika determinacji dla modelu prawidłowego według hipotezy zerowej, czyli: wartość współczynnika determinacji dla modelu prawidłowego według hipotezy alternatywnej, czyli:

4 Copyright by Dorota Ciołek 4 D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Istotności efektów w modelu FE cd Można również skorzystać z następującej statystyki: gdzie oznacza sumę kwadratów reszt dla modelu prawidłowego według hipotezy zerowej, zaś - dla modelu prawidłowego według hipotezy alternatywnej. W obu przypadkach obszar krytyczny testu jest prawostronny określony przez wartość krytyczną:

5 Copyright by Dorota Ciołek 5 D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Istotności efektów okresowych Czy właściwy jest model jednokierunkowy, czy dwukierunkowy? gdzie Według hipotezy zerowej właściwy jest model jednokierunkowy, a według hipotezy alternatywnej model dwukierunkowy. Statystyka z próby:

6 Copyright by Dorota Ciołek 6 D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Przykład 1. (Greene 2003 s. 292) W oparciu o dane o sześciu przewoźnikach lotniczych w latach (15 lat) oszacowano model objaśniający całkowity koszt działalności firm (K) w zależności od liczby "pasażerokilometrów" (PKM, suma odległości przebytych samolotami przez wszystkich pasażerów), ceny paliwa (PAL) i średniego poziomu wykorzystania miejsc (WYK, przeciętne zapełnienia startujących samolotów w kolejnych latach). Przyjęto następującą postać modelu: log(K it ) = α i + β 1 log (PKM it ) + β 2 log(PAL it ) + β 3 log(WYK it ) + ε it

7 Copyright by Dorota Ciołek 7 D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Przykład 1. (Greene 2003 s. 292) Wyniki oszacowania modelu regresji łącznej i modelu z efektami ustalonymi zamieszono w tablicy: ModelModel regresji łącznej Model FE jednokierunkowy Model FE dwukierunkowy STAŁA9,517 (0,22924) -12,667 (2,0811) PKM0,88274 (0,013255) 0,91930 (0,02989) 0,81725 (0,03185) PAL0,45398 (0,0203) 0,41749 (0,015199) 0,16861 (0,16348) WYK-1,6275 (0,3453) -1,0704 (0,20169) -0,88281 (0,26174) R2R2 0,988290,997430,99845 S2S2 0, , ,002727

8 Copyright by Dorota Ciołek 8 D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Przykład 1. (Greene 2003 s. 292) Efekty indywidualne oszacowane z modelu FE jednokierunkowym przedstawiają się następująco: Różnice w efektach indywidualnych nie wydają się być zbyt istotne, co sugeruje że właściwszy jest model regresji łącznej. 1) Przeprowadzimy test istotności efektów indywidualnych. Statystyka F tego testu: Wartość krytyczna testu: 2,327. a1a1 a2a2 a3a3 a4a4 a5a5 a6a6 9,7069,6659,4979,8919,7309,793

9 Copyright by Dorota Ciołek 9 D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Przykład 1. (Greene 2003 s. 292) 2) Drugie pytanie: czy lepszy jest model jednokierunkowy, czy dwukierunkowy? Statystyka z próby testu F: Wartość krytyczna testu: 1,84 Brak podstaw do odrzucenia hipotezy zerowej o braku zróżnicowania efektów w czasie. Wniosek: Właściwym modelem do analizy kosztów w badanych przedsiębiorstwach lotniczych jest model z ustalonymi efektami indywidualnymi, bez efektów okresowych.

10 Copyright by Dorota Ciołek 10 D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Istotności efektów w modelu RE W modelu z efektami losowymi zakładamy, że składnik losowy zawiera w sobie zarówno efekty indywidualne jak i okresowe. Należy zbadać, czy wariancja składników losowych dla wszystkich obserwacji jest stała. Jeżeli jest stała tzn. że brak istotnego zróżnicowania efektów i należy zastosować model regresji łącznej. Test Breuscha-Pagana (z testu mnożnika Lagrange'a):

11 Copyright by Dorota Ciołek 11 D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Istotności efektów w modelu RE cd Statystka z próby: gdzie wartości reszt e it to reszty z modelu regresji łącznej. Przy prawdziwości hipotezy zerowej powyższa statystyka ma rozkład z jednym stopniem swobody.

12 Copyright by Dorota Ciołek 12 D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Przykład 1. cd Zbadamy, czy w analizowanym modelu losowe efekty indywidualne można uznać za istotne, tzn. czy łączna wariancja składników zakłócających jest zmienna. Wartość statystyki z próby testu B-P wynosi: LM = 334,85 Wartość krytyczna dla poziomu istotności 0,05 i jednego stopnia swobody wynosi: 3,84. Oznacza to, że należy odrzucić hipotezę zerową testu i uznać, że losowe efekty indywidualne są istotne. Jednakże należy przeprowadzić kolejny test, aby sprawdzić, czy w przypadku tego modelu można zastosować estymator UMNK dla modelu z efektami losowymi.

13 Copyright by Dorota Ciołek 13 D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Model FE czy model RE I) Jakie założenia można przyjąć co do efektów indywidualnych? Czy można je ocenić jako nieprzypadkowo związane z poszczególnymi jednostkami? II) Testowanie statystyczne – czy są spełnione przyjete założenia?  Kluczowym założeniem dla modelu RE jest założenie o niezależności efektów indywidualnych i zmiennych objaśniających.  Jeżeli założenie to nie jest spełnione wówczas estymator UMNK staje się estymatorem obciążonym.  W przypadku spełnienia tego założenia zarówno estymator UMNK jak i estymator Within dla modelu FE są zgodne i nieobciążone, jednak estymator UMNK jest bardziej lub przynajmniej tak samo efektywny.

14 Copyright by Dorota Ciołek 14 D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Model FE czy model RE cd Test Hausmana Polega na porównaniu wartości ocen parametrów uzyskanych przy pomocy obu estymatorów. gdzie. H 0 – oba estymatory są zgodne i nieobciążone, ale UMNK dla modelu RE jest bardziej efektywny. H 1 – estymator UMNK jest obciążony, zatem należy stosować model FE, którego estymator jest nieobciążony.

15 Copyright by Dorota Ciołek 15 D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Model FE czy model RE cd Statystyka z próby: gdzie - wektor ocen parametrów z modelu RE - wektor ocen parametrów z modelu FE. - macierze wariancji i kowariancji obu estymatorów. Jeżeli hipoteza H 0 jest prawdziwa to statystyka m 1 ma rozkład z k stopniami swobody.

16 Copyright by Dorota Ciołek 16 D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Przykład 1. cd Oszacowane macierze wariancji i kowariancji estymatorów FE i RE dla omówionego modelu kosztów w przemyśle lotniczym są następujące: oraz Obliczona wartość statystyki m 1 wynosi 3,25, zaś wartość krytyczna testu z trzema stopniami swobody wynosi 7,814 ( α =0,05). Brak podstaw do odrzucenia hipotezy zerowej oznacza to, że model z efektami losowymi jest modelem lepszym w tym przypadku.

17 Copyright by Dorota Ciołek 17 D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Współczynnik determinacji Dla modeli panelowych definiujemy różne współczynniki determinacji  Ogólny współczynnik determinacji:  Wewnątrzgrupowy współczynnik determinacji: gdzie

18 18 D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Współczynnik determinacji cd  Międzygrupowy współczynnik determinacji: Wszystkie współczynniki wyznaczane są jako kwadraty współczynnika korelacji liniowej Pearsona i przyjmują wartości z przedziału. Wartości przedstawionych współczynników mogą istotnie się różnić w zależności od postaci wybranego estymatora.  Ogólny współczynnik determinacji przyjmuje z reguły największe wartości dla modelu regresji łącznej.  Zastosowanie modelu FE pozwala na maksymalizację R 2 wewnątrzgrupowego.  W regresji międzygrupowej uzyskamy najwyższą wartości współczynnika determinacji międzygrupowego.

19 19 D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Założenia modelu panelowego Definiując model jako: Formułujemy następujące założenia: dla modelu FE: i=1,...,N, t=1,...,T

20 20 D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Założenia modelu panelowego cd. dla modelu RE:

21 21 D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Macierz wariancji i kowariancji gdzie macierz Ω i jest w przypadku stałych efektów indywidualnych macierzą jednostkową rzędu T, a w przypadku losowych efektów indywidualnych macierzą: gdzie.

22 22 D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Niespełnienie założeń heteroskedastyczność: – groupwise heteroscedasticity – macierze Ω i są różne dla poszczególnych jednostek, co może być spowodowane zmiennością wariancji czysto losowego składnika lub (w modelu random effects) zmiennością wariancji efektów indywidualnych. – cross-sectional correlation – w macierzy blokowej V poza przekątną występują macierze niezerowe; sytuację taką najczęściej opisuje się poprzez współczynnik korelacji równoczesnych realizacji „czystego” zaburzenia losowego. autokorelacja – ; mogą wystąpić np. procesy autoregresyjne i/lub średniej ruchomej.

23 23 D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Konsekwencje niespełnienia założeń Jeśli założenia o strukturze wariancji zaburzenia losowego są błędne, to:  Estymatory parametrów modelu pozostają nieobciążone, zgodne i asymptotycznie normalne, lecz są nieefektywne w porównaniu z estymatorem uwzględniającym strukturę prawdziwa.  Dodatkowo obciążony jest estymator macierzy wariancji kowariancji parametrów, zatem mogą okazać się błędne wnioski o istotności zmiennych wyciągane na podstawie statystyki t.

24 24 D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Macierz wariancji i kowariancji parametrów Ogólna formuła wyznaczania macierzy wariancji i kowariancji parametrów strukturalnych: gdzie Ω jest macierzą wariancji i kowariancji składników losowych. Tylko wtedy, gdy Ω = σ 2 I redukuje się do:

25 25 D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Sposoby rozwiązania problemu 1) Zastosowanie Uogólnionej Metody Najmniejszych Kwadratów z estymacją (FGLS): dla modelu w którym występuje autokorelacja rzędu pierwszego: np. metoda Cochrana-Orcutta, dla modelu ze zmienną wariancją tzw. Ważona Metoda Najmniejszych Kwadratów. 2) Estymacja macierzy wariancji i kowariancji parametrów (czyli również błędów szacunku parametrów strukturalnych) w taki sposób, że byłaby odporna (robust) na niespełnienie założeń o sferyczności składnika losowego (i.i.d.).

26 26 D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Estymatory odporne (robust) 1) Metoda zaproponowana przez Arellano (2003) (szczególnie dla paneli o dużym N i małym T) Macierz wariancji i kowariancji może być szacowna jako: gdzie jest zgodnym estymatorem macierzy wariancji składnika losowego i dla wszelkich postaci heteroskedastyczności i autokorelacji „czystego” zaburzenia losowego u it ma postać: gdzie są resztami modelu, x ti to obserwacje na zmiennych objaśniających. Jest to tzw. korekta White’a uogólniona dla danych panelowych.

27 27 D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Estymatory odporne (robust) cd 2) Metoda Arellano niedoszacowuje błędów w przypadku wystąpienia znaczącej autokorelacji zakłóceń pomiędzy jednostkami w tym samym momencie czasu. W takich przypadkach stosuje się (Beck, Katz(1995)) : gdzie T oznacza długość szeregu czasowego dla każdej jednostki.

28 28 D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Estymatory odporne (robust) cd Uwaga: Estymatory odporne dla błędów parametrów strukturalnych dają dobre asymptotycznie właściwości statystyczne dla modeli, których specyfikacja jest właściwa, ale składniki losowe nie są i.i.d. „Asymptotycznie” oznacza, że nie mają zastosowanie dla małych prób. „Właściwa specyfikacja” oznacza, że jeżeli składniki losowe są skorelowane ze zmiennymi objaśniającymi (regresorami), to „nie ma cudów”, estymacja parametrów sama w sobie jest obciążona i niezgodna.

29 29 D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Heteroskedastyczność Dwa źródła:  duże zróżnicowanie jednostek w panelu,  duża zmienność zakłóceń losowych w czasie. Przy dużym N i małym T uwzględnienie zmienności wariancji w modelu RE wiąże się z estymacją zbyt dużej liczby parametrów, stąd w takim przypadku powinno się stosować model FE. Wówczas macierz wariancji i kowariancji składników losowych:

30 30 D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Heteroskedastyczność cd Dla znacznego zróżnicowania pomiędzy grupami macierz Σ: i dodatkowo jeżeli istnieje korelacja (współzależność) pomiędzy jednostkami:

31 31 D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Heteroskedastyczność cd Model taki możemy szacować Uogólnioną MNK : gdzie macierz wariancji i kowariancji parametrów: a elementy macierzy obliczamy na podstawie reszt z oszacowania wstępnej regresji metodą MNK:

32 32 D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Testowanie heteroscedatyczości Występowanie heteroskedastyczności możemy testować za pomocą trzech klasycznych testów ekonometrycznych, które są asymptotycznie równoważne (przy T → ∞), jednak przy niewielkiej ilości okresów czasu mogą dawać różne rezultaty. We wszystkich przypadkach testujemy: H 0 : σ i = σ dla każdego i H 1 : σ i ≠ σ j dla i ≠ j. i wszystkie trzy statystyki testujące mają rozkład.

33 33 D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Testowanie heteroscedatyczości cd 1) Dysponując resztami z modelu z ograniczeniami (restricted), czyli zakładającej homoskedastyczność metody MNK, możemy znaleźć statystykę testu mnożnika Lagrange’a: gdzie: 2) Wstawiając estymatory uzyskane analogicznie na podstawie reszt z modelu bez ograniczeń (FGLS), otrzymamy statystykę Walda:

34 34 D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Testowanie heteroscedatyczości cd 3) I wreszcie, estymując oba modele za pomocą metody największej wiarygodności (lub iteracyjnej FGLS) i znajdując z restricted model oraz i z unrestricted model, możemy obliczyć statystykę testu ilorazu wiarygodności: Niestety, wszystkie trzy statystyki są wrażliwe na założenie o normalności reszt. Jeżeli założenie to nie jest spełnione, możemy posłużyć się skorygowaną statystyką Walda:

35 35 D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Szacowanie modelu z heteroscedastycznością Zjawisko heteroscedastyczności grupowej jest szczególnym przypadkiem heteroscedastyczności składnika losowego. W takim przypadku do estymacji wykorzystać można Ważoną Metodę Najmniejszych Kwadratów (WMNK): - próba dzielona jest w sposób naturalny na podpróby składające się z obserwacji w czasie dla poszczególnych jednostek, - na podstawie reszt KMNK z kolejnych podprób, wyznacza się wariancje próbkowe, które określają wagi przypisywane kolejnym jednostkom. Wówczas estymator WMNK:

36 36 D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Testowanie korelacji międzygrupowej Testowanie korelacji miedzygrupowej (przekrojowej miedzy- jednostkowej, cross-sectional, contemporaneous) – korelacja składników losowych pochodzących z różnych obiektów, ale z tego samego okresu. Najczęściej testowaniu podlega hipoteza o istnieniu cross- sectional correlation przeciwko hipotezie o istnieniu zwykłej heteroskedastyczności:

37 37 D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Testowanie korelacji międzygrupowej 1) Test mnożnika Lagrange’a Breucha-Pagana będzie miał postać: gdzie r ij, to współczynniki korelacji reszt miedzy obiektami i-tym i j-tym uzyskanymi z oszacowania UMNK (ze względu na założenie stałości parametrów strukturalnych względem obiektów. Statystyka z próby ma rozkład:

38 38 D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Testowanie korelacji międzygrupowej 2) Test ilorazu wiarygodności: gdzie: wyliczane są z modelu oszacowanego z uwzględnieniem zjawiska heteroscedastyczności grupowej, - elementami tej macierzy są oceny kowariancji wyznaczone na podstawie reszt modelu oszacowanego z uwzględnieniem zjawiska heteroscedastyczności i korelacji przekrojowej, Obie powyższe estymacje wykonane są przy pomocy Metody Największej Wiarygodności. Rozkład statystyki z próby:

39 39 D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Szacowanie modelu z korelacją przekrojową i heteroscedastyczności grupową 1) Metoda UMNK z estymacją (FGLS) – metoda Parksa: Krok 1: wyznacza się oceny kowariancji pomiędzy obiektami i- tym i j-tym na podstawie reszt uzyskanych ze zgodnego, choć obciążonego estymatora KMNK, Krok 2: wyznacza się oceny parametrów struktralnych według wzoru: gdzie elementami V są kowariancje wyznaczone w pierwszym kroku estymacji.

40 40 D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Szacowanie modelu z korelacją przekrojową i heteroscedastyczności grupową 2) Technika Panel-Corrected Standard Errors (PCSE) (Beck, Katz (1995)) - Parametry strukturalne modelu szacowane są przy pomocy KMNK – oceny są zgodne i nieobciążone; - Problem nieefektywności rozwiązany jest poprzez zastosowanie specyficznej formuły obliczania średnich błędów szacunku parametrów, tzw. „skorygowanych błędów standardowych dla danych panelowych”. - Efektywności estymatora rośnie wraz ze wzrostem wymiaru czasowego danych względem liczby jednostek.

41 41 D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Szacowanie modelu z korelacją przekrojową i heteroscedastyczności grupową 2) Technika Panel-Corrected Standard Errors (PCSE) (Beck, Katz (1995)) cd. Macierz wariancji i kowariancji estymatorów: gdzie: E jest macierzą reszt modelu oszacowanego KMNK, w której kolumna o numerze i zawiera reszty pochodzące z i-tego obiektu.

42 42 D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Testowanie autokorelacji składnika zakłócającego Dodatkowo w modelu panelowym może występować jeszcze klasyczna autokorelacja zakłóceń losowych. Możliwe warianty: 1a) Składniki losowe z różnych obiektów są nieskorelowane, autokorelacja występuje tylko „wewnątrz” poszczególnych obiektów. 2a) Oprócz autokorelacji dopuszcza się też występowanie korelacji przekrojowej. Ponadto: 1b) Współczynnik autokorelacji może być jednakowy dla wszystkich obiektów. 2b) Współczynnik autokorelacji może być różnych dla różnych obiektów.

43 43 D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Testowanie autokorelacji składnika zakłócającego 1) Test seryjnej autokorelacji dowolnego rzędu Breuscha- Godfreya (oparty na mnożniku Lagrange’a); stosowany w modelach regresji łącznej, FE i RE; 2) Test Baltagi-Li (oparty na mnożniku Lagrange’a)– bada składniki losowy dla poszczególnych jednostek, czy nie mają charakteru AR(1) lub MA(1); stosowany w modelach RE; 3) Test Durbina-Watsona, stosowany w modelach regresji łącznej, FE i RE; W wariancie (1b) – do wyznaczenia statystyki wykorzystuje się reszty modelu wyliczone z KMNK na podstawie całej próby. W wariancie (2b) – wykorzystuje się reszty z modeli szacowanych KMNK dla oddzielnie dla poszczególnych jednostek. Wyniki Monte-Carlo sugerują stosowanie wariantu (1b).

44 44 D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Szacownie modelu z autokorelacją W celu usunięcia autokorelacji stosuje się zazwyczaj przekształcenie Praisa-Winstena – szeregi czasowe dotyczące kolejnych obiektów transformuje się w następujący sposób: gdzie r i jest oceną współczynnik autokorelacji, x it jest wektorem wartości wszystkich zmiennych objaśniających przyjmowanych dla i-tego obiektu w okresie t. W modelu szacowanym na przetransformowanych danych nie występuje już autokorelacja.


Pobierz ppt "Copyright by Dorota Ciołek 1 D. Ciołek Analiza danych przekrojowo-czasowych – wykład 3 Analiza szeregów przekrojowo-czasowych Wykład 3: Weryfikacja w modelach."

Podobne prezentacje


Reklamy Google