Ekonometria stosowana Wykład 3 Heteroskedastyczność składnika losowego Andrzej Torój - Lato 2013/2014
Heteroskedastyczność a autokorelacja macierz wariancji-kowariancji składnika losowego autokorelacja brak występuje heteroskedastyczność
Konsekwencje dla estymatorów pozostają nieobciążone i zgodne utrata efektywności Gdzie występuje? modele szeregów czasowych np. okresy wzmożonej zmienności na rynkach finansowych modele przekrojowe np. wariancja rosnąca wraz ze wzrostem wielkości jednostek / jednej z kluczowych zmiennych objaśniających
Test White’a Szacujemy podstawowe równanie regresji: ...i drugie pomocnicze równanie, w którym kwadrat składnika losowego uzależniamy od iloczynów (parami) wszystkich zmiennych z macierzy X (w tym stałej): np. dla modelu ze stałą [1] i regresorami [x1], [x2], [x3] regresorami w równaniu pomocniczym są 1, x1, x2, x3, x12, x22, x32, x1x2, x1x3, x2x3 ~ gdzie K – liczba zmiennych objaśniających w regresji testowej (bez stałej) wysokie R2 oznacza wysokie W i odrzucenie H0 o braku heteroskedastyczności
Ćwiczenie plik karty kredytowe szacujemy model, w którym zmienną objaśnianą są wydatki z kart kredytowych, zaś objaśniającymi: wiek, dochód, kwadrat dochodu i zmienna zerojedynkowa dla właścicieli domów (plus stała) testem White’a sprawdzamy, czy istnieje heteroskedastyczność
Test Goldfelda-Quandta dzielimy próbę (n obserwacji) na dwie podpróby (n=n1+n2) H0: (homoskedastyczność) H1: odpowiednio wysoka wartość statystyki (rozkład F z podanymi w nawiasie stopniami swobody) sugeruje odrzucenie H0 aby przetestować przeciwną H1 – odwracamy indeksy 1 i 2
Ćwiczenie sprawdźmy, czy wariancja reszt losowych jest różna dla modeli w dwóch równych podpróbach, wyróżnionych ze względu na wysokość dochodu Dane – Sortowanie danych przekrojowych Próba – Zakres próby
Test Breuscha-Pagana wariancja składnika losowego może być funkcją zmiennych ujętych w macierzy Z: H0: (homoskedastyczność) H1: (heteroskedastyczność) odpowiednio wysoka wartość statystyki (rozkład c2 ze stopniami swobody równymi liczbie regresorów) sugeruje odrzucenie H0
Ćwiczenie przetestujmy stałość wariancji składnika losowego jeszcze raz – załóżmy, że ta wariancja jest liniową funkcją: dochodu kwadratu dochodu (plus stała)
Odporne błędy oszacowań Znane już Wam odporne (na autokorelację) błędy oszacowań Neweya i Westa stanowiły uogólnienie (na przypadek autokorelacji) wcześniej zaproponowanego odpornego (na heteroskedastyczność) estymatora White’a (1980):
Ćwiczenie czy odporne błędy oszacowań w naszym modelu różnią się znacząco od zwykłych? czy prowadzi to do zmiany konkluzji o istotności zmiennych?
Ważona MNK (WLS) (1) ~ Analogicznie do przypadku autokorelacji: przy Stąd:
Ważona MNK (WLS) (2) Podobnie jak w przypadku autokorelacji, możemy przeprowadzić estymację ważoną MNK jako estymację MNK na transformowanych danych: Dowód: zob. Welfe (s. 117-118)
WMNK – zastosowanie (1) Skąd wziąć n nieznanych parametrów? Tak jak poprzednio, musimy przyjąć założenia pozwalające ograniczyć liczbę nieznanych parametrów, a następnie oszacować je za pomocą MNK.
ZAŁOŻENIE 1 n obserwacji pochodzi z s podprób, n1+n2+…+ns=n, w każdej z nich wariancja składnika losowego jest stała Szacujemy modele za pomocą MNK w każdej z prób osobno (dla każdego i, ni musi być odpowiednio duże). Korzystamy ze standardowego estymatora wariancji reszt w podpróbach (suma kwadratów reszt podzielona przez stopnie swobody). Oszacowane estymatory wariancji podstawiamy w odpowiednie miejsca macierzy W.
ZAŁOŻENIE 2 Wariancja i-tej reszty losowej jest funkcją pewnych zmiennych objaśniających ujętych w macierzy Z Szacujemy model wyjściowy za pomocą MNK, stąd mamy reszty losowe. Szacujemy równanie regresji ich kwadratów względem wybranych zmiennych objaśniających. Podstawiamy otrzymane wartości teoretyczne do wzoru na estymator WLS:
Literatura do wykładu 3 Welfe 4.1-4.4 Dla utrwalenia podstaw teoretycznych heteroskedastyczności.