Metoda najmniejszych kwadratów dla jednej zmiennej objaśniającej dr Grzegorz Szafrański pokój B106 Termin konsultacji: poniedziałek 13.30-15.00 16.30-17.00
Modelowanie – podstawy Wykorzystanie faktu korelacji zmiennych: przyczynowej (związek przyczynowo-skutkowy i jego stabilność), symptomatycznej (ukryty mechanizm, wspólne przyczyny różnych zjawisk i przybliżenie ich działania przez związaną z nimi zmienną tzw. proxy np. jak np. przyczyny jednokierunkowo zmieniające się w czasie – trend, wykazujące wahania – modele AR, analiza spektralna), przypadkowej – bezzasadne.
Budowa modelu Sformułuj problem ekonomiczny Zilustruj go danymi empirycznymi Podaj jego teoretyczne rozwiązanie (hipotezy, model ekonomiczny) Dobierz zmienne objaśniające Sprawdź teorię za pomocą modelu ekonometrycznego
Weryfikacja modelu Budowa postaci modelu (liniowy, potęgowy, inny nieliniowy?) Estymacja modelu (wybór metody, MNK, MNW czy inna?) Weryfikacja ekonomiczna (czy zgodny z teorią?) Weryfikacja statystyczna (na ile zgodny z teorią?) Propozycje poprawy modelu
Problem ekonomiczny Krótki opis problemu: Im większa produkcja tym wyższe koszty, ale rosną one coraz wolniej. Dlaczego? Odpowiedzi szukamy w teorii ekonomicznej: W produkcji występują koszty stałe (nie zależą od wielkości produkcji) i zmienne (zależne). Jak je wydzielić, gdy mamy dane: Y – koszt całkowity, w mln zł X – ilość produktów, w tys. szt.
Model ekonomiczny Formułujemy teorię ekonomiczną w postaci „Y zależy od X”: Y = f(X) Zależność ta może mieć postać liniową Y= a0 +a1X i a0>0, a1>0 a0,a1 to parametry modelu Czy istnieje empiryczna zależność między X a Y? Czy jest ona zgodna z teorią (np. czy a1>0)?
Model ekonometryczny yt=a0+a1xt + et Przedstawiamy teorię ekonomiczną z dokładnością do zmiennej losowej et i badamy, czy zachodziła w pewnym okresie czasu: t=1,...,T Sprawdzamy zależność stochastyczną: yt=a0+a1xt + et E(et) = 0, xt nielosowe, stąd E(yt) =a0+a1xt D2(et) = E(et2)= s2, E(etet-i) = 0 Zwykle przyjmuje się również postać rozkładu zmiennej et ~ N(0, s2)
Metoda najmniejszych kwadratów model stochastyczny (jedna zmienna objaśniająca): zależność korelacyjna między zmiennymi yt=a0+a1xt + et gdzie t=1,2,...,T oraz E(et) = 0, D(et) = s i et dla różnych t nie są skorelowane Dochodzimy do funkcji regresji I rodzaju: E(yt) =a0+a1xt
MNK Estymacja – szacowanie nieznanych parametrów modelu na podstawie próby wg określonego kryterium Funkcja regresji II rodzaju – wartość teoretyczna: pt=a0+a1xt To co zostaje to reszta: et= yt – (a0+a1xt) Kryterium MNK: minimalizacja sumy kwadratów reszt SSQ dla różnych wartości ocen parametrów a0, a1 SSQ(a0, a1) = St et2 min
Metoda regresji yt=a0+a1xt + et Próbujemy poznać nieznane parametry modelu yt=a0+a1xt + et Poprzez estymację: Estymator to przepis na a0 i a1 np: a1 =St [(xt - xśrednie) (yt - yśrednie)]/St (xt - xśrednie)2 a0 = yśrednie - a1 xtśrednie
Zadanie Dokonaj estymacji modelu: Problemy dostępności danych Dane w pliku jedna_zmienna.xls Y – koszty w mln złotych, X – ilość w tys. sztuk
Konwencja Model zwykle zapisujemy: próba: 2001.001 – 2002.008
Miara błędu SEE yt = pt + et Opieramy miarę błędu na sumie kwadratów reszt: Stet 2=St (yt -pt)2 Nieobciążony estymator wariancji składnika losowego otrzymujemy podobnie jak wariancję reszt z próby: S2 = Stet 2 /(ilość stopni swobody) Ilość stopni swobody obliczamy jako różnicę ilości obserwacji i ilości szacowanych parametrów. błąd standardowy SEE to pierwiastek z tej wariancji
Miary dokładności MNK Na całkowitą zmienność igreka SST=St (yt -yśrednie)2 składa się: SST=SSR+SSE St(yt -yśrednie)2 = St(pt -yśrednie)2 +Stet 2 bo (yt -yśrednie) = (pt -yśrednie) + et i reszty nie są skorelowane z p Współczynnik determinacji R-kwadrat to R2 = SSR/SST=1-SSE/SST R2 = (corr(yt ,pt))2
Źródła danych Rocznik Statystyczny GUS Biuletyn Statystyczny GUS inne materiały GUS i oficjalne informacje rządowe Biuletyn Informacyjny NBP inne materiały NBP (informacja wstępna, dane o inflacji, podaży pieniądza, instrumentach polityki pieniężnej) International Monetary Statistics (rocznik statystyczny MFW) Eurostat, OECD Economic Outlook i wiele innych
Źródła danych Miejsca publikacji danych w internecie: www.stat.gov.pl www.nbp.pl http://europa.eu.int/ European Commission/Eurostat www.oecd.org www.worldbank.org portale www.money.pl www.onet.pl www.bossa.pl
Model a rzeczywistość Jak dalekie uproszczenie rzeczywistości ? Model niezgodny z rzeczywistością czy na odwrót? Błędy w obserwacjach – przykłady. Dane realne czyli wolumeny: indeksy łańcuchowe indeksy jednopodstawowe deflatory deflatory_doit.xls
Do domu Zrobić przykład dla trendu liniowego Przeczytać o założeniach i warunkach stosowalności estymatora KMNK