dr Małgorzata Radziukiewicz Szeregi czasowe dr Małgorzata Radziukiewicz
Motto: …Zdobywanie wiedzy polega na przyzwyczajaniu się do pewnych pojęć oraz faktów….
Szeregi czasowe
Szeregi czasowe
Szeregi czasowe
Czas wprowadza w zbiorze zdarzeń relację porządku Szeregi czasowe Zmienna czasowa t Czas wprowadza w zbiorze zdarzeń relację porządku lata t 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 1 2 3 4 5 6 7 8 9 10
Szeregi czasowe Przyjmujemy, że n-elementowy szereg czasowy zapisujemy jako zbiór {(t,yt), gdzie: t= 1, 2, …, n}, czyli uporządkowany zbiór n par wartości zmiennych t i Y, który można przedstawić graficznie jako zbiór n punktów w układzie współrzędnych. Do tego zbioru punktów można dopasować linię o ogólnej postaci: opisującej tendencję rozwojową zjawiska w czasie.
nazywa się modelem trendu. Szeregi czasowe Funkcję: nazywa się modelem trendu. ■ Przy jej wyznaczaniu postępuje się identycznie jak przy budowie modelu regresji z jedną zmienną niezależną. ■ Postać dopasowywanej funkcji trendu wybiera się najczęściej na podstawie wykresu szeregu czasowego.
Szeregi czasowe Zakładamy, iż w szeregu stanowiącym podstawę analizy nie ma wahań sezonowych (wahań takich nie ma nigdy w danych rocznych). Model tendencji rozwojowej z liniową funkcją trendu przyjmuje postać: gdzie : yt – poziom zjawiska w okresie t, liniowa funkcja trendu, εt – składnik losowy dla okresu t
Szeregi czasowe Przyjmując odnośnie do rozkładu εt takie same założenia jak w klasycznym modelu regresji, uzyskujemy podstawę do szacowania parametrów funkcji trendu za pomocą MNK. Są to następujące założenia:
Szeregi czasowe Estymatory parametrów α0 i α1 liniowej funkcji trendu są następujące:
Liniowy model trendu – szacowanie parametrów Przykład 1. Na podstawie poniższych danych o nakładach książek i broszur (w mln. egzemplarzy) wydanych w Polsce w latach 1990-1997: lata 1990 1991 1992 1993 1994 1995 1996 1997 nakład 176 126 103 99 116 80 94 a) zinterpretuj parametry modelu i wypowiedz się na jego temat; b) wyjaśnij, jak przebiegały kolejne etapy obliczeń; c) podaj prognozę wraz z błędem standardowym nakładu książek i broszur w 1999 roku
Liniowy model trendu – wyznaczanie parametrów obliczenia pomocnicze lata Nakład (Y) t Y· t t2 1990 176 1 1991 126 2 252 4 1992 3 378 9 1993 103 412 16 1994 99 5 495 25 1995 116 6 696 36 1996 80 7 560 49 1997 94 8 752 64 ∑ 920 3721 204
Estymatory parametrów modelu trendu liniowego
Postać funkcji trendu i interpretacja oszacowanych parametrów Wyznaczona liniowa funkcja trendu ma postać: interpretacja: ocena parametru 0 ustalona na poziomie a0 = 159,893 informuje o wielkości nakładów książek i broszur w Polsce w roku 1989. ocena parametru 1 ustalona na poziomie a1 = -9,976 informuje, wielkość nakładów książek i broszur w Polsce w latach 1990-1997 malała średniorocznie o 9,976 mln. egzemplarzy (nazywany współczynnikiem trendu liniowego).
interpretacja c.d. współczynnik trendu liniowego a1 możemy interpretować jako przeciętny przyrost zmiennej Y na jednostkę czasu; dlatego z funkcji liniowej korzysta się, gdy można przyjąć, iż przyrosty absolutne zjawiska w kolejnych okresach są w przybliżeniu stałe.
weryfikacja modelu wyznaczony z otrzymanej funkcji trendu „teoretyczny” nakład książek i broszur: obliczenia pomocnicze: t Yt Y2t et e2t 1 176 149,92 30976 26,08 680,1664 2 126 139,94 15876 -13,94 194,3236 3 129,96 -3,96 15,6816 4 103 119,99 10609 -16,99 288,6601 5 99 110,01 9801 -11,01 121,2201 6 116 100,04 13456 15,96 254,7216 7 80 90,06 6400 -10,06 101,2036 8 94 80,08 8836 13,92 193,7664 ∑36 920 x 111830 0,0 1849,743
Rysunek 1 Rys.1. Szereg czasowy nakładu książek i broszur i dopasowana do niego prosta
ocena składnika losowego modelu
ocena składnika losowego modelu interpretacja błędu estymacji S(e): odchylenie reszt, będące miarą przypadkowych odchyleń nakładu książek i broszur od liniowego trendu wynosi 17,559 mln egzemplarzy
współczynnik zmienności interpretacja współczynnika zmienności V: odchylenia losowe (odchylenia obserwacji teoretycznych od rzeczywistych) nakładu książek i broszur stanowią 15,27% średniego nakładu książek i broszur
współczynnik zbieżności interpretacja φ2 : liniowy model trendu nie wyjaśnia około 30,7% całkowitej zmienności nakładu książek i broszur w rozpatrywanym okresie
współczynnik determinacji interpretacja R2 : liniowy trend wyjaśnia 69,7% całkowitego zróżnicowania nakładu książek i broszur w rozpatrywanym okresie
Weryfikacja modelu c.d. czy czas istotnie objaśnia nakład książek i broszur? czy reszty są losowe? czy występuje autokorelacja reszt? test t-Studenta test serii test Durbina-Watsona
Prognoza wielkości nakładu książek i broszur w 1999 roku wyniesie: Prognoza punktowa Model tendencji z dobrze dobraną funkcją trendu można wykorzystać do prognozowania zjawiska na przyszłe okresy. Prognoza ma charakter ekstrapolacji tzn. przeniesienia zaobserwowanej tendencji rozwojowej na przyszłe okresy. Oznaczając przez T okres, którego dotyczy prognoza, jej wartość obliczymy z otrzymanej funkcji trendu: Wyznaczony model wykorzystamy do określenia progozy nakładu książek i broszur w 1999 roku. W przyjętym systemie numeracji rok ten ma numer T=10. Prognoza wielkości nakładu książek i broszur w 1999 roku wyniesie: mln egzemplarzy
Standardowy błąd prognozy obliczanie standardowego błędu prognozy VT:
Standardowy błąd prognozy Interpretacja standardowego błędu prognozy VT: Przeciętnie biorąc, prawdziwe wartości zmiennej Y będą się odchylać od wyznaczonej prognozy średnio o wartość ± VT . Przykład: Przeciętnie biorąc, nakład książek i broszur w 1999 roku będzie się odchylał od prognozy nakładu książek i broszur (60,133 mln egzemplarzy) średnio o ± 26,83 mln egzemplarzy.
Względny standardowy błąd prognozy Względny błąd prognozy ex ante: Obliczenia: Interpretacja: W 1999 roku przeciętne oczekiwane odchylenie nakładu książek i broszur od prognozowanej wielkości nakładu książek i broszur stanowić będzie około 40% wartości prognozy. Procentowy rząd odchyleń prognozy od rzeczywistej wielkości nakładu książek i broszur jest bardzo duży i wynosi około 40%.
Prognoza przedziałowa Z tablicy t-Studenta dla n-(k+1) stopni swobody (8-(1+1)=6 ) oraz poziomu ufności 1- (0,95) odczytujemy t = 2,447 . Wyznaczamy granice przedziału prognozy: dolna granica 60,133 - 2,447· 23,85=1,772 górna granica 60,133 + 2,447· 23,85=118,49 Przedział prognozy jest więc następujący: [1,772 ; 118,49] Z prawdopodobieństwem równym 0,95 można przypuszczać, że w 1999 roku nakład książek i broszur będzie się zawierać w tym przedziale