Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

1 Prognozowanie stochastyczne Anna Matysiak Instytut Statystyki i Demografii SGH Wykład w ramach kursu Modele i Prognozy Demograficzne.

Podobne prezentacje


Prezentacja na temat: "1 Prognozowanie stochastyczne Anna Matysiak Instytut Statystyki i Demografii SGH Wykład w ramach kursu Modele i Prognozy Demograficzne."— Zapis prezentacji:

1 1 Prognozowanie stochastyczne Anna Matysiak Instytut Statystyki i Demografii SGH Wykład w ramach kursu Modele i Prognozy Demograficzne Warszawa,

2 2 Plan wykładu 1.Wprowadzenie 2.Prognoza stochastyczna versus prognoza deterministyczna 3.Etapy w prognozowaniu stochastycznym 4.Przedziały predykcji 5.Prognoza stochastyczna ludności Polski –Konstrukcja założeń –Wyniki prognozy 5. Linki i publikacje o prognozowaniu stochastycznym

3 3 Szybkie zmiany demograficzne Brak pełnego zrozumienia procesów demograficznych Wysoka niepewność dot. liczby i struktury ludności Potrzeba posiadania wiarygodnych prognoz ludności w celu tworzenia odpowiednich polityk Konieczność ilościowego ujęcia niepewności dot. płodności, umieralności i migracji Zapotrzebowanie na precyzyjne prognozy

4 4 Tymczasem… Prognozy przygotowane po 1960 w Europie Zachodniej: przeszacowały współczynniki urodzeń: –o 0,3 urodzeń na kobietę (prognozy na 15 lat) –o 0,4 urodzeń na kobietę (prognozy na 25 lat) niedoszacowały przeciętne trwanie życia: –o ok. 1-1,3 roku (prognozy na 10 lat wprzód) –3,2-3,4 roku (prognozy na 20 lat wprzód) niedoszacowały migracje netto o ok. 3/1000 osób (prognozy na 20 lat wprzód)

5 5 Prognoza deterministyczna vs. stochastyczna Prognozy deterministyczne nie ujmują niepewności w sposób ilościowy. Warianty: niski, średni, wysoki, ale nie wiadomo jakie jest prawdopodobieństwo realizacji poszczególnych wariantów! Prognoza stochastyczna (probabilistyczna) Zmienne wykorzystywane w konstrukcji prognozy oraz wyniki prognoz są traktowane jako zmienne losowe => wyniki prognoz stochastycznych są przedstawione w formie przedziałów ufności; oznacza to, że znane jest prawdopodobieństwo realizacji określonego scenariusza. Inne zalety prognoz stochastycznych nad deterministycznymi: Uzyskane liczby ludności niekoniecznie są wynikiem odgórnie narzuconych założeń o płodności, umieralności i migracjach netto; są wynikiem wielu losowych kombinacji poziomów płodności, umieralności i migracji Ponadto w prognozach stochastycznych możliwe są nagłe zmiany w poziomie płodności, umieralności czy migracji netto; w prognozach deterministycznych prawdopodobieństwo nagłych zmian jest zazwyczaj równe zeru.

6 6 Źródło: prognoza Eurostatu EUROPOP2004 Prognoza Eurostatu EUROPOP warianty rozwoju ludności Polski: niski, średni i wysoki Nie wiadomo, jakie jest prawdopodobieństwo realizacji tych wariantów ani wariantów pośrednich. Prognoza deterministyczna

7 7 Źródło: Matysiak, Nowok (w druku) Prognoza stochastyczna Liczba ludności Polski w 2050r. będzie: mln z prawdo- podobieństwem 50%, wyższa niż 41.6 mln z prawdopodobieństwem 10%, niższa niż 21.0 mln z prawdopodobieństwem 10%, wyższa niż w 2004r. z prawdopodobieństwem 18,2%. Uwaga: Założenia prognozy Eurostatu oraz prezentowanej prognozy stochastycznej są różne

8 8 Prognoza stochastyczna 50% przedział ufności 80% przedział ufności Rozkład prognozowanej liczby ludności w 2050r. Mediana, średnia, dominanta; także prognoza punktowa mln

9 9 Konstrukcja prognozy deterministycznej Dane wejściowe: Wyjściowa struktura ludności wg płci i wieku L(x,s,t=0) Zakładane cząstkowe współczynniki płodności w okresie prognozy f(x,t), t=1,…,T Zakładane cząstkowe współczynniki umieralności wg płci m(x,s,t) dla t=1,…,T Zakładane strumienie migracji netto wg płci i wieku n(x,s,t) dla t=1,…,T Procedura: Ustalenie liczby urodzeń, zgonów oraz migracji netto w kolejnych latach prognozy oraz wyznaczenie liczby ludności przy wykorzystaniu równania ruchu ludności (metoda składnikowa). Różne warianty prognozy: Zmieniając założenia dot. płodności, umieralności i/lub migracji otrzymujemy alternatywne scenariusze prognozy (warianty).

10 10 Konstrukcja prognozy stochastycznej Dane wejściowe: Wyjściowa struktura ludności wg płci i wieku Założenia o najbardziej prawdopodobnym przebiegu płodności f(x,t) dla t=1,…,T (punktowa prognoza f(x,t)) Założenia o najbardziej prawdopodobnym przebiegu umieralności m(x,s,t) dla t=1,…,T (punktowa prognoza m(x,s,t)) Założenia o najbardziej prawdopodobnym przebiegu migracji netto n(x,s,t) dla t=1,…,T (punktowa prognoza n(x,s,t)) + założenia o niepewności f(x,t), m(x,s,t) i n(x,s,t). Procedura: 1. Ustanowienie przedziałów predykcji dla f(x,t), m(x,s,t), n(x,s,t) 2. Losowy dobór f(x,t), m(x,s,t) i n(x,s,t) z ustanowionych przedziałów 3. Obliczenie liczby ludności na podstawie wylosowanych f(x,t), m(x,s,t) i n(x,s,t) za pomocą metody składnikowej 4. Wielokrotne powtórzenie kroków 2 i 3 (kilka tysięcy razy) -> rozkład liczby ludności L(x,s,t).

11 11 Przykład symulacji

12 12 Przedział predykcji 1.Ustalić typ rozkładu prawdopodobieństwa dla f(x,t), m(x,s,t), n(x,t) – najczęściej rozkład normalny na skali logarytmicznej –Jeśli przyjmiemy rozkład normalny to wartość oczekiwana rozkładu daje prognozę punktową. Jest to jednocześnie dominanta rozkładu – wartość, wokół której skupia się duża część masy rozkładu. Jest to zatem wartość najbardziej prawdopodobna (ang. best guess). 2. Ustalić wariancję rozkładu - określa dyspersję rozkładu, jest zatem miarą niepewności) prognoza punktowa (ang. point forecast)

13 13 Szacowanie wariancji rozkładu 1.Analiza szeregów czasowych 2.Analiza błędów przeszłych prognoz lub prognoz naiwnych 3.Opinia ekspertów Przeważnie używa się kombinacji co najmniej dwóch z tych metod

14 14 Analiza szeregów czasowych Pozwala wyznaczyć: prognozę punktową wariancję rozkładu Wady: Wymaga długich szeregów czasowych (min 50 obserwacji), dla wielu krajów dane takie są niedostępne lub niskiej jakości, Z drugiej strony korzystanie z danych z odległej przeszłości budzi zastrzeżenia, gdyż natura procesów demograficznych silnie się zmieniła, Wariancje oszacowane na podstawie analizy szeregów czasowych są zazwyczaj relatywnie duże

15 15 Analiza szeregów czasowych Płodność – Auroregressive Conditional Heteroscedastic (ARCH) model Umieralność – Generalized Autoregressive Conditional Heteroscedasticity (GARCH) model Migracje – próby analiz za pomocą Random walk with drift (RWD) i Autoregressive AR(1) Process (AR(1) daje znacznie szersze przedziały niż RWD)

16 16 Analiza błędów przeszłych prognoz Źródło: European Commission (2005). Changing Population of Europe: Uncertain Future, UPE (final project report). Luxembourg: Office for Official Publications of the EC.

17 17 Analiza błędów przeszłych prognoz Źródło: European Commission (2005). Changing Population of Europe: Uncertain Future, UPE (final project report). Luxembourg: Office for Official Publications of the EC.

18 18 Analiza błędów prognoz naiwnych Często prognozy z odległej przeszłości są niedostępne, źle udokumentowane lub w ogóle ich nie ma, Wówczas można skorzystać z prognoz naiwnych (np. płodność pozostanie na obecnym poziomie, współczynniki umieralności będą spadać w takim samym tempie jak w ostatnich kilkudziesięciu latach), Prognozy naiwne z założenia generują najwyższe z możliwych błędów.

19 19 Analiza błędów prognoz naiwnych Źródło: Alho J., Spencer B., 2005, str. 254 Analiza dla 6 krajów europejskich (Dania, Finlandia, Islandia, Holandia, Norwegia, Szwecja) w okresie 1751/ Błędy relatywne w naiwnych prognozach płodności Mediana błędów relatywnych Składnik losowy w random walk o wariancji 0,06 2

20 20 Analiza błędów prognoz naiwnych Źródło: Alho J., Spencer B., 2005, str. 255 Analiza dla 9 krajów europejskich (Austria, Dania, Francja, Włochy, Holandia, Norwegia, Szwecja, Szwajcaria, Wielka Brytania) w okresie do 2000 (początek okresu różny w zależności od kraju, najwcześniej dla Wielkiej Brytanii – 1841r.). Błędy relatywne w naiwnych prognozach umieralności Mediana błędów relatywnych Składnik losowy w random walk o wariancji 0,06 2 Lepsze dopaso- wanie: random walk with drift

21 21 Opinia ekspertów Przydatna w celu skorygowania wariancji rozkładu (a także prognoz punktowych) oszacowanych za pomocą analizy szeregów czasowych oraz analizy błędów przeszłych / naiwnych prognoz, Eksperci są proszeni o ocenę prawdopodobieństwa, że określona miara (np. TFR, e0) znajdzie się w określonym przedziale.

22 22 Przykład prognozy stochastycznej Prognoza ludności Polski Na podstawie Matysiak A., Nowok B. Stochastic forecast of the population of Poland, (w druku)

23 23 Założenia dot. płodności Założenia: Prognoza punktowa: Współczynnik płodności ogólnej (TFR) wzrasta do 1.35 do 2030 a następnie pozostaje na tym poziomie, Wariancja rozkładu: wykorzystano oszacowania na podstawie prognoz naiwnych Alho & Spencer (2005) (patrz slajd nr 20) Interpretacja przedziału predykcji: Współczynnik płodności ogólnej w 2050 znajdzie się w przedziale 0,9- 2,2 z prawdopodobieństwem 80%. Prawdopodobieństwo, że współczynnik płodności ogólnej będzie niższy niż w 2004r. wynosi 38%. Prawdopodobieństwa, że warianty średnie prognoz GUSu (w 2030), Eurostatu i ONZ (w 2050) przeszacowują współczynnik płodności ogólnej wynoszą: 31%, 71% i 81%.

24 24 Założenia dot. umieralności Prognoza punktowa: Cząstkowe współczynniki umieralności będą spadać liniowo do 2030r. do poziomu przeciętnych stóp spadku współczynników umieralności zaobserwowanych w najbardziej rozwiniętych krajach europejskich w ostatnich 30 latach W okresie cząstkowe współczynniki umieralności będą się obniżać w tempie ww. krajów europejskich, korekta w celu zmniejszenia różnic w umieralności pomiędzy kobietami a mężczyznami Wariancja rozkładu: Wykorzystano oszacowania na podstawie prognoz naiwnych Alho & Spencer (2005) (patrz slajd nr 21) Zdaniem ekspertów uzyskane przedziały predykcji były stosunkowo wąskie -> korekta na podstawie wyników prognoz dla innych krajów europejskich (projekt UPE)

25 25 Założenia dot. umieralności e0 - mężczyźnie0 - kobiety Interpretacja przedziału predykcji: Z prawdopodobieństwem 80% e0 w 2050r. będzie mieścić się w przedziale (mężczyźni) oraz (kobiety) e0 dla mężczyzn w 2050r jest niedoszacowanie z prawdopodobieństwem 55,4% (Eurostat) i 73,6% (ONZ) e0 dla kobiet w 2050r jest niedoszacowanie z prawdopodobieństwem 77,2% (Eurostat) i 80,7% (ONZ)

26 26 Założenia dot. migracji Prognoza punktowa: Założenia dot. zmian w poziomie migracji netto zbudowano na podstawie przewidywań odnośnie dat otwarcia rynków pracy dla Polaków przez kraje UE Do 2012 Polska będzie doświadczać odpływu ludności W wyniku rozwoju gospodarczego po 2010 Polska zacznie coraz silniej doświadczać napływu imigrantów ze Wschodu; stopniowo emigranci polscy zaczną powracać do kraju Od 2025 r. Polska będzie krajem o dodatnim saldzie migracji, w 2050r. wyniesie ono osób Wariancja rozkładu: Odchylenie standardowe migracji netto w 2050r. zostało ustalone na poziomie 6 ludności w 2004r. Odchylenie to jest stosunkowo wysokie ze względu na słabe zrozumienie procesów migracyjnych (-> trudności w przewidzeniu kierunku i skali zmian) oraz niską jakość danych migracyjnych w Polsce.

27 27 Założenia dot. migracji Interpretacja przedziału predykcji: z prawdopodobieństwem 80% migracje netto w 2050r. będą w przedziale [ ; ] a skumulowane migracje netto będą w przedziale [ ; ], prawdopodobieństwo, że migracje netto w 2050 będą dodatnie wynosi 57%

28 28 Wyniki – liczba ludności Liczba ludności Polski w 2050r. będzie: mln z prawdopodobień- stwem 50%, mln z prawdopodobień- stwem 80%, wyższa niż w 2004r. z prawdopodo- bieństwem 18,2%. Prawdopodobieństwo, że liczba ludności w 2050r. będzie niższa niż przewiduje: Eurostat wynosi 61%, ONZ wynosi 53%, Prawdopodobieństwo że GUS przeszacowuje liczbę ludności w 2030r. wynosi 57%.

29 29 Wyniki - struktura wieku tys.

30 30 Wyniki – współczynniki obciążeń Demograficzny współczynnik obciążeń osobami w wieku 65+ (old-age dependency ratio – OADR): najprawdopodobniej wzrośnie z 21% do 64% w 2050r., z prawdopodobieństwem 10% przekroczy 94%

31 31 Relatywne błędy - analiza wrażliwości Prognoza liczby ludności, analiza wrażliwości na skutek zmian w wysokości relatywnych błędów dla płodności dla umieralności

32 32 Relatywne błędy - analiza wrażliwości Prognoza liczby ludności, analiza wrażliwości na skutek zmian w wysokości relatywnych błędów dla migracji

33 33 Publikacje i linki Projekt Changing Population of Europe: Uncertain Future (UPE) - bogate materiały na temat prognozowania stochastycznego oraz wyniki prognoz dla 18 krajów europejskich, Oprogramowanie do prognozowania stochastycznego PEP (Program for Error Propagation) Alho J., Spencer B. 2005, Statistical Demography and Forecasting, New York: Springer Science + Business Media Przykładowe prognozy: Australia: Wilson T., Bell M., 2005, Australias uncertain demographic future, Demographic Research Vol. 11, Article 8, : Finlandia: Alho J. (2002), The population of Finalnd in 2050 and beyond, ETLA Disussion Paper No 826, Litwa: Alho, J. (1998). Stochastic Forecast of the Lithuanian Population Research Report P R. Joensuu: University of Joensuu, Department of Statistics, Polska: Matysiak A., Nowok B.,2006, Stochastic forecast of the population of Poland, MPIDR Working Paper Nr 26,


Pobierz ppt "1 Prognozowanie stochastyczne Anna Matysiak Instytut Statystyki i Demografii SGH Wykład w ramach kursu Modele i Prognozy Demograficzne."

Podobne prezentacje


Reklamy Google