Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

Michał Kowalczykiewicz Time series forecasting using a hybrid ARIMA and neural network model (na podstawie pracy z Neurocomputing 50 (2003) 159 – 175,

Podobne prezentacje


Prezentacja na temat: "Michał Kowalczykiewicz Time series forecasting using a hybrid ARIMA and neural network model (na podstawie pracy z Neurocomputing 50 (2003) 159 – 175,"— Zapis prezentacji:

1 Michał Kowalczykiewicz Time series forecasting using a hybrid ARIMA and neural network model (na podstawie pracy z Neurocomputing 50 (2003) 159 – 175, autorstwa G. Peter Zhang)

2 Szereg czasowy Szereg czasowy to proces stochastyczny, którego dziedziną jest czas; to zbiór informacji uporządkowanych w czasie, których pomiary wykonywane są z pewnym krokiem czasowym Analiza szeregów czasowych ma dwa główne cele: “ wykrywanie natury zjawiska reprezentowanego przez sekwencję obserwacji ”prognozowanie (przewidywanie przyszłych wartości szeregu czasowego)

3 Analiza szeregów zModele — pure autoregressive (AR) — pure moving avarage (MA) — autoregressive integrated moving average (ARIMA) — bilinear model — threshold autoregressive (TAR) — autoregressive conditional heteroscedastic (ARCH) — artificial neural network (ANN)

4 Analiza szeregów zModele — pure autoregressive (AR) — pure moving avarage (MA) — autoregressive integrated moving average (ARIMA) — bilinear model — threshold autoregressive (TAR) — autoregressive conditional heteroscedastic (ARCH) — artificial neural network (ANN)

5 ARIMA Jest metodą statystyczną służącą do analizowania szeregów czasowych, o liniowych zależnościach między danymi. Autorzy Box i Jenkins, 1976

6 ARIMA zModel: y t = Ө 0 + Ф 1 y t-1 + Ф 2 y t Ф p y t-p + є t - Ө 1 є t-1 - Ө 2 є t Ө q є t-q y t - wartość w czasie t є t - losowy błąd w czasie t Ф i (i = 1, 2,..., p), Ө i (j = 0, 1,..., q) - parametry modelu p, q - porządek modelu є t - niezależne, ze średnią zero i stałą wariancją σ 2

7 ARIMA Budowanie modelu za pomocą metody Boy - Jenkinsa (1976) zAlgorytm –FAZA 1 : identyfikacja modelu –FAZA 2 : estymacja parametrów –FAZA 3 : walidacja

8 ARIMA - identyfikacja modelu z W tej fazie należy ustalić (zidentyfikować) liczbę i typ parametrów modelu ARIMA, czyli określić wartości parametrów p i q.

9 ARIMA - identyfikacja modelu z W tej fazie należy ustalić (zidentyfikować) liczbę i typ parametrów modelu ARIMA, czyli określić wartości parametrów p i q. zKorzysta się z: •autokorelogramu (ACF) •autokorelogramu cząstkowego (PACF)

10 ARIMA - uwagi zWymaga się, by wejściowy szereg dla tej fazy był stacjonarny, to znaczy, powinien on mieć stałą w czasie średnią, wariancję i autokorelację. Dlatego zazwyczaj szereg wymaga różnicowania aż do osiągnięcia stacjonarności zróżnicowanie: y t = y t - y t-1

11 ARIMA - estymacja parametrów zPolega na wyznaczeniu wartości parametrów Ф i (i = 1, 2,..., p), Ө i (j = 0, 1,..., q) dla których otrzymujemy maksymalną wiarygodność (prawdopodobieństwo) otrzymania właśnie obserwowanego szeregu. Aby mierzony błąd był minimalny

12 ARIMA - estymacja parametrów zPolega na wyznaczeniu wartości parametrów Ф i (i = 1, 2,..., p), Ө i (j = 0, 1,..., q) dla których otrzymujemy maksymalną wiarygodność (prawdopodobieństwo) otrzymania właśnie obserwowanego szeregu. Aby mierzony błąd był minimalny z W praktyce wymaga to obliczenia (warunkowych) sum kwadratów reszt przy zadanych parametrach

13 ARIMA - walidacja z W ostatniej fazie oceniamy trafność naszego modelu. Jeśli model zawiera wiele parametrów i\lub wyniki nas nie zadowalają

14 ARIMA - walidacja z W ostatniej fazie oceniamy trafność naszego modelu. Jeśli model zawiera wiele parametrów i\lub wyniki nas nie zadowalają zmożemy próbować powtórnie z innymi wartościami początkowymi parametrów (czyli wracamy do FAZA 1).

15 ANN zJest ogólnym modelem potrafiącym wykrywać nieliniowe zależnościach między danymi, w szeregów czasowych

16 ANN zNajczęściej używaną siecią w tym zagadnieniu jest a sieć GLM zzależność między wyjściem y t, a wejściam (y t-1, y t-2,..., y t-p ), jest następująca: •y t = α 0 + Σ j<=q α j g(Σ i<=p β ij y t-i ) + є t α j (j = 0, 1,..., q), β ij (i = 0, 1,..., p; j = 1, 2,..., q) - wagi p - liczba wejść q - liczba neuronów w warstwie ukrytej

17 ANN Jako funkcję aktywacji środkowej warstwy przyjmuję się funkcje logistic: ˜g(x) = 1 / (1 + exp(-x)) zliczba wejść sieci (p) i liczba neuronów wewnętrznych (q) są dobierane eksperymentalnie.

18 Hybrid zDla danych o których nie wiemy, czy są związki w nich występujące są liniowe czy, też nie żadna z wymienionych metoda nie jest odpowiednia. •Metoda ARIMA nie wykrywa nieliniowości w danych •Sieci neuronowe dają średnie wyniki dla danych w których występują zarówno liniowe jak i nieliniowe związki

19 Hybrid zDla danych o których nie wiemy, czy są związki w nich występujące są liniowe czy, też nie żadna z wymienionych metoda nie jest odpowiednia. •Metoda ARIMA nie wykrywa nieliniowości w danych •Sieci neuronowe dają średnie wyniki dla danych w których występują zarówno liniowe jak i nieliniowe związki zPotrzebujemy uniwersalnego modelu, odpowiedniego dla wszystkich rodzajów danych

20 Hybrid zModel: y t = L t + N t L t - liniowy komponent N t - nieliniowy komponent Te dwa parametry muszą zostać wyznaczone z danych

21 Hybrid - Liniowy komponent ”Liniowy komponent Wpierw metodą ARIMA modelujemy liniowy komponent (Ľ). Jeśli tylko Ľ~L (czyli Ľ zawiera wszystkie liniowe relacje w danych) to residua powstałe z liniowego modelu będą zawierały tylko nieliniowe związki.

22 Hybrid - Nieliniowy komponent —Nieliniowy komponent Niech e t będzie resztą z dopasowanego liniowego modelu w czasie t. Wtedy: e t = y t - Ľ t Te wartości możemy zamodelować za pomocą sieci neuronowej: e t = f(e t-1, e t-2,..., e t-n ) + є t є t - losowy błąd w czasie t

23 Hybrid Ostatecznie y t ~ Ľ t + N t gdzie N t przewidywana wartość w czasie t wyznaczona przez ANN

24 Hybrid - przykłady zTestowane szeregi czasowe: “Lynx “Sunspot “Exchange rate

25 Dziękuję za uwagę


Pobierz ppt "Michał Kowalczykiewicz Time series forecasting using a hybrid ARIMA and neural network model (na podstawie pracy z Neurocomputing 50 (2003) 159 – 175,"

Podobne prezentacje


Reklamy Google