Pobierz prezentację
Pobieranie prezentacji. Proszę czekać
1
Selekcja danych Analiza widmowa FFT
2
Selekcja zmiennych w trybie zaawansowanym - metoda analizy widma częstotliwościowego (analiza harmoniczna): Szukanie związków pomiędzy danymi Automatyczne tworzenie grup powiązanych zmiennych
3
Ogólne informacje dotyczące metody – analiza widmowa – FFT 1/5
Analiza widma częstotliwościowego (analiza harmoniczna, analiza Fouriera) polega na przedstawieniu szeregu czasowego (zmiennej) w postaci sumy krzywych będących sinusoidami i/lub cosinusoidami o różnych amplitudach, częstotliwościach i fazach. Najczęściej budowany jest wykres zależności amplitudy od częstotliwości zwany periodogramem. Na periodogramie zaznaczone są częstotliwości, których amplitudy wykazują wartości znacząco większe niż dla częstotliwości sąsiadujących. Są to właśnie częstotliwości (cykle, harmoniczne) dominujące. Kilka z nich (liczbę wybiera Użytkownik) uwzględnia się w procesie selekcji. Poszukujemy zmiennych spełniających następujące warunki – takich, których cykle dominujące mają taką samą częstotliwość jak cykle dominujące zmiennej objaśnianej.
4
Ogólne informacje dotyczące metody – analiza widmowa – FFT 2/5
Poszukujemy zmiennych spełniających następujące warunki: cykle dominujące mają taką samą częstotliwość jak cykle dominujące zmiennej objaśnianej cykle dominujące wyjaśniają znaczną część wariancji danej zmiennej fazy cykli dominujących zmiennej objaśniającej wyprzedzają fazy cykli dominujących zmiennej objaśnianej
5
Częstotliwości dominujące
Ogólne informacje dotyczące metody – analiza widmowa – FFT 3/5 - periodogram Częstotliwości dominujące
6
Ogólne informacje dotyczące metody – analiza widmowa – FFT 4/5
7
Ogólne informacje dotyczące metody – analiza widmowa – FFT 5/5
8
Przejście do narzędzi selekcji zmiennych 1/2
W procesie automatycznej selekcji zmiennych przeszukiwane są bazy danych w celu wybrania grupy danych powiązanych z tzw. zmienną opisywaną. Zmienna opisywana, to taka wielkość, którą analizujemy, np. waluta, surowiec wskaźnik makroekonomiczny, itp. Zwykle w pierwszym etapie analizy zależy nam na wybraniu czynników powiązanych z tą zmienną – wpływających na nią. Powiązania dotyczą parametrów statystycznych i mogą uwzględniać przesunięcia czasowe, dzięki czemu wybrane czynniki mogły stanowić bazę do budowania modeli prognostycznych interesującego nas zjawiska.
9
Wejście do opcji automatycznej selekcji zmiennych
Przejście do narzędzi selekcji zmiennych 2/2 Wejście do opcji automatycznej selekcji zmiennych
10
Przejście do kolejnego etapu selekcji
Wybór miary podobieństwa Przejście do kolejnego etapu selekcji W przypadku selekcji zmiennych metodą analizy widmowej – wybieramy odpowiednią opcję
11
Opcje selekcji zmiennych metodą analizy widmowej
W panelu selekcji automatycznej wyróżnić można dwie grupy ustawień ważnych z punktu widzenia końcowej konfiguracji oraz uzyskanych wyników. Grupa pierwsza, to warunki logiczne uwzględniające słowa kluczowe. Grupa druga to parametry liczbowe (progi, zakresy itp.)
12
Grupa warunków logicznych
Opcje selekcji zmiennych metodą analizy widmowej - warunki logiczne uwzględniające słowa kluczowe Grupa warunków logicznych
13
Opcje selekcji zmiennych metodą analizy widmowej – parametry liczbowe
Opcja pojemności informacyjnej tworzonego zbioru Parametry analizy widmowej Definiowanie liczebności tworzonej grupy Interwał czasowy dla którego obliczane są miary podobieństwa Warunki brzegowe współczynnika korelacji
14
Opcje selekcji zmiennych metodą analizy widmowej – warunki logiczne 1/2
Warunki logiczne służą do ukierunkowania procesu selekcji. Warunki logiczne mogą dotyczyć: Zakresu dat notowań w bazie – można określić, że w procesie selekcji chcemy uzyskać zmienne notowane odpowiednio długo („data od”) lub/oraz takie, które nie wygasły – mają „świeżą” datę notowań („data do”). Tylko długie szeregi dostarczają pożądanych informacji statystycznych. Tylko niewygasłe serie mogą służyć do bieżących analiz i prognoz. Tematyki zdefiniowanej w nazwie serii – możemy ukierunkować selekcję na dane z określonej dziedziny. Źródeł danych – proces selekcji można zawęzić tylko do wybranych baz danych. Interwałów czasowych – baza zawiera serie o różnych interwałach czasowych. Wyszukiwanie można ograniczyć tylko do określonych interwałów, np. tylko dane dzienne lub tylko miesięczne.
15
Opcje selekcji zmiennych metodą analizy widmowej – warunki logiczne 2/2
Warunki dotyczące zakresu dat notowań w bazie Warunki dotyczące zakresu interwałów czasowych Pola wyboru warunków logicznych Warunki dotyczące źródeł danych Warunki dotyczące tematyki – nazwy zmiennych Warunki wybierane są z listy i łączone operatorami logicznymi AND/OR. Warunki mogą być dowolnie rozbudowywane przez Użytkownika
16
Opcje selekcji zmiennych metodą analizy widmowej – parametry liczbowe 1/9
Poszukujemy zmiennych spełniających następujące warunki: cykle dominujące mają taką samą częstotliwość jak cykle dominujące zmiennej objaśnianej – parametr „Liczba znaczących harmonicznych” cykle dominujące wyjaśniają znaczną część wariancji danej zmiennej – parametry „Minimalny próg objaśnialności” i „Współczynnik wygładzenia” fazy cykli dominujących zmiennej objaśniającej wyprzedzają fazy cykli dominujących zmiennej objaśnianej – wówczas sortowanie końcowe odbywa się według wielkości wyprzedzeń fazowych cykli dominujących (opcjonalnie - według stopnia objaśnialności).
17
Opcje selekcji zmiennych metodą analizy widmowej – parametry liczbowe 2/9
Liczba znaczących harmonicznych uwzględnianych w procesie selekcji Parametr wygładzenia regulujący przebieg trendu szeregu czasowego Minimalny stopień wyjaśnienia wariancji szeregu czasowego przez znaczące harmoniczne (cykle dominujące) Wybór przedmiotu badania (szereg czasowy lub odległość szeregu czasowego od własnego trendu)
18
Opcje selekcji zmiennych metodą analizy widmowej – parametry liczbowe 3/9
Sortowanie końcowe według stopnia objaśniania wariancji lub według wielkości wyprzedzeń fazowych cykli dominujących
19
Opcje selekcji zmiennych metodą analizy widmowej – parametry liczbowe 4/9
Periodogram - liczba znaczących harmonicznych uwzględnianych w procesie selekcji. Proponuje ją Użytkownik (tutaj trzy)
20
Opcje selekcji zmiennych metodą analizy widmowej – parametry liczbowe 5/9
Przedmiotem badania (rozkładu na harmoniczne) jest zwykle odległość szeregu czasowego od własnego trendu. Niekiedy może to być sam szereg czasowy. Parametr regulujący przebieg trendu danej zmiennej ma duże znaczenie dla przebiegu trendu. Zwiększenie wartości parametru powoduje, że przebieg trendu jest mniej dopasowany do szeregu czasowego (bardziej wygładzony). Bardzo duża wartość to trend zbliżony do liniowego.
21
Opcje selekcji zmiennych metodą analizy widmowej – parametry liczbowe 6/9
Przedmiotem badania (rozkładu na harmoniczne) jest zwykle odległość szeregu czasowego od własnego trendu. Niekiedy może to być sam szereg czasowy. Zwiększenie wartości parametru powoduje, że przebieg trendu jest mniej dopasowany do szeregu czasowego (bardziej wygładzony)
22
Opcje selekcji zmiennych metodą analizy widmowej – parametry liczbowe 7/9
Stopień wyjaśniania wariancji danej zmiennej przez cykle dominujące zależy między innymi od liczby uwzględnionych cykli. Więcej cykli oznacza większy stopień wyjaśnienia. Jednak w praktyce możemy uwzględnić jedynie kilka najistotniejszych cykli, ponieważ w przypadku ich większej liczby coraz trudniej znaleźć zmienne spełniające wszystkie warunki.
23
Opcje selekcji zmiennych metodą analizy widmowej – parametry analizy widmowej 8/9
Złożenie kilku cykli dominujących – słabsze wyjaśnienie zmienności, ale łatwiej znaleźć zmienne spełniające wszystkie warunki
24
Opcje selekcji zmiennych metodą analizy widmowej – parametry analizy widmowej 9/9
Większa liczba cykli dominujących – lepsze wyjaśnienie zmienności, ale trudniej znaleźć zmienne spełniające wszystkie warunki
25
Opcje selekcji zmiennych metodą analizy widmowej – liczebność tworzonej grupy 1/2
Wielkość tworzonej grupy może być zdefiniowana przez użytkownika. Grupa może zawierać wszystkie zmienne spełniające brzegowe warunki korelacji lub tylko określoną ilość zmiennych najbardziej skorelowanych z wielkością opisywaną. Zwykle do budowy modelu predykcyjnego wykorzystuje się od kilku do kilkudziesięciu najbardziej powiązanych czynników. W przypadku wcześniejszego ustawienia warunku dotyczącego wyprzedzenia czasowego, korelacja uwzględnia to wyprzedzenie.
26
Definiowanie liczebności tworzonej grupy
Opcje selekcji zmiennych metodą analizy widmowej – liczebność tworzonej grupy 2/2 Definiowanie liczebności tworzonej grupy Opcja pojemności informacyjnej redukuje ryzyko współliniowości zmiennych
27
Opcje selekcji zmiennych metodą analizy widmowej – różnicowanie danych i okres badania widma 1/2
Opcja różnicowania zmiennych umożliwia znalezienie danych, które wykazują podobieństwo na poziomie zmian. W przypadku cen lub notowań rynkowych szukamy wtedy zmiennych podobnych co do dynamiki zmian cenowych lub różnicy notowań. Zakres czasowy analizy widmowej – badamy widmo od … (data początkowa) do … (data końcowa). W przypadku budowania grupy pod kątem tworzenia modelu prognostycznego musimy uwzględnić okres testowy. Zdefiniowany zakres czasowy analizy widmowej (badania widma) NIE POWINIEN uwzględniać okresu testowego – te okresy POWINNY BYĆ ROZŁĄCZNE
28
Opcje selekcji zmiennych metodą analizy widmowej – różnicowanie danych i okres badania widma 2/2
Opcja różnicowania danych Parametr różnicowania danych związany jest z interwałem czasowym. W tym przypadku szukamy danych, które wykazują podobieństwo na poziomie zmian trzymiesięcznych Zakres czasowy badania widma
29
Uruchomienie procesu selekcji
30
Dane kontaktowe ExMetrix Sp. Z o.o. ul. Grzegórzecka 21 31-532 Kraków
NIP: Zbigniew Łukoś Ryszard Łukoś Konrad Pawlus
Podobne prezentacje
© 2024 SlidePlayer.pl Inc.
All rights reserved.