Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

Selekcja danych Korelacja w czasie.

Podobne prezentacje


Prezentacja na temat: "Selekcja danych Korelacja w czasie."— Zapis prezentacji:

1 Selekcja danych Korelacja w czasie

2 Selekcja zmiennych w trybie zaawansowanym -
metoda przebiegu korelacji w czasie: Szukanie związków pomiędzy danymi Automatyczne tworzenie powiązanych zmiennych

3 Ogólne informacje dotyczące metody – korelacja w czasie
W przypadku „korelacji w czasie” – współczynnik korelacji liczony jest na przesuwanym oknie czasowym. Powstaje ciągła funkcja przedstawiająca przebieg korelacji w dziedzinie czasu. Dzięki takiemu podejściu możliwe jest ustawienie warunków dotyczących charakteru funkcji korelacji czyli na przykład: korelacja większa niż zadane parametry brzegowe oraz rosnąca na ostatnim okresie. Takie dodatkowe warunki umożliwiają dobór czynników wzajemnie powiązanych z dodatkowym warunkiem powodującym, że wybrane zmienne nie wykazują osłabienia współzależności na końcu badanego okresu. Szerokość okna oraz krok jego przesunięcia są definiowana przez Użytkownika. Minimalna szerokość musi odpowiadać 30 interwałom czasowym, dla których wykonywana jest analiza. Jest to spowodowane metodologią obliczeń statystycznych.

4 Ogólne informacje dotyczące metody – korelacja w czasie - schemat
Współczynnik korelacji liczony jest krokowo dla każdego z nachodzących na siebie przedziałów. Szerokość okna oraz krok przesunięcia są definiowane przez Użytkownika. Minimalna długość okna wynosi 30 interwałów czasowych. Jest to spowodowane wymaganiami obliczeń statystycznych.

5 Wybór narzędzi selekcji zmiennych
Przycisk „Szukaj podobnych” prowadzi do metod selekcji automatycznej zmiennych. W procesie automatycznej selekcji zmiennych przeszukiwane są bazy danych w celu wybrania grupy danych powiązanych z tzw. zmienną opisywaną. Zmienna opisywana, to taka wielkość, którą analizujemy, np. waluta, surowiec wskaźnik makroekonomiczny itp. Zwykle w pierwszym etapie analizy zależy nam na wybraniu czynników powiązanych z tą zmienną – wpływających na nią. Powiązania dotyczą parametrów statystycznych i mogą uwzględniać przesunięcia czasowe, dzięki czemu wybrane czynniki mogły stanowić bazę do budowania modeli prognostycznych interesującego nas zjawiska

6 Przejście do kolejnego etapu selekcji
Wybór miary podobieństwa Przejście do kolejnego etapu selekcji W przypadku selekcji zmiennych metodą korelacji w czasie – wybieramy odpowiednią opcję

7 Opcje selekcji zmiennych metodą korelacji w czasie – widok ogólny
Grupa warunków logicznych Opcja pojemności informacyjnej tworzonego zbioru Opcje wyprzedzenia czasowego Definiowanie liczebności tworzonej grupy Interwał czasowy dla którego obliczane są miary podobieństwa Warunki dotyczące przebiegu funkcji korelacji Parametry szerokości okna oraz kroku jego przesuwania– minimalna szerokość okna wynosi 30 interwałów czasowych Sprawdzanie czy znak współczynnika korelacji jest taki sam we wszystkich przedziałach Warunki brzegowe współczynnika korelacji

8 Opcje selekcji zmiennych metodą korelacji w czasie – warunki logiczne 1/2
Warunki logiczne służą do ukierunkowania procesu selekcji. Warunki logiczne mogą dotyczyć: Zakresu dat notowań w bazie – można określić, że w procesie selekcji chcemy uzyskać zmienne notowane odpowiednio długo („data od”) lub/oraz takie, które nie wygasły – mają „świeżą” datę notowań („data do”). Tylko długie szeregi dostarczają pożądanych informacji statystycznych. Tylko niewygasłe serie mogą służyć do bieżących analiz i prognoz. Tematyki zdefiniowanej w nazwie serii – możemy ukierunkować selekcję na dane z określonej dziedziny Źródeł danych – proces selekcji można zawęzić tylko do wybranych baz danych Interwałów czasowych – baza zawiera serie o różnych interwałach czasowych. Wyszukiwanie można ograniczyć tylko do określonych interwałów, np. tylko dane dzienne lub tylko miesięczne.

9 Opcje selekcji zmiennych metodą korelacji w czasie – warunki logiczne 2/2
Warunki dotyczące zakresu dat notowań w bazie Warunki dotyczące zakresu interwałów czasowych Pola wyboru warunków logicznych Warunki dotyczące źródeł danych Warunki dotyczące tematyki – nazwy zmiennych Warunki wybierane są z listy i łączone operatorami logicznymi AND/OR. Warunki mogą być dowolnie rozbudowywane przez Użytkownika

10 Opcje selekcji zmiennych metodą korelacji w czasie – przesunięcia czasowe 1/2
Tworząc zbiór danych pod kątem ich wykorzystania do budowy modelu predykcyjnego, ważną rolę odgrywa przesunięcie czasowe między zmiennymi. Szukamy wówczas takich czynników, które wyprzedzają to, co dzieje się na zmiennej opisywanej, czyli na analizowanym i prognozowanym zjawisku. Baza wyselekcjonowanych zmiennych zawiera w takim przypadku tylko zmienne, które wykazują zdefiniowane podobieństwo statystyczne z ustalonym wyprzedzeniem czasowym związanym zazwyczaj z horyzontem czasowym, na który tworzony jest model prognostyczny.

11 Opcje selekcji zmiennych metodą korelacji w czasie – przesunięcia czasowe 2/2
Zakres przeszukiwań dotyczący optymalnego przesunięcia czasowego jest związany z wybranym interwałem czasowym procesu analitycznego. W tym przypadku szukamy czynników wyprzedzających od 2 do 12 miesięcy zachowanie zmiennej opisywanej. Wybór interwału czasowego, dla którego prowadzony jest proces analityczny

12 Opcje selekcji zmiennych metodą korelacji w czasie – liczebność tworzonej grupy 1/2
Wielkość tworzonej grupy może być zdefiniowana przez użytkownika. Grupa może zawierać wszystkie zmienne spełniające brzegowe warunki korelacji lub tylko określoną ilość zmiennych najbardziej skorelowanych z wielkością opisywaną. Zwykle do budowy modelu predykcyjnego wykorzystuje się od kilku do kilkudziesięciu najbardziej powiązanych czynników. W przypadku wcześniejszego ustawienia warunku dotyczącego wyprzedzenia czasowego, korelacja uwzględnia to wyprzedzenie.

13 Warunki brzegowe współczynnika korelacji przedziałami
Opcje selekcji zmiennych metodą korelacji w czasie – liczebność tworzonej grupy 2/2 Definiowanie liczebności tworzonej grupy. W tym przypadku będzie ona zawierała 15 najbardziej skorelowane zmiennych, które jednocześnie muszą spełniać warunek brzegowy korelacji. Jeżeli w bazie nie znajdzie się tyle zmiennych spełniających warunki brzegowe, liczebność grupy będzie mniejsza Opcja pojemności informacyjnej ogranicza ryzyko współliniowości zmiennych w grupie Parametry szerokości okna oraz kroku jego przesunięcia. Im węższe okno i krótszy krok, tym trudniej znaleźć zmienne spełniające te warunki. Warunki brzegowe współczynnika korelacji przedziałami

14 Opcje selekcji zmiennych metodą korelacji w czasie – różnicowanie danych 1/2
Opcja różnicowania zmiennych umożliwia znalezienie danych, które wykazują podobieństwo na poziomie zmian. W przypadku cen lub notowań rynkowych szukamy wtedy zmiennych podobnych co do dynamiki zmian cenowych lub różnicy notowań.

15 Parametr różnicowania danych związany jest z interwałem czasowym.
Opcje selekcji zmiennych metodą korelacji w czasie – różnicowanie danych 2/2 Opcja różnicowania danych. Umożliwia poszukiwanie podobieństwa zmian kursów. Parametr różnicowania danych związany jest z interwałem czasowym. W tym przypadku szukamy danych, które wykazują podobieństwo na poziomie zmian jednomiesięcznych

16 Opcje selekcji zmiennych metodą korelacji w czasie – okres liczenia współczynnika korelacji
Zakres czasowy obliczania współczynnika korelacji – w tym przypadku szukamy danych skorelowanych w okresie od 1 stycznia 2004 roku do 1 stycznia 2017 roku. W przypadku budowania grupy pod kątem tworzenia modelu prognostycznego musimy uwzględnić okres testowy. Zdefiniowany zakres czasowy nie powinien uwzględniać okresu testowego – te okresy powinny być rozłączne. W bieżącym przykładzie okres testowy mógłby przebiegać, np. od lutego 2017 r. do stycznia 2018 r. Jest to warunek konieczny do prawidłowego testowania modeli prognostycznych

17 Opcje selekcji zmiennych metodą korelacji w czasie – warunek dotyczący przebiegu funkcji korelacji 1/2 Warunek dotyczący przebiegu funkcji korelacji umożliwia selekcję czynników, które są ze sobą powiązane miarą korelacyjną i jednocześnie miara ta zachowuje się w pożądany przez Użytkownika sposób na końcu badanego okresu. W przypadku wybrania opcji „Trend korelacji – rosnący” – siła powiązań pomiędzy badanymi czynnikami musi się wzmacniać na końcu badanego okresu.

18 Opcje selekcji zmiennych metodą korelacji w czasie – warunek dotyczący przebiegu funkcji korelacji 2/2 Kliknięcie przycisku „Utwórz zadanie” powoduje uruchomienie procesu selekcji. Jeżeli kryteria są ustawione prawidłowo, pojawia się komunikat o utworzeniu zadania, który należy zaakceptować klikając przycisk OK. W przypadku błędu w ustawieniach, pojawia się komunikat. Po poprawieniu ustawień proces można uruchomić ponownie. Ustawianie warunku dotyczącego charakteru przebiegu funkcji korelacji. Monitorowanie znaku współczynnika korelacji w przedziałach.

19 Dane kontaktowe ExMetrix Sp. z o.o. ul. Grzegórzecka 21 31-532 Kraków
NIP: Zbigniew Łukoś Ryszard Łukoś Konrad Pawlus


Pobierz ppt "Selekcja danych Korelacja w czasie."

Podobne prezentacje


Reklamy Google