Selekcja danych Analiza widmowa FFT.

Slides:



Advertisements
Podobne prezentacje
Proces doboru próby. Badana populacja – (zbiorowość generalna, populacja generalna) ogół rzeczywistych jednostek, o których chcemy uzyskać informacje.
Advertisements

© IEn Gdańsk 2011 Technika fazorów synchronicznych Łukasz Kajda Instytut Energetyki Oddział Gdańsk Zakład OGA Gdańsk r.
Ekonometria stosowana WYKŁAD 4 Piotr Ciżkowicz Katedra Międzynarodowych Studiów Porównawczych.
Tworzenie odwołania zewnętrznego (łącza) do zakresu komórek w innym skoroszycie Możliwości efektywnego stosowania odwołań zewnętrznych Odwołania zewnętrzne.
Wyszukiwanie informacji w Internecie. Czym jest wyszukiwarka? INTERNET ZASOBY ZAINDEKSOWANE PRZEZ WYSZUKIWARKI Wyszukiwarka to mechanizm, który za pomocą.
Cel analizy statystycznej. „Człowiek –najlepsza inwestycja”
Ryzyko a stopa zwrotu. Standardowe narzędzia inwestowania Analiza fundamentalna – ocena kondycji i perspektyw rozwoju podmiotu emitującego papiery wartościowe.
Literary Reference Center Przewodnik
Autor: Kierunek: Promotor: Wykorzystanie GIS do wyznaczenia tras bezpiecznego przewozu transportu przez miasto Małgorzata Kość geodezja i kartografia dr.
Kontrakty terminowe na indeks mWIG40 Prezentacja dla inwestorów Giełda Papierów Wartościowych w Warszawie S.A. Dział Notowań GPW kwiecień 2005.
Analiza tendencji centralnej „Człowiek – najlepsza inwestycja”
Radosław Stefańczyk 3 FA. Fotony mogą oddziaływać z atomami na drodze czterech różnych procesów. Są to: zjawisko fotoelektryczne, efekt tworzenie par,
STATYSTYKA – kurs podstawowy wykład 10 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Porównywarki cen leków w Polsce i na świecie. Porównywarki w Polsce.
BADANIA STATYSTYCZNE. WARUNKI BADANIA STATYSTYCZNEGO musi dotyczyć zbiorowościstatystycznej musi określać prawidłowościcharakteryzujące całą zbiorowość.
ACCESS - RELACJE TEMAT:. Tworzenie i edycja relacji Relacje w bazach danych tworzone są w celu powiązania z sobą danych z wielu tabel. Tworzymy (edytujemy)
Optymalna wielkość produkcji przedsiębiorstwa działającego w doskonałej konkurencji (analiza krótkookresowa) Przypomnijmy założenia modelu doskonałej.
Definiowanie i planowanie zadań typu P 1.  Planowanie zadań typu P  Zadania typu P to zadania unikalne służące zwykle dokonaniu jednorazowej, konkretnej.
POP i SIR POK1 i POK2.
Od recesji do koniunktury.. Podstawowe pojęcia. Recesja – zjawisko makroekonomiczne polegające na znacznym zahamowaniu tempa wzrostu gospodarczego, skutkujące.
Jak tworzymy katalog alfabetyczny? Oprac.Regina Lewańska.
Regresja. Termin regresja oznacza badanie wpływu jednej lub kilku zmiennych tzw. objaśniających na zmienną, której kształtowanie się najbardziej nas interesuje,
Budżetowanie kapitałowe cz. III. NIEPEWNOŚĆ senesu lago NIEPEWNOŚĆ NIEMIERZALNA senesu strice RYZYKO (niepewność mierzalna)
O PARADOKSIE BRAESSA Zbigniew Świtalski Paweł Skałecki Wydział Matematyki, Informatyki i Ekonometrii Uniwersytet Zielonogórski Zakopane 2016.
PLAN MARKETINGOWY Imię i nazwisko. Podsumowanie sytuacji rynkowej  Sytuacja rynkowa: przeszła, bieżąca i przyszła  Uwzględnij udział w rynku, wiodące.
PODSTAWY TEORII BAZ DANYCH
Test analizy wariancji dla wielu średnich – klasyfikacja pojedyncza
Kluczowe elementy skutecznej strategii analizy danych internetowych
Schematy blokowe.
mutacyjnego algorytmu ewolucyjnego
[Tytuł – najlepiej aby jak najtrafniej oddawał opisywane rozwiązanie ]
System wspomagania decyzji DSS do wyznaczania matematycznego modelu zmiennej nieobserwowalnej dr inż. Tomasz Janiczek.
terminologia, skale pomiarowe, przykłady
Przywiązanie partnerów a ich kompetencje społeczne
Oczekiwana przez inwestora stopa dochodu
Liczby pierwsze.
Modele SEM założenia formalne
Podstawy automatyki I Wykład /2016
Wstęp do Informatyki - Wykład 3
Budowa, typologia, funkcjonalność
Przewodnik Udoskonalanie listy wyników w wyszukiwarce naukowej
KOREKTOR RÓWNOLEGŁY DLA UKŁADÓW Z NIEMINIMALNOFAZOWYMI OBIEKTAMI Ryszard Gessing Instytut Automatyki, Politechnika Śląska Plan referatu Wprowadzenie.
Świetlice szkolne w rzeczywistości prawnej
Tytuł – [najlepiej aby jak najtrafniej oddawał opisywane rozwiązanie]
Pawlicz, A. , Tokarz-Kocik, A. , Wolna-Samulak, A
[Nazwa produktu] Plan marketingowy
Produkt i dochód narodowy
Selekcja zmiennych w trybie zaawansowanym -
Tworzenie modelu: przeglądanie wyników, redukcja rozmiarów modelu.
GRUPY DANYCH : Funkcje dostępne z poziomu GRUP DANYCH
Selekcja zmiennych w trybie zaawansowanym -
Laboratorium 1 – obsługa wejść i wyjść
Zasady funkcjonowania rynku
Selekcja danych Korelacja.
Koszyk danych.
Podstawy informatyki Zygfryd Głowacz.
Selekcja danych Korelacja w czasie.
Porównywanie średnich prób o rozkładach normalnych (testy t-studenta)
Tytuł – [najlepiej aby jak najtrafniej oddawał opisywane rozwiązanie]
FORMUŁOWANIE HIPOTEZ STATYSTYCZNYCH
Znajdowanie liczb pierwszych w zbiorze
REGRESJA WIELORAKA.
POZNAJEMY PULPIT Opracowanie: mgr Barbara Benisz SP nr 20 w Rybniku
ROZKŁADY STATYSTYCZNE ZMIENNYCH MIERZALNYCH
Obsługa bazy danych z poziomu phpMyAdmin
Program na dziś Wprowadzenie Logika prezentacji i artykułu
Wybrane testy w MZI i UMM
dr Robert Kowalczyk, PWSZ Płock
Zapis prezentacji:

Selekcja danych Analiza widmowa FFT

Selekcja zmiennych w trybie zaawansowanym - metoda analizy widma częstotliwościowego (analiza harmoniczna): Szukanie związków pomiędzy danymi Automatyczne tworzenie grup powiązanych zmiennych

Ogólne informacje dotyczące metody – analiza widmowa – FFT 1/5 Analiza widma częstotliwościowego (analiza harmoniczna, analiza Fouriera) polega na przedstawieniu szeregu czasowego (zmiennej) w postaci sumy krzywych będących sinusoidami i/lub cosinusoidami o różnych amplitudach, częstotliwościach i fazach. Najczęściej budowany jest wykres zależności amplitudy od częstotliwości zwany periodogramem. Na periodogramie zaznaczone są częstotliwości, których amplitudy wykazują wartości znacząco większe niż dla częstotliwości sąsiadujących. Są to właśnie częstotliwości (cykle, harmoniczne) dominujące. Kilka z nich (liczbę wybiera Użytkownik) uwzględnia się w procesie selekcji. Poszukujemy zmiennych spełniających następujące warunki – takich, których cykle dominujące mają taką samą częstotliwość jak cykle dominujące zmiennej objaśnianej.

Ogólne informacje dotyczące metody – analiza widmowa – FFT 2/5 Poszukujemy zmiennych spełniających następujące warunki: cykle dominujące mają taką samą częstotliwość jak cykle dominujące zmiennej objaśnianej cykle dominujące wyjaśniają znaczną część wariancji danej zmiennej fazy cykli dominujących zmiennej objaśniającej wyprzedzają fazy cykli dominujących zmiennej objaśnianej

Częstotliwości dominujące Ogólne informacje dotyczące metody – analiza widmowa – FFT 3/5 - periodogram Częstotliwości dominujące

Ogólne informacje dotyczące metody – analiza widmowa – FFT 4/5

Ogólne informacje dotyczące metody – analiza widmowa – FFT 5/5

Przejście do narzędzi selekcji zmiennych 1/2 W procesie automatycznej selekcji zmiennych przeszukiwane są bazy danych w celu wybrania grupy danych powiązanych z tzw. zmienną opisywaną. Zmienna opisywana, to taka wielkość, którą analizujemy, np. waluta, surowiec wskaźnik makroekonomiczny, itp. Zwykle w pierwszym etapie analizy zależy nam na wybraniu czynników powiązanych z tą zmienną – wpływających na nią. Powiązania dotyczą parametrów statystycznych i mogą uwzględniać przesunięcia czasowe, dzięki czemu wybrane czynniki mogły stanowić bazę do budowania modeli prognostycznych interesującego nas zjawiska.

Wejście do opcji automatycznej selekcji zmiennych Przejście do narzędzi selekcji zmiennych 2/2 Wejście do opcji automatycznej selekcji zmiennych

Przejście do kolejnego etapu selekcji Wybór miary podobieństwa Przejście do kolejnego etapu selekcji W przypadku selekcji zmiennych metodą analizy widmowej – wybieramy odpowiednią opcję

Opcje selekcji zmiennych metodą analizy widmowej W panelu selekcji automatycznej wyróżnić można dwie grupy ustawień ważnych z punktu widzenia końcowej konfiguracji oraz uzyskanych wyników. Grupa pierwsza, to warunki logiczne uwzględniające słowa kluczowe. Grupa druga to parametry liczbowe (progi, zakresy itp.)

Grupa warunków logicznych Opcje selekcji zmiennych metodą analizy widmowej - warunki logiczne uwzględniające słowa kluczowe Grupa warunków logicznych

Opcje selekcji zmiennych metodą analizy widmowej – parametry liczbowe Opcja pojemności informacyjnej tworzonego zbioru Parametry analizy widmowej Definiowanie liczebności tworzonej grupy Interwał czasowy dla którego obliczane są miary podobieństwa Warunki brzegowe współczynnika korelacji

Opcje selekcji zmiennych metodą analizy widmowej – warunki logiczne 1/2 Warunki logiczne służą do ukierunkowania procesu selekcji. Warunki logiczne mogą dotyczyć: Zakresu dat notowań w bazie – można określić, że w procesie selekcji chcemy uzyskać zmienne notowane odpowiednio długo („data od”) lub/oraz takie, które nie wygasły – mają „świeżą” datę notowań („data do”). Tylko długie szeregi dostarczają pożądanych informacji statystycznych. Tylko niewygasłe serie mogą służyć do bieżących analiz i prognoz. Tematyki zdefiniowanej w nazwie serii – możemy ukierunkować selekcję na dane z określonej dziedziny. Źródeł danych – proces selekcji można zawęzić tylko do wybranych baz danych. Interwałów czasowych – baza zawiera serie o różnych interwałach czasowych. Wyszukiwanie można ograniczyć tylko do określonych interwałów, np. tylko dane dzienne lub tylko miesięczne.

Opcje selekcji zmiennych metodą analizy widmowej – warunki logiczne 2/2 Warunki dotyczące zakresu dat notowań w bazie Warunki dotyczące zakresu interwałów czasowych Pola wyboru warunków logicznych Warunki dotyczące źródeł danych Warunki dotyczące tematyki – nazwy zmiennych Warunki wybierane są z listy i łączone operatorami logicznymi AND/OR. Warunki mogą być dowolnie rozbudowywane przez Użytkownika

Opcje selekcji zmiennych metodą analizy widmowej – parametry liczbowe 1/9 Poszukujemy zmiennych spełniających następujące warunki: cykle dominujące mają taką samą częstotliwość jak cykle dominujące zmiennej objaśnianej – parametr „Liczba znaczących harmonicznych” cykle dominujące wyjaśniają znaczną część wariancji danej zmiennej – parametry „Minimalny próg objaśnialności” i „Współczynnik wygładzenia” fazy cykli dominujących zmiennej objaśniającej wyprzedzają fazy cykli dominujących zmiennej objaśnianej – wówczas sortowanie końcowe odbywa się według wielkości wyprzedzeń fazowych cykli dominujących (opcjonalnie - według stopnia objaśnialności).

Opcje selekcji zmiennych metodą analizy widmowej – parametry liczbowe 2/9 Liczba znaczących harmonicznych uwzględnianych w procesie selekcji Parametr wygładzenia regulujący przebieg trendu szeregu czasowego Minimalny stopień wyjaśnienia wariancji szeregu czasowego przez znaczące harmoniczne (cykle dominujące) Wybór przedmiotu badania (szereg czasowy lub odległość szeregu czasowego od własnego trendu)

Opcje selekcji zmiennych metodą analizy widmowej – parametry liczbowe 3/9 Sortowanie końcowe według stopnia objaśniania wariancji lub według wielkości wyprzedzeń fazowych cykli dominujących

Opcje selekcji zmiennych metodą analizy widmowej – parametry liczbowe 4/9 Periodogram - liczba znaczących harmonicznych uwzględnianych w procesie selekcji. Proponuje ją Użytkownik (tutaj trzy)

Opcje selekcji zmiennych metodą analizy widmowej – parametry liczbowe 5/9 Przedmiotem badania (rozkładu na harmoniczne) jest zwykle odległość szeregu czasowego od własnego trendu. Niekiedy może to być sam szereg czasowy. Parametr regulujący przebieg trendu danej zmiennej ma duże znaczenie dla przebiegu trendu. Zwiększenie wartości parametru powoduje, że przebieg trendu jest mniej dopasowany do szeregu czasowego (bardziej wygładzony). Bardzo duża wartość to trend zbliżony do liniowego.

Opcje selekcji zmiennych metodą analizy widmowej – parametry liczbowe 6/9 Przedmiotem badania (rozkładu na harmoniczne) jest zwykle odległość szeregu czasowego od własnego trendu. Niekiedy może to być sam szereg czasowy. Zwiększenie wartości parametru powoduje, że przebieg trendu jest mniej dopasowany do szeregu czasowego (bardziej wygładzony)

Opcje selekcji zmiennych metodą analizy widmowej – parametry liczbowe 7/9 Stopień wyjaśniania wariancji danej zmiennej przez cykle dominujące zależy między innymi od liczby uwzględnionych cykli. Więcej cykli oznacza większy stopień wyjaśnienia. Jednak w praktyce możemy uwzględnić jedynie kilka najistotniejszych cykli, ponieważ w przypadku ich większej liczby coraz trudniej znaleźć zmienne spełniające wszystkie warunki.

Opcje selekcji zmiennych metodą analizy widmowej – parametry analizy widmowej 8/9 Złożenie kilku cykli dominujących – słabsze wyjaśnienie zmienności, ale łatwiej znaleźć zmienne spełniające wszystkie warunki

Opcje selekcji zmiennych metodą analizy widmowej – parametry analizy widmowej 9/9 Większa liczba cykli dominujących – lepsze wyjaśnienie zmienności, ale trudniej znaleźć zmienne spełniające wszystkie warunki

Opcje selekcji zmiennych metodą analizy widmowej – liczebność tworzonej grupy 1/2 Wielkość tworzonej grupy może być zdefiniowana przez użytkownika. Grupa może zawierać wszystkie zmienne spełniające brzegowe warunki korelacji lub tylko określoną ilość zmiennych najbardziej skorelowanych z wielkością opisywaną. Zwykle do budowy modelu predykcyjnego wykorzystuje się od kilku do kilkudziesięciu najbardziej powiązanych czynników. W przypadku wcześniejszego ustawienia warunku dotyczącego wyprzedzenia czasowego, korelacja uwzględnia to wyprzedzenie.

Definiowanie liczebności tworzonej grupy Opcje selekcji zmiennych metodą analizy widmowej – liczebność tworzonej grupy 2/2 Definiowanie liczebności tworzonej grupy Opcja pojemności informacyjnej redukuje ryzyko współliniowości zmiennych

Opcje selekcji zmiennych metodą analizy widmowej – różnicowanie danych i okres badania widma 1/2 Opcja różnicowania zmiennych umożliwia znalezienie danych, które wykazują podobieństwo na poziomie zmian. W przypadku cen lub notowań rynkowych szukamy wtedy zmiennych podobnych co do dynamiki zmian cenowych lub różnicy notowań. Zakres czasowy analizy widmowej – badamy widmo od … (data początkowa) do … (data końcowa). W przypadku budowania grupy pod kątem tworzenia modelu prognostycznego musimy uwzględnić okres testowy. Zdefiniowany zakres czasowy analizy widmowej (badania widma) NIE POWINIEN uwzględniać okresu testowego – te okresy POWINNY BYĆ ROZŁĄCZNE

Opcje selekcji zmiennych metodą analizy widmowej – różnicowanie danych i okres badania widma 2/2 Opcja różnicowania danych Parametr różnicowania danych związany jest z interwałem czasowym. W tym przypadku szukamy danych, które wykazują podobieństwo na poziomie zmian trzymiesięcznych Zakres czasowy badania widma

Uruchomienie procesu selekcji

Dane kontaktowe ExMetrix Sp. Z o.o. ul. Grzegórzecka 21 31-532 Kraków NIP: 676 249 43 40 +48 570 202 650 www.exmetrix.com info@exmetrix.com Zbigniew Łukoś zbyszek@exmetrix.com +48 609 293 976 Ryszard Łukoś ryszard@exmetrix.com +48 726 900 912 Konrad Pawlus konrad@exmetrix.com +48 608 500 834