Selekcja zmiennych w trybie zaawansowanym -

Slides:



Advertisements
Podobne prezentacje
Temat 2: Podstawy programowania Algorytmy – 1 z 2 _________________________________________________________________________________________________________________.
Advertisements

Proces doboru próby. Badana populacja – (zbiorowość generalna, populacja generalna) ogół rzeczywistych jednostek, o których chcemy uzyskać informacje.
© IEn Gdańsk 2011 Technika fazorów synchronicznych Łukasz Kajda Instytut Energetyki Oddział Gdańsk Zakład OGA Gdańsk r.
Przewodnik po raportach rozliczeniowych w Condico Clearing Station (Rynek finansowy)
Tworzenie odwołania zewnętrznego (łącza) do zakresu komórek w innym skoroszycie Możliwości efektywnego stosowania odwołań zewnętrznych Odwołania zewnętrzne.
Zajęcia 1-3 Układ okresowy pierwiastków. Co to i po co? Pojęcie masy atomowej, masy cząsteczkowej, masy molowej Proste obliczenia stechiometryczne. Wydajność.
Cel analizy statystycznej. „Człowiek –najlepsza inwestycja”
Ryzyko a stopa zwrotu. Standardowe narzędzia inwestowania Analiza fundamentalna – ocena kondycji i perspektyw rozwoju podmiotu emitującego papiery wartościowe.
PROGAM LOJALNOŚCIOWY FAMILO Społeczność Konsumencka Familo umożliwia uczestnikom programu oszczędzanie na zakupach dokonywanych w sklepie na stronie
Autor: Kierunek: Promotor: Wykorzystanie GIS do wyznaczenia tras bezpiecznego przewozu transportu przez miasto Małgorzata Kość geodezja i kartografia dr.
Kontrakty terminowe na indeks mWIG40 Prezentacja dla inwestorów Giełda Papierów Wartościowych w Warszawie S.A. Dział Notowań GPW kwiecień 2005.
1 Organizacje a kontrakt psychologiczny We współczesnym świecie człowiek otoczony jest szeregiem kontraktowych zobowiązań. To pewien rodzaj powiązań, zależności,
Opodatkowanie spółek Podziały Spółek. Podziały spółek Rodzaje podziałów wg KSH Przewidziane są cztery sposoby podziału: 1) podział przez przejęcie, który.
Model warstwowy OSI Model OSI (Open Systems Interconnection) opisuje sposób przepływu informacji między aplikacjami programowymi w jednej stacji sieciowej.
„Jak zwiększyć bezpieczeństwo uczestników ruchu drogowego?” Co nam dała realizacja projektu?
BADANIA STATYSTYCZNE. WARUNKI BADANIA STATYSTYCZNEGO musi dotyczyć zbiorowościstatystycznej musi określać prawidłowościcharakteryzujące całą zbiorowość.
Instalacja nienadzorowana windows xp Jakub klafta.
ACCESS - RELACJE TEMAT:. Tworzenie i edycja relacji Relacje w bazach danych tworzone są w celu powiązania z sobą danych z wielu tabel. Tworzymy (edytujemy)
Optymalna wielkość produkcji przedsiębiorstwa działającego w doskonałej konkurencji (analiza krótkookresowa) Przypomnijmy założenia modelu doskonałej.
Cechy podobieństwa trójkątów Radosław Hołówko Konsultant: Agnieszka Pożyczka.
# Analiza cech taksacyjnych drzewostanów przy wykorzystaniu technologii LIDAR 1 15 Sep 2010 Analiza cech taksacyjnych drzewostanów przy wykorzystaniu technologii.
Definiowanie i planowanie zadań typu P 1.  Planowanie zadań typu P  Zadania typu P to zadania unikalne służące zwykle dokonaniu jednorazowej, konkretnej.
Zmienna losowa dwuwymiarowa Dwuwymiarowy rozkład empiryczny Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium Analiz Ekonomicznych.
Zespół trenerów FAOW – Janina Jaszczur, Inga Kawałek, Ryszard Kamiński, Ryszard Zarudzki Zasady kontroli Wnioskodawców w PPLeader+
1 Definiowanie i planowanie zadań budżetowych typu B.
Projekty domów jednorodzinnychProjekty domów jednorodzinnych – sprawdzone opcje i propozycje w wersji tradycyjnej Budując dom dla swoich najbliższych musimy.
Regresja. Termin regresja oznacza badanie wpływu jednej lub kilku zmiennych tzw. objaśniających na zmienną, której kształtowanie się najbardziej nas interesuje,
Moduł SDI – zasilanie węzłów IIP oraz wykorzystanie danych. Wprowadzenie. Szkolenie przeprowadzone w ramach projektu „TERYT 3 – Rozbudowa systemów do prowadzenia.
Budżetowanie kapitałowe cz. III. NIEPEWNOŚĆ senesu lago NIEPEWNOŚĆ NIEMIERZALNA senesu strice RYZYKO (niepewność mierzalna)
Moduł II. Obszar formułowania Programów i Projektów.
O PARADOKSIE BRAESSA Zbigniew Świtalski Paweł Skałecki Wydział Matematyki, Informatyki i Ekonometrii Uniwersytet Zielonogórski Zakopane 2016.
Szkoła Podstawowa Nr 47 im. Jana Klemensa Branickiego w Białymstoku
PODSTAWY TEORII BAZ DANYCH
Kluczowe elementy skutecznej strategii analizy danych internetowych
Lokalne źródła prawa – zarys
Schematy blokowe.
SYSTEM KWALIFIKACJI, AWANSÓW I SPADKÓW
System wspomagania decyzji DSS do wyznaczania matematycznego modelu zmiennej nieobserwowalnej dr inż. Tomasz Janiczek.
On-the-Fly Garbage Collection
BAROMETR HEDONIŚCI I OSZCZĘDNI 2017.
Przywiązanie partnerów a ich kompetencje społeczne
Full Text Finder Przegląd Publication Finder
„Prawa Ceteris Paribus i socjo-ekonomiczne mechanizmy”
Modele SEM założenia formalne
Quick Tips Tutorial Jak uzyskać dostęp do raportów EBSCOhost i EBSCO Discovery Service w EBSCOadmin support.ebsco.com.
Funkcja – definicja i przykłady
Wstęp do Informatyki - Wykład 3
Budowa, typologia, funkcjonalność
Przewodnik Udoskonalanie listy wyników w wyszukiwarce naukowej
Świetlice szkolne w rzeczywistości prawnej
PROGRAMY DO KONTROLI RODZICIELSKIEJ
Bezpieczeństwo dostępu do danych w systemie Windows
Tworzenie modelu: przeglądanie wyników, redukcja rozmiarów modelu.
GRUPY DANYCH : Funkcje dostępne z poziomu GRUP DANYCH
Selekcja zmiennych w trybie zaawansowanym -
Problem Plecakowy (Problem złodzieja okradającego sklep)
Zasady funkcjonowania rynku
Selekcja danych Korelacja.
Koszyk danych.
Selekcja danych Korelacja w czasie.
Selekcja danych Analiza widmowa FFT.
FORMUŁOWANIE HIPOTEZ STATYSTYCZNYCH
Implementacja rekurencji w języku Haskell
Znajdowanie liczb pierwszych w zbiorze
REGRESJA WIELORAKA.
POZNAJEMY PULPIT Opracowanie: mgr Barbara Benisz SP nr 20 w Rybniku
Obsługa bazy danych z poziomu phpMyAdmin
Prawa ruchu ośrodków ciągłych c. d.
Program na dziś Wprowadzenie Logika prezentacji i artykułu
MODELOWANIE ZMIENNOŚCI CECH
Zapis prezentacji:

Selekcja zmiennych w trybie zaawansowanym - metoda przebiegu korelacji w czasie : Szukanie związków pomiędzy danymi Automatyczne tworzenie powiązanych zmiennych

Ogólne informacje dotyczące metody – korelacja w czasie W przypadku „korelacji w czasie” – współczynnik korelacji liczony jest na przesuwanym oknie czasowym. Powstaje ciągła funkcja przedstawiająca przebieg korelacji w dziedzinie czasu. Dzięki takiemu podejściu możliwe jest ustawienie warunków dotyczących charakteru funkcji korelacji czyli na przykład: KORELACJA WIĘKSZA NIŻ ZADANE PARAMETRY BRZEGOWE ORAZ ROSNĄCA NA OSTATNIM OKRESIE. Takie dodatkowe warunki umożliwiają dobór czynników wzajemnie powiązanych z dodatkowym warunkiem powodującym, że wybrane zmienne nie wykazują osłabienia współzależności na końcu badanego okresu. Szerokość okna oraz krok jego przesunięcia są definiowana przez Użytkownika. Minimalna szerokość musi odpowiadać 30 interwałom czasowym dla których wykonywana jest analiza. Jest to spowodowane metodologią obliczeń statystycznych.

Ogólne informacje dotyczące metody – korelacja w czasie - schemat Współczynnik korelacji liczony jest krokowo dla każdego z NACHODZĄCYCH NA SIEBIE przedziałów. Szerokość okna oraz krok przesunięcia są definiowane przez Użytkownika. Minimalna długość okna wynosi 30 interwałów czasowych. Jest to spowodowane wymaganiami obliczeń statystycznych.

Opcja selekcji zmiennych Wybór narzędzi selekcji zmiennych Opcja selekcji zmiennych W procesie automatycznej selekcji zmiennych przeszukiwane są bazy danych w celu wybrania grupy danych powiązanych z tzw. zmienną opisywaną. Zmienna opisywana, to taka wielkość, którą analizujemy np. waluta, surowiec wskaźnik makroekonomiczny itp. Zwykle w pierwszym etapie analizy zależy nam na wybraniu czynników powiązanych z tą zmienną – wpływających na nią. Powiązania dotyczą parametrów statystycznych i mogą uwzględniać przesunięcia czasowe, dzięki czemu wybrane czynniki mogły stanowić bazę do budowania modeli prognostycznych interesującego nas zjawiska

Przejście do kolejnego etapu selekcji Wybór miary podobieństwa Przejście do kolejnego etapu selekcji W przypadku selekcji zmiennych metodą korelacji w czasie – wybieramy odpowiednią opcję

Opcje selekcji zmiennych metodą korelacji w czasie – widok ogólny Opcja pojemności informacyjnej tworzonego zbioru Grupa warunków logicznych Opcje wyprzedzenia czasowego Definiowanie liczebności tworzonej grupy Interwał czasowy dla którego obliczane są miary podobieństwa Parametry szerokości okna oraz kroku jego przesuwania– z powodu metody obliczeń minimalna szerokość wynosi 30 interwałów czasowych Warunki dotyczące przebiegu funkcji korelacji Warunki brzegowe współczynnika korelacji

Opcje selekcji zmiennych metodą korelacji w czasie – warunki logiczne 1/2 Warunki logiczne służą do ukierunkowania procesu selekcji. Warunki logiczne mogą dotyczyć : Zakresu dat notowań w bazie – można określić że w procesie selekcji chcemy uzyskać zmienne notowane odpowiednio długo ( „data od”) lub/oraz takie, które nie wygasły – mają „świeżą” datę notowań ( „data do”). Tylko długie szeregi dostarczają pożądanych informacji statystycznych. Tylko niewygasłe serie mogą służyć do bieżących analiz i prognoz. Tematyki zdefiniowanej w nazwie serii – możemy ukierunkować selekcję na dane z określonej dziedziny Źródeł danych – proces selekcji można zawęzić tylko do wybranych baz danych Interwałów czasowych – baza zawiera serie o różnych interwałach czasowych. Wyszukiwanie można ograniczyć tylko do określonych interwałów np. Tylko dane dzienne lub tylko miesięczne.

Warunki dotyczące zakresu dat notowań w bazie Opcje selekcji zmiennych metodą korelacji w czasie – warunki logiczne 2/2 Warunki dotyczące zakresu dat notowań w bazie Warunki dotyczące zakresu interwałów czasowych Pola wyboru warunków logicznych Warunki dotyczące źródeł danych Warunki dotyczące tematyki – nazwy zmiennych Warunki wybierane są z listy i łączone operatorami logicznymi AND/OR. Warunki mogą być dowolnie rozbudowywane przez Użytkownika

Opcje selekcji zmiennych metodą korelacji w czasie – przesunięcia czasowe 1/2 Tworząc zbiór danych pod kątem ich wykorzystania do budowy modelu predykcyjnego, ważną rolę odgrywa przesunięcie czasowe między zmiennymi. Szukamy wówczas takich czynników , które wyprzedzają to co dzieje się na zmiennej opisywanej czyli na zjawisku, które analizujemy i prognozujemy. Baza wyselekcjonowanych zmiennych zawiera w takim przypadku tylko zmienne , które wykazują zdefiniowane podobieństwo statystyczne z ustalonym wyprzedzeniem czasowym związanym zazwyczaj z horyzontem czasowym na który tworzony jest model prognostyczny.

Opcje selekcji zmiennych metodą korelacji w czasie – przesunięcia czasowe 2/2 Zakres przeszukiwań dotyczący optymalnego przesunięcia czasowego jest związany z wybranym interwałem czasowym procesu analitycznego. W tym przypadku szukamy czynników wyprzedzających od 2 do 12 miesięcy zachowanie zmiennej opisywanej. Wybór interwału czasowego dla którego prowadzony jest proces analityczny

Opcje selekcji zmiennych metodą korelacji w czasie – liczebność tworzonej grupy 1/2 Wielkość tworzonej grupy może być zdefiniowana przez użytkownika. Grupa może zawierać wszystkie zmienne spełniające brzegowe warunki korelacji lub tylko określoną ilość zmiennych najbardziej skorelowanych z wielkością opisywaną. Zwykle do budowy modelu predykcyjnego wykorzystuje się od kilku do kilkudziesięciu najbardziej powiązanych czynników. W przypadku wcześniejszego ustawienia warunku dotyczącego wyprzedzenia czasowego, korelacja uwzględnia to wyprzedzenie.

Parametry szerokości okna oraz kroku jego przesunięcia Opcje selekcji zmiennych metodą korelacji w czasie – liczebność tworzonej grupy 2/2 Definiowanie liczebności tworzonej grupy. W tym przypadku będzie ona zawierała 15 najbardziej skorelowane zmiennych, które jednocześnie muszą spełniać warunek brzegowy korelacji .Jeżeli w bazie nie znajdzie się tyle zmiennych spełniających warunki brzegowe, liczebność grupy będzie mniejsza Opcja pojemności informacyjnej powoduje że w grupie znajdą się zmienne pozytywnie wpływające na jej pojemność informacyjną Parametry szerokości okna oraz kroku jego przesunięcia Warunki brzegowe współczynnika korelacji przedziałami

Opcje selekcji zmiennych metodą korelacji w czasie – różnicowanie danych 1/2 Opcja różnicowania zmiennych umożliwia znalezienie danych, które wykazują podobieństwo na poziomie zmian. W przypadku cen lub notowań rynkowych szukamy wtedy zmiennych podobnych co do dynamiki zmian cenowych lub różnicy notowań.

Opcja różnicowania danych Opcje selekcji zmiennych metodą korelacji w czasie – różnicowanie danych 2/2 Opcja różnicowania danych Parametr różnicowania danych związany jest z interwałem czasowym. W tym przypadku szukamy danych które wykazują podobieństwo na poziomie zmian jednomiesięcznych

Opcje selekcji zmiennych metodą korelacji w czasie – okres liczenia współczynnika korelacji. Zakres czasowy obliczania współczynnika korelacji – w tym przypadku szukamy danych skorelowanych w okresie od 1 stycznia 2004 roku do 1 stycznia 2017 roku. W przypadku budowania grupy pod kątem tworzenia modelu prognostycznego musimy uwzględnić okres testowy . Zdefiniowany zakres czasowy NIE POWINIEN uwzględniać okresu testowego – te okresy POWINNY BYĆ ROZŁĄCZNE. W bieżącym przykładzie okres testowy mógłby przebiegać np. Od lutego 2017 r do stycznia 2018 r. JEST TO WARUNEK KONIECZNY DO PRAWIDŁOWEGO TESTOWANIA MODELI PROGNOSTYCZNYCH

Opcje selekcji zmiennych metodą korelacji w czasie – warunek dotyczący przebiegu funkcji korelacji 1/2 Warunek dotyczący przebiegu funkcji korelacji umożliwia selekcję czynników, które są ze sobą powiązane miarą korelacyjną i jednocześnie miara ta zachowuje się w pożądany przez Użytkownika sposób na końcu badanego okresu. W przypadku wybrania opcji „Trend korelacji – rosnący” – siła powiązań pomiędzy badanymi czynnikami musi się wzmacniać na końcu badanego okresu.

Ustawianie warunku dotyczącego charakteru przebiegu funkcji korelacji Opcje selekcji zmiennych metodą korelacji w czasie – warunek dotyczący przebiegu funkcji korelacji 2/2 Ustawianie warunku dotyczącego charakteru przebiegu funkcji korelacji

Dane kontaktowe ExMetrix Sp. Z o.o. ul. Grzegórzecka 21 31-532 Kraków NIP: 676 249 43 40 +48 570 202 650 www.exmetrix.com info@exmetrix.com Zbigniew Łukoś zbyszek@exmetrix.com +48 609 293 976 RyszardŁukoś ryszard@exmetrix.com +48 726 900 912 Konrad Pawlus konrad@exmetrix.com +48 608 500 834