Selekcja danych Korelacja.

Slides:



Advertisements
Podobne prezentacje
CLIMGEN (generator danych pogodowych w modelu CropSyst.
Advertisements

Analiza współzależności zjawisk
Gambit Centrum Oprogramowania i Szkoleń Sp. z o.o Kraków, al.Pokoju 29B/ Autoryzowany dystrybutor Thomson-Reuters.
Baza KNOVEL Pełnotekstowa baza książek światowych wydawców przygotowana przez amerykańską firmę Knovel zawiera ponad 1000 tytułów książek z wielu dziedzin.
Badania operacyjne. Wykład 1
Przegląd zastosowań.
Komponenty bazy danych Baza danych Jest to uporządkowany zbiór powiązanych ze sobą danych charakterystycznych dla pewnej klasy obiektów lub zdarzeń,
MS Access 2003 Kwerendy Paweł Górczyński.
MS Access 2000 Kwerendy Piotr Górczyński 25/08/2001.
SIECI KOMPUTEROWE (SieKom) PIOTR MAJCHER WYŻSZA SZKOŁA ZARZĄDZANIA I MARKETINGU W SOCHACZEWIE Zarządzanie.
Support.ebsco.com EBSCOhost Wyszukiwanie złożone (z wieloma frazami) Szkolenie.
Proste bazy danych w Excelu
Obsługa bazy danych z poziomu phpMyAdmin
PROJEKTOWANIE TABEL W PROGRAMIE: ACCESS
analiza dynamiki zjawisk Szeregi czasowe
Analiza danych w Excel za pomocą Analysis ToolPak
Tworzenie nowych kont lokalnych i domenowych, oraz zarządzanie nimi
Arkusze kalkulacyjne, część 3
dr hab. Ryszard Walkowiak prof. nadzw.
Moduł Lojalnościowy. Czyli zatrzymanie klienta przy naszym zakładzie optycznym.
ANNA BANIEWSKA SYLWIA FILUŚ
BAZA DANYCH AMATORSKIEJ DRUŻYNY PIŁKI HALOWEJ
MAKRA 1.
Excel – wiadomości przydatne
EXCEL Wykład 4.
Zarządzanie informacją
Arkusz kalkulacyjny MS Excel
Operacje edycyjne w bazie danych - kwerendy funkcjonalne Marzena Nowakowska Katedra Informatyki Stosowanej, WZiMK, PŚk.
Komendy SQL do pracy z tabelami i bazami
MS Excel - wspomaganie decyzji
Konfiguracja VPN Klienta – Windows 7
Opinie Prawne Wiki - pomoc Wyszukiwanie dokumentów w na stronie
Excel Wykresy – różne typy, wykresy funkcji.
Excel Filtrowanie Funkcje bazodanowe
Projektowanie relacyjnych baz danych – diagramy związków encji
Treści multimedialne - kodowanie, przetwarzanie, prezentacja Odtwarzanie treści multimedialnych Andrzej Majkowski 1 informatyka +
ENOVA dla WODOCIĄGÓW I KANALIZACJI System Zarządzania klasy ERP NOWOCZESNE, SPECJALSTYCZNE OPROGRAMOWANIE, WSPOMAGAJĄCE ZARZĄDZANIE I OBSŁUGĘ.
Beata Sanakiewicz. Spis treści  Łączenie dokumentów Łączenie dokumentów  Mechanizm OLE Mechanizm OLE  Obiekt osadzony Obiekt osadzony  Obiekt połączony.
EXCEL Wstęp do lab. 4. Szukaj wyniku Prosta procedura iteracyjnego znajdowania niewiadomej spełniającej warunek będący jej funkcją Metoda: –Wstążka Dane:
Projektowanie postaci formularza:
Portal edukacyjny A.Ś. Tworzenie kwerend w programie Access.
TEMAT: ACCESS - KWERENDY.
BAZY DANYCH Microsoft Access Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej Katedra Automatyki i.
Instalacja certyfikatu Dostęp do Rachunku przez Internet BS Pawłowice dla przeglądarki Mozilla Firefox.
Tworzenie wykresów część I
Przewodnik Wprowadzenie do
Temat: Edytor tekstu Word – redagowanie tekstu. Szukanie i zamiana tekstu Znajdowanie tekstu w dokumencie Znajdowanie tekstu i jego zamiany dokonujemy.
Przewodnik Bazy CINAHL Wyszukiwanie podstawowe
Przewodnik Tworzenie powiadomień dotyczących czasopism w EBSCOhost
Przewodnik Tworzenie powiadomień dotyczących wyszukiwania w EBSCOhost
Czym s ą i do czego słu żą ? Narzędzie analityczne arkusza kalkulacyjnego pozwalające filtrować, wybierać, przestawiać kolumny i wiersze z danymi w arkuszu.
EBSCOhost Mobile Przewodnik
„Filtry i funkcje bazodanowe w EXCELU”
Bazy CINAHL Wyszukiwanie zaawansowane Przewodnik
Temat: Tworzenie bazy danych
Przewodnik
STATYSTYKA – kurs podstawowy wykład 11
Rozpoczęcie procesu tworzenia prognoz metodą trybu uproszczonego.
Wybór nazwy lub słów kluczowych dla interesującego nas szeregu czasowego. Opcjonalnie – ustawienie innych dostępnych atrybutów szukania.
Badania operacyjne, Solver
Co do tej pory robiliśmy:
Selekcja zmiennych w trybie zaawansowanym -
Selekcja zmiennych w trybie zaawansowanym -
Grupy danych.
Koszyk danych – miejsce tymczasowego przechowywania ręcznie wybranych zmiennych : Funkcje koszyka Przekształcanie koszyka w grupę danych.
Selekcja danych Korelacja w czasie.
Selekcja danych Analiza widmowa FFT.
Analiza współzależności zjawisk
Zapis prezentacji:

Selekcja danych Korelacja

Selekcja zmiennych w trybie zaawansowanym – metoda korelacji liniowej: Szukanie związków pomiędzy danymi Automatyczne tworzenie powiązanych zmiennych

Przejście do kolejnego etapu selekcji Wybór miary podobieństwa Przejście do kolejnego etapu selekcji W przypadku selekcji zmiennych metodą korelacji liniowej – wybieramy opcję „Korelacje”

Opcje selekcji zmiennych metodą korelacji liniowej – widok ogólny Grupa warunków logicznych Opcja pojemności informacyjnej tworzonego zbioru Opcje wyprzedzenia czasowego Definiowanie liczebności tworzonej grupy Interwał czasowy dla którego obliczane są miary podobieństwa Warunki brzegowe współczynnika korelacji

Opcje selekcji zmiennych metodą korelacji liniowej – warunki logiczne 1/2 Warunki logiczne służą do ukierunkowania procesu selekcji. Warunki logiczne mogą dotyczyć: Zakresu dat notowań w bazie – można określić, że w procesie selekcji chcemy uzyskać zmienne notowane odpowiednio długo („data od”) lub/oraz takie, które nie wygasły – mają „świeżą” datę notowań („data do”). Tylko długie szeregi dostarczają pożądanych informacji statystycznych. Tylko niewygasłe serie mogą służyć do bieżących analiz i prognoz. Tematyki zdefiniowanej w nazwie serii – możemy ukierunkować selekcję na dane z określonej dziedziny Źródeł danych – proces selekcji można zawęzić tylko do wybranych baz danych Interwałów czasowych – baza zawiera serie o różnych interwałach czasowych. Wyszukiwanie można ograniczyć tylko do określonych interwałów np. tylko dane dzienne lub tylko miesięczne.

Opcje selekcji zmiennych metodą korelacji liniowej – warunki logiczne 2/2 Warunki dotyczące zakresu dat notowań w bazie Warunki dotyczące zakresu interwałów czasowych Pola wyboru warunków logicznych Warunki dotyczące źródeł danych Warunki dotyczące tematyki – nazwy zmiennych Warunki wybierane są z listy i łączone operatorami logicznymi AND/OR. Warunki mogą być dowolnie rozbudowywane przez Użytkownika

Opcje selekcji zmiennych metodą korelacji liniowej – przesunięcia czasowe 1/2 Tworząc zbiór danych pod kątem ich wykorzystania do budowy modelu predykcyjnego, ważną rolę odgrywa przesunięcie czasowe między zmiennymi. Szukamy wówczas takich czynników, które wyprzedzają to, co dzieje się na zmiennej opisywanej, czyli na analizowanym i prognozowanym zjawisku. Baza wyselekcjonowanych zmiennych zawiera w takim przypadku tylko zmienne, które wykazują zdefiniowane podobieństwo statystyczne z ustalonym wyprzedzeniem czasowym związanym zazwyczaj z horyzontem czasowym, na którym tworzony jest model prognostyczny.

Opcje selekcji zmiennych metodą korelacji liniowej – przesunięcia czasowe 2/2 Zakres przeszukiwań dotyczący optymalnego przesunięcia czasowego jest związany z wybranym interwałem czasowym procesu analitycznego. W tym przypadku szukamy czynników wyprzedzających od 2 do 12 miesięcy zachowanie zmiennej opisywanej. Wybór interwału czasowego, dla którego prowadzony jest proces analityczny

Opcje selekcji zmiennych metodą korelacji liniowej – liczebność tworzonej grupy 1/2 Wielkość tworzonej grupy może być zdefiniowana przez użytkownika. Grupa może zawierać wszystkie zmienne spełniające brzegowe warunki korelacji lub tylko określoną ilość zmiennych najbardziej skorelowanych z wielkością opisywaną. Zwykle do budowy modelu predykcyjnego wykorzystuje się od kilku do kilkudziesięciu najbardziej powiązanych czynników. W przypadku wcześniejszego ustawienia warunku dotyczącego wyprzedzenia czasowego, korelacja uwzględnia to wyprzedzenie.

Warunki brzegowe współczynnika korelacji Opcje selekcji zmiennych metodą korelacji liniowej – liczebność tworzonej grupy 2/2 Definiowanie liczebności tworzonej grupy – w tym przypadku będzie ona zawierała 25 najbardziej skorelowane zmiennych, które jednocześnie muszą spełniać warunek brzegowy korelacji. Jeżeli w bazie nie znajdzie się tyle zmiennych spełniających warunki brzegowe, liczebność grupy będzie mniejsza Opcja pojemności informacyjnej powoduje, że w grupie znajdą się zmienne pozytywnie wpływające na jej pojemność informacyjną Warunki brzegowe współczynnika korelacji

Opcje selekcji zmiennych metodą korelacji liniowej – różnicowanie danych 1/2 Opcja różnicowania zmiennych umożliwia znalezienie danych, które wykazują podobieństwo na poziomie zmian. W przypadku cen lub notowań rynkowych szukamy wtedy zmiennych podobnych co do dynamiki zmian cenowych lub różnicy notowań.

Opcje selekcji zmiennych metodą korelacji liniowej – różnicowanie danych 2/2 Opcja różnicowania danych Parametr różnicowania danych związany jest z interwałem czasowym. W tym przypadku szukamy danych, które wykazują podobieństwo na poziomie zmian trzymiesięcznych

Opcje selekcji zmiennych metodą korelacji liniowej – okres liczenia współczynnika korelacji Zakres czasowy obliczania współczynnika korelacji – w tym przypadku szukamy danych skorelowanych w okresie od 1 stycznia 2006 roku do 1 stycznia 2017 roku. W przypadku budowania grupy pod kątem tworzenia modelu prognostycznego musimy uwzględnić okres testowy. Zdefiniowany zakres czasowy NIE POWINIEN uwzględniać okresu testowego – te okresy POWINNY BYĆ ROZŁĄCZNE. W bieżącym przykładzie okres testowy mógłby przebiegać, np. od lutego 2017 r. do stycznia 2018 r. JEST TO WARUNEK KONIECZNY DO PRAWIDŁOWEGO TESTOWANIA MODELI PROGNOSTYCZNYCH

Opcje selekcji zmiennych metodą korelacji liniowej – okres liczenia współczynnika korelacji Po wprowadzeniu wszystkich kryteriów przeszukiwania klikamy przycisk „Utwórz zadanie”. Jeżeli ustawienia są prawidłowe, otrzymamy komunikat o przyjęciu zdania do realizacji, który należy zaakceptować, klikając przycisk OK. Jeżeli pojawi się komunikat o błędzie w ustawieniach, należy dokonać poprawki i ponownie zlecić utworzenie zadania. Można uruchomić kilka procesów selekcji jeden po drugim, zmieniając niektóre kryteria selekcji. Każdemu tak utworzonemu zadaniu odpowiadać będzie osobna docelowa grupa zmiennych.

Dane kontaktowe ExMetrix Sp. Z o.o. ul. Grzegórzecka 21 31-532 Kraków NIP: 676 249 43 40 +48 570 202 650 www.exmetrix.com info@exmetrix.com Zbigniew Łukoś zbyszek@exmetrix.com +48 609 293 976 Ryszard Łukoś ryszard@exmetrix.com +48 726 900 912 Konrad Pawlus konrad@exmetrix.com +48 608 500 834