Gradacyjna analiza danych

Slides:



Advertisements
Podobne prezentacje
Excel Narzędzia do analizy regresji
Advertisements

KORELACJA I REGRESJA WIELOWYMIAROWA
Tablice 1. Deklaracja tablicy
BADANIE KORELACJI ZMIENNYCH
Polska Infrastruktura Informatycznego Wspomagania Nauki w Europejskiej Przestrzeni Badawczej Intuicyjny interfejs do zasobów projektu PL-Grid Migrating.
Analiza współzależności zjawisk
Metody identyfikacji i lokalizacji sekwencji kodujących w genomie
Jak mierzyć asymetrię zjawiska?
Jak mierzyć zróżnicowanie zjawiska? Wykład 4. Miary jednej cechy Miary poziomu Miary dyspersji (zmienności, zróżnicowania, rozproszenia) Miary asymetrii.
Podstawy informatyki Informatyka stosowana Prowadzący: Grzegorz Smyk
Pakiety statystyczne Maciej Szydłowski (dr)
BIOSTATYSTYKA I METODY DOKUMENTACJI
Analiza korelacji.
Tablice jednowymiarowe 1
Konstrukcje rozkładów poprzez składanie funkcji odwrotnych
Prognozowanie na podstawie szeregów czasowych
Problem transportowy opracowanie na podstawie „Metody wspomagające podejmowanie decyzji w zarządzaniu” D. Witkowska, Menadżer Łódź 2000.
Zadanie pierwotne Zadanie dualne Max f. celu Współczynniki f. celu Warunki „=„ Warunki „=„ Macierz parametrów Min f. celu.
dr inż. Monika Lewandowska
Mgr inż. Bartłomiej Stasiak Instytut Informatyki Wydział Fizyki Technicznej, Informatyki i Matematyki Stosowanej Politechnika Łódzka Data i miejsce.
Podstawy programowania PP – WYK5 Wojciech Pieprzyca.
Podstawy programowania PP – LAB5 Wojciech Pieprzyca.
Elżbieta Fuszara, Maciej Fuszara PAN Centrum Badań Ekologicznych
Ćwiczenie 1 Konwersja DN do radiancji na poziomie TOA na przykładzie danych ASTER L1B.
Additive Models, Trees, and Related Methods
Piotr Skurzyński Polska Izba Gospodarcza Zaawansowanych Technologii
Korelacje, regresja liniowa
ANALIZA KORELACJI LINIOWEJ PEARSONA / REGRESJA LINIOWA
KPK, Wiesław Studencki Wiesław Studencki Krajowy Punkt Kontaktowy 6 PR IPPT, PAN ul. Świętokrzyska 21, Warszawa tel: 22/ , 0/
Wykład 4. Rozkłady teoretyczne
Analiza wariancji.
Wielowymiarowa analiza danych oparta na modelach gradacyjnych
Praca magisterska wykonana pod kierunkiem dr hab. Wiesława Szczesnego
dr inż. Piotr Muryjas Wyższa Szkoła Przedsiębiorczości i Administracji
Eco Data Miner System oceny jakości wyników danych pomiarowych z sieci monitorującej stan atmosfery przy wykorzystaniu metod ilościowych Skrótowy opis.
TABLICE C++.
BADANIE STATYSTYCZNE Badanie statystyczne to proces pozyskiwania danych na temat rozkładu cechy statystycznej w populacji. Badanie może mieć charakter:
Małgorzata Waligórska 24 listopada 2010 r.
Elementy Rachunku Prawdopodobieństwa i Statystyki
Podstawy programowania w języku C i C++
Jednostki pola powierzchni.
Jerzy F. Kotowski1 Informatyka I Wykład 15 PIERWSZE KROKI.
Tablice w Turbo Pascalu.
Autorzy:Ania Szczubełek Kasia Sul
jeszcze dygresja o macierzach...
Wstęp do ekonomiki informacji
Institute of Computer Science PAS Warsaw, The Project is co-financed by the European Union from resources of the European Social Found.
Regresja wieloraka.
Ministerstwo Rozwoju Regionalnego, pl. Trzech Krzyży 3/5, Warszawa; Experiences with macromodelling for assessing.
Współpraca R z KNIME na przykładzie analizy sezonu 2013/14 Ekstraklasy piłkarskiej. Piotr Ocalewicz.
Co to jest neurofeedback?
Informatyka +.
Ekonomia polityczna wzrostu i rozwoju gospodarczego propozycja zajęć Katarzyna Metelska-Szaniawska Dominika Milczarek-Andrzejewska.
ZASTOSOWANIE SPEKTROSKOPII NMR W MEDYCYNIE
Regresja liniowa. Dlaczego regresja? Regresja zastosowanie Dopasowanie modelu do danych Na podstawie modelu, przewidujemy wartość zmiennej zależnej na.
Inteligentna droga do miasta przyszłości
Jak mierzyć asymetrię zjawiska? Wykład 5. Miary jednej cechy  Miary poziomu  Miary dyspersji (zmienności, zróżnicowania, rozproszenia)  Miary asymetrii.
Statystyczna analiza danych
Statystyczna analiza danych
Koncepcja modelu agregacji działek Kamil Grudzień, Norbert Kurpiel Wydział Geodezji Górniczej i Inżynierii Środowiska Katedra Geomatyki Warszawa, r.
Modele nieliniowe sprowadzane do liniowych
STATYSTYKA – kurs podstawowy wykład 11
Budownictwo energooszczędne - Dyrektywy unijne a ich realizacja projekt ZEBRA 2020 Andrzej Rajkiewicz– Narodowa Agencja Poszanowania Energii.
Koło Naukowe Metod Ilościowych
KORELACJA I REGRESJA WIELOWYMIAROWA
Małgorzata Podogrodzka, SGH ISiD
Grupy danych.
Analiza współzależności zjawisk
Korelacja i regresja liniowa
Jednostki pola powierzchni.
Zapis prezentacji:

Gradacyjna analiza danych Instytut Podstaw Informatyki PAN Wiesław Szczesny Emilia Jarochowska

Gradacyjna analiza danych Grade Correspondence Analysis Pomiar koncentracji, nadreprezentacja, GCA Przykład analizy Ku kompletnej infrastrukturze pojęć gradacyjnej analizy danych

W gradacyjnej analizie danych dwóm jednowymiarowym rozkładom przyporządkowuje się krzywą w kwadracie jednostkowym, która reprezentuje koncentrację jednego rozkładu względem drugiego. Para rozkładów Krzywa koncentracji

Pomiar maksymalnej koncentracji: krzywa Cmax i wskaźnik armax armax = 2 × pole Cmax

Nadreprezentacja „wielkość obserwowana” Wskaźnik nadreprezentacji = pi 0.06 0.07 0.081 0.094 0.125 0.127 0.184 0.26 qi 0.022 0.036 0.051 0.071 0.212 0.217 0.263 hi 0.37 0.51 0.63 0.76 1.02 1.67 1.18 1.01 „wielkość obserwowana” Wskaźnik nadreprezentacji = „wielkość wynikająca z modelu”

GCA

GradeStat Zmienne na różnych skalach Dane wielowymiarowe Dane z brakami GradeStat GCA: analiza odpowiedniości Analiza skupień Imputacja Wykrywanie el. odstających

Wskaźniki ekonomiczno-gospodarcze Przykład analizy Wskaźniki ekonomiczno-gospodarcze Dane z Grzegorek, 2006 na podstawie http://epp.eurostat.cec.eu.int

odpowiedniości + imputacja GCA – gradacyjna analiza Przykład analizy

GCCA – gradacyjna analiza skupień Przykład analizy

Mapa zróżnicowania wewnątrz zmiennych Przykład analizy

Znajdowanie elementów odstających Przykład analizy

Znajdowanie elementów odstających Przykład analizy Znajdowanie elementów odstających

http://gradestat.ipipan.waw.pl

Grade Models and Methods for Data Analysis Książki Grade Models and Methods for Data Analysis With applications for the analysis of data populations Kowalczyk T., Pleszczyńska E., Ruland F. (red.) 2004

Analiza danych medycznych i demograficznych Książki Analiza danych medycznych i demograficznych Przy użyciu programu GradeStat Książyk J., Matyja O., Pleszczyńska E., Wiech M. (red.) 2005 książka wydana we współpracy Instytutu Podstaw Informatyki z Centrum Zdrowia Dziecka

Ku kompletnej infrastrukturze pojęć gradacyjnej analizy danych

Dla pary zmiennych: Dla tablicy m×k: Pomiar asymetrii, spłaszczenia i nierówności Krzywa koncentracji Krzywa maks. koncentracji Dla tablicy m×k: Pomiar asymetrii, spłaszczenia i nierówności; HGCA Powierzchnia koncentracji Powierzchnia maks. koncentracji

Dla pary zmiennych symetryzacja krzywej porządkowanie punktów Pomiar asymetrii, spłaszczenia i nierówności Krzywa koncentracji Krzywa maks. koncentracji Wskaźnik koncentracji Krzywa Lorenza Wskaźnik maks. koncentracji Dla pary zmiennych

Uzgodnienie zwrotów zmiennych. Pomiar asymetrii, symetryzacja HGCA Porządkowanie wierszy i kolumn: GCCA Uzgodnienie zwrotów zmiennych. Pomiar asymetrii, spłaszczenia i nierówności; Powierzchnia maksymalnej koncentracji Powierzchnia koncentracji Wskaźnik koncentracji Wskaźnik maks. koncentracji Dla tablicy m×k Tablica kontyngencji lub macierz danych wielowymiarowych

Ten schemat będzie w przyszłości rozwijany w wielu pracach dotyczących infrastruktury pojęciowej analizy danych wielowymiarowych

Powiązania z innymi metodami wizualizacji, np Powiązania z innymi metodami wizualizacji, np. generalized association plots (Szczesny i Wiech, 2006) Dekompozycja obrazów medycznych, np. NMR (Grzegorek, 2005) Prace nad uzgadnianiem zwrotu zmiennych European Economic Survey – zastosowanie GCA (m.in. praca magisterska)

Zastosowanie w monitorowaniu ordynacji lekarskiej współpraca z Łódzkim Oddziałem NFZ

Zapraszamy na stronę http://gradestat.ipipan.waw.pl Przykłady zastosowań Zapraszamy na stronę http://gradestat.ipipan.waw.pl

Gradacyjna Analiza Danych W przygotowaniu książka Gradacyjna Analiza Danych dla użytkowników na rozmaitych poziomach zaawansowania

Dziękujemy za uwagę Wiesław Szczesny wsz@ipipan.waw.pl Emilia Jarochowska emkaj@hell.pl

Mapa nadreprezentacji w kolorze

Mapa współczynników korelacji rangowej Spearmana