Wielowymiarowa analiza danych oparta na modelach gradacyjnych Z implementacją w programie GradeStat1 E. Pleszczyńska, E. Jarochowska, W. Szczesny Instytut Podstaw Informatyki PAN http://gradestat.ipipan.waw.pl Artykuł częściowo finansowany z projektu badawczego nr 3T11CO5328 przyznanego przez Ministerstwo Nauki i Informatyzacji
We point out that models based on probability theory, and the statistical techniques derived from them, have limited applicability, at least in exploratory multivariate situations. Jan de Leeuw
Plan referatu Czym jest Gradacyjna Analiza Danych? Przykład analizy – dane ekonomiczno-gospodarcze Wykrywanie elementów odstających Odwracanie zwrotu zmiennych Schematy gradacyjnego przetwarzania danych w teraźniejszości i przyszłości
Gradacyjna Analiza Danych Parom rozkładów przyporządkowuje się zmienną „lilipucią” reprezentującą koncentrację jednego rozkładu względem drugiego Para rozkładów Krzywa koncentracji
Implementacja w GradeStat GCA (ang. grade correspondence analysis) Analiza skupień (GCCA) Wykrywanie elementów odstających Wizualizacja: mapy nadreprezentacji
http://gradestat.ipipan.waw.pl
Przykład analizy gradacyjnej Dane Europejskiego Biura Statystycznego 25 krajów UE Zmienne ekonomiczne mierzone na różnych skalach absolutnych: dzietność, zużycie energii, inflacja, przewidywana dlugość życia etc.
Macierz danych
Mapa nadreprezentacji po GCA
Mapy odstępstw od regularności Przed odwróceniem zwrotu zmiennych Po odwróceniu zwrotu zmiennych 11, 12, 13 i 14
Mapy wskaźników korelacji Przed odwróceniem zwrotu zmiennych Po odwróceniu zwrotu zmiennych 11, 12, 13, 14
Krzywe koncentracji
Schematy gradacyjnego przetwarzania danych Dla pary zmiennych: Pomiar asymetrii, spłaszczenia i nierówności Krzywa koncentracji Krzywa maks. koncentracji Dla tablicy m×k: HGCA. Pomiar asymetrii, spłaszczenia i nierówności. Powierzchnia koncentracji Powierzchnia maks. koncentracji
Literatura Kowalczyk T., Pleszczyńska E., Ruland F. (red.), Grade Models and Methods for Data Analysis with Applications for the Analysis of Data Populations. Berlin, Springer-Verlag, 2004. Książyk J., Matyja O., Pleszczyńska E., Wiech M. (red.), Analiza danych medycznych i demograficznych przy użyciu programu GradeStat, Warszawa, IPI PAN i Instytut „Pomnik – Centrum Zdrowia Dziecka”, 2005.
http://gradestat.ipipan.waw.pl Zapraszamy na stronę programu: GradeStat do pobrania Samouczek programu Przykłady zastosowania