Pobierz prezentację
Pobieranie prezentacji. Proszę czekać
1
Gradacyjna analiza danych
Instytut Podstaw Informatyki PAN Wiesław Szczesny Emilia Jarochowska
2
Gradacyjna analiza danych
Grade Correspondence Analysis Pomiar koncentracji, nadreprezentacja, GCA Przykład analizy Ku kompletnej infrastrukturze pojęć gradacyjnej analizy danych
3
W gradacyjnej analizie danych dwóm jednowymiarowym rozkładom przyporządkowuje się krzywą w kwadracie jednostkowym, która reprezentuje koncentrację jednego rozkładu względem drugiego. Para rozkładów Krzywa koncentracji
4
Pomiar maksymalnej koncentracji: krzywa Cmax i wskaźnik armax
armax = 2 × pole Cmax
5
Nadreprezentacja „wielkość obserwowana” Wskaźnik nadreprezentacji =
pi 0.06 0.07 0.081 0.094 0.125 0.127 0.184 0.26 qi 0.022 0.036 0.051 0.071 0.212 0.217 0.263 hi 0.37 0.51 0.63 0.76 1.02 1.67 1.18 1.01 „wielkość obserwowana” Wskaźnik nadreprezentacji = „wielkość wynikająca z modelu”
6
GCA
8
GradeStat Zmienne na różnych skalach Dane wielowymiarowe
Dane z brakami GradeStat GCA: analiza odpowiedniości Analiza skupień Imputacja Wykrywanie el. odstających
9
Wskaźniki ekonomiczno-gospodarcze
Przykład analizy Wskaźniki ekonomiczno-gospodarcze Dane z Grzegorek, 2006 na podstawie
10
odpowiedniości + imputacja GCA – gradacyjna analiza
Przykład analizy
11
GCCA – gradacyjna analiza
skupień Przykład analizy
12
Mapa zróżnicowania wewnątrz zmiennych
Przykład analizy
13
Znajdowanie elementów odstających
Przykład analizy
14
Znajdowanie elementów odstających
Przykład analizy Znajdowanie elementów odstających
16
Grade Models and Methods for Data Analysis
Książki Grade Models and Methods for Data Analysis With applications for the analysis of data populations Kowalczyk T., Pleszczyńska E., Ruland F. (red.) 2004
17
Analiza danych medycznych i demograficznych
Książki Analiza danych medycznych i demograficznych Przy użyciu programu GradeStat Książyk J., Matyja O., Pleszczyńska E., Wiech M. (red.) 2005 książka wydana we współpracy Instytutu Podstaw Informatyki z Centrum Zdrowia Dziecka
18
Ku kompletnej infrastrukturze pojęć gradacyjnej analizy danych
19
Dla pary zmiennych: Dla tablicy m×k: Pomiar asymetrii, spłaszczenia
i nierówności Krzywa koncentracji Krzywa maks. koncentracji Dla tablicy m×k: Pomiar asymetrii, spłaszczenia i nierówności; HGCA Powierzchnia koncentracji Powierzchnia maks. koncentracji
20
Dla pary zmiennych symetryzacja krzywej porządkowanie punktów
Pomiar asymetrii, spłaszczenia i nierówności Krzywa koncentracji Krzywa maks. koncentracji Wskaźnik koncentracji Krzywa Lorenza Wskaźnik maks. koncentracji Dla pary zmiennych
21
Uzgodnienie zwrotów zmiennych. Pomiar asymetrii,
symetryzacja HGCA Porządkowanie wierszy i kolumn: GCCA Uzgodnienie zwrotów zmiennych. Pomiar asymetrii, spłaszczenia i nierówności; Powierzchnia maksymalnej koncentracji Powierzchnia koncentracji Wskaźnik koncentracji Wskaźnik maks. koncentracji Dla tablicy m×k Tablica kontyngencji lub macierz danych wielowymiarowych
22
Ten schemat będzie w przyszłości rozwijany w wielu pracach dotyczących infrastruktury pojęciowej analizy danych wielowymiarowych
23
Powiązania z innymi metodami wizualizacji, np
Powiązania z innymi metodami wizualizacji, np. generalized association plots (Szczesny i Wiech, 2006) Dekompozycja obrazów medycznych, np. NMR (Grzegorek, 2005) Prace nad uzgadnianiem zwrotu zmiennych European Economic Survey – zastosowanie GCA (m.in. praca magisterska)
24
Zastosowanie w monitorowaniu ordynacji lekarskiej współpraca z Łódzkim Oddziałem NFZ
25
Zapraszamy na stronę http://gradestat.ipipan.waw.pl
Przykłady zastosowań Zapraszamy na stronę
26
Gradacyjna Analiza Danych
W przygotowaniu książka Gradacyjna Analiza Danych dla użytkowników na rozmaitych poziomach zaawansowania
27
Dziękujemy za uwagę Wiesław Szczesny wsz@ipipan.waw.pl
Emilia Jarochowska
28
Mapa nadreprezentacji w kolorze
29
Mapa współczynników korelacji rangowej Spearmana
Podobne prezentacje
© 2024 SlidePlayer.pl Inc.
All rights reserved.