Analiza wielozmienna – metody taksonomiczne

Slides:



Advertisements
Podobne prezentacje
Przykład liczbowy Rozpatrzmy dwuwymiarową zmienną losową (X,Y), gdzie X jest liczbą osób w rodzinie, a Y liczbą izb w mieszkaniu. Niech f.r.p. tej zmiennej.
Advertisements

Zasady doboru instalacji solarnej
Klasyfikacja roczna w roku szkolnym 2012/2013
POWIAT MYŚLENICKI Tytuł Projektu: Poprawa płynności ruchu w centrum Myślenic poprzez przebudowę skrzyżowań dróg powiatowych K 1935 i K 1967na rondo.
The new wave of comfort.
V DNI OSZCZĘDZANIA ENERGII
Domy Na Wodzie - metoda na wlasne M
ZNACZENIE ZDROWIA PSYCHICZNEGO DLA EFEKTYWNOŚCI PRACOWNIKA
klasa3a3b3c3d ang 3d fr.3e3f3k3m3s Zad 13,462,752,623,573,822,762,722,623,322,76 Zad 22,611,51,550,851,761,51,091,062,251,33.
MINISTERSTWO ROZWOJU REGIONALNEGO Przebieg realizacji działań dotyczących MSP w ramach Sektorowego Programu Operacyjnego Wzrost konkurencyjności przedsiębiorstw,
Podatki i opłaty lokalne w 2010 roku
Dane dotyczące sprzedaży wody mineralnej
Wartość empiryczna (obserwowana) zmiennej
NOWE TECHNOLOGIE NA USŁUGACH EDUKACJI Publiczna Szkoła Podstawowa nr 3 w Grodkowie Zajęcia w ramach projektu NTUE.
UŁAMKI DZIESIĘTNE porównywanie, dodawanie i odejmowanie.
Cenniki 2005.
Proste zapytania w języku SQL
Badania biegłości oczami organizatora
Prezentacja poziomu rozwoju gmin, które nie korzystały z FS w 2006 roku. Eugeniusz Sobczak Politechnika Warszawska KNS i A Wykorzystanie Funduszy.
Fundusze nieruchomości jako inwestycja z celem zdobycia kapitału emerytalnego Karolina Oleszek.
METODY PODEJMOWANIA DECYZJI
- ROZWÓJ i POPRAWA KONKURENCYJNOŚCI REGIONU - realizowane w oparciu o:
ANALIZA BADANIA STATYSTYCZNEGO
Klamki do drzwi Klamki okienne i inne akcesoria
Matura 2005 Wyniki Jarosław Drzeżdżon Matura 2005 V LO w Gdańsku
Opracowanie wyników pomiarów
WYNIKI SPRAWDZIANU SZÓSTOKLASISTY 2010 DLA SZKOŁY.
Cena Państwa Warszawa, Ile płacimy podatków (1) Zarabiający średnią Krajową Polak zapłaci w 2012 roku łącznie złotych podatków czyli.
Właściciele w strukturze społecznej Henryk Domański IFiS PAN Warszawa, 25 listopada 2013.
Wyniki egzaminu gimnazjalnego 2011
Ogólnopolski Konkurs Wiedzy Biblijnej Analiza wyników IV i V edycji Michał M. Stępień
STAN WDRAŻANIA LOKALNEJ STRATEGII ROZWOJU LGD QWSI NA DZIEŃ
Uniwersytet Przyrodniczy we Wrocławiu Katedra Żywienia Roślin Możliwości wykorzystania biowęgla do nawożenia gleb Prof. dr hab. Zofia Spiak.
Agnieszka Jankowicz-Szymańska1, Wiesław Wojtanowski1,2
Rozkłady wywodzące się z rozkładu normalnego standardowego
Podatki i opłaty lokalne na 2012 rok
RADA PROGRAMOWA RSIP WŁ Łódź, r. Małgorzata Krawczyk
AKASA Bank Sebastian Marchel Anna Karpińska Anna Matusiewicz
PROJEKT BUDŻETU MIASTA TCZEWA NA 2010 ROK.. ZRÓWNOWAŻENIE BUDŻETU Projekt budżetu miasta na 2010 rok został zrównoważony na poziomie Wpływy budżetowe.
Ewa Meller Koło Naukowe Metod Ilościowych Wydział Zarządzania Uniwersytet Gdański.
1. Pomyśl sobie liczbę dwucyfrową (Na przykład: 62)
Wieloletnia Prognoza Finansowa i PROJEKT BUDŻETU POWIATU NA 2012 ROK Listopad 2011.
1. ŁATWOŚĆ ZADANIA (umiejętności) 2. ŁATWOŚĆ ZESTAWU ZADAŃ (ARKUSZA)
Analiza matury 2013 Opracowała Bernardeta Wójtowicz.
Podstawy statystyki, cz. II
Analiza wskaźnikowa.
Spływ należności w Branży Elektrycznej
w wyborach do parlamentu RP
Działalność ekonomiczno - finansowa
Wstępna analiza egzaminu gimnazjalnego.
EGZAMINU GIMNAZJALNEGO 2013
EcoCondens Kompakt BBK 7-22 E.
EcoCondens BBS 2,9-28 E.
ZAJĘCIA 8 OBLICZENIE ZBROJENIA SŁUPÓW -ZBROJENIE SYMETRYCZNE - ZBROJENIE NIESYMETRYCZNE KONSTRUKCJE BETONOWE II 2013/2014 MGR. INŻ. Julita Krassowska.
Określanie mimośrodu w elementach ściskanych
Wyniki badań dzieci 10 letnich z realizacji podstawy programowej z wychowania fizycznego po I etapie edukacyjnym- wrzesień 2013, luty- czerwiec 2014 Kuratorium.
Projekt Badawczo- Rozwojowy realizowany na rzecz bezpieczeństwa i obronności Państwa współfinansowany ze środków Narodowego Centrum Badań i Rozwoju „MODEL.
User experience studio Użyteczna biblioteka Teraźniejszość i przyszłość informacji naukowej.
WYNIKI EGZAMINU MATURALNEGO W ZESPOLE SZKÓŁ TECHNICZNYCH
Odzyskać obywatelstwo perspektywa makroekonomiczna Anna Zachorowska-Mazurkiewicz Feministyczny Think Tank.
EGZAMIN GIMNAZJALNY Charakterystyka wyników osiągniętych przez uczniów.
Testogranie TESTOGRANIE Bogdana Berezy.
Jak Jaś parował skarpetki Andrzej Majkowski 1 informatyka +
Nowy Jork Londyn Mleko, (1l) 0,81£ 0,94 £ Bochenek świeżego chleba (500g) 1,78 £ 0,96 £ Ryż (biały), (1kg) 2,01 £ 1,51 £ Jajka(12) 1,86 £ 2,27 £ Lokalny.
1 Używanie alkoholu i narkotyków przez młodzież szkolną w województwie opolskim w 2007 r. Na podstawie badań przeprowadzonych przez PBS DGA (w pełni porównywalnych.
Współrzędnościowe maszyny pomiarowe
Elementy geometryczne i relacje
Strategia pomiaru.
LO ŁobżenicaWojewództwoPowiat pilski 2011r.75,81%75,29%65,1% 2012r.92,98%80,19%72,26% 2013r.89,29%80,49%74,37% 2014r.76,47%69,89%63,58% ZDAWALNOŚĆ.
Zapis prezentacji:

Analiza wielozmienna – metody taksonomiczne Wykład nr 3

Odległość taksonomiczna jest miarą podobieństwa obiektów TAKSON [gr.], to formalna jednostka systematyczna organizmów; takson wyodrębnia się wg zasad, a następnie szereguje w hierarchię taksonomiczną, na którą składają się: odmiana (varietas), podgatunek (subspecies), gatunek (species), rodzaj (genus), rodzina (familia), rząd (ordo), gromada lub klasa (classis), typ (phylum lub cladus) Odległość taksonomiczna jest miarą podobieństwa obiektów

Autorami taksonomii wrocławskiej jest grupa polskich badaczy Florek, Łukaszewicz, Perkal, Steinhaus, Zubrzycki W oparciu o taksonomię wrocławską możemy dokonać podziału przestrzeni stosując dwa podejścia Typologię przestrzenną Klasyfikację przestrzenną właściwą (regionalizacja)

Typologia przestrzenna stanowi procedurę realizowaną w dwóch etapach Typologia przestrzenna stanowi procedurę realizowaną w dwóch etapach. Faza pierwsza polega na wyróżnieniu klas typologicznych, wyrażających grupy obiektów najbardziej podobnych, niezależnie od ich fizycznego położenia w przestrzeni. W drugim etapie przenosi się uzyskane wyniki na mapę, i tworzy się klasy przestrzenne obiektów będących w tej samej klasie typologicznej, a przy tym również sąsiadujących ze sobą. Klasyfikacja właściwa od samego początku uwzględnia spójność przestrzenną tworzonych klas. Spełnienie tego warunku wymaga równoległego przekształcenia macierzy funkcji podobieństwa w binarną macierz sąsiedztwa. Wydzielone klasy cechują się zawsze unikalnymi właściwościami, spełniając jednocześnie warunki rozłączności i adekwatności przestrzennej.

standaryzacja Dane wyjściowe Dane po standaryzacji L.p Powiaty małżeństwa urodzenia zgony na 1000 mieszkańców 1 bielski 5,85 9,98 9,26 2 cieszyński 5,49 10,60 9,69 3 częstochowski 5,35 9,65 11,92 4 gliwicki 5,33 8,52 8,88 5 kłobucki 6,57 10,06 10,79 6 mikołowski 5,18 9,13 9,83 7 pszczyński 5,59 10,92 7,15 8 raciborski 4,55 8,42 8,28 9 rybnicki 5,39 9,60 9,49 10 tarnogórski 4,47 7,82 8,47 11 tyski 4,91 8,83 7,79 12 żywiecki 5,86 11,43 10,41   Średnia 5,38 9,58 9,33 L.p Powiaty  małżeństwa urodzenia zgony   1 bielski 1,09 1,04 0,99 2 cieszyński 1,02 1,11 3 częstochowski 1,01 1,28 4 gliwicki 0,89 0,95 5 kłobucki 1,22 1,05 1,16 6 mikołowski 0,96 7 pszczyński 1,14 0,77 8 raciborski 0,85 0,88 9 rybnicki 1,00 10 tarnogórski 0,83 0,82 0,91 11 tyski 0,92 12 żywiecki 1,19 1,12 Źródło: Rocznik Statystyczny woj. śląskiego 2002

Miary odległości taksonomicznych     n- cechy i,j – numeracja wierszy Xk – element w macierzy    

Obliczenie odległości taksonomicznej pomiędzy wszystkimi obiektami np. d12=│1,09 – 1,02│+│1,04 – 1,11│+│0,99 – 1,04│ = 0,07 + 0,07 + 0,05 = 0,19 0,19 0,41 0,29 0,31 0,27 0,37 0,50 0,16 0,56 0,45 0,28 0,33 0,38 0,23 0,32 0,55 0,14 0,61 0,24 0,39 0,68 0,67 0,72 0,44 0,59 0,18 0,49 0,21 0,22 0,46 0,66 0,82 0,87 0,76 0,36 0,13 0,30 0,43 0,57 0,42 0,10 0,78 0,47 0,35 0,26 0,85 0,74 

Zestawienie jednostek najbliższych Odległość taksonomiczna Powiat (obiekt) Odległość taksonomiczna 1 0,16 9 2 0,14 3 0,28 4 0,18 6 5 0,31 0,13 7 0,32 8 0,10 10 11 12 0,24

Odległość taksonomiczna Powiat (obiekt) Odległość taksonomiczna 1 0,16 9 2 0,14 3 0,28 4 0,18 6 5 0,31 0,13 7 0,32 8 0,10 10 11 12 0,24 5 3 12 1 9 2 7 4 6 10 8 11

Dendryt Skupienia I-rzędu 1 3 7 2 9 5 4 6 12 1 3 7 2 9 5 4 6 12 11 10 8 11 10 8 4 (0,28) 4 (0,21) 4 (0,22)

10 5 3 1 7 2 9 4 6 12 11 8 0,21 0,10 0,16 0,28 0,31 0,18 0,13 0,14 0,24 0,32 Dendryt

Podział dendrytu oparty na kryteriach Z. Hellwiga Znaleźć wartość minimalną dla każdego wiersza w macierzy odległości taksonomicznej (ci) Utworzyć kolumnę wartości (ci) Obliczyć średnią arytmetyczną wartości (ci) Obliczyć odchylenie standardowe wartości (ci) wg wzoru Obliczenie wariantowych wartości krytycznych wg wzorów Ostre Średnie Słabe   Wybór jednego z kryterium do podziału dendrytu Podział dendrytu na klasy przestrzenne wg przyjętego kryterium

10 5 3 1 7 2 9 4 6 12 11 8 0,21 0,10 0,16 0,28 0,31 0,18 0,13 0,14 0,24 0,32 Dendryt d1, d2 d2

10 5 3 1 7 2 9 4 6 12 11 8 0,21 0,10 0,16 0,28 0,31 0,18 0,13 0,14 0,24 0,32 Dendryt d1, d2 d2 d1, d2

Model średnich arytmetycznych Dla poszczególnych klas przestrzennych obliczamy wartości średnie poszczególnych cech, korzystając z danych wyjściowych. Każdą średnią grupową dzielimy przez średnią ogólną wg ogólnego wzoru gdzie: xgj średnia arytmetyczna j-tej cechy dla grupy Xoj średnia arytmetyczna j-tej cechy dla całej macierzy j numer cechy, j=1,...,m Ilorazy większe od jedności świadczą o dominacji określonej cechy, zaś mniejsze od jedności o jej niedoborze.

Klasa przestrzenna Nr powiatów Cechy małżeństwa urodzenia zgony Powiaty Cechy małżeństwa urodzenia zgony na 1000 mieszkańców I 5 kłobucki 6,57 10,06 10,79 II 3 częstochowski 5,35 9,65 11,92 III 7 pszczyński 5,59 10,92 7,15 IV 12 żywiecki 5,86 11,43 10,41 V 11 tyski 4,91 8,83 7,79 8 raciborski 4,55 8,42 8,28 10 tarnogórski 4,47 7,82 8,47 8,36 8,18 VI 1 bielski 5,85 9,98 9,26 2 cieszyński 5,49 10,60 9,69 4 gliwicki 5,33 8,52 8,88 6 mikołowski 5,18 9,13 9,83 9 rybnicki 5,39 9,6 9,49 5,45 9,57 9,43 5,38 9,58 9,33 1,22 1,05 1,16 0,99 1,01 1,28 1,04 1,14 0,77 1,09 1,19 1,12 0,86 0,87 0,88 1,00

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 Czerwionka-Leszczyny   1,38 3,09 0,62 0,69 0,86 0,68 1,29 0,49 0,47 1,05 0,52 0,50 1,09 0,54 1,60 Gaszowice 2,74 1,46 1,22 1,65 1,55 1,32 1,85 1,17 1,78 1,33 1,86 1,56 2,00 Jejkowice 2,57 2,99 2,53 2,41 2,21 2,86 3,26 2,73 2,77 2,50 3,20 3,39 3,27 Lyski 0,89 0,58 0,98 0,79 0,76 0,78 0,35 1,59 1,16 2,10 Świerklany 1,06 0,91 1,18 0,87 1,10 0,44 0,80 0,72 1,28 Pszów 0,28 0,90 0,88 0,93 0,70 0,83 0,57 1,80 Radlin 0,96 0,66 0,94 0,67 0,53 1,00 0,97 1,51 Rydułtowy 1,52 1,50 1,25 1,13 1,21 Wodzisław Śląski 0,95 0,65 0,85 0,84 1,12 Godów 1,49 Gorzyce 1,82 1,30 Lubomia 1,72 Marklowice 0,60 1,15 1,54 Mszana 1,53 2,04 Jastrzębie-Zdrój Rybnik 1,37 Żory 1,597 1,995 3,268 2,097 1,283 1,798 1,514 1,206 1,119 2,001 2,208 1,719 1,539 2,041 0,688 1,371

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 Czerwionka-Leszczyny   1,09 0,54 1,60 Gaszowice 2,74 1,46 1,32 1,56 Jejkowice 2,57 2,21 3,39 Lyski 1,29 1,16 Świerklany 0,44 0,80 0,86 0,72 1,28 Pszów 0,90 0,93 0,70 Radlin 0,96 0,66 0,67 0,97 Rydułtowy 1,05 1,51 Wodzisław Śląski 0,95 1,52 0,85 Godów 0,65 Gorzyce 1,17 Lubomia Marklowice 0,60 Mszana Jastrzębie-Zdrój 1,49 1,53 0,69 Rybnik 1,37 Żory 0,7 0,6

Klas wyróżnione na podstawie klasyfikacji przestrzennej właściwej (regionalizacja) Klasy typologii przestrzennej Źródło: opracowanie własne

Położenie w przestrzenni badanych gmin

- współczynnik przyrostu naturalnego, - współczynnik salda migracji, Zestaw wyjściowych wskaźników obejmował następujące cechy (dane z 2000 roku): - gęstość zaludnienia, - współczynnik przyrostu naturalnego, - współczynnik salda migracji, - odsetek pracujących w przemyśle, - długość wodociągów na 1 km2, - długość kanalizacji na 1 km2, - długość gazociągów na 1 km2, - zasoby mieszkaniowe w m2 na 1 mieszkańca, - przychodnie na 1 tys. mieszkańców, - apteki na 1 tys. mieszkańców, - odsetek lasów w powierzchni ogółem, - podmioty gospodarcze na 1000 mieszkańców, - księgozbiór na 1000 mieszkańców, - dochody własne gmin w zł na 1 osobę, - wydatki majątkowe gmin na 1 mieszkańca,

Źródło: opracowanie własne Klasy przestrzenne wyróżnione na podstawie właściwej klasyfikacji przestrzennej – (regionalizacja) Klasy typologiczne Źródło: opracowanie własne

Wielkości ilorazów z modelu średnich arytmetycznych dla klas wyróżnionych według właściwej klasyfikacji przestrzennej Klasa Gminy* Cechy 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 5, 12, 14, 15, 16, 17, 19, 20, 21, 28 1,21 0,57 0,92 1,13 1,60 1,31 1,50 1,06 1,32 0,99 0,53 1,04 1,05 1,08 1,20 1, 4, 24, 25, 26, 27, 29 1,57 0,83 0,95 1,27 1,38 1,79 1,25 0,93 1,53 0,82 1,11 1,07 1,34 1,24 2, 10 0,67 1,28 1,88 0,56 1,70 1,02 1,35 0,25 0,88 0,94 0,74 30, 31, 32 1,16 1,73 0,86 0,91 0,84 1,12 0,47 0,96 1,14 33, 34, 35, 36, 37, 39, 41, 42, 44 0,58 1,81 0,70 0,35 0,52 0,32 0,73 0,68 0,60 18, 38, 40,43 1,54 0,85 0,38 0,11 0,33 0,00 0,77 1,64 0,72 0,97 6, 9, 13, 22 0,36 1,58 0,69 0,24 0,64 1,03 1,36 1,52 1,30 0,79 3, 7, 8, 11 0,37 1,47 1,22 1,48 1,01 1,83 0,81 0,89 Wartość najwyższa Wartość najniższa Źródło: opracowanie własne * - numeracja gmin zgodna z ryc. 1 gdzie cechy: 1 - gęstość zaludnienia, 2 - współczynnik przyrostu naturalnego, 3 - współczynnik salda migracji, 4 - odsetek pracujących w przemyśle, 5 - długość wodociągów na 1 km2, 6 - długość kanalizacji na 1 km2, 7 - długość gazociągów na 1 km2, 8 - zasoby mieszkaniowe w m2 na 1 mieszkańca, 9 - przychodnie na 1 tys. mieszkańców, 10 - apteki na 1 tys. mieszkańców, 11 - odsetek lasów w powierzchni ogółem, 12 - podmioty gospodarcze na 1000 mieszkańców, 13 - księgozbiór na 1000 mieszkańców, 14 - dochody własne gmin w zł na 1 osobę, 15 - wydatki majątkowe gmin na 1 mieszkańca

Badanie struktury w geografii STRUKTURA rozmieszczenie elementów składowych oraz zespół relacji między nimi, charakterystyczny dla danego układu jako całości; w węższym znaczeniu — sposób wzajemnego przyporządkowania elementów składowych i połączenia ich w pewną całość lub też system zależności między elementami danego układu oraz poszczególnymi elementami a całością układu;

Po co badamy strukturę? dla określenia proporcji pomiędzy elementami struktury dla wyznaczenia elementów dominujących dla porównania struktur w różnych obiektach przestrzennych

Prezentacja pojedynczej struktury Źródło: opracowanie własne

Prezentacja wielu struktur równocześnie

Nieprawidłowe sposoby prezentacji struktury Źródło: opracowanie własne

Wskaźnik specjalizacji lokalnej P.S. Florence'a umożliwia wskazanie najważniejszych (dominujących) elementów badanej struktury gdzie: ui - udział procentowy danej cechy w strukturze i-tej jednostki przestrzennej bądź w obiekcie Ui - udział procentowy danej cechy w strukturze jednostki hierarchicznie wyższej Wady wskaźnika specjalizacji Brak wyraźnej jednej cechy dominującej Konieczność odniesienia struktury do struktury hierarchicznie wyższej Struktura użytkowania ziemi w Sosnowcu w 2000 r. Sosnowiec woj. śląskie ui/Ui % grunty orne 16,2 37,2 0,436062 sady 2,7 0,9 3,084362 łąki 5,0 8,7 0,574762 pastwiska 2,3 3,7 0,627818 lasy 18,7 32,0 0,584138 nieużytki 55,1 17,6 3,131002 Źródło: opracowanie własne

Względny wskaźnik podobieństwa struktur   Pozwala na porównanie wewnętrznej budowy danej zbiorowości Z=0,1 1 oznacza ze struktury są identyczne 0 że struktury są zupełnie różne min(wi) odpowiadające sobie minimalne wartości struktury max(wi) odpowiadające sobie max. wartości struktury

Struktura pojazdów w Polsce w 2002 r.

Metoda K. Doi wyznaczania elementów dominujących Wyrażenie struktury w liczbach procentowych; Uszeregowanie elementów struktury w kolejności malejącej; Konstrukcja szeregu skumulowanego; Porównanie kolejnych wartości z szeregu skumulowanego z odpowiadającymi im rangą wartościami krytycznymi w tabeli w celu wyznaczenia elementów dominujących danej struktury. Powierzchnia zasiewów w ha Powierzchnia zasiewów w % Elementy procentowe uporządkowane Szereg skumulowany pszenica 79475 21,9 żyto 55379 15,2 37,1 jęczmień 37708 10,4 13,0 50,2 owies 14226 3,9 11,4 61,6 pszenżyto 21207 5,8 71,9 mieszanki zbożowe 28941 8,0 79,9 gryka i proso 594 0,2 85,8 kukurydza 4375 1,2 5,2 91,0 strączkowe 1506 0,4 94,9 ziemniaki 47405 3,4 98,2 przemysłowe 18954 99,4 pastewne 41339 99,9 warzywa gruntowe 12206 100,0