Analiza wielozmienna – metody taksonomiczne Wykład nr 3
Odległość taksonomiczna jest miarą podobieństwa obiektów TAKSON [gr.], to formalna jednostka systematyczna organizmów; takson wyodrębnia się wg zasad, a następnie szereguje w hierarchię taksonomiczną, na którą składają się: odmiana (varietas), podgatunek (subspecies), gatunek (species), rodzaj (genus), rodzina (familia), rząd (ordo), gromada lub klasa (classis), typ (phylum lub cladus) Odległość taksonomiczna jest miarą podobieństwa obiektów
Autorami taksonomii wrocławskiej jest grupa polskich badaczy Florek, Łukaszewicz, Perkal, Steinhaus, Zubrzycki W oparciu o taksonomię wrocławską możemy dokonać podziału przestrzeni stosując dwa podejścia Typologię przestrzenną Klasyfikację przestrzenną właściwą (regionalizacja)
Typologia przestrzenna stanowi procedurę realizowaną w dwóch etapach Typologia przestrzenna stanowi procedurę realizowaną w dwóch etapach. Faza pierwsza polega na wyróżnieniu klas typologicznych, wyrażających grupy obiektów najbardziej podobnych, niezależnie od ich fizycznego położenia w przestrzeni. W drugim etapie przenosi się uzyskane wyniki na mapę, i tworzy się klasy przestrzenne obiektów będących w tej samej klasie typologicznej, a przy tym również sąsiadujących ze sobą. Klasyfikacja właściwa od samego początku uwzględnia spójność przestrzenną tworzonych klas. Spełnienie tego warunku wymaga równoległego przekształcenia macierzy funkcji podobieństwa w binarną macierz sąsiedztwa. Wydzielone klasy cechują się zawsze unikalnymi właściwościami, spełniając jednocześnie warunki rozłączności i adekwatności przestrzennej.
standaryzacja Dane wyjściowe Dane po standaryzacji L.p Powiaty małżeństwa urodzenia zgony na 1000 mieszkańców 1 bielski 5,85 9,98 9,26 2 cieszyński 5,49 10,60 9,69 3 częstochowski 5,35 9,65 11,92 4 gliwicki 5,33 8,52 8,88 5 kłobucki 6,57 10,06 10,79 6 mikołowski 5,18 9,13 9,83 7 pszczyński 5,59 10,92 7,15 8 raciborski 4,55 8,42 8,28 9 rybnicki 5,39 9,60 9,49 10 tarnogórski 4,47 7,82 8,47 11 tyski 4,91 8,83 7,79 12 żywiecki 5,86 11,43 10,41 Średnia 5,38 9,58 9,33 L.p Powiaty małżeństwa urodzenia zgony 1 bielski 1,09 1,04 0,99 2 cieszyński 1,02 1,11 3 częstochowski 1,01 1,28 4 gliwicki 0,89 0,95 5 kłobucki 1,22 1,05 1,16 6 mikołowski 0,96 7 pszczyński 1,14 0,77 8 raciborski 0,85 0,88 9 rybnicki 1,00 10 tarnogórski 0,83 0,82 0,91 11 tyski 0,92 12 żywiecki 1,19 1,12 Źródło: Rocznik Statystyczny woj. śląskiego 2002
Miary odległości taksonomicznych n- cechy i,j – numeracja wierszy Xk – element w macierzy
Obliczenie odległości taksonomicznej pomiędzy wszystkimi obiektami np. d12=│1,09 – 1,02│+│1,04 – 1,11│+│0,99 – 1,04│ = 0,07 + 0,07 + 0,05 = 0,19 0,19 0,41 0,29 0,31 0,27 0,37 0,50 0,16 0,56 0,45 0,28 0,33 0,38 0,23 0,32 0,55 0,14 0,61 0,24 0,39 0,68 0,67 0,72 0,44 0,59 0,18 0,49 0,21 0,22 0,46 0,66 0,82 0,87 0,76 0,36 0,13 0,30 0,43 0,57 0,42 0,10 0,78 0,47 0,35 0,26 0,85 0,74
Zestawienie jednostek najbliższych Odległość taksonomiczna Powiat (obiekt) Odległość taksonomiczna 1 0,16 9 2 0,14 3 0,28 4 0,18 6 5 0,31 0,13 7 0,32 8 0,10 10 11 12 0,24
Odległość taksonomiczna Powiat (obiekt) Odległość taksonomiczna 1 0,16 9 2 0,14 3 0,28 4 0,18 6 5 0,31 0,13 7 0,32 8 0,10 10 11 12 0,24 5 3 12 1 9 2 7 4 6 10 8 11
Dendryt Skupienia I-rzędu 1 3 7 2 9 5 4 6 12 1 3 7 2 9 5 4 6 12 11 10 8 11 10 8 4 (0,28) 4 (0,21) 4 (0,22)
10 5 3 1 7 2 9 4 6 12 11 8 0,21 0,10 0,16 0,28 0,31 0,18 0,13 0,14 0,24 0,32 Dendryt
Podział dendrytu oparty na kryteriach Z. Hellwiga Znaleźć wartość minimalną dla każdego wiersza w macierzy odległości taksonomicznej (ci) Utworzyć kolumnę wartości (ci) Obliczyć średnią arytmetyczną wartości (ci) Obliczyć odchylenie standardowe wartości (ci) wg wzoru Obliczenie wariantowych wartości krytycznych wg wzorów Ostre Średnie Słabe Wybór jednego z kryterium do podziału dendrytu Podział dendrytu na klasy przestrzenne wg przyjętego kryterium
10 5 3 1 7 2 9 4 6 12 11 8 0,21 0,10 0,16 0,28 0,31 0,18 0,13 0,14 0,24 0,32 Dendryt d1, d2 d2
10 5 3 1 7 2 9 4 6 12 11 8 0,21 0,10 0,16 0,28 0,31 0,18 0,13 0,14 0,24 0,32 Dendryt d1, d2 d2 d1, d2
Model średnich arytmetycznych Dla poszczególnych klas przestrzennych obliczamy wartości średnie poszczególnych cech, korzystając z danych wyjściowych. Każdą średnią grupową dzielimy przez średnią ogólną wg ogólnego wzoru gdzie: xgj średnia arytmetyczna j-tej cechy dla grupy Xoj średnia arytmetyczna j-tej cechy dla całej macierzy j numer cechy, j=1,...,m Ilorazy większe od jedności świadczą o dominacji określonej cechy, zaś mniejsze od jedności o jej niedoborze.
Klasa przestrzenna Nr powiatów Cechy małżeństwa urodzenia zgony Powiaty Cechy małżeństwa urodzenia zgony na 1000 mieszkańców I 5 kłobucki 6,57 10,06 10,79 II 3 częstochowski 5,35 9,65 11,92 III 7 pszczyński 5,59 10,92 7,15 IV 12 żywiecki 5,86 11,43 10,41 V 11 tyski 4,91 8,83 7,79 8 raciborski 4,55 8,42 8,28 10 tarnogórski 4,47 7,82 8,47 8,36 8,18 VI 1 bielski 5,85 9,98 9,26 2 cieszyński 5,49 10,60 9,69 4 gliwicki 5,33 8,52 8,88 6 mikołowski 5,18 9,13 9,83 9 rybnicki 5,39 9,6 9,49 5,45 9,57 9,43 5,38 9,58 9,33 1,22 1,05 1,16 0,99 1,01 1,28 1,04 1,14 0,77 1,09 1,19 1,12 0,86 0,87 0,88 1,00
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 Czerwionka-Leszczyny 1,38 3,09 0,62 0,69 0,86 0,68 1,29 0,49 0,47 1,05 0,52 0,50 1,09 0,54 1,60 Gaszowice 2,74 1,46 1,22 1,65 1,55 1,32 1,85 1,17 1,78 1,33 1,86 1,56 2,00 Jejkowice 2,57 2,99 2,53 2,41 2,21 2,86 3,26 2,73 2,77 2,50 3,20 3,39 3,27 Lyski 0,89 0,58 0,98 0,79 0,76 0,78 0,35 1,59 1,16 2,10 Świerklany 1,06 0,91 1,18 0,87 1,10 0,44 0,80 0,72 1,28 Pszów 0,28 0,90 0,88 0,93 0,70 0,83 0,57 1,80 Radlin 0,96 0,66 0,94 0,67 0,53 1,00 0,97 1,51 Rydułtowy 1,52 1,50 1,25 1,13 1,21 Wodzisław Śląski 0,95 0,65 0,85 0,84 1,12 Godów 1,49 Gorzyce 1,82 1,30 Lubomia 1,72 Marklowice 0,60 1,15 1,54 Mszana 1,53 2,04 Jastrzębie-Zdrój Rybnik 1,37 Żory 1,597 1,995 3,268 2,097 1,283 1,798 1,514 1,206 1,119 2,001 2,208 1,719 1,539 2,041 0,688 1,371
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 Czerwionka-Leszczyny 1,09 0,54 1,60 Gaszowice 2,74 1,46 1,32 1,56 Jejkowice 2,57 2,21 3,39 Lyski 1,29 1,16 Świerklany 0,44 0,80 0,86 0,72 1,28 Pszów 0,90 0,93 0,70 Radlin 0,96 0,66 0,67 0,97 Rydułtowy 1,05 1,51 Wodzisław Śląski 0,95 1,52 0,85 Godów 0,65 Gorzyce 1,17 Lubomia Marklowice 0,60 Mszana Jastrzębie-Zdrój 1,49 1,53 0,69 Rybnik 1,37 Żory 0,7 0,6
Klas wyróżnione na podstawie klasyfikacji przestrzennej właściwej (regionalizacja) Klasy typologii przestrzennej Źródło: opracowanie własne
Położenie w przestrzenni badanych gmin
- współczynnik przyrostu naturalnego, - współczynnik salda migracji, Zestaw wyjściowych wskaźników obejmował następujące cechy (dane z 2000 roku): - gęstość zaludnienia, - współczynnik przyrostu naturalnego, - współczynnik salda migracji, - odsetek pracujących w przemyśle, - długość wodociągów na 1 km2, - długość kanalizacji na 1 km2, - długość gazociągów na 1 km2, - zasoby mieszkaniowe w m2 na 1 mieszkańca, - przychodnie na 1 tys. mieszkańców, - apteki na 1 tys. mieszkańców, - odsetek lasów w powierzchni ogółem, - podmioty gospodarcze na 1000 mieszkańców, - księgozbiór na 1000 mieszkańców, - dochody własne gmin w zł na 1 osobę, - wydatki majątkowe gmin na 1 mieszkańca,
Źródło: opracowanie własne Klasy przestrzenne wyróżnione na podstawie właściwej klasyfikacji przestrzennej – (regionalizacja) Klasy typologiczne Źródło: opracowanie własne
Wielkości ilorazów z modelu średnich arytmetycznych dla klas wyróżnionych według właściwej klasyfikacji przestrzennej Klasa Gminy* Cechy 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 5, 12, 14, 15, 16, 17, 19, 20, 21, 28 1,21 0,57 0,92 1,13 1,60 1,31 1,50 1,06 1,32 0,99 0,53 1,04 1,05 1,08 1,20 1, 4, 24, 25, 26, 27, 29 1,57 0,83 0,95 1,27 1,38 1,79 1,25 0,93 1,53 0,82 1,11 1,07 1,34 1,24 2, 10 0,67 1,28 1,88 0,56 1,70 1,02 1,35 0,25 0,88 0,94 0,74 30, 31, 32 1,16 1,73 0,86 0,91 0,84 1,12 0,47 0,96 1,14 33, 34, 35, 36, 37, 39, 41, 42, 44 0,58 1,81 0,70 0,35 0,52 0,32 0,73 0,68 0,60 18, 38, 40,43 1,54 0,85 0,38 0,11 0,33 0,00 0,77 1,64 0,72 0,97 6, 9, 13, 22 0,36 1,58 0,69 0,24 0,64 1,03 1,36 1,52 1,30 0,79 3, 7, 8, 11 0,37 1,47 1,22 1,48 1,01 1,83 0,81 0,89 Wartość najwyższa Wartość najniższa Źródło: opracowanie własne * - numeracja gmin zgodna z ryc. 1 gdzie cechy: 1 - gęstość zaludnienia, 2 - współczynnik przyrostu naturalnego, 3 - współczynnik salda migracji, 4 - odsetek pracujących w przemyśle, 5 - długość wodociągów na 1 km2, 6 - długość kanalizacji na 1 km2, 7 - długość gazociągów na 1 km2, 8 - zasoby mieszkaniowe w m2 na 1 mieszkańca, 9 - przychodnie na 1 tys. mieszkańców, 10 - apteki na 1 tys. mieszkańców, 11 - odsetek lasów w powierzchni ogółem, 12 - podmioty gospodarcze na 1000 mieszkańców, 13 - księgozbiór na 1000 mieszkańców, 14 - dochody własne gmin w zł na 1 osobę, 15 - wydatki majątkowe gmin na 1 mieszkańca
Badanie struktury w geografii STRUKTURA rozmieszczenie elementów składowych oraz zespół relacji między nimi, charakterystyczny dla danego układu jako całości; w węższym znaczeniu — sposób wzajemnego przyporządkowania elementów składowych i połączenia ich w pewną całość lub też system zależności między elementami danego układu oraz poszczególnymi elementami a całością układu;
Po co badamy strukturę? dla określenia proporcji pomiędzy elementami struktury dla wyznaczenia elementów dominujących dla porównania struktur w różnych obiektach przestrzennych
Prezentacja pojedynczej struktury Źródło: opracowanie własne
Prezentacja wielu struktur równocześnie
Nieprawidłowe sposoby prezentacji struktury Źródło: opracowanie własne
Wskaźnik specjalizacji lokalnej P.S. Florence'a umożliwia wskazanie najważniejszych (dominujących) elementów badanej struktury gdzie: ui - udział procentowy danej cechy w strukturze i-tej jednostki przestrzennej bądź w obiekcie Ui - udział procentowy danej cechy w strukturze jednostki hierarchicznie wyższej Wady wskaźnika specjalizacji Brak wyraźnej jednej cechy dominującej Konieczność odniesienia struktury do struktury hierarchicznie wyższej Struktura użytkowania ziemi w Sosnowcu w 2000 r. Sosnowiec woj. śląskie ui/Ui % grunty orne 16,2 37,2 0,436062 sady 2,7 0,9 3,084362 łąki 5,0 8,7 0,574762 pastwiska 2,3 3,7 0,627818 lasy 18,7 32,0 0,584138 nieużytki 55,1 17,6 3,131002 Źródło: opracowanie własne
Względny wskaźnik podobieństwa struktur Pozwala na porównanie wewnętrznej budowy danej zbiorowości Z=0,1 1 oznacza ze struktury są identyczne 0 że struktury są zupełnie różne min(wi) odpowiadające sobie minimalne wartości struktury max(wi) odpowiadające sobie max. wartości struktury
Struktura pojazdów w Polsce w 2002 r.
Metoda K. Doi wyznaczania elementów dominujących Wyrażenie struktury w liczbach procentowych; Uszeregowanie elementów struktury w kolejności malejącej; Konstrukcja szeregu skumulowanego; Porównanie kolejnych wartości z szeregu skumulowanego z odpowiadającymi im rangą wartościami krytycznymi w tabeli w celu wyznaczenia elementów dominujących danej struktury. Powierzchnia zasiewów w ha Powierzchnia zasiewów w % Elementy procentowe uporządkowane Szereg skumulowany pszenica 79475 21,9 żyto 55379 15,2 37,1 jęczmień 37708 10,4 13,0 50,2 owies 14226 3,9 11,4 61,6 pszenżyto 21207 5,8 71,9 mieszanki zbożowe 28941 8,0 79,9 gryka i proso 594 0,2 85,8 kukurydza 4375 1,2 5,2 91,0 strączkowe 1506 0,4 94,9 ziemniaki 47405 3,4 98,2 przemysłowe 18954 99,4 pastewne 41339 99,9 warzywa gruntowe 12206 100,0