GEOSTATYSTYKA I ANALIZA PRZESTRZENNA Wykład dla III roku Geografii specjalność - geoinformacja Alfred Stach Instytut Geoekologii i Geoinformacji Wydział

Slides:



Advertisements
Podobne prezentacje
BADANIE KORELACJI ZMIENNYCH
Advertisements

Estymacja. Przedziały ufności.
Analiza współzależności zjawisk
Analiza wariancji jednoczynnikowa
Zmienne losowe i ich rozkłady
BUDOWA MODELU EKONOMETRYCZNEGO
Jak mierzyć asymetrię zjawiska?
Graficzna prezentacja danych Wykład 2 dr Małgorzata Radziukiewicz
Miary jednej cechy Miary poziomu Miary dyspersji Miary asymetrii (skośności)
Analiza współzależności
ANALIZA STRUKTURY SZEREGU NA PODSTAWIE MIAR STATYSTYCZNYCH
Analiza współzależności
Statystyczne parametry akcji
Statystyczne parametry akcji
KINEMATYKA Kinematyka zajmuje się związkami między położeniem, prędkością i przyspieszeniem badanej cząstki – nie obchodzi nas, skąd bierze się przyspieszenie.
Statystyka w doświadczalnictwie
Kinematyka.
Alfred Stach Instytut Paleogeografii i Geoekologii
Alfred Stach Instytut Paleogeografii i Geoekologii
Alfred Stach Instytut Paleogeografii i Geoekologii
Alfred Stach Instytut Paleogeografii i Geoekologii
GEOSTATYSTYKA Wykłady dla III roku Geografii specjalność – geoinformacja Estymacja na podstawie danych jednej zmiennej I Alfred Stach Instytut Paleogeografii.
Alfred Stach Instytut Paleogeografii i Geoekologii
GEOSTATYSTYKA Wykłady dla III roku Geografii specjalność – geoinformacja Estymacja na podstawie danych jednej zmiennej II Alfred Stach Instytut Paleogeografii.
Alfred Stach Instytut Geoekologii i Geoinformacji
Alfred Stach Instytut Paleogeografii i Geoekologii
GEOSTATYSTYKA I ANALIZA PRZESTRZENNA Wykład dla III roku Geografii specjalność - geoinformacja Alfred Stach Instytut Geoekologii i Geoinformacji Wydział
Alfred Stach Instytut Paleogeografii i Geoekologii
ANALIZA KORELACJI LINIOWEJ PEARSONA / REGRESJA LINIOWA
Analiza współzależności dwóch zjawisk
Wykład 4. Rozkłady teoretyczne
Metody Symulacyjne w Telekomunikacji (MEST) Wykład 6/7: Analiza statystyczna wyników symulacyjnych  Dr inż. Halina Tarasiuk
Średnie i miary zmienności
Korelacja, autokorelacja, kowariancja, trendy
Fraktale i chaos w naukach o Ziemi
Analiza współzależności cech statystycznych
dr hab. Ryszard Walkowiak prof. nadzw.
Wykład III Sygnały elektryczne i ich klasyfikacja
Rozkłady wywodzące się z rozkładu normalnego standardowego
Analiza wariancji jednoczynnikowa.
KARTY KONTROLNE PRZY OCENIE LICZBOWEJ
MECHANIKA 2 Wykład Nr 11 Praca, moc, energia.
Elementy Rachunku Prawdopodobieństwa i Statystyki
Statystyka ©M.
Podstawy statystyki, cz. II
Regresja wieloraka.
FUNKCJE Pojęcie funkcji
Przedmiot: Ekonometria Temat: Szeregi czasowe. Dekompozycja szeregów
STATYSTYKA Pochodzenie nazwy:
Ruch jednostajny prostoliniowy i jednostajnie zmienny Monika Jazurek
Statystyka medyczna Piotr Kozłowski
Ruch jednowymiarowy Ruch - zmiana położenia jednych ciał względem innych, które nazywamy układem odniesienia. Uwaga: to samo ciało może poruszać się względem.
Ruch – jedno w najczęściej obserwowanych zjawisk fizycznych
Podstawowe pojęcia i terminy stosowane w statystyce
Statystyczna analiza danych w praktyce
Jak mierzyć asymetrię zjawiska? Wykład 5. Miary jednej cechy  Miary poziomu  Miary dyspersji (zmienności, zróżnicowania, rozproszenia)  Miary asymetrii.
Statystyczna analiza danych
Statystyczna analiza danych
Statystyczna analiza danych
Korelacje dwóch zmiennych. Korelacje Kowariancja.
Niech f(x,y,z) będzie ciągłą, różniczkowalną funkcją współrzędnych. Wektor zdefiniowany jako nazywamy gradientem funkcji f. Wektor charakteryzuje zmienność.
Treść dzisiejszego wykładu l Szeregi stacjonarne, l Zintegrowanie szeregu, l Kointegracja szeregów.
STATYSTYKA – kurs podstawowy wykład 8 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Parametry rozkładów Metodologia badań w naukach behawioralnych II.
Regresja wieloraka – bada wpływ wielu zmiennych objaśniających (niezależnych) na jedną zmienną objaśnianą (zależą)
Jednorównaniowy model regresji liniowej
Analiza współzależności zjawisk
MIARY STATYSTYCZNE Warunki egzaminu.
Korelacja i regresja liniowa
Alfred Stach Instytut Paleogeografii i Geoekologii UAM
Zapis prezentacji:

GEOSTATYSTYKA I ANALIZA PRZESTRZENNA Wykład dla III roku Geografii specjalność - geoinformacja Alfred Stach Instytut Geoekologii i Geoinformacji Wydział Nauk Geograficznych i Geologicznych UAM

Semiwariogram kodów – zmienna ciągła Funkcja kowariancji i semiwariogram to charakterystyki ciągłości przestrzennej (lub zmienności) dla całego zakresu wartości cechy. Struktura ciągłości przestrzennej (lub zmienności) może jednak różnić się, zależnie czy pod uwagę bierzemy rozkład punktów danych charakteryzujących się niskimi, średnimi czy wysokimi wartościami cechy. W wielu sytuacjach spotykanych w środowisku przyrodniczym lub społeczno-gospodarczym, losowo występujące wysokie wartości cechy, są otoczone większymi obszarami o średnich lub niskich wartościach, które zmieniają się w sposób ciągły. To czy wartości ekstremalne są w przestrzeni rozproszone, czy też skupione, ma duże znaczenie dla wyjaśniania zjawiska, oraz jakości estymacji.

90 percentyl = percentyl = percentyl = percentyl = 323 Analiza danych kodowanych – zmienna ciągła 10 percentyl = 314

Analiza danych kodowanych – zmienna ciągła Eksperymentalna autokowariancja kodów F -h (z k ) i F +h (z k ) oznaczają proporcje (ułamek) wartości ogona i głowy nie przekraczających poziomu wartości progowej z k. Kowariancja kodów określa jak często, dwie wartości tej samej cechy oddalone od siebie o wektor h, są jednocześnie nie większe od wartości progowej zk.

Analiza danych kodowanych – zmienna ciągła Eksperymentalna autokorelacja kodów wariancja wartości kodów ogona wariancja wartości kodów głowy

Analiza danych kodowanych – zmienna ciągła Eksperymentalny semiwariogram kodów Wariogram kodów ( 2 I (h; z k ) ) określa jak często dwie wartości cechy oddalone o wektor h znajdują się po przeciwnych stronach wartości progowej z k. Innymi słowy 2 I(h; zk) daje wielkość frekwencji przejść między dwoma klasami wartości cechy jako funkcję odległości (h).

Analiza danych kodowanych – interpretacja graficzna Kowariancja i semiwariogram danych kodowanych można interpretować jako proporcję punktów (par danych), które występują w określonych częściach wykresu rozrzutu z przesunięciem: Kowariancja – obszar zaszrafowany poziomo, Semiwariogram – obszar zaszrafowany pionowo

Powierzchnie semiwariogramu danych kodowanych – zmienna b1_03b 10 percentyl 50 percentyl = mediana Dane niekodowane 90 percentyl

Semiwariogram kodów – zmienna ciągła

Analiza danych kodowanych – zmienna kategoryzowana Jeśli średnia wartość cechy z na obszarze należącym do określonej kategorii s k bardzo się różni od ogólnej średniej, to geometryczny układ tej kategorii wpływa na kształt i anizotropię semiwariogramu z. Strukturę ciągłości (zmienności) kategorii s k można scharakteryzować za pomocą semiwariogramu określonego na zakodowanych danych obecności/braku tej kategorii według wzoru:

Analiza danych kodowanych – zmienna kategoryzowana Eksperymentalny semiwariogram kodów dla kategorii s k jest obliczany według wzoru: Wariogram kodów ( 2 I (h; s k ) ) określa jak często dwie lokalizacje oddalone o wektor h należą do różnych kategorii s k ` s k. Im mniejsze 2 I(h; s k ), tym ciągłość przestrzenna kategorii sk jest lepsza. Zasięgi i kształty semiwariogramów kierunkowych są odbiciem struktury geometrycznej kategorii s k.

Zmienne b1_03b i g-swir03b

Powierzchnie wariogramu dla grup zmiennej g-swir03b Grupa 1 Grupa 2 Grupa 3 Grupa 4

Semiwariogramy bezkierunkowe grup zmiennej g-swir03b

Analiza struktury przestrzennej dwóch zmiennych z i (u ) z i (u +h) ogon tail głowa head h Wartość cechy w punktach u i u + h dotyczy jednej zmiennej z i. z i (u ) z j (u +h) ogon tail głowa head h Wartość cechy w punktach u i u + h dotyczy dwóch zmiennych z i i z j.

Wykresy rozrzutu dwóch zmiennych z przesunięciem ( cross h-scattergram ) Dane z punktów odległych od siebie o 0-22,5m Średnia odległość 17,645m Ilość par punktów: 74 kowariancja: 62,033 korelacja: 0,5063 Dane cech b1_03b i b3n_03b ze zbioru Horbye3.dat

Wykresy rozrzutu dwóch zmiennych z przesunięciem ( cross h-scattergram ) Dane z punktów odległych od siebie o 22,5-67,5m Średnia odległość 51,381m Ilość par punktów: 640 kowariancja: 63,051 korelacja: 0,4165 Dane cech b1_03b i b3n_03b ze zbioru Horbye3.dat

Wykresy rozrzutu dwóch zmiennych z przesunięciem ( cross h-scattergram ) Dane z punktów odległych od siebie o 67,5-112,5m Średnia odległość 92,41m Ilość par punktów: 1048 kowariancja: 49,056 korelacja: 0,29181 Dane cech b1_03b i b3n_03b ze zbioru Horbye3.dat

Wykresy rozrzutu dwóch zmiennych z przesunięciem ( cross h-scattergram ) Dane z punktów odległych od siebie o 112,5-157,5m Średnia odległość 136,27m Ilość par punktów: 1472 kowariancja: 36,042 korelacja: 0,2139 Dane cech b1_03b i b3n_03b ze zbioru Horbye3.dat

Wykresy rozrzutu dwóch zmiennych z przesunięciem ( cross h-scattergram ) Dane z punktów odległych od siebie o 157, m Średnia odległość 181,33m Ilość par punktów: 1930 kowariancja: 21,321 korelacja: 0,1293 Dane cech b1_03b i b3n_03b ze zbioru Horbye3.dat

Wykresy rozrzutu dwóch zmiennych z przesunięciem ( cross h-scattergram ) h (m)– ij 0 – 0,807 17,6– 0,506 51,4– 0,416 92,4– 0, ,3– 0, ,3– 0,129

Funkcja kros kowariancji Kowariancja między wartościami cech z i i z j odległymi o wektor h jest obliczona według wzoru: gdzie: N(h) to ilość par punktów odległych o wektor h, a m i -h i m j +h to średnie wartości z i ogona, i wartości z j głowy.

Powierzchnia kros kowariancji zmiennych b1_03b i b3n_03b

Funkcja kros kowariancji zmiennych b1_03b i b3n_03b Uporządkowany zbiór kroskowariancji C ij (h 1 ), C ij (h 2 ), … jest zwany eksperymentalną funkcją kros kowariancji

Kros korelogram Wariancja wartości ogona (z i ) Wariancja wartości głowy (z j )

Powierzchnia kros korelogramu zmiennych b1_03b i b3n_03b

Kros korelogramy zmiennych b1_03b i b3n_03b ij =0,910 h=20,7m N=7

Efekt przesunięcia ( lag effect ) Kros kowariancja obliczana w przeciwnych kierunkach jest zazwyczaj odmienna: C ij (h) C ij (-h) Znacząca różnica pomiędzy C ij (h) i C ij (-h) może oznaczać, że jedna wartość jednej cechy zmienia się w przestrzeni z pewnym opóźnieniem w stosunku do zmian drugiej cechy. Zjawisko to nazywane jest efektem przesunięcia. Jeśli brak jest klarownej fizycznej interpretacji tego zjawiska, lepiej je zignorować, gdyż może być skutkiem przypadkowej fluktuacji związanej z małą ilością par danych z których wyliczono kowariancję.

Efekt przesunięcia - przykład Badamy skażenie gleb wokół zakładu przemysłowego. Jest ono związane z emisjami gazów i pyłów z komina zakładu. Składnik A zanieczyszczeń związany jest z emisjami pyłowymi, a składnik B – gazowymi. Składnik A będzie zatem wypadał z chmury zanieczyszczeń szybciej niż składnik B. Zmiany przestrzenne obu składników będą miały podobną strukturę przestrzenną (bo są efektem tego samego zjawiska), ale z przesunięciem.

Czy nasze zmienne b1_03b i b3n_03b wykazują efekt przesunięcia?

Rozrzut gradientów zmian par punktów dwóch zmiennych Kros kowariancja (kros korelacja) określa jak wygląda relacja wartości cechy z i w jednej lokalizacji w stosunku do wartości innej cechy z j w lokalizacji odległej o wektor h. Zamiast porównywać parę danych (z i (u ), z j (u +h)) możemy rozważyć porównanie pary przyrostów na dystansie h ([ z i (u ), z i (u +h)], [z j (u ), z j (u +h)]), które pokazują wspólną zmianę gradientów wartości z i - i z j - przy zmianie położenia o wektor h. Jeśli obie cechy są skorelowane dodatnio, to przyrost (spadek) wartości z i - od punktu u do punktu u +h będzie związany ze wzrostem (spadkiem) wartości z j -. A jeśli obie cechy są skorelowane ujemnie, to ….

Różnice wartości par punktów dwóch cech ( h-increments ) z i (u ) z i (u +h) ogon tail głowa head h z j (u ) z j (u +h) ogon tail głowa head h Analiza wspólnej zmienności cech z i i z j przy przemieszczeniu o dystans h

Wykresy rozrzutu z przesunięciem dla różnic ( h-increments scatergrams ) Cechy b1_03b i b3n_3b. Kierunek = 130°; tolerancja kierunku = 22,5°; szerokość pasa tolerancji = 100 m; odstęp = 45 m; tolerancja odstępu = 22,5 m h = 50,8 mh = 21,8 m

Wykresy rozrzutu z przesunięciem dla różnic ( h-increments scatergrams ) Cechy b1_03b i b3n_3b. Kierunek = 130°; tolerancja kierunku = 22,5°; szerokość pasa tolerancji = 100 m; odstęp = 45 m; tolerancja odstępu = 22,5 m h = 134,4 mh = 90,7 m

Wykresy rozrzutu z przesunięciem dla różnic ( h-increments scatergrams ) Cechy b1_03b i b3n_3b. Kierunek = 130°; tolerancja kierunku = 22,5°; szerokość pasa tolerancji = 100 m; odstęp = 45 m; tolerancja odstępu = 22,5 m h = 226,0 mh = 181,0 m

Kros semiwariogram Kros semiwariogram jest definiowany jako połowa nie scentralizowanej kowariancji pomiędzy różnicami na dystansie h. W przeciwieństwie do kros kowariancji i kros korelogramu kros semiwariogram jest symetryczny w stosunku do cech i wektora przesunięcia to jest zamiana ij na ji, oraz (h) na (-h) nie wpływa na jego wartość. Kros semiwariogram nie może zatem pomagać w wykrywaniu efektu przesunięcia. Poza tym kros semiwariogram może być obliczany jedynie dla takich lokalizacji, w których zmierzono obie cechy.

Powierzchnia kros semiwariancji zmiennych b1_03b i b3n_03b

Kros semiwariogram zmiennych b1_03b i b3n_03b

Funkcja kodyspersji Uporządkowany zbiór współczynników kodyspersji ij (h 1 ), ij (h 2 ),... jest zwany eksperymentalną funkcją kodyspersji. Współczynnik kodyspersji można interpretować jako współczynnik korelacji pomiędzy zmianami cech na dystansie h, kiedy wykres rozrzutu rysowany jest w postaci symetrycznej, tj. każda para lokalizacji (u, u +h) pojawia się dwukrotnie, raz jako punkt o współrzędnych ([ z i (u ), z i (u +h)], [z j (u ), z j (u +h)]), a drugi raz jako punkt ([ z i (u +h), z i (u )], [z j (u +h), z j (u )]).

Funkcja kodyspersji cech b1_03b i b3n_03b

Funkcja kros kowariancji kodów Tak samo jak w przypadku analizy struktury przestrzennej jednej zmiennej, charakter i siła relacji między dwoma zmiennymi może zależeć o skali natężenia porównywanych cech: niskiej, średniej, czy wysokiej. Często wysokie wartości skorelowanych przestrzennie cech będące efektem tego samego zjawiska mogą wykazywać większe podobieństwo niż średnie i niskie, mające odmienną genezę. Przykładem może być zawartość toksycznych metali ciężkich w glebach. Ich niskie lub średnie stężenia mają najczęściej genezę naturalną, związaną z procesami wietrzeniowymi skał macierzystych. Wysokie koncentracje natomiast są zazwyczaj związane z antropogenicznymi emisjami.

Funkcja kros kowariancji kodów Gdzie: F i -h (z ik ) i F j +h (z jk' ) to proporcje wartości ogona z i i głowy z j, które nie przekraczają poziomów progowych z ik i z jk'. Kros kowariancja jest miarą wspólnej dwu-punktowej skumulowaną frekwencji F ij (h;z ik, z jk' ), określającej jak często wartości z i i z j oddalone o wektor h są jednocześnie nie większe od określonych wartości progowych (z ik, z jk' ).

Kros korelogram kodów Standaryzowaną postacią kros kowariancji kodów jest kros korelogram kodów: Gdzie wariancja wartości kodów ogona i(u ;z ik ) jest równa:

Kros semiwariogram kodów Niezerowy udział w kros semiwariogramie kodów mają jedynie te pary danych, w których wartości obu cech z i, i z j są po przeciwnych stronach ich wartości progowych (z ik, z jk' ). Udział pary danych w może być pozytywny (+1) lub negatywny (-1), w zależności od tego czy wartości z i i z j wspólnie rosną (maleją) przy przejściu od u do u + h, lub też zmieniają się w sposób przeciwny.

Strukturę przestrzenną danych kodowanych dwóch cech badać można także w innych przypadkach: i(u ;z k ) i i(u ;z k' ) mogą dotyczyć tej samej ciągłej (ilościowej) cechy z, ale dla dwóch różnych wartości progowych z k i z k' i(u ;s k ) i i(u ;s k' ) odnoszących się do dwóch różnych kategorii s k i s k' i(u ;z k ) i i(u ;s k ) odnoszących się cechy ilościowej i jakościowej (kategorii)

Standaryzowane kros semiwariogramy bezkierunkowe kodów b1_03b i b3n_03b