GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja Alfred Stach Instytut Paleogeografii i Geoekologii Wydział Nauk Geograficznych i Geologicznych UAM
Eksploracyjna analiza danych Przestrzenna jednej zmiennej: typ próbkowania istnienie danych lokalnie odstających; potencjalne przyczyny ogólny pogląd na zmienność przestrzenną, wykorzystanie prostej automatycznej procedury interpolacji istnienie efektu proporcjonalności lokalnej średniej/wariancji rozgrupowanie danych przy próbkowaniu preferencyjnym
Poligon Hørbyebreen zmienna b1_03b Lokalizacja punktów pomiarowych Powierzchnia rzeczywista
Polygony Thiessen’a Poligony Thiessen’a (Voronoi): Metoda wektorowa Założenie, że wartości cechy w nie opróbowanych lokalizacjach są równe wartościom dla najbliżej położonego punktu pomiarowego Metoda wektorowa Regularnie rozmieszczone punkty dają w tej metodzie regularną siatkę poligonów Punkty rozproszone (nieregularnie rozrzucone) powodują powstanie siatki nieregularnych poligonów
Konstrukcja poligonów Thiessen’a
Poligon Hørbyebreen zmienna b1_03b Powierzchnia rzeczywista Interpolacja – poligony Thiessena
Traingulacja (TIN) Inna metoda wektorowa często stosowana do tworzenia cyfrowych modeli rzeźby terenu (digital terrain models - DTM) Sąsiadujące punkty są łączone liniami (krawędziami), i w efekcie powstaje siatka nieregularnych trójkątów Obliczenia rzeczywistej odległości między punktami danych w przestrzeni trójwymiarowej przy pomocy trygonometrii Obliczenia interpolowanej wartości z położenia na płaszczyźnie przechodzącej przez trzy sąsiadujące ze sobą punkty pomiarowe
Widok izometryczny (rzut 3W) Konstrukcja TIN dana c dana b Interpolowana wartość x a b c Widok izometryczny (rzut 3W) Widok w planie
Rzeczywista powierzchnia z lokalizacjami punktów pomiarowych Przykład TIN Rzeczywista powierzchnia z lokalizacjami punktów pomiarowych Wynikowa siatka TIN
Poligon Hørbyebreen zmienna b1_03b Powierzchnia rzeczywista Interpolacja – TIN
Przestrzenna średnia ruchoma Metoda mająca zastosowanie zarówno dla danych wektorowych, jak i rastrowych: Bardzo popularna w GIS Oblicza nieznaną wartość cechy dla określonej lokalizacji na podstawie zakresu wartości dla najbliżej lezących punktów pomiarowych Kryteria „sąsiedztwa” do obliczeń są określane za pomocą reguły wprowadzanej przez operatora: Wielkość, kształt sąsiedztwa i/lub charakter danych
Przestrzenna średnia ruchoma (PŚR) – przykłady definicji sąsiedztwa
Przykład PŚR (sąsiedztwo koliste) Rzeczywista powierzchnia z punktami danych Powierzchnia modelowana dla sąsiedztwa o promieniu 11 Powierzchnia modelowana dla sąsiedztwa o promieniu 21 Powierzchnia modelowana dla sąsiedztwa o promieniu 41
Poligon Hørbyebreen zmienna b1_03b Powierzchnia rzeczywista Interpolacja – średnia ruchoma
Interpolacja metodą średniej ważonej odległością (IDW – inverse distance weighted) W metodzie IDW rola otaczających punkt estymowany danych jest w liczonej średniej zróżnicowana w zależności od odległości Zj- wartość cechy Z estymowanej w punkcie j Zi – wartość cechy Z zmierzona w punkcie i (jednym z n punktów danych w otoczeniu) hij – efektywna odległość między punktami i i j - wykładnik potęgowy – waga odległości
Poligon Hørbyebreen zmienna b1_03b Powierzchnia rzeczywista Interpolacja – IDW ( = 2)
Powierzchnie trendu Wykorzystanie regresji wielomianowej aby dopasować metodą najmniejszych kwadratów powierzchnię do punktów danych Zazwyczaj operator może decydować o stopniu wielomianu stosowanego w dopasowaniu powierzchni Wraz ze wzrostem stopnia wielomianu dopasowywana powierzchnia staje się coraz bardziej skomplikowana Nie zawsze wielomian wyższego stopnia generuje powierzchnię bardziej dokładną – jest to uzależnione od charakteru danych Im niższy błąd RMS tym lepiej interpolowana powierzchnia odwzorowuje punkty danych Najczęściej stosuje się wielomiany od 1 do 3 rzędu
Typowe funkcje równań trendu Planarna: z(x,y) = A + Bx + Cy Bi-liniowa: z(x,y) = A + Bx + Cy + Dxy Kwadratowa: z(x,y) = A + Bx + Cy + Dx2 + Exy + Fy2 Sześcienna: z(x,y) = A + Bx + Cy + Dx2 + Exy + Fy2 + Gx3 + Hx2y + Ixy2 + Jy3
Dopasowanie powierzchni trendu wielomianem pierwszego stopnia Punkty interpolowane Punkty danych
Przykłady powierzchni trendu Rzeczywista powierzchnia z lokalizacją pomiarów Trend planarny Trend kwadratowy Trend sześcienny Jakość dopasowania (R2) = 92,72 % Jakość dopasowania (R2) = 45,42 % Jakość dopasowania (R2) = 82,11 %
Poligon Hørbyebreen zmienna b1_03b Powierzchnia rzeczywista Interpolacja – wielomian (1 st.)
Poligon Hørbyebreen zmienna b1_03b Powierzchnia rzeczywista Interpolacja – wielomian (2 st.)
Poligon Hørbyebreen zmienna b1_03b Powierzchnia rzeczywista Interpolacja – wielomian (3 st.)
Eksploracyjna analiza danych Przestrzenna jednej zmiennej: typ próbkowania istnienie danych lokalnie odstających; potencjalne przyczyny ogólny pogląd na zmienność przestrzenną, wykorzystanie prostej automatycznej procedury interpolacji istnienie efektu proporcjonalności lokalnej średniej/wariancji rozgrupowanie danych przy próbkowaniu preferencyjnym
Efekt proporcjonalności średniej lokalnej do wariancji lokalnej
Zmienna b1_03b: populacja i próbkowanie losowe
Zmienne b1_03b i g-swir03b - populacja
Semiwariogram reszt – statystyki zmiennej b1_03b w grupach swir_03b
Zmienne b1_03b i g-swir03b - populacja I etap próbkowania preferencyjnego: 200 losowych próbek wszystkich zmiennych II etap próbkowania preferencyjnego: usunięcie z 200 próbek losowo 100 próbek zmiennej b1_03b III etap próbkowania preferencyjnego: dodanie 150 próbek losowo wybranych, lecz jedynie w obrębie grupy 2 g-swir03b
Statystyki zmiennej b1_03b: populacja oraz próbkowania – losowe i preferencyjne
Efekt proporcjonalności: relacja między lokalną średnią, a lokalną wariancją Próbka losowa, zmienna b3n_03b Próbka losowa, zmienna b1_03b
Efekt proporcjonalności: relacja między lokalną średnią, a lokalną wariancją Próbka preferencyjna, zmienna b3n_03b Próbka preferencyjna, zmienna b1_03b
Eksploracyjna analiza danych Przestrzenna jednej zmiennej: typ próbkowania istnienie danych lokalnie odstających; potencjalne przyczyny ogólny pogląd na zmienność przestrzenną, wykorzystanie prostej automatycznej procedury interpolacji istnienie efektu proporcjonalności lokalnej średniej/wariancji rozgrupowanie danych przy próbkowaniu preferencyjnym
Analizowane przedziały widma (kanały) (światło zielone) Kanał 2: 0,63 – 0,69 µm (światło czerwone) Kanał 3: 0,78 – 0,86 µm (bliska podczerwień)
Próbkowanie: etap I - systematyczne
Próbkowanie: etap II - preferencyjne
Próbkowanie, a statystyki opisowe – kanał 1
Wyjście z problemu – statystyki ważone Średnia arytmetyczna Średnia ważona
Rozgrupowanie poligonalne (polygon declustering)
Rozgrupowanie komórkowe (cell declustering) Średnia arytmetyczna » 276,58 n=2 n=8 Średnia ważona = 1011,55/4 » 252,94
Rozgrupowanie komórkowe (cell declustering)