GEOSTATYSTYKA Wykłady dla III roku Geografii specjalność – geoinformacja Estymacja na podstawie danych jednej zmiennej I Alfred Stach Instytut Paleogeografii i Geoekologii Wydział Nauk Geograficznych i Geologicznych UAM
Podstawy krigingu Problem: Estymacja wartości ciągłej cechy z w dowolnej lokalizacji u z wykorzystaniem jedynie istniejących n danych z na obszarze badań A : {z(ua), a=1, ...., n} Rozwiązanie: Kriging to nazwa własna grupy algorytmów opartych na uogólnionej regresji metodą najmniejszych kwadratów, przyjęta przez geostatystyków dla uhonorowania pionierskich prac południowoafrykańskiego geologa Danie Krige (1951)
Podstawy krigingu Wszystkie estymatory krigingowe są wariantami podstawowej formuły regresji liniowej zgodnie z poniższym wzorem: gdzie: (u) jest wagą przypisaną do danej z(u), która jest interpretowana jako realizacja Zmiennej Losowej Z(u). Wartości m(u) i m(u) to oczekiwane wartości ZL Z(u) i Z(u).
Podstawy krigingu Ilość danych używanych do estymacji oraz ich wagi mogą się zmieniać przy kolejnych lokalizacjach. W praktyce używane jest jedynie n(u) danych leżących najbliżej lokalizacji punktu estymacji, to jest dane znajdujące się w określonym sąsiedztwie/oknie W(u) mający swoje centrum w u. Interpretacja nieznanej wartości z(u) i wartosci danych z(u) jako realizacji ZL Z(u) i Z(u) pozwala na zdefiniowanie błędu estymacji jako zmiennej losowej Z*(u) – Z(u). Wszystkie zalety krigingu wynikają z tego samego założenia minimalizacji wariancji (błędu) estymacji przy respektowaniu warunku nieobciążenia estymatora, czyli:
Podstawy krigingu jest minimalizowany przy uwzględnieniu ograniczenia, że: Estymacja za pomocą krigingu może się różnić ze względu na przyjęty model Funkcji Losowej Z(u). Przyjmuje się zazwyczaj, że FL Z(u) można rozłożyć na dwa komponenty: trend m(u) i resztę R(u):
Podstawy krigingu Składowa resztowa jest modelowana jako stacjonarna FL o średniej równej zero i kowariancji CR(h): Oczekiwana wartość ZL Z w lokalizacji u jest zatem równa wartości składowej trendu w tej lokalizacji:
Podstawy krigingu W zależności od przyjętego modelu trendu m(u) możemy wyróżnić trzy warianty krigingu: 1. Prosty kriging (Simple Kriging) zakłada że średnia m(u) jest znana i stała na całym analizowanym obszarze A : 2. Zwykły kriging (Ordinary Kriging) uwzględnia lokalne fluktuacje średniej, ograniczając domenę stacjonarności średniej do lokalnego sąsiedztwa (ruchomego okna) W(u): w przeciwieństwie do SK w tym przypadku średnia jest traktowana jako nieznana.
Czy lokalna średnia jest w przypadku danych satelitarnych ze Spitsbergenu stała? Próbka losowa, zmienna b3n_03b Próbka losowa, zmienna b1_03b
Podstawy krigingu 3. Kriging z trendem (Kriging with a Trend model) zakłada że nieznana lokalna średnia m(u´) zmienia się stopniowo wewnątrz każdego lokalnego sąsiedztwa (okna) W(u), a zatem również w całym obszarze A . Składowa trendu jest modelowana jako liniowa funkcja współrzędnych fk(u): Współczynniki ak(u´) są nieznane, lecz zakłada się, że są one stałe w obrębie każdego lokalnego sąsiedztwa W(u). Przyjęto, że f0(u´) = 1, tak więc przypadek gdzie K = 0 jest odpowiednikiem zwykłego krigingu (stała lecz nieznana średnia a0).
Prosty kriging (SK) Modelowanie składowej trendu (-owej) m(u) jako znanej stacjonarnej średniej m pozwala na zapisanie formuły estymatora jako liniowej kombinacji (n(u)+1) danych: n(u) ZL Z(u) i wartości średniej m: n(u) wag jest w taki sposób wyznaczane, aby zminimalizować wariancję błędów uwzględnia-jąc kryterium nieobciążenia estymatora.
Prosty kriging Estymator prostego krigingu (SK) jest z góry nieobciążony ponieważ średni błąd jest równy 0. Używając pierwszej formy zapisu estymatora SK możemy stwierdzić, że: Estymacja metodą prostego krigingu wykonywana jest za pomocą układu n(u) równań liniowych znanych pod nazwą układu zwykłych równań, które można zapisać używając kowariancji zmiennej z w postaci:
Prosty kriging – notacja macierzowa Wariancja błędu – wariancja SK: Prosty kriging – notacja macierzowa Układ równań SK można również zapisać w postaci macierzowej: Gdzie KSK jest macierzą kowariancji danych o wymiarach n(u) n(u), SK jest wektorem wag SK, a kSK jest wektorem kowariancji dane-do-nieznanej
Prosty kriging – notacja macierzowa
Prosty kriging – notacja macierzowa Wagi krigingowe wymagane do estymacji SK są obliczane przez mnożenie odwrotności macierzy kowariancji danych przez wektor kowariancji dane-do-nieznanej: Odpowiedni zapis macierzowy wariancji krigingowej SK jest następujący:
Podstawowe cechy estymatora SK Prosty kriging System równań SK ma jednoznaczne rozwiązanie i wynikowa wariancja krigingowa jest dodatnia, jeżeli macierz kowariancji KSK = [C(u - u)] jest pozytywnie określona, czyli w praktyce: żadna para danych nie ma takiej samej lokalizacji: u u dla zastosowano dopuszczalny model kowariancji C(h) Podstawowe cechy estymatora SK Jest to estymator wierny – to znaczy, że wartość estymowana w lokalizacji punktu danych jest jemu równa, Jeśli lokalizacja estymacji znajduje się poza zasięgiem autokorelacji w stosunku najbliższego punktu danych wartość estymowana jest równa stacjonarnej średniej m
Prosty kriging – przykłady Estymacja cechy w punkcie 0 za pomocą danych pomiarowych z punktów 1,2 i 3. Korzystając z relacji: C(h) = C(0) - (h)
Prosty kriging – przykłady Prosty kriging dla modelu z zerowym efektem nuggetowym i izotropowym wariogramem sferycznym o trzech różnych zasięgach. Zasięg Waga 1 2 3 1 0,781 0,012 0,065 5 0,648 -0,027 0,001 10 0,000
Prosty kriging – przykłady Prosty kriging dla modelu z izotropowym wariogramem sferycznym o zasięgu 10 jednostek odległości i trzech różnych względnych udziałach wariancji nuggetowej Nugget= Waga 1 2 3 0% 0,781 0,012 0,065 25% 0,468 0,203 0,064 75% 0,172 0,130 0,053 100% 0,000
Prosty kriging – przykłady Prosty kriging dla sferycznego modelu z 25% nuggetem i zasięgiem głównej osi wynoszącym 10 jednostek odległości w przypadku trzech różnych stosunków anizotropii Anizo- tropia= Waga 1 2 3 1:1 0,468 0,203 0,064 2:1 0,395 0,087 0,141 5:1 0,152 -0,055 0,232 20:1 0,000 0,239
Prosty przykład estymacji SK Dane jednowymiarowe: profil 7 punktów b1_03b przy Y = 240 m Izotropowy model semiwariancji obliczony dla wszystkich 256 danych
Prosty przykład estymacji SK Dane jednowymiarowe: profil dla Y = 240 m
Prosty kriging – zmienna b1_03b
Prosty kriging – zmienna b1_03b
Prosty kriging – zmienna b1_03b
Weryfikacja jakości modelu -kroswalidacja
Weryfikacja jakości modelu -kroswalidacja
Weryfikacja jakości modelu – walidacja podzbioru