Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

Alfred Stach Instytut Geoekologii i Geoinformacji

Podobne prezentacje


Prezentacja na temat: "Alfred Stach Instytut Geoekologii i Geoinformacji"— Zapis prezentacji:

1 GEOSTATYSTYKA I ANALIZA PRZESTRZENNA Wykład dla III roku Geografii specjalność - geoinformacja
Alfred Stach Instytut Geoekologii i Geoinformacji Wydział Nauk Geograficznych i Geologicznych UAM

2 Semiwariogram empiryczny a potrzeby estymacji
Semiwariogram empiryczny jest: nieciągły (dyskretny) chaotyczny

3 Wymagania algorytmów estymacji i symulacji
Wszystkie geostatystyczne algorytmy estymacji i symulacji przestrzennej wymagają podania w matematycznej (parametrycznej) formie modelu struktury przestrzennej analizowanej cechy Nie mogą to być po prostu wartości empirycznych (to jest wyliczonych z danych pomiarowych) miar struktury przestrzennej, jak kowariogram, korelogram czy semiwariogram.

4 Wymagania algorytmów estymacji i symulacji
W macierzach krigingowych dla każdego oczka siatki interpolacyjnej potrzebne są wartości kowariancji pomiędzy danymi pomiarowymi znajdującymi się w sąsiedztwie szukania (ang. data covariances) oraz kowariancji danych do lokalizacji estymowanej nieznanej (ang. data-to-unknown covariances). Oznacza to, że muszą one być możliwe do określenia dla dowolnej kombinacji odległości i kierunku. Wszystkie zaś empiryczne miary autokorelacji przestrzennej są dyskretne, czyli nieciągłe, obliczane są bowiem jako średnie przedziałowe (odstępy odległości i sektory kierunków). W estymacjach potrzebne są też często wartości kowariancji dla odległości i kierunków, dla których nie ma danych empirycznych. Nie bywa jednak stosowane, wydawałoby się najprostsze, rozwiązanie, to jest interpolacja i ekstrapolacja kowariancji empirycznych.

5 Wymagania algorytmów estymacji i symulacji
Empiryczne miary struktury przestrzennej stanowią statystyki obliczane z próby i jako takie są tylko przybliżeniem relacji przestrzennych w całej populacji. Ich wiarygodność jest uzależniona z jednej strony od wielkości i reprezentatywności próby, a z drugiej – od skali zmienności analizowanej cechy Zawsze dochodzi jednak czynnik jakim są nieuniknione błędy, zarówno pomiaru cechy, jak i określenia lokalizacji stanowiska, gdzie pomiar został dokonany. Zazwyczaj analizowane są próby stanowiące milionowe, miliardowe lub nawet mniejsze części całej populacji , a zalecenie ich losowości często nie jest w pełni spełnione. Wszystkie wymienione czynniki, a także czułość stosowanych zazwyczaj miar struktury przestrzennej na naturalnie występujące wartości anomalne powoduje, że ich wykresy często są chaotyczne i nie odzwierciedlają wiarygodnie stosunków istniejących w całej zbiorowości. Matematyczny model może zredukować znaczenie tych wad, wygładzając chaotyczne fluktuacje danych empirycznych.

6 Kryterium połowicznej pozytywnej określoności (ang
Kryterium połowicznej pozytywnej określoności (ang. positive semidefinite) Estymowane lub symulowane wartości są w geostatystyce traktowane jako zmienne losowe będące liniową kombinacją innych znanych zmiennych losowych. Wariancja zaś jakiejkolwiek liniowej kombinacji Y zmiennych losowych Z(u), u  A, jest wówczas liniową kombinacją wartości kowariancji owych zmiennych i musi nieujemna (ang. non-negative) Spełnienie tego warunku jest możliwe tylko przy zastosowaniu takich funkcji kowariancji C(h), nieparametrycznych czy też parametrycznych, które są pozytywnie połowicznie określone. dla jakiejkolwiek z wybranych n lokalizacji u  A i dla jakiejkolwiek wagi 

7 Kryterium połowicznej pozytywnej określoności (ang
Kryterium połowicznej pozytywnej określoności (ang. positive semidefinite) Stosowanie interpolowanych / ekstrapolowanych wartości empirycznych miar struktury przestrzennej nigdy nie gwarantuje, że obliczenia estymacji / symulacji dadzą jakikolwiek wynik. Gwarancję taką można mieć jedynie przy zastosowaniu modelu matematycznego o takiej postaci, który jest z góry pozytywnie połowicznie określony. Modele takie określa się jako dozwolone (ang. permissible).

8 Model nuggetowy (losowy)
Gaussowska symulacja bezwarunkowa dla zmiennej o średniej 0 i wariancji nuggetowej równej 10

9 Model nuggetowy (losowy)
Zastosowanie modelu nuggetowego oznacza w praktyce stwierdzenie braku autokorelacji zjawiska. Wariancja procesu jest stała dla każdej odległości większej od zera. Ponieważ większość parametrów środowiskowych jest w jakiejś skali przestrzennej ciągłe, konieczność użycia tego modelu oznacza zazwyczaj, że odstęp próbkowania był większy niż zasięg autokorelacji. Inną możliwość stwarza istnienie zjawiska w 100% losowego, nieciągłego, którego charakterystyki zmieniają gwałtownie przy przejściu z jednego punktu do drugiego. Obrazem symulacji bezwarunkowej przy użyciu tego modelu jest, zgodnie z terminologią stosowaną w analizie serii czasowych, „biały szum”, podobny do tego co jest obserwowane na ekranie telewizora (lampy katodowej), do którego nie dociera żaden sygnał

10 Model sferyczny o zasięgu a
Gaussowska symulacja bezwarunkowa dla zmiennej o średniej 0 i zasięgu rzeczywistym (a) równym 10 i wariancji progowej równej 10

11 Model sferyczny Model sferyczny może być stosowany w 1, 2 i 3 wymiarach, i jest jednym z najczęściej stosowanych w geostatystyce do charakterystyki struktury przestrzennej. Daje on reprezentację cech ciągłych, które mają podobną rozciągłość, a ich zmienność ma charakter przeplatających się nieregularnych płatów z wysokimi i niskimi wartościami. Średnia średnica owych płatów jest reprezentowana przez zasięg modelu. Model sferyczny ma w początkowym odcinku charakter funkcji liniowej o nachyleniu 3C/2a.

12 Model wykładniczy o zasięgu praktycznym a
Gaussowska symulacja bezwarunkowa dla zmiennej o średniej 0 i zasięgu praktycznym (a) równym 10 i wariancji progowej równej 10

13 Model wykładniczy Jest podobnie często wykorzystywany jak model sferyczny. Funkcja ta osiąga wariancję progową asymptotycznie i dlatego nie ma skończonego zasięgu. Zamiast niego podawany jest tak zwany zasięg „praktyczny” lub „efektywny”, zdefiniowany jako odległość na jakiej model osiąga 95% wartości wariancji progowej. Model wykładniczy ma również liniowy charakter w fazie początkowej, ale o większym nachyleniu niż w przypadku sferycznego: C/a. Funkcja ta odgrywa bardzo ważną rolę teoretyczną. Stanowi bowiem istotę losowości w ujęciu przestrzennym. Jest to semiwariogram procesów autoregresyjnych pierwszego rzędu i procesów Markowa. Można się spodziewać semiwariogramu wykładniczego wówczas, kiedy głównym źródłem zmienności cechy jest występowanie odmiennych typów systemów, a granice między typami występują losowo zgodnie z procesem Poissona. Przykładem może być sytuacja, kiedy zmienność przestrzenna pewnej cechy gleb, na przykład odczynu, jest uwarunkowana głównie różnicami pomiędzy typami gleb. Inaczej mówiąc, jest to semiwariogram cech ciągłych, których struktury mają losowy zasięg.

14 Model gaussowski o zasięgu praktycznym a
Gaussowska symulacja bezwarunkowa dla zmiennej o średniej 0 i zasięgu praktycznym (a) równym 10 i wariancji progowej równej 10

15 Model gaussowski … również osiąga poziom wariancji progowej asymptotycznie, dlatego tak jak w poprzednim przypadku, zasięg praktyczny definiowany jest jako odległość dla której wartość semiwariancji wyliczona z modelu osiąga 95% wariancji progowej. Model gaussowski odróżnia się od dwóch wymienionych poprzednio przede wszystkim parabolicznym kształtem w początkowym odcinku. Oznacza to, że „dotyka” on osi z zerowym nachyleniem. Stanowi to granicę zmienności losowej, przy której w rzeczywistości istnieje wartość stała i podwójnie różniczkowalna. Model ten ze względu na swój deterministyczny charakter daje w wielu przypadkach nierealistyczne wyniki estymacji i zazwyczaj nie może być stosowany samodzielnie. Jego użycie jest czasami uzasadnione przy analizie przestrzennej i prognozowaniu parametrów o bardzo regularnej i łagodnej zmienności przestrzennej, na przykład poziomu wód gruntowych w obszarach o mało zróżnicowanej rzeźbie i jednolitej budowie geologicznej.

16 Model liniowy z wariancją progową o zasięgu rzeczywistym a
Gaussowska symulacja bezwarunkowa dla zmiennej o średniej 0 i zasięgu rzeczywistym (a) równym 10 i wariancji progowej równej 10

17 Model potęgowy

18 Model potęgowy Funkcja potęgowa rośnie w nieskończoność, nie ma zatem zarówno zasięgu, ani progu. Tego typu modele nazywa się w geostatystyce nieograniczonymi (ang. unbounded). Interpretuje się jako reprezentację procesu losowego mającego charakter ruchów Browna. Przyjmując dla uproszczenia ruch cząsteczki w jednym wymiarze, jej prędkość lub moment pędu w położeniu x + h zależy od jej prędkości lub momentu pędu w bezpośrednio poprzednim bliskim położeniu x. Relację tą można zapisać równaniem: gdzie  to niezależne, losowe odchylenie gaussowskie, a  to parametr. W najprostszym przypadku  = 1, a wariogram procesu wygląda wówczas następująco:

19 Model potęgowy Jeśli wykładnik k w równaniu wynosi 1, to wówczas mamy do czynienia z modelem liniowym, gdzie gdy Nazywany jest on często modelem ścieżki losowej (ang. random walk model). Przy typowych ruchach Browna składnik  jest dla każdego kroku niezależny. Jeśli jednak  są przestrzennie skorelowane, to ślad ruchu cząsteczki jest bardziej „gładki” niż w klasycznym ruchu Browna. Wówczas to wykładnik k jest większy od 1, a krzywa wklęsła. Z drugiej strony, kiedy odchylenia  są odwrotnie (ujemnie) skorelowane, wówczas ścieżka ruchu jest bardziej chaotyczna. Wykładnik k z równania jest wtedy mniejszy od 1, a krzywa wariogramu wypukła. Kiedy  są idealnie skorelowane wówczas k = 2, a ślad ruchu cząsteczki jest płynny (gładki), co oznacza, że nie ma już charakteru losowego. W sytuacji gdy k  0 chaotyczność ruchu rośnie aż do poziomu białego szumu, którego obrazem jest model nuggetowy.

20 Porównanie kształtu najczęściej wykorzystywanych modeli

21 Symulacja warunkowa: zmienna b1_03b różne modele struktury – te same parametry (zasięg, wariancja progowa)

22 Inne, rzadziej stosowane, matematyczne modele struktury przestrzennej: cubic

23 Inne, rzadziej stosowane, matematyczne modele struktury przestrzennej: cardinal sine

24 Inne, rzadziej stosowane, matematyczne modele struktury przestrzennej: stable

25 Inne, rzadziej stosowane, matematyczne modele struktury przestrzennej: gamma

26 Liniowy model regionalizacji
W wielu sytuacjach, aby odwzorować dokładnie kształt semiwariogramu empirycznego konieczne jest połączenie dwóch, lub większej ilości modeli podstawowych g(h). Nie wszystkie kombinacje dopuszczalnych modeli dają w efekcie funkcję dopuszczalną, to znaczy z nieujemną wariancją. Najprostszym sposobem utworzenia modelu dopuszczalnego jest stworzenie najpierw funkcji losowej. Semiwariogram takiej funkcji jest z definicji dopuszczalny

27 Liniowy model regionalizacji
Praktycznie rzecz biorąc konieczne jest spełnienie dwóch warunków tak zwanego liniowego modelu regionalizacji (ang. linear regionalisation model): wszystkie użyte w modelu złożonym podstawowe funkcje gl(h) muszą być dopuszczalne, wariancja progowa bl każdego podstawowego modelu semiwariogramu musi być dodatnia, a wówczas: Model złożony (h) jest w takiej sytuacji wyrażony jako pozytywna liniowa kombinacja podstawowych modeli semiwariogramów gl(h). W literaturze przedmiotu popularna jest jego także alternatywna nazwa: „nested model” czyli model zagnieżdżony.

28 Liniowy model regionalizacji

29 Liniowy model regionalizacji – zmienna b1_03b

30 Liniowy model regionalizacji – zmienna b1_03b

31 Model zmiennej b1_03b - anizotropia
Powierzchnia modelu semiwariogramu bezkierunkowego (izotropowego) Powierzchnia semiwariogramu empirycznego

32 Model zmiennej b1_03b - anizotropia
Powierzchnia modelu semiwariogramu anizotropowego Powierzchnia semiwariogramu empirycznego

33 Model zmiennej b1_03b - anizotropia
gamma (h) = Sph(88) + 69Sph(632) dir(1) = 62°, ani(1) = 1,6; dir(2) = 306°, ani(2) = 0,49 325° 55° 10° 280°

34 Zmienna b3n_03b – anizotropia
gamma(h) = 52,1 + 67,0Sph(104) + 67,1Sph(680) dir(1) = 59°, ani(1) = 7,6 dir(2) = 263°, ani(2) = 0,44 Powierzchnia semiwariogramu empirycznego

35 Zmienne b1-b3n_03b – anizotropia
gamma(h) = 21,6 + 54,4Sph(97) + 60,0Sph(621) dir(1) = 61°, ani(1) = 16,0 dir(2) = 256°, ani(2) = 0,42 Powierzchnia semiwariogramu empirycznego

36 Spitsbergen – zmienna b1_03b
Powierzchnia rzeczywista Interpolacja – zwykły kriging (OK)

37 Spitsbergen – zmienna b1_03b
Powierzchnia rzeczywista Błędy geometryczne interpolacji OK

38 Spitsbergen – zmienna b1_03b
Interpolacja coOK z wykorzystaniem skorelowanych danych ilościowych (dodatkowe 100 punktów) Powierzchnia rzeczywista

39 Spitsbergen – zmienna b1_03b
Powierzchnia rzeczywista Błędy geometryczne interpolacji coOK

40 Podstawowe zasady przed tworzeniem liniowego modelu koregionalizacji
Semiwariogramy i kros semiwariogramy empiryczne będące podstawą szacowania LCM muszą być obliczane dla tej samej ilości i wielkości odstępów i dla tych samych kierunków. Sporządzenie LCM dla Nv cech wymaga jednoczesnego modelowania Nv(Nv+1)/2 semiwariogramów i kros semiwariogramów. Najwyższą, decydującą wagę przy podejmowaniu decyzji o postaci LCM ma forma semiwariogramu zmiennej pierwotnej, czyli tej, która ma być estymowana.

41 Liniowy model koregionalizacji (LCM)
LCM jest zdefiniowany jako zbiór Nv  Nv modeli semiwariogramów i kros semiwariogramów ij(h), takich że: gdzie każda funkcja gl(h) jest dopuszczalnym modelem semiwariogramu, i (L+1) macierzy współczynników stanowiących sill lub nachylenie modelu gl(h) są wszystkie połowicznie pozytywnie określone.

42 Kryterium połowicznej pozytywnej określoności macierzy (positive semi-definite)
Symetryczna macierz jest połowicznie pozytywnie określona jeśli jej wyznacznik oraz wszystkie jej główne podwyznaczniki nie są ujemne. Przykładowy liniowy model koregionalizacji dla Nv=3: Każda macierz koregionalizacji Bl jest połowicznie określona pozytywnie jeśli spełnione jest następujących siedem nierównosci

43 Kryterium połowicznej pozytywnej określoności macierzy (positive semi-definite)
Wszystkie elementy przekątnej nie są negatywne: Wszystkie główne podwyznaczniki stopnia 2 nie są negatywne:

44 Kryterium połowicznej pozytywnej określoności macierzy (positive semi-definite)
Wyznacznik stopnia 3 nie jest negatywny:

45 Pojęcie struktura oznacza:
(a) typ modelu, (b) zasięg, (c) kierunek Podstawowe zasady w trakcie tworzeniem liniowego modelu koregionalizacji Każda elementarna struktura pojawiająca się na kros semiwariogramie ij(h) musi istnieć w obu modelach semiwariogramów jednostkowych ii(h) i jj(h). Jeśli elementarna struktura gl(h) nie występuje na semiwariogramie jednostkowym danej zmiennej, to musi być ona nieobecna także na wszystkich kros semiwariogramach zawierających ową zmienną.

46 Pojęcie struktura oznacza:
(a) typ modelu, (b) zasięg, (c) kierunek Podstawowe zasady w trakcie tworzeniem liniowego modelu koregionalizacji Każdy model jednostkowego czy też kros semiwariogramu ij(h) nie musi zawierać wszystkich (L + 1) elementarnych struktur. Struktura gl(h) pojawiająca się na obu semiwariogramach jednostkowych ii(h) i jj(h) nie musi być obecna na kros semiwariogramie ij(h) obu zmiennych.

47 b1_03b gamma(h) = 19, ,41449Sph(95) + 76,70560Sph(620) b3n_03b gamma(h) = 54, ,98145Sph(95) + 91,90548Sph(620) b1-b3n_03b gamma(h) = 16, Sph(95) + 77,51083Sph(620) Najlepiej dopasowane modele izotropowe dla cech b1_03b i b3n_03b tworzone jednocześnie zgodnie z zasadami LCM Najlepiej dopasowane modele izotropowe dla cech b1_03b i b3n_03b tworzone niezależnie b1_03b gamma(h) = 18,0 + 78,0Sph(95) + 82,0Sph(628) b3n_03b gamma(h) = 50,0 + 49,0Sph(84) + 96,5Sph(589) b1-b3n_03b gamma(h) = 22,0 + 52,8Sph(150) + 72,0Sph(587)

48 Testowanie kryterium połowicznej pozytywnej określoności macierzy współczynników
b1_03b gamma(h) = 19, ,41449Sph(95) + 76,70560Sph(620) b3n_03b gamma(h) = 54, ,98145Sph(95) + 91,90548Sph(620) b1-b3n_03b gamma(h) = 16, Sph(95) + 77,51083Sph(620) Macierz współczynników struktury nuggetowej Macierz współczynników 1 struktury sferycznej Macierz współczynników 2 struktury sferycznej

49 Testowanie kryterium połowicznej pozytywnej określoności macierzy współczynników
3 pierwsze nierówności są spełnione ponieważ wszystkie elementy przekątne każdej macierzy nie są negatywne.

50 Model „zwykły” a model LCM – b1_03b

51 Model „zwykły” a model LCM – b3n_03b

52 Uproszczony model koregionalizacji
LCM jest bardzo skomplikowany; wymaga poszukiwania optymalnego rozwiązania metodą prób i błędów, albo posiadania oprogramowania wykonującego to zadanie metodą iteracyjną opracowaną na początku lat 90-tych XX wieku (Goulard, Voltz 1992, program LCMFIT2) W ostatnim 15-leciu opracowano dwa uproszczone modele koregionalizacji szczególnie przydatne do kokrigingu kolokacyjnego (Almeida, Journel 1994, Journel 1998)

53 Uproszczony model koregionalizacji: model Markowa I (MM1)
W modelu Markowa I przyjmuje się następujące założenie dotyczące kroskorelogramu dwóch zmiennych Z i Y: gdzie z(h) = Cz(h)/Cz(0) jest korelogramem zmiennej pierwotnej, a zy(0) jest współczynnikiem korelacji pomiędzy zmienną pierwotną a wtórną, określonym z par danych obu zmiennych znajdujących się w tej samej lokalizacji {z(ua), y(ua)}

54 Uproszczony model koregionalizacji: model Markowa I (MM1)
Do wykonania estymacji metodą kokrigingu przy użyciu modelu 1 Markowa potrzebne są zatem jedynie: model semiwariancji zmiennej pierwotnej, współczynnik korelacji liniowej zmiennej pierwotnej z wtórną, wariancja zmiennej wtórnej. Model struktury przestrzennej zmiennej wtórnej jest obliczany na podstawie podanych wcześniej wzorów

55 Uproszczony model koregionalizacji: model Markowa II (MM2)
W opracowaniach w których dane zmiennej wtórnej pochodzą z teledetekcji ich liczba przewyższa setki, a nawet tysiące razy ilość danych zmiennej pierwotnej Zachodzi wówczas „ekranowanie” danych zmiennej pierwotnej przez wtórną, a model zmiennej wtórnej jest łatwiej określić i jest on bardziej statystycznie wiarygodny

56 Uproszczony model koregionalizacji: model Markowa II (MM2)
W modelu Markowa II przyjmuje się następujące założenie dotyczące kroskorelogramu dwóch zmiennych: gdzie y(h) = Cy(h)/Cy(0) jest korelogramem zmiennej wtórnej, a zy(0) jest współczynnikiem korelacji pomiędzy zmienną pierwotną a wtórną określonym z par danych obu zmiennych znajdujących się w tej samej lokalizacji {z1(ua), y2(ua)}

57 Uproszczony model koregionalizacji: model Markova II (MM2)
Do wykonania estymacji metodą kokrigingu przy użyciu modelu 2 Markowa potrzebne są zatem jedynie: model semiwariancji zmiennej wtórnej, model semiwariancji zmiennej pierwotnej, współczynnik korelacji liniowej zmiennej pierwotnej z wtórną, Ponieważ modele struktury przestrzennej zmiennej pierwotnej i wtórnej muszą być spójne z ich kroskorelogramem modelowanie dla zmiennej pierwotnej powinno być wykonywane przy pomocy liniowej kombinacji modelu zmiennej wtórnej i jakiegokolwiek innego dopuszczalnego modelu R(h):

58 „Techniczne” aspekty budowy modeli struktury przestrzennej
Modelowanie matematyczne struktury przestrzennej nie jest, jakby się wydawało, nawet przy aktualnym poziomie mocy obliczeniowej komputerów osobistych, zagadnieniem łatwym. Wręcz przeciwnie, automatyczne algorytmy zdają egzamin jedynie przy izotropowych, i to raczej najprostszych przypadkach. Próby stworzenie takich uniwersalnych procedur podejmowane są od ponad 30 lat bez większego powodzenia. W modułach modelowania struktury przestrzennej w większości dostępnych programów geostatystycznych dokonuje się tego na drodze manualnej lub półautomatycznej, przy czym i w tym drugim przypadku operator ma całkowitą kontrolę nad przebiegiem obliczeń, łącznie z możliwością całkowitego wyłączenia „automatyki” i / albo „ręcznej” modyfikacji wyników.

59 „Techniczne” aspekty budowy modeli struktury przestrzennej
Tam gdzie stosuje się wariant w 100% manualny, operator obserwując na ekranie wykres semiwariogramu empirycznego (albo innej miary struktury przestrzennej), wybiera podstawowe składowe modelu: ilość, typ i następstwo struktur elementarnych, a następnie metodą prób i błędów optymalizuje ich parametry: zasięg, wariancje cząstkowe, kierunek i stopień anizotropii. W procedurach półautomatycznych drugi z wymienionych wyżej etapów, to jest optymalizacja parametrów, dokonywana jest w mniejszym lub większym stopniu automatycznie. Jeśli operator nie jest zadowolony z końcowego wyniku, może dokonać jego modyfikacji, cały czas obserwując efekt swoich działań na ekranowym wykresie.

60 „Techniczne” aspekty budowy modeli struktury przestrzennej
Ten element procedury geostatystycznej jest bardzo często krytykowany ze względu na subiektywizm. Bywa jednak, że może to doprowadzić do radykalnego polepszenia wyników estymacji lub symulacji. Związane jest to bowiem z możliwością uwzględnienia wiedzy a priori, wiedzy eksperta, o naturze zmienności przestrzennej zjawiska, które wygenerowało obserwowany rozkład analizowanej cechy. Dane pomiarowe ze względu na małą próbę, czy błędy pomiarowe, mogą tych relacji nie wykazywać. Kiedy na przykład zadaniem jest estymacja skażenia gleb wokół emitora, jakim może być komin elektrowni cieplnej, wiemy że musi ona wykazywać anizotropię o kierunku i rozmiarach uzależnionych od lokalnego reżimu wiatrów. Wiedzę tą możemy w trakcie modelowania wykorzystać, „wymuszając” uwzględnienie anizotropii.

61 „Techniczne” aspekty budowy modeli struktury przestrzennej
Zarówno przy ręcznym, jak i automatycznym modelowaniu struktury przestrzennej potrzebne jest obiektywne kryterium jakości dopasowania modelu do danych empirycznych. W pierwszym przypadku ma ono charakter pomocniczy. Operator może, ale nie musi, opierając się na obliczanych po każdej wprowadzonej przez niego zmianie w parametrach modelu, wartościach owego kryterium, dążyć do optymalizacji wyniku. Optymalizacja automatyczna musi być dokonywana w odniesieniu do precyzyjnie zdefiniowanego jej celu, którym zazwyczaj jest minimalizacja albo maksymalizacja wartości jakiejś funkcji. Konieczne jest również podanie warunku zakończenia obliczeń – zazwyczaj dokonywanych metodą kolejnych przybliżeń (iteracyjnie).

62 „Techniczne” aspekty budowy modeli struktury przestrzennej
Najczęściej w geostatystyce stosowanym kryterium dopasowania modelu do danych empirycznych jest Ważona Suma Kwadratów (ang. Weighted Sum of Squares, WSS) różnic pomiędzy eksperymentalnymi , a modelowanymi (hk) wartościami semiwariogramu: Waga  przypisana do każdego odstępu hk jest zazwyczaj proporcjonalna do liczby N(hk) par danych, które są uwzględniane w obliczeniu wartości semiwariogramu empirycznego. Podstawą takiego rozwiązania jest założenie, że wiarygodność semiwariogramu empirycznego wzrasta wraz z wielkością próby. Nie jest to jednakże jedyny wariant wagi w kryterium WSS.

63 „Techniczne” aspekty budowy modeli struktury przestrzennej
Inny, równie często stosowany wariant wagi, przywiązuje większe znaczenie do semiwariogramów obliczanych dla pierwszych odstępów, poprzez podzielenie ilości par danych przez podniesioną do kwadratu wartość modelu: W trzecim wariancie wiarygodność statystyczną wartości semiwariogramu empirycznego ocenia się nie poprzez ilość par danych, która posłużyła do jego obliczenia, ale poprzez zróżnicowanie indywidualnych wartości różnic obliczonych dla każdej pary: małe zróżnicowanie – duża wiarygodność. Waga WSS jest wówczas odwrotnie proporcjonalna do odchylenia standardowego indywidualnych wartości różnic.

64 „Techniczne” aspekty budowy modeli struktury przestrzennej
Na koniec omawiania tego zagadnienia należy wspomnieć, że metoda WSS, jakkolwiek najbardziej popularna, nie jest jedynym rozwiązaniem problemu automatycznego dopasowania parametrów modeli struktury przestrzennej. Stosowane są również algorytmy tzw. maksymalnej wiarygodności (ang. maximum likelihood, ML ) lub ograniczonej ML (ang. restricted ML, REML), gdzie model tworzony jest bezpośrednio na podstawie surowych wartości różnic. Ponieważ jednak bazują one na założeniu rozkładu normalnego, ich oszacowania są często obciążone. Obliczenia wykonywane metodami ML i REML są także stosunkowo wolne przy dużych próbach. Jakość estymacji zależy głównie od poprawnego określenia „kształtu” modelu u jego początku, natomiast semiwariancje empiryczne pierwszych odstępów obliczane są zazwyczaj na podstawie znacznie mniejszej liczby par punktów niż dalsze.

65 A jak to się robi w pakiecie Variowin (program Model)
N – liczba kierunkowych wariogramów* użytych w modelu n(k) – liczba odstępów dla k-tego wariogramu P(i) – liczba par dla odstępu i h(i) – średnia odległość dla odstępu i hmax(k) – maksymalna odległość dla k-tego wariogramu (i) – wartość wariogramu eksperymentalnego dla odstępu i *(i) – wartość modelu wariogramu dla średniej odległości odstępu i 2 – wariancja danych dla semiwariogramu i kowariancji, maksymalna wartość danych dla madogramu, 1 dla korelogramu i standaryzowanego semiwariogramu IGF to wskaźnik bezwymiarowy. Im jego wartość jest mniejsza tym jakość dopasowania jest lepsza. Ponieważ jest także miarą standaryzowaną umożliwia porównywanie jakości dopasowania różnych modeli do różnych danych eksperymentalnych.

66 Optymalizacja modelu struktury przestrzennej
Z półautomatycznym i ręcznym konstruowaniem złożonego (zagnieżdżonego) modelu struktury przestrzennej wiąże się jeszcze jeden istotny problem – niepewności co do wyboru optymalnej liczby i kombinacji funkcji podstawowych (elementarnych). Z jednej strony model powinien być jak najlepiej dopasowany do danych eksperymentalnych, z drugiej zaś wiadomo, że ich niewielkie fluktuacje mogą być zupełnie przypadkowe. Zagadnienie to można rozpatrywać w dwóch kontekstach. Pierwszy z nich ma charakter optymalizacyjny drugi – praktyczny.

67 Praktyczne podejście do problemu optymalizacji modelu struktury przestrzennej
Z praktycznego punktu widzenia najlepszym modelem jest nie ten, który został najlepiej dopasowany do danych obserwacyjnych, ale dający najbardziej dokładną prognozę. Dlatego też ważnym etapem procedury geostatycznej jest wybór z kilku, jednego optymalnego modelu poprzez procedurę zwaną walidacją. Polega ona na porównaniu rzeczywistych wartości analizowanej cechy z prognozowanymi na podstawie testowanych modeli. Wykonuje się to albo metodą „walidacji podzbiorem” albo w sposób uproszczony tzw. „kroswalidacją”

68 Optymalizacja matematyczna modelu struktury przestrzennej
Optymalizacyjne podejście do zagadnienia budowy złożonego modelu semiwariancji opiera się idei, że musi istnieć równowaga pomiędzy prostotą modelu, a więc także łatwością wykonywanych na jego podstawie estymacji, a jakością jego dopasowania do danych eksperymentalnych. Polepszenie modelu poprzez minimalizację kryterium WSS może się dokonywać praktycznie w nieskończoność, jeśli zwiększać się będzie ilość funkcji elementarnych. Jednakże kolejne komplikowanie jego postaci skutkuje coraz mniejszym przyrostem jakości dopasowania, dlatego ważne byłoby ustalenie kryterium, które umożliwiłoby w obiektywny i powtarzalny sposób zachowanie proporcji między dążeniem do prostoty modelu, a wiernością odwzorowania wyników pomiarów. Webster i McBratney (1989) zaproponowali zastosowanie do tego celu kryterium informacyjnego Akaike (ang. Akaike Information Criterion)

69 Kryterium informacyjne Akaike (AIC)
gdzie: n jest liczbą punktów na wariogramie, p – ilością parametrów modelu, a R stanowi średnią podniesionych do kwadratu różnic pomiędzy wartościami eksperymentalnymi a modelem. Do dalszego etapu procedury geostatystycznej wybiera się ten model, dla którego AIC jest najmniejsze Fragment wzoru znajdujący się w nawiasie jest stały dla każdego konkretnego semiwariogramu, dlatego można go uprościć do postaci: Minimalizacja kwadratów odchyleń (WSS) zmniejsza wartość R, lecz jeśli dalsze jego obniżanie dokonuje się jedynie poprzez zwiększanie p, to w pewnym momencie spadek AIC zostaje zatrzymany.


Pobierz ppt "Alfred Stach Instytut Geoekologii i Geoinformacji"

Podobne prezentacje


Reklamy Google