Pobierz prezentację
Pobieranie prezentacji. Proszę czekać
OpublikowałDrugi Klimek Został zmieniony 11 lat temu
1
GEOSTATYSTYKA I ANALIZA PRZESTRZENNA Wykład dla III roku Geografii specjalność - geoinformacja
Alfred Stach Instytut Geoekologii i Geoinformacji Wydział Nauk Geograficznych i Geologicznych UAM
2
Semiwariogram empiryczny a potrzeby estymacji
Semiwariogram empiryczny jest: nieciągły (dyskretny) chaotyczny
3
Wymagania algorytmów estymacji i symulacji
Wszystkie geostatystyczne algorytmy estymacji i symulacji przestrzennej wymagają podania w matematycznej (parametrycznej) formie modelu struktury przestrzennej analizowanej cechy Nie mogą to być po prostu wartości empirycznych (to jest wyliczonych z danych pomiarowych) miar struktury przestrzennej, jak kowariogram, korelogram czy semiwariogram.
4
Wymagania algorytmów estymacji i symulacji
W macierzach krigingowych dla każdego oczka siatki interpolacyjnej potrzebne są wartości kowariancji pomiędzy danymi pomiarowymi znajdującymi się w sąsiedztwie szukania (ang. data covariances) oraz kowariancji danych do lokalizacji estymowanej nieznanej (ang. data-to-unknown covariances). Oznacza to, że muszą one być możliwe do określenia dla dowolnej kombinacji odległości i kierunku. Wszystkie zaś empiryczne miary autokorelacji przestrzennej są dyskretne, czyli nieciągłe, obliczane są bowiem jako średnie przedziałowe (odstępy odległości i sektory kierunków). W estymacjach potrzebne są też często wartości kowariancji dla odległości i kierunków, dla których nie ma danych empirycznych. Nie bywa jednak stosowane, wydawałoby się najprostsze, rozwiązanie, to jest interpolacja i ekstrapolacja kowariancji empirycznych.
5
Wymagania algorytmów estymacji i symulacji
Empiryczne miary struktury przestrzennej stanowią statystyki obliczane z próby i jako takie są tylko przybliżeniem relacji przestrzennych w całej populacji. Ich wiarygodność jest uzależniona z jednej strony od wielkości i reprezentatywności próby, a z drugiej – od skali zmienności analizowanej cechy Zawsze dochodzi jednak czynnik jakim są nieuniknione błędy, zarówno pomiaru cechy, jak i określenia lokalizacji stanowiska, gdzie pomiar został dokonany. Zazwyczaj analizowane są próby stanowiące milionowe, miliardowe lub nawet mniejsze części całej populacji , a zalecenie ich losowości często nie jest w pełni spełnione. Wszystkie wymienione czynniki, a także czułość stosowanych zazwyczaj miar struktury przestrzennej na naturalnie występujące wartości anomalne powoduje, że ich wykresy często są chaotyczne i nie odzwierciedlają wiarygodnie stosunków istniejących w całej zbiorowości. Matematyczny model może zredukować znaczenie tych wad, wygładzając chaotyczne fluktuacje danych empirycznych.
6
Kryterium połowicznej pozytywnej określoności (ang
Kryterium połowicznej pozytywnej określoności (ang. positive semidefinite) Estymowane lub symulowane wartości są w geostatystyce traktowane jako zmienne losowe będące liniową kombinacją innych znanych zmiennych losowych. Wariancja zaś jakiejkolwiek liniowej kombinacji Y zmiennych losowych Z(u), u A, jest wówczas liniową kombinacją wartości kowariancji owych zmiennych i musi nieujemna (ang. non-negative) Spełnienie tego warunku jest możliwe tylko przy zastosowaniu takich funkcji kowariancji C(h), nieparametrycznych czy też parametrycznych, które są pozytywnie połowicznie określone. dla jakiejkolwiek z wybranych n lokalizacji u A i dla jakiejkolwiek wagi
7
Kryterium połowicznej pozytywnej określoności (ang
Kryterium połowicznej pozytywnej określoności (ang. positive semidefinite) Stosowanie interpolowanych / ekstrapolowanych wartości empirycznych miar struktury przestrzennej nigdy nie gwarantuje, że obliczenia estymacji / symulacji dadzą jakikolwiek wynik. Gwarancję taką można mieć jedynie przy zastosowaniu modelu matematycznego o takiej postaci, który jest z góry pozytywnie połowicznie określony. Modele takie określa się jako dozwolone (ang. permissible).
8
Model nuggetowy (losowy)
Gaussowska symulacja bezwarunkowa dla zmiennej o średniej 0 i wariancji nuggetowej równej 10
9
Model nuggetowy (losowy)
Zastosowanie modelu nuggetowego oznacza w praktyce stwierdzenie braku autokorelacji zjawiska. Wariancja procesu jest stała dla każdej odległości większej od zera. Ponieważ większość parametrów środowiskowych jest w jakiejś skali przestrzennej ciągłe, konieczność użycia tego modelu oznacza zazwyczaj, że odstęp próbkowania był większy niż zasięg autokorelacji. Inną możliwość stwarza istnienie zjawiska w 100% losowego, nieciągłego, którego charakterystyki zmieniają gwałtownie przy przejściu z jednego punktu do drugiego. Obrazem symulacji bezwarunkowej przy użyciu tego modelu jest, zgodnie z terminologią stosowaną w analizie serii czasowych, „biały szum”, podobny do tego co jest obserwowane na ekranie telewizora (lampy katodowej), do którego nie dociera żaden sygnał
10
Model sferyczny o zasięgu a
Gaussowska symulacja bezwarunkowa dla zmiennej o średniej 0 i zasięgu rzeczywistym (a) równym 10 i wariancji progowej równej 10
11
Model sferyczny Model sferyczny może być stosowany w 1, 2 i 3 wymiarach, i jest jednym z najczęściej stosowanych w geostatystyce do charakterystyki struktury przestrzennej. Daje on reprezentację cech ciągłych, które mają podobną rozciągłość, a ich zmienność ma charakter przeplatających się nieregularnych płatów z wysokimi i niskimi wartościami. Średnia średnica owych płatów jest reprezentowana przez zasięg modelu. Model sferyczny ma w początkowym odcinku charakter funkcji liniowej o nachyleniu 3C/2a.
12
Model wykładniczy o zasięgu praktycznym a
Gaussowska symulacja bezwarunkowa dla zmiennej o średniej 0 i zasięgu praktycznym (a) równym 10 i wariancji progowej równej 10
13
Model wykładniczy Jest podobnie często wykorzystywany jak model sferyczny. Funkcja ta osiąga wariancję progową asymptotycznie i dlatego nie ma skończonego zasięgu. Zamiast niego podawany jest tak zwany zasięg „praktyczny” lub „efektywny”, zdefiniowany jako odległość na jakiej model osiąga 95% wartości wariancji progowej. Model wykładniczy ma również liniowy charakter w fazie początkowej, ale o większym nachyleniu niż w przypadku sferycznego: C/a. Funkcja ta odgrywa bardzo ważną rolę teoretyczną. Stanowi bowiem istotę losowości w ujęciu przestrzennym. Jest to semiwariogram procesów autoregresyjnych pierwszego rzędu i procesów Markowa. Można się spodziewać semiwariogramu wykładniczego wówczas, kiedy głównym źródłem zmienności cechy jest występowanie odmiennych typów systemów, a granice między typami występują losowo zgodnie z procesem Poissona. Przykładem może być sytuacja, kiedy zmienność przestrzenna pewnej cechy gleb, na przykład odczynu, jest uwarunkowana głównie różnicami pomiędzy typami gleb. Inaczej mówiąc, jest to semiwariogram cech ciągłych, których struktury mają losowy zasięg.
14
Model gaussowski o zasięgu praktycznym a
Gaussowska symulacja bezwarunkowa dla zmiennej o średniej 0 i zasięgu praktycznym (a) równym 10 i wariancji progowej równej 10
15
Model gaussowski … również osiąga poziom wariancji progowej asymptotycznie, dlatego tak jak w poprzednim przypadku, zasięg praktyczny definiowany jest jako odległość dla której wartość semiwariancji wyliczona z modelu osiąga 95% wariancji progowej. Model gaussowski odróżnia się od dwóch wymienionych poprzednio przede wszystkim parabolicznym kształtem w początkowym odcinku. Oznacza to, że „dotyka” on osi z zerowym nachyleniem. Stanowi to granicę zmienności losowej, przy której w rzeczywistości istnieje wartość stała i podwójnie różniczkowalna. Model ten ze względu na swój deterministyczny charakter daje w wielu przypadkach nierealistyczne wyniki estymacji i zazwyczaj nie może być stosowany samodzielnie. Jego użycie jest czasami uzasadnione przy analizie przestrzennej i prognozowaniu parametrów o bardzo regularnej i łagodnej zmienności przestrzennej, na przykład poziomu wód gruntowych w obszarach o mało zróżnicowanej rzeźbie i jednolitej budowie geologicznej.
16
Model liniowy z wariancją progową o zasięgu rzeczywistym a
Gaussowska symulacja bezwarunkowa dla zmiennej o średniej 0 i zasięgu rzeczywistym (a) równym 10 i wariancji progowej równej 10
17
Model potęgowy
18
Model potęgowy Funkcja potęgowa rośnie w nieskończoność, nie ma zatem zarówno zasięgu, ani progu. Tego typu modele nazywa się w geostatystyce nieograniczonymi (ang. unbounded). Interpretuje się jako reprezentację procesu losowego mającego charakter ruchów Browna. Przyjmując dla uproszczenia ruch cząsteczki w jednym wymiarze, jej prędkość lub moment pędu w położeniu x + h zależy od jej prędkości lub momentu pędu w bezpośrednio poprzednim bliskim położeniu x. Relację tą można zapisać równaniem: gdzie to niezależne, losowe odchylenie gaussowskie, a to parametr. W najprostszym przypadku = 1, a wariogram procesu wygląda wówczas następująco:
19
Model potęgowy Jeśli wykładnik k w równaniu wynosi 1, to wówczas mamy do czynienia z modelem liniowym, gdzie gdy Nazywany jest on często modelem ścieżki losowej (ang. random walk model). Przy typowych ruchach Browna składnik jest dla każdego kroku niezależny. Jeśli jednak są przestrzennie skorelowane, to ślad ruchu cząsteczki jest bardziej „gładki” niż w klasycznym ruchu Browna. Wówczas to wykładnik k jest większy od 1, a krzywa wklęsła. Z drugiej strony, kiedy odchylenia są odwrotnie (ujemnie) skorelowane, wówczas ścieżka ruchu jest bardziej chaotyczna. Wykładnik k z równania jest wtedy mniejszy od 1, a krzywa wariogramu wypukła. Kiedy są idealnie skorelowane wówczas k = 2, a ślad ruchu cząsteczki jest płynny (gładki), co oznacza, że nie ma już charakteru losowego. W sytuacji gdy k 0 chaotyczność ruchu rośnie aż do poziomu białego szumu, którego obrazem jest model nuggetowy.
20
Porównanie kształtu najczęściej wykorzystywanych modeli
21
Symulacja warunkowa: zmienna b1_03b różne modele struktury – te same parametry (zasięg, wariancja progowa)
22
Inne, rzadziej stosowane, matematyczne modele struktury przestrzennej: cubic
23
Inne, rzadziej stosowane, matematyczne modele struktury przestrzennej: cardinal sine
24
Inne, rzadziej stosowane, matematyczne modele struktury przestrzennej: stable
25
Inne, rzadziej stosowane, matematyczne modele struktury przestrzennej: gamma
26
Liniowy model regionalizacji
W wielu sytuacjach, aby odwzorować dokładnie kształt semiwariogramu empirycznego konieczne jest połączenie dwóch, lub większej ilości modeli podstawowych g(h). Nie wszystkie kombinacje dopuszczalnych modeli dają w efekcie funkcję dopuszczalną, to znaczy z nieujemną wariancją. Najprostszym sposobem utworzenia modelu dopuszczalnego jest stworzenie najpierw funkcji losowej. Semiwariogram takiej funkcji jest z definicji dopuszczalny
27
Liniowy model regionalizacji
Praktycznie rzecz biorąc konieczne jest spełnienie dwóch warunków tak zwanego liniowego modelu regionalizacji (ang. linear regionalisation model): wszystkie użyte w modelu złożonym podstawowe funkcje gl(h) muszą być dopuszczalne, wariancja progowa bl każdego podstawowego modelu semiwariogramu musi być dodatnia, a wówczas: Model złożony (h) jest w takiej sytuacji wyrażony jako pozytywna liniowa kombinacja podstawowych modeli semiwariogramów gl(h). W literaturze przedmiotu popularna jest jego także alternatywna nazwa: „nested model” czyli model zagnieżdżony.
28
Liniowy model regionalizacji
29
Liniowy model regionalizacji – zmienna b1_03b
30
Liniowy model regionalizacji – zmienna b1_03b
31
Model zmiennej b1_03b - anizotropia
Powierzchnia modelu semiwariogramu bezkierunkowego (izotropowego) Powierzchnia semiwariogramu empirycznego
32
Model zmiennej b1_03b - anizotropia
Powierzchnia modelu semiwariogramu anizotropowego Powierzchnia semiwariogramu empirycznego
33
Model zmiennej b1_03b - anizotropia
gamma (h) = Sph(88) + 69Sph(632) dir(1) = 62°, ani(1) = 1,6; dir(2) = 306°, ani(2) = 0,49 325° 55° 10° 280°
34
Zmienna b3n_03b – anizotropia
gamma(h) = 52,1 + 67,0Sph(104) + 67,1Sph(680) dir(1) = 59°, ani(1) = 7,6 dir(2) = 263°, ani(2) = 0,44 Powierzchnia semiwariogramu empirycznego
35
Zmienne b1-b3n_03b – anizotropia
gamma(h) = 21,6 + 54,4Sph(97) + 60,0Sph(621) dir(1) = 61°, ani(1) = 16,0 dir(2) = 256°, ani(2) = 0,42 Powierzchnia semiwariogramu empirycznego
36
Spitsbergen – zmienna b1_03b
Powierzchnia rzeczywista Interpolacja – zwykły kriging (OK)
37
Spitsbergen – zmienna b1_03b
Powierzchnia rzeczywista Błędy geometryczne interpolacji OK
38
Spitsbergen – zmienna b1_03b
Interpolacja coOK z wykorzystaniem skorelowanych danych ilościowych (dodatkowe 100 punktów) Powierzchnia rzeczywista
39
Spitsbergen – zmienna b1_03b
Powierzchnia rzeczywista Błędy geometryczne interpolacji coOK
40
Podstawowe zasady przed tworzeniem liniowego modelu koregionalizacji
Semiwariogramy i kros semiwariogramy empiryczne będące podstawą szacowania LCM muszą być obliczane dla tej samej ilości i wielkości odstępów i dla tych samych kierunków. Sporządzenie LCM dla Nv cech wymaga jednoczesnego modelowania Nv(Nv+1)/2 semiwariogramów i kros semiwariogramów. Najwyższą, decydującą wagę przy podejmowaniu decyzji o postaci LCM ma forma semiwariogramu zmiennej pierwotnej, czyli tej, która ma być estymowana.
41
Liniowy model koregionalizacji (LCM)
LCM jest zdefiniowany jako zbiór Nv Nv modeli semiwariogramów i kros semiwariogramów ij(h), takich że: gdzie każda funkcja gl(h) jest dopuszczalnym modelem semiwariogramu, i (L+1) macierzy współczynników stanowiących sill lub nachylenie modelu gl(h) są wszystkie połowicznie pozytywnie określone.
42
Kryterium połowicznej pozytywnej określoności macierzy (positive semi-definite)
Symetryczna macierz jest połowicznie pozytywnie określona jeśli jej wyznacznik oraz wszystkie jej główne podwyznaczniki nie są ujemne. Przykładowy liniowy model koregionalizacji dla Nv=3: Każda macierz koregionalizacji Bl jest połowicznie określona pozytywnie jeśli spełnione jest następujących siedem nierównosci
43
Kryterium połowicznej pozytywnej określoności macierzy (positive semi-definite)
Wszystkie elementy przekątnej nie są negatywne: Wszystkie główne podwyznaczniki stopnia 2 nie są negatywne:
44
Kryterium połowicznej pozytywnej określoności macierzy (positive semi-definite)
Wyznacznik stopnia 3 nie jest negatywny:
45
Pojęcie struktura oznacza:
(a) typ modelu, (b) zasięg, (c) kierunek Podstawowe zasady w trakcie tworzeniem liniowego modelu koregionalizacji Każda elementarna struktura pojawiająca się na kros semiwariogramie ij(h) musi istnieć w obu modelach semiwariogramów jednostkowych ii(h) i jj(h). Jeśli elementarna struktura gl(h) nie występuje na semiwariogramie jednostkowym danej zmiennej, to musi być ona nieobecna także na wszystkich kros semiwariogramach zawierających ową zmienną.
46
Pojęcie struktura oznacza:
(a) typ modelu, (b) zasięg, (c) kierunek Podstawowe zasady w trakcie tworzeniem liniowego modelu koregionalizacji Każdy model jednostkowego czy też kros semiwariogramu ij(h) nie musi zawierać wszystkich (L + 1) elementarnych struktur. Struktura gl(h) pojawiająca się na obu semiwariogramach jednostkowych ii(h) i jj(h) nie musi być obecna na kros semiwariogramie ij(h) obu zmiennych.
47
b1_03b gamma(h) = 19, ,41449Sph(95) + 76,70560Sph(620) b3n_03b gamma(h) = 54, ,98145Sph(95) + 91,90548Sph(620) b1-b3n_03b gamma(h) = 16, Sph(95) + 77,51083Sph(620) Najlepiej dopasowane modele izotropowe dla cech b1_03b i b3n_03b tworzone jednocześnie zgodnie z zasadami LCM Najlepiej dopasowane modele izotropowe dla cech b1_03b i b3n_03b tworzone niezależnie b1_03b gamma(h) = 18,0 + 78,0Sph(95) + 82,0Sph(628) b3n_03b gamma(h) = 50,0 + 49,0Sph(84) + 96,5Sph(589) b1-b3n_03b gamma(h) = 22,0 + 52,8Sph(150) + 72,0Sph(587)
48
Testowanie kryterium połowicznej pozytywnej określoności macierzy współczynników
b1_03b gamma(h) = 19, ,41449Sph(95) + 76,70560Sph(620) b3n_03b gamma(h) = 54, ,98145Sph(95) + 91,90548Sph(620) b1-b3n_03b gamma(h) = 16, Sph(95) + 77,51083Sph(620) Macierz współczynników struktury nuggetowej Macierz współczynników 1 struktury sferycznej Macierz współczynników 2 struktury sferycznej
49
Testowanie kryterium połowicznej pozytywnej określoności macierzy współczynników
3 pierwsze nierówności są spełnione ponieważ wszystkie elementy przekątne każdej macierzy nie są negatywne.
50
Model „zwykły” a model LCM – b1_03b
51
Model „zwykły” a model LCM – b3n_03b
52
Uproszczony model koregionalizacji
LCM jest bardzo skomplikowany; wymaga poszukiwania optymalnego rozwiązania metodą prób i błędów, albo posiadania oprogramowania wykonującego to zadanie metodą iteracyjną opracowaną na początku lat 90-tych XX wieku (Goulard, Voltz 1992, program LCMFIT2) W ostatnim 15-leciu opracowano dwa uproszczone modele koregionalizacji szczególnie przydatne do kokrigingu kolokacyjnego (Almeida, Journel 1994, Journel 1998)
53
Uproszczony model koregionalizacji: model Markowa I (MM1)
W modelu Markowa I przyjmuje się następujące założenie dotyczące kroskorelogramu dwóch zmiennych Z i Y: gdzie z(h) = Cz(h)/Cz(0) jest korelogramem zmiennej pierwotnej, a zy(0) jest współczynnikiem korelacji pomiędzy zmienną pierwotną a wtórną, określonym z par danych obu zmiennych znajdujących się w tej samej lokalizacji {z(ua), y(ua)}
54
Uproszczony model koregionalizacji: model Markowa I (MM1)
Do wykonania estymacji metodą kokrigingu przy użyciu modelu 1 Markowa potrzebne są zatem jedynie: model semiwariancji zmiennej pierwotnej, współczynnik korelacji liniowej zmiennej pierwotnej z wtórną, wariancja zmiennej wtórnej. Model struktury przestrzennej zmiennej wtórnej jest obliczany na podstawie podanych wcześniej wzorów
55
Uproszczony model koregionalizacji: model Markowa II (MM2)
W opracowaniach w których dane zmiennej wtórnej pochodzą z teledetekcji ich liczba przewyższa setki, a nawet tysiące razy ilość danych zmiennej pierwotnej Zachodzi wówczas „ekranowanie” danych zmiennej pierwotnej przez wtórną, a model zmiennej wtórnej jest łatwiej określić i jest on bardziej statystycznie wiarygodny
56
Uproszczony model koregionalizacji: model Markowa II (MM2)
W modelu Markowa II przyjmuje się następujące założenie dotyczące kroskorelogramu dwóch zmiennych: gdzie y(h) = Cy(h)/Cy(0) jest korelogramem zmiennej wtórnej, a zy(0) jest współczynnikiem korelacji pomiędzy zmienną pierwotną a wtórną określonym z par danych obu zmiennych znajdujących się w tej samej lokalizacji {z1(ua), y2(ua)}
57
Uproszczony model koregionalizacji: model Markova II (MM2)
Do wykonania estymacji metodą kokrigingu przy użyciu modelu 2 Markowa potrzebne są zatem jedynie: model semiwariancji zmiennej wtórnej, model semiwariancji zmiennej pierwotnej, współczynnik korelacji liniowej zmiennej pierwotnej z wtórną, Ponieważ modele struktury przestrzennej zmiennej pierwotnej i wtórnej muszą być spójne z ich kroskorelogramem modelowanie dla zmiennej pierwotnej powinno być wykonywane przy pomocy liniowej kombinacji modelu zmiennej wtórnej i jakiegokolwiek innego dopuszczalnego modelu R(h):
58
„Techniczne” aspekty budowy modeli struktury przestrzennej
Modelowanie matematyczne struktury przestrzennej nie jest, jakby się wydawało, nawet przy aktualnym poziomie mocy obliczeniowej komputerów osobistych, zagadnieniem łatwym. Wręcz przeciwnie, automatyczne algorytmy zdają egzamin jedynie przy izotropowych, i to raczej najprostszych przypadkach. Próby stworzenie takich uniwersalnych procedur podejmowane są od ponad 30 lat bez większego powodzenia. W modułach modelowania struktury przestrzennej w większości dostępnych programów geostatystycznych dokonuje się tego na drodze manualnej lub półautomatycznej, przy czym i w tym drugim przypadku operator ma całkowitą kontrolę nad przebiegiem obliczeń, łącznie z możliwością całkowitego wyłączenia „automatyki” i / albo „ręcznej” modyfikacji wyników.
59
„Techniczne” aspekty budowy modeli struktury przestrzennej
Tam gdzie stosuje się wariant w 100% manualny, operator obserwując na ekranie wykres semiwariogramu empirycznego (albo innej miary struktury przestrzennej), wybiera podstawowe składowe modelu: ilość, typ i następstwo struktur elementarnych, a następnie metodą prób i błędów optymalizuje ich parametry: zasięg, wariancje cząstkowe, kierunek i stopień anizotropii. W procedurach półautomatycznych drugi z wymienionych wyżej etapów, to jest optymalizacja parametrów, dokonywana jest w mniejszym lub większym stopniu automatycznie. Jeśli operator nie jest zadowolony z końcowego wyniku, może dokonać jego modyfikacji, cały czas obserwując efekt swoich działań na ekranowym wykresie.
60
„Techniczne” aspekty budowy modeli struktury przestrzennej
Ten element procedury geostatystycznej jest bardzo często krytykowany ze względu na subiektywizm. Bywa jednak, że może to doprowadzić do radykalnego polepszenia wyników estymacji lub symulacji. Związane jest to bowiem z możliwością uwzględnienia wiedzy a priori, wiedzy eksperta, o naturze zmienności przestrzennej zjawiska, które wygenerowało obserwowany rozkład analizowanej cechy. Dane pomiarowe ze względu na małą próbę, czy błędy pomiarowe, mogą tych relacji nie wykazywać. Kiedy na przykład zadaniem jest estymacja skażenia gleb wokół emitora, jakim może być komin elektrowni cieplnej, wiemy że musi ona wykazywać anizotropię o kierunku i rozmiarach uzależnionych od lokalnego reżimu wiatrów. Wiedzę tą możemy w trakcie modelowania wykorzystać, „wymuszając” uwzględnienie anizotropii.
61
„Techniczne” aspekty budowy modeli struktury przestrzennej
Zarówno przy ręcznym, jak i automatycznym modelowaniu struktury przestrzennej potrzebne jest obiektywne kryterium jakości dopasowania modelu do danych empirycznych. W pierwszym przypadku ma ono charakter pomocniczy. Operator może, ale nie musi, opierając się na obliczanych po każdej wprowadzonej przez niego zmianie w parametrach modelu, wartościach owego kryterium, dążyć do optymalizacji wyniku. Optymalizacja automatyczna musi być dokonywana w odniesieniu do precyzyjnie zdefiniowanego jej celu, którym zazwyczaj jest minimalizacja albo maksymalizacja wartości jakiejś funkcji. Konieczne jest również podanie warunku zakończenia obliczeń – zazwyczaj dokonywanych metodą kolejnych przybliżeń (iteracyjnie).
62
„Techniczne” aspekty budowy modeli struktury przestrzennej
Najczęściej w geostatystyce stosowanym kryterium dopasowania modelu do danych empirycznych jest Ważona Suma Kwadratów (ang. Weighted Sum of Squares, WSS) różnic pomiędzy eksperymentalnymi , a modelowanymi (hk) wartościami semiwariogramu: Waga przypisana do każdego odstępu hk jest zazwyczaj proporcjonalna do liczby N(hk) par danych, które są uwzględniane w obliczeniu wartości semiwariogramu empirycznego. Podstawą takiego rozwiązania jest założenie, że wiarygodność semiwariogramu empirycznego wzrasta wraz z wielkością próby. Nie jest to jednakże jedyny wariant wagi w kryterium WSS.
63
„Techniczne” aspekty budowy modeli struktury przestrzennej
Inny, równie często stosowany wariant wagi, przywiązuje większe znaczenie do semiwariogramów obliczanych dla pierwszych odstępów, poprzez podzielenie ilości par danych przez podniesioną do kwadratu wartość modelu: W trzecim wariancie wiarygodność statystyczną wartości semiwariogramu empirycznego ocenia się nie poprzez ilość par danych, która posłużyła do jego obliczenia, ale poprzez zróżnicowanie indywidualnych wartości różnic obliczonych dla każdej pary: małe zróżnicowanie – duża wiarygodność. Waga WSS jest wówczas odwrotnie proporcjonalna do odchylenia standardowego indywidualnych wartości różnic.
64
„Techniczne” aspekty budowy modeli struktury przestrzennej
Na koniec omawiania tego zagadnienia należy wspomnieć, że metoda WSS, jakkolwiek najbardziej popularna, nie jest jedynym rozwiązaniem problemu automatycznego dopasowania parametrów modeli struktury przestrzennej. Stosowane są również algorytmy tzw. maksymalnej wiarygodności (ang. maximum likelihood, ML ) lub ograniczonej ML (ang. restricted ML, REML), gdzie model tworzony jest bezpośrednio na podstawie surowych wartości różnic. Ponieważ jednak bazują one na założeniu rozkładu normalnego, ich oszacowania są często obciążone. Obliczenia wykonywane metodami ML i REML są także stosunkowo wolne przy dużych próbach. Jakość estymacji zależy głównie od poprawnego określenia „kształtu” modelu u jego początku, natomiast semiwariancje empiryczne pierwszych odstępów obliczane są zazwyczaj na podstawie znacznie mniejszej liczby par punktów niż dalsze.
65
A jak to się robi w pakiecie Variowin (program Model)
N – liczba kierunkowych wariogramów* użytych w modelu n(k) – liczba odstępów dla k-tego wariogramu P(i) – liczba par dla odstępu i h(i) – średnia odległość dla odstępu i hmax(k) – maksymalna odległość dla k-tego wariogramu (i) – wartość wariogramu eksperymentalnego dla odstępu i *(i) – wartość modelu wariogramu dla średniej odległości odstępu i 2 – wariancja danych dla semiwariogramu i kowariancji, maksymalna wartość danych dla madogramu, 1 dla korelogramu i standaryzowanego semiwariogramu IGF to wskaźnik bezwymiarowy. Im jego wartość jest mniejsza tym jakość dopasowania jest lepsza. Ponieważ jest także miarą standaryzowaną umożliwia porównywanie jakości dopasowania różnych modeli do różnych danych eksperymentalnych.
66
Optymalizacja modelu struktury przestrzennej
Z półautomatycznym i ręcznym konstruowaniem złożonego (zagnieżdżonego) modelu struktury przestrzennej wiąże się jeszcze jeden istotny problem – niepewności co do wyboru optymalnej liczby i kombinacji funkcji podstawowych (elementarnych). Z jednej strony model powinien być jak najlepiej dopasowany do danych eksperymentalnych, z drugiej zaś wiadomo, że ich niewielkie fluktuacje mogą być zupełnie przypadkowe. Zagadnienie to można rozpatrywać w dwóch kontekstach. Pierwszy z nich ma charakter optymalizacyjny drugi – praktyczny.
67
Praktyczne podejście do problemu optymalizacji modelu struktury przestrzennej
Z praktycznego punktu widzenia najlepszym modelem jest nie ten, który został najlepiej dopasowany do danych obserwacyjnych, ale dający najbardziej dokładną prognozę. Dlatego też ważnym etapem procedury geostatycznej jest wybór z kilku, jednego optymalnego modelu poprzez procedurę zwaną walidacją. Polega ona na porównaniu rzeczywistych wartości analizowanej cechy z prognozowanymi na podstawie testowanych modeli. Wykonuje się to albo metodą „walidacji podzbiorem” albo w sposób uproszczony tzw. „kroswalidacją”
68
Optymalizacja matematyczna modelu struktury przestrzennej
Optymalizacyjne podejście do zagadnienia budowy złożonego modelu semiwariancji opiera się idei, że musi istnieć równowaga pomiędzy prostotą modelu, a więc także łatwością wykonywanych na jego podstawie estymacji, a jakością jego dopasowania do danych eksperymentalnych. Polepszenie modelu poprzez minimalizację kryterium WSS może się dokonywać praktycznie w nieskończoność, jeśli zwiększać się będzie ilość funkcji elementarnych. Jednakże kolejne komplikowanie jego postaci skutkuje coraz mniejszym przyrostem jakości dopasowania, dlatego ważne byłoby ustalenie kryterium, które umożliwiłoby w obiektywny i powtarzalny sposób zachowanie proporcji między dążeniem do prostoty modelu, a wiernością odwzorowania wyników pomiarów. Webster i McBratney (1989) zaproponowali zastosowanie do tego celu kryterium informacyjnego Akaike (ang. Akaike Information Criterion)
69
Kryterium informacyjne Akaike (AIC)
gdzie: n jest liczbą punktów na wariogramie, p – ilością parametrów modelu, a R stanowi średnią podniesionych do kwadratu różnic pomiędzy wartościami eksperymentalnymi a modelem. Do dalszego etapu procedury geostatystycznej wybiera się ten model, dla którego AIC jest najmniejsze Fragment wzoru znajdujący się w nawiasie jest stały dla każdego konkretnego semiwariogramu, dlatego można go uprościć do postaci: Minimalizacja kwadratów odchyleń (WSS) zmniejsza wartość R, lecz jeśli dalsze jego obniżanie dokonuje się jedynie poprzez zwiększanie p, to w pewnym momencie spadek AIC zostaje zatrzymany.
Podobne prezentacje
© 2024 SlidePlayer.pl Inc.
All rights reserved.