GEOSTATYSTYKA I ANALIZA PRZESTRZENNA Wykład dla III roku Geografii specjalność - geoinformacja Alfred Stach Instytut Geoekologii i Geoinformacji Wydział Nauk Geograficznych i Geologicznych UAM
Zarys treści Klasyczna statystyka, a struktura otaczającej nas rzeczywistości Miejsce Geostatystyki w Statystyce Przestrzeni (spatial statistics): definicje i klasyfikacje Estymacja i Symulacja – dwie podejścia do zmierzenia się z problemem ograniczonej wiedzy o otaczającym nas środowisku. Przykłady zastosowań Geostatystyki
Podstawa klasycznej statystyki = Niezależność obserwacji - co oznacza, że wyniki kolejnych prób są w 100% losowe
Geograficzne Prawo Toblera (1970) „Everything is related to everything else, but near things are more related than distant things" Obiekty, które w przestrzeni i/lub czasie ze sobą sąsiadują są zazwyczaj bardziej podobne od znajdujących się od siebie dalej. Konsekwencja – próbkowanie (obserwacje/ pomiary) w przestrzeni i w czasie może nie mieć charakteru losowego. Znajomość współrzędnych obiektu/punktu zbadanego może pomagać w bardziej precyzyjnym szacowaniu cech leżących w pobliżu obiektów nie zbadanych.
Dekompozycja serii pomiarowej Składowa deterministyczna Składowa losowa
Analiza przestrzenna Analiza przestrzenna (ang. spatial analysis) to systematyczne wykorzystywanie lokalizacji geograficznej interesujących obiektów jako ważnej zmiennej do opisu, analizy i prognozowania. Zazwyczaj, choć nie jest konieczne, analiza taka uwzględnia również cechy (parametry) tych obiektów. Możliwość wykonywania prostych i wyrafinowanych analiz przestrzennych jest jednym z najważniejszych cech GIS. Analizy te mogą być przeprowadzane na różnym poziomie złożoności. David J. Unwin, Encyclopedia of Geographic Information Science Karen K. Kemp (red.), SAGE Publications, 2008, 392-396
Statystyka przestrzenna Statystyka przestrzenna (ang. spatial statistics) składa się z szerokiego zakresu procedur manipulacji i wizualizacji danych, jak i metod kartograficznych, statystycznych, jakościowych i teoretycznych. Jest ona pewnym podzbiorem analitycznych możliwości GIS, a służy do opisu i modelowania rozkładów przestrzennych, struktur, procesów i relacji. Mimo, że niektóre z metod statystyki przestrzeni są oparte o podobne założenia, a nawet używane są w podobnym celu jak tradycyjne, nieprzestrzenne, metody statystyczne, to jednak wyróżnia się ona ze względu na szereg narzędzi utworzonych specjalnie do wykorzystania z danymi geograficznymi. Statystyka przestrzeni wykorzystuje bowiem relacje powierzchni, kształtu, długości, bliskości, orientacji, sąsiedztwa itp. bezpośrednio w algorytmach obliczeniowych. Lauren M. Scott Arthur Getis, Encyclopedia of Geographic Information Science Karen K. Kemp (red.), SAGE Publications, 2008, 436-440
Statystyka przestrzeni – spatial statistics Zbiór metod analiz danych pomiarowych/obserwacyjnych, które oprócz cech obiektów uwzględniają ich lokalizację w przestrzeni i/lub w czasie
Zarys treści Klasyczna statystyka, a struktura otaczającej nas rzeczywistości Miejsce Geostatystyki w Statystyce Przestrzeni (spatial statistics): definicje i klasyfikacje Estymacja i Symulacja – dwie podejścia do zmierzenia się z problemem ograniczonej wiedzy o otaczającym nas środowisku. Przykłady zastosowań Geostatystyki
Podział Statystyki Przestrzeni ze względu na obiekt analizy Dziedzina Obiekt analizy Cechy obiektów Narzędzia
Co to jest geostatystyka? (Goovaerts 1997 zmienione) Zbiór narzędzi statystycznych uwzględniających w analizie danych ich przestrzenną i czasową lokalizację, a opartych o teorię funkcji losowych. Cztery funkcje geostatystyki: Identyfikacja i modelowanie struktury przestrzennej/czasowej zjawiska Estymacja (szacowanie wartości parametru w nieopróbowanym miejscu i/lub momencie czasu) Symulacja (generowanie alternatywnych obrazów (realizacji), które honorują wyniki pomiarów i strukturę przestrzenną/czasową zjawiska), Optymalizacja próbkowania/sieci pomiarowej minimalizująca koszty przy maksymalizacji ilości i dokładności informacji
Interpretacja założeń teoretycznych! W geostatystyce traktujemy wyniki pomiarów jako odbicie realizacji funkcji losowych. Prawdopodobieństwa nie istnieją obiektywnie w Naturze, tylko w naszych modelach ją opisujących. Natura jest deterministyczna, nie losowa. Używamy modeli stochastycznych bo są analitycznie użyteczne – są furtką wyjścia w sytuacji naszej bezradności wobec skomplikowania przyrody
Zarys treści Klasyczna statystyka, a struktura otaczającej nas rzeczywistości Miejsce Geostatystyki w Statystyce Przestrzeni (spatial statistics): definicje i klasyfikacje Estymacja i Symulacja – dwie podejścia do zmierzenia się z problemem ograniczonej wiedzy o otaczającym nas środowisku. Przykłady zastosowań Geostatystyki
Przykład na początek: kabel telekomunikacyjny na dnie cieśniny gibraltarskiej (Alfaro 1979)
Zarys treści Klasyczna statystyka, a struktura otaczającej nas rzeczywistości Miejsce Geostatystyki w Statystyce Przestrzeni (spatial statistics): definicje i klasyfikacje Estymacja i Symulacja – dwie podejścia do zmierzenia się z problemem ograniczonej wiedzy o otaczającym nas środowisku. Przykłady zastosowań Geostatystyki
Typowe zastosowania geostatystyki Identyfikacja struktury zmienności przestrzennej i/lub czasowej jakiejś cechy (zjawiska) Szacunek wartości jakiejś cechy ilościowej w nieopróbowanym punkcie w przestrzeni i/lub momencie czasu Szacunek wartości średniej jakiejś cechy ilościowej dla określonej powierzchni i/lub okresu czasu Ocena błędu szacunku wartości punktowej i/lub obszarowej cechy ilościowej Szacunek wartości ekstremalnych cechy możliwych w danym punkcie, czy obszarze Prawdopodobieństwo przynależności danego punktu lub obszaru do określonej kategorii Prawdopodobieństwo przekroczenia w danym punkcie lub obszarze wartości progowej cechy ilościowej Filtrowanie składowych przestrzennych i/lub czasowych cechy (zjawiska); separacja tzw. „szumu” (składowej losowej) Optymalizacja próbkowania i/lub sieci monitorigowych Inne
Przykład zastosowań Spatial Interpolation Comparison (SIC-97) Alfred Stach Instytut Badań Czwartorzędu i Geoekologii UAM
Problem: Opady atmosferyczne są głównym zjawiskiem powodującym „wypadanie” z atmosfery i depozycję na powierzchni terenu różnego typu zanieczyszczeń, w tym także radioaktywnych Sieć punktowych pomiarów opadów atmosferycznych jest znacznie gęstsza od sieci pomiarów zanieczyszczeń Szybka i wiarygodna ocena obszarowa opadów w trakcie przemieszania się chmury zanieczyszczeń (przykład Czernobyla) umożliwia identyfikację obszarów potencjalnego skażenia, i natychmiastowe podjęcie stosownych działań Interpolacja dobowych wartości opadów jest ze względu na ich nieciągłość i silne uzależnienie od warunków lokalnych (a w tym topografii terenu) bardzo trudna i obarczona dużymi błędami.
Cel: Przetestowanie na jednym zbiorze danych opadowych estymacji przestrzennych wykonanych za pomocą różnych metod interpolacyjnych pod kątem: dokładności, przydatności do rutynowych ocen zagrożeń skażeniami (szybkość obliczeń, stopień komplikacji procedury, możliwość automatyzacji).
Dane: Uczestnicy SIC-97 otrzymali: Dane sum dobowych opadów (wyrażone w jednostkach 1/10 mm) z 8 maja 1986 roku ze 100 punktów pomiarowych zlokalizowanych na obszarze Szwajcarii. Zostały one losowo wybrane ze zbioru 467 punktów. Współrzędne lokalizacji pozostałych 367 punktów. Cyfrowy model rzeźby terenu (DEM) o rozdzielczości 11 km, wraz z przebiegiem granicy Szwajcarii definiującej obszar analizy.
Dane pomiarowe (symbole proporcjonalne do wysokości opadów) ze 100 punktów na tle Cyfrowego Modelu Rzeźby (DEM)
Charakterystyka statystyczna 100 podstawowych pomiarów
Zadanie: Dokonać na podstawie 100 podanych danych szacunków opadów w 367 pozostałych punktach. Opisać szczegółowo metodykę obliczeń. Podać charakterystyki jakości uzyskanych estymacji: minimum, maksimum, średnią, medianę i odchylenie standardowe 367 estymowanych sum opadów, pierwiastek średniego błędu kwadratowego, stopień dewiacji (obciążenia) błędów, średnie względne i absolutne błędy, korelację błędów, Wykres korelacji wartości estymowanych z rzeczywistymi, Wskazać lokalizację punktów pomiarowych z 10 największych i 10 najmniejszych sumami opadu. Wykonać mapę izarytmiczną z izoliniami estymowanych wartości.
Dane pomiarowe (symbole proporcjonalne do wysokości opadów) i lokalizacja punktów estymacji
Charakterystyka statystyczna 367 pomiarów, które miały zostać oszacowane
Charakterystyka statystyczna wszystkich 467 pomiarów
Przykład rozkładu błędów jednej z estymacji wykonanych w ramach SIC-97
Przykłady interpolacji opadów z 8 maja 1986 roku na terenie Szwajcarii wykonanych w ramach SIC-97
Podsumowanie: Wybór metody estymacji zależy od: charakteru danych pomiarowych, zagęszczenia i rozkładu przestrzennego punktów pomiarowych, skali zróżnicowania przestrzennego analizowanej zmiennej, wstępnych założeń co do natury analizowanego zjawiska, celu opracowania (opis, kwantyfikacja, identyfikacja ekstremów itp.), pożądanego poziomu dokładności, pracochłonności obliczeń, wiedzy i doświadczenia badacza.
Podsumowanie: W SIC-97 wzięło udział 48 uczestników. W końcowym zestawieniu uwzględniono 22 prace spełniające wszystkie wymogi regulaminowe. Uczestnicy SIC-97 zastosowali 36 (!!!) różnych metod interpolacyjnych do rozwiązania postawionego przed nimi problemu.
Podsumowanie:
Pod-sumo-wanie: Ocena na oko
Podsumowanie: Ocena na oko
Podsumowanie: Najlepszą metodą interpolacji w SIC-97 okazała się multiquadratic RBF (Radial Basis Function) Niewiele gorsze okazały się różne geostatystyczne metody estymacji, które dominowały ilościowo w całej porównywanej stawce. Metody geostatystyczne jako grupa okazały się generalnie bardzo dobre lub dobre Nie zawsze stosowanie wyrafinowanych metod numerycznych daje wyniki lepsze niż ocena na oko dokonana przez eksperta. Zasadnicze różnice widoczne są dopiero przy bardzo dużej ilości danych, których człowiek nie jest w stanie ogarnąć.
Źródło: DUBOIS, G., MALCZEWSKI, J., M. DE CORT, M., (eds.) 2003: Mapping radioactivity in the environment. Spatial Interpolation Comparison 97. European Commision, Joint Research Centre, EUR 20667 EN, 1-268.
Przykład zastosowań Budowa tunelu pod Kanałem La Manche Alfred Stach Instytut Badań Czwartorzędu i Geoekologii UAM
TUNEL
Najważniejsze dane: Lokalizacja: Folkestone, Anglia, i Sangatte, Francja Data zakończenia budowy: 1994 Koszt: 21 miliardów dolarów Długość: ok. 49,9 km Przeznaczenie: transport kolejowy Charakter: podwodny Materiał konstrukcyjny: stal, beton Budowniczy: firma Transmanche Link Engineering
Geostatystyka a Tunel – przykład idealny praktycznych zastosowań: Waga problemu proporcjonalna do kosztów budowy – czyli ponad 21 mld. dolarów Zagadnienie stosunkowo łatwe do zrozumienia Rzadka możliwość porównania geostatystycznych estymacji z rzeczywistością
Usytuowanie Tunelu na tle przekroju geologicznej dna Kanału najkorzystniejszą geotechnicznie warstwą jest cenomański margiel kredowy (Chalk Marl) zbudowany z miękkich, homogenicznych i raczej dla wody nieprzepuszczalnych skał, jest on przykryty szarą kredą (Grey Chalk) – bardzo porowatą warstwą mocno spękanych skał, podłoże stanowił Gault (Gault Clay) o bardzo niekorzystnych właściwościach geotechnicznych.
Podstawowe ograniczenia techniczne i geologiczne, które musieli uwzględniać budowniczowie Tunelu Na planowanej trasie tunelu nie można było, ze względu na niebezpieczeństwo zalania wodą morską, wykonywać wierceń Tunel musiał znajdować się na głębokości co najmniej 20 m poniżej dna morskiego, aby zachowana została mechaniczna wytrzymałość skał nad nim leżących Tunel nie można było, ze względu na konstrukcję maszyn wiertniczych, wiercić poniżej 100 m pod poziomem dna morskiego Uskoki znajdujące się na trasie Tunelu powinny być przecinane pod kątem jak najbardziej zbliżonym do prostego Spadki i krzywizna Tunelu nie mogły przekraczać ograniczeń narzucanych przez szybką kolej I warunek najważniejszy – Tunel musiał być wywiercony w skałach margla kredowego (Chalk Marl)
PROBLEM! Jak na dystansie 50 km wywiercić 9 metrowe otwory w środku warstwy skalnej o miąższości 30 m, która na domiar złego nie zalega horyzontalnie i jest poprzecinana uskokami, przy braku precyzyjnych informacji geologicznych i geodezyjnych?
Dane jakimi dysponowali specjaliści od estymacji geostatystycznych 1500 km ciągłych (pomiary co 3 m) profili batymetrycznych i sejsmicznych refleksyjnych, a w tym: 5 podłużnych profili sejsmicznych, co 25 m po stronie francuskiej, i co 250 m po stronie angielskiej, 83 poprzeczne profile sejsmiczne wykonywane w różnych odstępach od 250 do 1000 m. 10 profili wierceń wykonanych w pobliżu trasy planowanego Tunelu w roku 1986 90 profili starszych wierceń z tego obszaru
Podstawowy problem interpretacji danych z profilowań sejsmicznych Prędkość rozchodzenia się fal sejsmicznych jest uzależniona od szeregu właściwości fizycznych skał Właściwości te w strefie budowy Tunelu były bardzo zmienne zarówno w poziomie, jak i w pionie Przy interpretacji posługiwano się średnimi wartościami prędkości fal dla poszczególnych typów skał Tak więc ocena głębokości zalegania poszczególnych warstw skalnych była obarczona zmiennym i nie znanym błędem
Mapa izolinii (w m poniżej poziomu morza) szacowanego stropu zalegania iłu Gault po stronie francuskiej Kanału La Manche
Mapa izolinii (w m) błędu oceny głębokości zalegania stropu iłu Gault po stronie francuskiej Kanału La Manche
Oszacowany metodą krigingu przekrój podłużny wzdłuż południowej części Tunelu (przewyższenie skali pionowej 20 )
Nowe dane uzyskane w trakcie budowy W trakcie wiercenia tunelu serwisowego wykonano 85 podwójnych sondowań głębokości zalegania stropu iłu Gault Wykonano je w celu oceny dokładności estymacji, i w razie potrzeby – rewizji modelu geometrii tunelu, gdyby błędy były zbyt duże i zagroziły bezpieczeństwu budowy
Strona francuska (13 km) Strona angielska (15 km) Ilość par wierceń 54 31 Minimalna różnica -5,00 m -7,00 m Maksymalna różnica +3,90 m +8,00 m Średnia różnica +0,48 m +1,70 m Odchylenie standardowe różnic 2,02 m 3,40 m Odchylenie standardowe krigingu 2,85 m 2,55 Oszacowana ufność estymacji geostatystycznej w porównaniu z rzeczywistą rzędną stropu iłu Gault
Wielkość i źródła błędów Po angielskiej stronie porównanie szacowanej wielkości błędów z rzeczywistością wykazuje dobrą zgodność dla pierwszych 20 otworów. Przy kolejnych 10 pojawia się systematyczny błąd (średnia różnica 5,6 m) Przyczyny tych błędów: strefa gdzie gęstość profili sejsmicznych i wierceń była najniższa, pomiędzy marglem kredowym, a iłem Gault pojawiła się cienka (3,5 m) warstwa kredy Tourtia, o odmiennej prędkości przewodzenia fal sejsmicznych, dodatkowe błędy kalibracji prędkości fal sejsmicznych związane z niedokładnościami lokalizacji starych (z lat 1964-65) wierceń geofizycznych w strefie o dużym upadzie warstw
Wielkość i źródła błędów Po stronie francuskiej błędy oceny mieściły się w założonych granicach. Wynikało to z większej ilości wyjściowych danych geologicznych, a także uwzględnienia w opracowaniu geostatystycznym braku precyzji ich lokalizacji Pomiary wykonywane w czasie budowy Tunelu wykazały dobrą zgodność modelu geostatystycznego z rzeczywistością. Różnice były konsekwencją systematycznych błędów danych geologicznych w miejscach rzadko opróbowanych Główny cel opracowania – uniknięcie penetracji iłu Gault przez maszyny wiertnicze – został osiągnięty. Po stronie francuskiej nie wystąpiło to ani razu, po angielskiej – dwukrotnie, lecz było to przewidziane.
Oficjalne otwarcie Tunelu 6 maja 1994 roku
Źródło: Chilès, J.-P., Delfiner, P., 1999: Geostatistics. Modeling spatial uncertainty. J. Wiley, 1-695. (str. 215-224)