Alfred Stach Instytut Geoekologii i Geoinformacji

Slides:

Advertisements

Podobne prezentacje

Badania statystyczne Wykłady 1-2 © Leszek Smolarek.

Advertisements

Leszek Smolarek Akademia Morska w Gdyni 2005/2006

Excel Narzędzia do analizy regresji

Krzywe kalibracyjne Anna Kolczyk gr. B2.

Parametry ogniska sejsmicznego

BUDOWA MODELU EKONOMETRYCZNEGO

Wskaźniki analizy technicznej

Opracowanie zasad tworzenia programów ochrony przed hałasem mieszkańców terenów przygranicznych związanych z funkcjonowaniem dużych przejść granicznych.

ANALIZA STRUKTURY SZEREGU NA PODSTAWIE MIAR STATYSTYCZNYCH

Statystyka w doświadczalnictwie

Statystyka w doświadczalnictwie

Zagadnienie niedokładności w GIS

Ulepszenia metody Eigenfaces

Rozpoznawanie Twarzy i Systemy Biometryczne, 2005/2006

Wykład III Fale materii Zasada nieoznaczoności Heisenberga

Wybrane wiadomości z teorii błędów

Jakość sieci geodezyjnych. Pomiary wykonane z największą starannością, nie dostarczają nam prawdziwej wartości mierzonej wielkości, lecz są zwykle obarczone.

Analiza korelacji.

Niepewności przypadkowe

Program przedmiotu “Metody statystyczne w chemii”

Alfred Stach Instytut Paleogeografii i Geoekologii

Alfred Stach Instytut Paleogeografii i Geoekologii

GEOSTATYSTYKA Wykłady dla III roku Geografii specjalność – geoinformacja Estymacja na podstawie danych jednej zmiennej II Alfred Stach Instytut Paleogeografii.

Alfred Stach Instytut Geoekologii i Geoinformacji

Instytut Badań Czwartorzędu i Geoekologii UAM

Alfred Stach Instytut Geoekologii i Geoinformacji

Alfred Stach Instytut Paleogeografii i Geoekologii

Alfred Stach Instytut Paleogeografii i Geoekologii

Alfred Stach Instytut Paleogeografii i Geoekologii UAM

Alfred Stach Instytut Paleogeografii i Geoekologii UAM

WSTĘP DO GEOGRAFII FIZYCZNEJ SYSTEMOWY OBRAZ PRZYRODY - MODELE

Metody Symulacyjne w Telekomunikacji (MEST) Wykład 6/7: Analiza statystyczna wyników symulacyjnych Dr inż. Halina Tarasiuk

Średnie i miary zmienności

Jednoczynnikowa analiza wariancji (ANOVA)

Weryfikacja modelu hydrodynamicznego i modelu ProDeMo

Metody ilościowe w biznesie Wykład 1

czyli jak analizować zmienność zjawiska w czasie?

Konstrukcja, estymacja parametrów

Seminarium 2 Krzywe kalibracyjne – rodzaje, wyznaczanie, obliczanie wyników Równanie regresji liniowej Współczynnik korelacji.

i jak odczytywać prognozę?

Jak mierzyć i od czego zależy?

Ekonometria. Co wynika z podejścia stochastycznego?

Akademia Górniczo-Hutnicza, Kraków

Modelowanie matematyczne jako podstawa obliczeń naukowo-technicznych:

Dana jest sieć dystrybucji wody w postaci: Ø m- węzłów,

Podstawy statystyki, cz. II

Planowanie badań i analiza wyników

Jacek Wasilewski Politechnika Warszawska Instytut Elektroenergetyki

Treści multimedialne - kodowanie, przetwarzanie, prezentacja Odtwarzanie treści multimedialnych Andrzej Majkowski.

Przedmiot: Ekonometria Temat: Szeregi czasowe. Dekompozycja szeregów

Ekonometryczne modele nieliniowe

Wnioskowanie statystyczne

STATYSTYKA Pochodzenie nazwy:

PODZIAŁ MAP GÓRNICZYCH

* Halina Klimczak Instytut Geodezji i Geoinformatyki Uniwersytet Przyrodniczy we Wrocławiu Prawie wszystko o danych…..

Człowiek – najlepsza inwestycja

WYKŁAD Teoria błędów Katedra Geodezji im. K. Weigla ul. Poznańska 2

Modele nieliniowe sprowadzane do liniowych

STATYSTYKA – kurs podstawowy wykład 11

Estymacja parametryczna dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium Analiz.

Dokładność NMT modelowanie dokładności NMT oszacowanie a priori badanie a posteriori.

Wojciech Bartnik, Jacek Florek Katedra Inżynierii Wodnej, Akademia Rolnicza w Krakowie Charakterystyka parametrów przepływu w potokach górskich i na terenach.

Systemy neuronowo – rozmyte

Statystyka matematyczna

Statystyka matematyczna

* PROCESÓW TECHNOLOGICZNYCH

PODSTAWY STATYSTYKI Wykład udostępniony przez dr hab. Jana Gajewskiego

Jakość sieci geodezyjnych

Korelacja i regresja liniowa

Alfred Stach Instytut Paleogeografii i Geoekologii UAM

Zapis prezentacji:

GEOSTATYSTYKA I ANALIZA PRZESTRZENNA Wykład dla III roku Geografii specjalność - geoinformacja Alfred Stach Instytut Geoekologii i Geoinformacji Wydział Nauk Geograficznych i Geologicznych UAM

Zarys treści Klasyczna statystyka, a struktura otaczającej nas rzeczywistości Miejsce Geostatystyki w Statystyce Przestrzeni (spatial statistics): definicje i klasyfikacje Estymacja i Symulacja – dwie podejścia do zmierzenia się z problemem ograniczonej wiedzy o otaczającym nas środowisku. Przykłady zastosowań Geostatystyki

Podstawa klasycznej statystyki = Niezależność obserwacji - co oznacza, że wyniki kolejnych prób są w 100% losowe

Geograficzne Prawo Toblera (1970) „Everything is related to everything else, but near things are more related than distant things" Obiekty, które w przestrzeni i/lub czasie ze sobą sąsiadują są zazwyczaj bardziej podobne od znajdujących się od siebie dalej. Konsekwencja – próbkowanie (obserwacje/ pomiary) w przestrzeni i w czasie może nie mieć charakteru losowego. Znajomość współrzędnych obiektu/punktu zbadanego może pomagać w bardziej precyzyjnym szacowaniu cech leżących w pobliżu obiektów nie zbadanych.

Dekompozycja serii pomiarowej Składowa deterministyczna Składowa losowa

Analiza przestrzenna Analiza przestrzenna (ang. spatial analysis) to systematyczne wykorzystywanie lokalizacji geograficznej interesujących obiektów jako ważnej zmiennej do opisu, analizy i prognozowania. Zazwyczaj, choć nie jest konieczne, analiza taka uwzględnia również cechy (parametry) tych obiektów. Możliwość wykonywania prostych i wyrafinowanych analiz przestrzennych jest jednym z najważniejszych cech GIS. Analizy te mogą być przeprowadzane na różnym poziomie złożoności. David J. Unwin, Encyclopedia of Geographic Information Science Karen K. Kemp (red.), SAGE Publications, 2008, 392-396

Statystyka przestrzenna Statystyka przestrzenna (ang. spatial statistics) składa się z szerokiego zakresu procedur manipulacji i wizualizacji danych, jak i metod kartograficznych, statystycznych, jakościowych i teoretycznych. Jest ona pewnym podzbiorem analitycznych możliwości GIS, a służy do opisu i modelowania rozkładów przestrzennych, struktur, procesów i relacji. Mimo, że niektóre z metod statystyki przestrzeni są oparte o podobne założenia, a nawet używane są w podobnym celu jak tradycyjne, nieprzestrzenne, metody statystyczne, to jednak wyróżnia się ona ze względu na szereg narzędzi utworzonych specjalnie do wykorzystania z danymi geograficznymi. Statystyka przestrzeni wykorzystuje bowiem relacje powierzchni, kształtu, długości, bliskości, orientacji, sąsiedztwa itp. bezpośrednio w algorytmach obliczeniowych. Lauren M. Scott Arthur Getis, Encyclopedia of Geographic Information Science Karen K. Kemp (red.), SAGE Publications, 2008, 436-440

Statystyka przestrzeni – spatial statistics Zbiór metod analiz danych pomiarowych/obserwacyjnych, które oprócz cech obiektów uwzględniają ich lokalizację w przestrzeni i/lub w czasie

Zarys treści Klasyczna statystyka, a struktura otaczającej nas rzeczywistości Miejsce Geostatystyki w Statystyce Przestrzeni (spatial statistics): definicje i klasyfikacje Estymacja i Symulacja – dwie podejścia do zmierzenia się z problemem ograniczonej wiedzy o otaczającym nas środowisku. Przykłady zastosowań Geostatystyki

Podział Statystyki Przestrzeni ze względu na obiekt analizy Dziedzina Obiekt analizy Cechy obiektów Narzędzia

Co to jest geostatystyka? (Goovaerts 1997 zmienione) Zbiór narzędzi statystycznych uwzględniających w analizie danych ich przestrzenną i czasową lokalizację, a opartych o teorię funkcji losowych. Cztery funkcje geostatystyki: Identyfikacja i modelowanie struktury przestrzennej/czasowej zjawiska Estymacja (szacowanie wartości parametru w nieopróbowanym miejscu i/lub momencie czasu) Symulacja (generowanie alternatywnych obrazów (realizacji), które honorują wyniki pomiarów i strukturę przestrzenną/czasową zjawiska), Optymalizacja próbkowania/sieci pomiarowej minimalizująca koszty przy maksymalizacji ilości i dokładności informacji

Interpretacja założeń teoretycznych! W geostatystyce traktujemy wyniki pomiarów jako odbicie realizacji funkcji losowych. Prawdopodobieństwa nie istnieją obiektywnie w Naturze, tylko w naszych modelach ją opisujących. Natura jest deterministyczna, nie losowa. Używamy modeli stochastycznych bo są analitycznie użyteczne – są furtką wyjścia w sytuacji naszej bezradności wobec skomplikowania przyrody

Zarys treści Klasyczna statystyka, a struktura otaczającej nas rzeczywistości Miejsce Geostatystyki w Statystyce Przestrzeni (spatial statistics): definicje i klasyfikacje Estymacja i Symulacja – dwie podejścia do zmierzenia się z problemem ograniczonej wiedzy o otaczającym nas środowisku. Przykłady zastosowań Geostatystyki

Przykład na początek: kabel telekomunikacyjny na dnie cieśniny gibraltarskiej (Alfaro 1979)

Zarys treści Klasyczna statystyka, a struktura otaczającej nas rzeczywistości Miejsce Geostatystyki w Statystyce Przestrzeni (spatial statistics): definicje i klasyfikacje Estymacja i Symulacja – dwie podejścia do zmierzenia się z problemem ograniczonej wiedzy o otaczającym nas środowisku. Przykłady zastosowań Geostatystyki

Typowe zastosowania geostatystyki Identyfikacja struktury zmienności przestrzennej i/lub czasowej jakiejś cechy (zjawiska) Szacunek wartości jakiejś cechy ilościowej w nieopróbowanym punkcie w przestrzeni i/lub momencie czasu Szacunek wartości średniej jakiejś cechy ilościowej dla określonej powierzchni i/lub okresu czasu Ocena błędu szacunku wartości punktowej i/lub obszarowej cechy ilościowej Szacunek wartości ekstremalnych cechy możliwych w danym punkcie, czy obszarze Prawdopodobieństwo przynależności danego punktu lub obszaru do określonej kategorii Prawdopodobieństwo przekroczenia w danym punkcie lub obszarze wartości progowej cechy ilościowej Filtrowanie składowych przestrzennych i/lub czasowych cechy (zjawiska); separacja tzw. „szumu” (składowej losowej) Optymalizacja próbkowania i/lub sieci monitorigowych Inne

Przykład zastosowań Spatial Interpolation Comparison (SIC-97) Alfred Stach Instytut Badań Czwartorzędu i Geoekologii UAM

Problem: Opady atmosferyczne są głównym zjawiskiem powodującym „wypadanie” z atmosfery i depozycję na powierzchni terenu różnego typu zanieczyszczeń, w tym także radioaktywnych Sieć punktowych pomiarów opadów atmosferycznych jest znacznie gęstsza od sieci pomiarów zanieczyszczeń Szybka i wiarygodna ocena obszarowa opadów w trakcie przemieszania się chmury zanieczyszczeń (przykład Czernobyla) umożliwia identyfikację obszarów potencjalnego skażenia, i natychmiastowe podjęcie stosownych działań Interpolacja dobowych wartości opadów jest ze względu na ich nieciągłość i silne uzależnienie od warunków lokalnych (a w tym topografii terenu) bardzo trudna i obarczona dużymi błędami.

Cel: Przetestowanie na jednym zbiorze danych opadowych estymacji przestrzennych wykonanych za pomocą różnych metod interpolacyjnych pod kątem: dokładności, przydatności do rutynowych ocen zagrożeń skażeniami (szybkość obliczeń, stopień komplikacji procedury, możliwość automatyzacji).

Dane: Uczestnicy SIC-97 otrzymali: Dane sum dobowych opadów (wyrażone w jednostkach 1/10 mm) z 8 maja 1986 roku ze 100 punktów pomiarowych zlokalizowanych na obszarze Szwajcarii. Zostały one losowo wybrane ze zbioru 467 punktów. Współrzędne lokalizacji pozostałych 367 punktów. Cyfrowy model rzeźby terenu (DEM) o rozdzielczości 11 km, wraz z przebiegiem granicy Szwajcarii definiującej obszar analizy.

Dane pomiarowe (symbole proporcjonalne do wysokości opadów) ze 100 punktów na tle Cyfrowego Modelu Rzeźby (DEM)

Charakterystyka statystyczna 100 podstawowych pomiarów

Zadanie: Dokonać na podstawie 100 podanych danych szacunków opadów w 367 pozostałych punktach. Opisać szczegółowo metodykę obliczeń. Podać charakterystyki jakości uzyskanych estymacji: minimum, maksimum, średnią, medianę i odchylenie standardowe 367 estymowanych sum opadów, pierwiastek średniego błędu kwadratowego, stopień dewiacji (obciążenia) błędów, średnie względne i absolutne błędy, korelację błędów, Wykres korelacji wartości estymowanych z rzeczywistymi, Wskazać lokalizację punktów pomiarowych z 10 największych i 10 najmniejszych sumami opadu. Wykonać mapę izarytmiczną z izoliniami estymowanych wartości.

Dane pomiarowe (symbole proporcjonalne do wysokości opadów) i lokalizacja punktów estymacji

Charakterystyka statystyczna 367 pomiarów, które miały zostać oszacowane

Charakterystyka statystyczna wszystkich 467 pomiarów

Przykład rozkładu błędów jednej z estymacji wykonanych w ramach SIC-97

Przykłady interpolacji opadów z 8 maja 1986 roku na terenie Szwajcarii wykonanych w ramach SIC-97

Podsumowanie: Wybór metody estymacji zależy od: charakteru danych pomiarowych, zagęszczenia i rozkładu przestrzennego punktów pomiarowych, skali zróżnicowania przestrzennego analizowanej zmiennej, wstępnych założeń co do natury analizowanego zjawiska, celu opracowania (opis, kwantyfikacja, identyfikacja ekstremów itp.), pożądanego poziomu dokładności, pracochłonności obliczeń, wiedzy i doświadczenia badacza.

Podsumowanie: W SIC-97 wzięło udział 48 uczestników. W końcowym zestawieniu uwzględniono 22 prace spełniające wszystkie wymogi regulaminowe. Uczestnicy SIC-97 zastosowali 36 (!!!) różnych metod interpolacyjnych do rozwiązania postawionego przed nimi problemu.

Podsumowanie:

Pod-sumo-wanie: Ocena na oko

Podsumowanie: Ocena na oko

Podsumowanie: Najlepszą metodą interpolacji w SIC-97 okazała się multiquadratic RBF (Radial Basis Function) Niewiele gorsze okazały się różne geostatystyczne metody estymacji, które dominowały ilościowo w całej porównywanej stawce. Metody geostatystyczne jako grupa okazały się generalnie bardzo dobre lub dobre Nie zawsze stosowanie wyrafinowanych metod numerycznych daje wyniki lepsze niż ocena na oko dokonana przez eksperta. Zasadnicze różnice widoczne są dopiero przy bardzo dużej ilości danych, których człowiek nie jest w stanie ogarnąć.

Źródło: DUBOIS, G., MALCZEWSKI, J., M. DE CORT, M., (eds.) 2003: Mapping radioactivity in the environment. Spatial Interpolation Comparison 97. European Commision, Joint Research Centre, EUR 20667 EN, 1-268.

Przykład zastosowań Budowa tunelu pod Kanałem La Manche Alfred Stach Instytut Badań Czwartorzędu i Geoekologii UAM

TUNEL

Najważniejsze dane: Lokalizacja: Folkestone, Anglia, i Sangatte, Francja Data zakończenia budowy: 1994 Koszt: 21 miliardów dolarów Długość: ok. 49,9 km Przeznaczenie: transport kolejowy Charakter: podwodny Materiał konstrukcyjny: stal, beton Budowniczy: firma Transmanche Link Engineering

Geostatystyka a Tunel – przykład idealny praktycznych zastosowań: Waga problemu proporcjonalna do kosztów budowy – czyli ponad 21 mld. dolarów Zagadnienie stosunkowo łatwe do zrozumienia Rzadka możliwość porównania geostatystycznych estymacji z rzeczywistością

Usytuowanie Tunelu na tle przekroju geologicznej dna Kanału najkorzystniejszą geotechnicznie warstwą jest cenomański margiel kredowy (Chalk Marl) zbudowany z miękkich, homogenicznych i raczej dla wody nieprzepuszczalnych skał, jest on przykryty szarą kredą (Grey Chalk) – bardzo porowatą warstwą mocno spękanych skał, podłoże stanowił Gault (Gault Clay) o bardzo niekorzystnych właściwościach geotechnicznych.

Podstawowe ograniczenia techniczne i geologiczne, które musieli uwzględniać budowniczowie Tunelu Na planowanej trasie tunelu nie można było, ze względu na niebezpieczeństwo zalania wodą morską, wykonywać wierceń Tunel musiał znajdować się na głębokości co najmniej 20 m poniżej dna morskiego, aby zachowana została mechaniczna wytrzymałość skał nad nim leżących Tunel nie można było, ze względu na konstrukcję maszyn wiertniczych, wiercić poniżej 100 m pod poziomem dna morskiego Uskoki znajdujące się na trasie Tunelu powinny być przecinane pod kątem jak najbardziej zbliżonym do prostego Spadki i krzywizna Tunelu nie mogły przekraczać ograniczeń narzucanych przez szybką kolej I warunek najważniejszy – Tunel musiał być wywiercony w skałach margla kredowego (Chalk Marl)

PROBLEM! Jak na dystansie 50 km wywiercić 9 metrowe otwory w środku warstwy skalnej o miąższości 30 m, która na domiar złego nie zalega horyzontalnie i jest poprzecinana uskokami, przy braku precyzyjnych informacji geologicznych i geodezyjnych?

Dane jakimi dysponowali specjaliści od estymacji geostatystycznych 1500 km ciągłych (pomiary co 3 m) profili batymetrycznych i sejsmicznych refleksyjnych, a w tym: 5 podłużnych profili sejsmicznych, co 25 m po stronie francuskiej, i co 250 m po stronie angielskiej, 83 poprzeczne profile sejsmiczne wykonywane w różnych odstępach od 250 do 1000 m. 10 profili wierceń wykonanych w pobliżu trasy planowanego Tunelu w roku 1986 90 profili starszych wierceń z tego obszaru

Podstawowy problem interpretacji danych z profilowań sejsmicznych Prędkość rozchodzenia się fal sejsmicznych jest uzależniona od szeregu właściwości fizycznych skał Właściwości te w strefie budowy Tunelu były bardzo zmienne zarówno w poziomie, jak i w pionie Przy interpretacji posługiwano się średnimi wartościami prędkości fal dla poszczególnych typów skał Tak więc ocena głębokości zalegania poszczególnych warstw skalnych była obarczona zmiennym i nie znanym błędem

Mapa izolinii (w m poniżej poziomu morza) szacowanego stropu zalegania iłu Gault po stronie francuskiej Kanału La Manche

Mapa izolinii (w m) błędu oceny głębokości zalegania stropu iłu Gault po stronie francuskiej Kanału La Manche

Oszacowany metodą krigingu przekrój podłużny wzdłuż południowej części Tunelu (przewyższenie skali pionowej 20 )

Nowe dane uzyskane w trakcie budowy W trakcie wiercenia tunelu serwisowego wykonano 85 podwójnych sondowań głębokości zalegania stropu iłu Gault Wykonano je w celu oceny dokładności estymacji, i w razie potrzeby – rewizji modelu geometrii tunelu, gdyby błędy były zbyt duże i zagroziły bezpieczeństwu budowy

Strona francuska (13 km) Strona angielska (15 km) Ilość par wierceń 54 31 Minimalna różnica -5,00 m -7,00 m Maksymalna różnica +3,90 m +8,00 m Średnia różnica +0,48 m +1,70 m Odchylenie standardowe różnic 2,02 m 3,40 m Odchylenie standardowe krigingu 2,85 m 2,55 Oszacowana ufność estymacji geostatystycznej w porównaniu z rzeczywistą rzędną stropu iłu Gault

Wielkość i źródła błędów Po angielskiej stronie porównanie szacowanej wielkości błędów z rzeczywistością wykazuje dobrą zgodność dla pierwszych 20 otworów. Przy kolejnych 10 pojawia się systematyczny błąd (średnia różnica 5,6 m) Przyczyny tych błędów: strefa gdzie gęstość profili sejsmicznych i wierceń była najniższa, pomiędzy marglem kredowym, a iłem Gault pojawiła się cienka (3,5 m) warstwa kredy Tourtia, o odmiennej prędkości przewodzenia fal sejsmicznych, dodatkowe błędy kalibracji prędkości fal sejsmicznych związane z niedokładnościami lokalizacji starych (z lat 1964-65) wierceń geofizycznych w strefie o dużym upadzie warstw

Wielkość i źródła błędów Po stronie francuskiej błędy oceny mieściły się w założonych granicach. Wynikało to z większej ilości wyjściowych danych geologicznych, a także uwzględnienia w opracowaniu geostatystycznym braku precyzji ich lokalizacji Pomiary wykonywane w czasie budowy Tunelu wykazały dobrą zgodność modelu geostatystycznego z rzeczywistością. Różnice były konsekwencją systematycznych błędów danych geologicznych w miejscach rzadko opróbowanych Główny cel opracowania – uniknięcie penetracji iłu Gault przez maszyny wiertnicze – został osiągnięty. Po stronie francuskiej nie wystąpiło to ani razu, po angielskiej – dwukrotnie, lecz było to przewidziane.

Oficjalne otwarcie Tunelu 6 maja 1994 roku

Źródło: Chilès, J.-P., Delfiner, P., 1999: Geostatistics. Modeling spatial uncertainty. J. Wiley, 1-695. (str. 215-224)