Instytut Badań Czwartorzędu i Geoekologii UAM

Slides:



Advertisements
Podobne prezentacje
Regresja i korelacja materiały dydaktyczne.
Advertisements

Badania statystyczne Wykłady 1-2 © Leszek Smolarek.
Ocena dokładności i trafności prognoz
Statystyczna kontrola jakości badań laboratoryjnych wg: W.Gernand Podstawy kontroli jakości badań laboratoryjnych.
IV Tutorial z Metod Obliczeniowych
Analiza wariancji jednoczynnikowa
Skale pomiarowe – BARDZO WAŻNE
PODSUMOWANIE WIADOMOŚCI ZE STATYSTYKI
Jak mierzyć asymetrię zjawiska?
Jak mierzyć zróżnicowanie zjawiska? Wykład 4. Miary jednej cechy Miary poziomu Miary dyspersji (zmienności, zróżnicowania, rozproszenia) Miary asymetrii.
ANALIZA STRUKTURY SZEREGU NA PODSTAWIE MIAR STATYSTYCZNYCH
MIARY ZMIENNOŚCI Główne (wywołujące zmienność systematyczną)
Krzysztof Jurek Statystyka Spotkanie 4. Miary zmienności m ó wią na ile wyniki są rozproszone na konkretne jednostki, pokazują na ile wyniki odbiegają
Statystyka w doświadczalnictwie
Rozpoznawanie Twarzy i Systemy Biometryczne, 2005/2006
Podstawowe pojęcia prognozowania i symulacji na podstawie modeli ekonometrycznych Przewidywaniem nazywać będziemy wnioskowanie o zdarzeniach nieznanych.
Niepewności przypadkowe
Proces analizy i rozpoznawania
Prognozowanie na podstawie modelu ekonometrycznego
Alfred Stach Instytut Paleogeografii i Geoekologii
Alfred Stach Instytut Paleogeografii i Geoekologii
GEOSTATYSTYKA Wykłady dla III roku Geografii specjalność – geoinformacja Estymacja na podstawie danych jednej zmiennej I Alfred Stach Instytut Paleogeografii.
Interpolacja danych przestrzennych w GIS
GEOSTATYSTYKA Wykłady dla III roku Geografii specjalność – geoinformacja Estymacja na podstawie danych jednej zmiennej II Alfred Stach Instytut Paleogeografii.
Alfred Stach Instytut Geoekologii i Geoinformacji
Alfred Stach Instytut Geoekologii i Geoinformacji
Alfred Stach Instytut Geoekologii i Geoinformacji
Alfred Stach Instytut Paleogeografii i Geoekologii
Alfred Stach Instytut Paleogeografii i Geoekologii UAM
Dopasowanie modelu autoregresji i predykcja stanów wody w Odrze (posterunek wodowskazowy Trestno) Tomasz Niedzielski.
Korelacje, regresja liniowa
Rozkład normalny Cecha posiada rozkład normalny jeśli na jej wielkość ma wpływ wiele niezależnych czynników, a wpływ każdego z nich nie jest zbyt duży.
Średnie i miary zmienności
AGH Wydział Zarządzania
Metody ilościowe w biznesie Wykład 1
Konstrukcja, estymacja parametrów
Elementy Rachunku Prawdopodobieństwa i Statystyki
na podstawie materiału – test z użyciem komputerowo generowanych prób
Irena Woroniecka EKONOMIA MENEDŻERSKA - dodatek do W2
Elementy Rachunku Prawdopodobieństwa i Statystyki
Akademia Górniczo-Hutnicza, Kraków
Elementy Rachunku Prawdopodobieństwa i Statystyki
Statystyka ©M.
Podstawy statystyki, cz. II
Ekonometria stosowana
Regresja wieloraka.
Wnioskowanie statystyczne
STATYSTYKA Pochodzenie nazwy:
Statystyka medyczna Piotr Kozłowski
Statystyczna analiza danych w praktyce
Jak mierzyć asymetrię zjawiska? Wykład 5. Miary jednej cechy  Miary poziomu  Miary dyspersji (zmienności, zróżnicowania, rozproszenia)  Miary asymetrii.
Statystyczna analiza danych
Statystyczna analiza danych
Model ekonometryczny Jacek Szanduła.
Statystyczna analiza danych
Model trendu liniowego
STATYSTYKA – kurs podstawowy wykład 5 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
1 Proces analizy i rozpoznawania. 2 Jak przygotować dwie klasy obiektów?
Modele nieliniowe sprowadzane do liniowych
STATYSTYKA – kurs podstawowy wykład 11
Estymacja parametryczna dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium Analiz.
Dokładność NMT modelowanie dokładności NMT oszacowanie a priori badanie a posteriori.
1.problem próbkowania (sampling problem) dobór charakterystycznych punktów powierzchni w celu uzyskania najlepszego efektu przy minimalizacji ilości danych.
Niepewności pomiarów. Błąd pomiaru - różnica między wynikiem pomiaru a wartością mierzonej wielkości fizycznej. Bywa też nazywany błędem bezwzględnym.
Jak mierzyć zróżnicowanie zjawiska?
Statystyka matematyczna
59 Konferencja Naukowa KILiW PAN oraz Komitetu Nauki PZITB
Regresja wieloraka – bada wpływ wielu zmiennych objaśniających (niezależnych) na jedną zmienną objaśnianą (zależą)
MIARY STATYSTYCZNE Warunki egzaminu.
Alfred Stach Instytut Paleogeografii i Geoekologii UAM
Zapis prezentacji:

Instytut Badań Czwartorzędu i Geoekologii UAM WSTĘPNA OCENA PRZYDATNOŚCI WYBRANYCH ALGORYTMÓW PRZESTRZENNEJ ESTYMACJI MIESIĘCZNYCH I ROCZNYCH SUM OPADÓW NA OBSZARZE POLSKI Alfred Stach Instytut Badań Czwartorzędu i Geoekologii UAM Jan Tamulewicz Instytut Geografii Fizycznej i Kształtowania Środowiska Przyrodniczego UAM

Zarys treści Problem Cel pracy Analizowane dane Metody Wyniki Wnioski

Problem Precyzyjna estymacja punktowych i obszarowych charakterystyk opadów atmosferycznych jest bardzo istotna zarówno w badaniach naukowych, jak i w różnych aspektach gospodarki wodnej i rolnictwa. Powszechna dostępność komputerowych implementacji różnych algorytmów estymacji przestrzennej (=interpolacji) stwarza olbrzymie szanse, ale także liczne obawy. możliwa jest szybka i obiektywna – w sensie powtarzalności i niezależności od tzw. doświadczenia badacza – analiza wielkich zbiorów danych powszechne stosowanie narzędzi matematyczno-statystycznych bez gruntownej znajomości ich podstaw, zakresu stosowania i ograniczeń

Problem cd. Żaden algorytm estymacji przestrzennych nie jest uniwersalny. Jego przydatność jest różna, w zależności nie tylko od charakteru zjawiska, którego zmienność przestrzenna jest opracowywana, ale także od zagęszczenia i konfiguracji punktów pomiarowych, błędów samego pomiaru i niedokładności określenia lokalizacji stanowisk pomiarowych. Opady atmosferyczne charakteryzują się nieciągłością czasową i przestrzenną oraz sezonową i przestrzenną zmienność mechanizmów je generujących.

Problem cd. Co rozumiemy pod pojęciem efektywności (przydatności) algorytmu interpolacyjnego? optymalną estymację w punkcie? optymalną estymację dla obszaru? Czy estymator jest lepszy kiedy wiernie oddaje oryginalne dane pomiarowe? Czy rozkład błędów pomiarowych w czasie i przestrzeni jest losowy? A co z nieprecyzyjną informacją o lokalizacji punktów pomiarowych?

Problem cd. Czy istnieje możliwość podniesienia jakości automatycznej estymacji przestrzennej opadów z wykorzystaniem skorelowanych charakterystyk morfometrycznych rzeźby? Niestacjonarność pola opadów – algorytmy globalne kontra lokalne.

Cel pracy Czy testowane algorytmy z taką sama wiarygodnością estymują sumy roczne i miesięczne? Czy w zróżnicowanej efektywności uwzględnionych algorytmów znajduje odbicie sezonowa zmienność struktury przestrzennej pola opadów? Które algorytmy są bardziej przydatne do estymacji punktowej, a które dla obszarowej? Jaka jest wielkość bezwzględnych i względnych błędów estymacji, i jaki jest ich rozkład geograficzny?

Metody Wykorzystane algorytmy estymacji przestrzennych: geostatystyczne (kriging): zwykły kriging z globalnym semiwariogramem (OK-gv), zwykły kriging z lokalnymi semiwariogramami (OK-lv), prosty kriging ze zmiennymi średnimi lokalnymi i globalnym semiwariogramem liczonym automatycznie (SKlm-gva), prosty kriging ze zmiennymi średnimi lokalnymi i globalnym semiwariogramem dopasowanym „ręcznie” (SKlm-gvm), prosty kriging ze zmiennymi średnimi lokalnymi i lokalnymi semiwariogramami (SKlm-lv), odwrotności odległości z kwadratowym wykładnikiem potęgowym (ID2), „triangulacji” (TIN), minimalnej krzywizny (MC).

Metody Algorytmy o charakterze lokalnym: OK-lv, SKlm-lv, ID2, TIN i MC. Algorytmy o charakterze globalnym: OK-gv, SKlm-gva, SKlm-gvm. Algorytmy uwzględniające dodatkowe dane (wysokość nad poziom morza z cyfrowego modelu rzeźby terenu): SKlm-lv, SKlm-gva, SKlm-gvm. Algorytmy nie uwzględniające dodatkowych danych: OK-gv, OK-lv, ID2, TIN i MC.

Metody Metoda oceny jakości algorytmu interpolacyjnego: jackknifing czyli podział zbioru danych na podzbiory: kalibracyjny i walidacyjny. Porównanie estymacji miar centralnych populacji (wartości obszarowych): średniej (x) i mediany (Me). Porównanie estymacji miar rozrzutu/rozkładu populacji (wartości obszarowych): odchylenie standardowe (SD), pierwszy i trzeci kwartyl (Q1, Q3), minimum i maksimum (min, maks) skośność (Sk) i kurtoza (K). Porównanie estymacji wartości lokalnych: średni błąd (ME), pierwiastek średniego błądu kwadratowego (RMSE), współczynnik korelacji (r).

Dane Rok 1980 Suma października Rok 1980 Suma kwietnia Rok 1980 Suma stycznia Rok 1980 Suma roczna Rok 1980 Suma lipca Dane

Metody Z analizowanych zbiorów danych usunięto losowo co 40 punkt pomiarowy. Przyjęta procedura zapewniała równomierne rozmieszczenie punktów wybranych do walidacji na terenie całego kraju. Ze względu na różną liczebność zbioru stacji dla poszczególnych miesięcy i całego roku (minimalnie 2385 dla całego roku, maksymalnie 2504 stacje w lipcu) wylosowano od 59 do 63 punktów pomiarowych, co stanowiło od 2,47 do 2,53% analizowanych zbiorów danych.

Dane: cyfrowy model rzeźby terenu (DEM) o roz- dzielczości ok Dane: cyfrowy model rzeźby terenu (DEM) o roz- dzielczości ok. 1 km GTOPO30 http://www1.gsi.go.jp/gtopo30/gtopo30.html

Wyniki: zależność opadu od położenia i wysokości

Wyniki: estymacja średniej obszarowej

Wyniki: estymacja odchylenia standardowego rozkładu obszarowego opadów

Wyniki: estymacja skośności rozkładu obszarowego opadów

Wyniki: współczynnik korelacji między danymi oryginalnymi i estymowanymi

Wyniki: średni błąd estymacji (ME)

Wyniki: pierwiastek względnego średniego błędu kwadratowego estymacji (RRMSE)

Wyniki: błędy estymacji metodą Najmniejszej Krzywizny (MC)

Wnioski Z przeprowadzonej analizy wynika że żadna z testowanych metod nie może być uważana za uniwersalną i najlepszą w każdych warunkach. Wyniki testów są nie tylko różne w przypadku poszczególnych zbiorów danych (sumy rocznej i sum miesięcznych), ale także w sytuacji różnych parametrów oceny jakości estymacji. Porównanie wyników obliczeń wykonanych na jednym jedynie zbiorze danych referencyjnych może prowadzić do fałszywych uogólnień. Generalnie dość słabo wypadły algorytmy (SKlm-), które uwzględniały dane z cyfrowego modelu rzeźby terenu. Zależność między wysokością nad poziom morza a opadami obliczono bowiem w postaci jednego modelu wielomianowego dla całego terytorium Polski.

Wnioski cd. Lepsze wyniki dają algorytmy oparte na lokalnym modelu struktury pola opadów niż na globalnym. Algorytmy TIN, SKlm-gva, SKlm-lv były nieco bardziej skuteczne przy estymacjach parametrów populacji (obszarowych), podczas gdy MC, OKgv, OKlv i SKlm-gvm – punktowych.

Wnioski cd. Zdecydowanie najlepiej wypadła metoda minimalnej krzywizny (MC). Jej średni wynik zarówno z estymacji punktowych, jak i obszarowych był znacznie lepszy niż wszystkich pozostałych metod. Można ją wstępnie zalecać do rutynowego wykonywania map opadów atmosferycznych, tym bardziej, że nie wymaga specjalistycznego parametryzowania. Metoda ta daje dobre rezultaty jedynie przy względnie równomiernym pokryciu analizowanego obszaru punktami pomiarowymi.

Wnioski cd. Zdecydowanie najgorzej w zestawieniu wypadł kriging w oparciu o globalny model struktury pola opadów (OKgv) i popularna metoda odwrotności odległości przy wykładniku kwadratowym (ID2). Średni błąd estymacji sumy rocznej opadów wahał się od 6,7 (SKlm-lv) do 7,9% (ID2), przy rozrzucie estymacji punktowych od –22,5 do +25,0%. Średnie błędy estymacji sum miesięcznych (dla wszystkich metod) wynosiły: styczeń – 18,6%, kwiecień – 10,9%, lipiec – 13,0%, październik – 9,2%. Różnice pomiędzy najlepszą a najgorszą metodą estymacji sum miesięcznych wahały się od 0,8% w lipcu do 3,4% w styczniu. Błędy estymacji punktowych mogą przy sumach miesięcznych sięgać 75%, w większości jednak przypadków oscylują w granicach 35%.

Wnioski cd. Prezentowane wyniki mają charakter wstępnej oceny niektórych algorytmów estymacyjnych. Aktualnie trwają dalsze prace związane z testowaniem szerokiego spektrum metod automatycznej estymacji opadów przy wykorzystaniu większej ilości danych, zarówno wartości przeciętnych jak i uwzględniających ekstremalne wysokości opadów.

Dziękuję Za uwagę