Alfred Stach Instytut Geoekologii i Geoinformacji

Slides:



Advertisements
Podobne prezentacje
Analiza współzależności zjawisk
Advertisements

IV Tutorial z Metod Obliczeniowych
Cyfrowy model powierzchni terenu
BUDOWA MODELU EKONOMETRYCZNEGO
Jak mierzyć asymetrię zjawiska?
ANALIZA STRUKTURY SZEREGU NA PODSTAWIE MIAR STATYSTYCZNYCH
Analiza współzależności
Krzysztof Jurek Statystyka Spotkanie 4. Miary zmienności m ó wią na ile wyniki są rozproszone na konkretne jednostki, pokazują na ile wyniki odbiegają
Statystyka w doświadczalnictwie
Analiza korelacji.
Niepewności przypadkowe
Wykład 4 Rozkład próbkowy dla średniej z rozkładu normalnego
Wykład 14 Liniowa regresja
Wykład 3 Rozkład próbkowy dla średniej z rozkładu normalnego
Program przedmiotu “Metody statystyczne w chemii”
Alfred Stach Instytut Paleogeografii i Geoekologii
Alfred Stach Instytut Paleogeografii i Geoekologii
Alfred Stach Instytut Paleogeografii i Geoekologii
Alfred Stach Instytut Paleogeografii i Geoekologii
GEOSTATYSTYKA Wykłady dla III roku Geografii specjalność – geoinformacja Estymacja na podstawie danych jednej zmiennej I Alfred Stach Instytut Paleogeografii.
Interpolacja danych przestrzennych w GIS
Alfred Stach Instytut Paleogeografii i Geoekologii
GEOSTATYSTYKA I ANALIZA PRZESTRZENNA Wykład dla III roku Geografii specjalność - geoinformacja Alfred Stach Instytut Geoekologii i Geoinformacji Wydział
GEOSTATYSTYKA Wykłady dla III roku Geografii specjalność – geoinformacja Estymacja na podstawie danych jednej zmiennej II Alfred Stach Instytut Paleogeografii.
Alfred Stach Instytut Geoekologii i Geoinformacji
Instytut Badań Czwartorzędu i Geoekologii UAM
Alfred Stach Instytut Geoekologii i Geoinformacji
Alfred Stach Instytut Paleogeografii i Geoekologii
GEOSTATYSTYKA I ANALIZA PRZESTRZENNA Wykład dla III roku Geografii specjalność - geoinformacja Alfred Stach Instytut Geoekologii i Geoinformacji Wydział
Alfred Stach Instytut Paleogeografii i Geoekologii
Korelacje, regresja liniowa
Wykład 4. Rozkłady teoretyczne
Metody Symulacyjne w Telekomunikacji (MEST) Wykład 6/7: Analiza statystyczna wyników symulacyjnych  Dr inż. Halina Tarasiuk
Średnie i miary zmienności
Elementy Rachunku Prawdopodobieństwa i Statystyki
Analiza współzależności cech statystycznych
dr hab. Ryszard Walkowiak prof. nadzw.
Elementy Rachunku Prawdopodobieństwa i Statystyki
Rozkłady wywodzące się z rozkładu normalnego standardowego
BADANIE STATYSTYCZNE Badanie statystyczne to proces pozyskiwania danych na temat rozkładu cechy statystycznej w populacji. Badanie może mieć charakter:
Elementy Rachunku Prawdopodobieństwa i Statystyki
Prognozowanie z wykorzystaniem modeli ekonometrycznych
Hipotezy statystyczne
Elementy Rachunku Prawdopodobieństwa i Statystyki
Planowanie badań i analiza wyników
Regresja wieloraka.
Przedmiot: Ekonometria Temat: Szeregi czasowe. Dekompozycja szeregów
Wnioskowanie statystyczne
Statystyka medyczna Piotr Kozłowski
Program przedmiotu “Opracowywanie danych w chemii” 1.Wprowadzenie: przegląd rodzajów danych oraz metod ich opracowywania. 2.Podstawowe pojęcia rachunku.
Statystyczna analiza danych w praktyce
Jak mierzyć asymetrię zjawiska? Wykład 5. Miary jednej cechy  Miary poziomu  Miary dyspersji (zmienności, zróżnicowania, rozproszenia)  Miary asymetrii.
Statystyczna analiza danych
Statystyczna analiza danych
Statystyczna analiza danych
Korelacje dwóch zmiennych. Korelacje Kowariancja.
Przeprowadzenie badań niewyczerpujących, (częściowych – prowadzonych na podstawie próby losowej), nie daje podstaw do formułowania stanowczych stwierdzeń.
Model GRID znaczenie NMT o postaci GRID strategie interpolacji: dane → GRID stosowane metody interpolacji omówienie wybranych metod przykłady.
Rozkłady statystyk z próby dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium.
WYKŁAD Teoria błędów Katedra Geodezji im. K. Weigla ul. Poznańska 2
Modele nieliniowe sprowadzane do liniowych
STATYSTYKA – kurs podstawowy wykład 11
Statystyka matematyczna
Co do tej pory robiliśmy:
Regresja wieloraka – bada wpływ wielu zmiennych objaśniających (niezależnych) na jedną zmienną objaśnianą (zależą)
Jednorównaniowy model regresji liniowej
Analiza współzależności zjawisk
MIARY STATYSTYCZNE Warunki egzaminu.
Korelacja i regresja liniowa
Alfred Stach Instytut Paleogeografii i Geoekologii UAM
Zapis prezentacji:

GEOSTATYSTYKA I ANALIZA PRZESTRZENNA Wykład dla III roku Geografii specjalność - geoinformacja Alfred Stach Instytut Geoekologii i Geoinformacji Wydział Nauk Geograficznych i Geologicznych UAM

Typowy przebieg analizy geostatystycznej Pozyskanie i wstępna weryfikacja danych Eksploracja danych: nieprzestrzenna i przestrzenna Budowa probalistycznego modelu struktury przestrzennej analizowanego cechy Weryfikacja modelu. Estymacja i ocena jej jakości. Symulacje. Optymalizacja

Eksploracyjna analiza danych Ogólne informacje o danych źródłowych: ogólna charakterystyka zjawiska/zjawisk generującego przestrzenną/czasową zmienność analizowanej cechy/cech typ próbkowania: przestrzenny i czasowy relacja lokalizacji próbek do głównych czynników zmienność przestrzennej / czasowej analizowanej cechy / cech jednolitość metodyki; źródła i rozmiary błędów pomiarowych

Eksploracyjna analiza danych Nieprzestrzenna jednej zmiennej: typ rozkładu: jedno-, wielomodalny typ rozkładu: symetryczny (potencjalnie normalny), asymetryczny (skośny) istnienie danych globalnie odstających (ekstremów) Nieprzestrzenna dwóch zmiennych: typ i siła korelacji zmiennych ilościowych istotność różnic grup zmiennej/ych ilościowych wyróżnionych względem zmiennej jakościowej

Próba losowa – zmienna b3n_02 Rozkład w przybliżeniu symetryczny, dwumodalny (?). Występowanie wartości ekstremalnych (globalnie odstających).

Relacja b3N_02 i b3N_04

Zmienna b3N_02 w klasach SWIR

Eksploracyjna analiza danych Przestrzenna jednej zmiennej: typ próbkowania istnienie danych lokalnie odstających; potencjalne przyczyny ogólny pogląd na zmienność przestrzenną, wykorzystanie prostej automatycznej procedury interpolacji istnienie efektu proporcjonalności lokalnej średniej/wariancji rozgrupowanie danych przy próbkowaniu preferencyjnym

Losowa stratyfikowana Typ próbkowania Zastosowana metoda poboru próbek ma podstawowe znaczenie dla wyboru metody i jakości estymacji Profilowa Regularna Losowa Izoliniowa Losowa stratyfikowana Preferencyjna (skupiona)

Poligon Hørbyebreen zmienna b1_03b Lokalizacja punktów pomiarowych Powierzchnia rzeczywista

Polygony Thiessen’a Poligony Thiessen’a (Voronoi): Metoda wektorowa Założenie, że wartości cechy w nie opróbowanych lokalizacjach są równe wartościom dla najbliżej położonego punktu pomiarowego Metoda wektorowa Regularnie rozmieszczone punkty dają w tej metodzie regularną siatkę poligonów Punkty rozproszone (nieregularnie rozrzucone) powodują powstanie siatki nieregularnych poligonów

Konstrukcja poligonów Thiessen’a

Poligon Hørbyebreen zmienna b1_03b Powierzchnia rzeczywista Interpolacja – poligony Thiessena

Traingulacja (TIN) Inna metoda wektorowa często stosowana do tworzenia cyfrowych modeli rzeźby terenu (digital terrain models - DTM) Sąsiadujące punkty są łączone liniami (krawędziami), i w efekcie powstaje siatka nieregularnych trójkątów Obliczenia rzeczywistej odległości między punktami danych w przestrzeni trójwymiarowej przy pomocy trygonometrii Obliczenia interpolowanej wartości z położenia na płaszczyźnie przechodzącej przez trzy sąsiadujące ze sobą punkty pomiarowe

Widok izometryczny (rzut 3W) Konstrukcja TIN dana c dana b Interpolowana wartość x a b c Widok izometryczny (rzut 3W) Widok w planie

Rzeczywista powierzchnia z lokalizacjami punktów pomiarowych Przykład TIN Rzeczywista powierzchnia z lokalizacjami punktów pomiarowych Wynikowa siatka TIN

Poligon Hørbyebreen zmienna b1_03b Powierzchnia rzeczywista Interpolacja – TIN

Przestrzenna średnia ruchoma Metoda mająca zastosowanie zarówno dla danych wektorowych, jak i rastrowych: Bardzo popularna w GIS Oblicza nieznaną wartość cechy dla określonej lokalizacji na podstawie zakresu wartości dla najbliżej lezących punktów pomiarowych Kryteria „sąsiedztwa” do obliczeń są określane za pomocą reguły wprowadzanej przez operatora: Wielkość, kształt sąsiedztwa i/lub charakter danych

Przestrzenna średnia ruchoma (PŚR) – przykłady definicji sąsiedztwa

Przykład PŚR (sąsiedztwo koliste) Rzeczywista powierzchnia z punktami danych Powierzchnia modelowana dla sąsiedztwa o promieniu 11 Powierzchnia modelowana dla sąsiedztwa o promieniu 21 Powierzchnia modelowana dla sąsiedztwa o promieniu 41

Poligon Hørbyebreen zmienna b1_03b Powierzchnia rzeczywista Interpolacja – średnia ruchoma

Interpolacja metodą średniej ważonej odległością (IDW – inverse distance weighted) W metodzie IDW rola otaczających punkt estymowany danych jest w liczonej średniej zróżnicowana w zależności od odległości Zj- wartość cechy Z estymowanej w punkcie j Zi – wartość cechy Z zmierzona w punkcie i (jednym z n punktów danych w otoczeniu) hij – efektywna odległość między punktami i i j  - wykładnik potęgowy – waga odległości

Poligon Hørbyebreen zmienna b1_03b Powierzchnia rzeczywista Interpolacja – IDW ( = 2)

Powierzchnie trendu Wykorzystanie regresji wielomianowej aby dopasować metodą najmniejszych kwadratów powierzchnię do punktów danych Zazwyczaj operator może decydować o stopniu wielomianu stosowanego w dopasowaniu powierzchni Wraz ze wzrostem stopnia wielomianu dopasowywana powierzchnia staje się coraz bardziej skomplikowana Nie zawsze wielomian wyższego stopnia generuje powierzchnię bardziej dokładną – jest to uzależnione od charakteru danych Im niższy błąd RMS tym lepiej interpolowana powierzchnia odwzorowuje punkty danych Najczęściej stosuje się wielomiany od 1 do 3 rzędu

Typowe funkcje równań trendu Planarna: z(x,y) = A + Bx + Cy Bi-liniowa: z(x,y) = A + Bx + Cy + Dxy Kwadratowa: z(x,y) = A + Bx + Cy + Dx2 + Exy + Fy2 Sześcienna: z(x,y) = A + Bx + Cy + Dx2 + Exy + Fy2 + Gx3 + Hx2y + Ixy2 + Jy3

Dopasowanie powierzchni trendu wielomianem pierwszego stopnia Punkty interpolowane Punkty danych

Przykłady powierzchni trendu Rzeczywista powierzchnia z lokalizacją pomiarów Trend planarny Trend kwadratowy Trend sześcienny Jakość dopasowania (R2) = 92,72 % Jakość dopasowania (R2) = 45,42 % Jakość dopasowania (R2) = 82,11 %

Poligon Hørbyebreen zmienna b1_03b Powierzchnia rzeczywista Interpolacja – wielomian (1 st.)

Poligon Hørbyebreen zmienna b1_03b Powierzchnia rzeczywista Interpolacja – wielomian (2 st.)

Poligon Hørbyebreen zmienna b1_03b Powierzchnia rzeczywista Interpolacja – wielomian (3 st.)

Eksploracyjna analiza danych Przestrzenna jednej zmiennej: typ próbkowania istnienie danych lokalnie odstających; potencjalne przyczyny ogólny pogląd na zmienność przestrzenną, wykorzystanie prostej automatycznej procedury interpolacji istnienie efektu proporcjonalności lokalnej średniej/wariancji rozgrupowanie danych przy próbkowaniu preferencyjnym

Efekt proporcjonalności średniej lokalnej do wariancji lokalnej

Zmienna b1_03b: populacja i próbkowanie losowe

Zmienne b1_03b i g-swir03b - populacja

Statystyki zmiennej b1_03b w grupach swir_03b

Zmienne b1_03b i g-swir03b - populacja I etap próbkowania preferencyjnego: 200 losowych próbek wszystkich zmiennych II etap próbkowania preferencyjnego: usunięcie z 200 próbek losowo 100 próbek zmiennej b1_03b III etap próbkowania preferencyjnego: dodanie 150 próbek losowo wybranych, lecz jedynie w obrębie grupy 2 g-swir03b

Statystyki zmiennej b1_03b: populacja oraz próbkowania – losowe i preferencyjne

Efekt proporcjonalności: relacja między lokalną średnią, a lokalną wariancją Próbka losowa, zmienna b3n_03b Próbka losowa, zmienna b1_03b

Efekt proporcjonalności: relacja między lokalną średnią, a lokalną wariancją Próbka preferencyjna, zmienna b3n_03b Próbka preferencyjna, zmienna b1_03b

Eksploracyjna analiza danych Przestrzenna jednej zmiennej: typ próbkowania istnienie danych lokalnie odstających; potencjalne przyczyny ogólny pogląd na zmienność przestrzenną, wykorzystanie prostej automatycznej procedury interpolacji istnienie efektu proporcjonalności lokalnej średniej/wariancji rozgrupowanie danych przy próbkowaniu preferencyjnym

Analizowane przedziały widma (kanały) (światło zielone) Kanał 2: 0,63 – 0,69 µm (światło czerwone) Kanał 3: 0,78 – 0,86 µm (bliska podczerwień)

Próbkowanie: etap I - systematyczne

Próbkowanie: etap II - preferencyjne

Próbkowanie, a statystyki opisowe – kanał 1

Wyjście z problemu – statystyki ważone Średnia arytmetyczna Średnia ważona

Rozgrupowanie poligonalne (polygon declustering)

Rozgrupowanie komórkowe (cell declustering) Średnia arytmetyczna » 276,58 n=2 n=8 Średnia ważona = 1011,55/4 » 252,94

Rozgrupowanie komórkowe (cell declustering)

Zmienna zregionalizowana (ang. regionalized variable) Zmienna zregionalizowana to podstawowe pojęcie geostatystyki, które zostało zaproponowane przez G. Matherona w 1965 r. Jest to zmienna rozłożona w przestrzeni, używana do opisu zjawisk zachodzących na pewnym obszarze. Zmienne zregionalizowane mają właściwości pośrednie między zmiennymi losowymi i zmiennymi deterministycznymi Z jednej strony charakteryzują się wzajemną korelacją związaną z przestrzennym rozkładem danego zjawiska, z drugiej zaś strony mogą być traktowane lokalnie, jako zmienne losowe - mające określony rozkład prawdopodobieństwa

Zmienna zregionalizowana (ang. regionalized variable) Dwoistą naturę zmiennych zregionalizowanych wyraża najlepiej funkcja losowa zmiennej przestrzennej Z(x), będąca zbiorem zmiennych losowych, w różnych położeniach. Ma ona następujące własności: lokalnie w danym punkcie wartość z(x) funkcji losowej Z(x) traktowana jest jako pewna realizacja zmiennej losowej, w dowolnej parze punktów x. oraz x+h zmienne losowe Z(x.) oraz Z(x.+h) są związane pewną zależnością korelacyjną wynikającą z przestrzennej ciągłości badanego zjawiska. Przykładami zmiennych zregionalizowanych mogą być: zanieczyszczenie określoną substancją na pewnym obszarze, jasność spektralna pikseli na zdjęciu satelitarnym, temperatura powietrza, wilgotność gleby, natężenie określonego procesu społecznego lub gospodarczego na badanym obszarze.