Generalizacja danych przestrzennych

Slides:



Advertisements
Podobne prezentacje
Statystyka w analizie rynku i wycenie nieruchomości (cz.1)
Advertisements

PODZIAŁ STATYSTYKI STATYSTYKA STATYSTYKA MATEMATYCZNA STATYSTYKA
W dalszej części zajęć wyróżniać będziemy następujące
Podsumowanie wykładu 1. Najpełniejszą charakterystyką wybranej zmiennej jest jej rozkład.
Skale pomiarowe – BARDZO WAŻNE
BUDOWA MODELU EKONOMETRYCZNEGO
Materiały pochodzą z Platformy Edukacyjnej Portalu
Jak mierzyć asymetrię zjawiska?
Miary jednej cechy Miary poziomu Miary dyspersji Miary asymetrii (skośności)
Właściwości średniej arytmetycznej
ANALIZA STRUKTURY SZEREGU NA PODSTAWIE MIAR STATYSTYCZNYCH
Krzysztof Jurek Statystyka Spotkanie 4. Miary zmienności m ó wią na ile wyniki są rozproszone na konkretne jednostki, pokazują na ile wyniki odbiegają
Statystyka w doświadczalnictwie
(dla szeregu szczegółowego) Średnia arytmetyczna (dla szeregu szczegółowego) Średnią arytmetyczną nazywamy sumę wartości zmiennej wszystkich jednostek.
BIOSTATYSTYKA I METODY DOKUMENTACJI
BIOSTATYSTYKA I METODY DOKUMENTACJI
Wykład 6 Standardowy błąd średniej a odchylenie standardowe z próby
Wykład 14 Liniowa regresja
Wykład 5 Przedziały ufności
Rozpoznawanie obrazów
Alfred Stach Instytut Paleogeografii i Geoekologii
Alfred Stach Instytut Paleogeografii i Geoekologii
Korelacje, regresja liniowa
Metody Symulacyjne w Telekomunikacji (MEST) Wykład 6/7: Analiza statystyczna wyników symulacyjnych  Dr inż. Halina Tarasiuk
Średnie i miary zmienności
Fraktale i chaos w naukach o Ziemi
Konstrukcja, estymacja parametrów
Elementy Rachunku Prawdopodobieństwa i Statystyki
dr hab. Ryszard Walkowiak prof. nadzw.
Elementy Rachunku Prawdopodobieństwa i Statystyki
Komputerowe metody przetwarzania obrazów cyfrowych
dr hab. Ryszard Walkowiak prof. nadzw.
Elementy Rachunku Prawdopodobieństwa i Statystyki
Elementy Rachunku Prawdopodobieństwa i Statystyki
Typy wykresów Bartosz Celiński.
Elementy Rachunku Prawdopodobieństwa i Statystyki
Statystyka ©M.
Podstawy statystyki, cz. II
ZWIĄZKI MIĘDZY KLASAMI KLASY ABSTRAKCYJNE OGRANICZENIA INTERFEJSY SZABLONY safa Michał Telus.
VI EKSPLORACJA DANYCH Zadania eksploracji danych: klasyfikacja
VII EKSPLORACJA DANYCH
SYSTEMY EKSPERTOWE I SZTUCZNA INTELIGENCJA
Regresja wieloraka.
Treści multimedialne - kodowanie, przetwarzanie, prezentacja Odtwarzanie treści multimedialnych Andrzej Majkowski.
Przedmiot: Ekonometria Temat: Szeregi czasowe. Dekompozycja szeregów
Dopasowanie rozkładów
Wnioskowanie statystyczne
STATYSTYKA Pochodzenie nazwy:
Statystyka medyczna Piotr Kozłowski
Wykład 5 Przedziały ufności
Estymatory punktowe i przedziałowe
Podstawowe pojęcia i terminy stosowane w statystyce
Statystyczna analiza danych w praktyce
Jak mierzyć asymetrię zjawiska? Wykład 5. Miary jednej cechy  Miary poziomu  Miary dyspersji (zmienności, zróżnicowania, rozproszenia)  Miary asymetrii.
Statystyczna analiza danych
Statystyczna analiza danych
Statystyczna analiza danych
Statystyczna analiza danych
* Halina Klimczak Instytut Geodezji i Geoinformatyki Uniwersytet Przyrodniczy we Wrocławiu Prawie wszystko o danych…..
SKALA CIĄGŁA I SKOKOWA.
Halina Klimczak Katedra Geodezji i Fotogrametrii Akademia Rolnicza we Wrocławiu WYKŁAD 2 ZMIENNE GRAFICZNE SKALA CIĄGŁA I SKOKOWA.
Parametry rozkładów Metodologia badań w naukach behawioralnych II.
Nierówności liniowe.
Statystyka matematyczna
Co do tej pory robiliśmy:
Jednorównaniowy model regresji liniowej
MIARY STATYSTYCZNE Warunki egzaminu.
Korelacja i regresja liniowa
statystyka podstawowe pojęcia
Zapis prezentacji:

Generalizacja danych przestrzennych dr hab. Ryszard Walkowiak prof. nadzw.

Generalizacja danych W poprzednich wykładach stwierdziliśmy, że jednym z głównych zadań GIS jest właściwa reprezentacja danych przestrzennych. Powierzchnia Ziemi, badana z dużą szczegółowością, jest tworem niewyobrażalnie skomplikowanym. Jej bardzo dokładne zobrazowanie wymagałoby umieszczenia w bazie danych, a następnie przetwarzania, ogromnej, prawie nieskończonej liczby danych. Prowadziłoby to do wytwarzania map zbyt szczegółowych, całkowicie nieczytelnych. Z tego względu opracowano różne metody upraszczania, nazywane generalizacją danych.

Generalizacja danych Metody generalizacji danych dzielimy ogólnie na: generalizację kształtu generalizację statystyczną.

Generalizacja kształtu Generalizacja kształtu polega na zmianie kształtu obiektów w celu lepszego ich uwidocznienia na mapie, przy zachowaniu ich najważniejszych cech.

Generalizacja kształtu uproszczenie lub wybór punktów np. przez eliminację niektórych wierzchołków wieloboku tak, aby jego kształt stał się prostszy.

Generalizacja kształtu wygładzanie polegające na zastępowaniu ostrych i złożonych kształtów przez wygładzone

Generalizacja kształtu agregacja, czyli zastąpienie dużej liczby szczegółowych znaków mniejszą liczbą nowych znaków.

Generalizacja kształtu łączenie polegające na zastępowaniu kilku obiektów powierzchniowych przez jeden.

Generalizacja kształtu scalanie polegające łączeniu wielu obiektów liniowych w jeden.

Generalizacja kształtu dekompozycja polegająca na zamianie obiektu powierzchniowego na obiekt punktowy.

Generalizacja kształtu wybór obiektów polegający na eliminacji pewnych obiektów przy zachowaniu ogólnych prawidłowości rozkładu przestrzennego

Generalizacja kształtu przewiększenie obiektu w celu zachowania atrybutów, mimo że przy danej skali powinien być niewidoczny.

Generalizacja kształtu wzmocnienie przez zmianę wielkości i kształtów symboli

Generalizacja kształtu przemieszczenie obiektów z ich rzeczywistego położenia w celu zachowania ich relacji przestrzennych i czytelności

Generalizacja statystyczna Gdy mapy są używane do wyświetlania informacji statystycznych (np. liczba ludności, procent bezrobocia itd.), należy zachować szczególną ostrożność, aby przedstawić jak najdokładniej przestrzenny rozkład danych. Jest to trudne zadanie, gdyż sensem wyświetlania danych statystycznych na mapach jest uchwycenie ich rozkładu w przestrzeni. Jednak uogólniając i upraszczając dane, można ukryć subtelne różnice w rozkładzie. Dlatego też, podczas mapowania danych statystycznych, należy zawsze starać się znaleźć równowagę między wiernością rzeczywistemu rozkładowi danych a uogólnieniem, tak, aby uwypuklić zależności przestrzenne.

Generalizacja statystyczna Aby przedstawić wartości jakiejś zmiennej w postaci kolorów, należy podzielić cały zakres zmienności tej zmiennej na przedziały. W tym celu należy najpierw ustalić liczbę przedziałów a następnie ich granice.

Generalizacja statystyczna 0-30 31-65 65- 15 25 7 21 34 56 61 45 39 92 77 88

Generalizacja statystyczna 0-25 51-75 76- 26-50 15 15 15 25 25 25 7 7 7 21 21 34 34 56 56 56 61 45 39 92 77 88

Generalizacja statystyczna Ilość klas Za mało klas: zarys rozkładu danych jest niewyraźny, gubimy niuanse. Za dużo klas: dezorientacja, problem z interpretacją, gubimy strukturę przestrzenną. Większość map tematycznych zawiera od 3 do 7 klas. Przy zastosowaniu odcieni szarości, 8 klas to maksimum, które da się rozróżnić.

Generalizacja statystyczna Metody klasyfikacji Mapy tematyczne przygotowane z tych samych danych i z taką samą ilością klas, dają inną informację, jeśli zastosowano różne metody podziału (klasyfikacji). Metoda podziału musi być odpowiednia do określonego rozkładu statystycznego danych.

Generalizacja statystyczna Rozkład danych Histogram Pierwszy etap przy tworzeniu map tematycznych: wykreślenie frekwencji występowania określonych przedziałów wartości cechy Umożliwia identyfikację rozkładu danych. Zastosowanie podstawowych statystyk opisowych: średnia, mediana, skośność, kurtoza. Jednolity Normalny Wykładniczy Wartość cechy Frekwencja

Generalizacja statystyczna Rozkład danych Jednakowe przedziały Każda klasa reprezentuje jednakowy przedział wartości cechy. Szerokość klasy to różnica między wartością największą a najmniejszą podzielona przez ilość klas. (Max-Min) / IK Prosta interpretacja. Odpowiednie dla danych o rozkładzie jednolitym i ciągłym. Nieodpowiednie jeśli dane są skupione wokół niewielu wartości. C1 C2 C3 C4 Frekwencja Min Max Wartość

Generalizacja statystyczna Rozkład danych Kwantyle Równa ilość obserwacji w każdej klasie. n(C1) = n(C2) = n(C3) = n(C4). Stosowny dla równomiernie rozłożonych danych. Obiekty o zbliżonych wartościach cechy mogą się znajdować w różnych kategoriach. Jednakowa powierzchnia Klasy tworzone są aby miały podobną powierzchnię. Efekt podobny do podziału kwantylowego jeśli wielkość jednostki jest taka sama. n(C1) n(C2) n(C3) n(C4) C1 C2 C3 C4 Frekwencja Wartość

Generalizacja statystyczna Rozkład danych Odchylenie standardowe Jako granice klas stosowana jest średnia i wielokrotności odchylenia standardowego. Wskazana, gdy rozkład wartości cechy jest zbliżony do normalnego. Wizualizacja obiektów, których wartości cechy są powyżej lub poniżej średniej. Wyraźnie widoczne obiekty odstające. Nie pokazuje wartości jako cech obiektów, jedynie ich odległość od średniej. C1 C2 C3 C4 Śr. -1STD +1STD Frekwencja Wartość

Generalizacja statystyczna Rozkład danych Wzrost arytmetyczny, geometryczny lub wykładniczy Szerokość przedziałów klasowych rośnie lub maleje nieliniowo. Wskazane dla rozkładów o charakterze wykładniczym. Wartość Frekwencja C1 C2 C3 C4

Generalizacja statystyczna Rozkład danych Podział naturalny (Natural breaks) Złożona metoda optymalizacji podziału. Minimalizuje sumę wariancji w każdej klasie. Najlepsza jeśli dane nie są rozłożone równomiernie. Uzasadniona statystycznie. Trudna do porównania z innymi klasyfikacjami. Arbitralna decyzja wyboru odpowiedniej ilości klas. Frequency Value C1 C2 C3 C4

Generalizacja statystyczna Rozkład danych Podział własny Operator wybiera podział klasowy, który jest najlepiej dostosowany do rozkładu danych. Metoda ta podawana jest jako ostatnia, ponieważ zazwyczaj nie ma jasnych kryteriów dokonanego podziału, lub są one stosowane niekonsekwentnie. Zazwyczaj tego typu wybór związany jest z osobistym doświadczeniem eksperta. Często do tej grupy można włączyć podział dokonany ze względów estetycznych (okrągłe liczby). 5000 - 10000 zamiast 4982 - 10123. Inny cel Klasyfikacja może być także użyta do umyślnego zamazania lub ukrycia informacji.

Generalizacja statystyczna Rozkład danych Równe przedziały Kwantyle

Generalizacja statystyczna Rozkład danych Odchylenie standardowe

Wnioskowanie przestrzenne Uzupełnianie braków danych Zazwyczaj próbkowanie nie jest kompletne zarówno w ujęciu czasowym, jak i przestrzennym. Bardzo często potrzebna jest metoda obiektywnego uzupełniania braków danych. Interpolacja i ekstrapolacja Dane w lokalizacjach gdzie nie dokonano pomiaru niekiedy mogą być szacowane na podstawie wyników pomiarów dokonanych w sąsiedztwie. Interpolacja: Prognozowanie brakujących danych w miejscach (czasie) leżących pomiędzy miejscami (czasem), w których pobrano próbki. Ekstrapolacja: Prognozowanie brakujących danych leżących poza zasięgiem obszaru znanego.

Wnioskowanie przestrzenne Interpolacja i ekstrapolacja Wysokość Lokalizacja Linia interpolowana Próbka Linia ekstrapolowana Oczekiwanie na światłach Linia interpolowana Próbka Liczba pojazdów

Wnioskowanie przestrzenne Dopasowanie trendu

Wnioskowanie przestrzenne Niebezpieczeństwo ekstrapolacji

Wnioskowanie przestrzenne Niebezpieczeństwo ekstrapolacji