Ćwiczenia ze statystyki II rok Geoinformacji rok akademicki 2007/2008 WSTĘP
Na czym opiera się nasza wiedza o otaczającym środowisku fizycznym i społecznym? I. Pomiar + Teoria
Na czym opiera się nasza wiedza o otaczającym środowisku fizycznym i społecznym? II. Pomiar + ???
Podstawy klasycznej statystyki
Przykład z gazet – badania opinii społecznej Aby poznać preferencje dorosłych (ok. 29 mln.) Polaków z dokładnością 3% ankietuje się zazwyczaj ok osób (próbka 0,000045). Próbka musi być reprezentatywna tzn. zachowywać proporcje głównych parametrów całej populacji: strukturę płci, strukturę wiekową, strukturę wykształcenia, strukturę zawodową, strukturę zamieszkania.
Przykład w skali Polski: suma opadów atmosferycz -nych w sierpniu 1975 Dane źródłowe z 2659 stacji. DUŻO, CZY MAŁO?
Przykład w skali Polski: suma opadów atmosferycz- nych w sierpniu 1975 roku. Dane źródłowe z 2659 stacji. DUŻO, CZY MAŁO? Dane wyjściowe: 2659 deszczomierzy Hellmanna powierzchnia zbiorcza deszczomierza Hellmanna: 200 cm 2 powierzchnia Polski: km 2 Obliczenia: Powierzchnia pomiaru = cm 2 = cm 2 = 53,2 m 2 = km 2 Powierzchnia pomiarowa w stosunku do powierzchni Polski 1 : 0, To tak jakby się chciało poznać opinię społeczną w Polsce na podstawie ankietowania 0,0223 obywatela, czyli około 1,1 kg
Przykład w skali Polski: suma opadów atmosferycz- nych w sierpniu 1980 roku. Dane źródłowe z 2659 stacji. DUŻO, CZY MAŁO? A MOŻE TO JEDNAK WYSTARCZAJĄCO DUŻO DANYCH? Mechanizm powstawania opadów w Polsce: frontalne (30 – 60 tys. km 2 ), konwekcyjne (ok. 5 km 2 ), i dodatkowo wpływ rzeźby terenu. Obliczenia: Powierzchnia przypadająca na 1 deszczomierz: : 2659 = 117,6 km 2 średnia odległość między deszczomierzami: 117,6 0,5 = 10,84 km średni promień opadowej komórki konwekcyjnej: (5 : ) 0,5 = 1,26 km
Przykład w skali Polski: suma opadów atmosfe- rycznych w sierpniu 1975 roku
Problem w skali globalnej
Globalne ocieplenie – dane źródłowe Lokalizacja stacji meteo. z danymi średniej temperatury powietrza Lokalizacja stacji meteo. z danymi maks. temperatury powietrza
Decyzje ekonomiczne – eksploatacja ropy naftowej na Morzu Północnym Koszt budowy i instalacji platformy wiertniczej: ok. 2 mld. U$ Informacje bę- dące podstawą decyzji o wyda- niu 2 mld. U$: Rdzenie wiertnicze: 0, Wiercenia: 0, Pomiary geofizyczne: 0,
Główne funkcje statystyki Opisywanie/podsumowywanie/ tabelaryzowanie danych, Opisywanie/podsumowywanie/ tabelaryzowanie danych, Testowanie hipotez (przewidywań) na temat danych Testowanie hipotez (przewidywań) na temat danych Przeprowadzanie eksploracji danych w poszukiwaniu struktury/układów/ czynników/skupień Przeprowadzanie eksploracji danych w poszukiwaniu struktury/układów/ czynników/skupień
Opisywanie/podsumowywanie/ tabelaryzowanie danych Podsumowanie/rysowanie kształt rozkładu zmiennych ciągłych, Podsumowanie/rysowanie kształt rozkładu zmiennych ciągłych, Podsumowanie/rysowanie kształt rozkładu zmiennych ciągłych Podsumowanie/rysowanie kształt rozkładu zmiennych ciągłych Tabelaryzowanie/ilustrowanie graficzne danych jakościowych (takich jak płeć, zawód) oraz wyznaczanie liczności, procentów itp., Tabelaryzowanie/ilustrowanie graficzne danych jakościowych (takich jak płeć, zawód) oraz wyznaczanie liczności, procentów itp., Tabelaryzowanie/ilustrowanie graficzne danych jakościowych (takich jak płeć, zawód) oraz wyznaczanie liczności, procentów itp. Tabelaryzowanie/ilustrowanie graficzne danych jakościowych (takich jak płeć, zawód) oraz wyznaczanie liczności, procentów itp. Przeprowadzanie eksploracji/ podsumowywanie szeregów czasowych Przeprowadzanie eksploracji/ podsumowywanie szeregów czasowych Przeprowadzanie eksploracji/ podsumowywanie szeregów czasowych Przeprowadzanie eksploracji/ podsumowywanie szeregów czasowych
Testowanie hipotez (przewidywań) na temat danych Kształtu (lub dopasowania) rozkładu, Kształtu (lub dopasowania) rozkładu, Kształtu (lub dopasowania) rozkładu Kształtu (lub dopasowania) rozkładu Różnic pomiędzy grupami/próbami, Różnic pomiędzy grupami/próbami, Różnic pomiędzy grupami/próbami Różnic pomiędzy grupami/próbami Różnic pomiędzy zmiennymi, Różnic pomiędzy zmiennymi, Różnic pomiędzy zmiennymi Różnic pomiędzy zmiennymi Zależności (relacji) między zmiennymi, Zależności (relacji) między zmiennymi, Zależności (relacji) między zmiennymi Zależności (relacji) między zmiennymi Różnic w relacjach pomiędzy zmiennymi w różnych grupach Różnic w relacjach pomiędzy zmiennymi w różnych grupach Różnic w relacjach pomiędzy zmiennymi w różnych grupach Różnic w relacjach pomiędzy zmiennymi w różnych grupach
Przeprowadzanie eksploracji danych w poszukiwaniu struktury/układów/ czynników/skupień Czynników lub wymiarów wśród wielu zmiennych ciągłych, Czynników lub wymiarów wśród wielu zmiennych ciągłych, Czynników lub wymiarów wśród wielu zmiennych ciągłych Czynników lub wymiarów wśród wielu zmiennych ciągłych Skupień lub naturalnych grup zmiennych lub przypadków, Skupień lub naturalnych grup zmiennych lub przypadków, Skupień lub naturalnych grup zmiennych lub przypadków Skupień lub naturalnych grup zmiennych lub przypadków Wzorców lub trendów zachodzących w czasie, Wzorców lub trendów zachodzących w czasie, Wzorców lub trendów zachodzących w czasie Wzorców lub trendów zachodzących w czasie Związków w tablicach wielodzielczych. Związków w tablicach wielodzielczych. Związków w tablicach wielodzielczych Związków w tablicach wielodzielczych Związków pomiędzy zmiennymi niezależnymi (objaśniającymi) a zmiennymi zależnymi, określającymi przynależność do grup (kategorii). Związków pomiędzy zmiennymi niezależnymi (objaśniającymi) a zmiennymi zależnymi, określającymi przynależność do grup (kategorii). Związków pomiędzy zmiennymi niezależnymi (objaśniającymi) a zmiennymi zależnymi, określającymi przynależność do grup (kategorii) Związków pomiędzy zmiennymi niezależnymi (objaśniającymi) a zmiennymi zależnymi, określającymi przynależność do grup (kategorii)
Ćwiczenia ze statystyki w roku akademickim 2007/2008 Zakres tematyczny zajęć Zakres tematyczny zajęć Forma zajęć Forma zajęć Oprogramowanie i literatura Oprogramowanie i literatura Dane do ćwiczeń Dane do ćwiczeń Wymagania i forma zaliczenia Wymagania i forma zaliczenia
Ćwiczenia ze statystyki w roku akademickim 2006/2007: zakres tematyczny zajęć Przygotowanie danych do analiz statystycznych Przygotowanie danych do analiz statystycznych Podstawy grafiki statystycznej Podstawy grafiki statystycznej Statystyki opisowe Statystyki opisowe Testowanie hipotez parametrycznych Testowanie hipotez parametrycznych Testowanie hipotez nieparametrycznych Testowanie hipotez nieparametrycznych Analiza korelacji i regresji Analiza korelacji i regresji ANOVA ANOVA Metody wielowymiarowe – analiza składowych głównych, analiza skupień. Metody wielowymiarowe – analiza składowych głównych, analiza skupień.
Statystyka – strona domowa ćwiczeń:
Statystyka - literatura
Oprogramowanie statystyczno-graficzne: Excel
Oprogramowanie statystyczno-graficzne: R
Oprogramowanie statystyczno-graficzne: R Commander
R i R Commander - instalacja
Excel – literatura
R – literatura
R – literatura po polsku Ekonometria i statystyka przestrzenna z wykorzystaniem programu R CRAN Katarzyna Kopczewska ISBN: CeDeWu Sp. z o.o. Wydanie I, 162 strony
Ćwiczenia ze statystyki w roku akademickim 2007/2008 Zakres tematyczny zajęć Zakres tematyczny zajęć Forma zajęć Forma zajęć Oprogramowanie i literatura Oprogramowanie i literatura Dane do ćwiczeń Dane do ćwiczeń Wymagania i forma zaliczenia Wymagania i forma zaliczenia