Statystyczna analiza danych

Slides:



Advertisements
Podobne prezentacje
Badania statystyczne Wykłady 1-2 © Leszek Smolarek.
Advertisements

Statystyka w analizie rynku i wycenie nieruchomości (cz.1)
Statystyka w doświadczalnictwie
Analiza współzależności zjawisk
Biostatystyka inż. Jacek Jamiołkowski Wykład 2 Statystyka opisowa.
Podsumowanie wykładu 1. Najpełniejszą charakterystyką wybranej zmiennej jest jej rozkład.
PODSUMOWANIE WIADOMOŚCI ZE STATYSTYKI
BUDOWA MODELU EKONOMETRYCZNEGO
Regresja w EXCELU.
Charakterystyki opisowe rozkładu jednej cechy
Jak mierzyć asymetrię zjawiska?
Jak mierzyć zróżnicowanie zjawiska? Wykład 4. Miary jednej cechy Miary poziomu Miary dyspersji (zmienności, zróżnicowania, rozproszenia) Miary asymetrii.
Miary jednej cechy Miary poziomu Miary dyspersji Miary asymetrii (skośności)
ANALIZA STRUKTURY SZEREGU NA PODSTAWIE MIAR STATYSTYCZNYCH
Miary położenia Miary położenia opisują umiejscowienie typowych wartości cechy statystycznej na osi liczbowej.
Krzysztof Jurek Statystyka Spotkanie 4. Miary zmienności m ó wią na ile wyniki są rozproszone na konkretne jednostki, pokazują na ile wyniki odbiegają
(dla szeregu szczegółowego) Średnia arytmetyczna (dla szeregu szczegółowego) Średnią arytmetyczną nazywamy sumę wartości zmiennej wszystkich jednostek.
Wykład 14 Termodynamika cd..
Termodynamika cd. Wykład 2. Praca w procesie izotermicznego rozprężania gazu doskonałego V Izotermiczne rozprężanie gazu Stan 1 Stan 2 P Idealna izoterma.
BIOSTATYSTYKA I METODY DOKUMENTACJI
BIOSTATYSTYKA I METODY DOKUMENTACJI
Dane INFORMACYJNE (do uzupełnienia)
Dane informacyjne: Gimnazjum im. Marii Skłodowskiej-Curie
Metody ilościowe w logistyce
Wykład 4. Rozkłady teoretyczne
Przykłady Zastosowania Średnich W Geometrii
Średnie i miary zmienności
Opracowała: Joanna Wasiak
Elementy Rachunku Prawdopodobieństwa i Statystyki
Przegląd Projektu Zakres nauczania Przedział wiekowy Cele Matematyka
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Testy nieparametryczne
Dane INFORMACYJNE Nazwa szkoły: Zespół Szkół nr 5 w Szczecinku i Zespół Szkół w Opalenicy ID grupy: 97/41_mf_g2 i 97/71_mf_g1 Kompetencja:
Statystyka ©M.
Statystyka i opracowanie wyników badań
HARALD KAJZER ZST NR 2 im. M. Batko
Planowanie badań i analiza wyników
Analiza struktury na podstawie parametrów klasycznych i pozycyjnych
Statystyka matematyczna czyli rozmowa o znaczeniu liczb Jan Bołtuć Piotr Pastusiak Wykorzystano materiały z:
STATYSTYKA Pochodzenie nazwy:
Pochodna funkcji jednej zmiennej. Pochodna wektora.
Statystyka medyczna Piotr Kozłowski
1 informatyka +. 2 TYTUŁ: Podstawowe statystyki wykorzystywane do analizowania danych AUTOR: A. Brzostek, P. Królikowski.
Statystyka w doświadczalnictwie Wydział Technologii Drewna SGGW Studia II stopnia Wykład 3.
Analiza wariancji ANOVA czynnikowa ANOVA
Repetytorium z probabilistyki i statystyki
Podstawowe pojęcia i terminy stosowane w statystyce
Statystyczna analiza danych w praktyce
Jak mierzyć asymetrię zjawiska? Wykład 5. Miary jednej cechy  Miary poziomu  Miary dyspersji (zmienności, zróżnicowania, rozproszenia)  Miary asymetrii.
Statystyczna analiza danych
Statystyczna analiza danych
Statystyczna analiza danych
Statystyczna analiza danych
ze statystyki opisowej
Mierniki dynamiki zjawisk. Indeksy dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii.
Analiza tendencji centralnej „Człowiek – najlepsza inwestycja”
Szkoła Podstawowa w Zofiówce Zofiówka Rozporządzenie MEN w sprawie warunków i sposobu oceniania, klasyfikowania i promowania uczniów i słuchaczy.
Projektowanie kwestionariusza
STATYSTYKA – kurs podstawowy wykład 2 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
STATYSTYKA – kurs podstawowy wykład 11
Niepewności pomiarów. Błąd pomiaru - różnica między wynikiem pomiaru a wartością mierzonej wielkości fizycznej. Bywa też nazywany błędem bezwzględnym.
Statystyka Wykłady dla II rok Geoinformacji rok akademicki 2012/2013
Jak mierzyć zróżnicowanie zjawiska?
Małgorzata Podogrodzka, SGH ISiD
Statystyka matematyczna
Statystyka Alfred Stach WYKŁAD rok akademicki 2013/2014
Estymacja i estymatory
MIARY STATYSTYCZNE Warunki egzaminu.
Korelacja i regresja liniowa
Zapis prezentacji:

Statystyczna analiza danych Wykład 1 Statystyka opisowa Dr Anna ADRIAN 

Wyróżnia się następujące grupy parametrów statystycznych: Statystyka Opisowa Wyróżnia się następujące grupy parametrów statystycznych: Miary położenia (klasyczne i pozycyjne) Miary zmienności Miary asymetrii i koncentracji Graficzna interpretacja statystyk 

Wartości średnie Średnia arytmetyczna Średnia ważona, gdzie wagi wi>0 Średnia geometryczna Średnia harmoniczna 

Średnie: sh<=sg<=s Arytmetyczna Jest najlepszą miarą charakteryzującą rozkład cechy ale jest zbyt wrażliwa na wartości brzegowe Zamiast czystej wersji oblicza się często średnią ważoną Harmoniczna jest odwrotnością średniej arytmetycznej-stosowana gdy wartości podawane są w jednostkach względnych(km/h) Geometryczna- stosowana gdy zjawiska ujmowane są dynamicznie 

Mediana –wzór interpolacyjny dla zmiennej ciągłej Medianą rozkładu empirycznego Me nazywamy taką wartość cechy, że co najmniej połowa jednostek zbiorowości ma wartość cechy nie większą niż Me i jednocześnie połowa jednostek ma wartość cechy nie mniejszą niż Me. Czyli dystrybuanta empiryczna Fn(Me)1/2 Dla zmiennej losowej ciągłej medianę oblicza się wg wzoru: gdzie xm- dolna granica przedziału zawierającego medianę hm,nm- odpowiednio rozpiętość i liczebność przedziału mediany 

Mediana Wzór Pearsona na relacje pomiędzy Mo, Me, oraz dla rozkładów symetrycznych i umiarkowanie asymetrycznych 25% wartości 25% wartości 25% wartości 25% wartości Q1 Mediana Q3 Rozstęp kwartylowy max  min Rozstęp

Kwantyle Kwantylem rzędu p w rozkładzie empirycznym nazywamy taką wartość zmiennej xp, dla której, jako pierwszej , dystrybuanta empiryczna spełnia relację F(xp) p, 0<p<1 Kwartyle Qk, są to kwantyle rzędu k/4, k=1,2,3 Kwartyle są wykorzystywane do określenia pozycyjnej miary zróżnicowania, nazywanej odchyleniem ćwiartkowym, którym jest wielkość Q, określona wzorem 

Graficzne wyznaczanie mody 

Moda (dominanta) W rozkładach empirycznych określa się dominantę (modę), tj. najczęściej występującą wartość cechy gdzie x0 - dolna granicą przedziału w którym występuje moda, hm - rozpiętość przedziału klasowego, nm, nm-1, nm+1- liczebności odpowiednio przedziału z modą, poprzedniego i następnego 

Miary zmienności dzielą się na miary klasyczne i pozycyjne. miary pozycyjne : rozstęp, odchylenie ćwiartkowe, współczynnik zmienności miary klasyczne: wariancja, odchylenie standardowe, odchylenie przeciętne, współczynnik zmienności 

Miary zmienności Rozstęp R=xmax – xmin Odchylenie ćwiartkowe Odchylenie przeciętne Współczynnik zmienności 

Miary zmienności Wariancja Odchylenie standardowe Współczynnik zmienności - klasyczny 

Miary zmienności – interpretacja graficzna Na rysunku pokazano dwa diagramy częstości (1) i (2). Dla uproszczenia miary położenia (średnia, mediana i modalna) są sobie równe i identyczne dla obu zbiorowości. Mniejsze rozproszenie wokół średniej występuje w zbiorowości (1). Diagram jest smuklejszy i wyższy. Większe rozproszenie wokół średniej występuje w zbiorowości (2). Diagram jest bardziej rozłożysty i niższy. Odchylenie standardowe w zbiorowości (1) jest mniejsze niż w zbiorowości (2) s1  s2 

Praktyczne wykorzystanie miar zmienności Przedział TYPOWYCH wartości cechy (miary klasyczne) Przedział taki ma tą własność, że około70% jednostek badanej zbiorowości charakteryzuje się wartością cechy należącą do tego przedziału. 

Reguła „3 sigma” 

Porządkowanie zbioru danych identyfikacja omyłek ( błędów grubych) Zapotrzebowanie 79 Wartości mniejsze o rząd wielkości 82 338 632 634 1534 Wartości większe o rząd wielkości 1600 2427 

