Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

 Wykład 1 Statystyka opisowa Dr Anna ADRIAN Statystyczna analiza danych.

Podobne prezentacje


Prezentacja na temat: " Wykład 1 Statystyka opisowa Dr Anna ADRIAN Statystyczna analiza danych."— Zapis prezentacji:

1  Wykład 1 Statystyka opisowa Dr Anna ADRIAN Statystyczna analiza danych

2  Statystyka Opisowa Wyróżnia się następujące grupy parametrów statystycznych: Miary położenia (klasyczne i pozycyjne) Miary zmienności Miary asymetrii i koncentracji Graficzna interpretacja statystyk

3  Wartości średnie Średnia arytmetyczna Średnia ważona, gdzie wagi w i >0 Średnia geometryczna Średnia harmoniczna

4  Średnie: s h <=s g <=s Arytmetyczna –Jest najlepszą miarą charakteryzującą rozkład cechy ale jest zbyt wrażliwa na wartości brzegowe –Zamiast czystej wersji oblicza się często średnią ważoną Harmoniczna jest odwrotnością średniej arytmetycznej-stosowana gdy wartości podawane są w jednostkach względnych(km/h) Geometryczna- stosowana gdy zjawiska ujmowane są dynamicznie

5  Mediana –wzór interpolacyjny dla zmiennej ciągłej gdzie x m - dolna granica przedziału zawierającego medianę h m,n m - odpowiednio rozpiętość i liczebność przedziału mediany Medianą rozkładu empirycznego Me nazywamy taką wartość cechy, że co najmniej połowa jednostek zbiorowości ma wartość cechy nie większą niż Me i jednocześnie połowa jednostek ma wartość cechy nie mniejszą niż Me. Czyli dystrybuanta empiryczna F n (Me)  1/2 Dla zmiennej losowej ciągłej medianę oblicza się wg wzoru:

6  Mediana 25% wartości Mediana Q1 Q3 Rozstęp Rozstęp kwartylowy min max Wzór Pearsona na relacje pomiędzy Mo, Me, oraz dla rozkładów symetrycznych i umiarkowanie asymetrycznych

7  Kwantyle Kwantylem rzędu p w rozkładzie empirycznym nazywamy taką wartość zmiennej x p, dla której, jako pierwszej, dystrybuanta empiryczna spełnia relację F(x p )  p, 0

8  Graficzne wyznaczanie mody Mo

9  Moda (dominanta) W rozkładach empirycznych określa się dominantę (modę), tj. najczęściej występującą wartość cechy gdzie x 0 - dolna granicą przedziału w którym występuje moda, h m - rozpiętość przedziału klasowego, n m, n m-1, n m+1 - liczebności odpowiednio przedziału z modą, poprzedniego i następnego

10  Miary zmienności Miary zmienności dzielą się na miary klasyczne i pozycyjne. miary pozycyjne : rozstęp, odchylenie ćwiartkowe, współczynnik zmienności miary klasyczne: wariancja, odchylenie standardowe, odchylenie przeciętne, współczynnik zmienności

11  Miary zmienności Rozstęp R=x max – x min Odchylenie ćwiartkowe Odchylenie przeciętne Współczynnik zmienności

12  Miary zmienności Wariancja Odchylenie standardowe Współczynnik zmienności - klasyczny

13  Miary zmienności – interpretacja graficzna Na rysunku pokazano dwa diagramy częstości (1) i (2). Dla uproszczenia miary położenia (średnia, mediana i modalna) są sobie równe i identyczne dla obu zbiorowości. Mniejsze rozproszenie wokół średniej występuje w zbiorowości (1). Diagram jest smuklejszy i wyższy. Większe rozproszenie wokół średniej występuje w zbiorowości (2). Diagram jest bardziej rozłożysty i niższy. Odchylenie standardowe w zbiorowości (1) jest mniejsze niż w zbiorowości (2) s1  s2

14  Praktyczne wykorzystanie miar zmienności Przedział TYPOWYCH wartości cechy (miary klasyczne) Przedział taki ma tą własność, że około70% jednostek badanej zbiorowości charakteryzuje się wartością cechy należącą do tego przedziału.

15  Reguła „3 sigma”

16  Porządkowanie zbioru danych identyfikacja omyłek ( błędów grubych) Zapotrzebowanie 79 Wartości mniejsze o rząd wielkości Wartości większe o rząd wielkości

17 


Pobierz ppt " Wykład 1 Statystyka opisowa Dr Anna ADRIAN Statystyczna analiza danych."

Podobne prezentacje


Reklamy Google