Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

Podobne prezentacje


Prezentacja na temat: "dr hab. Dariusz Piwczyński, prof. nadzw. UTP"— Zapis prezentacji:

1 dr hab. Dariusz Piwczyński, prof. nadzw. UTP
Wprowadzenie do statystyki matematycznej Miary tendencji centralnej i rozproszenia. dr hab. Dariusz Piwczyński, prof. nadzw. UTP

2 Statystyka Nauka poświęcona metodom badania zjawisk masowych. Polega na systematyzowaniu, obserwowaniu cech ilościowych i jakościowych oraz przedstawieniu wyników w postaci zestawień tabelarycznych, wykresów, posługuje się rachunkiem prawdopodobieństwa.

3 Po co nam statystyka? Z ilu pomiarów należy obliczyć średnią? Ilu pomiarów należy użyć, aby mieć do tej średniej zaufanie? Ile winniczków powinniśmy poddać kontroli masy ciała?

4 Czy istnieje różnica między grubością rogówki przed założeniem szkieł kontaktowych a w 4. tygodniu ich noszenia?

5 Czy kobiety i mężczyźni w równym stopniu lubią słodycze?

6 Szeregi czasowe

7 Dzietność kobiet w latach 1960-2008

8 Czy istnieje zależność między masą noworodków a oceną w skali APGAR?

9 Statystyka matematyczna
Dział matematyki zajmujący się metodami wnioskowania o prawach prawdopodobieństwa rządzących danym zjawiskiem na podstawie obserwacji tego zjawiska. Statystyka matematyczna zajmuje się badaniem własności zbiorów na podstawie znajomości własności ich części.

10 Populacja generalna Zbiorowość statystyczna, zbiór dowolnych elementów, nieidentycznych z punktu widzenia badanej cech. Z reguły jest ona dla nas niedostępna w całości do badań, jednak nas interesuje. Przykład: zbiór wszystkich osobników gatunku Ślimak winniczek, Kret.

11 Populacja próbna Podzbiór populacji generalnej, który podlega bezpośrednio badaniu ze względu na rozpatrywaną cechę, co pozwala na wyciągnięcie wniosków o kształtowaniu się wartości cechy w całej populacji generalnej.

12 Próba powinna być reprezentatywna!
Powinna w jak najlepszy sposób oddawać strukturę populacji. Najprostszym przykładem takiej próby jest próba losowa prosta, otrzymywana jest, gdy każdy element populacji ma taką samą szansę dostania się do próby.

13 Zmienna losowa Cecha, a wartości tej cechy poszczególnych elementów populacji to realizacja zmiennej. Zmienna losowa może przyjmować z określonym prawdopodobieństwem każdą z wartości należących do wyszczególnionego zbioru, np. rzut kostką do gry – zmienna losowa, czyli cecha może przyjmować dowolną wartość ze zbioru od 1 do 6. Każdej wartości zmiennej losowej możemy przyporządkować jej prawdopodobieństwo wystąpienia.

14 Cechy ilościowe jakościowe

15 Cecha ilościowa Wynik zjawiska lub procesu, który daje się wyrazić ilościowo (za pomocą liczb). Cechy ilościowe oznaczane są za pomocą liter: X, Y, Z.

16 Cechy ilościowe, skokowe
tzw. dyskretne. W badaniach biologicznych cechy skokowe wyrażane są za pomocą liczb naturalnych. Na ogół przyjmują one kilka lub kilkanaście wartości liczbowych. Ich modelami matematycznymi są zmienne losowe skokowe. Przykład – liczba urodzonych dzieci.

17 Cechy ilościowe, ciągłe
Przyjmują wszystkie wartości z pewnego przedziału liczbowego liczb rzeczywistych. Ich modelami matematycznymi są zmienne losowe ciągłe, często ich rozkład prawdopodobieństwa jest zbliżony do rozkładu normalnego.

18 Cecha jakościowa Cechy, których nie możemy zapisać w postaci liczby, np. kolor oczu.

19 Zmienne dziecko Apgar masa dlugosc mleko jaja ospa piers kodPiers
matka 1 6 2400 49 10 9 3 31 2 3750 55 7 22 4050 54 23 4 4000 11 5 8 3300 53 3200 52 12 36 33 3850 25

20 Zanim rozpoczniemy analizę statystyczną konieczne jest ustalenie skali, w jakiej wyrażana jest nasza cecha!!!

21 Skale pomiaru, nominalna
nominalna – porządek właściwie dowolny, np.: rasa zwierzęcia, siedlisko, forma spędzania wolnego czasu     nominalna dychotomiczna, np. płeć, stan zdrowia („CHORY, ZDROWY”)

22 Skale pomiaru, porządkowa
Wartościom cechy można przypisać rangi. Musi zatem istnieć możliwość logicznego uporządkowania wartości zmiennej. Przykład: wykształcenie osoby (podstawowe, zawodowe, średnie, wyższe), stan finansów (zły, średni, dobry, bardzo dobry)

23 Skale pomiaru, przedziałowa
pozwala uporządkować wartości zmiennej, zakłada się, że dotyczy zbioru liczb rzeczywistych.

24 Rozkład zmiennej losowej
Polega na przyporządkowaniu każdej wartości zmiennej losowej prawdopodobieństwo jej wystąpienia.

25 Doświadczenie Postępowanie, które służy weryfikacji istniejącego stanu wiedzy lub pozyskaniu nowych informacji. Polega ono na rozpoczęciu i obserwowaniu pewnego zjawiska w warunkach kontrolowanych.

26 Jednostka doświadczalna,
Roślina lub zwierzę poddane działaniu danego poziomu czynnika doświadczalnego i w odniesieniu, do której prowadzimy obserwację cechy ilościowej, będącej odpowiedzią na działanie czynnika.

27 Czynnik doświadczalny
Rodzaj zmiennej, która jest kontrolowana w doświadczeniu i która jest przyczyną kształtowania się cech zjawisk dotyczących głównie zwierząt, roślin czy środowiska, w którym bytują.

28 Poziom czynnika doświadczalnego
Określone przez badacza warianty czynnika, w ramach których zamierza się prowadzić obserwacje nad kształtowaniem się interesujących nas cech. Gatunek: Carabus auratus Carabus cancellatus Carabus granulatus Carabus hortensis Carabus violaceus

29 Doświadczenia jednoczynnikowe W jednym czasie analizujemy wpływ jednego czynnika na cechy ilościowe roślin lub zwierząt, wieloczynnikowe W jednym czasie badamy wpływ wielu czynników na cechy ilościowe roślin lub zwierząt.

30 Statystyczny opis zmiennej losowej

31 Statystyki Pewne funkcje wartości pomiarowych służące do wyznaczenia przybliżonych wartości parametrów statystycznych. Należy do nich, m. in.: mediana, średnia arytmetyczna. Statystyki dotyczą populacji próbnej. Oznaczane są literami łacińskimi. Statystyka elementarna zajmuje się obliczaniem statystyk.

32 Parametry Parametry charakteryzują rozkład badanej cechy w populacji generalnej. Dotyczą populacji generalnej! Oznaczane są literami greckimi ,  Parametry Statystyki Średnia Wariancja 2 s2 Odchylenie standardowe s

33 Miary położenia i zmienności, podział

34 Podział miar statystycznych, miary asymetrii i koncentracji
Asymetria rozkładu: skośność Koncentracja rozkładu: kurtoza

35 Miary położenia KLASYCZNE pozwalają określić, gdzie w zbiorze wartości liczbowych znajdują się wartości badanej cechy, tym samym pozwalają na umiejscowienie rozkładu cechy.

36 Średnia arytmetyczna gdzie: N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.

37 Średnia arytmetyczna ważona
Stosowana wtedy, gdy poszczególnym obserwacjom przypisujemy wagi związane z ich znaczeniem. wi – wagi przypisane poszczególnym obserwacjom. Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy egzaminowi wagę 3, a kolokwium wagę 1.

38 Własności średniej arytmetycznej
Jest to taka wartość zmiennej, która podstawiona na miejsce wszystkich poszczególnych wartości nie zmieni ich sumy Suma odchyleń poszczególnych wartości od średniej arytmetycznej jest równa zero. Suma kwadratów odchyleń poszczególnych wartości zmiennej od średniej arytmetycznej jest najmniejsza w porównaniu z sumami kwadratów odchyleń od jakiejkolwiek innej liczby w szeregu.

39 Średnia ważona liczebnościami (dane przedstawione w formie szeregu rozdzielczego)
gdzie: N – liczba wszystkich jednostek, ni - liczba jednostek posiadających i-tą wartość cechy, k – liczba klas, xi – i-ta wartość cechy

40 Średnia ważona

41 Szereg rozdzielczy zawiera pomiary pogrupowane na klasy. W ramach szeregu rozdzielczego tworzone są przedziały klasowe oraz zliczana jest liczba pomiarów w każdym przedziale klasowym.

42 Szereg rozdzielczy

43 Średnia harmoniczna gdzie: xi – wartość cechy, N – liczebność odnosząca się do wartości cechy xi. Średnia harmoniczna jest odwrotnością średniej arytmetycznej z odwrotności elementów próby! Stosowana m.in. w analizie wariancji układów nieortogonalnych (nieproporcjonalnych - przy nierównej ilości osobników w grupach). Nie można jej obliczyć, gdy jakaś wartość cechy równa się „0” lub jest ujemna. W badaniach, w których obserwowana jest wydajność w czasie – rozkład cechy odbiega od symetrycznego, ma przebieg hiperboliczny.

44 Średnia harmoniczna. Przykład (Dobek, Szwaczkowski)
W gospodarstwie produkującym jaja stwierdzono, że pierwsze 1000 jaj pozyskiwano z prędkością 120 jaj/tydzień, drugi 1000 z prędkością 150 jaj/tydzień, a ostatni 1000 z prędkością 100 jaj/tydzień. Jaka była średnia wydajność tygodniowa w okresie, w którym uzyskano 3000 jaj?

45 Średnia geometryczna Stosowana, gdy jedna z wartości skrajnych zmiennej bardzo różni się od pozostałych (duże rozproszenie wartości skrajnych), w takim przypadku średnia geometryczna bardziej prawidłowo scharakteryzuje położenie danej cechy w szeregu liczbowym niż średnia arytmetyczna. Miara popularna w badaniach mikrobiologicznych, zmienne posiadają rozkłady prawostronne.

46 Arytmetyczna, geometryczna i harmoniczna

47 Obliczenie średniej geometrycznej
jest równoznaczne z obliczeniem średniej arytmetycznej: a następnie powrót do oryginalnej skali pomiaru poprzez transformację: co jest równoznaczne z obliczeniem średniej geometrycznej

48 Miary położenia POZYCYJNE wskazują wartość cechy, która odgrywa w szeregu szczególną rolę, np. dzieli szereg na dwie połowy. Punktem wyjścia do ich określenia jest uporządkowanie szeregu liczbowego, konieczna jest przy tym znajomość liczebności.

49 Dominanta (Mo) Zwana wartością szczytowa, modą, wartością modalną.
Jest to taka wartość zmiennej, która występuje w populacji największą ilość razy. Jest najbardziej typowa dla danego zjawiska. Jednak nie należy jej obliczać, gdy rozkład danej cechy nie posiada jednego, wyraźnie zaznaczonego maksimum liczebności. Wartość modalna wyznacza szczyt krzywej liczebności. Pozwala scharakteryzować populację pod względem jej typowości.

50 Kwartyle (kwantyle) (Q1,Q2,Q3)
Są to takie wartości cechy, które pozwalają podzielić uporządkowany szereg liczbowy na 4 części. Kwartyl drugi dzieli szereg na połowy, zwany jest też medianą. Jeśli liczebności ćwiartek są liczbami parzystymi, to wartość kwartyli obliczamy jako średnią arytmetyczną z wartości kończących i rozpoczynających kolejne ćwiartki. W szeregu nieparzystym medianę stanowi środkowy wyraz szeregu.

51 Kwartyle stosujemy w odniesieniu do cech jakościowych trudno mierzalnych, w badaniach mikrobiologicznych przy określaniu średniej liczby drobnoustrojów.

52 MIARY ZMIENNOŚCI (DYSPERSJI)
Problem, jaki wiąże się z powyższym zagadnieniem, to odpowiedź na pytanie: jak bardzo poszczególne wartości cechy różnią się od siebie?

53 Rozstęp Najprostsza miara zmienności. Jest to tzw. obszar zmienności, określa on całkowitą zmienność cechy. Obliczany jest z poniższego wzoru: Ox=xmax-xmin Rozstęp jest traktowany jedynie jako wstępna miara zmienności z oczywistych względów (opieramy się jedynie o wartości skrajne).

54 Odchylenie ćwiartkowe

55 Średnie odchylenie przeciętne odchyleniem poszczególnych wartości zmiennej (xi) od średniej arytmetycznej.

56 Wariancja Wariancja jest średnią z kwadratów różnic średniej arytmetycznej od poszczególnych wartości cechy. W przypadku małych prób (poniżej 30) suma kwadratów dzielona jest przez N-1, w przeciwnym zaś przypadku przez N. Wariancja jest miarą, która nie posiada interpretacji.

57 Odchylenie standardowe
Jest to liczba mianowana. Pozwala ona określić typowy obszar zmienności wartości cechy. Wskazuje ono, o jaką wartość poszczególne wartości cechy odbiegają przeciętnie od średniej arytmetycznej. Im większe odchylenie standardowe, tym poszczególne obserwacje są bardziej oddalone od średniej arytmetycznej, tym większe jest rozproszenie próby. Mówi się, że próba jest mało wyrównana.

58 Wskaźnik zmienności Pearsona
Miary względnego zróżnicowania Stosowana w sytuacji, gdy badane zjawisko mierzone jest w różnych jednostkach miary lub kształtuje się na niejednakowym poziomie przeciętnym.

59 Przykład Badano stężenie jonów żelaza (mg/l) w dopływie do stawu wodnego. W tym celu wykonano 30 prób (tab. ). Oblicz podstawowe miary położenia klasyczne i pozycyjne oraz miary zmienności w zakresie badanej cechy.

60 Szereg nieuporządkowany
Szereg uporządkowany Kwartyle lp x x2 lp' 1 0,10 0,01 12 0,08 2 0,40 0,16 13 0,09 3 0,14 0,02 23 4 5 0,47 0,22 6 7 8 1,10 1,21 9 Q1 = 0,10 30 0,11 10 0,13 20 0,12 11 0,84 0,71 15 14 1,09 1,19 19 0,20 29 0,24 Me = (0, ,37) / 2 = 0,305 0,42 0,18 18 16 0,37 17 0,63 27 0,04 21 0,60 0,36 22 0,50 0,25 Q3 = 0,63 24 1,16 1,35 26 0,77 25 1,83 3,35 0,59 28 2,92 8,53 0,06 Suma 15,3100 19,0083

61 Skrzynka z wąsami

62 Wykres pudełkowy, objaśnienie
W tej ostatniej nie zaobserwowano wartości nietypowych, czyli nie znalazły się takie wartości cechy, które byłyby oddalone od krawędzi skrzynki więcej niż wynosi półtora odstępu międzykwartylowego (1,5 x IQR). Ponadto, można stwierdzić, że wszystkie cechy posiadają rozkład prawostronny, gdyż wartość mediany jest mniejsza niż średniej arytmetycznej.


Pobierz ppt "dr hab. Dariusz Piwczyński, prof. nadzw. UTP"

Podobne prezentacje


Reklamy Google