Wykład 4. Rozkłady teoretyczne Zmienna losowa jest to taka zmienna, która w wyniku doświadczenia przyjmuje wartość z pewnego zbioru liczb rzeczywistych z określonym prawdopodobieństwem. Rozkład normalny Podstawowym rozkładem zmiennej losowej ciągłej jest rozkład normalny (Gaussa-Laplace’a). Zmienna losowa X ma rozkład normalny, jeśli jej funkcja gęstości - określona dla wszystkich rzeczywistych wartości x - da się przedstawić za pomocą wzoru (4.1):
Wykład 4. Rozkłady teoretyczne Realizacje zmiennej losowej o rozkładzie normalnym są określone w przedziale - < x < + Funkcja gęstości rozkładu normalnego, dana wzorem 4.1. ma następujące własności: 1) jest symetryczna względem prostej x = m (własność symetryczności), 2) osiąga maksimum dla x = m (własność jednomodalności), jej ramiona mają dwa punkty przegięcia dla x1 m- σ; oraz x2 m + σ , 4) jest całkowicie określona przez dwa parametry: parametr m decyduje o przesunięciu krzywej, natomiast parametr σ decyduje o smukłości krzywej; własność określoności wyróżniamy zapisem N(m; σ) .
Wykład 4. Rozkłady teoretyczne; rozkład normalny
Wykład 4. Rozkłady teoretyczne; rozkład normalny Rozkład normalny N (0,1) nazywa się standardowym rozkładem normalnym. Jego dystrybuanta wyraża się wzorem (4.2): gdzie (4.3)
Wykład 4. Rozkłady teoretyczne; dystrybuanta rozkładu normalnego
Wykład 4. Rozkłady teoretyczne; rozkład normalny Funkcje związane z rozkładem normalnym w Excelu: A. Dowolny rozkład normalny: a) dane są: średnia, odchylenie standardowe, wartość empiryczna x - poszukujemy pole czyli „lewy ogonek”: - [fx]=>statystyczne=>rozkład.normalny ==>dane: m, s, x oraz jako „skumulowany” wpisać jako wartość logiczną „1” b) dane jest prawdopodobieństwo, średnia, odchylenie standardowe - poszukujemy kwantyl empiryczny x, - [fx]=>statystyczne=>rozkład.normalny ==>dane
Wykład 4. Rozkłady teoretyczne; rozkład normalny B. Rozkład normalny standaryzowany a) dany jest kwantyl - poszukujemy pole „lewy ogonek”: - [fx]=>statystyczne=>rozkład.normalny.S==> kwantyl b) dane jest pole - poszukujemy kwantyl rozkładu normalnego: - [fx]=>statystyczne=>rozkład.normalny.S.odw==> pole pod krzywą rozkładu normalnego od - do szukanego x. Obliczanie prawdopodobieństw P(a<X<b) dla zmiennej losowej o rozkładzie normalnym można przedstawić przy pomocy zmiennej standaryzowanej U(0,1) w sposób następujący:
Wykład 4. Rozkłady teoretyczne; wyznaczanie pola pod krzywą rozkładu normalnego
Wykład 4. Rozkłady teoretyczne; wyznaczanie pola pod krzywą rozkładu normalnego Przykład 1: Temperatura ciała ludzkiego jest zmienną losową o rozkładzie normalnym ze średnią wynoszącą 36,6oC oraz odchyleniem standardowym . Oblicz prawdopodobieństwo zdarzenia, że losowo wybrany pacjent pewnego szpitala będzie miał temperaturę ciała: a) mniejszą niż 36,3oC, b) większą niż 37,6 oC, c) większą niż 37,9 oC ale mniejszą niż 38,2oC. ad. a)
Wykład 4. Rozkłady teoretyczne; wyznaczanie pola pod krzywą rozkładu normalnego ad. b) P(X>37,6) P(X>37,6)=P(u>2)=1-F(2)=1-0,97725=0,02275, patrz rys. 4.3.
Wykład 4. Rozkłady teoretyczne; wyznaczanie pola pod krzywą rozkładu normalnego ad. c)
Wykład 4. Rozkłady teoretyczne; własności i zastosowania rozkładu normalnego standaryzowanego 1) Rozkład normalny standaryzowany N(0;1) ma E(u) = 0 oraz S2 = 1; 2) Pole pod krzywą rozkładu normalnego standaryzowanego N(0;1) jest równe jedności; 3) Punkty przegięcia: u1 = -1 oraz u2 = +1; 4) Współczynnik asymetrii alfa 3 = 0; 5) Współczynnik koncentracji alfa 4 = 3; 6) Mo = Me = E(u) 7) Q1 = - 0,6745; Q3 = +0,6745
Wykład 4. Rozkłady teoretyczne; własności i zastosowania rozkładu normalnego standaryzowanego W przedziale od – 1 do + 1 znajduje się ponad 68% zbiorowości, od – 2 do + 2 około 95%, od – 3 do + 3 ponad 99% całej zbiorowości; 9) Rozkład normalny jako rozkład błędów w teorii pomiarów; 10) Występowanie rozkładu normalnego w świecie przyrody: mity i rzeczywistość; 11) Rzadkość występowania rozkładu normalnego w zjawiskach społeczno-ekonomicznych;
Wykład 4. Rozkłady teoretyczne; własności i zastosowania rozkładu normalnego standaryzowanego 12) Miejsce rozkładu normalnego w teorii statystyki: a. aproksymacja statystyczna, b. przybliżenie krzywą Gaussa – Laplace’a innych rozkładów teoretycznych ciągłych (Studenta, , Fishera – Snedecora) i dyskretnych (dwumianowy, Poissona) c. estymacja statystyczna, d. weryfikacja hipotez statystycznych, e. ocena niezbędnej wielkości próby w badaniach reprezentacyjnych..
Wykład 4. Rozkłady teoretyczne; Rozkład Studenta
Wykład 4. Tablice rozkładu Studenta „dwuogonowe” Tablica 4.2. Kwantyle rozkładu Studenta z dwoma obszarami krytycznymi ("dwugoniaste") dla małej liczby stopni swobody. Liczba stopni 0,50 0,40 0,30 0,20 0,10 0,04 0,02 0,01 0,002 swobody 1 1,00 1,38 1,96 3,08 6,31 15,89 31,82 63,66 318,29 2 0,82 1,06 1,39 1,89 2,92 4,85 6,96 9,92 22,33 3 0,76 0,98 1,25 1,64 2,35 3,48 4,54 5,84 10,21 4 0,74 0,94 1,19 1,53 2,13 3,00 3,75 4,60 7,17 5 0,73 0,92 1,16 1,48 2,02 2,76 3,36 4,03 5,89 6 0,72 0,91 1,13 1,44 1,94 2,61 3,14 3,71 5,21 7 0,71 0,90 1,12 1,41 2,52 3,50 4,79 8 0,89 1,11 1,40 1,86 2,45 2,90 4,50 9 0,70 0,88 1,10 1,83 2,40 2,82 3,25 4,30 10 1,09 1,37 1,81 2,36 3,17 4,14 11 1,36 1,80 2,33 2,72 3,11 4,02 12 0,87 1,08 1,78 2,30 2,68 3,05 3,93 13 0,69 1,35 1,77 2,28 2,65 3,01 3,85 14 1,76 2,26 2,62 2,98 3,79 15 1,07 1,34 1,75 2,25 2,60 2,95 3,73
Wykład 5 Analiza współzależności. Analiza wariancji a) analiza jednoczynnikowa (podział wg 1 kryterium) Porównanie średnich w dowolnej liczbie subpopulacji (prób) o rozkładzie normalnym lub zbliżonym do normalnego oraz o jednakowych wariancjach. H0: M1 = M2 = M3 = . . . (5.1) H1: M1 M2 M3 . . . (5.2)
Wykład 5 Analiza współzależności. Analiza wariancji Do weryfikacji hipotezy (5.1) wykorzystuje się test Fishera-Snedecora o postaci: F = MSB/MSE, gdy MSB > MSE, (5.3) lub F = MSE/MSB, gdy MSB < MSE, (5.4) gdzie: MSB – średni kwadrat odchyleń od średniej między grupami (próbami), MSE – średni kwadrat odchyleń od średniej wewnątrz grup
Wykład 5 Analiza współzależności. Analiza wariancji Tablica 5.1. Analiza wariancji z uwzględnieniem liczby zmiennych (grup) oraz liczby obserwacji:
Wykład 5 Analiza współzależności. Analiza wariancji Ogólna suma kwadratów odchyłek (5.5):
Wykład 5 Analiza współzależności. Analiza wariancji Ważona suma kwadratów odchyłek między średnimi grupowymi a średnią ogólną (5.6):
Wykład 5 Analiza współzależności. Analiza wariancji Suma kwadratów odchyłek między realizacjami zmiennej X a poszczególnymi średnimi wewnątrz grup (podpróbek) (5.7) : SSE = SST – SSB Wariancja między grupami (5.8):
Wykład 5 Analiza współzależności. Analiza wariancji gdzie w nawiasie okrągłym w liczniku (5.8) mamy odchyłki między średnimi grupowymi (lub przeciętnymi z poszczególnych podpróbek) a średnią ogólną dla całej próby. Wariancja wewnątrz grup (wewnątrz podpróbek) (5.9):
Przykład 5.1. Ceny wędlin w wylosowanych sklepach detalicznych Poznania. Czy ceny mięsa pochodzącego od różnych rzeźników różnią się istotnie?
Przykład 5.1. c.d.
Wykład 5 Analiza współzależności. Analiza wariancji F = 1,47869/0,68796 =2,1494. Na poziomie istotności α = 0,05 i liczbach stopni swobody: k-1=4-1 = 3 (licznik) oraz n-k=26-4=22 (mianownik) w rozkładzie Fishera-Snedecora odczytujemy: F0,05;3;22 = 3,05 > F = 2,1494 Nie można więc odrzucić H0, że średnie w populacji generalnej są sobie równe. Brak zatem podstaw do stwierdzenia, że mięso pochodzące od poszczególnych rzeźników różni się pod względem cen.
Wykład 6 Analiza współzależności Wykład 6 Analiza współzależności. Korelacja cech jakościowych i ilościowych 1. Rodzaje zależności a) Kryterium 1 - przyczynowo-skutkowe, - korelacyjne, - symptomatyczne, bilansowe b) Kryterium 2 - zależność funkcyjna, · zależność stochastyczna, · zależność korelacyjna. c) Kryterium 3 - liniowe, - krzywoliniowe, - wg formalnej postaci równań
Wykład 6 Rodzaje zależności (kryterium 3).
Wykład 6 Rodzaje zależności (kryterium 3).
Wykład 6 Rodzaje zależności (kryterium 3).
Wykład 6 Rodzaje zależności (kryterium 3).
Wykład 6 Rodzaje zależności (kryterium 3).
Wykład 6 Rodzaje zależności (kryterium 3).
Wykład 6 Rodzaje zależności (kryterium 3).
Wykład 6 Rodzaje zależności (kryterium 3).