Co to są rozkłady normalne? - symetryczność - kształt dzwonowy („bell-shaped curve”) - jednomodalność („unimodal”) - średnia i odchylenie std. determinują całkowicie kształt krzywej - średnia arytmetyczna, mediana oraz dominanta są równe
Średnia i odchylenie standardowe całkowicie determinują kształt Rozkład normalny średnia arytmetyczna odchylenie standardowe Punkt przegięcia Średnia i odchylenie standardowe całkowicie determinują kształt rozkładu normalnego Odchylenie standardowe jest odległością pomiędzy średnią a punktem przegięcia krzywej rozkładu
Cechy rozkładu normalnego - c.d. (normal probability distribution) 1. Najważniejszy rozkład w statystyce. 2. Jest rozkładem zmiennej mierzonej w skali ciągłej. 3. Prawdopodobieństwo jakiejkolwiek pojedynczej wartości jest niedefiniowalne. 4. Prawdopodobieństwo określa się dla przedziałów. 5. Zakres dziedziny funkcji: -/+ nieskończoność
Przykłady zmiennych charakteryzujących się rozkładem normalnym 1. Wzrost 2. Waga 3. Poziom IQ 4. Temperatura ciała 5. Średnia roczna temperatura 6. Systematyczne pomiary tej samej wielkości 7. Suma co najmniej 12 liczb o dowolnym rozkładzie Przykłady zmiennych, których rozkład nie jest normalny 1. Dobowa temperatura w okresie zimowym 2. Prędkość wiatru 3. Średnia dobowa temperatura w roku 4. Długość ciąży kobiet w USA 5. Długość dzioba zięby afrykańskiej
Example - Heights of U.S. Adults Female and Male adult heights are well approximated by normal distributions: YF~N(63.7,2.5) YM~N(69.1,2.6)
μ +/- 1σ, znajduje się 68.3% obserwacji,
Test 3 sigma (3 σ)
Standaryzowany rozkład normalny Charakteryzuje się średnią = 0 i odchyleniem standardowym = 1 μ = 0, σ = 1 Standaryzacja X - dane oryginalne, Z - dane standaryzowane Statystyka Z informuje o tym o ile odchyleń standardowych oryginalna zmienna różni się od średniej.
Zaleta standaryzowanego rozkładu normalnego Korzystając z tablic statystycznych można bezpośrednio określić prawdopodobieństwo wystąpienia wartości z danego zakresu oraz percentyle. Percentyl jest jedną z 99 wartości, które dzielą szereg monotoniczny na 100 równych części, tak, że każda część reprezentuje 1% populacji 1 percentyl odcina 1% najniższych wartości 98 percentyl odcina 98% najniższych wartości
funkcja prawdopodobieństwa NIE przewyższenia wartości Z Dystrybuanta funkcja prawdopodobieństwa NIE przewyższenia wartości Z Dystrybuanta rozkładu normalnego Z