Rozkłady statystyk z próby dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium Analiz Ekonomicznych Szkoła Główna Handlowa w Warszawie
Próba losowa – przykład 1.
Zmienna losowa i próba losowa W zakresie rozważań teoretycznych, rezultat pierwszego skoku nie jest konkretną liczbą, lecz szeregiem możliwych do uzyskania (z różnym prawdopodobieństwem) rezultatów. Oznacza to, że jest to zmienna losowa. Próba losowa prosta – ciąg n zmiennych losowych (X 1, X 2,……X n ) niezależnych i posiadających jednakowe rozkłady, takie jak rozkład zmiennej losowej X w populacji generalnej.
Próba losowa – przykład 2.
m (średnia w populacji) x̄ (średnia z próby) Rozkład w populacji x x xx x x xx x x x x x x x x wartości z próby
Rozkłady z próby
Statystyka z próby i rozkład statystyki z próby Statystyka z próby to zmienna losowa będąca funkcją zmiennych losowych X 1, X 2,……X n stanowiących próbę losową. Rozkład statystyki z próby – jest rozkładem prawdopodobieństwa wszystkich możliwych wartości, jakie ta statystyka może przyjąć, jeżeli obliczamy je na podstawie badania prób losowych o tych samych rozmiarach, pobranych z określonej populacji.
I. Rozkłady dokładne statystyk z próby
Rozkład średniej arytmetycznej z próby
rozkład zmiennej losowej X odchylenie standardowe liczebnosć próbyrozkład średniej postać wystandaryzowana zmiennej n - dowolne n – małe, (n<120 lub n<30) n – duże (n>120)
Ad 1. Rozkład średniej arytmetycznej z próby dla populacji normalnej ze znanym odchyleniem standardowym, próba dowolonej liczebności.
Ad 2. Rozkład średniej arytmetycznej z próby dla populacji normalnej z nieznanym odchyleniem standardowym, próba mała.
Stopnie swobody (degree of freedom) – liczba niezależnych obserwacji w próbie. Liczba stopni swobody = liczba wszystkich pomiarów (która nie musi być równa liczbie wyników obserwacji) – liczba wszystkich ograniczeń (narzuconych na te pomiary). df = liczba pomiarów – liczba ograniczeń Ograniczenie – każda wielkość, która zostaje obliczona na podstawie tych samych pomiarów.
Stopnie swobody – przykład Przykład 1: W badaniu wylosowano 2 niezależne próby o znanych średnich. Próby zostały połączone. Liczebność próby 1. = n 1, Liczebność próby 2. = n 2. Odpowiedź: Jeżeli I próba składa się z n 1, a II próba z n 2 wyników obserwacji, to liczba stopni swobody (df) związana jest z odch.stand. dwóch średnich z próby wynosi: df = n 1 + n Przykład 2: 200 losowo wybranych g.d. zapytano o dochody. Dochody pogrupowano uzyskując 5 przedziałów. Nie była znana wartość oczekiwana ani odchylenie standardowe rozkładu. Otrzymano wartość testu 20,51. Ile jest stopni swobody? df = k – r – 1, gdzie k – liczba przedziałow r – liczba ograniczeń (założeń) df = 5 – 2 – 1 = 2
Prawdopodobieństwo w rozkładzie t-Studenta -t α,v t α,v Rozkład t-Studenta został stablicowany. Tablice zawierają wartości t α,v takie, że P(|t|≥ t α,v ) =α α/2 1-α f(t) t
Tablice rozkładu t-Studenta
Ad 3. Rozkład średniej arytmetycznej z próby dla populacji normalnej ze dowolnym odchyleniem standardowym, próba duża.
Rozkłady różnicy średnich arytmetycznych z dwóch prób
rozkład zmiennej losowej X odchylenie standardowe liczebność próby postać wystandaryzowana zmiennej
Ad 4. Rozkład różnicy średnich arytmetycznych z prób dla dwóch populacji normalnych przy znanych odchyleniach standardowych Założenia: X 1 : N(m 1, σ 1 ) X 2 : N(m 2,σ 2 ) σ 1,σ 2 znane n 1 i n 2 liczebności prób Wniosek: Wystandaryzowana postać zmiennej:
Ad 5. Rozkład różnicy średnich arytmetycznych z prób dla dwóch populacji normalnych przy nieznanych (ale jednakowych) odchyleniach standardowych Założenia: X 1 : N(m 1, σ) X 2 : N(m 2,σ) σ - nieznane, jednakowe n 1 i n 2 liczebności prób Wniosek: ma rozkład t-Studenta, v= n 1 +n 2 -2 Wystandaryzowana postać zmiennej:
II. Rozkłady graniczne statystyk z próby
1. Rozkład częstości z próby
2. Rozkład różnicy częstości z dwóch prób Zał.: X 1 i X 2 mają rozkłady dwumianowe z parametrami, odpowiednio n 1 i p 1 oraz n 2 i p 2 Wniosek: Statystyka (różnica częstości sukcesów z dwóch prób) ma, przy n 1 →∞ i n 2 →∞ na mocy twierdzenia de Moivre’a-Laplace’a graniczny rozkład normalny
3. Rozkład graniczny średniej z próby Zał.: X ma dowolny rozkład ( niekoniecznie normalny) ze średnią m i odchyleniem standardowym σ. Wniosek: z twierdzenia Lindeberga-Lévy’ego wynika, że średnia z próby ma przy n→∞ graniczny rozkład normalny
Rozkład w populacji (niekoniecznie normalny) i normalny rozkład średniej z próby Normalny rozkład X̄ Odch.stand. w popul.: σ Odch.stand.średniej Rozkład w populacji m (wartość oczekiwana w populacji i zarazem w rozkładzie średniej dla dużej próby)
4. Rozkład graniczny różnicy średnich z 2. prób Zał.: X 1 i X 2 mają dowolne rozkłady (niekoniecznie normalne) z parametrami odpowiednio m 1 i σ 1 oraz m 2 i σ 2. Wniosek: Z twierdzenia Lindeberga-Lévy’ego wynika, że różnica średnich z prób X̄ 1 -X̄ 2 ma przy n 1 →∞ i n 2 →∞ graniczny rozkład normalny
1. Częstość: 2. Różnica częstości: Rozkłady graniczne (wnioski z twierdzeń granicznych) Wystandaryzowana postać statystyki z próby:
3. Średnia: 4. Różnica średnich: Wystandaryzowana postać statystyki z próby:
Podsumowanie
Dziękuję dr Marta Marszałek
Podstawowe pojęcia