Rozkład z próby Jacek Szanduła
Populacja a próba Populacja Wartości wyznaczone na podstawie całej populacji nazywamy parameterami Próba Wartości wyznaczone na podstawie próby nazywamy statystykami Jacek Szanduła
Zalety próby Pozyskanie danych mniej kosztowne oraz szybsze w porównaniu do spisu populacji. Przeprowadzenie spisu może być niewykonalne (jak policzyć liczbę cząsteczek tlenu w atmosferze?) Możliwość uzyskania wyników o wystarczającej precyzji. Jacek Szanduła
Rozkład z próby Statystyki wyznaczane na podstawie próby są zmiennymi losowymi. Rozkład z próby – rozkład wszystkich możliwych wartości statystyki dla ustalonej wielkości próby. Jacek Szanduła
Rozkład z próby – przykład 1 Populacja Zmienna losowa X: liczba oczek E(X) = 3,5 1 2 3 4 5 6 Rozkład zmiennej X Jacek Szanduła
Rozkład z próby – przykład 1 Populacja Jaki jest rozkład z próby średniej liczby oczek dla próby o wielkości n = 2 ? Możliwe próby Średnie z prób Rzut nr 1 Rzut nr 2 1 2 3 4 5 6 (1, 1) (1, 2) (1, 3) (1, 4) (1, 5) (1, 6) (2, 1) (2, 2) (2, 3) (2, 4) (2, 5) (2, 6) (3, 1) (3, 2) (3, 3) (3, 4) (3, 5) (3, 6) (4, 1) (4, 2) (4, 3) (4, 4) (4, 5) (4, 6) (5, 1) (5, 2) (5, 3) (5, 4) (5, 5) (5, 6) (6, 1) (6, 2) (6, 3) (6, 4) (6, 5) (6, 6) Rzut nr 1 Rzut nr 2 1 2 3 4 5 6 1,5 2,5 3,5 4,5 5,5 Jacek Szanduła
Rozkład z próby – przykład 1 Populacja Jaki jest rozkład z próby średniej liczby oczek dla próby o wielkości n = 2 ? Średnie z prób Rozkład Rzut nr 1 Rzut nr 2 1 2 3 4 5 6 1,5 2,5 3,5 4,5 5,5 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5 5,5 6 Uwaga: parametry populacji są (zwykle nieznanymi) wartościami, statystyki są zmiennymi losowymi z własnymi parametrami (E, V, …). Jacek Szanduła
Prawo wielkich liczb Jeżeli obserwacje w próbie są niezależne i o jednakowym rozkładzie (i.i.d. – independent and identically distributed), wówczas średnia z próby zbliża się do średniej populacji z prawdopodobieństwem 1, gdy wielkość próby dąży do nieskończoności. Jacek Szanduła
Centralne twierdzenie graniczne Niech gdzie wszystkie Xi są i.i.d. z E(X) = μ i V(X) = σ2 Jacek Szanduła
Centralne twierdzenie graniczne cd. Niech gdzie wszystkie Xi są i.i.d. z E(X) = μ i V(X) = σ2 Jacek Szanduła
Centralne twierdzenie graniczne – przykład 1 Miesięczne zarobki brutto w Polsce są zmienną losową z parametrami: μ = 3 800; σ = 2 900 Stowarzyszenie ma 100 członków. Pobiera 1% od zarobków brutto swoich członków. Jakie jest prawdopodobieństwo, że miesięcznie zbiera ponad 4000 PLN? C – całkowite miesięczne zarobki członków stowarzyszenia P(0,01C > 4 000) = P(C > 400 000) n = 100 Jacek Szanduła
Centralne twierdzenie graniczne – przykład 2 Puszka fasoli waży 500 g 5% (odchylenie standardowe). Jakie jest prawdopodobieństwo, że średnia waga 400 losowo wybranych puszek nie przekracza 499g? μ = 500; σ = 25. Jacek Szanduła
Rozkład średniej dla próby pobranej z populacji o rozkładzie normalnym N(μ, σ) Jacek Szanduła
Rozkład średniej dla próby pobranej z populacji o rozkładzie normalnym N(μ, σ) – przykład Waga paczki cukru jest zmienną losową o rozkładzie normalnym z parametrami μ = 1 kg, σ = 0,01kg. Jakie jest prawdopodobieństwo, że średnia waga 16 losowo wybranych paczek różni się od 1kg o ponad 0,01kg? Jacek Szanduła
Przedziały ufności Jacek Szanduła
Definicje i terminy Przedział ufności – przedział liczbowy, który przypuszczalnie zawiera nieznaną wartość parametru populacji. Współczynnik ufności – prawdopodobieństwo, że losowo wybrany przedział zawiera parametr populacji. Poziom ufności – współczynnik ufności wyrażony jako wartość procentowa. Jacek Szanduła
Idea przedziału ufności θ – parametr populacji z ustaloną lecz nieznaną wartością a b (a, b) – przedział ufności 1 – α – współczynnik ufności (1 – α)∙100% – poziom ufności Jacek Szanduła
Idea przedziału ufności cd. Przykład: Wartości średnie dla dwukrotnego rzutu kostką: 1; 1,5; 1,5; 2; 2; 2; 2,5; 2,5; 2,5; 2,5; 3; 3; 3; 3; 3; 3,5; 3,5; 3,5; 3,5; 3,5; 3,5; 4; 4; 4; 4; 4; 4,5; 4,5; 4,5; 4,5; 5; 5; 5; 5,5; 5,5; 6. Wartość oczekiwana populacji wynosi μ = 3,5. Tworzymy przedziały: 24 0,5 1 1,5 2,5 3,5 4,5 5,5 6,5 2 3 4 5 6 7 Jacek Szanduła
Przedział ufności dla wartości oczekiwanej 1° Znane σ, populacja o rozkładzie normalnym lub duża próba 2° Nieznane σ, populacja o rozkładzie normalnym lub duża próba 3° Populacja o rozkładzie innym niż normalny i mała próba Jacek Szanduła
Wartość oczekiwana – przykład 1 (znane σ, populacja o rozkładzie normalnym) Długość gwoździa jest zmienną losową o rozkładzie normalnym z odchyleniem standardowym σ = 1mm. Wyznacz 90% przedział ufności dla wartości oczekiwanej jeżeli średnia z 25-elementowej próby wynosi 10cm? tablice rozkładu normalnego Jacek Szanduła
Wartość oczekiwana – przykład 2 (znane σ, duża próba) Odchylenie standardowe objętości butelki wody mineralnej wynosi σ = 20ml. Wyznacz 95% przedział ufności dla wartości oczekiwanej, jeżeli średnia z próby wyznaczona na podstawie 100 butelek wynosi 1,503l? tablice rozkładu normalnego Jacek Szanduła
Wartość oczekiwana – przykład 3 (nieznane σ, rozkład normalny lub duża próba) Przykład studentów Jacek Szanduła