Wnioskowanie statystyczne Statystyka matematyczna
Wnioskowanie statystyczne - polega na uogólnianiu wyników otrzymanych na podstawie próby losowej na całą populację generalną, z której próba została pobrana Wnioskowanie statystyczne dzieli się na: 1. Estymację – szacowanie wartości parametrów lub postaci rozkładu zmiennej na podstawie próby – na podstawie wyników próby formułujemy wnioski dla całej populacji 2. Weryfikację hipotez statystycznych – sprawdzanie określonych założeń sformułowanych dla parametrów populacji generalnej na podstawie wyników z próby – najpierw wysuwamy założenie, które weryfikujemy na podstawie wyników próby
Estymator – wielkość (charakterystyka, miara), obliczona na podstawie próby, służąca do oceny wartości nieznanych parametrów populacji generalnej. Najlepszym z pośród wszystkich estymatorów parametru w populacji generalnej jest ten, który spełnia wszystkie właściwości estymatorów (jest równocześnie nieobciążony, zgodny, efektywny, dostateczny).
Estymacja przedziałowa polega na budowie przedziału zwanego przedziałem ufności, który z określonym prawdopodobieństwem będzie zawierał nieznaną wartość szacowanego parametru gdzie: Q – nieznany parametr populacji generalnej, końce przedziałów (dolna i górna granica przedziału), będące funkcją wylosowanej próby
tym bardziej precyzyjna jest estymacja przedziałowa. 1–α współczynnik ufności – prawdopodobieństwo tego, że wyznaczając na podstawie n-elementowych prób wartość funkcji g1 i g2 (dolną i górną granicę przedziału) średnio w (1-α)·100% przypadkach otrzymamy przedziały pokrywające nieznaną wartość parametru Q – z prawdopodobieństwem (1- α) przedział ufności pokrywa nieznaną wartość szacowanego parametru Im krótszy przedział (różnica między górną i dolną granicą przedziału), tym bardziej precyzyjna jest estymacja przedziałowa. Im wyższa jest wartość współczynnika ufności, tym większa jest długość przedziału.
Przedział ufności dla średniej w populacji o rozkładzie normalnym ze znanym odchyleniem standardowym Estymatorem średniej w populacji jest średnia arytmetyczna z próby , która ma rozkład . Przedział ufności dla średniej w populacji ma postać: - wartość odczytana z tablic rozkładu normalnego dla danego poziomu istotności α - odchylenie standardowe w populacji generalnej
Względna miara precyzji oszacowania jako miara dokładności dopasowania określona jest wzorem: Jeżeli: - oszacowanie charakteryzuje się dużą precyzją - uogólnienia wyników na populację generalną należy dokonywać ostrożnie - nie należy dokonywać żadnych uogólnień na populację generalną
Zadanie 1. Firma telefoniczna oszacowała przeciętną długość rozmów lokalnych w czasie weekendu, których czas ma rozkład normalny z odchyleniem standardowym 5,5 minuty. Z losowej próby 50 rozmów otrzymano średnią 14,5 minuty. Wyznacz z prawdopodobieństwem 1- α =0,9 przedział ufności dla średniej długości rozmów lokalnych. Skorzystaj z funkcji w MS Excel „Ufność” Zadanie 2. Wyznacz granice liczbowe krańców przedziału ufności pomiaru odległości między dwoma wierzchołkami gór (w metrach) przy poziomie ufności 1- a=0.95 , jeśli wykonano 80 pomiarów ze średnią równą 3000 m. Rozkład odległości jest rozkładem normalnym z odchyleniem standardowym równym 10 m.
Przedział ufności dla średniej w populacji o rozkładzie normalnym z nieznanym odchyleniem standardowym n < 30 Jeżeli próba jest mało liczna - stosujemy statystykę t o rozkładzie t–Studenta dla n-1 stopni swobody gdzie: - odchylenie standardowe z próby - wartość odczytana z tablic rozkładu Studenta dla poziomu istotności α oraz n–1 stopni swobody
Gdy n > 30, wartość odczytaną z tablic rozkładu Studenta możemy zastąpić wartością , odczytaną z tablic rozkładu normalnego oraz . - wartość odczytana z tablic rozkładu normalnego dla danego poziomu istotności α - odchylenie standardowe w próbie
Względną precyzję oszacowania oceniamy następująco: dla n < 30 dla n > 30
W pewnej klasie wybrano losowo grupę 8 osobową, która miała za zadanie rozwiązać zadanie z matematyki. Zmierzono czas rozwiązania zadania przez każdego z uczniów: 25, 16, 12, 10, 12, 21, 25, 20. Oszacuj metodą przedziałową dla współczynnika ufności średni czas niezbędny do rozwiązania zadania w całej zbiorowości uczniów. Przyjmując poziom istotności = 0,05. 2. W grupie losowo wybranych 625 pracowników w dużym koncernie produkującym samochody osobowe, średnia liczba dni nieobecności w pracy w badanym roku wynosiła 18, natomiast odchylenie standardowe 3. Przyjmując poziom ufności na poziomie 0,90 oszacować średni poziom nieobecności pracowników w całym przedsiębiorstwie oraz ocenić precyzję oszacowania.
Problem minimalnej liczebność próby Minimalna liczebność próby - taka liczebność próby, która zapewni wymaganą dokładność (precyzję oszacowania) przy danym poziomie wiarygodności (prawdopodobieństwa).
Dla estymacji przedziałowej średniej m w populacji przy znanym odchyleniu standardowym σ w populacji Poszukujemy takiej liczebność próby n, dla której przy danym współczynniku ufności (1-α) połowa długości przedziału ufności d – maksymalny błąd szacunku – nie przekroczy ustalonej z góry wartości. stąd
Dla estymacji przedziałowej średniej m w populacji przy nieznanym odchyleniu standardowym σ w populacji Losujemy próbę wstępną n0, obliczamy średnią i wariancję z próby i na jej podstawie wyznaczamy właściwą liczebność próby: t α,n0-1 – wartość odczytana z tablic rozkładu Studenta dla α i n0-1 Jeżeli n ≤ n0 to próbę wstępną traktujemy jako właściwą. Jeżeli zaś n > n0 to musimy próbę powiększyć o n – n0.
1. Firma zajmująca się wyszukiwaniem stanowisk dla personelu kierowniczego chce oszacować średnią pensję, jaką może uzyskać pracownik pełniący funkcję kierowniczą, z dokładnością do 2000 $, przy poziomie ufności 95%. Wiadomo, że rozkład pensji kierowniczych jest rozkładem normalnym o wariancji 40 mln. Jak liczna powinna być próba do oszacowania średniej pensji kierowników? 2. W celu wyznaczenia przeciętnej długości drogi hamowania samochodu na asfalcie, przeprowadzono przy prędkości 40 km/h 12 prób i otrzymano wyniki w metrach: 17,0; 19,0; 22,0; 20,5; 20,0; 21,0; 20,5; 20,0; 21,0; 18,0; 20,0; 21,0. Czy liczba prób jest wystarczająca do wyznaczenia przedziału ufności średniej o długości 0,5 m i dla 1- α = 0,95. Ewentualnie, jaką liczbę prób należy jeszcze przeprowadzić?