Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

Estymacja parametryczna

Podobne prezentacje


Prezentacja na temat: "Estymacja parametryczna"— Zapis prezentacji:

1 Estymacja parametryczna
Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium Analiz Ekonomicznych Szkoła Główna Handlowa w Warszawie Estymacja parametryczna dr Marta Marszałek

2 Plan wykładu estymator vs. parametr własności estymatorów
estymacja punktowa estymacja przedziałowa precyzja szacunku minimalna liczebność próby

3 Wnioskowanie statystyczne
Estymacja Weryfikacja hipotez statystycznych Szacowanie wartości parametrów rozkładu populacji (lub jego postaci funkcyjnej) na podstawie próby losowej Sprawdzanie przypuszczeń dot. parametrów rozkładu populacji (lub jego postaci funkcyjnej) na podstawie próby losowej

4 Estymacja Estymacja parametryczna Estymacja nieparametryczna
szacowanie wartości parametrów populacji generalnej na podstawie obserwacji uzyskanych w próbie estymacja punktowa estymacja przedziałowa szacowanie postaci funkcyjnej rozkładu populacji generalnej

5 Estymacja parametryczna
O wartości oczekiwanej w populacji (𝒎) wnioskuje się w oparciu o miary położenia (tendencji centralnej) wyznaczone z próby losowej. O wariancji w populacji (𝝈 𝟐 ) wnioskuje się w oparciu o miary zróżnicowania wyznaczone z próby losowej. O prawdopodobieństwie w populacji(𝒑) (czyli o szansie na wystąpienie zdarzenia) wnioskuje się w oparciu o częstość względną (𝜔) wyznaczoną z próby losowej. 𝑥 𝒎 Próba (estymatory) Populacja (parametry) 𝒘 𝒊 – odsetek studentów, którzy przeczytali xi książek w ubiegłym roku 𝒑 – prawdopodobieństwo przeczytania xi książek przez mieszkańców Polski

6 Estymacja parametryczna
Liczbowe charakterystyki (konkretne wartości) populacji to parametry, a ich „odpowiedniki” z próby to estymatory. 𝜽 (theta) – nieznana wartość parametru populacji generalnej, szacowana na podstawie próby. 𝑻𝒏 – estymator parametru θ rozkładu popul. generalnej. To statystyka z próby losowej (X1,X2…..Xn), która służy do oszacowania wartości parametru. Ocena parametru 𝜃 to konkretna wartość liczbowa jaką przyjmuje estymator 𝑇𝑛 wyznaczony z próby (x1,x2…..xn).

7 Parametr populacji (𝜽)
Estymator vs. parametr Wyznaczane na Wartości podstawie próby na ogół nieznane Estymator (𝑻𝒏 ) (statystyka z próby) Parametr populacji (𝜽) (z próby) (liczbowa charakterystyka populacji generalnej) 𝑥 𝑚=𝐸𝑋 𝑆 𝑥 2 𝑆 𝑥 ω 𝜎 2 = 𝐷 2 𝑋 𝜎=𝐷𝑋 𝑝

8 Własności estymatorów
Nieobciążoność Zgodność Efektywność IV. Dostateczność (wystarczalność)

9 Własności estymatorów
I. Nieobciążoność. Estymator 𝑇 𝑛 parametru 𝜃 jest nieobciążony, jeśli 𝐸 𝑇 𝑛 =𝜃 Interpretacja: pobierając wielokrotnie próby z populacji, średnia z wartości przyjmowanych przez estymator nieobciążony będzie równa parametrowi. Oceny parametru uzyskiwane przy wykorzystaniu estymatora nieobciążonego są pozbawione błędu systematycznego. Wyrażenie: 𝐸 𝑇 𝑛 −𝜃=𝑏 𝑇 𝑛 to obciążenie estymatora Estymator Tn parametru θ jest asymptotycznie nieobciążony, jeśli lim b(Tn)=0 n→∞

10 Średnia z próby 𝑥 ̄, jako nieobciążony estymator średniej w populacji, m
X̄ X̄ X̄ X̄ X̄ Średnia z próby X̄ X̄ X̄ X̄ X̄ X̄ • m X̄ X̄ X̄ X̄ X̄ X̄ X̄ X̄ X̄

11 Obciążony estymator 𝑌 średniej w populacji, m
systematyczne obciążenie y y y Obciążony y y y estymator Y y y • m y ● y y y y y y

12 Przykłady Średnia arytm. jest nieobciążonym estymatorem wartości oczekiwanej w populacji generalnej. Wariancja jest obciążonym estymatorem wariancji 𝐷2(𝑋) w populacji generalnej

13 Uwaga! Wariancja nieobciążona jest nieobciążonym estymatorem wariancji w próbie Wariancja obciążona jest obciążonym estymatorem wariancji w populacji

14 II. Zgodność Estymator Tn parametru θ jest zgodny, jeśli spełnia relację: lim P{│Tn-θ│<ε} = dla dowolnego ε>0 n→∞ Interpretacja: Estymator jest zgodny, jeśli wraz ze wzrostem liczebności próby (n↗) rośnie prawdopodobieństwo (p↗) tego, że jego wartość będzie coraz bliższa wartości parametru (=>θ). Wniosek 1: W dostatecznie dużej próbie ryzyko popełnienia dużego błędu jest niewielkie. Wniosek 2: Średnia arytm. z próby 𝑥 ̄ jest zgodnym estymatorem wartości oczekiwanej 𝐸(𝑋) w populacji generalnej.

15 Relacje między własnościami nieobciążoności i zgodności estymatora
1. Jeśli estymator Tn parametru θ jest zgodny to jest asymptotycznie nieobciążony. (Twierdzenie odwrotne nie jest prawdziwe.) 2. Jeśli estymator Tn parametru θ jest nieobciążony (lub asymptotycznie nieobciążony) oraz jeśli jego wariancja spełnia relację lim 𝑛→∞ 𝐷2(𝑇𝑛) ⁡=0 to Tn jest estymatorem zgodnym.

16 III. Efektywność Spośród wszystkich nieobciążonych estymatorów Tn1, Tn2, ……Tnr parametru θ, estymator Tn*, który ma najmniejszą wariancję, D2(Tn*), jest najefektywniejszym estymatorem parametru θ. Wyrażenie: to efektywność estymatora Tni parametru θ.

17 Dwa nieobciążone estymatory parametru m: estymator X jest efektywniejszy od estymatora Z
Estymator nieobciążony i efektywny z X z Estymator nieobciążony z z ale nieefektywny x x z (o dużej wariancji) z x x x Z x • m x z z z x x x z x z z z

18 IV. Dostateczność (wystarczalność)
Estymator jest dostateczny, jeśli wykorzystuje wszystkie informacje o szacowanym parametrze, jakie można uzyskać z próby.

19 Metody uzyskiwania estymatorów
1. Metoda momentów 2. Metoda największej wiarogodności (MNW) 3. Metoda najmniejszych kwadratów (MNK) Estymatory MNW są: 1. zgodne, 2. co najmniej asymptotycznie nieobciążone, 3. co najmniej asymptotycznie najefektywniejsze, 4. mają asymptotyczny rozkład normalny.

20 Estymacja Punktowa Przedziałowa
Jako oszacowanie parametru przyjmuje się wartość jego estymatora obliczoną na podstawie próby losowej. Jest to jedna, konkretna wartość liczbowa. Przykład: średnia wartość wynagrodzenia brutto w Polsce Konstruujemy przedział ufności, który z dużym prawdopodobieństwem obejmie nieznany parametr. Jest to przedział liczbowy. Przykład: 3500 𝑧ł;4500𝑧ł z prawdopodobieństwem 0,95 pokrywa nieznaną wartość wynagrodzenia brutto w Polsce.

21 Estymacja punktowa Przykład 1. Pewna sieć hipermarketów chce sprawdzić średnią wagę zakupów realizowanych przed weekendem. Losowa, 122 elementowa próba dała wyniki: 𝑋 ̄=5𝑘𝑔, 𝑆=1,2 𝑘𝑔 Odp.: Jako średnią wartość w populacji (parametr m populacji) przyjmiemy wartość 𝑋 z próby, czyli 5𝑘𝑔. Przykład 2. Firma badawcza chce oszacować przewidywaną frekwencję wyborczą. W losowo wybranej, reprezentatywnej próbie 1000 Polaków gotowość do głosowania wyraziło 550 osób. Odp: Jako punktowe oszacowanie przewidywanej frekwencji w wyborach w Polsce (parametr p populacji) przyjmiemy wartość częstości z próby tzn. 𝒘=550/1000=0,55.

22 Estymacja punktowa błąd szacunku – miara oceny jakości estymacji punktowej. Przyjmuje się, że jest nim błąd standardowy (odchylenie standardowe) estymatora. (z populacji) (z próby) Parametr Estymator Błąd standardowy 𝜃 𝑇𝑛 estymatora D( 𝑇 𝑛 ) 𝑚 𝑥 ̄ 𝑝 w= 𝑝

23 Estymacja przedziałowa

24 Przedział ufności dla średniej m w populacji normalnej ze znanym odchyleniem standardowym
Założenia: 𝑋:𝑁 𝑚,𝜎 𝑚 – nieznane; σ – znane (𝑋1,𝑋2…..𝑋𝑛) próba losowa 1−𝛼 – współczynnik ufności Estymatorem parametru m jest średnia z próby 𝑥 ̄ o rozkładzie: Przedział ufności: gdzie uα – wartość w standardowym rozkładzie normalnym: 𝑃(│𝑈│≥𝑢𝛼)=𝛼 lub inaczej 𝑃(−𝑢𝛼<𝑢<𝑢𝛼)= 1−𝛼

25 Przedział ufności dla m
parametr Współczynnik ufności (np. 0,9; 0,95; 0,99) Estymator Standardowy błąd szacunku Estymator ± wartość odczytana z tablic * błąd standardowy błąd maksymalny (in. statystyczny)

26 Przedział ufności Granice przedziału: z tablic stand. z tablic stand.
Estymator - wartość * błąd ; Estymator + wartość * błąd z tablic stand z tablic stand. Środkiem przedziału ufności jest punktowe oszacowanie parametru. Maksymalny (in. statystyczny) błąd szacunku (ozn. d) = połowa długości przedziału ufności Współczynnik ufności przyjmuje wartość np. 1−𝛼 ≥ 0,9

27 Interpretacja przedziału ufności
Skonstruowany przedział jest jednym z tych, które z dużym prawdopodobieństwem obejmują („pokrywają”) nieznaną wartość parametru m. X̄2 X̄3 m X̄1 X̄7 X̄6

28 𝑃 𝑥 − 𝑢 𝛼 𝑆 𝑥 𝑛 ≺𝑚< 𝑥 + 𝑢 𝛼 𝑆 𝑥 𝑛 =1− 𝛼
Przykład Zadanie: Proszę wyznaczyć przedział ufności przeciętnej wagi czekolady w próbie 121 czekolad. Średnia waga czekolady w próbie wyniosła 100 g, zaś odchylenie standardowe wyniosło 25. Proszę przyjąć współczynnik ufności: 1−𝛼=0,95. Dane: Szukane: 𝑛= 𝑚=? 𝑆 𝑥 =25 𝑥 =100 1−𝛼=0,95 →𝛼=0,05→ 𝑢 𝛼 = 𝑢 0,05 =1,96 𝑃 𝑥 − 𝑢 𝛼 𝑆 𝑥 𝑛 ≺𝑚< 𝑥 + 𝑢 𝛼 𝑆 𝑥 𝑛 =1− 𝛼 𝑃 100−1,96∗ <𝑚<100+1,96∗ =0,95 𝑃 100−1,96∗2,27<𝑚<100+1,96∗2,27 =0,95 𝑃 100−4,45<𝑚<100+4,45 =0,95 (95,55;104,45) Odp.: Przedział o końcach (95,55;104,45) jest jednym z możliwych przedziałów, który z prawdopodobieństwem 95% pokrywa nieznaną wartość parametru 𝑚 (przeciętnej wagi czekolady)

29 Przedział ufności dla średniej m w populacji normalnej z nieznanym odchyleniem standardowym
Założenia: 𝑋:𝑁(𝑚,𝜎) 𝑚 i 𝜎 – nieznane (𝑋1,𝑋2…..𝑋𝑛) próba losowa (mała) 1−𝛼 – współczynnik ufności Estymatorem parametru m jest średnia z próby 𝑥 , której rozkład nie może być wyznaczony, gdyż nie znamy σ. Przedział ufności: gdzie: 𝑠 – odch. standardowe (nieobciążone) 𝑡 𝛼,𝑛−1 - wartość w rozkł. t-Studenta o 𝑛−1 st. swobody: 𝑃(│𝑡│ ≥ 𝑡 𝛼,𝑛−1 ) = 𝛼 lub inaczej 𝑃(−𝑡𝛼,𝑛−1 < 𝑡 < 𝑡𝛼,𝑛−1) = 1−𝛼

30 *Przedział ufności dla średniej m w populacji normalnej z nieznanym odchyleniem standardowym
Jeśli wykorzystamy wariancję z próby obciążoną, tzn. wówczas przedział ufności ma postać: gdzie 𝑡 𝛼,𝑛−1 – wartość w rozkładzie t-Studenta o 𝑛−1 st. swobody: 𝑃(│𝑡│ ≥ 𝑡 𝛼,𝑛−1 = 𝛼 lub inaczej 𝑃(− 𝑡 𝛼,𝑛−1 <𝑡< 𝑡 𝛼,𝑛−1 )=𝛼

31 Przedział ufności dla średniej m w populacji o nieznanym rozkładzie
Założenie: 𝑋 ma dowolny rozkład 𝑚 i 𝜎 – nieznane (𝑋1,𝑋2…..𝑋𝑛) próba losowa (duża) 1−𝛼 – współczynnik ufności Z granicznego rozkładu średniej 𝑥 przy dużej próbie, który jest zbieżny do i przyjmując, że σ ≈ s, mamy: Przedział ufności gdzie uα - wartość w standardowym rozkładzie normalnym: 𝑃(│𝑈│ ≥ 𝑢𝛼) = α lub inaczej 𝑃(−𝑢𝛼 < 𝑢 < 𝑢𝛼) = 1−𝛼

32 Przedział ufności dla m - przykład
Należy oszacować (1−𝛼=0,9) średnią wagę bagażu podręcznego w samolocie. Losowa, 169 elementowa próba dała wyniki: 𝑥 =7𝑘𝑔, 𝑠=1,3𝑘𝑔

33 Precyzja szacunku = maksymalny błąd szacunku
Precyzja szacunku zależy od: przyjętego współczynnika ufności 1−𝛼 liczebności próby Zmniejszenie 𝟏−𝜶: poprawia precyzję (przedział jest węższy) zmniejsza wiarygodność (ufność) tzn. zwiększa się ryzyko, że przedział nie obejmie parametru.

34 Minimalna liczebność próby przy estymacji średniej m w populacji normalnej ze znanym σ
Postać przedziału ufności: Maksymalny błąd szacunku 𝒅 (połowa długości przedziału ufności): Minimalna liczebność próby, zapewniająca, że przy danym 1−𝛼 maksymalny błąd szacunku nie przekroczy ustalonej wartości 𝑑 :

35 Minimalna liczebność próby przy estymacji parametru p w rozkładzie dwumianowym
Postać przedziału ufności: Maksymalny błąd szacunku d (połowa długości przedziału ufności): Minimalna liczebność próby, przy danym 1−𝛼 maksymalny błąd szacunku nie przekroczy ustalonej wartości d: W miejsce p podstawiamy wartość przewidywaną lub wstępnie oszacowaną. W przypadku braku wiedzy przyjmujemy: 𝑝=0,5.

36 Przykład – minimalna liczebność próby
Pytanie: jak liczna powinna być próba, aby przy estymacji frakcji żarówek wadliwych w populacji 𝑝, błąd szacunku nie przekroczył 2% (1−𝛼 = 0,95)? 𝑢 𝛼 𝑝 (1− 𝑝 ) 𝑛 ≤0,02 𝑛> 𝑢 𝛼 𝑝 (1− 𝑝 ) 0, = 1,96 2 𝑝 (1− 𝑝 ) 0,02 2 dla 𝑤=0,1 błąd 2% 𝑛>864,36≈865 dla 𝑤=0,5 błąd 2% 𝑛≈2401 błąd 3% 𝑛>1067,11≈1068 błąd 1% 𝑛≈9604

37 Dziękuję dr Marta Marszałek https://www.e-sgh.pl/marszalek/110580


Pobierz ppt "Estymacja parametryczna"

Podobne prezentacje


Reklamy Google