Estymacja parametryczna

Slides:



Advertisements
Podobne prezentacje
Opracowali: Patryk Klemczak Tomasz Klemczak ODSIECZ WIEDEŃSKA.
Advertisements

Kształtowanie się granic II Rzeczypospolitej
Wykład 4: Systemy nawigacji satelitarnej
WNIOSEK O PRZYZNANIE POMOCY
POGŁĘBIONA OCENA SYTUACJI FINANSOWEJ NA PODSTAWIE ANALIZY WSKAŹNIKOWEJ
Machine learning Lecture 3
Identyfikacja dansylowanych aminokwasów metodą cienkowarstwowej chromatografii na płytkach poliamidowych Gawahir Hassan.
Mechanika kwantowa dla niefizyków
Program Rozwoju Obszarów Wiejskich
Przyszłe zmiany sposobu finansowania zadań oświatowych
Wybrane bloki i magistrale komputerów osobistych (PC)
HELIOTECHNIKA W chwili obecnej jest niekonkurencyjna w porównaniu ze źródłami konwencjonalnymi, ale jest to „czysta energia” dlatego wiąże się z nią wiele.
Tolerancje i pasowania
B R Y Ł Y P L A T O Ń S K I E.
Bankowość Pieniądz Podstawowe informacje o bankach
Weryfikacja hipotez statystycznych
Krakowskie Sympozjum Naukowo-Techniczne
Zasilacze prądu stałego Czyli rzeczywiste źródła napięcia
Prof. nadzw. dr hab. inż. Jarosław Bartoszewicz
Mechanika kwantowa dla niefizyków
Grzegorz Karasiewicz Katedra Marketingu Wydział Zarządzania UW
1 czerwca w zerówce.
„ Mały Miś i polskie tradycje Bożego Narodzenia”
Box Behnken Design w optymalizacji procesu biosyntezy β-karotenu w hodowlach drożdży Rhodotorula rubra Ludmiła Bogacz-Radomska(1), Joanna Harasym(1,2,3),
Projekt z dnia 30 maja 2017 r. Ustawa z dnia …. ……………
Prof. dr hab. Roman Sobiecki Rachunki makroekonomiczne
CAPS LOCK - CERTYFIKOWANE SZKOLENIA JĘZYKOWE I KOMPUTEROWE
Prezentacje wykonali: Marcin Łukasik Wiktor Kołek
GOSPODAROWANIE ZASOBAMI W ORGANIZACJI
Co to jest SSC Master… SSC Master to platforma elektronicznego obiegu, dekretacji i akceptacji dokumentów w organizacji. Dzięki szerokiemu i elastycznemu.
Podstawy pomagania SPPiIK, 2016 Anna Gromińska.
Chemia biopierwiastków
Sedymentacja.
Współczesne kierunki polityki społecznej
Hiszpania,Portugalia,Litwa,Polska,Turcja,Włochy,Chorwacja Desery.
Prawo pracy – ćwiczenia (IX)
Dotarcie do specyficznej grupy docelowej
Sprawozdanie roczne z realizacji Planu działania Krajowej Sieci Obszarów Wiejskich na lata za rok 2016 Warszawa, 26 czerwca 2017 r. Materiał.
Srebrna Małopolska regionalne inicjatywy na rzecz seniorów
Stan Wojenny.
O UTWORZENIE ZWIĄZKU METROPOLITALNEGO W WOJEWÓDZTWIE ŚLĄSKIM
Wojewódzki Inspektorat Ochrony Środowiska w Białymstoku
ZAWODOZNAWSTWO Materiały zrealizowane w ramach projektu
Wykład 8: Złożone problemy przetwarzania mobilnego
Realizacja sprzężenia od siły w układzie sterowania robotem do zastosowań neurochirurgicznych Dorota Marszalik Wieliczka,
Funkcje generujące w kombinatoryce
Ruch turystyczny w Krakowie w 2015 roku
© dr hab. Inż. Paweł Jabłoński
Adsorpcja faza stała/ gazowa lub ciekła faza ciekła/ gazowa lub ciekła
MODELE EPIDEMIOLOGICZNE
Dowody matematyczne - zadania podstawowe
Zagadnienie prawdy Andrzej Łukasik Zakład Ontologii i Teorii Poznania
Ewolucja gwiazd.
Potencjał chemiczny Potencjał chemiczny ma charakter siły uogólnionej,
STAŁE RÓWNOWAGI REAKCJI PROTOLITYCZNYCH
Optymalizacja sieci drogowej propozycja algorytmu
Nie ma innego – Tylko Jezus Mariusz Śmiałek
W ramach stypendium Ministerstwa Kultury i Dziedzictwa Narodowego
R- Punkt referencyjny (wyjściowy) obrabiarki
Parki krajobrazowe na Podlasiu
Publicznej Szkole Podstawowej nr 4 im. Tadeusza Kościuszki
Materiały pochodzą z Platformy Edukacyjnej Portalu
Zasady poprawnej komunikacji – jak uniknąć konfliktów ?
Gimnazjum nr 3 im. J. Chełmońskiego w Zielonej Górze
Moje dziecko i jego potrzeby.
Edukacja psychologiczna
GMINA RUDZINIEC.
Czym jest mowa nienawiści?
Wykład 7 Prawo urzędnicze.
Zapis prezentacji:

Estymacja parametryczna Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium Analiz Ekonomicznych Szkoła Główna Handlowa w Warszawie Estymacja parametryczna dr Marta Marszałek e-mail: marta.marszalek@sgh.waw.pl

Plan wykładu estymator vs. parametr własności estymatorów estymacja punktowa estymacja przedziałowa precyzja szacunku minimalna liczebność próby

Wnioskowanie statystyczne Estymacja Weryfikacja hipotez statystycznych Szacowanie wartości parametrów rozkładu populacji (lub jego postaci funkcyjnej) na podstawie próby losowej Sprawdzanie przypuszczeń dot. parametrów rozkładu populacji (lub jego postaci funkcyjnej) na podstawie próby losowej

Estymacja Estymacja parametryczna Estymacja nieparametryczna szacowanie wartości parametrów populacji generalnej na podstawie obserwacji uzyskanych w próbie estymacja punktowa estymacja przedziałowa szacowanie postaci funkcyjnej rozkładu populacji generalnej

Estymacja parametryczna O wartości oczekiwanej w populacji (𝒎) wnioskuje się w oparciu o miary położenia (tendencji centralnej) wyznaczone z próby losowej. O wariancji w populacji (𝝈 𝟐 ) wnioskuje się w oparciu o miary zróżnicowania wyznaczone z próby losowej. O prawdopodobieństwie w populacji(𝒑) (czyli o szansie na wystąpienie zdarzenia) wnioskuje się w oparciu o częstość względną (𝜔) wyznaczoną z próby losowej. 𝑥 𝒎 Próba (estymatory) Populacja (parametry) 𝒘 𝒊 – odsetek studentów, którzy przeczytali xi książek w ubiegłym roku 𝒑 – prawdopodobieństwo przeczytania xi książek przez mieszkańców Polski

Estymacja parametryczna Liczbowe charakterystyki (konkretne wartości) populacji to parametry, a ich „odpowiedniki” z próby to estymatory. 𝜽 (theta) – nieznana wartość parametru populacji generalnej, szacowana na podstawie próby. 𝑻𝒏 – estymator parametru θ rozkładu popul. generalnej. To statystyka z próby losowej (X1,X2…..Xn), która służy do oszacowania wartości parametru. Ocena parametru 𝜃 to konkretna wartość liczbowa jaką przyjmuje estymator 𝑇𝑛 wyznaczony z próby (x1,x2…..xn).

Parametr populacji (𝜽) Estymator vs. parametr Wyznaczane na Wartości podstawie próby na ogół nieznane Estymator (𝑻𝒏 ) (statystyka z próby) Parametr populacji (𝜽) (z próby) (liczbowa charakterystyka populacji generalnej) 𝑥 𝑚=𝐸𝑋 𝑆 𝑥 2 𝑆 𝑥 ω 𝜎 2 = 𝐷 2 𝑋 𝜎=𝐷𝑋 𝑝

Własności estymatorów Nieobciążoność Zgodność Efektywność IV. Dostateczność (wystarczalność)

Własności estymatorów I. Nieobciążoność. Estymator 𝑇 𝑛 parametru 𝜃 jest nieobciążony, jeśli 𝐸 𝑇 𝑛 =𝜃 Interpretacja: pobierając wielokrotnie próby z populacji, średnia z wartości przyjmowanych przez estymator nieobciążony będzie równa parametrowi. Oceny parametru uzyskiwane przy wykorzystaniu estymatora nieobciążonego są pozbawione błędu systematycznego. Wyrażenie: 𝐸 𝑇 𝑛 −𝜃=𝑏 𝑇 𝑛 to obciążenie estymatora Estymator Tn parametru θ jest asymptotycznie nieobciążony, jeśli lim b(Tn)=0 n→∞

Średnia z próby 𝑥 ̄, jako nieobciążony estymator średniej w populacji, m X̄ X̄ X̄ X̄ X̄ Średnia z próby X̄ X̄ X̄ X̄ X̄ X̄ • m X̄ X̄ X̄ X̄ X̄ X̄ X̄ X̄ X̄

Obciążony estymator 𝑌 średniej w populacji, m systematyczne obciążenie y y y Obciążony y y y estymator Y y y • m y ● y y y y y y

Przykłady Średnia arytm. jest nieobciążonym estymatorem wartości oczekiwanej w populacji generalnej. Wariancja jest obciążonym estymatorem wariancji 𝐷2(𝑋) w populacji generalnej

Uwaga! Wariancja nieobciążona jest nieobciążonym estymatorem wariancji w próbie Wariancja obciążona jest obciążonym estymatorem wariancji w populacji

II. Zgodność Estymator Tn parametru θ jest zgodny, jeśli spełnia relację: lim P{│Tn-θ│<ε} = 1 dla dowolnego ε>0 n→∞ Interpretacja: Estymator jest zgodny, jeśli wraz ze wzrostem liczebności próby (n↗) rośnie prawdopodobieństwo (p↗) tego, że jego wartość będzie coraz bliższa wartości parametru (=>θ). Wniosek 1: W dostatecznie dużej próbie ryzyko popełnienia dużego błędu jest niewielkie. Wniosek 2: Średnia arytm. z próby 𝑥 ̄ jest zgodnym estymatorem wartości oczekiwanej 𝐸(𝑋) w populacji generalnej.

Relacje między własnościami nieobciążoności i zgodności estymatora 1. Jeśli estymator Tn parametru θ jest zgodny to jest asymptotycznie nieobciążony. (Twierdzenie odwrotne nie jest prawdziwe.) 2. Jeśli estymator Tn parametru θ jest nieobciążony (lub asymptotycznie nieobciążony) oraz jeśli jego wariancja spełnia relację lim 𝑛→∞ 𝐷2(𝑇𝑛) ⁡=0 to Tn jest estymatorem zgodnym.

III. Efektywność Spośród wszystkich nieobciążonych estymatorów Tn1, Tn2, ……Tnr parametru θ, estymator Tn*, który ma najmniejszą wariancję, D2(Tn*), jest najefektywniejszym estymatorem parametru θ. Wyrażenie: to efektywność estymatora Tni parametru θ.

Dwa nieobciążone estymatory parametru m: estymator X jest efektywniejszy od estymatora Z Estymator nieobciążony i efektywny z X z Estymator nieobciążony z z ale nieefektywny x x z (o dużej wariancji) z x x x Z x • m x z z z x x x z x z z z

IV. Dostateczność (wystarczalność) Estymator jest dostateczny, jeśli wykorzystuje wszystkie informacje o szacowanym parametrze, jakie można uzyskać z próby.

Metody uzyskiwania estymatorów 1. Metoda momentów 2. Metoda największej wiarogodności (MNW) 3. Metoda najmniejszych kwadratów (MNK) Estymatory MNW są: 1. zgodne, 2. co najmniej asymptotycznie nieobciążone, 3. co najmniej asymptotycznie najefektywniejsze, 4. mają asymptotyczny rozkład normalny.

Estymacja Punktowa Przedziałowa Jako oszacowanie parametru przyjmuje się wartość jego estymatora obliczoną na podstawie próby losowej. Jest to jedna, konkretna wartość liczbowa. Przykład: średnia wartość wynagrodzenia brutto w Polsce Konstruujemy przedział ufności, który z dużym prawdopodobieństwem obejmie nieznany parametr. Jest to przedział liczbowy. Przykład: 3500 𝑧ł;4500𝑧ł z prawdopodobieństwem 0,95 pokrywa nieznaną wartość wynagrodzenia brutto w Polsce.

Estymacja punktowa Przykład 1. Pewna sieć hipermarketów chce sprawdzić średnią wagę zakupów realizowanych przed weekendem. Losowa, 122 elementowa próba dała wyniki: 𝑋 ̄=5𝑘𝑔, 𝑆=1,2 𝑘𝑔 Odp.: Jako średnią wartość w populacji (parametr m populacji) przyjmiemy wartość 𝑋 z próby, czyli 5𝑘𝑔. Przykład 2. Firma badawcza chce oszacować przewidywaną frekwencję wyborczą. W losowo wybranej, reprezentatywnej próbie 1000 Polaków gotowość do głosowania wyraziło 550 osób. Odp: Jako punktowe oszacowanie przewidywanej frekwencji w wyborach w Polsce (parametr p populacji) przyjmiemy wartość częstości z próby tzn. 𝒘=550/1000=0,55.

Estymacja punktowa błąd szacunku – miara oceny jakości estymacji punktowej. Przyjmuje się, że jest nim błąd standardowy (odchylenie standardowe) estymatora. (z populacji) (z próby) Parametr Estymator Błąd standardowy 𝜃 𝑇𝑛 estymatora D( 𝑇 𝑛 ) 𝑚 𝑥 ̄ 𝑝 w= 𝑝

Estymacja przedziałowa

Przedział ufności dla średniej m w populacji normalnej ze znanym odchyleniem standardowym Założenia: 𝑋:𝑁 𝑚,𝜎 𝑚 – nieznane; σ – znane (𝑋1,𝑋2…..𝑋𝑛) próba losowa 1−𝛼 – współczynnik ufności Estymatorem parametru m jest średnia z próby 𝑥 ̄ o rozkładzie: Przedział ufności: gdzie uα – wartość w standardowym rozkładzie normalnym: 𝑃(│𝑈│≥𝑢𝛼)=𝛼 lub inaczej 𝑃(−𝑢𝛼<𝑢<𝑢𝛼)= 1−𝛼

Przedział ufności dla m parametr Współczynnik ufności (np. 0,9; 0,95; 0,99) Estymator Standardowy błąd szacunku Estymator ± wartość odczytana z tablic * błąd standardowy błąd maksymalny (in. statystyczny)

Przedział ufności Granice przedziału: z tablic stand. z tablic stand. Estymator - wartość * błąd ; Estymator + wartość * błąd z tablic stand. z tablic stand. Środkiem przedziału ufności jest punktowe oszacowanie parametru. Maksymalny (in. statystyczny) błąd szacunku (ozn. d) = połowa długości przedziału ufności Współczynnik ufności przyjmuje wartość np. 1−𝛼 ≥ 0,9

Interpretacja przedziału ufności Skonstruowany przedział jest jednym z tych, które z dużym prawdopodobieństwem obejmują („pokrywają”) nieznaną wartość parametru m. X̄2 X̄3 m X̄1 X̄7 X̄6

𝑃 𝑥 − 𝑢 𝛼 𝑆 𝑥 𝑛 ≺𝑚< 𝑥 + 𝑢 𝛼 𝑆 𝑥 𝑛 =1− 𝛼 Przykład Zadanie: Proszę wyznaczyć przedział ufności przeciętnej wagi czekolady w próbie 121 czekolad. Średnia waga czekolady w próbie wyniosła 100 g, zaś odchylenie standardowe wyniosło 25. Proszę przyjąć współczynnik ufności: 1−𝛼=0,95. Dane: Szukane: 𝑛=121 𝑚=? 𝑆 𝑥 =25 𝑥 =100 1−𝛼=0,95 →𝛼=0,05→ 𝑢 𝛼 = 𝑢 0,05 =1,96 𝑃 𝑥 − 𝑢 𝛼 𝑆 𝑥 𝑛 ≺𝑚< 𝑥 + 𝑢 𝛼 𝑆 𝑥 𝑛 =1− 𝛼 𝑃 100−1,96∗ 25 121 <𝑚<100+1,96∗ 25 121 =0,95 𝑃 100−1,96∗2,27<𝑚<100+1,96∗2,27 =0,95 𝑃 100−4,45<𝑚<100+4,45 =0,95 (95,55;104,45) Odp.: Przedział o końcach (95,55;104,45) jest jednym z możliwych przedziałów, który z prawdopodobieństwem 95% pokrywa nieznaną wartość parametru 𝑚 (przeciętnej wagi czekolady)

Przedział ufności dla średniej m w populacji normalnej z nieznanym odchyleniem standardowym Założenia: 𝑋:𝑁(𝑚,𝜎) 𝑚 i 𝜎 – nieznane (𝑋1,𝑋2…..𝑋𝑛) próba losowa (mała) 1−𝛼 – współczynnik ufności Estymatorem parametru m jest średnia z próby 𝑥 , której rozkład nie może być wyznaczony, gdyż nie znamy σ. Przedział ufności: gdzie: 𝑠 – odch. standardowe (nieobciążone) 𝑡 𝛼,𝑛−1 - wartość w rozkł. t-Studenta o 𝑛−1 st. swobody: 𝑃(│𝑡│ ≥ 𝑡 𝛼,𝑛−1 ) = 𝛼 lub inaczej 𝑃(−𝑡𝛼,𝑛−1 < 𝑡 < 𝑡𝛼,𝑛−1) = 1−𝛼

*Przedział ufności dla średniej m w populacji normalnej z nieznanym odchyleniem standardowym Jeśli wykorzystamy wariancję z próby obciążoną, tzn. wówczas przedział ufności ma postać: gdzie 𝑡 𝛼,𝑛−1 – wartość w rozkładzie t-Studenta o 𝑛−1 st. swobody: 𝑃(│𝑡│ ≥ 𝑡 𝛼,𝑛−1 = 𝛼 lub inaczej 𝑃(− 𝑡 𝛼,𝑛−1 <𝑡< 𝑡 𝛼,𝑛−1 )=𝛼

Przedział ufności dla średniej m w populacji o nieznanym rozkładzie Założenie: 𝑋 ma dowolny rozkład 𝑚 i 𝜎 – nieznane (𝑋1,𝑋2…..𝑋𝑛) próba losowa (duża) 1−𝛼 – współczynnik ufności Z granicznego rozkładu średniej 𝑥 przy dużej próbie, który jest zbieżny do i przyjmując, że σ ≈ s, mamy: Przedział ufności gdzie uα - wartość w standardowym rozkładzie normalnym: 𝑃(│𝑈│ ≥ 𝑢𝛼) = α lub inaczej 𝑃(−𝑢𝛼 < 𝑢 < 𝑢𝛼) = 1−𝛼

Przedział ufności dla m - przykład Należy oszacować (1−𝛼=0,9) średnią wagę bagażu podręcznego w samolocie. Losowa, 169 elementowa próba dała wyniki: 𝑥 =7𝑘𝑔, 𝑠=1,3𝑘𝑔

Precyzja szacunku = maksymalny błąd szacunku Precyzja szacunku zależy od: przyjętego współczynnika ufności 1−𝛼 liczebności próby Zmniejszenie 𝟏−𝜶: poprawia precyzję (przedział jest węższy) zmniejsza wiarygodność (ufność) tzn. zwiększa się ryzyko, że przedział nie obejmie parametru.

Minimalna liczebność próby przy estymacji średniej m w populacji normalnej ze znanym σ Postać przedziału ufności: Maksymalny błąd szacunku 𝒅 (połowa długości przedziału ufności): Minimalna liczebność próby, zapewniająca, że przy danym 1−𝛼 maksymalny błąd szacunku nie przekroczy ustalonej wartości 𝑑 :

Minimalna liczebność próby przy estymacji parametru p w rozkładzie dwumianowym Postać przedziału ufności: Maksymalny błąd szacunku d (połowa długości przedziału ufności): Minimalna liczebność próby, przy danym 1−𝛼 maksymalny błąd szacunku nie przekroczy ustalonej wartości d: W miejsce p podstawiamy wartość przewidywaną lub wstępnie oszacowaną. W przypadku braku wiedzy przyjmujemy: 𝑝=0,5.

Przykład – minimalna liczebność próby Pytanie: jak liczna powinna być próba, aby przy estymacji frakcji żarówek wadliwych w populacji 𝑝, błąd szacunku nie przekroczył 2% (1−𝛼 = 0,95)? 𝑢 𝛼 𝑝 (1− 𝑝 ) 𝑛 ≤0,02 𝑛> 𝑢 𝛼 𝑝 (1− 𝑝 ) 0,02 2 = 1,96 2 𝑝 (1− 𝑝 ) 0,02 2 dla 𝑤=0,1 błąd 2% 𝑛>864,36≈865 dla 𝑤=0,5 błąd 2% 𝑛≈2401 błąd 3% 𝑛>1067,11≈1068 błąd 1% 𝑛≈9604

Dziękuję dr Marta Marszałek https://www.e-sgh.pl/marszalek/110580 e-mail: marta.marszalek@sgh.waw.pl