Wykład 5 Standardowy błąd a odchylenie standardowe

Slides:



Advertisements
Podobne prezentacje
Excel Narzędzia do analizy regresji
Advertisements

ESTYMACJA PRZEDZIAŁOWA
Ocena dokładności i trafności prognoz
BIOSTATYSTYKA I METODY DOKUMENTACJI Ćwiczenie 1
Statystyka Wojciech Jawień
Estymacja. Przedziały ufności.
Wykład 9 Analiza wariancji (ANOVA)
Wykład 11 Przykład z muszkami (krzyżówka wsteczna CcNn z ccnn)
Wykład 7: Moc Moc testu to prawdopodobieństwo odrzucenia H0, gdy prawdziwa jest HA Moc=czułość testu Moc = 1 – Pr (nie odrzucamy H0, gdy prawdziwa jest.
Analiza współzależności zjawisk
Skale pomiarowe – BARDZO WAŻNE
Estymacja przedziałowa
Jak mierzyć asymetrię zjawiska?
Krzysztof Jurek Statystyka Spotkanie 4. Miary zmienności m ó wią na ile wyniki są rozproszone na konkretne jednostki, pokazują na ile wyniki odbiegają
Statystyka w doświadczalnictwie
Podstawowe pojęcia prognozowania i symulacji na podstawie modeli ekonometrycznych Przewidywaniem nazywać będziemy wnioskowanie o zdarzeniach nieznanych.
BIOSTATYSTYKA I METODY DOKUMENTACJI
Niepewności przypadkowe
Wykład 7 Przedział ufności dla 1 – 2
Wykład 6 Standardowy błąd średniej a odchylenie standardowe z próby
Wykład 4 Rozkład próbkowy dla średniej z rozkładu normalnego
Wykład 14 Liniowa regresja
Wykład 3 Wzór Bayesa – wpływ rozkładu a priori.
Wykład 5 Przedziały ufności
Wykład 3 Rozkład próbkowy dla średniej z rozkładu normalnego
Wykład 11 Analiza wariancji (ANOVA)
Wykład 3 Wzór Bayesa, cd.: Wpływ rozkładu a priori.
Wykład 4 Przedziały ufności
Elementy Rachunku Prawdopodobieństwa c.d.
Metody Przetwarzania Danych Meteorologicznych Wykład 4
Rozkład normalny Cecha posiada rozkład normalny jeśli na jej wielkość ma wpływ wiele niezależnych czynników, a wpływ każdego z nich nie jest zbyt duży.
Wykład 4. Rozkłady teoretyczne
Metody Symulacyjne w Telekomunikacji (MEST) Wykład 6/7: Analiza statystyczna wyników symulacyjnych  Dr inż. Halina Tarasiuk
Średnie i miary zmienności
Analiza wariancji.
Estymacja przedziałowa i korzystanie z tablic rozkładów statystycznych
Rozkład t.
Elementy Rachunku Prawdopodobieństwa i Statystyki
Konstrukcja, estymacja parametrów
dr hab. Ryszard Walkowiak prof. nadzw.
Elementy Rachunku Prawdopodobieństwa i Statystyki
Elementy Rachunku Prawdopodobieństwa i Statystyki
Elementy Rachunku Prawdopodobieństwa i Statystyki
Hipotezy statystyczne
Elementy Rachunku Prawdopodobieństwa i Statystyki
Podstawy statystyki, cz. II
Błędy i niepewności pomiarowe II
Planowanie badań i analiza wyników
Wykład 16 Inne zagadnienia z prostej regresji liniowej.
Testowanie hipotez statystycznych
Dopasowanie rozkładów
Wnioskowanie statystyczne
Wykład 5 Przedziały ufności
Modele zmienności aktywów
Rozkład wariancji z próby (rozkład  2 ) Pobieramy próbę x 1,x 2,...,x n z rozkładu normalnego o a=0 i  =1. Dystrybuanta rozkładu zmiennej x 2 =x 1 2.
Przenoszenie błędów (rachunek błędów) Niech x=(x 1,x 2,...,x n ) będzie n-wymiarową zmienną losową złożoną z niezależnych składników o rozkładach normalnych.
Testowanie hipotez Jacek Szanduła.
Jak mierzyć asymetrię zjawiska? Wykład 5. Miary jednej cechy  Miary poziomu  Miary dyspersji (zmienności, zróżnicowania, rozproszenia)  Miary asymetrii.
STATYSTYKA – kurs podstawowy wykład 5 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Monte Carlo, bootstrap, jacknife. 2 Literatura Bruce Hansen (2012 +) Econometrics, ze strony internetowej :
ze statystyki opisowej
Rozkłady statystyk z próby dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium.
STATYSTYKA – kurs podstawowy wykład 11
Estymacja parametryczna dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium Analiz.
Rozkład z próby Jacek Szanduła.
Statystyka matematyczna
Jednorównaniowy model regresji liniowej
Własności asymptotyczne ciągów zmiennych losowych
ROZKŁAD NORMALNY 11 października 2017.
Monte Carlo, bootstrap, jacknife
Zapis prezentacji:

Wykład 5 Standardowy błąd a odchylenie standardowe Odchylenie standardowe z próby s: Służy do oceny zmienności w zbiorze danych Gdy n wzrasta s zbliża się do odchylenia standardowego w populacji  Używane do przewidywań dotyczących indywidualnych obserwacji

Błąd standardowy średniej SE = : Służy do oceny niepewności związanej z estymacją średniej w populacji Maleje do zera wraz ze wzrostem n Używane do przewidywań dotyczących średniej

Jak duża powinna być próba? Poprzez wybór odpowiedniego n możemy uzyskać PU o odpowiedniej (dowolnie małej) szerokości Możemy estymować  z zadaną precyzją Przykład: znajdź rozmiar próby taki, aby 95% PU dla średniej miał szerokość 5.

Załóżmy, że  =10. Wtedy Na ogół nie znamy, możemy jednak wykonać badanie wstępne (mała próba) i użyć s.

Podstawowe założenie (jeszcze raz) Próba musi być losowa: każdy element w populacji ma jednakową szansę być wybranym poszczególne wybory są od siebie niezależne Jeżeli to założenie nie jest spełnione to wzrost n może nie gwarantować zmniejszenia SE.

Przedział ufności dla frakcji w populacji Estymujemy p za pomocą Chcemy skonstruować przedział ufności dla p Moglibyśmy skorzystać z rozkładu dwumianowego, ale wymagałoby to uciążliwych rachunków. Korzystamy z przybliżenia rozkładu Bernoulliego rozkładem normalnym Gdy Y ma rozkład dwumianowy (n, p) i n jest duże, wtedy Y ma w przybliżeniu rozkład normalny

= Y/n ma wartość oczekiwaną= i  = Zatem ma w przybliżeniu rozkład

Przedział ufności dla p Będziemy korzystali z przybliżonego przedziału ufności Agrestiego-Coula (patrz np. Brown, Cai i DasGupta, Annals of Statistics, 2002): Środkiem przedziału będzie (modyfikacja ) Przypomnijmy, że Z/2 jest taką liczbą, że Pr(Z < - Z/2) = Pr(Z > Z/2) = /2 Dla 95% PU,  = 0.05 i Z/2 = 1.96

Definiujemy SE dla definiujemy jako Np. dla 95% PU wstawiamy Z0.025 = 1.96 i dostajemy

Przedział ufności dla p (cd.) Skonstruujemy przybliżony przedział ufności dla p, z centrum w Użyjemy kwantyli z rozkładu normalnego Z/2 Dla 95% PU użyjemy Z0.025 =1.96 Dla 90% PU użyjemy Z0.05 =1.65; dla 99% PU użyjemy Z0.005=2.58. przybliżony 95% PU dla p wynosi

Przykład: Złapano 125 myszy i 6 z nich ma brzuszki nakrapiane na biało p = frakcja myszek w całej populacji, które mają nakrapiane na biało brzuszki 95% PU dla p:

90% PU dla p

Sformułowanie konkluzji: Mamy 90% pewności że frakcja myszek w tej populacji, które mają brzuszki nakrapiane na biało zawiera się w przedziale między a . Zauważmy, że 90% PU jest niż 95% PU i że przedziały te mają różne środki.

Klasyczny przybliżony przedział ufności (informacja) Klasyczny przedział ufności uzyskuje się biorąc za jego środek i zastępując p przez we wzorze na  i błąd standardowy. Klasyczne przedziały ufności zachowują się źle, gdy liczba sukcesów (Y) jest bliska zeru lub n. Może się wtedy zdarzyć np., że klasyczny PU zawiera ujemne wartości.

Jak duża powinna być próba ? Chcemy aby 95% PU miał długość nie większą od zadanej. Jak ustalić rozmiar próby? Idea: długość przedziału zależy od n, skąd można wyznaczyć wystarczający rozmiar próby. Uwaga – długość przedziału zależy też od , którego nie znamy. Jeżeli wiemy w przybliżeniu, jakie jest p, to możemy tej przybliżonej wartości użyć w równaniu na długość przedziału (skąd wyznaczymy n) Jeżeli nie mamy żadnych wstępnych informacji, to użyjemy p = 0.5. Prowadzi to do ostrożnego wyboru n: szerokość PU skonstruowanego w oparciu o próbę o wyliczonym rozmiarze nie będzie większa od założonej, a może być dużo mniejsza. (Czy to dobrze?)

Przykład Chcemy aby SE było równe 0.005 (95% PU będzie miał długość około 0.02). Przypuszczamy, że prawdziwe p jest bliskie 0.05. Rachunki: Konkluzja: „Proszę złapać myszy.”

Obliczenia, gdy nie wiemy nic o p: Konkluzja: „Proszę złapać myszy.”

Asymptotyczne przedzialy ufnosci dla estymatorow najwiekszej wiarogodnosci – patrz tablica