Wykład 6 Standardowy błąd średniej a odchylenie standardowe z próby

Slides:



Advertisements
Podobne prezentacje
Excel Narzędzia do analizy regresji
Advertisements

ESTYMACJA PRZEDZIAŁOWA
Ocena dokładności i trafności prognoz
Estymacja. Przedziały ufności.
Wykład 9 Analiza wariancji (ANOVA)
Wykład 5 Standardowy błąd a odchylenie standardowe
Wykład 11 Przykład z muszkami (krzyżówka wsteczna CcNn z ccnn)
Wykład 7: Moc Moc testu to prawdopodobieństwo odrzucenia H0, gdy prawdziwa jest HA Moc=czułość testu Moc = 1 – Pr (nie odrzucamy H0, gdy prawdziwa jest.
Wykład 6 Dwie niezależne próby
Analiza współzależności zjawisk
Analiza wariancji jednoczynnikowa
Zmienne losowe i ich rozkłady
Skale pomiarowe – BARDZO WAŻNE
Estymacja przedziałowa
Jak mierzyć asymetrię zjawiska?
Krzysztof Jurek Statystyka Spotkanie 4. Miary zmienności m ó wią na ile wyniki są rozproszone na konkretne jednostki, pokazują na ile wyniki odbiegają
Symulacja zysku Sprzedaż pocztówek.
Statystyka w doświadczalnictwie
BIOSTATYSTYKA I METODY DOKUMENTACJI
Analiza korelacji.
Niepewności przypadkowe
Wykład 7 Przedział ufności dla 1 – 2
Wykład 4 Rozkład próbkowy dla średniej z rozkładu normalnego
Wykład 8 Testy Studenta Jest kilka różnych testów Studenta. Mają one podobną strukturę ale służą do testowania różnych hipotez i różnią się nieco postacią.
Wykład 14 Liniowa regresja
Wykład 3 Wzór Bayesa – wpływ rozkładu a priori.
Wykład 5 Przedziały ufności
Wykład 3 Rozkład próbkowy dla średniej z rozkładu normalnego
Wykład 11 Analiza wariancji (ANOVA)
Wykład 3 Wzór Bayesa, cd.: Wpływ rozkładu a priori.
Wykład 4 Przedziały ufności
Rozkład normalny Cecha posiada rozkład normalny jeśli na jej wielkość ma wpływ wiele niezależnych czynników, a wpływ każdego z nich nie jest zbyt duży.
Metody Symulacyjne w Telekomunikacji (MEST) Wykład 6/7: Analiza statystyczna wyników symulacyjnych  Dr inż. Halina Tarasiuk
Średnie i miary zmienności
Estymacja przedziałowa i korzystanie z tablic rozkładów statystycznych
Rozkład t.
Elementy Rachunku Prawdopodobieństwa i Statystyki
Konstrukcja, estymacja parametrów
dr hab. Ryszard Walkowiak prof. nadzw.
Elementy Rachunku Prawdopodobieństwa i Statystyki
na podstawie materiału – test z użyciem komputerowo generowanych prób
Elementy Rachunku Prawdopodobieństwa i Statystyki
Modelowanie ekonometryczne
Hipotezy statystyczne
Elementy Rachunku Prawdopodobieństwa i Statystyki
Testy statystycznej istotności
Wykład 16 Inne zagadnienia z prostej regresji liniowej.
Seminarium licencjackie Beata Kapuścińska
Testowanie hipotez statystycznych
Wnioskowanie statystyczne
Wykład 5 Przedziały ufności
Rozkład wariancji z próby (rozkład  2 ) Pobieramy próbę x 1,x 2,...,x n z rozkładu normalnego o a=0 i  =1. Dystrybuanta rozkładu zmiennej x 2 =x 1 2.
Przenoszenie błędów (rachunek błędów) Niech x=(x 1,x 2,...,x n ) będzie n-wymiarową zmienną losową złożoną z niezależnych składników o rozkładach normalnych.
Testowanie hipotez Jacek Szanduła.
Jak mierzyć asymetrię zjawiska? Wykład 5. Miary jednej cechy  Miary poziomu  Miary dyspersji (zmienności, zróżnicowania, rozproszenia)  Miary asymetrii.
STATYSTYKA – kurs podstawowy wykład 5 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Monte Carlo, bootstrap, jacknife. 2 Literatura Bruce Hansen (2012 +) Econometrics, ze strony internetowej :
ze statystyki opisowej
Rozkłady statystyk z próby dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium.
STATYSTYKA – kurs podstawowy wykład 4 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Estymacja parametrów populacji. Estymacja polega na szacowaniu wartości parametrów rozkładu lub postaci samego rozkładu zmiennej losowej, na podstawie.
STATYSTYKA – kurs podstawowy wykład 11
Estymacja parametryczna dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium Analiz.
Rozkład z próby Jacek Szanduła.
Statystyka matematyczna
Statystyka matematyczna
Jednorównaniowy model regresji liniowej
Własności asymptotyczne ciągów zmiennych losowych
MIARY STATYSTYCZNE Warunki egzaminu.
Monte Carlo, bootstrap, jacknife
Zapis prezentacji:

Wykład 6 Standardowy błąd średniej a odchylenie standardowe z próby Odchylenie standardowe z próby s: Służy do oceny zmienności w zbiorze danych Gdy n wzrasta s zbliża się do odchylenia standardowego w populacji  Używane do przewidywań dotyczących poszczególnych obserwacji

Błąd standardowy średniej SE = : Służy do oceny niepewności związanej z estymacją średniej w populacji Maleje wraz ze wzrostem n Używane do przewidywań dotyczących średniej

Jak duża powinna być próba? Poprzez wybór odpowiedniego n możemy uzyskać PU o odpowiedniej (dowolnie małej) szerokości Możemy estymować  z zadaną precyzją Przykład: ustal rozmiar próby tak aby 95% PU dla średniej miał szerokość 5.

Załóżmy, że  =10. Wtedy Na ogół nie znamy . Możemy wykonać badanie wstępne (mała próba) aby oszacować .

Założenia (jeszcze raz) Próba musi być losowa Każdy element w populacji ma jednakową szansę na wybór Poszczególne wybory są od siebie niezależne Jeżeli te założenia nie są spełnione to wzrost n może nie gwarantować zmniejszenia SE.

Przedział ufności dla frakcji w populacji Estymujemy p za pomocą Chcemy skonstruować przedział ufności dla p Moglibyśmy skorzystać z rozkładu Bernoulliego ale wymagałoby to uciążliwych rachunków. Korzystamy z przybliżenia rozkładu Bernoulliego rozkładem normalnym Gdy Y ma rozkład Bernoulliego (n, p) i n jest duże, wtedy Y ma w przybliżeniu rozkład nornmalny

= Y/n ma średnią i  = Zatem ma w przybliżeniu rozkład

Przedział ufności dla p Klasyczny przedział ufności uzyskuje się zastępując p przez (we wzorze na ). Klasyczne przedziały ufności zachowują się źle gdy y jest bliskie 0 – wtedy PU często zawiera ujemne wartości. My będziemy korzystali z następującej poprawki: Centrum przedziału będzie (zamiast ). Przypomnijmy, że Z/2 jest taką liczbą, że Pr(Z < - Z/2) = Pr(Z > Z/2) = /2 Dla 95% PU,  = 0.05 i Z/2 = 1.96.

Definiujemy SE dla wynosi Dla 95% PU Wstawiamy Z0.025 = 1.96 i dostajemy

Przedział ufności dla p Skonstruujemy przybliżony przedział ufności dla p, z centrum w Użyjemy kwantyli z rozkładu normalnego Z/2 Dla 95% PU użyjemy Z0.025 =1.96 Dla 90% PU użyjemy Z0.05 =1.65; dla 99% PU użyjemy Z0.005=2.58. przybliżony 95% PU dla p wynosi

Przykład: Złapano 125 myszy i 6 z nich ma nakrapiane na biało brzuszki p = frakcja myszek w całej populacji, które mają nakrapiane na biało brzuszki 95% PU dla p:

90% PU dla p

Mamy 90% pewności że frakcja myszek w całej populacji, które mają brzuszki nakrapiane na biało zawiera się w przedziale między a . Zauważmy, że 90% PU jest niż 95% PU i że przedziały te mają różne środki.

Jak duża powinna być próba ? Chcemy aby 95% PU miał zadaną długość. Jak ustalić rozmiar próby ? Uwaga – długość przedziału zależy od , którego nie znamy Jeżeli mniej więcej wiemy jakie jest p, to możemy tą przybliżoną wartość użyć w równaniu na długość przedziału. Jeżeli nie mamy żadnych wstępnych informacji to używamy p = 0.5. Ten wybór jest bezpieczny i gwarantuje, że przedział ufności skonstruowany w oparciu o próbę o wyliczonym rozmiarze będzie nie szerszy od założonego.

Przykład Chcemy aby SE było równe .005 (odpowiedni przedział ufności ma długość około 0.02). Przypuszczamy, że prawdziwe p jest bliskie .05. Potrzebujemy myszy.

Nie wiemy nic o p. Potrzebujemy myszy.

Dwie niezależne próby Czasami chcemy porównać wartości pewnej zmiennej w dwóch populacjach. Przykłady Grupa zabiegowa i kontrolna Lekarstwo a placebo Pacjenci biorący dwa podobne lekarstwa Mężczyźni a kobiety Dwie różne linie genetyczne

Rozkład cechy Y w populacji 1 jest N(1, 1): bierzemy próbę o rozmiarze n1, y1, s1, SE1 = Rozkład cechy Y w populacji 2 jest N(2, 2) : bierzemy próbę o rozmiarze n2,,, y2,s2, SE2 =

Jaka jest różnica między średnimi w obu populacjach, 1-2 ? Chcemy wyestymować 1 - 2 i otrzymać przedział ufności y1-y2 jest estymatorem 1-2 Aby skonstruować przedział ufności musimy wyznaczyć SE

Standardowy błąd dla różnicy dwóch średnich Jak policzyć SE dla y1-y2? Dwa sposoby: ``nieuśrednianie’’ i ``uśrednianie’’. gdy n1 = n2 obie metody dają te same wyniki Na ogół będziemy używać ``nieuśrednionego’’ SE. Metodę ``uśredniania’’ zastosujemy gdy będzie można założyć, że 1=2 (albo gdy o to poprosi wykładowca). W obu przypadkach SE liczone jest jako pewna kombinacja s1 and s2

Metoda zwykła (``nieuśrednianie’’) Liczymy SE1 = i SE2 = osobno w obu próbach.

Liczymy standardowy błąd różnicy średnich:

Metoda ``uśredniania’’ W obu próbach liczymy SS : SS1 and SS2, i obliczamy „uśrednioną wariancję": sc2 =

``Uśredniony’’ błąd standardowy wynosi

Podsumowanie obu metod Metoda ``nieuśredniania’’ (N)SEy1-y2 = =

Metoda ``uśredniania’’ SS1 = (n1–1)s12 = (y-y1)2 w próbie 1 SS2 = (n2–1)s22 = (y-y2)2 w próbie 2 ``uśredniona’’ wariancja sc2 = (U)SEy1-y2 =

Przykład: próba 1: n1 = 15, y1 = 75, SS1 = 600

Wyniki z obu metod nie są takie same ale są dość podobne. Zauważmy, że s1 = 6.55 i s2 = 5.77 (dość podobne).