Wykład 7 Przedział ufności dla 1 – 2

Slides:



Advertisements
Podobne prezentacje
Regresja i korelacja materiały dydaktyczne.
Advertisements

Test zgodności c2.
Rangowy test zgodności rozkładów
Estymacja. Przedziały ufności.
Wykład 9 Analiza wariancji (ANOVA)
Wykład 5 Standardowy błąd a odchylenie standardowe
Wykład 11 Przykład z muszkami (krzyżówka wsteczna CcNn z ccnn)
Wykład 7: Moc Moc testu to prawdopodobieństwo odrzucenia H0, gdy prawdziwa jest HA Moc=czułość testu Moc = 1 – Pr (nie odrzucamy H0, gdy prawdziwa jest.
Wykład 6 Dwie niezależne próby
Analiza wariancji jednoczynnikowa
BUDOWA MODELU EKONOMETRYCZNEGO
Test zgodności Joanna Tomanek i Piotr Nowak.
Metody ekonometryczne
hasło: student Joanna Rutkowska Aneta Arct
Jakość sieci geodezyjnych. Pomiary wykonane z największą starannością, nie dostarczają nam prawdziwej wartości mierzonej wielkości, lecz są zwykle obarczone.
Wykład 6 Standardowy błąd średniej a odchylenie standardowe z próby
Wykład 4 Rozkład próbkowy dla średniej z rozkładu normalnego
Wykład 8 Testy Studenta Jest kilka różnych testów Studenta. Mają one podobną strukturę ale służą do testowania różnych hipotez i różnią się nieco postacią.
Wykład 5 Przedziały ufności
Wykład 3 Rozkład próbkowy dla średniej z rozkładu normalnego
Wykład 11 Analiza wariancji (ANOVA)
Wykład 4 Przedziały ufności
Metody Przetwarzania Danych Meteorologicznych Wykład 4
Rozkład normalny Cecha posiada rozkład normalny jeśli na jej wielkość ma wpływ wiele niezależnych czynników, a wpływ każdego z nich nie jest zbyt duży.
Testy nieparametryczne
Analiza wariancji.
Jednoczynnikowa analiza wariancji (ANOVA)
Rozkład t.
Metody ilościowe w biznesie Wykład 1
Hipotezy statystyczne
Analiza wariancji.
Testy nieparametryczne
Testowanie hipotez statystycznych
Hipotezy statystyczne
Elementy Rachunku Prawdopodobieństwa i Statystyki
BADANIE STATYSTYCZNE Badanie statystyczne to proces pozyskiwania danych na temat rozkładu cechy statystycznej w populacji. Badanie może mieć charakter:
Analiza wariancji jednoczynnikowa.
Testy nieparametryczne
Elementy Rachunku Prawdopodobieństwa i Statystyki
Modelowanie ekonometryczne
Hipotezy statystyczne
Elementy Rachunku Prawdopodobieństwa i Statystyki
Kilka wybranych uzupelnień
Ekonometria stosowana
Planowanie badań i analiza wyników
Wykład 16 Inne zagadnienia z prostej regresji liniowej.
Seminarium licencjackie Beata Kapuścińska
Testowanie hipotez statystycznych
Wnioskowanie statystyczne
Ekonometria stosowana
Wykład 5 Przedziały ufności
Weryfikacja hipotez statystycznych
Weryfikacja hipotez statystycznych dr hab. Mieczysław Kowerski
Testowanie hipotez Jacek Szanduła.
STATYSTYKA sposób na opisanie zjawisk masowych Mirosław Sadowski TRANSGRANICZNY UNIWERSYTET TRZECIEGO WIEKU W ZGORZELCU.
Treść dzisiejszego wykładu l Weryfikacja statystyczna modelu ekonometrycznego –błędy szacunku parametrów, –istotność zmiennych objaśniających, –autokorelacja,
Monte Carlo, bootstrap, jacknife. 2 Literatura Bruce Hansen (2012 +) Econometrics, ze strony internetowej :
Przeprowadzenie badań niewyczerpujących, (częściowych – prowadzonych na podstawie próby losowej), nie daje podstaw do formułowania stanowczych stwierdzeń.
Testy nieparametryczne – testy zgodności. Nieparametryczne testy istotności dzielimy na trzy zasadnicze grupy: testy zgodności, testy niezależności oraz.
STATYSTYKA – kurs podstawowy wykład 7 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Rozkłady statystyk z próby dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium.
Estymacja parametrów populacji. Estymacja polega na szacowaniu wartości parametrów rozkładu lub postaci samego rozkładu zmiennej losowej, na podstawie.
STATYSTYKA – kurs podstawowy wykład 6 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Weryfikacja hipotez statystycznych „Człowiek – najlepsza inwestycja”
Wnioskowanie statystyczne. Próbkowanie (sampling)
Statystyka matematyczna
Statystyka matematyczna
Jednorównaniowy model regresji liniowej
Wnioskowanie statystyczne Weryfikacja hipotez statystycznych
Analiza współzależności zjawisk
Zapis prezentacji:

Wykład 7 Przedział ufności dla 1 – 2 Skonstruujemy przedział ufności dla 1 – 2 Przypomnienie: PU dla  : y  t/2 SEy = (estymator)  (kwantyl)(SE) Estymator dla 1 - 2 : y1-y2 Potrzebujemy t/2 : Ile użyć stopni swobody? (Skomplikowane; wzoru nie trzeba pamiętać, będzie na ściądze.) df=

Liczba stopni swobody wyliczona z poprzedniego wzoru nie powinna być większa niż n1 + n2 – 2; przy szybkich, zgrubnych obliczeniach często stosujemy df = n1 + n2 –2. Nie powinna być mniejsza niż mniejsza z wartości (n1 -1) i (n2 -1).

Stosujemy ``nieuśredniony’’ SE (o ile w zadaniu nie będzie specjalnie wymagane any użyć (U)SE). PU na poziomie ufności (1-) dla 1 - 2 (y1-y2)  t(df)/2 SE(y1-y2)

Przykład (cd) Skonstruuj 95% PU dla 1 - 2 y1 –y2 = 75 – 55 = 20 SE1 = 1.690 ; SE2 = 1.826 df=

Oblicz przedział ufności jeszcze raz wykorzystując ``uśredniony’’ SE.

Przykład 2 - 95% PU dla 1 - 2 Rośliny hodowane w różnych warunkach oświetleniowych. Ciemno Jasno n 22 21 y 1.76 2.46 SE 0.5 0.7

“1” – populacja/próba hodowana przy słabym oświetleniu “2” – populacja/próba hodowana przy silnym oświetleniu Oblicz 95% PU dla 1 - 2.

Przedziały ufności: Interpretacja Nasz PU zawiera wartości zarówno dodatnie jak i ujemne ? Jak to zinterpretować ?

Testowanie hipotez Idea Chcemy odpowiedzieć na pytanie naukowe dotyczące pewnej (lub pewnych) populacji Decyzję podejmujemy w oparciu o próbę - dysponujemy tylko pewnym fragmentem informacji W rezultacie możemy popełnić błąd przy podejmowaniu decyzji Chcemy zminimalizować p-stwo błędu

Typowe pytania: Pytania o wartości parametrów Dla populacji o rozkładzie Bernoulliego. Czy p-stwo sukcesu wynosi ½ (czy moneta jest symetryczna) ? Czy p-stwo sukcesu wynosi p0 ? (p0 – pewna konkretna, interesująca nas wartość)

Dla rozkładu normalnego: Czy średnia w populacji wynosi 0? Czy średnia w populacji wynosi 93? Czy średnia w populacji wynosi 0 ? (0 – konkretna, interesująca nas wartość). Dla dwóch populacji normalnych Czy średnie wartości cechy w obu populacjach są sobie równe ? Czy różnica między średnimi w obu populacjach wynosi 0? Czy różnica między średnimi w obu populacjach wynosi 0 ?

Na te pytania są dwie możliwe odpowiedzi – tak albo nie (prawda albo fałsz). Pytania dotyczą całej populacji, do której na ogół nie mamy dostępu. Nasza decyzja, którą podejmujemy w oparciu o próbę, jest obarczona pewnym błędem. Sposób formułowania odpowiedzi Zamiast prawda mówimy ``W oparciu o tę próbę nie możemy wykluczyć postawionej hipotezy’’ . Przykład: Przeprowadzone badania nie potwierdzają, że badane populacje mają różny średni poziom badanej cechy. (Nie można wykluczyć, że nie ma różnicy).

Zamiast Nie mówimy Jest to mało prawdopodobne albo bardziej precyzyjnie Gdyby postawiona hipoteza była prawdziwa to uzyskany wynik (z próby) byłby bardzo mało prawdopodobny. Dlatego odrzucamy tę hipotezę (ale możemy się mylić). Przykład: Przeprowadzone badanie potwierdza tezę, że badane populacje różnią się średnią wartością badanej cechy (odrzucamy hipotezę o równości średnich).

Analogia (K. Simonsen, Purdue): wykrywacz dymu Instalujemy wykrywacze dymu aby ostrzegły nas przed pożarem. Nie są to idealne wykrywacze pożarów. Reagują na cząstki dymu w powietrzu. Mogą być w dwu możliwych stanach – CICHO i GŁOŚNO Nasz dom może być w dwu możliwych stanach – SPOKÓJ albo POŻAR

Możemy podjąć dwie decyzje: zostać albo uciekać System ostrzegania może popełnić dwa błędy Jest GŁOŚNO choć nie ma ognia (na przykład przypaliliśmy grzankę) Jest CICHO choć jest pożar (zła lokalizacja, koniec baterii,…) Decyzję uzależniamy od stanu wykrywaczy dymu (CICHO – zostajemy, GŁOŚNO – uciekamy).

Na ogół nie ma ognia, wykrywacz jest CICHO, więc nie reagujemy (dobra decyzja). Czasami nie ma ognia a wykrywacz jest GŁOŚNO, więc uciekamy (zła decyzja – strata czasu) – błąd I rodzaju. Czasami jest pożar a wykrywacz jest CICHO więc zostajemy (zła decyzja – niebezpieczeństwo) – błąd II rodzaju. Czasami jest pożar i wykrywacz jest GŁOŚNO więc uciekamy (dobra decyzja).

Notacja: Hipotezy Stan wyjściowy, ``SPOKÓJ’’, określamy nazwą hipotezy zerowej Drugi możliwy stan, ``POŻAR’’, określamy nazwą hipotezy alternatywnej H0 to skrót dla hipotezy zerowej HA to skrót dla hipotezy alternatywnej

Decyzje Decyzje zawsze wyrażamy w stosunku do hipotezy zerowej H0: Decyzja ``uciekamy’’ odpowiada odrzuceniu H0, tzn. odrzucamy stanowisko, że nie ma pożaru. Decyzja ``zostajemy’’ odpowiada nie odrzuceniu H0. Decyzję podejmujemy w oparciu o zachowanie wykrywacza dymu, który dalej będziemy nazywać statystyką testową.

Gdy wykrywacz jest GŁOŚNO to mówimy, że wynik testu jest ``istotny’’ Gdy wykrywacz jest GŁOŚNO to mówimy, że wynik testu jest ``istotny’’. Istotny wynik powoduje odrzucenie H0. Gdy wykrywacz jest CICHO to wynik testu jest ``nieistotny’’ i nie odrzucamy H0.

Podsumowanie analogii Hipotezy: SPOKÓJ = H0 ; POŻAR = HA ; Statystyka testowa: CICHO = nieistotna; GŁOŚNO = istotna; Decyzja: zostajemy = nie odrzucamy H0; uciekamy = odrzucamy H0 Błąd I rodzaju: (uciekamy choć nie ma pożaru) = (odrzucamy H0 choć jest prawdziwa) Błąd II rodzaju: (zostajemy choć jest pożar) = (nie odrzucamy H0 choć prawdziwa jest HA)

Zauważmy, że H0 jest bardziej precyzyjna niż HA: gdy HA jest prawdziwa to pożar może być dowolnej wielkości Wykrywacze dymu mają pewną ustaloną czułość – reagują na określoną ilość dymu w powietrzu. Jeżeli wykrywacz jest zbyt czuły to będzie często powodował fałszywe alarmy (błędy I rodzaju). Jeżeli nie jest dość czuły to nie będzie się włączał kiedy potrzeba – błędy II rodzaju.

Zwiększając czułość zmniejszamy p-stwo błędu II rodzaju ale zwiększamy p-stwo błędu I rodzaju. Dobór czułości testu powinien zależeć od konsekwencji błędów. Jak opisać czułość testu ? „Poziom istotności” (α) to p-stwo błędu I rodzaju. Poziom istotności powinno się ustalić jeszcze przed przeprowadzeniem eksperymentu. β – p-stwo błędu II rodzaju (zależy np. od wielkości pożaru)

Hipoteza zerowa H0  = 0  = 0 (-0 = 0) 1 = 2 (1–2 = 0) Prosta i specyficzna Będziemy ją odrzucali albo nie Przykłady:  = 0  = 0 (-0 = 0) 1 = 2 (1–2 = 0) 1 - 2 = 0 p = p0 Aby kontrolować błąd I rodzaju musimy znać rozkład statystyki testowej przy H0.

Hipoteza alternatywna HA W pewnym sensie przeciwna do H0 Na ogół bardziej ogólna niż H0 (nieznany rozmiar pożaru) „odrzucenie H0" oznacza, że wierzymy w HA „nie odrzucenie H0" oznacza, że nie mamy dowodów przemawiających za HA Nie jest to to samo co udowodnienie prawdziwości H0 (tego nie potrafimy zrobić).

Przykłady HA:   0  > 0  < 0 1  2 (1 - 2  0) 1 > 2 (1 - 2 > 0) 1 > 2 (1 - 2 < 0) Rozkład statystyki testowej przy HA powinien być inny niż przy H0 (wykrywacz powinien być GŁOŚNO gdy mamy pożar).

Przykład ilustracyjny Załóżmy, że mamy próbę z populacji o rozkładzie normalnym. Niech  (nieznane) oznacza jego średnią. Chcemy przetestować H0:  = 5 Przeciwko alternatywie HA:   5

Możemy skonstruować przedział ufności dla  w oparciu o dane Możemy skonstruować przedział ufności dla  w oparciu o dane. Taki przedział ufności powinien zawierać . Zatem jeżeli przedział ufności nie zawiera 5 to raczej odrzucimy H0 na korzyść HA. Jeżeli przedział ufności zawiera 5 to oznacza, że nie możemy odrzucić H0. Ponieważ jednak PU zawiera także wiele innych wartości niż 5 nie możemy również stwierdzić, że H0 jest prawdziwa.

PU na poziomie (1-) jest dany wzorem y  t/2 SE. Sprawdzimy, czy zawiera on 5.

Tak więc równoważnie wyznaczamy statystykę testową (y – 5)/SE i sprawdzamy czy zawiera się ona w przedziale –t/2 and +t/2 Jeżeli tak to statystyka jest nieistotna i nie odrzucamy H0. Jeżeli nie to statystyka jest istotna i odrzucamy H0. Zbiór (-∞ , –t/2) U (+t/2 , ∞) nazywamy obszarem krytycznym. Jeżeli statystyka testowa znajdzie się w obszarze krytycznym to odrzucamy H0. Zauważmy, że postać statystyki testowej zależy od H0 (stąd pochodzi 5).

Rozkład statystyki testowej przy H0 ma rozkład My zastępujemy  przez SE . (y-)/SE ma rozkład Studenta z n-1 stopniami swobody. Tak więc, jeżeli H0 jest prawdziwa to  = 5 i (y-5)/SE ma rozkład

Zwykle statystykę testową tak wybieramy abyśmy umieli policzyć jej rozkład przy H0. Co się stanie jeżeli prawdziwa jest HA ? Wtedy  ≠ 5 i rozkład statystyki (y-5) będzie skoncentrowany w okolicach (-5) zamiast w okolicach 0.

Poziom istotności Poziom istotności -  = P-stwo błędu I rodzaju (odrzucenie H0 gdy jest prawdziwa). Załóżmy, że H0 jest prawdziwa. Jakie jest p-stwo, że statystyka testowa znajdzie się w zbiorze krytycznym (-∞ , –t/2) U (+t/2 ,∞).

α wybieramy przed przystąpieniem do testowania. Typowe wartości α to 0 α wybieramy przed przystąpieniem do testowania. Typowe wartości α to 0.05, 0.01 lub 0.1. Możemy jednak stosować inne wartości. Wybór α powinien zależeć od konsekwencji błędów I i II rodzaju. Wartość krytyczna – wartość leżąca na granicy obszaru krytycznego.

W naszym przykładzie rozbiliśmy zbiór krytyczny na dwie symetryczne części (-∞ , –t/2) i (+t/2 ,∞). Tak postępujemy ponieważ HA,  ≠ 5 , jest symetryczna (niekierunkowa). Jesteśmy zainteresowani alternatywami dla których  < 5 lub  > 5. Czasami rozważamy alternatywy kierunkowe, takie jak HA:  > 5. W tym przypadku obszar krytyczny ma postać