Hipotezy statystyczne

Slides:



Advertisements
Podobne prezentacje
Regresja i korelacja materiały dydaktyczne.
Advertisements

ESTYMACJA PRZEDZIAŁOWA
Test zgodności c2.
Rangowy test zgodności rozkładów
Estymacja. Przedziały ufności.
Wykład 9 Analiza wariancji (ANOVA)
Analiza wariancji jednoczynnikowa
Badania marketingowe na rynkach produktów sektora wysokich technologii Wybrane metody analizy danych.
BUDOWA MODELU EKONOMETRYCZNEGO
Test zgodności Joanna Tomanek i Piotr Nowak.
Opinie, przekonania, stereotypy
Wnioskowanie statystyczne CZEŚĆ III
Wykład 7 Przedział ufności dla 1 – 2
Wykład 11 Analiza wariancji (ANOVA)
Metody Przetwarzania Danych Meteorologicznych Wykład 4
Nierówność informacyjna
Rozkład normalny Cecha posiada rozkład normalny jeśli na jej wielkość ma wpływ wiele niezależnych czynników, a wpływ każdego z nich nie jest zbyt duży.
Wykład 4. Rozkłady teoretyczne
Testy nieparametryczne
Średnie i miary zmienności
Analiza wariancji.
Jednoczynnikowa analiza wariancji (ANOVA)
Rozkład t.
Hipotezy statystyczne
Analiza wariancji jednoczynnikowa
Analiza wariancji.
Testy nieparametryczne
Konstrukcja, estymacja parametrów
Testowanie hipotez statystycznych
Testy nieparametryczne
Analiza reszt w regresji
BADANIE STATYSTYCZNE Badanie statystyczne to proces pozyskiwania danych na temat rozkładu cechy statystycznej w populacji. Badanie może mieć charakter:
Analiza wariancji jednoczynnikowa.
Testy nieparametryczne
Elementy Rachunku Prawdopodobieństwa i Statystyki
Prognozowanie z wykorzystaniem modeli ekonometrycznych
Modelowanie ekonometryczne
Hipotezy statystyczne
Zagadnienia regresji i korelacji
Kilka wybranych uzupelnień
Ekonometria stosowana
Ekonometria stosowana
Seminarium licencjackie Beata Kapuścińska
Testowanie hipotez statystycznych
Dopasowanie rozkładów
Wnioskowanie statystyczne
Weryfikacja hipotez statystycznych
Weryfikacja hipotez statystycznych dr hab. Mieczysław Kowerski
Testowanie hipotez Jacek Szanduła.
STATYSTYKA sposób na opisanie zjawisk masowych Mirosław Sadowski TRANSGRANICZNY UNIWERSYTET TRZECIEGO WIEKU W ZGORZELCU.
Treść dzisiejszego wykładu l Weryfikacja statystyczna modelu ekonometrycznego –błędy szacunku parametrów, –istotność zmiennych objaśniających, –autokorelacja,
Przeprowadzenie badań niewyczerpujących, (częściowych – prowadzonych na podstawie próby losowej), nie daje podstaw do formułowania stanowczych stwierdzeń.
Testy nieparametryczne – testy zgodności. Nieparametryczne testy istotności dzielimy na trzy zasadnicze grupy: testy zgodności, testy niezależności oraz.
STATYSTYKA – kurs podstawowy wykład 7 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Rozkłady statystyk z próby dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium.
Ekonometria stosowana Heteroskedastyczność składnika losowego Piotr Ciżkowicz Katedra Międzynarodowych Studiów Porównawczych.
Estymacja parametrów populacji. Estymacja polega na szacowaniu wartości parametrów rozkładu lub postaci samego rozkładu zmiennej losowej, na podstawie.
STATYSTYKA – kurs podstawowy wykład 6 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Weryfikacja hipotez statystycznych „Człowiek – najlepsza inwestycja”
Modele nieliniowe sprowadzane do liniowych
STATYSTYKA – kurs podstawowy wykład 11
Estymacja parametryczna dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium Analiz.
Wnioskowanie statystyczne. Próbkowanie (sampling)
Testy nieparametryczne
Statystyka matematyczna
Statystyka matematyczna
Jednorównaniowy model regresji liniowej
Wnioskowanie statystyczne Weryfikacja hipotez statystycznych
Analiza niepewności pomiarów Zagadnienia statystyki matematycznej
Monte Carlo, bootstrap, jacknife
Zapis prezentacji:

Hipotezy statystyczne Definicja, sformułowanie i weryfikacja Autor: Janusz Górczyński

Autor: Janusz Górczyński Definicja Hipotezą statystyczną jest dowolne zdanie orzekające o parametrach populacji lub jej rozkładzie. Prawdziwość hipotezy jest oceniana na podstawie wyników próby losowej. Hipoteza statystyczna może orzekać o parametrach populacji i takie hipotezy nazywamy hipotezami parametrycznymi. Pozostałe hipotezy statystyczne (te, które nie dotyczą parametrów), nazywamy hipotezami nieparametrycznymi. Autor: Janusz Górczyński

Hipotezy parametryczne Przykład 1. Interesuje nas wydajność pracy pracowników pewnego zakładu produkcyjnego. Zakładamy, że modelem tej cechy może być zmienna losowa normalna o nieznanych parametrach m i . Przypuszczamy, że średnia wydajność (w populacji) jest równa znanej wartości m0. Tym samym sformułowaliśmy hipotezę statystyczną dotyczącą parametru m: Autor: Janusz Górczyński

Hipotezy nieparametryczne Przykład 2. W poprzednim przykładzie założyliśmy, że interesująca nas cecha (wydajność pracy pracowników) może być modelowana zmienną losową normalną. Możemy więc sformułować hipotezę dotyczącą rozkładu tej cechy: Autor: Janusz Górczyński

Autor: Janusz Górczyński Weryfikacja hipotezy Hipoteza statystyczna musi być na podstawie wyników próby zweryfikowana. Testem statystycznym nazywamy regułę postępowania, która każdej możliwej próbie przyporządkowuje decyzję odrzucenia hipotezy lub nie daje podstaw do podjęcia takiej decyzji. Proces weryfikacji hipotezy statystycznej obejmuje z jednej strony jej sformułowanie (jako tzw. hipotezy zerowej), z drugiej strony musimy sformułować hipotezę alternatywną oznaczaną z reguły symbolem H1. Autor: Janusz Górczyński

Weryfikacja hipotez statystycznych Rozpatrzmy hipotezę parametryczną z przykładu 1, gdzie wypowiadaliśmy się o możliwej wartości średniej generalnej. Odpowiednią hipotezę zerową i alternatywną możemy zapisać jako: Na podstawie wyników próby losowej chcemy teraz skonstruować taki test statystyczny, który da możliwość podjęcia decyzji co do prawdziwości hipotezy zerowej. Autor: Janusz Górczyński

Weryfikacja hipotez statystycznych (c.d.) Przy konstrukcji testu skorzystamy z faktu, że statystyka: ma, przy prawdziwości H0:m=m0, rozkład t-Studenta z liczbą stopni swobody v = n - 1. Załóżmy, że H0:m=m0 jest prawdziwa. Jeżeli tak, to m  m0 = 0 oraz (ponieważ ). Tym samym wartość statystyki t powinna niewiele odbiegać od zera (jeżeli H0 jest prawdziwa). Autor: Janusz Górczyński

Weryfikacja hipotez statystycznych (c.d.) W sytuacji, gdy wartości statystyki t będą odbiegać od zera dość znacznie, to powinniśmy zacząć wątpić w prawdziwość naszego założenia (o tym, że ). Pozostaje do rozstrzygnięcia kwestia, kiedy można uznać, że wyniki naszej próby świadczą przeciwko prawdziwości hipo-tezy zerowej. Wykorzystamy do tego celu fakt, że dla każdego znajdziemy taką wartość , dla której spełniona jest równość Autor: Janusz Górczyński

Weryfikacja hipotez statystycznych (c.d.) Tym samym wartość wyznacza nam obszar krytyczny dla naszej hipotezy H0: Jeżeli wartość empiryczna statystyki t znajdzie się w tym obszarze, to H0 musimy odrzucić jako zbyt mało prawdopodobną. Obszar jest obszarem dopuszczalnym dla H0 , mówimy, że wyniki naszej próby nie przeczą hipotezie zerowej. Proszę zauważyć, że nie jest to równoważne zdaniu, że hipoteza zerowa jest prawdziwa! (my jej tylko nie możemy odrzucić). Autor: Janusz Górczyński

Autor: Janusz Górczyński Błędy weryfikacji Wyniki próby mogą być takie, że uznamy za fałszywą i odrzucimy hipotezę H0 , która w rzeczywistości jest prawdziwa. Jest to tzw. błąd I rodzaju, a prawdopodo-bieństwo jego popełnienia jest równe . Możliwa jest także sytuacja odwrotna: wyniki próby nie pozwoliły na odrzucenie H0 , która w rzeczywistości była fałszywa. Popełniamy wtedy tzw. błąd II rodzaju, a jego prawdopodobieństwo jest równe . Zwiększenie liczebności próby powoduje zmniejszenie prawdopodobieństwa . Autor: Janusz Górczyński

Błędy weryfikacji cd. Brak podstaw do odrzucenia H0 Odrzucenie H0 H0 prawdziwa P-stwo Błąd I rodzaju H0 fałszywa Błąd II rodzaju Moc testu Autor: Janusz Górczyński

Hipoteza o średniej generalnej m Niech zmienna losowa X ma rozkład normalny o nieznanych parametrach m i . Na podstawie n-elementowej próby losowej chcemy zweryfikować hipotezę zerową wobec alternatywy Procedura testowa: 1. Ustalamy poziom istotności  2. Obliczamy wartość empiryczną statystyki t-Studenta 3. Odczytujemy z tablic statystycznych wartość krytyczną statystyki Autor: Janusz Górczyński

Hipoteza o średniej generalnej m (c.d) Wnioskowanie: Jeżeli , to H0 odrzucamy na korzyść H1. Jeżeli , to nie mamy podstaw do odrzucenia H0. Autor: Janusz Górczyński

Hipoteza o średniej generalnej m (c.d.) Hipoteza może być także weryfikowana przy inaczej skonstruowanej hipotezie alternatywnej ( lub ). Procedura weryfikacyjna przebiega podobnie, zmienia się tylko obszar krytyczny: Hipoteza zerowa Alternatywa (jednostronna) Obszar krytyczny H0 odrzucamy, jeżeli: Autor: Janusz Górczyński

Hipoteza o równości dwóch średnich generalnych Niech oraz . Na podstawie odpowiednich prób losowych chcemy zweryfikować hipotezę: wobec Procedura testowa: 1. Ustalamy poziom istotności  2. Obliczamy wartość empiryczną statystyki t-Studenta 3. Odczytujemy z tablic statystycznych wartość krytyczną statystyki Autor: Janusz Górczyński

Hipoteza o równości dwóch średnich generalnych (c.d.) Wnioskowanie o prawdziwości wobec Jeżeli , to H0 odrzucamy jako zbyt mało prawdopodobną. Jeżeli , to nie mamy podstaw do odrzucenia H0. Autor: Janusz Górczyński

Hipoteza o różnicy średnich generalnych (c.d.) Niech oraz . Na podstawie odpowiednich prób losowych chcemy zweryfikować hipotezę: Hipoteza alternatywna może być jednostronna ( lub ) Procedura testowa przebiega podobnie jak poprzednio, zmieniają się jedynie obszary krytyczne. Hipoteza zerowa Hipotezy alternatywne Obszar krytyczny Autor: Janusz Górczyński

Inny sposób weryfikacji hipotezy o równości średnich. NIR Hipoteza przy jest odrzucana wtedy, gdy: Iloczyn nazywamy najmniejszą istotną różnicą (least significant difference) i oznaczamy skrótem NIR (LSD). Autor: Janusz Górczyński

Najmniejsza istotna różnica Hipotezę przy alternatywie będziemy odrzucać wtedy, gdy: NIR (LSD) jest taką różnicą wartości danej cechy w dwóch populacjach, którą jeszcze można uznać za losową (przypadkową). Różnice większe od NIR są już spowodowane własnościami danych populacji (nie są przypadkowe). Autor: Janusz Górczyński

Test istotności dla frakcji Niech zmienna X ma w populacji rozkład zero-jedynkowy z prawdopodobieństwem sukcesu p. Parametr ten można interpretować jako wskaźnik struktury w populacji. Interesuje nas weryfikacja hipotezy zerowej: wobec Procedura weryfikacyjna wykorzystuje rozkład N(0, 1): 1. Obliczamy gdzie 2. H0 odrzucamy, jeżeli Autor: Janusz Górczyński

Test istotności dla różnicy frakcji Rozważmy dwie zmienne zero-jedynkowe z parametrami odpowiednio p1 i p2. Interesuje nas weryfikacja przy alternatywie . Niech oraz oznaczają odpowiednio frakcje elementów wyróżnionych w obu próbach. Wiadomo, że Jeżeli jest prawdziwa, to gdzie p oznacza wspólną wartość dla obu zmiennych. Autor: Janusz Górczyński

Test istotności dla różnicy frakcji (c.d.) Jako ocenę wspólnego prawdopodobieństwa sukcesu dla obu zmiennych przyjmuje się wyrażenie: Ostatecznie statystyka ma rozkład N(0, 1). Hipotezę przy odrzucamy, jeżeli Autor: Janusz Górczyński

Test istotności dla wariancji Niech , interesuje nas weryfikacja hipotezy przy alternatywie . W praktyce nie formułuje się H1 jako dwustronnej czy lewostronnej, co wynika z faktu, że duża wariancja jest niekorzystna. Weryfikację hipotezy zerowej przeprowadzamy w oparciu o n-elementową próbę wykorzystując fakt, że statystyka ma rozkład z liczbą stopni swobody v = n – 1. Autor: Janusz Górczyński

Test istotności dla wariancji (c.d.) Jeżeli prawdziwa jest H0, to statystyka ma rozkład z liczbą stopni swobody v = n - 1. Wnioskowanie: Jeżeli , to H0 odrzucamy na korzyść H1. Jeżeli , to nie mamy podstaw do odrzucenia H0 . Autor: Janusz Górczyński

Test istotności dla dwóch wariancji Niech oraz . Na podstawie odpowiednich prób losowych chcemy zweryfikować przy alternatywie Statystyka ma rozkład Fishera-Snedecora z liczbami stopni swobody oraz . . Autor: Janusz Górczyński

Test istotności dla dwóch wariancji (c.d.) Jeżeli jest prawdziwa, to również statystyka ma rozkład Fishera-Snedecora z liczbami stopni swobody oraz . Z uwagi na konstrukcję tablic statystycznych, które zawierają wartości tylko dla prawostronnego obszaru krytycznego, wartość empiryczną statystyki F budujemy tak, aby była większa od 1 (w liczniku umieszczamy większą wariancję z próby). Autor: Janusz Górczyński

Test istotności dla dwóch wariancji (c.d.) Wnioskowanie: 1. Obliczamy wartość empiryczną statystyki 2. Dla ustalonego  odczytujemy z tablic wartość krytyczną gdzie u i v są odpowiednio liczbami stopni swobody dla średnich kwadratów w liczniku i mianowniku. 3. Jeżeli , to odrzucamy na korzyść Autor: Janusz Górczyński

Hipotezy nieparametryczne Hipotezy tego typu dotyczą z reguły zgodności rozkładu empirycznego z rozkładem określonym przez hipotezę lub zgodności rozkładów pewnej cechy w kilku populacjach bez określania, o jaki rozkład chodzi. Z tego też powodu testy służące do weryfikacji takich hipotez nazywamy testami zgodności. Do najczęściej stosowanych testów zgodności należą: 2 (chi-kwadrat) Pearsona  (lambda) Kołmogorowa-Smirnowa w Shapiro-Wilka Autor: Janusz Górczyński

Autor: Janusz Górczyński Test zgodności Niech hipotezą zerową będzie przypuszczenie, że cecha X ma w populacji rozkład określony dystrybuantą F0(x): wobec Statystyka przy prawdziwości H0 ma asymptotyczny rozkład z liczbą stopni swobody v = k -u - 1. Autor: Janusz Górczyński

Autor: Janusz Górczyński Test zgodności (c.d.) Wielkość jest teoretyczną liczebnością w j-tym przedziale, k jest liczbą przedziałów klasowych, a u liczbą parametrów szacowanych z próby. Wartość empiryczną statystyki porównujemy z wartością krytyczną wnioskując analogicznie jak w pozostałych hipotezach. Autor: Janusz Górczyński

Test zgodności Chi-kwadrat Elementem kluczowym przy wykorzystaniu statystyki Chi-kwadrat jest wielkość Która jest teoretycznym prawdopodobieństwem wystąpienia obserwacji w j-tym przedziale przy założeniu prawdziwości H0. Autor: Janusz Górczyński

Test 2 zgodności kilku rozkładów Obserwujemy tę samą cechę w kilku populacjach. Interesuje nas odpowiedź na pytanie, czy rozkłady te są takie same (co pociąga za sobą równość parametrów!). Jeżeli dystrybuantę danej cechy w i-tej populacji oznaczymy jako Fi, to hipoteza zerowa ma postać: Zastosowanie testu 2 wymaga zestawienia próby w postaci tabeli dwukierunkowej. W jednym kierunku umieszczamy poziomy danej cechy, w drugim populacje. Autor: Janusz Górczyński

Test 2 zgodności kilku rozkładów (c.d.) Klasy Numer populacji cechy X 1 2 .... k 1 n11 n21 .... nk1 2 n12 n22 .... nk2 : nij r n1r n2r .... nkr Autor: Janusz Górczyński

Test 2 zgodności kilku rozkładów (c.d.) Statystyka testowa ma postać: gdzie Przy prawdziwości H0 statystyka ta ma rozkład 2 Pearsona z liczbą stopni swobody v=(k-1)(r-1). Wnioskowanie przebiega analogicznie jak przy innych hipotezach. Autor: Janusz Górczyński

Autor: Janusz Górczyński Podejmowanie decyzji weryfikacyjnych na podstawie krytycznego poziomu istotności Dotychczas podejmowaliśmy decyzje weryfikacyjne poprzez zbadanie, czy wartość empiryczna statystyki testowej znajduje się w obszarze krytycznym danej hipotezy (przy z góry ustalonym poziomie istotności ). W pakietach statystycznych stosuje się inne podejście polegające na obliczeniu dla konkretnej statystyki z próby prawdopodobieństwa odrzucenia hipotezy zerowej. Prześledźmy to na przykładzie weryfikacji hipotezy Autor: Janusz Górczyński

Krytyczny poziom istotności (c.d.) Dla wartości empirycznej statystyki temp wyznaczonej na podstawie n-elemnetowej próby obliczane jest prawdo-podobieństwo otrzymania wartości statystyki testującej co najmniej tak dużej, jak ta uzyskana z próby, czyli Kryterium odrzucenia hipotezy zerowej jest relacja wyznaczonego prawdopodobieństwa do przyjętego poziomu istotności . Jeżeli , to H0 odrzucamy. Jeżeli , to nie mamy podstaw do odrzucenia H0. Autor: Janusz Górczyński