Hipotezy statystyczne

Hipotezy statystyczne
dr hab. Dariusz Piwczyński

Po co hipotezy? do... badania założeń dotyczących średniego poziomu cechy w populacji generalnej: wydajność mleka dla określonej rasy bydła wynosi 6700 kg oceny różnicy między dwiema grupami: czy istnieje różnica między dwiema grupami zwierząt żywionych paszami o różnym składzie pod względem przyrostów dobowych? badania zależności między cechami: czy istnieje zależność pomiędzy ilością wypalanych papierosów a zachorowalnością na nowotwór płuc? porównania rozkładów zmiennych: badamy czy zmienna przyrosty dobowe posiada rozkład zgodny z normalnym.

Weryfikacja hipotez statystycznych
polega na doborze określonego schematu postępowania zwanego testem statystycznym, który rozstrzyga, przy jakich wynikach z próby sprawdzoną hipotezę należy odrzucić, a przy jakich nie ma podstaw do jej odrzucenia.

Hipotezy możemy podzielić na:
parametryczne, tj. takie, które dotyczą wartości parametrów statystycznych populacji, np. średniej arytmetycznej czy odchylenia standardowego nieparametryczne – dotyczą postaci rozkładu zmiennej lub losowości próby.

Rodzaje hipotez Hipoteza, która podlega sprawdzeniu zwana jest hipotezą zerową (H0) Konkurencyjną dla niej hipotezą jest hipoteza alternatywna (H1).

Hipotezy jednostronne i dwustronne
Na podstawie pewnych przesłanek zakładamy, że masa ciała samic gatunku kret wynosi 92 g. H0: µ = 92 g Alternatywna hipoteza: H1: µ < 92 g (hipoteza jednostronna) H1: µ > 92 g (hipoteza jednostronna) H1: µ ≠ 92 g (hipoteza dwustronna)

Hipoteza zerowa Hipotezę zerową, dotyczącą wartości oczekiwanych można zapisać następująco: H0: μ1 = μ2 np. zakładamy, że średnia masa ciała samic i samców gatunku kret (w populacji generalnej) jest taka sama. H0: E(X1) = E(X2) ~ H0: μ1 = μ2

Założenie! Przystępując do weryfikacji hipotezy zerowej, zakładamy iż jest ona prawdziwa.

Błąd pierwszego rodzaju (α)
Polega na odrzuceniu hipotezy zerowej, mimo że jest ona prawdziwa. Błąd ten zwany jest poziomem istotności. Najczęściej przyjmuje wartości 0,05; 0,01 czy 0,001. Poziom istotności wskazuje, na jak mały błąd „zgadzamy się” przy weryfikacji hipotezy zerowej. Poziom istotności określa dopuszczalną częstość wystąpienia wyników niezgodnych z przyjętymi założeniami na skutek losowego charakteru próby.

Błąd drugiego rodzaju (β)
Polega na przyjęciu hipotezy zerowej, gdy jest ona w rzeczywistości fałszywa.

Błędy towarzyszące testowaniu hipotez
Hipoteza zerowa Decyzja Przyjąć H0 Odrzucić H0 prawdziwa decyzja prawidłowa błąd I rodzaju fałszywa błąd II rodzaju

Moc testu 1- , jest to prawdopodobieństwo odrzucenia hipotezy zerowej, gdy jest ona fałszywa, a hipoteza alternatywna jest prawdziwa. Testem najmocniejszym jest ten, którego, przy ustalonym poziome istotności α, wartość  jest najmniejsza.

Moc testu – test t-Studenta

Moc testu – analiza wariancji
Title 'Ustalenie mocy testu - analiza nwariancji'; proc glmpower data = moc.kret; class plec poraRoku siedlisko; model masa = plec poraRoku plec*poraRoku siedlisko; power stddev = ntotal = 111 power = .; run;

Formułowanie i weryfikowanie hipotez statystycznych:
Sformułowanie hipotezy zerowej i alternatywnej. Wybór testu lub testów określających reguły postępowania przy weryfikacji hipotezy zerowej. Określenie poziomu istotności, a tym samym wyznaczenie obszaru krytycznego hipotezy. Formułowanie – na podstawie wyników z próby, testu i przyjętych założeń - wniosku końcowego.

Obszar krytyczny Zbiór wszystkich wartości danej statystyki, dla których hipoteza zerowa jest odrzucana.

Pojedyncza próba, rozkład normalny, znane σ
Obliczone u porównujemy z wartością tablicową uα. Jeżeli |u| ≥ uα to mamy podstawę do odrzucenia hipotezy zerowej.

Pojedyncza próba, rozkład normalny lub inny, nieznane σ, duża próba n > 30
Obliczone u porównujemy z wartością tablicową uα. Jeżeli |u| ≥ uα to mamy podstawę do odrzucenia hipotezy zerowej.

Pojedyncza próba, rozkład normalny, nie jest znane σ, próba jest mała
– średni błąd średniej arytmetycznej

Czy mamy podstawę do odrzucenia H0 = 92 g?

H1: µ ≠ 92 g H1: µ < 92 g

Wartości krytyczne Wartości krytyczne rozkładu t-Studenta można otrzymać w wyniku zastosowania funkcji: =rozkład.t.odwr.ds(α; ν)

Wartości krytyczne, P(|t|  t,) = 

Podjęcie decyzji Ponieważ obliczona wartość statystyki t jest większa niż wartość krytyczna, odrzucamy hipotezę H0. Nie mamy podstaw do stwierdzenia, że przeciętna masa samic w populacji generalnej to 92 g.

Enterprise guide

EG, typ test t Jednopróbkowy

EG, Wskazujemy zmienną do analizy

EG, definiujemy H0 = 92 g

Eg, wyniki „Pr” – prawdopodobieństwo (p-value) – błąd z jakim należy się liczyć odrzucając hipotezę zerową – prawdopodobieństwo otrzymania wyniku.

Porównujemy 2 grupy, Układ doświadczenia
Niezależny a wiązany!

Doświadczenie dwugrupowe
Formułujemy hipotezę zerową i alternatywną H0: µ1 = µ2 H1: µ1  µ2

Porównujemy 2 grupy – kryteria doboru testu
Rozkład normalny? TAK Czy znane wariancje (pop. generalnej? NIE Czy równe wariancje? Test t dla równych wariancji Test t dla nierównych wariancji Test U Duże próby? n1 i n2≥30 (50)? Test Z Testy nieparametryczne Porównujemy 2 grupy – kryteria doboru testu

Istota porównań – najmniejsza istotna różnica (NIR, LSD)
Jest to wartość różnicy między średnimi, która może być jeszcze uznana za wartość losową. Jeśli różnica między średnimi jest większa niż NIR to znaczy, że są efektem czynnika kontrolowanego w doświadczeniu. wks – wartość krytyczna danej statystyki, np. t-Studenta, u

SD – średni błąd różnicy średnich
1. Dwie próby, nierówne wariancje Test t dla nierównych wariancji (test Cochrana-Coxa) Statystyka testująca t SD – średni błąd różnicy średnich Rozkład statystyki testującej: t-Studenta

Ustalenie liczby stopni swobody

2. Dwie próby, równe wariancje, Test t
Statystyka testująca t Rozkład statystyki testującej: t-Studenta o  = n1 + n2 – 2

3.Rozkład normalny, znane wariancje odnoszące się do populacji generalnej (test U)
Statystyka testująca: Rozkład statystyki testującej: N(0; 1)

4. Rozkład dowolny, duże próby, nie jest znana wariancja
Statystyka testująca: Rozkład statystyki testującej: N(0; 1)

Przykład H0: µ♂ = µ♀; H1: µ♂  µ♀
Naszym zamiarem jest porównanie samic i samców gatunku kret w zakresie masy ciała. Próby są małe (n < 30), zakładamy że cecha posiada rozkład zgodny z normalnym. Nie znamy wariancji w populacji generalnej. Z kolei wariancje populacji próbnych są różne. H0: µ♂ = µ♀; H1: µ♂  µ♀

Przykład cd., Test Cochrana-Coxa
Z jakich wzorów korzystamy?

Wartości krytyczne,  = 0,05 -2,064 2,064
2.064 0,01 2.797 0,001 3.745 -2,064 2,064 Obliczona wartość statystyki t to 3,145 =ROZKŁAD.T.ODW(0.05;24)

Decyzja Ze względu na fakt, iż obliczona wartość statystyki |t| jest większa niż wartość krytyczna przy p = 0,01 odrzucamy hipotezę zerową. Stwierdzamy tym samym, że grupy różnią się między sobą wysoko istotnie.

Test dla dwóch wariancji
Zanim przystąpimy do zbadania hipotezy zerowej dotyczącej wartości przeciętnych, musimy zweryfikować hipotezę dotyczącą podobieństwa wariancji! Jednym z kryteriów uwzględnianych w trakcie doboru właściwego testu do porównania dwóch wartości oczekiwanych jest ustalenia czy wariancje odnoszące się do tychże porównywanych populacji są jednakowe.

Podobieństwo zmienności
Hipoteza zerowa o równości wariancji w porównywanych populacjach posiada następującą postać: H0: σ21 = σ 22 zaś alternatywna zakładająca różnice w zakresie zmienności:H1: σ21  σ22

Statystyka F Wykorzystywana jest do weryfikacji hipotezy o równości dwóch wariancji Jeżeli wariancje porównywanych grup nie są sobie równe, to w powyższym wzorze, w liczniku umieszczamy wariancję o wyższej wartości!!! Obliczoną wartość statystyki porównujemy z wartością tablicową ustaloną dla określonego poziomu istotności i liczby stopni swobody.

Rozkład F

Test FISHERA Mamy podstawę do odrzucenia H0 zakładającej podobieństwo wariancji w grupie samic i samców! W praktyce oznacza, że zmienność masy ciała samic i samców w populacji generalnej jest różna.

zatem test Cochrana-Coxa

Decyzja Obliczone prawdopodobieństwo jest mniejsze niż 0,01 (oczywiście mniejsze niż 0,05) zatem mamy podstawę do odrzucenia H0 i przyjęcia H1. Co to oznacza? Możemy uznać, że przeciętna masa ciała samic i samców w populacji generalnej jest różna!

Jaka różnica? Stwierdzamy, że różnica między płciami w zakresie masy ciała jest wysoko istotna.

Test t w SAS, wybór typu tesu

EG, ustalamy zmienne

Wykres

EG, wyniki 3. odczytujemy zatem wyniki dotyczące testu t dla wariancji Nierównych 1. Rozstrzygamy czy wariancje są równe? 2. Nie są!

Wykres pudełkowy

Wykres pudełkowy wartości cechy, które oddalone od krawędzi skrzynki więcej niż wynosi półtora odstępu międzykwartylowego (1,5 x IQR)

Doświadczenie wiązane, przykład
Wymiary grubości rogówki (mierzonej w jej centrum, μm) oka ludzkiego przed założeniem szkieł kontaktowych (GL0) i po 2 tygodniach od ich noszenia (GL2)

Hipotezy Hipotezę zerowa – zakładamy, że grubość rogówki oka ludzkiego przed założeniem i po dwóch tygodniach noszenia szkieł kontaktowych jest taka sama. H0: µ1 = µ2 Hipoteza alternatywna – zakładamy, że grubość rogówki oka ludzkiego przed założeniem i po dwóch tygodniach noszenia szkieł kontaktowych jest różna. H1: µ1  µ2

Doświadczenie wiązane, obliczamy wartość statystyki t
– średnia z indywidualnych różnic między wymiarami grubości rogówki w 2 terminach kontroli – błąd standardowy różnicy – wariancja zmiennej di

Doświadczenie wiązane, MS Excel
nasze dane

Tworzymy zmienną di di = GL0 – GL2

Obliczamy średnią kolumny di Obliczamy wariancję kolumny di Obliczamy błąd standardowy różnicy Obliczamy statystykę t

Decyzja Obliczona wartość statystyki t: |t| = 1,56
Wartość krytyczna t(0,05; 21) = 2,080 Nie mamy podstaw do odrzucenia hipotezy zerowej, ponieważ obliczona przez nas wartość statystyki t jest mniejsza niż wartość krytyczna odczytana przy poziomie istotności 0,05 i liczbie stopni swobody 21. Można zatem stwierdzić, że noszenie soczewek kontaktowych nie wpływa statystycznie na zmianę grubości rogówki.

Doświadczenie zależne, MS Excel
Wykorzystujemy funkcję t.test() T.TEST() T.TEST(B2:B23;C2:C23;2;1) Obliczone prawdopodobieństwo jest większe niż 0,05. Nie ma podstaw do odrzucenia H0. T.TEST Koniecznie musimy wpisać „1” w miejsce Typ – oznacza to doświadczenie wiązane

Analiza za pomocą EG Wybieramy rodzaj analizy statystycznej
Wybieramy typ testu t

Wskazujemy zmienne analizowane

Oglądamy wyniki

Testy dla wskaźników struktury

Test dla jednego wskaźnika struktury

Czy uważasz się za osobę szczęśliwą?
Czy można przyjąć, że 50% ludzi uważa się za szczęśliwych w życiu?

Rozpoczynamy eksperyment
Zadajemy pytanie, zestawiamy wyniki!!! Szczęśliwi Nieszczęśliwi 268 73

Obliczamy proporcje Szczęśliwi Nieszczęśliwi Suma końcowa m 268 73 341
Stosunek 0,786 0,214

Weryfikujemy hipotezę zerową
Hipoteza ta zakłada, że wskaźnik struktury (udział osób szczęśliwych) jest równy określonej wartości p0, tj. H0 : p = 0,5 (H1 : p ≠ 0,5) m – liczba osobników posiadających daną cechę, n – liczebność całej populacji.

Decyzja Obliczoną wartość statystyki u porównujemy z wartością krytyczną u. u0,05= 1,96 Obliczona wartość statystyki u jest większa niż wartość tablicowa, zatem odrzucamy hipotezę zerową, że 50% ludzi jest szczęśliwych.

Test dla dwóch wskaźników struktury

Czy udział szczęśliwych kobiet jest taki sam jak szczęśliwych mężczyzn?

Nasz eksperyment, cd. Uwzględniliśmy płeć badanych osób. Płeć
Szczęśliwi Nieszczęśliwi Suma końcowa Kobiety 185 55 240 Mężczyźni 83 18 101 268 73 341

Nasz eksperyment, cd. Uwzględniliśmy płeć badanych osób. Płeć
Szczęśliwi, % Kobiety (p1) 0,771 Mężczyźni (p2) 0,822

Weyfikujemy hipotezę zerową
Hipoteza zerowa zakłada, że proporcja szczęśliwych kobiet jest taka sama jak szczęśliwych mężczyzn, czyli: H0 : p1 = p2 Hipoteza alternatywna: H1 : p1 ≠ p2

Statystyka testowa u Wskaźnik struktury dla obydwu grup jednocześnie:

Obliczamy statystykę testową u
Wskaźnik struktury dla obydwu grup jednocześnie:

Decyzja Obliczoną wartość statystyki u porównujemy z wartością krytyczną u0,05. u = -1,048; u0,05 = 1,96 Obliczona wartość statystyki u jest mniejsza niż wartość krytyczna – nie mamy podstaw do odrzucenia hipotezy zerowej. Uznajemy zatem, że stopnień odczuwania jest taki sam u obojga płci.

Przedział ufności dla wskaźnika struktury, n>100

Centralne twierdzenie graniczne
Jeżeli z populacji, w której zmienna losowa posiada rozkład z wartością oczekiwaną  i wariancją 2, pobierzemy próbę odpowiednio liczną składającą się z n elementów, to średnia arytmetyczna obserwacji ma w przybliżeniu rozkład normalny z parametrami  i Wynika z tego, że zmienna losowa ma rozkład normalny standaryzowany.

Duża próba, mała próba Mała próba n < 30 Duża n  30
Dla małych prób statystyka t ma rozkład t-Studenta. W przypadku dużych prób przechodzi w rozkład normalny – zmienna u posiadać będzie rozkład normalny.

Hipoteza o zgodności rozkładu empirycznego z rozkładem teoretycznym
H0: X ~ N(, )

Hipotezy statystyczne

Podobne prezentacje

Prezentacja na temat: "Hipotezy statystyczne"— Zapis prezentacji:

Podobne prezentacje

О projekcie

Zwrotny adres

Wejść

Zaloguj się poprzez sieć społeczną:

Hipotezy statystyczne

Podobne prezentacje

Prezentacja na temat: "Hipotezy statystyczne"— Zapis prezentacji:

Podobne prezentacje

О projekcie

Zwrotny adres