Hipotezy statystyczne Testy zgodności Autor: Janusz Górczyński
Hipotezy nieparametryczne Hipotezy tego typu dotyczą z reguły zgodności rozkładu empirycznego z rozkładem określonym przez hipotezę lub zgodności rozkładów pewnej cechy w kilku populacjach bez określania, o jaki rozkład chodzi. Z tego też powodu testy służące do weryfikacji takich hipotez nazywamy testami zgodności. Do najczęściej stosowanych testów zgodności należą: 2 (chi-kwadrat) Pearsona (lambda) Kołmogorowa-Smirnowa w Shapiro-Wilka
Test zgodności Niech hipotezą zerową będzie przypuszczenie, że cecha X ma w populacji rozkład określony dystrybuantą F0(x): wobec Statystyka przy prawdziwości H0 ma asymptotyczny rozkład z liczbą stopni swobody v = k -u - 1.
Test zgodności Wielkość jest teoretyczną liczebnością w j-tym przedziale, k jest liczbą przedziałów klasowych, a u liczbą parametrów szacowanych z próby. Wartość empiryczną statystyki porównujemy z wartością krytyczną wnioskując analogicznie jak w pozostałych hipotezach.
Test zgodności Chi-kwadrat Elementem kluczowym przy wykorzystaniu statystyki Chi-kwadrat jest wielkość która jest teoretycznym prawdopodobieństwem wystąpienia obserwacji w j-tym przedziale przy założeniu prawdziwości H0.
Przykład weryfikacji hipotezy Czy można przyjąć, że średnia ocen studentów z okresu studiów może być modelowana zmienna losową normalną, jeżeli w badaniu statystycznym uzyskano pokazane obok wyniki (zestawione w szereg rozdzielczy).
Przygotowania do standaryzacji Dla wyznaczenia teoretycznego prawdopodobieństwa wystąpienia elementów w danym przedziale szeregu rozdzielczego musimy standaryzować krańce zgodnie ze wzorem: niestety, nie znamy parametru m ani sigma, musimy te dwa parametry oszacować z próby. Otrzymamy następujące oceny:
Standaryzacja krańców przedziałów
Obliczenia wartości testu Chi-kwadrat
Wnioskowanie
Test 2 zgodności kilku rozkładów Obserwujemy tę samą cechę w kilku populacjach. Interesuje nas odpowiedź na pytanie, czy rozkłady te są takie same (co pociąga za sobą równość parametrów!). Jeżeli dystrybuantę danej cechy w i-tej populacji oznaczymy jako Fi, to hipoteza zerowa ma postać: Zastosowanie testu 2 wymaga zestawienia próby w postaci tabeli dwukierunkowej. W jednym kierunku umieszczamy poziomy danej cechy, w drugim populacje.
Test 2 zgodności kilku rozkładów Klasy Numer populacji cechy X 1 2 .... k 1 n11 n21 .... nk1 2 n12 n22 .... nk2 : nij r n1r n2r .... nkr
Test 2 zgodności kilku rozkładów Statystyka testowa ma postać: gdzie Przy prawdziwości H0 statystyka ta ma rozkład 2 Pearsona z liczbą stopni swobody v=(k-1)(r-1). Wnioskowanie przebiega analogicznie jak przy innych hipotezach.
Weryfikacja na podstawie krytycznego poziomu istotności Dotychczas podejmowaliśmy decyzje weryfikacyjne poprzez zbadanie, czy wartość empiryczna statystyki testowej znajduje się w obszarze krytycznym danej hipotezy (przy z góry ustalonym poziomie istotności ). W pakietach statystycznych stosuje się inne podejście polegające na obliczeniu dla konkretnej statystyki z próby prawdopodobieństwa odrzucenia hipotezy zerowej. Prześledźmy to na przykładzie weryfikacji hipotezy
Krytyczny poziom istotności Dla wartości empirycznej statystyki temp wyznaczonej na podstawie n-elemenetowej próby obliczane jest prawdo-podobieństwo otrzymania wartości statystyki testującej co najmniej tak dużej, jak ta uzyskana z próby, czyli Kryterium odrzucenia hipotezy zerowej jest relacja wyznaczonego prawdopodobieństwa do przyjętego poziomu istotności . Jeżeli , to H0 odrzucamy. Jeżeli , to nie mamy podstaw do odrzucenia H0.
Weryfikacja hipotez w StatystykaJG W skoroszycie StatystykaJG znajdziemy wiele procedur odpowiedzialnych za weryfikację podstawowych hipotez statystycznych. Poniżej widok zakładki Dodatki z poleceniami udostępnionymi przez ten skoroszyt.
Hipotezy parametryczne w StatystykaJG Widok możliwych hipotez parametrycznych
Przykład weryfikacji hipotezy o średniej, wskazanie obszaru danych i innych parametrów
i rezultat weryfikacji hipotezy o średniej
Przykład weryfikacji hipotezy o równości średnich, wskazanie obszarów danych i innych parametrów
i rezultat weryfikacji hipotezy o równości dwóch średnich