FORMUŁOWANIE HIPOTEZ STATYSTYCZNYCH Warszawa, 25 października 2017
HIPOTEZA Zdanie nie w pełni uzasadnione, wymagające sprawdzenia. Hipotezy naukowe powstają zwykle wtedy, gdy dla pewnych faktów nie znajduje się racji wśród uznanych twierdzeń. Celem formułowania hipotez jest odkrycie nieznanych zjawisk lub praw.
Weryfikacja hipotezy Eksperyment jest zabiegiem badawczym polegającym na celowym wywołaniu zjawiska (lub jego zmiany) w celu zweryfikowania sformułowanej uprzednio hipotezy. Hipoteza w wyniku eksperymentu może zostać potwierdzona (wzrasta jej prawdopodobieństwo) lub obalona.
Falsyfikacja procedura mająca na celu wykazanie fałszywości (błędności ) sformułowanej hipotezy i prowadząca do jej odrzucenia. Odrzucenie hipotezy na podstawie kolejnej obserwacji jest zabiegiem z logicznego punktu widzenia ostatecznym. Uprawdopodobnienie hipotezy na podstawie kolejnej obserwacji nie wyklucza, że dalsze obserwacje doprowadzą do jej odrzucenia.
Przykład Hipoteza: wszystkie kruki są czarne 1 kruk - czarny (zgadza się), 2 kruk - czarny (kolejne potwierdzenie), ... 127 kruk - czarny (już jesteśmy prawie pewni), 128 kruk - biały (i po ptakach - hipoteza zostaje odrzucona).
Formułowanie hipotezy statystycznej Hipoteza zerowa: efekt, który nas interesuje, a który, jak nam się wydaje, obserwujemy jest jedynie wynikiem przypadkowym. Weryfikacja: jeżeli możemy wykazać, że hipoteza zerowa jest bardzo mało prawdopodobna odrzucamy ją. W przeciwnym przypadku nie odrzucamy hipotezy, co oczywiście nie oznacza jej przyjęcia.
Poziom istotności Co to znaczy, że hipoteza jest mało prawdopodobna? Graniczne prawdopodobieństwo dobieramy arbitralnie. Zwykle przyjmuje się, że prawdopodobieństwo prawdziwości hipotezy zerowej p<0,05 (5%) jest wystarczająco małe żeby ją odrzucić. Graniczne prawdopodobieństwo nazywamy poziomem istotności i oznaczamy przez a.
Dobór poziomu istotności Zwykle przyjmuje się jedną z trzech wartości a: 0,05; 0,01 lub 0,001. a = 0,05 - badania na mało licznych próbkach, gdy pomyłka nie powoduje groźnych skutków, a = 0,01 - badania, w których zależy nam na uzyskaniu wiążących wyników, a = 0,001 - badania, w których pomyłka może spowodować groźne skutki (testowanie leków, uzbrojenia itp.)
Błędy wnioskowania Hipoteza zerowa: testowany efekt nie występuje Jesteśmy tak samo głupi jak przedtem Ogłaszamy nieprawdę
Błędy wnioskowania Błąd I rodzaju: niesłusznie odrzucamy hipotezę zerową, ogłaszamy istnienie efektu, którego w rzeczywistości nie ma. Błąd II rodzaju: Nie odrzucamy hipotezy zerowej, nie wykrywamy efektu, który w rzeczywistości zachodzi.
Poziom istotności a błędy wnioskowania Prawdopodobieństwo prawdziwości hipotezy zerowej to prawdopodobieństwo popełnienia błędu I rodzaju. Maksymalne, przyjęte jako dopuszczalne, prawdopodobieństwo popełnienia błędu I rodzaju to poziom istotności a. Błędu drugiego rodzaju nie da się określić w sposób ścisły.
H0: związek między dwiema zmiennymi mierzalnymi nie zachodzi Punktowy, dwuwymiarowy wykres rozrzutu Jeżeli wykażemy, że prawdopodobieństwo przypadkowego ułożenia punktów w sposób wskazujący na istnienie związku jest małe - odrzucamy H0
H0: Średnie wartości cechy w dwóch grupach nie różnią się od siebie Histogramy z zaznaczonymi wartościami odchyleń standardowych Jeżeli wykażemy, że prawdopodobieństwo przypadkowego charakteru różnicy średnich jest małe - odrzucamy H0
H0: Frakcje tych, którzy lubią szpinak są jednakowe wśród kobiet i mężczyzn Jeżeli wykażemy, że prawdopodobieństwo przypadkowego charakteru różnicy frakcji jest małe - odrzucamy H0
Algorytm postępowania 1. Sformułowanie H0, dobranie a 2. Obliczenie wskaźnika statystycznego służącego do oceny prawdopodobieństwa (P) błędu I-go rodzaju (t-Studenta, c2 itp.) 3. Jeżeli P<a odrzucamy Ho, w przeciwnym przypadku (P>=a) nie odrzucamy Ho