Opinie, przekonania, stereotypy W Warszawie życie jest droższe niż w Rzeszowie W prywatnych uczelniach więcej niż połowa wykładowców jest przyjezdnych Panie powodują mniejszą liczbę wypadków czy stłuczek niż panowie Wraz z podwyżkami czesnego, zmaleje liczba chętnych do studiowania Panowie, rzadziej niż panie, wykonują zawód nauczyciela Nieobecność na wykładach i jest ryzyko niezdanego egzaminu Wskaźnik zatrudnienia dla kobiet jest niższy niż dla mężczyzn. Do Rz. pociągi przyjeżdżają z opóźnieniem większym niż 20 minut.
Dwie grupy testów statystycznych: Podobnie jak testy w życiu codziennym, test statystyczny też ma jeden wynik: „jest OK albo nie jest OK” Wąchamy wędlinkę sprzed paru dni i kierujemy ją na stół albo pod stół ;-) Nie ma trzeciej drogi. Zwróćmy przy okazji uwagę na to, że przy testowaniu możemy popełnić dwa rodzaje błędów: możemy wyrzucić dobrą szynkę albo zjeść zepsutą Dwie grupy testów statystycznych: Parametryczne – testujemy parametr (np. średnią) Nieparametryczne – testujemy zjawisko (prawidłowość) – np. test niezależności
Stosuje się dwie grupy testów: parametryczne i nieparametryczne Parametryczne – testujemy parametr (np. średnią) testy nieparametryczne – testujemy zjawisko (prawidłowość) – np. test niezależności
Hipotezy statystyczne Hipoteza statystyczna to każde przypuszczenie weryfikowane na podstawie n-elementowej próby Hipotezą zerową, oznaczoną przez H0, jest hipoteza w wartości jednego z parametrów populacji (lub wielu) Tę hipotezę traktujemy jako prawdziwą, dopóki nie uzyskamy informacji dostatecznych do zmiany naszego stanowiska Hipotezą alternatywną, oznaczoną przez H1, jest hipoteza przypisująca parametrowi (parametrom) populacji wartość inną niż podaje to hipoteza zerowa
Hipoteza zerowa: często opisuje sytuację, która istniała do tej pory lub jest wyrazem naszego przekonania, które chcemy sprawdzić Sprawdzenia dokonuje się korzystając z informacji zawartej w próbie losowej Sprawdzianem lub statystyką testu nazywamy statystkę z próby, której wartość obliczona na podstawie wyników obserwacji jest wykorzystywana do ustalenia czy możemy hipotezę zerową odrzucić czy też nie
Test dla średniej w populacji dla dużej próby (n > 30) H0: m = m0 H1: m ≠ m0 Poziom istotności: a (zazwyczaj przyjmowany: 0,05; 0,01) Statystyka testu: Obszar krytyczny: Ra = (-; -ua/2) (ua/2; +) Reguła decyzyjna: hipotezę zerową odrzucić, jeśli statystyka u należy do Ra
Test dla średniej w populacji dla małej próby (n ≤ 30) H0: m = m0 H1: m ≠ m0 Poziom istotności: a (zazwyczaj przyjmowany: 0,05; 0,01) Statystyka testu: ma rozkład t o n-1 stopniach swobody Obszar krytyczny: Ra = (-; -ta;n-1 ) (ta;n-1; +) Reguła decyzyjna: hipotezę zerową odrzucić, jeśli statystyka t należy do Ra
Test dla porównania dwóch wartości oczekiwanych dwóch populacji przy dużych próbach (n1 > 30 i n2 > 30) H0: m1= m2 H1: m1 ≠ m2 dwie badane populacje mają rozkład normalny N(m1, s1) oraz N(m2, s2) Poziom istotności: a (zazwyczaj przyjmowany: 0,05; 0,01) Statystyka testu: Obszar krytyczny: Ra = (-; -ua/2) (ua/2; +) Reguła decyzyjna: hipotezę zerową odrzucić, jeśli statystyka u należy do Ra
Test dla porównania dwóch wartości oczekiwanych dwóch populacji przy małych próbach (n1 ≤ 30 i n2 ≤ 30) H0: m1= m2 H1: m1 ≠ m2 dwie badane populacje mają rozkład normalny N(m1, s1) oraz N(m2, s2), nieznane odchylenia Poziom istotności: a (zazwyczaj przyjmowany: 0,05; 0,01) Statystyka testu: ma rozkład t o n1 + n2 - 2 stopniach swobody Obszar krytyczny: Ra = (-; -ta) (ta; +) Reguła decyzyjna: hipotezę zerową odrzucić, jeśli statystyka t należy do Ra
Test hipotezy o wskaźniku frakcji w populacji (n > 100) H0: p= p0 H1: p ≠ p0 jeśli próba jest duża, to rozkład frakcji w próbie jest rozkładem normalnym o średniej p i odchyleniu pq/n Poziom istotności: a (zazwyczaj przyjmowany: 0,05; 0,01) Statystyka testu: Obszar krytyczny: Ra = (-; -ua/2) (ua/2; +) Reguła decyzyjna: hipotezę zerową odrzucić, jeśli statystyka u należy do Ra
Test hipotezy o wskaźnikach frakcji w dwóch populacjach (każde n > 100) H0: p1= p2 H1: p1 ≠ p2 Poziom istotności: a (zazwyczaj przyjmowany: 0,05; 0,01) Statystyka testu: gdzie: Obszar krytyczny: Ra = (-; -ua/2) (ua/2; +) Reguła decyzyjna: hipotezę zerową odrzucić, jeśli statystyka u należy do Ra
Testy jednostronne H0: μ = A H1: μ > A H1: μ < A Wybór rodzaju testu podyktowany jest potrzebą działania Jeżeli działanie (np. korygujące) będzie podjęte, gdy parametr przekroczy pewną wartość A, to stosujemy test prawostronny: H0: μ = A H1: μ > A Jeżeli działanie będzie podjęte, gdy parametr przyjmie wartość mniejszą niż A, to stosujemy test lewostronny: H1: μ < A
H0: μ = A H1: μ A H0: μ = A H1: μ > A
Przykład 1: Firma rozwożąca paczki zapewnia, że średni czas dostarczenia przesyłki od drzwi klienta do odbiorcy wynosi 28 minut. By sprawdzić to stwierdzenie pobrano próbę 100 przesyłek i obliczono średni czas dostawy 31,5 minut oraz odchylenie standardowe 5 minut.
Obszar krytyczny: Ra = (-; -1,96) (1,96; +) Obliczenia do przykładu: H0 : µ = 28 H1 : µ 28 Obszar krytyczny: Ra = (-; -1,96) (1,96; +) u
Przykład 2: Przypuszcza się, że przeciętny czas jaki potrzebuje komputer do wykonania pewnego zadania wynosi 3,24 sekundy. Grupa naukowców z Bell Laboratories testowała algorytmy, które mogłyby zmienić czas obliczeń. Przeprowadzono badania: wybrano losowo próbę 200 cykli obliczeń komputera według nowych algorytmów i otrzymano średni czas obliczeń 3,48 s przy odchyleniu 2,8 sekundy. Jaki wniosek wyciągną naukowcy przy poziomie istotności 0,05?
Obszar krytyczny: R0,05 = (-; -1,96) (1,96; +) H0 : µ = 3,24 H1 : µ 3,24 Obszar krytyczny: R0,05 = (-; -1,96) (1,96; +) Obszar krytyczny: R0,1 = (-; -1,65) (1,65; +) Otrzymana wartość u nie należy do obszaru krytycznego. Zatem nie ma podstaw do odrzucenia hipotezy zerowej. Oznacza to jedynie, że na przyjętym poziomie istotności nie mamy dostatecznych powodów do odrzucenia H0.