Wykład 8 Testy Studenta Jest kilka różnych testów Studenta. Mają one podobną strukturę ale służą do testowania różnych hipotez i różnią się nieco postacią statystyki testowej. Sześć podstawowych typów testów Studenta to: Test dla jednej próby, dla dwóch niezależnych prób i dla dwóch prób zależnych. Każdy z powyższych testów może być kierunkowy (alternatywa jednostronna) lub nie (alternatywa dwustronna).
“Test studenta dla pojedynczej proby, niekierunkowy” Przykład 1: Studenci statystyki pomierzyli prędkość aut prowadzonych przez 32 studentów na ulicy Wyspiańskiego.Średnia i odchylenie z próby są podane poniżej. Pomiary policyjne wskazują, że na ulicy Wyspiańskiego kierowcy (ogół populacji) prowadzą auta ze średnią 55 km/h. Czy nasze badanie sugeruje, że średnia prędkość aut prowadzonych przez studentów jest inna niż średnia w całej populacji kierowców ?
Prędkość aut w km/h N mean S 32 66 5.5
“Kierunkowy test Studenta dla jednej próby”: Tym razem zadajemy pytanie: Czy średnia prędkość aut prowadzonych przez studentów przekracza 55 km/h?
Uwaga: Decyzja o typie hipotezy alternatywnej (kierunkowa lub nie) powinna być podjęta zanim spojrzymy na dane.
Jaki będzie wynik jeżeli zadamy pytanie: Czy średnia prędkość aut prowadzonych przez studentów na ulicy Wyspiańskiego jest mniejsza niż 55 km/h?
“Test Studenta dla dwóch niezależnych prób, niekierunkowy”: Badacze chcą stwierdzić czy obecność pewnego enzymu (G6PD) jest związana z rozwojem artretyzmu (RA). Aby to zbadać wybrano losowo 14 pacjentów chorych na artretyzm i utworzono grupę kontrolną z 17 zdrowych dorosłych. U każdej z badanych osób zmierzono poziom (G6PD) we krwi. Wyniki podano w jednostkach/g Hgb (Hgb=hemoglobina).
RA Grupa kontrolna średnia 17.8 12.3 SD 3.2 2.84 Zakładając, że poziom G6PD w badanych populacjach ma w przybliżeniu rozkład normalny porównaj średnie poziomy G6PD u osób chorych na artretyzm i u osób zdrowych używając odpowiedniego testu statystycznego. Użyj liczby stopni swobody df = n1 + n2 – 2. Rozwiązanie Czy średni poziom enzymu G6PD u osób chorych na artretyzm jest taki sam jak u zdrowych osób? 1 – średni poziom G6PD u osób chorych na artretyzm 2 – średni poziom G6PD u zdrowych osób
„Kierunkowy test Studenta dla dwóch niezależnych prób": Lekarstwo uśmierzające ból zostało przetestowane na grupie 50 kobiet cierpiących na bóle poporodowe. 25 losowo wybranych kobiet dostało lekarstwo a pozostałych 25 placebo. Dla każdej kobiety wyliczono wskaźnik uśmierzenia bólu w oparciu o wynik cogodzinnego wywiadu. Zakres zmienności tego wskaźnika był pomiędzy 0 (ból bez zmian) do 56 (całkowite uśmierzenie bólu na 8 godzin). Wyniki badań zawarte są w poniższej tabeli. Zakładając, że wskaźnik uśmierzenia bólu ma w obu populacjach rozkład normalny zweryfikuj hipotezę o przydatności badanego lekarstwa.
Czy lekarstwo redukuje ból bardziej efektywnie niż placebo ? Wskaźnik uśmierzenia bólu N Srednia SD Placebo 25 25.32 12.05 lekarstwo 31.96 13.78 Pytanie Czy lekarstwo redukuje ból bardziej efektywnie niż placebo ?
P-wartość Przed przystąpieniem do testowania należy wybrać poziom istotności . Odrzucamy H0 gdy statystyka testowa jest istotna, tzn. znajdzie się w obszarze odrzuceń. Obszar odrzuceń to zbiór wartości w ``ogonie’’ rozkładu Studenta taki, że całka z gęstości rozkładu Studenta po tym zbiorze wynosi . Jak porównać wynik testowania z kimś kto użył innej wartości ? Może się zdarzyć, że hipoteza odrzucona na poziomie istotności =0.05 nie będzie odrzucona jeżeli użyjemy = 0.01.
Przykład: Stosujemy dwustronny test Studenta z 18 df na poziomie istotności = 0.05. Wartość krytyczna = 2.101. Statystyka testowa wyliczona w oparciu o dane wynosi ts = 2.3, więc Moja koleżanka Ala chce użyć = 0.01. Jej krytyczna wartość = 2.878. Ala użyła tych samych danych, więc ts = i Czego potrzeba aby podjąć decyzję ? Tablicy rozkładu Studenta aby ustalić wartość krytyczną. Wartości statystyki testowej ts.
Czy Ala może uniknąć wyszukiwania nowej wartości krytycznej ? Tak. Możemy podać Ali P-wartość dla naszej statystyki. Znajomość P-wartości umożliwia podjęcie decyzji dla każdego poziomu istotności bez konieczności wyszukiwania wartości krytycznych. P-wartość to p-stwo, że przy prawdziwości hipotezy zerowej wartość statystyki przyjmie wartość bardziej ekstremalną, niż zaobserwowana w badanej próbie. Dla dwustronnego testu Studenta P-wartość to całka z gęstości rozkładu Studentana prawo od +| ts| i na lewo od -| ts|. Dla testów jednostronnych P-wartość to całka po jednej stronie zaobserwowanej statystyki w kierunku wyspecyfikowanym przez alternatywę. Przy HA : 1 > 2, P-wartość to całka na prawo od ts. Przy HA : 1 < 2, P-wartość to całka na lewo od ts .
Kontynuacja przykładu Przy 18 df i ts = 2.3, P-wartość dla testu dwustronnego wynosi 0.034. Jest to całka z gęstości rozkładu Studenta na prawo od +2.3 i na lewo od -2.3. Jak używamy P-watości? Porównujemy je bezpośrednio z . Gdy P-wartość < , . Gdy P-wartość > , .
Tak więc mówimy Ali, że P-wartość wynosi 0 Tak więc mówimy Ali, że P-wartość wynosi 0.034 i ona wie od razu, że na poziomie istotności = 0.01 . I my wiemy, że na poziomie istotności α = 0.05 Jeżeli znamy P-wartość warto ją podać razem z wynikiem testu. Na przykład ``To badanie na poziomie istotności 0.05 potwierdza (P-wartość=0.034), że
Szacowanie P-wartości P-wartość można obliczyć przy pomocy komputera, korzystając z dystrybuanty rozkładu Studenta. P-wartość można także zgrubnie oszacować korzystając z tablic rozkładu Studenta. W tym wypadku należy wyszukać wartości krytyczne najbliżej ograniczające zaobserwowaną wartość statystyki. Szukana P-wartość dla testu jednostronnego leży wewnątrz odcinka wyznaczonego przez poziomy istotności odpowiadające wyszukanym wartościom krytycznym. P-wartość dla testu dwustronnego leży pomiędzy podwojonymi wartościami poziomów istotności odpowiadających ``ograniczającym’’ wartościom krytycznym.
Kontynuacja przykładu Oszacuj p-wartość dla dwustronnego testu Studenta, jeżeli wartość statystyki testowej wynosi 2.3 a liczba stopni swobody df=18.
Hipotezy alternatywne Testy Studenta Hipotezy zerowe Hipotezy alternatywne df ts (1-) PU dwustronne jednostronne H0 HA Obszar Kryt. Obsz. Jedna Próba = 0 0 ts <- t/2 ts > t/2 < 0 ts <- t n-1 dla : y t/2SEy > 0 ts > t Dwie Niezależne Próby 1 = 2 1 2 1 < 2 ts < -t n1+n2-2 albo podany wzór dla 1-2: y1 –y2 t/2SEy1-y2 1 > 2 Zależne Proby ts < –t/2 ts <-t nd – 1 y1 –y2 t/2SEd