Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

Podobnie jak testy w ż yciu codziennym, test statystyczny te ż ma jeden wynik:jest OK albo nie jest OK W ą chamy w ę dlink ę sprzed paru dni i kierujemy.

Podobne prezentacje


Prezentacja na temat: "Podobnie jak testy w ż yciu codziennym, test statystyczny te ż ma jeden wynik:jest OK albo nie jest OK W ą chamy w ę dlink ę sprzed paru dni i kierujemy."— Zapis prezentacji:

1 Podobnie jak testy w ż yciu codziennym, test statystyczny te ż ma jeden wynik:jest OK albo nie jest OK W ą chamy w ę dlink ę sprzed paru dni i kierujemy j ą na stół albo pod stół ;-) Nie ma trzeciej drogi, chyba ż e mamy psa, który nam si ę opatrzył ;-) 1 Zwróćmy przy okazji uwagę na to, że przy testowaniu możemy popełnić dwa rodzaje błędów: możemy wyrzucić dobrą szynkę albo zjeść zepsutą

2 Opinie, przekonania, stereotypy W Warszawie życie jest droższe niż w Rzeszowie W prywatnych uczelniach więcej niż połowa wykładowców jest przyjezdnych Panie powodują mniej wypadków czy stłuczek niż panowie Wraz z podwyżkami czesnego, zmaleje liczba chętnych do studiowania Panowie, rzadziej niż panie, wykonują zawód fryzjera Nieobecność na wykładach i można mieć kłopoty ze zdaniem egzaminu Do Rz. pociągi przyjeżdżają z opóźnieniem > 20 minut 2

3 3 czy warto ść okre ś lonej statystyki (np. ś redniej) uzyskana z próbki losowej (szczególnie je ś li próbka ma mał ą liczno ść ), pozwala s ą dzi ć, ż e odpowiada ona warto ś ci wymaganej (spodziewanej) lub te ż, czy uzyskana w wyniku działa ń doskonal ą cych poprawa jest tylko pozorna – wynika z małej liczby pomiarów sprawdzaj ą cych – czy rzeczywista Odpowiedzi na tak i podobnie postawione pytanie uzyskuje si ę w tzw. testach statystycznych Przykładowo:

4 Hipotezy statystyczne 4 Hipoteza statystyczna to ka ż de przypuszczenie weryfikowane na podstawie n-elementowej próby Hipotez ą zerow ą, oznaczon ą przez H 0, jest hipoteza w warto ś ci jednego z parametrów populacji (lub wielu) –Tę hipotezę traktujemy jako prawdziwą, dopóki nie uzyskamy informacji dostatecznych do zmiany naszego stanowiska Hipotez ą alternatywn ą, oznaczon ą przez H 1, jest hipoteza przypisuj ą ca parametrowi (parametrom) populacji warto ść inn ą ni ż podaje to hipoteza zerowa

5 5 Hipoteza zerowa: cz ę sto opisuje sytuacj ę, która istniała do tej pory lub jest wyrazem naszego przekonania, które chcemy sprawdzi ć Sprawdzenia dokonuje się korzystając z informacji zawartej w próbie losowej Sprawdzianem lub statystyką testu nazywamy statystk ę z próby, której warto ść obliczona na podstawie wyników obserwacji jest wykorzystywana do ustalenia czy mo ż emy hipotez ę zerow ą odrzuci ć czy jej odrzuci ć nie mo ż emy

6 Stosuje się dwie grupy testów: 6 parametryczne i nieparametryczne testy parametryczne – testujemy parametr (np. ś redni ą ) testy nieparametryczne – testujemy zjawisko (prawidłowo ść ) – np. test niezale ż no ś ci

7 Grupa 1: Testy parametryczne 7

8 Test dla średniej w populacji dla dużej próby (n > 30) 8 H 0 : = 0 H 1 : 0 Poziom istotności: (zazwyczaj przyjmowany: 0,05; 0,01) Statystyka testu: Obszar krytyczny: R = (- ; -u /2 ) (u /2 ; + ) Reguła decyzyjna: hipotezę zerową odrzucić, jeśli statystyka u należy do R

9 Test dla średniej w populacji dla małej próby (n 30) 9 H 0 : = 0 H 1 : 0 Poziom istotności: (zazwyczaj przyjmowany: 0,05; 0,01) Statystyka testu: Obszar krytyczny: R = (- ; -t n-1 ) (t n-1 ; + ) Reguła decyzyjna: hipotezę zerową odrzucić, jeśli statystyka t należy do R ma rozkład t o n-1 stopniach swobody

10 Próby niezależne i zależne 10 Próby niezale ż ne – dwie ró ż ne grupy, jedno badanie Mierzymy ci ś nienie grupie osób (m ęż czy ź ni i kobiety; pracuj ą cy i bezrobotni; bezdzietni i maj ą cy potomstwo) Próby zale ż ne – jedna grupa, dwa badania Mierzymy t ę tno grupie osób PRZED i PO wykonaniu serii podskoków

11 Test dla porównania dwóch wartości oczekiwanych dwóch populacji przy dużych próbach (n 1 > 30 i n 2 > 30); próby niezależne 11 H 0 : = H 1 : Poziom istotności: (zazwyczaj przyjmowany: 0,05; 0,01) Statystyka testu: Obszar krytyczny: R = (- ; -u /2 ) (u /2 ; + ) Reguła decyzyjna: hipotezę zerową odrzucić, jeśli statystyka u należy do R

12 Test dla porównania dwóch wartości oczekiwanych dwóch populacji przy małych próbach (n 1 30 i n 2 30); próby niezależne 12 H 0 : = H 1 : Poziom istotności: (zazwyczaj przyjmowany: 0,05; 0,01) Statystyka testu: Obszar krytyczny: R = (- ; -t ) (t ; + ) Reguła decyzyjna: hipotezę zerową odrzucić, jeśli statystyka t należy do R ma rozkład t o n 1 + n stopniach swobody

13 Test dla porównania dwóch wartości oczekiwanych dwóch populacji; próby niezależne 13 H 0 : = H 1 : Poziom istotności: (zazwyczaj przyjmowany: 0,05; 0,01) Statystyka testu: Obszar krytyczny: R = (- ; -t ) (t ; + ) Reguła decyzyjna: hipotezę zerową odrzucić, jeśli statystyka t należy do R ma rozkład t o n 1 + n stopniach swobody

14 Test hipotezy o wskaźniku frakcji w populacji (n > 100) 14 H 0 : p= p 0 H 1 : p p 0 jeśli próba jest duża, to rozkład frakcji w próbie jest rozkładem normalnym o średniej p i odchyleniu pq/n Poziom istotności: (zazwyczaj przyjmowany: 0,05; 0,01) Statystyka testu: Obszar krytyczny: R = (- ; -u /2 ) (u /2 ; + ) Reguła decyzyjna: hipotezę zerową odrzucić, jeśli statystyka u należy do R

15 Test hipotezy o wskaźnikach frakcji w dwóch populacjach (każde n > 100) 15 H 0 : p 1 = p 2 H 1 : p 1 p 2 Poziom istotności: (zazwyczaj przyjmowany: 0,05; 0,01) Statystyka testu: Obszar krytyczny: R = (- ; -u /2 ) (u /2 ; + ) Reguła decyzyjna: hipotezę zerową odrzucić, jeśli statystyka u należy do R gdzie:

16 Test hipotezy o istotności współczynnika korelacji 16 H 0 : r pop = 0 H 1 : r pop 0 Poziom istotności: (zazwyczaj przyjmowany: 0,05; 0,01) Statystyka testu: Reguła decyzyjna: hipotezę zerową odrzucić, jeśli statystyka u należy do R Obszar krytyczny: R = (- ; -t ) (t ; + )

17 Testy jednostronne 17 Wybór rodzaju testu podyktowany jest potrzeb ą działania Je ż eli działanie (np. koryguj ą ce) b ę dzie podj ę te, gdy parametr przekroczy pewn ą warto ść A, to stosujemy test prawostronny: H 0 : μ = A H 1 : μ > A Je ż eli działanie b ę dzie podj ę te, gdy parametr przyjmie warto ść mniejsz ą ni ż A, to stosujemy test lewostronny: H 0 : μ = A H 1 : μ < A

18 18 H 0 : μ = A H 1 : μ > A H 0 : μ = A H 1 : μ A

19 Przykład 1: 19 Firma rozwo żą ca paczki zapewnia, ż e ś redni czas dostarczenia przesyłki od drzwi klienta do odbiorcy wynosi 28 minut. By sprawdzi ć to stwierdzenie pobrano prób ę 100 przesyłek i obliczono ś redni czas dostawy 31,5 minut oraz odchylenie standardowe 5 minut.

20 20 u H 0 : µ = 28 H 1 : µ 28 Obszar krytyczny: R = (- ; -1,96) (1,96; + ) Obliczenia do przykładu:

21 Przykład 2: 21 Przypuszcza si ę, ż e przeci ę tny czas jaki potrzebuje komputer do wykonania pewnego zadania wynosi 3,24 sekundy. Grupa naukowców z Bell Laboratories testowała algorytmy, które mogłyby zmieni ć czas oblicze ń. Przeprowadzono badania: wybrano losowo prób ę 200 cykli oblicze ń komputera według nowych algorytmów i otrzymano ś redni czas oblicze ń 3,48 s przy odchyleniu 2,8 sekundy. Jaki wniosek wyci ą gn ą naukowcy przy poziomie istotno ś ci 0,05?

22 22 H 0 : µ = 3,24 H 1 : µ 3,24 Obszar krytyczny: R = (- ; -1,96) (1,96; + ) Obszar krytyczny: R = (- ; -1,65) (1,65; + ) Otrzymana wartość u nie należy do obszaru krytycznego. Zatem nie ma podstaw do odrzucenia hipotezy zerowej. Oznacza to jedynie, że na przyjętym poziomie istotności nie mamy dostatecznych powodów do odrzucenia H 0.

23 Grupa 2: Testy nieparametryczne 23

24 Najczęściej stosowanym narzędziem jest test chi-kwadrat. Został on opracowany przez Karla Pearsona w 1900 roku i jest metodą, dzięki której można się upewnić, czy dane zawarte w tabeli wielodzielczej dostarczają wystarczającego dowodu na związek tych dwóch zmiennych. Test chi-kwadrat polega na porównaniu liczebności zaobserwowanych z oczekiwanymi przy założeniu hipotezy o braku związku między tymi dwiema zmiennymi. Liczebności (częstości) oczekiwane obliczamy, wykorzystując liczebności brzegowe(z tablicy wielodzielczej) według następującego wzoru: Wówczas hipotezę o tym, że cechy X i Y są niezależne, możemy zweryfikować testem według następującego schematu: 24

25 Weryfikacja hipotezy zerowej: H0: cechy X i Y są niezależne Wobec hipotezy alternatywnej: H1: cechy X i Y są zależne Do weryfikacji hipotezy stosujemy statystykę: Otrzymaną wartość należy porównać z wartością krytyczną chi-kwadrat o (k - 1)·(p - 1) stopniach swobody 25

26 Na przykład: zapytano 260 osób o to, czy korzystają z bezpłatnych darmowych badań profilaktycznych dowolnego typu. Zebrane dane przedstawiono w wielodzielczej tabeli. Czy istnieje zależność między korzystaniem z takiej oferty i miejscem zamieszkania? 26 Miejsce zamieszkania Korzystanie z badań profilaktycznych Razem częstorzadkonigdy Wieś Miasto Razem

27 Wyliczymy liczebności oczekiwane. Wyniki obliczeń pozostałych liczebności oczekiwanych przedstawiono w tabeli w nawiasach obok wartości obserwowanych. 27 Miejsce zamieszkania Korzystanie z badań profilaktycznych Razem częstorzadkonigdy Wieś29,5447,7550,71128 Miasto30,4649,2552,29132 Razem A jak się to liczy? Mnożymy sumę z wiersza i sumę z kolumny (patrzymy po brzegach), następnie dzielimy przez liczbę wszystkich elementów (tu 260).

28 28 Miejsce zamieszkania Korzystanie z badań profilaktycznych Razem częstorzadkonigdy Wieś 60* * * Miasto 60* * * Razem Miejsce zamieszkania Korzystanie z badań profilaktycznych Razem częstorzadkonigdy Wieś29,5447,7550,71128 Miasto30,4649,2552,29132 Razem I stąd jest

29 Następny krok to porównanie liczebności empirycznych i teoretycznych, a końcowym efektem jest obliczona wartość statystyki chi-kwadrat. 29 A jak się to liczy? We wnętrzu tabeli: liczebność empiryczna minus teoretyczna, podnosimy do kwadratu, dzielimy przez teoretyczną. Miejsce zamieszkania Korzystanie z badań profilaktycznych Razem częstorzadkonigdy Wieś3,080,162,986,22 Miasto2,990,152,896,03 Razem6,070,315,8712,25 Miejsce zamieszkania Korzystanie z badań profilaktycznych Razem częstorzadkonigdy Wieś (20-29,54) 2 29,54 (45-47,75) 2 47,75 (63-50,71) 2 50,71 6,22 Miasto (40-30,36) 2 30,46 (52-49,25) 2 49,25 (40-52,29) 2 52,29 6,03 Razem6,070,315,8712,25

30 Tak więc wartość obliczona chi-kwadrat = 12,25 Wartość odczytana wynosi (dla poziomu istotności 0,05 i (3–1)*(2–1)) stopni swobody = 5, A teraz szukamy największych rozbieżności między liczebnościami empirycznymi i teoretycznymi, np.: Wartość obliczona > wartość krytyczna (odczytana) 12,25 > 5,991 W takiej sytuacji formułujemy wniosek końcowy: Istnieje zależność między miejscem zamieszkania a częstotliwością korzystania z badań profilaktycznych. Miejsce zamieszkania Korzystanie z badań profilaktycznych częstorzadkonigdy Wieś 20-29, , ,71 Miasto 40-30, , ,29

31 31 Zauważmy, że bardzo duże wartości chi-kwadrat obliczonego oznaczają dużą różnicę pomiędzy częstościami obserwowanymi a oczekiwanymi, i jest to dowód istnienia zależności. Przeciwnie mała wartość (zwłaszcza bliska 0) nie daje dowodu na istnienie korelacji. Miejsce zamieszkania Korzystanie z badań profilaktycznych częstorzadkonigdy Wieś 20-29, , ,71 Miasto 40-30, , ,29 Zauważmy, że mieszkańcy wsi częściej przyznawali, ze nigdy nie korzystali z badań profilaktycznych (63 wobec 50,71). Mieszkańcy miast w większym stopniu niż można się było spodziewać przyznawali, że często korzystają z badań profilaktycznych (40 wobec 30,36).

32 Tymczasem w SPSS… 32

33 33

34 Sposoby podejmowania decyzji: 34 porównujemy obliczoną wartość statystyki testu z wartością krytyczną otrzymaną istotność z zakładanym poziomem istotności Typowy sposób przy liczeniu na piechotę Typowy sposób przy liczeniu z użyciem programów komputerowych Jeśli otrzymana istotność zakładany poziom istotności, odrzucamy H 0 Jeśli otrzymana istotność > zakładany poziom istotności, nie odrzucamy H 0


Pobierz ppt "Podobnie jak testy w ż yciu codziennym, test statystyczny te ż ma jeden wynik:jest OK albo nie jest OK W ą chamy w ę dlink ę sprzed paru dni i kierujemy."

Podobne prezentacje


Reklamy Google