Testy nieparametryczne

Slides:



Advertisements
Podobne prezentacje
Rangowy test zgodności rozkładów
Advertisements

Testy sekwencyjne Jan Acedański.
Statystyka Wojciech Jawień
Wykład 9 Analiza wariancji (ANOVA)
Wykład 7: Moc Moc testu to prawdopodobieństwo odrzucenia H0, gdy prawdziwa jest HA Moc=czułość testu Moc = 1 – Pr (nie odrzucamy H0, gdy prawdziwa jest.
Porównywanie średnich dwóch prób niezależnych o rozkładach normalnych (test t-studenta)
Analiza wariancji jednoczynnikowa
Badania marketingowe na rynkach produktów sektora wysokich technologii Wybrane metody analizy danych.
Analiza wariancji Marcin Zajenkowski. Badania eksperymentalne ANOVA najczęściej do eksperymentów Porównanie wyników z 2 grup lub więcej Zmienna niezależna.
Miary jednej cechy Miary poziomu Miary dyspersji Miary asymetrii (skośności)
Opinie, przekonania, stereotypy
Krzysztof Jurek Statystyka Spotkanie 4. Miary zmienności m ó wią na ile wyniki są rozproszone na konkretne jednostki, pokazują na ile wyniki odbiegają
Wnioskowanie statystyczne CZEŚĆ III
Statystyka w doświadczalnictwie
Wykład 8 Testy Studenta Jest kilka różnych testów Studenta. Mają one podobną strukturę ale służą do testowania różnych hipotez i różnią się nieco postacią.
Wykład 11 Analiza wariancji (ANOVA)
Metody Przetwarzania Danych Meteorologicznych Wykład 4
Test t-studenta dla pojedynczej próby
Próby niezależne versus próby zależne
Próby niezależne versus próby zależne
Porównywanie średnich dwóch prób zależnych
Rozkład normalny Cecha posiada rozkład normalny jeśli na jej wielkość ma wpływ wiele niezależnych czynników, a wpływ każdego z nich nie jest zbyt duży.
Testy nieparametryczne
Średnie i miary zmienności
Co to są rozkłady normalne?
Jednoczynnikowa analiza wariancji (ANOVA)
Rozkład t.
Hipotezy statystyczne
Analiza wariancji jednoczynnikowa
Analiza wariancji.
Testy nieparametryczne
Dlaczego obserwujemy??? istotny wpływ, istotną różnicę, istotną zależność.
Konstrukcja, estymacja parametrów
Hipotezy statystyczne
Testy nieparametryczne
BADANIE STATYSTYCZNE Badanie statystyczne to proces pozyskiwania danych na temat rozkładu cechy statystycznej w populacji. Badanie może mieć charakter:
Analiza wariancji jednoczynnikowa.
Hipotezy statystyczne
Korelacja rang.
Podstawy statystyki, cz. II
Statystyka i opracowanie wyników badań
Statystyka - to „nie boli”
Planowanie badań i analiza wyników
Porównywanie średnich 2 i więcej prób o rozkładach innych niż normalny
1 Analiza wyników sprawdzianu ‘2014 Zespół Szkolno-Przedszkolny w Krowiarkach – XI 2014 – XI 2014 Opracował: J. Pierzchała.
Testowanie hipotez statystycznych
Dopasowanie rozkładów
Wnioskowanie statystyczne
Estymatory punktowe i przedziałowe
Weryfikacja hipotez statystycznych dr hab. Mieczysław Kowerski
Podstawowe pojęcia i terminy stosowane w statystyce
Statystyczna analiza danych w praktyce
Testowanie hipotez Jacek Szanduła.
Statystyczna analiza danych
Statystyczna analiza danych
Statystyczna analiza danych
STATYSTYKA – kurs podstawowy wykład 9 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Przeprowadzenie badań niewyczerpujących, (częściowych – prowadzonych na podstawie próby losowej), nie daje podstaw do formułowania stanowczych stwierdzeń.
Testy nieparametryczne – testy zgodności. Nieparametryczne testy istotności dzielimy na trzy zasadnicze grupy: testy zgodności, testy niezależności oraz.
STATYSTYKA – kurs podstawowy wykład 7 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Rozkłady statystyk z próby dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium.
Estymacja parametrów populacji. Estymacja polega na szacowaniu wartości parametrów rozkładu lub postaci samego rozkładu zmiennej losowej, na podstawie.
Weryfikacja hipotez statystycznych „Człowiek – najlepsza inwestycja”
Statystyka medyczna Piotr Kozłowski www: 1.
Wnioskowanie statystyczne. Próbkowanie (sampling)
Testy nieparametryczne
Statystyka matematyczna
Statystyka matematyczna
PODSTAWY STATYSTYKI Wykład udostępniony przez dr hab. Jana Gajewskiego
Analiza współzależności zjawisk
Zapis prezentacji:

Testy nieparametryczne

Ograniczenia testów parametrycznych Testów parametrycznych nie stosujemy, gdy zmienne mają charakter jakościowy czy też uporządkowany.

Zastosowanie testów nieparametrycznych Testy nieparametryczne wykorzystujemy w sytuacji, gdy nie są spełnione założenia wymagane przez testy parametryczne, jak: zmienne mierzalne, posiadające rozkład zgodny normalnym. Stosujemy, gdy transformacja danych nie przynosi efektów, np. w zakresie normalizacji rozkładu.

Testy nieparametryczne a rozkład zmiennej Testy nieparametryczne nie zależą od rozkładu zmiennej, od pewnych parametrów rozkładu populacji. Na ogół obliczenia są proste i nie zajmują wiele czasu.

Analiza rang Testy nieparametryczne pod względem rachunkowym oparte są na analizie rang (lokat). Dane w porównywanych grupach porządkujemy rosnąco lub malejące. Rachunki matematyczne wykonujemy na rangach.

Moc testów Siła testów nieparametrycznych (1-β) jest niższa niż siła testów parametrycznych – testy nieparametryczne stosujemy wtedy, gdy nie są spełnione założenia, jakich wymagają testy parametryczne. W odniesieniu do dużych populacji n > 100 zamiast testów nieparametrycznych możemy stosować testy parametryczne, mimo że sama zmienna nie posiada rozkładu normalnego. Jest to możliwe ze względu na fakt, że rozkład średnich z tych prób ulega normalizacji.

Statystyczna analiza

Statystyczna analiza

Statystyka opisowa Średnia geometryczna Mediana Dominanta Rozstęp Odstęp międzykwartylowy

Porównania grup – dobór testu

Doświadczenie niezależne – 2 grupy Test U Mann-Whitney Test ten jest najmocniejszą nieparametryczną alternatywą dla testu t. Założenia testu: cecha posiada rozkład typu ciągłego, ale może być rozpatrywana również w skali porządkowej.

Test U Mann-Whitney Porównujemy poziom ocenianych wskaźników ścieków zmierzony w czasie zimy i wiosny. Weryfikujemy hipotezę zerową zakładającą, iż rozkład ChZT stwierdzony zimą i wiosną jest taki sam: H0: F(x) = G(x); H1: F(x) ≠ G(x) F(x), G(x) – dystrybuanta ChZT zimą i wiosną

Test U – porównujemy pory roku Porządkujemy rosnąco dane obydwu grup. Poczynając od wartości najmniejszej przypisujemy im rangi.

Rangi wiązane Rangi wiązane to sytuacja, w której sąsiednie, uporządkowane wcześniej wartości zmiennej są takie same.

Rangi wiązane W tej sytuacji przyporządkowujemy im tzw. rangi wiązane, które powstają w wyniku obliczenia średnie arytmetycznej z numerów nadawanych kolejnym powtórzeniom tej samej wartości. (8+9)/2=8.5

Kolejność obliczeń Ustalamy liczebności porównywanych grup Obliczamy sumę rang dla obydwu grup: R1 i R2. Ustalamy liczebności porównywanych grup

Wzór R1, R2 – suma rang przyznanych 1 i 2 grupie; n1, n2 – liczebność grupy 1 i 2.

Wartości krytyczne Obliczone wartości U i Z porównujemy z odpowiednimi wartościami krytycznymi z tabel statystycznych.

Wyniki U = 12 z = -2,86 |-2,86| porównujemy z wartością z/2=1,96 (=0,05) Ze względu na fakt, iż obliczona wartość z jest większa niż 1,96, odrzucamy hipotezę zerową. Wnioskujemy zatem, że poziom CHZT zmierzony zimą różni się statystycznie od poziomu zarejestrowanego wiosną. Otrzymany wynik jest również większy niż z/2 odczytane przy =0,01. Wnioskujemy zatem, że między badanymi grupami różnica jest statystycznie wysoko istotna

Test U n1 i n2 > 20

Doświadczenie niezależne, k > 2 Test Kruskal-Wallis Test mediany

Kruskal-Wallis Weryfikujemy hipotezę zerową zakładającą, iż rozkład ChZT w k populacjach jest taki sam: H0: F1(x) = F2(x) =... = Fk(x) H1: F1(x) ≠ F2(x) ≠ ...≠ Fk(x) F1(x), F2(x), Fk(x)– dystrybuanty rozpatrywanych populacji. Program SAS: Kruskal-Wallis Test Chi-kwadrat 8.4354 Stopień swobody 2 Pr > Chi-kwadrat 0.0147 Wartość testu Kruskal-Wallis wynosi 8,4354. Obliczone prawdopodobieństwo (p<0,0147) pozwala odrzucić H0. Wyniki analizy pozwalają stwierdzić, że pora roku wpływa statystycznie istotnie na poziom badanego wskaźnika.

Kruskal-Wallis n = n1 + n2 + … + nk – liczebność poszczególnych grup; Ti (i = 1, 2, … k) – suma rang w każdej grupie oddzielnie

Test mediany Test mediany jest mniej dokładną wersją K-W. Obliczenia wykonywane są w oparciu o tablicę kontyngencji 2. H0 : mediany są takie same w obydwu próbach, czyli około jednej połowy wszystkich przypadków w każdej z grup przypada powyżej, a drugiej połowy wspólnej mediany. H1 : mediany nie są takie same.

Statistica, test K-W i mediany

Doświadczenie zależne, k =2 Test kolejności par Wilcoxona Test znaków

Test kolejności par Wilcoxona Obliczamy różnice między sąsiednimi wartościami zmiennych Wyznaczamy wartości bezwzględne różnic; porządkujemy je rosnąco Uporządkowanym wartościom przypisujemy rangi (w razie obliczamy rangi wiązane) Obliczamy sumy rang (T-; T+) oddzielnie dla różnic ujemnych i dodatnich.

Test znaków Test znaków jest nieparametrycznym odpowiednikiem testu t dla zmiennych zależnych. W teście tym brane jest pod uwagę ile razy wartości pierwszej zmiennej przewyższają wartości drugiej zmiennej i odwrotnie.

Doświadczenia zależne, k > 2 Test Friedmana