Testy nieparametryczne

Slides:



Advertisements
Podobne prezentacje
Rangowy test zgodności rozkładów
Advertisements

Statystyka Wojciech Jawień
Układy eksperymentalne analizy wariancji. Analiza wariancji Planowanie eksperymentu Analiza jednoczynnikowa, p poziomów czynnika, dla każdego obiektu.
Wykład 7: Moc Moc testu to prawdopodobieństwo odrzucenia H0, gdy prawdziwa jest HA Moc=czułość testu Moc = 1 – Pr (nie odrzucamy H0, gdy prawdziwa jest.
Analiza współzależności zjawisk
Porównywanie średnich dwóch prób niezależnych o rozkładach normalnych (test t-studenta)
Analiza wariancji jednoczynnikowa
Analiza wariancji Marcin Zajenkowski. Badania eksperymentalne ANOVA najczęściej do eksperymentów Porównanie wyników z 2 grup lub więcej Zmienna niezależna.
Skale pomiarowe – BARDZO WAŻNE
Miary jednej cechy Miary poziomu Miary dyspersji Miary asymetrii (skośności)
Opinie, przekonania, stereotypy
Wnioskowanie statystyczne CZEŚĆ III
Statystyka w doświadczalnictwie
Dane informacyjne: Gimnazjum im. Marii Skłodowskiej-Curie
Wykład 8 Testy Studenta Jest kilka różnych testów Studenta. Mają one podobną strukturę ale służą do testowania różnych hipotez i różnią się nieco postacią.
Wykład 11 Analiza wariancji (ANOVA)
Metody Przetwarzania Danych Meteorologicznych Wykład 4
Test t-studenta dla pojedynczej próby
Próby niezależne versus próby zależne
Próby niezależne versus próby zależne
Porównywanie średnich dwóch prób zależnych
Rozkład normalny Cecha posiada rozkład normalny jeśli na jej wielkość ma wpływ wiele niezależnych czynników, a wpływ każdego z nich nie jest zbyt duży.
Testy nieparametryczne
Co to są rozkłady normalne?
Jednoczynnikowa analiza wariancji (ANOVA)
Rozkład t.
Hipotezy statystyczne
Analiza wariancji jednoczynnikowa
Strona formalna tekstu
Dlaczego obserwujemy??? istotny wpływ, istotną różnicę, istotną zależność.
Konstrukcja, estymacja parametrów
Hipotezy statystyczne
Testy nieparametryczne
BADANIE STATYSTYCZNE Badanie statystyczne to proces pozyskiwania danych na temat rozkładu cechy statystycznej w populacji. Badanie może mieć charakter:
Analiza wariancji jednoczynnikowa.
Testy nieparametryczne
Hipotezy statystyczne
Korelacja rang.
Kilka wybranych uzupelnień
Podstawy statystyki, cz. II
Statystyka i opracowanie wyników badań
Statystyka - to „nie boli”
Porównywanie średnich 2 i więcej prób o rozkładach innych niż normalny
Testowanie hipotez statystycznych
Dopasowanie rozkładów
Wnioskowanie statystyczne
STATYSTYKA Pochodzenie nazwy:
Estymatory punktowe i przedziałowe
Weryfikacja hipotez statystycznych dr hab. Mieczysław Kowerski
Podstawowe pojęcia i terminy stosowane w statystyce
Statystyczna analiza danych w praktyce
Testowanie hipotez Jacek Szanduła.
Statystyczna analiza danych
Statystyczna analiza danych
Statystyczna analiza danych
STATYSTYKA – kurs podstawowy wykład 9 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Przeprowadzenie badań niewyczerpujących, (częściowych – prowadzonych na podstawie próby losowej), nie daje podstaw do formułowania stanowczych stwierdzeń.
Testy nieparametryczne – testy zgodności. Nieparametryczne testy istotności dzielimy na trzy zasadnicze grupy: testy zgodności, testy niezależności oraz.
STATYSTYKA – kurs podstawowy wykład 7 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Rozkłady statystyk z próby dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium.
Estymacja parametrów populacji. Estymacja polega na szacowaniu wartości parametrów rozkładu lub postaci samego rozkładu zmiennej losowej, na podstawie.
Weryfikacja hipotez statystycznych „Człowiek – najlepsza inwestycja”
Parametry rozkładów Metodologia badań w naukach behawioralnych II.
Statystyka medyczna Piotr Kozłowski www: 1.
TABELE WIELODZELCZE TESTY NIEPARAMETRYCZNE
Testy nieparametryczne
Statystyka matematyczna
Statystyka matematyczna
PODSTAWY STATYSTYKI Wykład udostępniony przez dr hab. Jana Gajewskiego
Analiza współzależności zjawisk
Zapis prezentacji:

Testy nieparametryczne dr hab. inż. Dariusz Piwczyński

Ograniczenia testów parametrycznych Testów parametrycznych nie stosujemy, gdy zmienne mają charakter jakościowy czy też uporządkowany.

Zastosowanie testów nieparametrycznych Testy nieparametryczne wykorzystujemy w sytuacji, gdy nie są spełnione założenia wymagane przez testy parametryczne, jak: zmienne mierzalne, posiadające rozkład zgodny normalnym. Stosujemy, gdy transformacja danych nie przynosi efektów, np. w zakresie normalizacji rozkładu.

Testy nieparametryczne a rozkład zmiennej Testy nieparametryczne nie zależą od rozkładu zmiennej, od pewnych parametrów rozkładu populacji. Na ogół obliczenia są proste i nie zajmują wiele czasu.

Analiza rang Testy nieparametryczne pod względem rachunkowym oparte są na analizie rang (lokat). Dane w porównywanych grupach porządkujemy rosnąco lub malejąco. Rachunki matematyczne wykonujemy na rangach.

Moc testów Niestety, siła testów nieparametrycznych (1-β) jest niższa niż siła testów parametrycznych –testy nieparametryczne stosujemy tylko wtedy, gdy nie są spełnione założenia, jakich wymagają testy parametryczne. W odniesieniu do dużych populacji n > 100 zamiast testów nieparametrycznych możemy stosować testy parametryczne, mimo że sama zmienna nie posiada rozkładu normalnego. Jest to możliwe ze względu na fakt, że rozkład średnich z tych prób ulega normalizacji.

Statystyczna analiza

Statystyczna analiza

Statystyka opisowa Średnia geometryczna Mediana Dominanta Rozstęp Odstęp międzykwartylowy

Porównania grup – dobór testu

Doświadczenie niezależne – 2 grupy Test U Mann-Whitney Test ten jest najmocniejszą nieparametryczną alternatywą dla testu t. Założenia testu: cecha posiada rozkład typu ciągłego, ale może być rozpatrywana również w skali porządkowej.

Test U Mann-Whitney Porównujemy poziom ocenianych wskaźników ścieków zmierzony w czasie zimy i wiosny. Weryfikujemy hipotezę zerową zakładającą, iż rozkład ChZT stwierdzony zimą i wiosną jest taki sam: H0: F(x) = G(x); H1: F(x) ≠ G(x) F(x), G(x) – dystrybuanta ChZT zimą i wiosną

Test U – porównujemy pory roku Porządkujemy rosnąco dane obydwu grup. Poczynając od wartości najmniejszej przypisujemy im rangi.

Rangi wiązane Rangi wiązane to sytuacja, w której sąsiednie, uporządkowane wcześniej wartości zmiennej są takie same.

Rangi wiązane W tej sytuacji przyporządkowujemy im tzw. rangi wiązane, które powstają w wyniku obliczenia średnie arytmetycznej z numerów nadawanych kolejnym powtórzeniom tej samej wartości. (8 + 9) = 8,5

Kolejność obliczeń Ustalamy liczebności porównywanych grup Obliczamy sumę rang dla obydwu grup: R1 i R2. Ustalamy liczebności porównywanych grup

Wzór R1, R2 – suma rang przyznanych 1 i 2 grupie; n1, n2 – liczebność grupy 1 i 2.

Wartości krytyczne Obliczone wartości U i Z porównujemy z odpowiednimi wartościami krytycznymi z tabel statystycznych.

Wyniki U = 12 z = -2,86 |-2,86| porównujemy z wartością z/2=1,96 (=0,05) Ze względu na fakt, iż obliczona wartość z jest większa niż 1,96, odrzucamy hipotezę zerową. Wnioskujemy zatem, że poziom CHZT zmierzony zimą różni się statystycznie od poziomu zarejestrowanego wiosną. Otrzymany wynik jest również większy niż z/2 odczytane przy =0,01. Wnioskujemy zatem, że między badanymi grupami różnica jest statystycznie wysoko istotna.

Test U n1 i n2 > 20

SAS EG, Test U Mann Whitney

SAS EG, Test U Mann Whitney

SAS EG, U Mann Whitney, WYNIKI

Doświadczenie niezależne, k > 2 Test Kruskal-Wallis Test mediany

Kruskal-Wallis Weryfikujemy hipotezę zerową zakładającą, iż rozkład ChZT w k populacjach jest taki sam: H0: F1(x) = F2(x) =... = Fk(x) H1: F1(x) ≠ F2(x) ≠ ...≠ Fk(x) F1(x), F2(x), Fk(x) – dystrybuanty rozpatrywanych populacji. Program SAS: Kruskal-Wallis Test Chi-kwadrat 8.4354 Stopień swobody 2 Pr > Chi-kwadrat 0.0147 Wartość testu Kruskal-Wallis wynosi 8,4354. Obliczone prawdopodobieństwo (p < 0,0147) pozwala odrzucić H0. Wyniki analizy pozwalają stwierdzić, że pora roku wpływa statystycznie istotnie na poziom badanego wskaźnika.

Kruskal-Wallis n = n1 + n2 + … + nk – liczebność poszczególnych grup; Ti (i = 1, 2, … k) – suma rang w każdej grupie oddzielnie

Test mediany Test mediany jest mniej dokładną wersją K-W. Obliczenia wykonywane są w oparciu o tablicę kontyngencji 2. H0 : mediany są takie same w obu próbach, czyli około połowy przypadków wszystkich przypadkach w każdej z grup przypada powyżej, a druga poniżej wspólnej mediany. H1 : mediany nie są takie same.

SAS EG, test K-W i mediany

SAS EG, test K-W

SAS EG, test mediany

Statistica, test K-W i mediany

Doświadczenie zależne, k =2 Test kolejności par Wilcoxona Test znaków

Test znaków Test znaków jest nieparametrycznym odpowiednikiem testu t dla zmiennych zależnych. W teście tym brane jest pod uwagę ile razy wartości pierwszej zmiennej przewyższają wartości drugiej zmiennej i odwrotnie.

Test kolejności par Wilcoxona

Doświadczenia dwugrupowe zależne w SAS W SAS konieczne jest wcześniejsze przygotowanie kolumny będącej różnicą jednej i drugiej serii danych!

SAS EG, Test znaków i kolejności par Wilcoxona

SAS EG, Test znaków i kolejności par Wilcoxona

SAS EG, Test znaków i kolejności par Wilcoxona test kolejności par Wilcoxona

Doświadczenia zależne, k > 2 Test Friedmana