Testy nieparametryczne

Slides:



Advertisements
Podobne prezentacje
Regresja i korelacja materiały dydaktyczne.
Advertisements

Test zgodności c2.
Rangowy test zgodności rozkładów
Analiza wariancji jednoczynnikowa
Zmienne losowe i ich rozkłady
Badania marketingowe na rynkach produktów sektora wysokich technologii Wybrane metody analizy danych.
BUDOWA MODELU EKONOMETRYCZNEGO
Test zgodności Joanna Tomanek i Piotr Nowak.
Metody wnioskowania na podstawie podprób
Wnioskowanie statystyczne CZEŚĆ III
Statystyka w doświadczalnictwie
Statystyka w doświadczalnictwie
Metody Przetwarzania Danych Meteorologicznych Wykład 4
Nierówność informacyjna
Pobieranie próby Populacja generalna: zbiór wyników wszystkich możliwych doświadczeń określonego typu. Próba n-wymiarowa: zbiór n wyników doświadczeń.
Próby niezależne versus próby zależne
Porównywanie średnich dwóch prób zależnych
Rozkład normalny Cecha posiada rozkład normalny jeśli na jej wielkość ma wpływ wiele niezależnych czynników, a wpływ każdego z nich nie jest zbyt duży.
Wykład 4. Rozkłady teoretyczne
Testy nieparametryczne
Metody Symulacyjne w Telekomunikacji (MEST) Wykład 6/7: Analiza statystyczna wyników symulacyjnych  Dr inż. Halina Tarasiuk
Średnie i miary zmienności
Rozkład t.
Hipotezy statystyczne
Analiza wariancji jednoczynnikowa
Testy nieparametryczne
Dlaczego obserwujemy??? istotny wpływ, istotną różnicę, istotną zależność.
Konstrukcja, estymacja parametrów
Testowanie hipotez statystycznych
Hipotezy statystyczne
Testy nieparametryczne
Analiza reszt w regresji
BADANIE STATYSTYCZNE Badanie statystyczne to proces pozyskiwania danych na temat rozkładu cechy statystycznej w populacji. Badanie może mieć charakter:
Analiza wariancji jednoczynnikowa.
Testy nieparametryczne
Modelowanie ekonometryczne
Hipotezy statystyczne
Finanse 2009/2010 dr Grzegorz Szafrański pokój B106 Termin konsultacji poniedziałek:
Kilka wybranych uzupelnień
Ekonometria stosowana
Planowanie badań i analiza wyników
Porównywanie średnich 2 i więcej prób o rozkładach innych niż normalny
Testowanie hipotez statystycznych
Co to jest dystrybuanta?
Dopasowanie rozkładów
Weryfikacja hipotez statystycznych
Estymatory punktowe i przedziałowe
Podstawowe pojęcia i terminy stosowane w statystyce. Rozkłady częstości Seminarium 2.
Weryfikacja hipotez statystycznych dr hab. Mieczysław Kowerski
Testowanie hipotez Jacek Szanduła.
Badanie własności składnika losowego dr hab. Mieczysław Kowerski
STATYSTYKA – kurs podstawowy wykład 9 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Monte Carlo, bootstrap, jacknife. 2 Literatura Bruce Hansen (2012 +) Econometrics, ze strony internetowej :
Przeprowadzenie badań niewyczerpujących, (częściowych – prowadzonych na podstawie próby losowej), nie daje podstaw do formułowania stanowczych stwierdzeń.
Testy nieparametryczne – testy zgodności. Nieparametryczne testy istotności dzielimy na trzy zasadnicze grupy: testy zgodności, testy niezależności oraz.
STATYSTYKA – kurs podstawowy wykład 7 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Rozkłady statystyk z próby dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium.
Estymacja parametrów populacji. Estymacja polega na szacowaniu wartości parametrów rozkładu lub postaci samego rozkładu zmiennej losowej, na podstawie.
STATYSTYKA – kurs podstawowy wykład 6 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Weryfikacja hipotez statystycznych „Człowiek – najlepsza inwestycja”
Wnioskowanie statystyczne. Próbkowanie (sampling)
TABELE WIELODZELCZE TESTY NIEPARAMETRYCZNE
Statystyka matematyczna
Statystyka matematyczna
Statystyka matematyczna
Zmienna losowa. Wybrane rozkłady zmiennej. Przedział ufności.
Wnioskowanie statystyczne Weryfikacja hipotez statystycznych
Analiza niepewności pomiarów Zagadnienia statystyki matematycznej
Analiza współzależności zjawisk
Monte Carlo, bootstrap, jacknife
Zapis prezentacji:

Testy nieparametryczne

Testy losowości Weryfikują hipotezę, że dobór jednostek do próby był jednakowy

Test serii Stevensa 1. Ho: Dobór jednostek do próby jest losowy H1:Dobór jednostek do próby nie jest losowy 2. Procedura testowa: 2a. Wyznaczamy na podstawie uporządkowanych danych medianę 2b. Danym nieuporządkowanym przyporządkowujemy następujące oznaczenia: A gdy x<Me B gdy x>Me 0 gdy x=Me (zera pomijamy w dalszej analizie) Statystyką testową jest liczba serii (k)

Seria – ciąg identycznych symboli (A lub B) np. AAAA B A BB k=4 AAA 0 A BBB 0 AA k=3

3. Ustalamy poziom istotności 4. Obszar krytyczny testu jest zawsze dwustronny. Odczytujemy z rozkładu liczby serii wartości krytyczne 5. Podejmujemy decyzję

Przykład 1: Wylosowano 12 spółek i zbadano cenę ich akcji (w zł). Otrzymano następujące wyniki: 74,5 191,0 55,5 5,15 36,4 35,0 46,0 10,9 7,35 6,65 173,5 26,0. Czy dobór spółek do próby był losowy? Wysuniętą hipotezę zweryfikuj na poziomie istotności 0,05.

Rozwiązanie: Ho: dobór jednostek do próby jest losowy H1:Dobór jednostek do próby nie jest losowy Wyznaczamy medianę: Poz. Me=(n+1)/2=6,5 Me=35,7 Danym pierwotnym przypisujemy litery A, B, 0 kolejnym obserwacjom

Obliczamy liczbę serii: k=8 Poziom istotności 0,05 Odczytujemy wartości krytyczne:

Porównujemy wartość statystyki z próby z wartościami krytycznymi: Brak podstaw do odrzucenia hipotezy zerowej, która mówi, że dobór jednostek do próby był losowy. 3 10 8

Testy zgodności: Weryfikują hipotezę o zgodności rozkładu empirycznego (rozkładu z próby losowej) z rozkładem teoretycznym (np. normalnym, dwumianowym itp.) lub inaczej ujmując – dotyczą postaci rozkładu badanej cechy w populacji.

Testy zgodności (normalności) 1. Test Kołmogorowa- Smirnowa (D) (próby małe n<100, zmienna ciągła) 2. Test  - Kołmogorowa (próby duże n100, zmienna ciągła) 3. Test 2 (wszystkie zmienne, szeregi rozdzielcze o dużych liczebnościach w przedziałach , próby duże)

Etapy testów zgodności (aproksymacja rozkładu normalnego): 1. Ustalamy parametry rozkładu normalnego 2. Standaryzujemy prawe (górne) granice przedziałów (poza ostatnim) 3. Odczytujemy wartości dystrybuant z tablicy rozkładu normalnego (jako ostatnią dystrybuantę przyjmujemy wartość 1) 4a. Z dystrybuant obliczamy skumulowane wartości teoretyczne (test Chi-kwadrat) lub 4b. Obliczamy dystrybuanty empiryczne (test Kołmogorowa)

Etapy testów zgodności (c.d.): 5. Obliczamy wartość statystyki testowej 6 a. Odczytujemy wartość krytyczną z tablic Lub 6 b. Obliczamy prawdopodobieństwo testu 7. Podejmujemy decyzję

Przykład 1:

Wiek w latach Liczba osób Z F(Z) nisk F(X)   15-25 2 -1,38 0,0833 0,1176 0,0343 25-35 3 -0,46 0,3224 5 0,2941 0,0283 35-45 6 0,46 0,6776 11 0,6471 0,0305 45-55 1,38 0,9167 16 0,9412 0,0245 55-65 1 x 17 1,0000 0,0000  Suma

0,206 0,0343 Brak podstaw do odrzucenia hipotezy zerowej o zgodności rozkładu wieku inwestorów z rozkładem normalnym.

Przykład 2: I sposób (test  - Kołmogorowa)

Wiek w latach Liczba osób Z F(Z) nisk F(X)   15-25 20 -1,38 0,0833 0,1176 0,0343 25-35 30 -0,46 0,3224 50 0,2941 0,0283 35-45 60 0,46 0,6776 110 0,6471 0,0305 45-55 1,38 0,9167 160 0,9412 0,0245 55 i więcej 10 x 1 170 1,0000 0,0000  Suma

1,36 0,447 Brak podstaw do odrzucenia hipotezy zerowej o zgodności rozkładu wieku inwestorów z rozkładem normalnym.

Przykład 2: II sposób (test Chi - kwadrat)

Wiek w latach Liczba osób Z F(Z)   15-25 20 -1,38 0,0833 14,16 28,25 25-35 30 -0,46 0,3224 54,81 40,65 22,14 35-45 60 0,46 0,6776 115,19 60,38 59,62 45-55 50 1,38 0,9167 155,84 61,50 55 i więcej 10 x 1 170 7,06  Suma 178,57 

1,36 8,57 Brak podstaw do odrzucenia hipotezy zerowej o zgodności rozkładu wieku inwestorów z rozkładem normalnym.

Testy jednorodności Weryfikują hipotezę o zgodności dwóch rozkładów empirycznych ze sobą (oba rozkłady pochodzą z tej samej populacji)

Testy jednorodności Test serii Walda – Wolfowitza (próby niezależne, małe, dane szczegółowe) Test 2 (Snedeckora) (próby niezależne, duże, szeregi rozdzielcze o licznych przedziałach , wszystkie rodzaje cech) Test Kołmogorowa - Smirnowa () (próby niezależne, duże, tylko cechy ilościowe ciągłe) Test znaków (Dixona - Mooda) (próby zależne, małe, dane szczegółowe, cechy ilościowe ciągłe)

Przykład: Liczba zgonów niemowląt wg wieku w losowo wybranych próbach w 1989 roku i 1990 roku. Wiek Liczba niemowląt 1989 1990 0 dni 112 73 1-6 132 135 7-13 27 21 14-20 11 17 21-29 8 9 1-2 m-ce 28 26 3-5 24 37 6-11 Razem 366 339 Czy rozkłady zgonów niemowląt według wieku w obu badanych próbach są takie same? =0.05

Test jednorodności chi-kwadrat

Wiek Liczba niemowląt   1989 1990 0 dni 112 73 67,81 06-sty 132 135 65,26 13-lip 27 21 15,19 14-20 11 17 4,32 21-29 8 9 3,76 1-2 m-ce 28 26 14,52 05-mar 24 37 9,44 11-cze 12,80 Razem 366 339 193,10

14,067 0,018 Brak podstaw do odrzucenia hipotezy zerowej o jednorodności rozkładu zgonów niemowląt.

Przykład:

Brak podstaw do odrzucenia hipotezy zerowej o identyczności rozkładów wagi przed i po kuracji. 2 4