Testy nieparametryczne

Slides:

Advertisements

Podobne prezentacje

Regresja i korelacja materiały dydaktyczne.

Advertisements

Test zgodności c2.

Rangowy test zgodności rozkładów

Analiza wariancji jednoczynnikowa

Zmienne losowe i ich rozkłady

Badania marketingowe na rynkach produktów sektora wysokich technologii Wybrane metody analizy danych.

BUDOWA MODELU EKONOMETRYCZNEGO

Test zgodności Joanna Tomanek i Piotr Nowak.

Metody wnioskowania na podstawie podprób

Wnioskowanie statystyczne CZEŚĆ III

Statystyka w doświadczalnictwie

Statystyka w doświadczalnictwie

Metody Przetwarzania Danych Meteorologicznych Wykład 4

Nierówność informacyjna

Pobieranie próby Populacja generalna: zbiór wyników wszystkich możliwych doświadczeń określonego typu. Próba n-wymiarowa: zbiór n wyników doświadczeń.

Próby niezależne versus próby zależne

Porównywanie średnich dwóch prób zależnych

Rozkład normalny Cecha posiada rozkład normalny jeśli na jej wielkość ma wpływ wiele niezależnych czynników, a wpływ każdego z nich nie jest zbyt duży.

Wykład 4. Rozkłady teoretyczne

Testy nieparametryczne

Metody Symulacyjne w Telekomunikacji (MEST) Wykład 6/7: Analiza statystyczna wyników symulacyjnych Dr inż. Halina Tarasiuk

Średnie i miary zmienności

Hipotezy statystyczne

Analiza wariancji jednoczynnikowa

Testy nieparametryczne

Dlaczego obserwujemy??? istotny wpływ, istotną różnicę, istotną zależność.

Konstrukcja, estymacja parametrów

Testowanie hipotez statystycznych

Hipotezy statystyczne

Testy nieparametryczne

Analiza reszt w regresji

BADANIE STATYSTYCZNE Badanie statystyczne to proces pozyskiwania danych na temat rozkładu cechy statystycznej w populacji. Badanie może mieć charakter:

Analiza wariancji jednoczynnikowa.

Testy nieparametryczne

Modelowanie ekonometryczne

Hipotezy statystyczne

Finanse 2009/2010 dr Grzegorz Szafrański pokój B106 Termin konsultacji poniedziałek:

Kilka wybranych uzupelnień

Ekonometria stosowana

Planowanie badań i analiza wyników

Porównywanie średnich 2 i więcej prób o rozkładach innych niż normalny

Testowanie hipotez statystycznych

Co to jest dystrybuanta?

Dopasowanie rozkładów

Weryfikacja hipotez statystycznych

Estymatory punktowe i przedziałowe

Podstawowe pojęcia i terminy stosowane w statystyce. Rozkłady częstości Seminarium 2.

Weryfikacja hipotez statystycznych dr hab. Mieczysław Kowerski

Testowanie hipotez Jacek Szanduła.

Badanie własności składnika losowego dr hab. Mieczysław Kowerski

STATYSTYKA – kurs podstawowy wykład 9 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.

Monte Carlo, bootstrap, jacknife. 2 Literatura Bruce Hansen (2012 +) Econometrics, ze strony internetowej :

Przeprowadzenie badań niewyczerpujących, (częściowych – prowadzonych na podstawie próby losowej), nie daje podstaw do formułowania stanowczych stwierdzeń.

Testy nieparametryczne – testy zgodności. Nieparametryczne testy istotności dzielimy na trzy zasadnicze grupy: testy zgodności, testy niezależności oraz.

STATYSTYKA – kurs podstawowy wykład 7 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.

Rozkłady statystyk z próby dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium.

Estymacja parametrów populacji. Estymacja polega na szacowaniu wartości parametrów rozkładu lub postaci samego rozkładu zmiennej losowej, na podstawie.

STATYSTYKA – kurs podstawowy wykład 6 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.

Weryfikacja hipotez statystycznych „Człowiek – najlepsza inwestycja”

Wnioskowanie statystyczne. Próbkowanie (sampling)

TABELE WIELODZELCZE TESTY NIEPARAMETRYCZNE

Statystyka matematyczna

Statystyka matematyczna

Statystyka matematyczna

Zmienna losowa. Wybrane rozkłady zmiennej. Przedział ufności.

Wnioskowanie statystyczne Weryfikacja hipotez statystycznych

Analiza niepewności pomiarów Zagadnienia statystyki matematycznej

Analiza współzależności zjawisk

Monte Carlo, bootstrap, jacknife

Zapis prezentacji:

Testy nieparametryczne

Testy losowości Weryfikują hipotezę, że dobór jednostek do próby był jednakowy

Test serii Stevensa 1. Ho: Dobór jednostek do próby jest losowy H1:Dobór jednostek do próby nie jest losowy 2. Procedura testowa: 2a. Wyznaczamy na podstawie uporządkowanych danych medianę 2b. Danym nieuporządkowanym przyporządkowujemy następujące oznaczenia: A gdy x<Me B gdy x>Me 0 gdy x=Me (zera pomijamy w dalszej analizie) Statystyką testową jest liczba serii (k)

Seria – ciąg identycznych symboli (A lub B) np. AAAA B A BB k=4 AAA 0 A BBB 0 AA k=3

3. Ustalamy poziom istotności 4. Obszar krytyczny testu jest zawsze dwustronny. Odczytujemy z rozkładu liczby serii wartości krytyczne 5. Podejmujemy decyzję

Przykład 1: Wylosowano 12 spółek i zbadano cenę ich akcji (w zł). Otrzymano następujące wyniki: 74,5 191,0 55,5 5,15 36,4 35,0 46,0 10,9 7,35 6,65 173,5 26,0. Czy dobór spółek do próby był losowy? Wysuniętą hipotezę zweryfikuj na poziomie istotności 0,05.

Rozwiązanie: Ho: dobór jednostek do próby jest losowy H1:Dobór jednostek do próby nie jest losowy Wyznaczamy medianę: Poz. Me=(n+1)/2=6,5 Me=35,7 Danym pierwotnym przypisujemy litery A, B, 0 kolejnym obserwacjom

Obliczamy liczbę serii: k=8 Poziom istotności 0,05 Odczytujemy wartości krytyczne:

Porównujemy wartość statystyki z próby z wartościami krytycznymi: Brak podstaw do odrzucenia hipotezy zerowej, która mówi, że dobór jednostek do próby był losowy. 3 10 8

Testy zgodności: Weryfikują hipotezę o zgodności rozkładu empirycznego (rozkładu z próby losowej) z rozkładem teoretycznym (np. normalnym, dwumianowym itp.) lub inaczej ujmując – dotyczą postaci rozkładu badanej cechy w populacji.

Testy zgodności (normalności) 1. Test Kołmogorowa- Smirnowa (D) (próby małe n<100, zmienna ciągła) 2. Test  - Kołmogorowa (próby duże n100, zmienna ciągła) 3. Test 2 (wszystkie zmienne, szeregi rozdzielcze o dużych liczebnościach w przedziałach , próby duże)

Etapy testów zgodności (aproksymacja rozkładu normalnego): 1. Ustalamy parametry rozkładu normalnego 2. Standaryzujemy prawe (górne) granice przedziałów (poza ostatnim) 3. Odczytujemy wartości dystrybuant z tablicy rozkładu normalnego (jako ostatnią dystrybuantę przyjmujemy wartość 1) 4a. Z dystrybuant obliczamy skumulowane wartości teoretyczne (test Chi-kwadrat) lub 4b. Obliczamy dystrybuanty empiryczne (test Kołmogorowa)

Etapy testów zgodności (c.d.): 5. Obliczamy wartość statystyki testowej 6 a. Odczytujemy wartość krytyczną z tablic Lub 6 b. Obliczamy prawdopodobieństwo testu 7. Podejmujemy decyzję

Przykład 1:

Wiek w latach Liczba osób Z F(Z) nisk F(X) 15-25 2 -1,38 0,0833 0,1176 0,0343 25-35 3 -0,46 0,3224 5 0,2941 0,0283 35-45 6 0,46 0,6776 11 0,6471 0,0305 45-55 1,38 0,9167 16 0,9412 0,0245 55-65 1 x 17 1,0000 0,0000 Suma

0,206 0,0343 Brak podstaw do odrzucenia hipotezy zerowej o zgodności rozkładu wieku inwestorów z rozkładem normalnym.

Przykład 2: I sposób (test  - Kołmogorowa)

Wiek w latach Liczba osób Z F(Z) nisk F(X) 15-25 20 -1,38 0,0833 0,1176 0,0343 25-35 30 -0,46 0,3224 50 0,2941 0,0283 35-45 60 0,46 0,6776 110 0,6471 0,0305 45-55 1,38 0,9167 160 0,9412 0,0245 55 i więcej 10 x 1 170 1,0000 0,0000 Suma

1,36 0,447 Brak podstaw do odrzucenia hipotezy zerowej o zgodności rozkładu wieku inwestorów z rozkładem normalnym.

Przykład 2: II sposób (test Chi - kwadrat)

Wiek w latach Liczba osób Z F(Z) 15-25 20 -1,38 0,0833 14,16 28,25 25-35 30 -0,46 0,3224 54,81 40,65 22,14 35-45 60 0,46 0,6776 115,19 60,38 59,62 45-55 50 1,38 0,9167 155,84 61,50 55 i więcej 10 x 1 170 7,06 Suma 178,57

1,36 8,57 Brak podstaw do odrzucenia hipotezy zerowej o zgodności rozkładu wieku inwestorów z rozkładem normalnym.

Testy jednorodności Weryfikują hipotezę o zgodności dwóch rozkładów empirycznych ze sobą (oba rozkłady pochodzą z tej samej populacji)

Testy jednorodności Test serii Walda – Wolfowitza (próby niezależne, małe, dane szczegółowe) Test 2 (Snedeckora) (próby niezależne, duże, szeregi rozdzielcze o licznych przedziałach , wszystkie rodzaje cech) Test Kołmogorowa - Smirnowa () (próby niezależne, duże, tylko cechy ilościowe ciągłe) Test znaków (Dixona - Mooda) (próby zależne, małe, dane szczegółowe, cechy ilościowe ciągłe)

Przykład: Liczba zgonów niemowląt wg wieku w losowo wybranych próbach w 1989 roku i 1990 roku. Wiek Liczba niemowląt 1989 1990 0 dni 112 73 1-6 132 135 7-13 27 21 14-20 11 17 21-29 8 9 1-2 m-ce 28 26 3-5 24 37 6-11 Razem 366 339 Czy rozkłady zgonów niemowląt według wieku w obu badanych próbach są takie same? =0.05

Test jednorodności chi-kwadrat

Wiek Liczba niemowląt 1989 1990 0 dni 112 73 67,81 06-sty 132 135 65,26 13-lip 27 21 15,19 14-20 11 17 4,32 21-29 8 9 3,76 1-2 m-ce 28 26 14,52 05-mar 24 37 9,44 11-cze 12,80 Razem 366 339 193,10

14,067 0,018 Brak podstaw do odrzucenia hipotezy zerowej o jednorodności rozkładu zgonów niemowląt.

Przykład:

Brak podstaw do odrzucenia hipotezy zerowej o identyczności rozkładów wagi przed i po kuracji. 2 4