Przeprowadzenie badań niewyczerpujących, (częściowych – prowadzonych na podstawie próby losowej), nie daje podstaw do formułowania stanowczych stwierdzeń.

Slides:



Advertisements
Podobne prezentacje
Regresja i korelacja materiały dydaktyczne.
Advertisements

Badania statystyczne Wykłady 1-2 © Leszek Smolarek.
ESTYMACJA PRZEDZIAŁOWA
Test zgodności c2.
PODZIAŁ STATYSTYKI STATYSTYKA STATYSTYKA MATEMATYCZNA STATYSTYKA
Rangowy test zgodności rozkładów
Analiza współzależności zjawisk
Analiza wariancji jednoczynnikowa
BUDOWA MODELU EKONOMETRYCZNEGO
Test zgodności Joanna Tomanek i Piotr Nowak.
ANALIZA WSPÓŁZALEŻNOŚCI
Powinien być określony w sposób zwięzły i precyzyjny, np
Opinie, przekonania, stereotypy
Analiza wariancji Analiza wariancji (ANOVA) stanowi rozszerzenie testu t-Studenta w przypadku porównywanie większej liczby grup. Podział na grupy (czyli.
Wnioskowanie statystyczne CZEŚĆ III
Statystyka w doświadczalnictwie
Statystyka w doświadczalnictwie
Wykład 7 Przedział ufności dla 1 – 2
Metody Przetwarzania Danych Meteorologicznych Wykład 4
Pobieranie próby Populacja generalna: zbiór wyników wszystkich możliwych doświadczeń określonego typu. Próba n-wymiarowa: zbiór n wyników doświadczeń.
Próby niezależne versus próby zależne
Porównywanie średnich dwóch prób zależnych
Rozkład normalny Cecha posiada rozkład normalny jeśli na jej wielkość ma wpływ wiele niezależnych czynników, a wpływ każdego z nich nie jest zbyt duży.
Wykład 4. Rozkłady teoretyczne
Testy nieparametryczne
Test nieparametryczny
Rozkład t.
Hipotezy statystyczne
Analiza wariancji jednoczynnikowa
Analiza wariancji.
Testy nieparametryczne
Konstrukcja, estymacja parametrów
Testowanie hipotez statystycznych
Hipotezy statystyczne
Elementy Rachunku Prawdopodobieństwa i Statystyki
Testy nieparametryczne
Analiza reszt w regresji
BADANIE STATYSTYCZNE Badanie statystyczne to proces pozyskiwania danych na temat rozkładu cechy statystycznej w populacji. Badanie może mieć charakter:
Analiza wariancji jednoczynnikowa.
Testy nieparametryczne
Modelowanie ekonometryczne
Hipotezy statystyczne
Finanse 2009/2010 dr Grzegorz Szafrański pokój B106 Termin konsultacji poniedziałek:
Kilka wybranych uzupelnień
Planowanie badań i analiza wyników
Testy statystycznej istotności
Seminarium licencjackie Beata Kapuścińska
Testowanie hipotez statystycznych
Co to jest dystrybuanta?
Wnioskowanie statystyczne
Weryfikacja hipotez statystycznych
Weryfikacja hipotez statystycznych dr hab. Mieczysław Kowerski
Testowanie hipotez Jacek Szanduła.
STATYSTYKA sposób na opisanie zjawisk masowych Mirosław Sadowski TRANSGRANICZNY UNIWERSYTET TRZECIEGO WIEKU W ZGORZELCU.
Statystyczna analiza danych
STATYSTYKA – kurs podstawowy wykład 9 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Monte Carlo, bootstrap, jacknife. 2 Literatura Bruce Hansen (2012 +) Econometrics, ze strony internetowej :
Testy nieparametryczne – testy zgodności. Nieparametryczne testy istotności dzielimy na trzy zasadnicze grupy: testy zgodności, testy niezależności oraz.
STATYSTYKA – kurs podstawowy wykład 7 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Rozkłady statystyk z próby dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium.
Estymacja parametrów populacji. Estymacja polega na szacowaniu wartości parametrów rozkładu lub postaci samego rozkładu zmiennej losowej, na podstawie.
STATYSTYKA – kurs podstawowy wykład 6 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Weryfikacja hipotez statystycznych „Człowiek – najlepsza inwestycja”
Estymacja parametryczna dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium Analiz.
Wnioskowanie statystyczne. Próbkowanie (sampling)
Testy nieparametryczne
Statystyka matematyczna
Wnioskowanie statystyczne Weryfikacja hipotez statystycznych
Analiza współzależności zjawisk
Monte Carlo, bootstrap, jacknife
Zapis prezentacji:

Przeprowadzenie badań niewyczerpujących, (częściowych – prowadzonych na podstawie próby losowej), nie daje podstaw do formułowania stanowczych stwierdzeń dotyczących badanych zmiennych losowych. Daje jednak wystarczające podstawy do stawiania oraz weryfikowania różnego rodzaju przypuszczeń dotyczących zarówno klasy rozkładu, jak i jego parametrów. Tego rodzaju przypuszczenia nazywamy hipotezami statystycznymi.

Hipotezy, które dotyczą parametrów nazywać będziemy hipotezami parametrycznymi, zaś takie, które dotyczą klasy rozkładu zmiennej – a więc funkcyjnej postaci dystrybuanty nazywać będziemy hipotezami nieparametrycznymi. Procedury mające na celu sprawdzenie tak sformułowanych hipotez nazywać będziemy testami statystycznymi i odpowiednio do sprawdzanych hipotez wyróżniamy testy parametryczne oraz nieparametryczne.

Procedura przeprowadzenia testu sprowadza się, najprościej mówiąc, do postawienia hipotezy statystycznej, wyboru statystyki testowej (kryterium danego testu) oraz poziomu istotności testu. Najczęściej poziom istotności testu jest oznaczany jako alfa i oznacza prawdopodobieństwo popełnienia błędu pierwszego rodzaju (który polega na odrzuceniu sądu właściwego, przy czym prawdopodobieństwo przyjęcia sądu błędnego oznaczane jest jako beta - czyli błąd drugiego rodzaju).

Test niezależności chi-kwadrat stosowany jest w przypadku badania niezależności cech niemierzalnych (jakościowych) lub w przypadku badania niezależności cechy jakościowej z ilościową.

Załóżmy, że przedmiotem badania jest populacja generalna. Z populacji tej pobrano n-elementową próbę (przy czym ważne jest, by n>30), której wyniki sklasyfikowano w postaci tablicy wg jednej cechy w r wierszach i wg drugiej cechy w k kolumnach. Wnętrze tablicy niezależności stanowią liczebności n ij elementów próby, które spełniają jednocześnie kryteria zawarte w i-tym wierszu i k-tej kolumnie.

Tablica niezależności jest podstawą weryfikacji nieparametrycznej hipotezy zerowej głoszącej, że w populacji nie ma zależności między cechami (zmiennymi) X i Y.

Hipotezę tę można zapisać zgodnie z pojęciem niezależności zmiennych losowych w sposób następujący: H0; P (X = xi, Y = yj) = P (X = xi)P(Y = yj), czyli, że cechy X i Y są niezależne oraz H1; P (X = xi, Y = yj)  P (X = xi)P(Y = yj), czyli, że cechy X i Y są zależne, przy przyjętym poziomie istotności .

Do weryfikacji powyższych hipotez stosuje się statystykę  2, której wartość liczymy ze wzoru: gdzie:  n ij – liczba elementów próby,  - liczebności teoretyczne,  k – liczba kolumn tablicy niezależności,  r – liczba wierszy tablicy niezależności.

Liczebności teoretyczne oblicza się wg wzoru:  gdzie:  n ij – liczba elementów próby,  - liczebności teoretyczne,  k – liczba kolumn tablicy niezależności,  r – liczba wierszy tablicy niezależności.

Z tablic rozkładu chi-kwadrat odczytujemy wartość statystyki  2 odczytaną przy poziomie istotności  i przy (r-1)(k-1) stopniach swobody, obszar krytyczny (prawostronny) wyznacza nierówność:

Jeżeli  2   2  ; (r – 1)(k – 1)  H o odrzucamy na rzecz hipotezy alternatywnej Jeżeli  2 <  2  ; (r – 1)(k – 1)  Nie ma podstaw do odrzucenia H o o niezależności cech

Wartości chi-kwadrat zależą od:  natężenia (siły) związku badanych cech – im większe różnice między liczebnością empiryczną a teoretyczną, tym większa wartość chi-kwadrat i tym samym większa zależność między cechami,  od wielkości próby, przy czym chi-kwadrat liczymy tylko dla dużych prób,  od stopnia szczegółowości danych (przy czym w każdym polu tabeli powinno być co najmniej 5, a więc czasami trzeba łączyć wiersze lub kolumny).

Przykład 1 Do badania wybrano 500 mieszkańców Rzeszowa, których poproszono o określenie, jakiego typu programy rozrywkowe oglądają w TV - kabarety czy relacje z festiwali. Wyniki odpowiedzi respondentów zostały przedstawione w tabeli niezależności. Sprawdź, czy rodzaj oglądanych programów rozrywkowych i płeć respondenta są niezależne, przyjmując poziom istotności alfa= 0,05.

Płeć Oglądane programy RAZEM KabaretyFestiwale Mężczyzna Kobieta RAZEM

Rozpoczynamy od postawienia hipotezy zerowej i alternatywnej: H0; P (X = xi, Y = yj) = P (X = xi)P(Y = yj), czyli, że cechy X i Y są niezależne oraz H1; P (X = xi, Y = yj)  P (X = xi)P(Y = yj), czyli, że cechy X i Y są zależne,

Następnie należy obliczyć liczebności teoretyczne:

Do weryfikacji powyższych hipotez stosuje się statystykę  2, której wartość wynosi:

Z tablic rozkładu chi-kwadrat odczytujemy wartość statystyki  2 dla poziomu istotności  =0,05 i przy (2-1)(2-1) stopniach swobody, która wynosi 3,841. Ponieważ zachodzi nierówność: istnieją podstawy do odrzucenia hipotezy zerowej na rzecz hipotezy alternatywnej, czyli istnieje zależność między analizowanymi cechami.

Przykład 2 Dla zbadania przypuszczenia, iż wyjazdy na letni wypoczynek zależą od wielkości miejscowości wylosowano w sposób niezależny 200 osób. Wyniki odpowiedzi respondentów zostały przedstawione w tabeli niezależności. Na poziomie istotności 0,05 zweryfikuj hipotezę, że wyjazdy na letni wypoczynek zależą od miejsca zamieszkania.

Miejsce zamieszkania Wyjazd na letni wypoczynek Razem taknie do 30 tys. mieszkańców tys tys. mieszkańców Powyżej 100 tys. mieszkańców Razem

Rozpoczynamy od postawienia hipotezy zerowej i alternatywnej: H0; P (X = xi, Y = yj) = P (X = xi)P(Y = yj), czyli, że cechy X i Y są niezależne oraz H1; P (X = xi, Y = yj)  P (X = xi)P(Y = yj), czyli, że cechy X i Y są zależne,

Następnie należy obliczyć liczebności teoretyczne:

Do weryfikacji powyższych hipotez stosuje się statystykę  2, której wartość wynosi:

Z tablic rozkładu chi-kwadrat odczytujemy wartość statystyki  2 dla poziomu istotności  =0,05 i przy (3-1)(2-1) stopniach swobody, która wynosi 5,991. Ponieważ zachodzi nierówność: istnieją podstawy do odrzucenia hipotezy zerowej na rzecz hipotezy alternatywnej, czyli istnieje zależność między analizowanymi cechami.