Przeprowadzenie badań niewyczerpujących, (częściowych – prowadzonych na podstawie próby losowej), nie daje podstaw do formułowania stanowczych stwierdzeń.

Slides:

Advertisements

Podobne prezentacje

Regresja i korelacja materiały dydaktyczne.

Advertisements

Badania statystyczne Wykłady 1-2 © Leszek Smolarek.

ESTYMACJA PRZEDZIAŁOWA

Test zgodności c2.

PODZIAŁ STATYSTYKI STATYSTYKA STATYSTYKA MATEMATYCZNA STATYSTYKA

Rangowy test zgodności rozkładów

Analiza współzależności zjawisk

Analiza wariancji jednoczynnikowa

BUDOWA MODELU EKONOMETRYCZNEGO

Test zgodności Joanna Tomanek i Piotr Nowak.

ANALIZA WSPÓŁZALEŻNOŚCI

Powinien być określony w sposób zwięzły i precyzyjny, np

Opinie, przekonania, stereotypy

Analiza wariancji Analiza wariancji (ANOVA) stanowi rozszerzenie testu t-Studenta w przypadku porównywanie większej liczby grup. Podział na grupy (czyli.

Wnioskowanie statystyczne CZEŚĆ III

Statystyka w doświadczalnictwie

Statystyka w doświadczalnictwie

Wykład 7 Przedział ufności dla 1 – 2

Metody Przetwarzania Danych Meteorologicznych Wykład 4

Pobieranie próby Populacja generalna: zbiór wyników wszystkich możliwych doświadczeń określonego typu. Próba n-wymiarowa: zbiór n wyników doświadczeń.

Próby niezależne versus próby zależne

Porównywanie średnich dwóch prób zależnych

Rozkład normalny Cecha posiada rozkład normalny jeśli na jej wielkość ma wpływ wiele niezależnych czynników, a wpływ każdego z nich nie jest zbyt duży.

Wykład 4. Rozkłady teoretyczne

Testy nieparametryczne

Test nieparametryczny

Hipotezy statystyczne

Analiza wariancji jednoczynnikowa

Analiza wariancji.

Testy nieparametryczne

Konstrukcja, estymacja parametrów

Testowanie hipotez statystycznych

Hipotezy statystyczne

Elementy Rachunku Prawdopodobieństwa i Statystyki

Testy nieparametryczne

Analiza reszt w regresji

BADANIE STATYSTYCZNE Badanie statystyczne to proces pozyskiwania danych na temat rozkładu cechy statystycznej w populacji. Badanie może mieć charakter:

Analiza wariancji jednoczynnikowa.

Testy nieparametryczne

Modelowanie ekonometryczne

Hipotezy statystyczne

Finanse 2009/2010 dr Grzegorz Szafrański pokój B106 Termin konsultacji poniedziałek:

Kilka wybranych uzupelnień

Planowanie badań i analiza wyników

Testy statystycznej istotności

Seminarium licencjackie Beata Kapuścińska

Testowanie hipotez statystycznych

Co to jest dystrybuanta?

Wnioskowanie statystyczne

Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych dr hab. Mieczysław Kowerski

Testowanie hipotez Jacek Szanduła.

STATYSTYKA sposób na opisanie zjawisk masowych Mirosław Sadowski TRANSGRANICZNY UNIWERSYTET TRZECIEGO WIEKU W ZGORZELCU.

Statystyczna analiza danych

STATYSTYKA – kurs podstawowy wykład 9 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.

Monte Carlo, bootstrap, jacknife. 2 Literatura Bruce Hansen (2012 +) Econometrics, ze strony internetowej :

Testy nieparametryczne – testy zgodności. Nieparametryczne testy istotności dzielimy na trzy zasadnicze grupy: testy zgodności, testy niezależności oraz.

STATYSTYKA – kurs podstawowy wykład 7 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.

Rozkłady statystyk z próby dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium.

Estymacja parametrów populacji. Estymacja polega na szacowaniu wartości parametrów rozkładu lub postaci samego rozkładu zmiennej losowej, na podstawie.

STATYSTYKA – kurs podstawowy wykład 6 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.

Weryfikacja hipotez statystycznych „Człowiek – najlepsza inwestycja”

Estymacja parametryczna dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium Analiz.

Wnioskowanie statystyczne. Próbkowanie (sampling)

Testy nieparametryczne

Statystyka matematyczna

Wnioskowanie statystyczne Weryfikacja hipotez statystycznych

Analiza współzależności zjawisk

Monte Carlo, bootstrap, jacknife

Zapis prezentacji:

Przeprowadzenie badań niewyczerpujących, (częściowych – prowadzonych na podstawie próby losowej), nie daje podstaw do formułowania stanowczych stwierdzeń dotyczących badanych zmiennych losowych. Daje jednak wystarczające podstawy do stawiania oraz weryfikowania różnego rodzaju przypuszczeń dotyczących zarówno klasy rozkładu, jak i jego parametrów. Tego rodzaju przypuszczenia nazywamy hipotezami statystycznymi.

Hipotezy, które dotyczą parametrów nazywać będziemy hipotezami parametrycznymi, zaś takie, które dotyczą klasy rozkładu zmiennej – a więc funkcyjnej postaci dystrybuanty nazywać będziemy hipotezami nieparametrycznymi. Procedury mające na celu sprawdzenie tak sformułowanych hipotez nazywać będziemy testami statystycznymi i odpowiednio do sprawdzanych hipotez wyróżniamy testy parametryczne oraz nieparametryczne.

Procedura przeprowadzenia testu sprowadza się, najprościej mówiąc, do postawienia hipotezy statystycznej, wyboru statystyki testowej (kryterium danego testu) oraz poziomu istotności testu. Najczęściej poziom istotności testu jest oznaczany jako alfa i oznacza prawdopodobieństwo popełnienia błędu pierwszego rodzaju (który polega na odrzuceniu sądu właściwego, przy czym prawdopodobieństwo przyjęcia sądu błędnego oznaczane jest jako beta - czyli błąd drugiego rodzaju).

Test niezależności chi-kwadrat stosowany jest w przypadku badania niezależności cech niemierzalnych (jakościowych) lub w przypadku badania niezależności cechy jakościowej z ilościową.

Załóżmy, że przedmiotem badania jest populacja generalna. Z populacji tej pobrano n-elementową próbę (przy czym ważne jest, by n>30), której wyniki sklasyfikowano w postaci tablicy wg jednej cechy w r wierszach i wg drugiej cechy w k kolumnach. Wnętrze tablicy niezależności stanowią liczebności n ij elementów próby, które spełniają jednocześnie kryteria zawarte w i-tym wierszu i k-tej kolumnie.

Tablica niezależności jest podstawą weryfikacji nieparametrycznej hipotezy zerowej głoszącej, że w populacji nie ma zależności między cechami (zmiennymi) X i Y.

Hipotezę tę można zapisać zgodnie z pojęciem niezależności zmiennych losowych w sposób następujący: H0; P (X = xi, Y = yj) = P (X = xi)P(Y = yj), czyli, że cechy X i Y są niezależne oraz H1; P (X = xi, Y = yj)  P (X = xi)P(Y = yj), czyli, że cechy X i Y są zależne, przy przyjętym poziomie istotności .

Do weryfikacji powyższych hipotez stosuje się statystykę  2, której wartość liczymy ze wzoru: gdzie:  n ij – liczba elementów próby,  - liczebności teoretyczne,  k – liczba kolumn tablicy niezależności,  r – liczba wierszy tablicy niezależności.

Liczebności teoretyczne oblicza się wg wzoru:  gdzie:  n ij – liczba elementów próby,  - liczebności teoretyczne,  k – liczba kolumn tablicy niezależności,  r – liczba wierszy tablicy niezależności.

Z tablic rozkładu chi-kwadrat odczytujemy wartość statystyki  2 odczytaną przy poziomie istotności  i przy (r-1)(k-1) stopniach swobody, obszar krytyczny (prawostronny) wyznacza nierówność:

Jeżeli  2   2  ; (r – 1)(k – 1)  H o odrzucamy na rzecz hipotezy alternatywnej Jeżeli  2 <  2  ; (r – 1)(k – 1)  Nie ma podstaw do odrzucenia H o o niezależności cech

Wartości chi-kwadrat zależą od:  natężenia (siły) związku badanych cech – im większe różnice między liczebnością empiryczną a teoretyczną, tym większa wartość chi-kwadrat i tym samym większa zależność między cechami,  od wielkości próby, przy czym chi-kwadrat liczymy tylko dla dużych prób,  od stopnia szczegółowości danych (przy czym w każdym polu tabeli powinno być co najmniej 5, a więc czasami trzeba łączyć wiersze lub kolumny).

Przykład 1 Do badania wybrano 500 mieszkańców Rzeszowa, których poproszono o określenie, jakiego typu programy rozrywkowe oglądają w TV - kabarety czy relacje z festiwali. Wyniki odpowiedzi respondentów zostały przedstawione w tabeli niezależności. Sprawdź, czy rodzaj oglądanych programów rozrywkowych i płeć respondenta są niezależne, przyjmując poziom istotności alfa= 0,05.

Płeć Oglądane programy RAZEM KabaretyFestiwale Mężczyzna Kobieta RAZEM

Rozpoczynamy od postawienia hipotezy zerowej i alternatywnej: H0; P (X = xi, Y = yj) = P (X = xi)P(Y = yj), czyli, że cechy X i Y są niezależne oraz H1; P (X = xi, Y = yj)  P (X = xi)P(Y = yj), czyli, że cechy X i Y są zależne,

Następnie należy obliczyć liczebności teoretyczne:

Do weryfikacji powyższych hipotez stosuje się statystykę  2, której wartość wynosi:

Z tablic rozkładu chi-kwadrat odczytujemy wartość statystyki  2 dla poziomu istotności  =0,05 i przy (2-1)(2-1) stopniach swobody, która wynosi 3,841. Ponieważ zachodzi nierówność: istnieją podstawy do odrzucenia hipotezy zerowej na rzecz hipotezy alternatywnej, czyli istnieje zależność między analizowanymi cechami.

Przykład 2 Dla zbadania przypuszczenia, iż wyjazdy na letni wypoczynek zależą od wielkości miejscowości wylosowano w sposób niezależny 200 osób. Wyniki odpowiedzi respondentów zostały przedstawione w tabeli niezależności. Na poziomie istotności 0,05 zweryfikuj hipotezę, że wyjazdy na letni wypoczynek zależą od miejsca zamieszkania.

Miejsce zamieszkania Wyjazd na letni wypoczynek Razem taknie do 30 tys. mieszkańców tys tys. mieszkańców Powyżej 100 tys. mieszkańców Razem

Rozpoczynamy od postawienia hipotezy zerowej i alternatywnej: H0; P (X = xi, Y = yj) = P (X = xi)P(Y = yj), czyli, że cechy X i Y są niezależne oraz H1; P (X = xi, Y = yj)  P (X = xi)P(Y = yj), czyli, że cechy X i Y są zależne,

Następnie należy obliczyć liczebności teoretyczne:

Do weryfikacji powyższych hipotez stosuje się statystykę  2, której wartość wynosi:

Z tablic rozkładu chi-kwadrat odczytujemy wartość statystyki  2 dla poziomu istotności  =0,05 i przy (3-1)(2-1) stopniach swobody, która wynosi 5,991. Ponieważ zachodzi nierówność: istnieją podstawy do odrzucenia hipotezy zerowej na rzecz hipotezy alternatywnej, czyli istnieje zależność między analizowanymi cechami.