hasło: student Szymon Drobniak pokój 3.2.1 konsultacje: wtorek 13-14

Slides:



Advertisements
Podobne prezentacje
Test zgodności c2.
Advertisements

Joanna Sawicka Wydział Nauk Ekonomicznych, Uniwersytet Warszawski
hasło: student Justyna Kubacka
Wykład 9 Analiza wariancji (ANOVA)
Analiza wariancji jednoczynnikowa
Analiza wariancji Marcin Zajenkowski. Badania eksperymentalne ANOVA najczęściej do eksperymentów Porównanie wyników z 2 grup lub więcej Zmienna niezależna.
BUDOWA MODELU EKONOMETRYCZNEGO
Test zgodności Joanna Tomanek i Piotr Nowak.
Opinie, przekonania, stereotypy
Wnioskowanie statystyczne CZEŚĆ III
Statystyka w doświadczalnictwie
hasło: student Joanna Rutkowska Aneta Arct
BIOSTATYSTYKA I METODY DOKUMENTACJI
Niepewności przypadkowe
Wykład 7 Przedział ufności dla 1 – 2
Wykład 6 Standardowy błąd średniej a odchylenie standardowe z próby
Wykład 4 Rozkład próbkowy dla średniej z rozkładu normalnego
Wykład 8 Testy Studenta Jest kilka różnych testów Studenta. Mają one podobną strukturę ale służą do testowania różnych hipotez i różnią się nieco postacią.
Wykład 5 Przedziały ufności
Wykład 3 Rozkład próbkowy dla średniej z rozkładu normalnego
Wykład 11 Analiza wariancji (ANOVA)
Test t-studenta dla pojedynczej próby
Próby niezależne versus próby zależne
Porównywanie średnich dwóch prób zależnych
Wzory ułatwiające obliczenia
Rozkład normalny Cecha posiada rozkład normalny jeśli na jej wielkość ma wpływ wiele niezależnych czynników, a wpływ każdego z nich nie jest zbyt duży.
UKŁADY SZEREGOWO-RÓWNOLEGŁE
Wykład 4. Rozkłady teoretyczne
Testy nieparametryczne
Analiza wariancji.
Estymacja przedziałowa i korzystanie z tablic rozkładów statystycznych
Rozkład t.
Hipotezy statystyczne
Analiza wariancji jednoczynnikowa
Analiza wariancji.
Testy nieparametryczne
Analiza współzależności cech statystycznych
Testy nieparametryczne
BADANIE STATYSTYCZNE Badanie statystyczne to proces pozyskiwania danych na temat rozkładu cechy statystycznej w populacji. Badanie może mieć charakter:
Testy nieparametryczne
Elementy Rachunku Prawdopodobieństwa i Statystyki
Modelowanie ekonometryczne
Hipotezy statystyczne
Statystyka - to „nie boli”
Planowanie badań i analiza wyników
Testy statystycznej istotności
Ekonometryczne modele nieliniowe
Seminarium licencjackie Beata Kapuścińska
Testowanie hipotez statystycznych
Ekonometryczne modele nieliniowe
Wnioskowanie statystyczne
STATYSTYKA Pochodzenie nazwy:
Weryfikacja hipotez statystycznych
Przenoszenie błędów (rachunek błędów) Niech x=(x 1,x 2,...,x n ) będzie n-wymiarową zmienną losową złożoną z niezależnych składników o rozkładach normalnych.
Weryfikacja hipotez statystycznych dr hab. Mieczysław Kowerski
Testowanie hipotez Jacek Szanduła.
Przeprowadzenie badań niewyczerpujących, (częściowych – prowadzonych na podstawie próby losowej), nie daje podstaw do formułowania stanowczych stwierdzeń.
ze statystyki opisowej
Testy nieparametryczne – testy zgodności. Nieparametryczne testy istotności dzielimy na trzy zasadnicze grupy: testy zgodności, testy niezależności oraz.
STATYSTYKA – kurs podstawowy wykład 7 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Rozkłady statystyk z próby dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium.
Estymacja parametrów populacji. Estymacja polega na szacowaniu wartości parametrów rozkładu lub postaci samego rozkładu zmiennej losowej, na podstawie.
STATYSTYKA – kurs podstawowy wykład 6 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Weryfikacja hipotez statystycznych „Człowiek – najlepsza inwestycja”
Wnioskowanie statystyczne. Próbkowanie (sampling)
Testy nieparametryczne
Statystyka matematyczna
Wnioskowanie statystyczne Weryfikacja hipotez statystycznych
Analiza niepewności pomiarów Zagadnienia statystyki matematycznej
Test t-studenta dla pojedynczej próby
Zapis prezentacji:

www.eko.uj.edu.pl/statystyka hasło: student Szymon Drobniak szymek.drobniak@uj.edu.pl pokój 3.2.1 konsultacje: wtorek 13-14 lub mailem

Testowanie hipotez Przyjęcie założeń Definicja modelu – zwykle o niezależności i losowości prób. Sformułowanie hipotezy: - hipoteza zerowa (H0) - zwykle o braku różnic, braku zależności, o zgodności z rozkładem teoretycznym - hipoteza alternatywna (HA); test dwustronny: nie precyzujemy kierunku HA, test jednostronny: określony kierunek HA Przypomnę teraz schemat testowania hipotez. Jest uniwersalny i będzie się pojawiał w każdym teście statystycznym. Założenia, które muszą być spełnione – próba jest niezależna (np. nie łapiemy bocianów w parach) i losowa. Losowość – bardzo ważna – gdybyśmy chcieli wykazać że próby się różnią możemy podświadomie wybierać do pomiarów w jednej populacji większe a w drugiej mniejsze osobniki. Hipoteza STATYSTYCZNA: (analogia – jak w sądzie) – przykład na tablicy, spytać o HA. Stwierdzenie: populacje nie różnią się masą ciała/długością dzioba. Masa ciała samców nie różni się od masy ciała samic Długość dzioba jest niezależna od płci Proporcja płci jest zgodna z przewidywanym przez losowy wynik mejozy stosunkiem 1:1. Hipoteza alternatywna brzmi: Populacje się różnią, Masa ciała / długość dzioba zależy... Proporcja płci jest różna od 1:1.

Testowanie hipotez 2. Otrzymanie rozkładu z próby (przy założeniu H0) 3. Wyznaczenie poziomu istotności i obszaru krytycznego Zwykle poziom istotności: p=0,05 Obszar krytyczny wyznaczają tzw. wartości krytyczne obliczanej statystyki dla danego poziomu istotności, przy których odrzucamy bądź przyjmujemy H0 Teraz otrzymanie rozkładu z próby: Jest to zwykle określenie z jakim rozkładem mamy odczynienia – dopasowanie rozkładu teoretycznego do zmiennej, którą badamy. Wiecie już o rozkładzie dwumianowym, normalnym i rozkładzie t. Ważne jest aby na tym etapie określić parametry rozkładu, który cechuje naszą próbę. Tu zapytać, jakie są parametry rozkładu dwumianowego (N, p, k) i normalnego (średnia i wariancja). Określamy teraz poziom istotności, czyli powierzchnię rozkładu odpowiadającą wartościom, przy których odrzucamy H0 (narysować na tablicy). Jest to zwykle 0.05, ale to kwestia umowna. Teraz wyliczamy jaki jest obszar krytyczny. Robimy to w sposób analogiczny, w jaki liczony był przedział ufności, ale tym razem intersują nas najbardziej skrajne wartości cechy:

Testowanie hipotez 4. Przeprowadzenie badań i wyliczenie statystyki testu 5. Podjęcie decyzji o przyjęciu, bądź odrzuceniu H0 Błąd I rodzaju to ryzyko odrzucenia prawdziwej H0 Błąd II rodzaju to ryzyko przyjęcia fałszywej H0 Kolejnym krokiem jest sprawdzenie, czy uzyskany przez nas wynik (np. masa ciała bociana) znajduje się w obszarze krytycznym. Odpowiedź będzie od razu jednoznaczna: mieści się – wtedy Ho przyjmujemy, lub nie mieści się – wtedy odrzucamy. Jeżeli badania były bardziej skomplikowane, a hipoteza brzmiała: Populacje nie różnią się, albo Nie ma zależności między masą ciała samic i samców, wtedy konieczne jest wyliczenie statystyki testu. W końcu podejmujemy decyzję o tym, czy hipoteza była prawdziwa czy nieprawdziwa - fałszywa. Czy nie ma różnic między populacjami, czy są różnice istotne statystyczne. Tutaj są dwa pojęcia: błąd pierwszego i drugiego rodzaju. Są one związane z tym, że stale operujemy PRAWDOPODOBIENSTWAMI a zatem podejmując decyzje odnośnie Ho możemy się mylić. Błąd I rodzaju – Błąd II rodzaju –

w rzeczywistości H0 jest... Testowanie hipotez Błąd I rodzaju (a): to prawdopodobieństwo odrzucenia prawdziwej H0 Błąd II rodzaju (b): to prawdopodobieństwo przyjęcia fałszywej H0 w rzeczywistości H0 jest... prawdziwa fałszywa decyzja statystyczna odrzucamy H0 błąd I rodzaju a OK przyjmujemy H0 Błąd II rodzaju b Błąd I rodzaju to prawdopodobieństwo otrzymania danego wyniku ORAZ gorszych dla hipotezy zerowej. Test dwustronny – liczymy po obu stronach rozkładu. Jednostronny – po jednej. (Zaznaczyć na tablicy).

Czym innym jest błąd I lub II rodzaju, a czym innym błąd standardowy. WAŻNE!!! Czym innym jest błąd I lub II rodzaju, a czym innym błąd standardowy. Często zwrot „prawdobodobieństwo błędu” zastępuje się w sposób niezbyt precyzyjny samym słowem „błąd”. Tutaj zapytać, czy są pytania. A teraz – test proporcji piłeczek.

A teraz przypomnienie o rozkładzie t i przedziałach ufności A teraz przypomnienie o rozkładzie t i przedziałach ufności. Rozkład t to jeszcze jeden rozkład teoretyczny. Wartości krytyczne t służą m.in. do obliczenia przedziału ufności dla małych prób (dla dużych można wykorzystać rozkład normalny i wartości Z). Opisać, jak brać wartości t do obliczenia 95% przedziału ufności.

Średnia i przedział ufności: Masa ciała Możemy dostać takie wyniki: na tym wykresie oznaczona jest średnia i przedział ufności dla dwóch prób. Bardzo często, zanim przystąpimy do obliczeń robimy wykres... Czasem od razu widać różnice a czasem nie. Jeżeli przedziały ufności nie zachodzą, to z 95% pewnością można powiedzieć, że populacje się różnią Puszcza Białowieska Puszcza Niepołomicka

Średnia i przedział ufności: Masa ciała Natomiast, jeżeli przedziały ufności pokrywają się, niekoniecznie oznacza to brak istotnych różnic. Aby sprawdzić czy różnice między średnimi są istotne należy obliczyć wspólny błąd standardowy. Puszcza Białowieska Puszcza Niepołomicka

wyniki z testu 1. wraz z przedziałami ufności Wśród studentów często bywa tak, że późniejsze grupy zajęciowe mają lepsze wyniki na kolokwiach – bo np. pierwsze grupy przekazują pytania grupom kolejnym. W teście 1 zadania były takie same dla wszystkich grup, więc jeśli była wymiana informacji, to grupy III i IV rzeczywiście mogły mieć lepsze wyniki. Spójrzmy na wykres - przedstawia średnie wyniki dla poszczególnych tygodni oraz przedziały ufności dla tych średnich. Widać, że średnia z tygodnia 2 jest wyższa, ale przedziały ufności się pokrywają. Nie wiemy zatem, czy różnica jest istotna. Aby się dowiedzieć, musimy przeprowadzić test statystyczny. Za chwilę zbadamy testem t-studenta, o którym czytaliście w książce, czy grupy I i II różnią się wynikami testu od grup z tygodnia późniejszego – III i IV.

W jakim przedziale mieści się 95% pomiarów? N=∞ 68,26% -SD X SD -1 0 1 a w obrębie dwóch SD mieści się 95,46% pomiarów

W jakim przedziale mieści się 95% pomiarów? 1 2 3 4 5 6 7 8 9 10

Naszkicuj na jednym wykresie krzywe dwóch hipotetycznych rozkładów normalnych o dużej średniej i dużym odchyleniu standardowym o małej średniej i małym odchyleniu standardowym

Rozkład normalny (krzywa Gaussa) Taka sama średnia (X)

Rozkład normalny (krzywa Gaussa) Takie samo odchylenie standardowe (SD)

Rozkład normalny (krzywa Gaussa) Różne średnie (X) i różne odchylenia standardowe (SD)

Pewien student leśnictwa mierzył długości szyszek świerku w Puszczy Knyszyńskiej. W próbie 25 szyszek średnia długość wynosiła 9 cm, a odchylenie standardowe1,5 cm. Co można powiedzieć o średniej długości szyszek świerkowych w całej Puszczy Knyszyńskiej? Jakie założenia muszą być spełnione?

Wybór właściwego testu Czy intensywność karmienia piskląt w gniazdach kosa jest różna rano i wieczorem (próba – 9 gniazd kosa, każde obserwowane rano oraz wieczorem)? Czy intensywność karmienia piskląt w gniazdach kosa jest różna w Puszczy Niepołomickiej oraz Puszczy Dulowskiej? Czy samce nornicy rudej różnią się poziomem testosteronu rano oraz wieczorem? (10 samców nornicy, dla każdego pomiar poziomu hormonu rano oraz wieczorem) Czy kobiety pochodzące z 2 różnych plemion inkaskich indian różnią się poziomem estrogenu w okresie ciąży?

2. Średni wzrost mężczyzny w Polsce to 176 cm z odchyleniem standardowym 7 cm, natomiast wzrost kobiet to 163 cm z odchyleniem standardowym 6 cm. kto jest stosunkowo wyższy – mężczyzna o wzroście 183cm czy kobieta o wzroście 169cm? jaki procent mężczyzn zalicza się do grupy ze wzrostem wyższym o 2,74 SD od średniej? Ile wzrostu ma taka osoba? c) jaki procent kobiet zalicza się do grupy ze wzrostem niższym o 1,50 SD od średniej? Ile wzrostu ma taka osoba? d) przy zapisach do drużyny koszykarskiej mężczyzn wymagano wzrostu 185cm. Jaki procent mężczyzn mógłby być przyjęty do drużyny?

Na terenie Puszczy Niepołomickiej odłowiono po 9 samców i 9 samic nornicy rudej (Clethrionomys glareolus). Po przeniesieniu do laboratorium (i po kilkudniowym okresie aklimatyzacji) u każdego osobnika zmierzono masę ciała dwa razy: rano i wieczorem.

Na terenie Puszczy Niepołomickiej odłowiono po 9 samców i 9 samic nornicy rudej (Clethrionomys glareolus). Po przeniesieniu do laboratorium (i po kilkudniowym okresie aklimatyzacji) u każdego osobnika zmierzono masę ciała dwa razy: rano i wieczorem. samce rano: 34, 33, 28, 30, 23, 33, 25, 19, 31 samce wieczorem: 35, 30, 26, 28, 21, 31, 24, 19, 31 samice rano: 22, 29, 20, 26, 21, 24, 32, 17, 27 samice wieczorem: 21, 27, 18, 24, 21, 23, 34, 16, 28 Użyj odpowiedniego testu (dla par wiązanych lub dla pomiarów niezależnych), aby odpowiedzieć na poniższe pytania: czy samce różniły się od samic średnią masą ciała zmierzoną rano? czy różnica między średnią masą ciała samców mierzoną rano i wieczorem była istotna?

7(?) Długość stopy nornicy rudej Clethrionomys glareolus w Puszczy Niepołomickiej ma rozkład normalny ze średnią i odchyleniem standardowym 15,8 ± 1,9 mm narysuj rozkład tej cechy w populacji. Zaznacz wartość średnią i SD; pod osią X zaznacz wartości rzeczywiste, a nad osią standaryzowane. b) pewna nornica miała stopę o długości 16,5 mm. Oblicz standaryzowaną wartość tej długości i oznacz ją na wykresie. Co oznacza ten wynik? c*) z jakim prawdopodobieństwem napotkamy w tej populacji osobnika mającego stopę krótszą niż 14,3 mm, a z jakim dłuższą niż 12,5 mm? d*) jaki procent nornic zalicza się do grupy o stopie dłuższej o 1,5 odchylenia standardowego od średniej. Jaką długość stopy ma taki osobnik?

Przeprowadzono doświadczenie mające na celu zbadanie wpływu chlorpiryfosu (pestycyd) na wzrost siewek sosny Pinus silvestris. Do eksperymentu wybrano 50 roślin w tym samym wieku, które po połowie rozdzielono do zabiegu eksperymentalnego (E) i kontrolnego (K). Otrzymano następujące wyniki: dla E:X=14,2, Σx2=250,93, s2=28,9 dla K:X=17,4, Σx2 =276,23, s2=32,4 Jaki test wybierzesz, jaka będzie statystyka testu, decyzja i błąd I rodzaju, jeżeli: a) wariancje w obu zabiegach są homogeniczne b) wariancje w obu zabiegach nie są homogeniczne c) w obu zabiegach użyto po 100 roślin a wariancje są homogeniczne