Pobierz prezentację
Pobieranie prezentacji. Proszę czekać
OpublikowałMirosław Koprowski Został zmieniony 11 lat temu
1
hasło: student Szymon Drobniak pokój 3.2.1 konsultacje: wtorek 13-14 lub mailem
2
Testowanie hipotez Przyjęcie założeń
Definicja modelu – zwykle o niezależności i losowości prób. Sformułowanie hipotezy: - hipoteza zerowa (H0) - zwykle o braku różnic, braku zależności, o zgodności z rozkładem teoretycznym - hipoteza alternatywna (HA); test dwustronny: nie precyzujemy kierunku HA, test jednostronny: określony kierunek HA Przypomnę teraz schemat testowania hipotez. Jest uniwersalny i będzie się pojawiał w każdym teście statystycznym. Założenia, które muszą być spełnione – próba jest niezależna (np. nie łapiemy bocianów w parach) i losowa. Losowość – bardzo ważna – gdybyśmy chcieli wykazać że próby się różnią możemy podświadomie wybierać do pomiarów w jednej populacji większe a w drugiej mniejsze osobniki. Hipoteza STATYSTYCZNA: (analogia – jak w sądzie) – przykład na tablicy, spytać o HA. Stwierdzenie: populacje nie różnią się masą ciała/długością dzioba. Masa ciała samców nie różni się od masy ciała samic Długość dzioba jest niezależna od płci Proporcja płci jest zgodna z przewidywanym przez losowy wynik mejozy stosunkiem 1:1. Hipoteza alternatywna brzmi: Populacje się różnią, Masa ciała / długość dzioba zależy... Proporcja płci jest różna od 1:1.
3
Testowanie hipotez 2. Otrzymanie rozkładu z próby (przy założeniu H0)
3. Wyznaczenie poziomu istotności i obszaru krytycznego Zwykle poziom istotności: p=0,05 Obszar krytyczny wyznaczają tzw. wartości krytyczne obliczanej statystyki dla danego poziomu istotności, przy których odrzucamy bądź przyjmujemy H0 Teraz otrzymanie rozkładu z próby: Jest to zwykle określenie z jakim rozkładem mamy odczynienia – dopasowanie rozkładu teoretycznego do zmiennej, którą badamy. Wiecie już o rozkładzie dwumianowym, normalnym i rozkładzie t. Ważne jest aby na tym etapie określić parametry rozkładu, który cechuje naszą próbę. Tu zapytać, jakie są parametry rozkładu dwumianowego (N, p, k) i normalnego (średnia i wariancja). Określamy teraz poziom istotności, czyli powierzchnię rozkładu odpowiadającą wartościom, przy których odrzucamy H0 (narysować na tablicy). Jest to zwykle 0.05, ale to kwestia umowna. Teraz wyliczamy jaki jest obszar krytyczny. Robimy to w sposób analogiczny, w jaki liczony był przedział ufności, ale tym razem intersują nas najbardziej skrajne wartości cechy:
4
Testowanie hipotez 4. Przeprowadzenie badań i wyliczenie statystyki testu 5. Podjęcie decyzji o przyjęciu, bądź odrzuceniu H0 Błąd I rodzaju to ryzyko odrzucenia prawdziwej H0 Błąd II rodzaju to ryzyko przyjęcia fałszywej H0 Kolejnym krokiem jest sprawdzenie, czy uzyskany przez nas wynik (np. masa ciała bociana) znajduje się w obszarze krytycznym. Odpowiedź będzie od razu jednoznaczna: mieści się – wtedy Ho przyjmujemy, lub nie mieści się – wtedy odrzucamy. Jeżeli badania były bardziej skomplikowane, a hipoteza brzmiała: Populacje nie różnią się, albo Nie ma zależności między masą ciała samic i samców, wtedy konieczne jest wyliczenie statystyki testu. W końcu podejmujemy decyzję o tym, czy hipoteza była prawdziwa czy nieprawdziwa - fałszywa. Czy nie ma różnic między populacjami, czy są różnice istotne statystyczne. Tutaj są dwa pojęcia: błąd pierwszego i drugiego rodzaju. Są one związane z tym, że stale operujemy PRAWDOPODOBIENSTWAMI a zatem podejmując decyzje odnośnie Ho możemy się mylić. Błąd I rodzaju – Błąd II rodzaju –
5
w rzeczywistości H0 jest...
Testowanie hipotez Błąd I rodzaju (a): to prawdopodobieństwo odrzucenia prawdziwej H0 Błąd II rodzaju (b): to prawdopodobieństwo przyjęcia fałszywej H0 w rzeczywistości H0 jest... prawdziwa fałszywa decyzja statystyczna odrzucamy H0 błąd I rodzaju a OK przyjmujemy H0 Błąd II rodzaju b Błąd I rodzaju to prawdopodobieństwo otrzymania danego wyniku ORAZ gorszych dla hipotezy zerowej. Test dwustronny – liczymy po obu stronach rozkładu. Jednostronny – po jednej. (Zaznaczyć na tablicy).
6
Czym innym jest błąd I lub II rodzaju, a czym innym błąd standardowy.
WAŻNE!!! Czym innym jest błąd I lub II rodzaju, a czym innym błąd standardowy. Często zwrot „prawdobodobieństwo błędu” zastępuje się w sposób niezbyt precyzyjny samym słowem „błąd”. Tutaj zapytać, czy są pytania. A teraz – test proporcji piłeczek.
7
A teraz przypomnienie o rozkładzie t i przedziałach ufności
A teraz przypomnienie o rozkładzie t i przedziałach ufności. Rozkład t to jeszcze jeden rozkład teoretyczny. Wartości krytyczne t służą m.in. do obliczenia przedziału ufności dla małych prób (dla dużych można wykorzystać rozkład normalny i wartości Z). Opisać, jak brać wartości t do obliczenia 95% przedziału ufności.
8
Średnia i przedział ufności:
Masa ciała Możemy dostać takie wyniki: na tym wykresie oznaczona jest średnia i przedział ufności dla dwóch prób. Bardzo często, zanim przystąpimy do obliczeń robimy wykres... Czasem od razu widać różnice a czasem nie. Jeżeli przedziały ufności nie zachodzą, to z 95% pewnością można powiedzieć, że populacje się różnią Puszcza Białowieska Puszcza Niepołomicka
9
Średnia i przedział ufności:
Masa ciała Natomiast, jeżeli przedziały ufności pokrywają się, niekoniecznie oznacza to brak istotnych różnic. Aby sprawdzić czy różnice między średnimi są istotne należy obliczyć wspólny błąd standardowy. Puszcza Białowieska Puszcza Niepołomicka
10
wyniki z testu 1. wraz z przedziałami ufności
Wśród studentów często bywa tak, że późniejsze grupy zajęciowe mają lepsze wyniki na kolokwiach – bo np. pierwsze grupy przekazują pytania grupom kolejnym. W teście 1 zadania były takie same dla wszystkich grup, więc jeśli była wymiana informacji, to grupy III i IV rzeczywiście mogły mieć lepsze wyniki. Spójrzmy na wykres - przedstawia średnie wyniki dla poszczególnych tygodni oraz przedziały ufności dla tych średnich. Widać, że średnia z tygodnia 2 jest wyższa, ale przedziały ufności się pokrywają. Nie wiemy zatem, czy różnica jest istotna. Aby się dowiedzieć, musimy przeprowadzić test statystyczny. Za chwilę zbadamy testem t-studenta, o którym czytaliście w książce, czy grupy I i II różnią się wynikami testu od grup z tygodnia późniejszego – III i IV.
11
W jakim przedziale mieści się 95% pomiarów?
N=∞ 68,26% -SD X SD a w obrębie dwóch SD mieści się 95,46% pomiarów
12
W jakim przedziale mieści się 95% pomiarów?
1 2 3 4 5 6 7 8 9 10
13
Naszkicuj na jednym wykresie krzywe dwóch hipotetycznych rozkładów normalnych
o dużej średniej i dużym odchyleniu standardowym o małej średniej i małym odchyleniu standardowym
14
Rozkład normalny (krzywa Gaussa)
Taka sama średnia (X)
15
Rozkład normalny (krzywa Gaussa)
Takie samo odchylenie standardowe (SD)
16
Rozkład normalny (krzywa Gaussa)
Różne średnie (X) i różne odchylenia standardowe (SD)
17
Pewien student leśnictwa mierzył długości szyszek świerku w Puszczy Knyszyńskiej.
W próbie 25 szyszek średnia długość wynosiła 9 cm, a odchylenie standardowe1,5 cm. Co można powiedzieć o średniej długości szyszek świerkowych w całej Puszczy Knyszyńskiej? Jakie założenia muszą być spełnione?
18
Wybór właściwego testu
Czy intensywność karmienia piskląt w gniazdach kosa jest różna rano i wieczorem (próba – 9 gniazd kosa, każde obserwowane rano oraz wieczorem)? Czy intensywność karmienia piskląt w gniazdach kosa jest różna w Puszczy Niepołomickiej oraz Puszczy Dulowskiej? Czy samce nornicy rudej różnią się poziomem testosteronu rano oraz wieczorem? (10 samców nornicy, dla każdego pomiar poziomu hormonu rano oraz wieczorem) Czy kobiety pochodzące z 2 różnych plemion inkaskich indian różnią się poziomem estrogenu w okresie ciąży?
19
2. Średni wzrost mężczyzny w Polsce to 176 cm
z odchyleniem standardowym 7 cm, natomiast wzrost kobiet to 163 cm z odchyleniem standardowym 6 cm. kto jest stosunkowo wyższy – mężczyzna o wzroście 183cm czy kobieta o wzroście 169cm? jaki procent mężczyzn zalicza się do grupy ze wzrostem wyższym o 2,74 SD od średniej? Ile wzrostu ma taka osoba? c) jaki procent kobiet zalicza się do grupy ze wzrostem niższym o 1,50 SD od średniej? Ile wzrostu ma taka osoba? d) przy zapisach do drużyny koszykarskiej mężczyzn wymagano wzrostu 185cm. Jaki procent mężczyzn mógłby być przyjęty do drużyny?
20
Na terenie Puszczy Niepołomickiej odłowiono po 9 samców i 9 samic nornicy rudej (Clethrionomys glareolus). Po przeniesieniu do laboratorium (i po kilkudniowym okresie aklimatyzacji) u każdego osobnika zmierzono masę ciała dwa razy: rano i wieczorem.
21
Na terenie Puszczy Niepołomickiej odłowiono po 9 samców i 9 samic nornicy rudej (Clethrionomys glareolus). Po przeniesieniu do laboratorium (i po kilkudniowym okresie aklimatyzacji) u każdego osobnika zmierzono masę ciała dwa razy: rano i wieczorem. samce rano: 34, 33, 28, 30, 23, 33, 25, 19, 31 samce wieczorem: 35, 30, 26, 28, 21, 31, 24, 19, 31 samice rano: 22, 29, 20, 26, 21, 24, 32, 17, 27 samice wieczorem: 21, 27, 18, 24, 21, 23, 34, 16, 28 Użyj odpowiedniego testu (dla par wiązanych lub dla pomiarów niezależnych), aby odpowiedzieć na poniższe pytania: czy samce różniły się od samic średnią masą ciała zmierzoną rano? czy różnica między średnią masą ciała samców mierzoną rano i wieczorem była istotna?
22
7(?) Długość stopy nornicy rudej Clethrionomys glareolus
w Puszczy Niepołomickiej ma rozkład normalny ze średnią i odchyleniem standardowym 15,8 ± 1,9 mm narysuj rozkład tej cechy w populacji. Zaznacz wartość średnią i SD; pod osią X zaznacz wartości rzeczywiste, a nad osią standaryzowane. b) pewna nornica miała stopę o długości 16,5 mm. Oblicz standaryzowaną wartość tej długości i oznacz ją na wykresie. Co oznacza ten wynik? c*) z jakim prawdopodobieństwem napotkamy w tej populacji osobnika mającego stopę krótszą niż 14,3 mm, a z jakim dłuższą niż 12,5 mm? d*) jaki procent nornic zalicza się do grupy o stopie dłuższej o 1,5 odchylenia standardowego od średniej. Jaką długość stopy ma taki osobnik?
23
Przeprowadzono doświadczenie mające na celu zbadanie wpływu chlorpiryfosu (pestycyd) na wzrost siewek sosny Pinus silvestris. Do eksperymentu wybrano 50 roślin w tym samym wieku, które po połowie rozdzielono do zabiegu eksperymentalnego (E) i kontrolnego (K). Otrzymano następujące wyniki: dla E:X=14,2, Σx2=250,93, s2=28,9 dla K:X=17,4, Σx2 =276,23, s2=32,4 Jaki test wybierzesz, jaka będzie statystyka testu, decyzja i błąd I rodzaju, jeżeli: a) wariancje w obu zabiegach są homogeniczne b) wariancje w obu zabiegach nie są homogeniczne c) w obu zabiegach użyto po 100 roślin a wariancje są homogeniczne
Podobne prezentacje
© 2024 SlidePlayer.pl Inc.
All rights reserved.