Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

Wykład 11 Analiza wariancji (ANOVA) Sposób analizy danych gdy mamy więcej niż dwa zabiegi lub populacje. Omówimy ANOV-ę w najprostszej postaci. Te same.

Коpie: 1
Wykład 11 Analiza wariancji (ANOVA) Sposób analizy danych gdy mamy więcej niż dwa zabiegi lub populacje. Omówimy ANOV-ę w najprostszej postaci. Te same.

Podobne prezentacje


Prezentacja na temat: "Wykład 11 Analiza wariancji (ANOVA) Sposób analizy danych gdy mamy więcej niż dwa zabiegi lub populacje. Omówimy ANOV-ę w najprostszej postaci. Te same."— Zapis prezentacji:

1 Wykład 11 Analiza wariancji (ANOVA) Sposób analizy danych gdy mamy więcej niż dwa zabiegi lub populacje. Omówimy ANOV-ę w najprostszej postaci. Te same podstawowe założenia/ograniczenia co przy teście Studenta W każdej populacji badana cecha ma rozkład normalny Obserwacje są niezależne i losowe Będziemy testowali hipotezy o średnich w populacjach i Założenie – standardowe odchylenia badanej cechy w każdej populacji są sobie równe (podobne) więc możemy użyć uśrednionego SE

2 Uwaga: ANOVA może być stosowana także gdy próby nie są niezależne Np. W układzie zrandomizowanym blokowym (zasada podobna do testu Studenta dla powiązanych par) Nie będziemy tego omawiać. Omówimy tylko układy zupełne zrandomizowane. Cel: Testujemy hipotezy postaci: H 0 : 1 = 2 = 3 = … = k H A : nie wszystkie średnie są równe

3 Dlaczego nie stosujemy wielu testów Studenta? Wielokrotne porównania –P-stwo błędu pierwszego rodzaju (p - stwo odrzucenia prawdziwej hipotezy) jest trudne do kontrolowania)

4 Korekta Bonferoniego –Prosta ale na ogół konserwatywna (p-stwo błędu pierwszego rodzaju mniejsze niż założone – strata mocy).

5 Estymacja błędu standardowego –ANOVA wykorzystuje informację zawartą we wszystkich obserwacjach: zwykle daje większą precyzję

6 Notacja: k = 3 zabiegi (próby, grupy) Zabieg 1Zabieg 2Zabieg średnia SS423246

7 Trzy rodzaje rachunków: Wewnątrz grup, pomiędzy grupami, całkowite. Liczymy trzy wartości: SS, df, MS SSdfMS Between Within Total

8 Notacja: k = # grup (prób, zabiegów)k = n 1, n 2, n 3, …, n k = rozmiary grup (# obserwacji) n 1 =, n 2 =, n 3 = y 1, y 2, … y k = średnie w grupach y 1 =, y 2 =, y 3 = = całkowita średnia n* = całkowita liczba obserwacjin* =

9 Dwa podstawowe typy rachunków: (gdzie konieczne, będziemy używali i do indeksowania grup a j do indeksowania obserwacji w każdej grupie : y ij ) Wewnątrz każdej grupy oznacza sumę ``wewnątrz grupy

10 Uwzględniające wszystkie grupy oznacza sumę we wszystkich grupach np. n* = i

11 UWAGA: Gdy rozmiary prób nie są równe nie jest średnią z k średnich!!! Ale można ją obliczyć jako = (n 1 y 1 + n 2 y 2 + …+n 3 y 3 ) / n*

12 Wewnątrz grup (wypełniamy drugi rząd w tabeli) Suma kwadratów wewnątrz grup (SSW) Liczymy SS wewnątrz każdej grupy (itd. - SS 2, SS 3, …) SS 1 = SS 2 = … = 32, SS 3 = … = 46

13 SSW = SS 1 +SS 2 +…+SS k = SSW = Stopnie swobody wewnątrz grup: dfw = n* - k dfw = Średnia suma kwadratów wewnątrz grup MSW = SSW / dfw MSW = To samo co uśredniona wariancja Dla przypomnienia dla dwóch prób

14 Uśrednione standardowe odchylenie sc = Pomiędzy grupami (wypełniamy pierwszy rząd tabeli) Porównujemy średnie grupowe do średniej całkowitej Ważone przez rozmiar grupy Suma kwadratów pomiędzy grupami (SSB) SSB =

15 Stopnie swobody pomiędzy grupami (dfb) dfb = k – 1 dfb = Średnia suma kwadratów pomiędzy grupami (MSB) MSB = SSB/dfb MSB = Całkowite Całkowita suma kwadratów (SST) SST= SST= … =348

16 Uwaga: SST = SSW+SSB 348 = Zwykle nie trzeba liczyć SST z definicji Całkowita liczba stopni swobody (dft) dft = n* – 1 dft = Uwaga: dft = dfb+dfw 10 = 2 + 8

17 Tablica ANOV-y SSdfMS Between Within Total

18 Ta tabela będzie dostępna na kolokwium i egzaminie: SSdfMS Pomiędzy SSB= dfb = k – 1SSB/dfb Wewnątrz SSW=dfw = n* – kSSW/dfw Całkowite SST= dft = n* – 1

19 Test F Dane dla k 2 populacji lub zabiegów są niezależne Dane w każdej populacji mają rozkład normalny ze średnią i dla populacji i, i tym samym odchyleniem standardowym

20 Testujemy H 0 : 1 = 2 = 3 = … = k (wszystkie średnie są sobie równe) vs. H A : nie wszystkie średnie są sobie równe (H A jest niekierunkowa ale obszar odrzuceń będzie jednostronny) Kroki: Obliczenie tabeli ANOV-y Testowanie

21 Jak opisać F test Zdefinować wszystkie H 0 podać za pomocą wzoru i słownie H A tylko słownie Statystyka testowa F s = MSB/MSW przy H 0, F s ma rozkład Snedecora z dfb, dfw stopniami swobody Na kolejnych slajdach podane są wartości krytyczne z książki D.S. Moore i G. P. McCabe ``Introduction to the Practice of Statistics "numerator df" = dfb i "denominator df" = dfw.

22

23

24

25

26 Odrzucamy H 0 gdy zaobserwowane F s > F krytyczne Przykładowy wniosek - Na poziomie istotności α (nie) mamy przesłanki aby twierdzić, że grupy różnią się poziomem badanej cechy.

27 Przykład: Losową próbę 15 zdrowych mężczyzn podzielono losowo na 3 grupy składające się z 5 mężczyzn. Przez tydzień otrzymywali oni lekarstwo Paxil w dawkach 0, 20 i 40 mg dziennie. Po tym czasie zmierzono im poziom serotoniny. Czy Paxil wpływa na poziom serotoniny u zdrowych, młodych mężczyzn ? Niech 1 będzie średnim poziomem serotoniny u mężczyzn przyjmujących 0 mg Paxilu. Niech 2 będzie średnim poziomem serotoniny u mężczyzn przyjmujących 20 mg Paxilu. Niech 3 będzie średnim poziomem serotoniny u mężczyzn przyjmujących 40 mg Paxilu.

28 H 0 : 1 = 2 = 3 ; średni poziom serotoniny nie zależy od dawki Paxilu H A : średni poziom serotoniny nie jest ten sam we wszystkich grupach (albo średni poziom serotoniny zależy od dawki Paxilu). Zastosujemy F-Test

29

30 Fs = MSB / MSW przy H 0 ma rozkład Testujemy na poziomie istotności = Wartość krytyczna F. 05 =. Obserwujemy F s = Wniosek:

31 Na jakiej zasadzie to działa ? Dla przypomnienia: Test Studenta patrzy na różnicę między średnimi ( y 1 - y 2 ) Dzieli ją przez miarę rozrzutu tej różnicy (SE y1- y2 ) Jeżeli ( y 1 - y 2 ) jest duże w porównaniu do błędu standardowego to statystyka testu Studenta jest duża i odrzucamy H 0.

32 Dla testu F, Liczymy ``uśredniony kwadrat różnicy między średnimi (MSB) Dzielimy go przez oszacowanie zróżnicowania w próbie (MSW) Jeżeli MSB jest duże w porównaniu do MSW wówczas statystyka testu F jest duża i odrzucamy H 0. Test F jest analogiczny do testu Studenta ale umożliwia jednoczesne porównanie kilku średnich.

33 Test F można stosować również gdy mamy tylko dwie próby Statystyka testu F dla dwóch prób jest równa kwadratowi statystyki testu Studenta Decyzje i p-wartości są dokładnie takie same dla obu testów.


Pobierz ppt "Wykład 11 Analiza wariancji (ANOVA) Sposób analizy danych gdy mamy więcej niż dwa zabiegi lub populacje. Omówimy ANOV-ę w najprostszej postaci. Te same."

Podobne prezentacje


Reklamy Google