Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

Wykład 9 Analiza wariancji (ANOVA) Sposób analizy danych, gdy porównujemy więcej niż dwie populacje/zabiegi. Omówimy ANOV-ę w najprostszej postaci. Te.

Podobne prezentacje


Prezentacja na temat: "Wykład 9 Analiza wariancji (ANOVA) Sposób analizy danych, gdy porównujemy więcej niż dwie populacje/zabiegi. Omówimy ANOV-ę w najprostszej postaci. Te."— Zapis prezentacji:

1 Wykład 9 Analiza wariancji (ANOVA) Sposób analizy danych, gdy porównujemy więcej niż dwie populacje/zabiegi. Omówimy ANOV-ę w najprostszej postaci. Te same podstawowe założenia/ograniczenia, co przy teście Studenta: W każdej populacji badana cecha ma rozkład normalny Obserwacje są niezależne i losowe Testujemy hipotezy o średnich w populacjach: I Dodatkowe założenie – standardowe odchylenia badanej cechy w badanych populacjach są sobie równe (podobne) – użyjemy uśrednionego SE

2 Uwaga: ANOVA może być stosowana także wtedy, gdy próby nie są niezależne, np. w zrandomizowanym układzie blokowym (zasada podobna do testu Studenta dla par). Tutaj jednak omówimy tylko układy zrandomizowane zupełne (=jednoblokowe). Cel: Testujemy hipotezy postaci: H 0 : 1 = 2 = 3 = … = k H A : nie wszystkie średnie są równe

3 Dlaczego nie stosujemy wielu testów Studenta? Wielokrotne porównania: prawdopodo-bieństwo błędu pierwszego rodzaju (odrzucenia prawdziwej hipotezy zerowej) byłoby trudne do kontrolowania. Estymacja błędu standardowego: ANOVA wykorzystuje informację zawartą we wszystkich obserwacjach: zwykle daje większą precyzję obliczenia/mniejsze SE niż indywidualne testy Studenta dla par. ANOVA automatycznie porównuje konfiguracje populacji większe niż pary.

4 Korekta Bonferoniego Przy k testach na poziomie α, przyjmujemy łączny poziom istotności kα. Prosta, ale na ogół konserwatywna: prawdo- podobieństwo błędu pierwszego rodzaju jest mniejsze niż założone kα – w efekcie strata mocy. Np. przy porównywaniu 5 populacji testem Studenta dla niezależnych prób Bonferoni daje poziom istotności równy

5 Notacja: k = 3 zabiegi (grupy) Zabieg 1Zabieg 2Zabieg średnia SS423246

6 Trzy kategorie: –wewnątrz grup, –pomiędzy grupami, –łącznie. W każdej - trzy wartości: SS, df, MS. SSdfMS wewnątrz pomiędzy łącznie

7 Notacja, cd.: k : # grup (prób, zabiegów), tutajk = n 1, n 2, n 3, …, n k : rozmiary grup (# obserwacji) n 1 =, n 2 =, n 3 = y 1, y 2, … y k = średnie w grupach y 1 =, y 2 =, y 3 = = całkowita średnia (wszystkich obserwacji) n* = całkowita liczba obserwacjin* =

8 Używamy i do indeksowania grup a j do indeksowania obserwacji w każdej grupie, np: y ij. oznacza sumę ``wewnątrz grupy:

9 Uwzględniające wszystkie grupy oznacza sumę po grupach: np. ; tutaj n* =

10 UWAGA: Gdy rozmiary prób nie są równe nie jest średnią z k średnich! Można ją obliczyć jako = (n 1 y 1 + n 2 y 2 + …+n 3 y 3 ) / n*

11 Wewnątrz grup: wypełniamy drugi rząd w tabeli Suma kwadratów wewnątrz grup (SSW): Liczymy SS dla każdej grupy (SS 2, SS 3, itd.) SS 1 =..... SS 2 = … = 32, SS 3 = … = 46

12 SSW = SS 1 +SS 2 +…+SS k, tutaj SSW =.... Stopnie swobody wewnątrz grup: dfw = n* - k, tutaj dfw =... Średnia suma kwadratów wewnątrz grup: MSW = SSW / dfw, tutaj MSW =... MSW to uśredniona wariancja, np.(wykład 6): Uśrednione odchylenie standardowe s c =, tutaj s c =...

13 Pomiędzy grupami: wypełniamy pierwszy rząd tabeli Porównujemy średnie grupowe do całko- witej z wagą daną przez rozmiar grupy. Suma kwadratów pomiędzy grupami (SSB) SSB = Tutaj SSB =....

14 Stopnie swobody pomiędzy grupami (dfb) dfb = k – 1, tutaj dfb =... Średnia suma kwadratów pomiędzy grupami (MSB) MSB = SSB/dfb, tutaj MSB =...

15 Całkowite: wypełniamy trzeci rząd tabeli Całkowita suma kwadratów (SST): SST= SST= … =348

16 Uwaga: SST = SSW+SSB, tu 348 = Zwykle nie trzeba liczyć SST z definicji! Całkowita liczba stopni swobody (dft) dft = n* – 1, tutaj dft = Uwaga: dft = dfb+dfw, tutaj 10 = 2 + 8

17 Tablica ANOV-y (ponownie) SSdfMS Between Within Total puste

18 Ta tabela będzie dostępna na kolokwium i egzaminie: SSdfMS Pomiędzy SSB= dfb = k – 1SSB/dfb Wewnątrz SSW=dfw = n* – kSSW/dfw Całkowite SST= dft = n* – 1

19 Test F (Fishera) Założenia (jak w ANOV-ie): Dane dla k 2 populacji/zabiegów są niezależne Dane w każdej populacji mają rozkład normalny ze średnią i (dla populacji I), oraz z tym samym odchyleniem standardowym

20 Testujemy H 0 : 1 = 2 = 3 = … = k (wszystkie średnie są sobie równe) przeciwko H A : nie wszystkie średnie są sobie równe H A jest niekierunkowa, ale obszar odrzuceń będzie jednostronny (duże dodatnie wartości statystyki) Kroki: Obliczenie tabeli ANOV-y Testowanie

21 Jak opisać F test Zdefinować wszystkie H 0 podać za pomocą wzoru i słownie H A tylko słownie Statystyka testowa F s = MSB/MSW Przy H 0, F s ma rozkład F Snedecora ze stopniami swobody (dfb, dfw) Na slajdach podane są wartości krytyczne z książki D.S. Moore i G. P. McCabe Introduction to the Practice of Statistics numerator df = dfb, denominator df = dfw.

22

23

24

25

26 Odrzucamy H 0, gdy zaobserwowane F s > F krytyczne Przykładowy wniosek: Na poziomie istotności α (nie) mamy przesłanki, aby twierdzić, że grupy różnią się poziomem badanej cechy.

27 Przykład: Losową próbę 15 zdrowych mężczyzn podzielono losowo na 3 grupy składające się z 5 mężczyzn. Przez tydzień otrzymywali oni lekarstwo Paxil w dawkach 0, 20 i 40 mg dziennie. Po tym czasie zmierzono im poziom serotoniny. Czy Paxil wpływa na poziom serotoniny u zdrowych, młodych mężczyzn ? Niech 1 będzie średnim poziomem serotoniny u mężczyzn przyjmujących 0 mg Paxilu. Niech 2 będzie średnim poziomem serotoniny u mężczyzn przyjmujących 20 mg Paxilu. Niech 3 będzie średnim poziomem serotoniny u mężczyzn przyjmujących 40 mg Paxilu.

28 H 0 : 1 = 2 = 3 ; średni poziom serotoniny nie zależy od dawki Paxilu H A : średni poziom serotoniny nie jest ten sam we wszystkich grupach (albo średni poziom serotoniny zależy od dawki Paxilu). Zastosujemy F-Test

29

30 Fs = MSB / MSW przy H 0 ma rozkład... Testujemy na poziomie = Wartość krytyczna F. 05 =.... Obserwujemy F s =... Wniosek:...

31 Na jakiej zasadzie to działa ? Dla przypomnienia: Statystyka testu Studenta ma w liczniku różnicę między średnimi ( y 1 - y 2 ) Tę dzielimy przez miarę rozrzutu tej różnicy (SE y1- y2 ) Jeżeli ( y 1 - y 2 ) jest duże w porównaniu do błędu standardowego, to statystyka testu Studenta jest duża i odrzucamy H 0.

32 Dla testu F: W liczniku mamy uśredniony kwadrat różnicy między średnimi (MSB) W mianowniku mamy oszacowanie zróżnicowania w obserwacji (MSW) Jeżeli MSB jest duże w porównaniu do MSW, to statystyka testu F jest duża i odrzucamy H 0. Test F jest analogiczny do testu Studenta. Umożliwia jednoczesne porównanie dowolnej liczby średnich.

33 Test F można stosować również, gdy mamy tylko dwie próby. Wtedy: Statystyka testu F dla dwóch prób jest równa kwadratowi statystyki Studenta (przy (U)SE). Decyzje i p-wartości są dokładnie takie same dla obu testów.


Pobierz ppt "Wykład 9 Analiza wariancji (ANOVA) Sposób analizy danych, gdy porównujemy więcej niż dwie populacje/zabiegi. Omówimy ANOV-ę w najprostszej postaci. Te."

Podobne prezentacje


Reklamy Google