Analiza wariancji Marcin Zajenkowski
Badania eksperymentalne ANOVA najczęściej do eksperymentów Porównanie wyników z 2 grup lub więcej Zmienna niezależna (czynnik): –manipulacyjna – przypisanie wartości osobom badanym np. warunki badania –klasyfikacyjna – pogrupowanie wg jakiejś cechy np. płeć, IQ itp. Poziomy – wartości z. niezależnej
Eksperymenty Jednoczynnikowe, np. wpływ 3 rodzajów terapii na stan zdrowia pacjentów Dwuczynnikowe np. wpływ 3 rodzajów terapii oraz 2 rodzajów środków farmakologicznych na stan zdrowia Wieloczynnikowe – więcej zmiennych niezależnych
ANOVA Służy do porównania k średnich ANOVA – dzieli obserwowaną zmienność na oddzielne części, z której każdą można przypisać innemu źródłu Ronald A. Fischer stosował ją początkowo w rolnictwie
ANOVA Np. porównujemy k grup eksperymentalnych. Hipoteza zerowa: H 0 : m 1 = m 2 =... = m k H 1 : co najmniej dwie średnie różnią się między sobą
ANOVA W celu testowania statystycznej istotności różnic pomiędzy średnimi w rzeczywistości przeprowadzamy porównanie (tzn. analizę) wariancji.
ANOVA – średni wynik grupy A – średni wynik grupy C – średni wynik grupy B
ANOVA Podstawą tej analizy jest możliwość rozbicia sumy kwadratów wariancji całkowitej dla wszystkich wyników obserwacji na dwa składniki: –sumę kwadratów opisującą zmienność wewnątrz grup (błąd losowy). –sumę kwadratów opisującą zmienność między grupami.
Zapis Badamy k grup niezależnych o liczebnościach: N 1 + N N k = N X 11 – osoba 1, grupa 1 X i j - osoba i – ta, z k – grupy
Zapis Suma kwadratów w grupie j - tej
Zapis Całkowita suma kwadratów (wszystkich pomiarów od średniej ogólnej)
Suma kwadratów Suma kwadratów całkowitych = wewnątrzgrupową sumę kwadratów + międzygrupowa suma kwadratów, czyli:
Średnie kwadraty Podzielone przez stopnie swobody, czyli N – 1 = (N – k) + (k – 1) całkowita = wewnątrz + między
Średnie kwadraty
Test F
Zadanie Fabryka testowała maszyny produkujące gwoździe dwóch firm. Wyniki wydajności maszyn : Grupa 1: 12, 26, 31, 12, 14, 16, 10 Grupa 2: 8, 14, 29, 7, 14, 6