Plan na dziś Ogólny model liniowy (GLM) Model mieszany (MIXED)
Ogólny model liniowy gr. słoniny = stado + masa półtuszy + reszta zm. klasyfikująca zm. ciągła OML łączy zalety ANOVA i analizy regresji
Parametry modelu β0 = efekt wspólny β1 = efekt stada A β2 = efekt stada B efekt stada C = 0 β3 = regr. na masę półtuszy Jeden poziom efektu stałego jest zawsze wyzerowany!
23 mm stado A 42 kg 24 mm stado B 40 kg 22 mm stado C 41 kg 23 = 1β0 + 1β1 + 0β2 + 42β3 + e1 24 = 1β0 + 0β1 + 1β2 + 40β3 + e2 22 = 1β0 + 0β1 + 0β2 + 41β3 + e3
y = X + e Zapis macierzowy β0 β1 β2 β3 23 24 = 22 e1 + e2 e3 1 1 0 42 1 1 0 42 1 0 1 40 1 0 0 41 y = X + e
General Linear Model data swinie ; infile “C:\...\mojplik.txt” ; input slonina stado $ waga ; proc GLM data=swinie; class stado ; model slonina = stado waga ; run ;
Sumy kwadratów Typu I-ego: zależą od pozycji efektu w modelu! Oszacowany efekt masy półtuszy uzględnia wpływ stada, ale nie odwrotnie. Typu III-ego: nie zależne od pozycji efektu w modelu! Każdy efekt jest poprawiony względem pozostałych.
Rozwiązania proc GLM data=swinie; run ; class stado ; model slonina = stado waga / solutions; run ; Testowanie efektów: H0 1 = 0 H1 1 0 (test dwustronny) poziom istotności w kolumnie Pr > |t| Jeden poziom wyzerowany!
Średnie najmniejszych kwadratów to średnie jakich byśmy oczekiwali dla zbalansowanych danych. Średnie NK Układ niezbalanowany stado rok A B C średnie brzegowe 2005 5 4 2006 1 5 1 2 3 Tu brakuje obserwacji
Oblicza błąd standardowy i testuje hipotezę średnia=0 Średnie NK proc GLM data=swinie; class stado ; model slonina = stado waga ; lsmeans stado / stderr ; run ; Oblicza błąd standardowy i testuje hipotezę średnia=0 Oblicza średnie least-squares
Interakcja Y = A B A*B Interakcja A1 A2 B1 B2 A1B1 A1B2 A2B1 A2B2
B nie występuje jako efekt główny. Efekty zagnieżdżone A1 A2 B1 B2 B1 B2 Y = A B(A) A1 A2 B1 B2 A1B1 A1B2 A2B1 A2B2 B nie występuje jako efekt główny.
Porównania wielokrotne proc GLM data=swinie; class stado ; model slonina = stado waga ; means stado / opcja; run ; DUNCAN LSD – najmniejsza istotna różnica TUKEY Means oblicza nie poprawione średnie, SNK Student-Newman-Keuls
Porównania średnich NK lsmeans stado / pdiff=all adjust=tukey; Testuje hipotezę H0: LSM(i)=LSM(j)
Pomiary powtarzane 23 mm 22 mm stado A 42 kg 19 mm 18 mm 17 mm stado B 40 kg 22 mm 21 mm stado C 41 kg Pomiary wykonywane na tych samych obiektach (świniach) mogą być skorelowane!
Dowolna nazwa dla czynnika wewnątrz- obiektowego Pomiary powtarzane – c.d y1 y2 y3 stado waga 23 22 A 42 19 18 17 B 40 22 21 22 C 41 proc GLM; class stado ; model y1-y3 = stado waga ; repeated czas ; run ; Dowolna nazwa dla czynnika wewnątrz- obiektowego
y = X + Zu + e Model mieszany Zawiera zarówno efekty stałe jak i losowe u
Kiedy efekt losowy? Efekt jest losowy, jeżeli po powtórzeniu próbkowania możemy wylosować inne jego poziomy. Np. losowanie 30 koni I próbkowanie: umaszczenie gniade 20 koni. umaszczenie pstrokate 10 koni II próbkowanie umaszczenie gniade 15 umaszczenie myszate 15
Kiedy efekt losowy? Gdy chcemy wnioskować o czynniku, ale nie mamy wszystkich jego poziomów. Np. Analizujemy wpływ pór roku, ale mamy dane tylko z lata i jesieni.
Kiedy efekt losowy? Gdy chcemy uwględnić fakt, że obserwacje są skorelowane ...lub gdy efekty skorelowane są naszym przedmiotem zainteresowania. Np. Wartość hodowlana świni A jest skorelowana z w.h. świni B, bo A i B są spokrewnione.
Zależności między efektami y = X + Zu + e Zależności między efektami zdefiniowane w macierzy G Zależności między resztami zdefiniowane w macierzy R
Przykład y = X + e V = R = = 6 buhaj 1 krowa 1 krowa 2 buhaj 2 stado A stado B y=9 y=12 buhaj 2 krowa 3 krowa 4 stado A stado B y=11 y=6 buhaj 3 krowa 5 krowa 6 stado A stado B y=7 y=14 y = X + e 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 V = R = 6 9 12 11 6 7 14 1 0 0 1 = stado A stado B Y = X = Zakładamy, że obserwacje nie są skorelowane, ale to nieprawda!
Przykład y = X + Zu + e V = ZGZ`+ R = 2 buhaj 1 krowa 1 krowa 2 stado A stado B y=9 y=12 buhaj 2 krowa 3 krowa 4 stado A stado B y=11 y=6 buhaj 3 krowa 5 krowa 6 stado A stado B y=7 y=14 y = X + Zu + e 8 2 0 0 0 0 2 8 0 0 0 0 0 0 8 2 0 0 0 0 2 8 0 0 0 0 0 0 8 2 0 0 0 0 2 8 1 0 0 0 1 0 0 0 1 buhaj 1 buhaj 2 buhaj 3 V = ZGZ`+ R = u = Z = 1 0 0 0 1 0 0 0 1 Teraz obserwacje są skorelowane, ale błędy nie! 2 G =
Poziomy efektów losowych mogą być także skorelowane np. zależności między efektami proporcjonalne do spokrewnień (Animal Model) ojciec matka córka ojciec 1 0 1/2 matka 0 1 1/2 córka 1/2 1/2 1 matka ojciec G=A 2A córka
Model mieszany w SASie proc MIXED ; run ; class A B ; model Y = A B ; random C ; run ;
BLUP AM G = A×1,0 R = I×1,5 Y = stado + animal + reszta Krowa 1 Buhaj 2 stado A y=3,1 Założenia: wariancja add. 2A = 1,0 wariancja reszt 2E = 1,5 ...czyli G = A×1,0 R = I×1,5 Córka 3 Córka 4 stado B y=3,5 stado B y=3,3
BLUP AM krowa 1 1 0 0,5 0 buhaj 2 0 1 0,5 0,5 córka 3 0,5 0,5 1 0,25 data G ; input Row Col1-Col4 ; cards ; 1 1 0 0.5 0 2 0 1 0.5 0.5 3 0.5 0.5 1 0.25 4 0 0.5 0.25 1 ; data G ; input Row Col Value ; cards ; 1 1 0 3 0.5 2 1 itd.
BLUP AM data mleko ; input stado $ animal $ Y ; cards ; A 1 3.1 A 2 . proc mixed data=mleko ; class stado animal ; model Y = stado ; random animal / type=un gdata=G s ; parms 1.5 / hold=1 ; run ;
Zadanie 1 Zbadaj wpływ leku (1-4) i choroby (1-3) oraz interakcji między nimi na wskaźnik wydajnościowy organizmu. Czy układ jest zbalansowany? Który efekt jest istotny? Porównaj średnie najmniejszych kwadratów w parach. Dane: Procedura wczytania danych: 1 1 42 44 36 13 19 22 1 2 33 . 26 . 33 21 1 3 31 -3 . 25 25 24 2 1 28 . 23 34 42 13 2 2 . 34 33 31 . 36 2 3 3 26 28 32 4 16 3 1 . . 1 29 . 19 3 2 . 11 9 7 1 -6 3 3 21 1 . 9 3 . 4 1 24 . 9 22 -2 15 4 2 27 12 12 -5 16 15 4 3 22 7 25 5 12 . data a; input lek choroba @; do i=1 to 6; input y @; output; end; cards ;
Zadanie 2 Zbadaj skuteczność antybiotyku (a-f) na stopień zakażenia pacjentów (po) uwzględniając stopień zakażenia przed leczeniem (przed) jako drugi efekt w modelu. Wytłumacz różnicę między wynikiem dla antybiotyku obliczonym wg sum kw. typu I i III. data AB; input anty $ przed po @@; cards; a 11 6 a 8 0 a 5 2 a 14 8 a 19 11 a 6 4 a 10 13 a 6 1 a 11 8 a 3 0 d 6 0 d 6 2 d 7 3 d 8 1 d 18 18 d 8 4 d 19 14 d 8 9 d 5 1 d 15 9 f 16 13 f 13 10 f 11 18 f 9 5 f 21 23 f 16 12 f 12 5 f 12 16 f 7 1 f 12 20
Zadanie 3 Analizowano wpływ mutacji w genie leptyny (CC, CG, GG) na ekspresję tego genu (poziom mRNA). Zbadano 14 świń i dla każdej wykonano 3 pomiary ekspresji genu. Zbadaj wpływ genu. http://jay.au.poznan.pl/~mcszyd/dyda/pakiety/index.html dane22.txt kol 1: genotyp Leptyny kol 2: pomiar 1 kol 3: pomiar 2 kol 4: pomiar 3
Zadanie 4 Analizowano wpływ genotypu w genie leptyny (CC, CG) na średnią grubość słoniny. Wykonaj obliczenia (a) ignorując wpływ ojca i (b) traktując wpływ ojca jako efekt losowy. Uwzględnij wiek uboju i masę półtuszy. http://jay.au.poznan.pl/~mcszyd/dyda/pakiety/index.html dane23.txt kol 1: kod rasy kol 2: numer próby kol 3: numer ojca kol 4: genotyp RYR kol 5: genotyp Leptyny kol 6: średnia gr. słoniny (cm) kol 7: wiek uboju (dni) kol 8: masa półtuszy (kg)
Zadanie dla chętnych Oceń wartość hodowlaną buhajów i krów wzg. zawartości tłuszczu w mleku przyjmując, że wariancja genetyczna addytywna = 0,75, a wariancja reszt = 1,3. 1 2 3 4 5 krowa stado %tłuszczu 2 A 3,3 3 A 3,1 5 B 3,0 6 B 2,9 8 B 3,4 9 A 3,5 10 B 3,2 6 7 8 9 10 zwierzęta ponumerowane rosnąco od najstarszych do najmłodszych