Plan na dziś Ogólny model liniowy (GLM) Model mieszany (MIXED)

Slides:



Advertisements
Podobne prezentacje
I część 1.
Advertisements

Klasyfikacja roczna w roku szkolnym 2012/2013
Joanna Sawicka Wydział Nauk Ekonomicznych, Uniwersytet Warszawski
hasło: student Szymon Drobniak pokój konsultacje: wtorek 13-14
Wykład 13 Estymacja wartości oczekiwanej zmiennej zależnej.
Wykład 14 Diagnostyka Diagnostyka – ocena prawidłowości założeń
Analiza wariancji jednoczynnikowa
Metody ekonometryczne
Analiza wariancji Marcin Zajenkowski. Badania eksperymentalne ANOVA najczęściej do eksperymentów Porównanie wyników z 2 grup lub więcej Zmienna niezależna.
BUDOWA MODELU EKONOMETRYCZNEGO
MS Access 2000 Normalizacja Paweł Górczyński 2005.
Dane dotyczące sprzedaży wody mineralnej
KONKURS WIEDZY O SZTUCE
Analiza wariancji Analiza wariancji (ANOVA) stanowi rozszerzenie testu t-Studenta w przypadku porównywanie większej liczby grup. Podział na grupy (czyli.
Metody ekonometryczne
Nowy kod Statistica 6.1 HEN6EUEKH8.
Pakiety statystyczne Maciej Szydłowski (dr)
BIOSTATYSTYKA I METODY DOKUMENTACJI
Mgr Sebastian Mucha Schemat doświadczenia:
Parametry genetyczne.
Metody Sztucznej Inteligencji w Sterowaniu 2009/2010 Metoda propagacji wstecznej Dr hab. inż. Kazimierz Duzinkiewicz, Katedra Inżynierii Systemów Sterowania.
Wykład 4 Rozkład próbkowy dla średniej z rozkładu normalnego
Wykład 3 Rozkład próbkowy dla średniej z rozkładu normalnego
Proces analizy i rozpoznawania
Prognozowanie na podstawie sezonowych szeregów czasowych
Prognozowanie na podstawie szeregów czasowych
Analiza wariancji ANOVA efekty główne
UKŁADY SZEREGOWO-RÓWNOLEGŁE
Przykładowe zastosowania równania Bernoulliego i równania ciągłości przepływu 1. Pomiar ciśnienia Oznaczając S - punkt spiętrzenia (stagnacji) strugi v=0,
Klasyfikacja systemów
Transformacja Z (13.6).
Wieloczynnikowa analiza wariancji
Analiza wariancji jednoczynnikowa
Analiza wariancji.
Testy nieparametryczne
Analiza współzależności cech statystycznych
Wyrażenia algebraiczne
Rozkłady wywodzące się z rozkładu normalnego standardowego
Testy nieparametryczne
KALENDARZ 2011r. Autor: Alicja Chałupka klasa III a.
Irena Woroniecka EKONOMIA MENEDŻERSKA - dodatek do W2
Dr hab. Dariusz Piwczyński Katedra Genetyki i Podstaw Hodowli Zwierząt
Analiza wpływu regulatora na jakość regulacji (1)
Hipotezy statystyczne
Modelowanie i Identyfikacja 2011/2012 Metoda propagacji wstecznej Dr hab. inż. Kazimierz Duzinkiewicz, Katedra Inżynierii Systemów Sterowania 1 Warstwowe.
Kalendarz 2011r. styczeń pn wt śr czw pt sb nd
1. ŁATWOŚĆ ZADANIA (umiejętności) 2. ŁATWOŚĆ ZESTAWU ZADAŃ (ARKUSZA)
Statystyka ©M.
Ekonometria stosowana
Analiza wariancji ANOVA czynnikowa ANOVA
-17 Oczekiwania gospodarcze – Europa Wrzesień 2013 Wskaźnik > +20 Wskaźnik 0 a +20 Wskaźnik 0 a -20 Wskaźnik < -20 Unia Europejska ogółem: +6 Wskaźnik.
+21 Oczekiwania gospodarcze – Europa Grudzień 2013 Wskaźnik > +20 Wskaźnik 0 do +20 Wskaźnik 0 do -20 Wskaźnik < -20 Unia Europejska ogółem: +14 Wskaźnik.
(C) Jarosław Jabłonka, ATH, 5 kwietnia kwietnia 2017
EcoCondens Kompakt BBK 7-22 E.
Ekonometria stosowana
W2 Modelowanie fenomenologiczne I
Ekonometryczne modele nieliniowe
Seminarium licencjackie Beata Kapuścińska
Analiza wariancji ANOVA efekty główne. Analiza wariancji ANOVA ANOVA: ANalysis Of VAriance Nazwa: wywodzi się z faktu, że w celu testowania statystycznej.
Ekonometryczne modele nieliniowe
Kalendarz 2020.
Elementy geometryczne i relacje
Strategia pomiaru.
Analiza wariancji ANOVA czynnikowa ANOVA
Regresja liniowa. Dlaczego regresja? Regresja zastosowanie Dopasowanie modelu do danych Na podstawie modelu, przewidujemy wartość zmiennej zależnej na.
Model ekonometryczny Jacek Szanduła.
Treść dzisiejszego wykładu l Weryfikacja statystyczna modelu ekonometrycznego –błędy szacunku parametrów, –istotność zmiennych objaśniających, –autokorelacja,
Ekonometria stosowana
Regresja wieloraka – bada wpływ wielu zmiennych objaśniających (niezależnych) na jedną zmienną objaśnianą (zależą)
MNK – podejście algebraiczne
Zapis prezentacji:

Plan na dziś Ogólny model liniowy (GLM) Model mieszany (MIXED)

Ogólny model liniowy gr. słoniny = stado + masa półtuszy + reszta zm. klasyfikująca zm. ciągła OML łączy zalety ANOVA i analizy regresji

Parametry modelu β0 = efekt wspólny β1 = efekt stada A β2 = efekt stada B efekt stada C = 0 β3 = regr. na masę półtuszy Jeden poziom efektu stałego jest zawsze wyzerowany!

23 mm stado A 42 kg 24 mm stado B 40 kg 22 mm stado C 41 kg 23 = 1β0 + 1β1 + 0β2 + 42β3 + e1 24 = 1β0 + 0β1 + 1β2 + 40β3 + e2 22 = 1β0 + 0β1 + 0β2 + 41β3 + e3

y = X + e Zapis macierzowy β0 β1 β2 β3 23 24 = 22 e1 + e2 e3 1 1 0 42 1 1 0 42 1 0 1 40  1 0 0 41 y = X + e

General Linear Model data swinie ; infile “C:\...\mojplik.txt” ; input slonina stado $ waga ; proc GLM data=swinie; class stado ; model slonina = stado waga ; run ;

Sumy kwadratów Typu I-ego: zależą od pozycji efektu w modelu! Oszacowany efekt masy półtuszy uzględnia wpływ stada, ale nie odwrotnie. Typu III-ego: nie zależne od pozycji efektu w modelu! Każdy efekt jest poprawiony względem pozostałych.

Rozwiązania proc GLM data=swinie; run ; class stado ; model slonina = stado waga / solutions; run ; Testowanie efektów: H0 1 = 0 H1 1  0 (test dwustronny) poziom istotności w kolumnie Pr > |t| Jeden poziom wyzerowany!

Średnie najmniejszych kwadratów to średnie jakich byśmy oczekiwali dla zbalansowanych danych. Średnie NK Układ niezbalanowany stado rok A B C średnie brzegowe 2005 5 4 2006 1 5 1 2 3 Tu brakuje obserwacji

Oblicza błąd standardowy i testuje hipotezę średnia=0 Średnie NK proc GLM data=swinie; class stado ; model slonina = stado waga ; lsmeans stado / stderr ; run ; Oblicza błąd standardowy i testuje hipotezę średnia=0 Oblicza średnie least-squares

Interakcja Y = A B A*B Interakcja A1 A2 B1 B2 A1B1 A1B2 A2B1 A2B2

B nie występuje jako efekt główny. Efekty zagnieżdżone A1 A2 B1 B2 B1 B2 Y = A B(A) A1 A2 B1 B2 A1B1 A1B2 A2B1 A2B2 B nie występuje jako efekt główny.

Porównania wielokrotne proc GLM data=swinie; class stado ; model slonina = stado waga ; means stado / opcja; run ; DUNCAN LSD – najmniejsza istotna różnica TUKEY Means oblicza nie poprawione średnie, SNK Student-Newman-Keuls

Porównania średnich NK lsmeans stado / pdiff=all adjust=tukey; Testuje hipotezę H0: LSM(i)=LSM(j)

Pomiary powtarzane 23 mm 22 mm stado A 42 kg 19 mm 18 mm 17 mm stado B 40 kg 22 mm 21 mm stado C 41 kg Pomiary wykonywane na tych samych obiektach (świniach) mogą być skorelowane!

Dowolna nazwa dla czynnika wewnątrz- obiektowego Pomiary powtarzane – c.d y1 y2 y3 stado waga 23 22 A 42 19 18 17 B 40 22 21 22 C 41 proc GLM; class stado ; model y1-y3 = stado waga ; repeated czas ; run ; Dowolna nazwa dla czynnika wewnątrz- obiektowego

y = X + Zu + e Model mieszany Zawiera zarówno efekty stałe  jak i losowe u

Kiedy efekt losowy? Efekt jest losowy, jeżeli po powtórzeniu próbkowania możemy wylosować inne jego poziomy. Np. losowanie 30 koni I próbkowanie: umaszczenie gniade 20 koni. umaszczenie pstrokate 10 koni II próbkowanie umaszczenie gniade 15 umaszczenie myszate 15

Kiedy efekt losowy? Gdy chcemy wnioskować o czynniku, ale nie mamy wszystkich jego poziomów. Np. Analizujemy wpływ pór roku, ale mamy dane tylko z lata i jesieni.

Kiedy efekt losowy? Gdy chcemy uwględnić fakt, że obserwacje są skorelowane ...lub gdy efekty skorelowane są naszym przedmiotem zainteresowania. Np. Wartość hodowlana świni A jest skorelowana z w.h. świni B, bo A i B są spokrewnione.

Zależności między efektami y = X + Zu + e Zależności między efektami zdefiniowane w macierzy G Zależności między resztami zdefiniowane w macierzy R

Przykład y = X + e V = R = = 6 buhaj 1 krowa 1 krowa 2 buhaj 2 stado A stado B y=9 y=12 buhaj 2 krowa 3 krowa 4 stado A stado B y=11 y=6 buhaj 3 krowa 5 krowa 6 stado A stado B y=7 y=14 y = X + e 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 V = R = 6 9 12 11 6 7 14 1 0 0 1 = stado A stado B Y = X = Zakładamy, że obserwacje nie są skorelowane, ale to nieprawda!

Przykład y = X + Zu + e V = ZGZ`+ R = 2 buhaj 1 krowa 1 krowa 2 stado A stado B y=9 y=12 buhaj 2 krowa 3 krowa 4 stado A stado B y=11 y=6 buhaj 3 krowa 5 krowa 6 stado A stado B y=7 y=14 y = X + Zu + e 8 2 0 0 0 0 2 8 0 0 0 0 0 0 8 2 0 0 0 0 2 8 0 0 0 0 0 0 8 2 0 0 0 0 2 8 1 0 0 0 1 0 0 0 1 buhaj 1 buhaj 2 buhaj 3 V = ZGZ`+ R = u = Z = 1 0 0 0 1 0 0 0 1 Teraz obserwacje są skorelowane, ale błędy nie! 2 G =

Poziomy efektów losowych mogą być także skorelowane np. zależności między efektami proporcjonalne do spokrewnień (Animal Model) ojciec matka córka ojciec 1 0 1/2 matka 0 1 1/2 córka 1/2 1/2 1 matka ojciec G=A 2A córka

Model mieszany w SASie proc MIXED ; run ; class A B ; model Y = A B ; random C ; run ;

BLUP AM G = A×1,0 R = I×1,5 Y = stado + animal + reszta Krowa 1 Buhaj 2 stado A y=3,1 Założenia: wariancja add. 2A = 1,0 wariancja reszt 2E = 1,5 ...czyli G = A×1,0 R = I×1,5 Córka 3 Córka 4 stado B y=3,5 stado B y=3,3

BLUP AM krowa 1 1 0 0,5 0 buhaj 2 0 1 0,5 0,5 córka 3 0,5 0,5 1 0,25 data G ; input Row Col1-Col4 ; cards ; 1 1 0 0.5 0 2 0 1 0.5 0.5 3 0.5 0.5 1 0.25 4 0 0.5 0.25 1 ; data G ; input Row Col Value ; cards ; 1 1 0 3 0.5 2 1 itd.

BLUP AM data mleko ; input stado $ animal $ Y ; cards ; A 1 3.1 A 2 . proc mixed data=mleko ; class stado animal ; model Y = stado ; random animal / type=un gdata=G s ; parms 1.5 / hold=1 ; run ;

Zadanie 1 Zbadaj wpływ leku (1-4) i choroby (1-3) oraz interakcji między nimi na wskaźnik wydajnościowy organizmu. Czy układ jest zbalansowany? Który efekt jest istotny? Porównaj średnie najmniejszych kwadratów w parach. Dane: Procedura wczytania danych: 1 1 42 44 36 13 19 22 1 2 33 . 26 . 33 21 1 3 31 -3 . 25 25 24 2 1 28 . 23 34 42 13 2 2 . 34 33 31 . 36 2 3 3 26 28 32 4 16 3 1 . . 1 29 . 19 3 2 . 11 9 7 1 -6 3 3 21 1 . 9 3 . 4 1 24 . 9 22 -2 15 4 2 27 12 12 -5 16 15 4 3 22 7 25 5 12 . data a; input lek choroba @; do i=1 to 6; input y @; output; end; cards ;

Zadanie 2 Zbadaj skuteczność antybiotyku (a-f) na stopień zakażenia pacjentów (po) uwzględniając stopień zakażenia przed leczeniem (przed) jako drugi efekt w modelu. Wytłumacz różnicę między wynikiem dla antybiotyku obliczonym wg sum kw. typu I i III. data AB; input anty $ przed po @@; cards; a 11 6 a 8 0 a 5 2 a 14 8 a 19 11 a 6 4 a 10 13 a 6 1 a 11 8 a 3 0 d 6 0 d 6 2 d 7 3 d 8 1 d 18 18 d 8 4 d 19 14 d 8 9 d 5 1 d 15 9 f 16 13 f 13 10 f 11 18 f 9 5 f 21 23 f 16 12 f 12 5 f 12 16 f 7 1 f 12 20

Zadanie 3 Analizowano wpływ mutacji w genie leptyny (CC, CG, GG) na ekspresję tego genu (poziom mRNA). Zbadano 14 świń i dla każdej wykonano 3 pomiary ekspresji genu. Zbadaj wpływ genu. http://jay.au.poznan.pl/~mcszyd/dyda/pakiety/index.html dane22.txt kol 1: genotyp Leptyny kol 2: pomiar 1 kol 3: pomiar 2 kol 4: pomiar 3

Zadanie 4 Analizowano wpływ genotypu w genie leptyny (CC, CG) na średnią grubość słoniny. Wykonaj obliczenia (a) ignorując wpływ ojca i (b) traktując wpływ ojca jako efekt losowy. Uwzględnij wiek uboju i masę półtuszy. http://jay.au.poznan.pl/~mcszyd/dyda/pakiety/index.html dane23.txt kol 1: kod rasy kol 2: numer próby kol 3: numer ojca kol 4: genotyp RYR kol 5: genotyp Leptyny kol 6: średnia gr. słoniny (cm) kol 7: wiek uboju (dni) kol 8: masa półtuszy (kg)

Zadanie dla chętnych Oceń wartość hodowlaną buhajów i krów wzg. zawartości tłuszczu w mleku przyjmując, że wariancja genetyczna addytywna = 0,75, a wariancja reszt = 1,3. 1 2 3 4 5 krowa stado %tłuszczu 2 A 3,3 3 A 3,1 5 B 3,0 6 B 2,9 8 B 3,4 9 A 3,5 10 B 3,2 6 7 8 9 10 zwierzęta ponumerowane rosnąco od najstarszych do najmłodszych