Marta Molińska-Glura, Krzysztof Moliński Wisła, grudzień 2010

Slides:



Advertisements
Podobne prezentacje
OBLICZENIA NUMERYCZNE
Advertisements

Regresja i korelacja materiały dydaktyczne.
Excel Narzędzia do analizy regresji
Praktyczne wykorzystanie wiedzy z zakresu genetyki cech jakościowych i ilościowych u koni dr inż. Janusz Strychalski, UWM.
BADANIE KORELACJI ZMIENNYCH
Modele oświetlenia Punktowe źródła światła Inne
Równanie różniczkowe zupełne i równania do niego sprowadzalne
Przetwarzanie i rozpoznawanie obrazów
Podsumowanie wykładu 1. Najpełniejszą charakterystyką wybranej zmiennej jest jej rozkład.
BUDOWA MODELU EKONOMETRYCZNEGO
Metody wnioskowania na podstawie podprób
Komponenty bazy danych Baza danych Jest to uporządkowany zbiór powiązanych ze sobą danych charakterystycznych dla pewnej klasy obiektów lub zdarzeń,
Graficzna prezentacja danych Wykład 2 dr Małgorzata Radziukiewicz
Analiza współzależności
ANALIZA STRUKTURY SZEREGU NA PODSTAWIE MIAR STATYSTYCZNYCH
Analiza współzależności
WYKŁAD 11 FUNKCJE FALOWE ELEKTRONU W ATOMIE WODORU Z UWZGLĘDNIENIEM SPINU; SKŁADANIE MOMENTÓW PĘDU.
Parametry genetyczne.
Metody Sztucznej Inteligencji w Sterowaniu 2009/2010Optymalizacja miary efektywności działania sztucznych sieci neuronowych Dr hab. inż. Kazimierz Duzinkiewicz,
Wykład 7 Wojciech Pieprzyca
SZTUCZNA INTELIGENCJA ARTIFICIAL INTELLIGENCE
ROZWIĄZYWANIA PROBLEMÓW ELEKTROMAGNETYCZNYCH
Układ równań stopnia I z dwoma niewiadomymi
Średnie i miary zmienności
Podstawy układów logicznych
Modele ze strukturą wieku
i jak odczytywać prognozę?
Ekonometria. Co wynika z podejścia stochastycznego?
Metody numeryczne SOWIG Wydział Inżynierii Środowiska III rok
Obserwatory zredukowane
Elementy Rachunku Prawdopodobieństwa i Statystyki
GŁOSOWA ŁĄCZNOŚĆ Z KOMPUTEREM
Zadanie programowania liniowego PL dla ograniczeń mniejszościowych
Prognozowanie z wykorzystaniem modeli ekonometrycznych
Metody iteracyjne rozwiązywania układów równań liniowych
Modelowanie i identyfikacja 2010/2011Optymalizacja miary efektywności działania sztucznych sieci neuronowych Dr hab. inż. Kazimierz Duzinkiewicz, Katedra.
Finanse 2009/2010 dr Grzegorz Szafrański pokój B106 Termin konsultacji poniedziałek:
Kilka wybranych uzupelnień
Autorzy:Ania Szczubełek Kasia Sul
Wybrane zagadnienia relacyjnych baz danych
Funkcja liniowa ©M.
MS Excel - wspomaganie decyzji
SYSTEMY EKSPERTOWE I SZTUCZNA INTELIGENCJA
Współczynnik spokrewnienia addytywnego
FUNKCJE Pojęcie funkcji
ENDOG Monitorowanie zmienności genetycznej w małych populacjach na postawie danych rodowodowych.
Temat: Matematyczny opis ruchu drgającego
Analiza szeregów czasowych
ALG - wykład 3. LICZBY ZESPOLONE MACIERZE. Powtórzenie z = a+bi, z  C Re z = Re(a+bi) = a Im z = Im(a+bi) = b.
Ekonometria Metody estymacji parametrów strukturalnych modelu i ich interpretacja dr hab. Mieczysław Kowerski.
D. Ciołek BADANIA OPERACYJNE – wykład 2
Wykład drugi Szereg Fouriera Warunki istnienia
Treść dzisiejszego wykładu l Metoda kar. l Podsumowanie przekształcania zadań programowania liniowego do postaci tabelarycznej. l Specjalne przypadki –sprzeczność,
Ekonometria stosowana Heteroskedastyczność składnika losowego Piotr Ciżkowicz Katedra Międzynarodowych Studiów Porównawczych.
© Prof. Antoni Kozioł, Wydział Chemiczny Politechniki Wrocławskiej MATEMATYCZNE MODELOWANIE PROCESÓW BIOTECHNOLOGICZNYCH Temat – 5 Modelowanie różniczkowe.
Człowiek – najlepsza inwestycja
MODELE ANALIZY WYNIKÓW GEODEZYJNYCH POMIARÓW DEFORMACJI.
STATYSTYKA – kurs podstawowy wykład 8 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Modele nieliniowe sprowadzane do liniowych
O ODPORNOŚCI KONWENCJONALNEGO OBSERWATORA LUENBERGERA ZREDUKOWANEGO RZĘDU Ryszard Gessing Instytut Automatyki Politechnika Śląska.
STATYSTYKA – kurs podstawowy wykład 11
Metody ekonometryczne dla NLLS
Podstawowe rodzaje modeli rozmytych
Jednorównaniowy model regresji liniowej
Współczynnik spokrewnienia addytywnego
REALIZACJA PROGRAMÓW HODOWLANYCH Krzysztof Gałązka 2016
Podstawy Automatyki Człowiek- najlepsza inwestycja
Wykorzystano materiały Tomasz Strabel, UP Poznań
KORELACJA WIELOKROTNA I CZĄSTKOWA
Korelacja i regresja liniowa
Zapis prezentacji:

Marta Molińska-Glura, Krzysztof Moliński Wisła, grudzień 2010 Wykorzystanie informacji rodowodowej lub podobieństwa molekularnego do określenia postaci dyspersji efektów genetycznych w liniowym modelu mieszanym z dwoma komponentami Marta Molińska-Glura, Krzysztof Moliński Wisła, grudzień 2010

Tworzenie macierzy spokrewnień w oparciu o rodowód Tworzenie macierzy podobieństw molekularnych w oparciu o różne miary podobieństwa Model liniowy z dwoma komponentami Estymacja komponentów metodą REML Kryterium wyboru modelu

Predykcja efektów genetycznych nazywanych wartościami hodowlanymi roślin lub zwierząt ma istotne znaczenie w selekcji osobników. Efekty genetyczne w naukach medycznych najczęściej skojarzone są z odziedziczalnością pewnych cech (chorób).

I. Tworzenie macierzy spokrewnień w oparciu o rodowód Konstrukcja klasycznego rodowodu w postaci tabelarycznej rozpoczyna się od uporządkowania posiadanych obiektów oraz przypisaniu im rodziców. Możliwe jest również umieszczenie w tabeli rodowodowej osobników o nieokreślonych przodkach. Poniżej zamieszczono fragment przykładowej tabeli rodowodowej: Odmiany kukurydzy o nieznanym pochodzeniu Odmiany kukurydzy z pełną informacją rodowodową

Informacje zawarte w tabelarycznej postaci rodowodu mogą posłużyć do wyznaczenia macierzy spokrewnień. Na podstawie prac Wright`a (1922) i późniejszych Henderson`a (1988) możemy przedstawić wzory definiujące elementy tej macierzy: 𝑎 𝑖𝑗 = 𝑎 𝑗𝑖 = 1 2 𝑎 𝑠 𝑖 + 𝑎 𝑑 𝑖 𝑎 𝑖𝑖 =1+ 1 2 𝑎 𝑠 𝑖 𝑑 𝑖 gdzie 𝑎 𝑠 𝑖 oraz 𝑎 𝑑 𝑖 oznaczają wyznaczoną informację rodowodową, odpowiednio ojca i matki, dla i-tego osobnika, 𝑎 𝑠 𝑖 𝑑 𝑖 oznacza stopień spokrewnienia ojca i matki i-tego osobnika.

Korzystając z tabelarycznej postaci rodowodu i wcześniejszych wzorów na określanie współczynników pokrewieństwa rodowodowego, odpowiednia macierz spokrewnień przyjmuje postać:

II. Tworzenie macierzy podobieństw molekularnych w oparciu o różne miary podobieństwa 1. Przetworzenie obrazu na tablicę zawierającą odpowiednie wartości mas molekularnych charakteryzujące strukturę każdego z obiektów. 2. Zastosowanie znanych miar podobieństwa molekularnego bazujących na zestawie mas molekularnych . 3. Wartości podobieństw molekularnych jako składowe macierzy podobieństw molekularnych.

Przykładowy obraz widma uzyskany dzięki elektroforezie metodą PCR

Najpopularniejszymi miarami oznaczania podobieństwa molekularnego są: Miara Nei-Li 𝐺 𝑖𝑗 = 2 𝑁 𝑖𝑗 𝑁 𝑖 + 𝑁 𝑗 Miara Kulczyńskiego 𝐺 𝑖𝑗 = 𝑁 𝑖𝑗 𝑁 𝑖 + 𝑁 𝑗 2 𝑁 𝑖 𝑁 𝑗 Miara Jaccarda 𝐺 𝑖𝑗 = 𝑁 𝑖𝑗 𝑁 𝑖 + 𝑁 𝑗 − 𝑁 𝑖𝑗 𝑁 𝑖 to liczba „prążków” dla i-tego obiektu, 𝑁 𝑗 to liczba „prążków” dla j-tego obiektu, 𝑁 𝑖𝑗 to liczba „prążków” dla i-tego i j-tego obiektu występujących na tych samych pozycjach.

Korzystając z wyników analiz molekularnych metodą RAPD i wzoru Nei`a-Li określających podobieństwo molekularne odpowiednia macierz podobieństw molekularnych przyjmuje postać:

III. Model liniowy z dwoma komponentami 𝑦=𝑋𝛽+𝑍𝑢+𝑒 𝑦 𝑛×1 wektor obserwowanych zmiennych losowych 𝑋 𝑛×𝑝 macierz dla parametrów stałych, pełnego rzędu kolumnowego 𝛽 𝑝×1 wektor parametrów stałych 𝑍 𝑛×𝑞 macierz dla efektów losowych 𝑢 𝑞×1 wektor losowych efektów obiektowych 𝑒 𝑛×1 wektor błędów losowych

Założenia: Dla wektora błędów losowych 𝑒 zakładamy: 𝑒~ 𝑁 𝑛 0, 𝜎 𝑒 2 𝐼 𝑛 . Dla wektora zmiennych losowych 𝑢: 𝑢~ 𝑁 𝑞 0, 𝜎 𝑢 2 𝐻 , gdzie 𝜎 𝑢 2 𝐻 oznacza dyspersję wektora losowego 𝑢. Ponadto, wektory losowe 𝑢 i 𝑒 są niezależne, oraz 𝜎 𝑒 2 >0 i 𝜎 𝑢 2 ≥0 są tzw. komponentami wariancji, reprezentującymi odpowiednio wariancję błędów eksperymentalnych oraz wariancję losowych efektów obiektowych.

Przy wcześniejszych założeniach możemy zapisać: 𝑦~ 𝑁 𝑛 𝑋𝛽,𝑉 𝑉= 𝜎 𝑒 2 𝜌𝑍𝐻𝑍`+ 𝐼 𝑛 𝜌= 𝜎 𝑢 2 𝜎 𝑒 2 jest ilorazem komponentów wariancji

IV. Estymacja komponentów metodą REML Spośród wielu metod estymacji komponentów wariancji wybrano znaną metodę REML. Stąd uzasadnione jest przyjęcie we wstępie założenia o normalności rozkładu zmiennej losowej 𝑦. Zasada metody REML polega na wydzieleniu w funkcji gęstości wielowymiarowego rozkładu normalnego dwóch czynników, z których pierwszy wystarcza do estymacji komponentów wariancji (nie zależy od wektora parametrów stałych), drugi zaś zależy zarówno od wektora parametrów stałych jak i komponentów wariancji. W rozważanym modelu podział ten daje się zapisać: 𝑔 𝑦 𝜎,𝛽 = 𝑔 1 𝑀 1 𝑦 𝜎 ∙ 𝑔 2 𝑀 2 𝑦 𝜎,𝛽 𝑔, 𝑔 1 , 𝑔 2 oznaczają odpowiednie funkcje gęstości wielowymiarowego rozkładu normalnego oraz wymienionych wyżej czynników. Macierz 𝑀 1 jest podmacierzą pełnego rzędu wierszowego macierzy: 𝐼 𝑛 −𝑋 𝑋 ` 𝑋 −1 𝑋 ` oraz 𝑀 2 = 𝑋 ` 𝑉 −1 , 𝜎= 𝜎 𝑢 2 , 𝜎 𝑒 2

Dalsze postępowanie polega na niezależnej maksymalizacji funkcji 𝑔 1 i 𝑔 2 . Postępowanie to sprowadza się rozwiązania układu równań nieliniowych: 𝑆𝜎=𝑞, w którym elementy 𝑠 𝑖𝑗 macierzy 𝑆 oraz 𝑞 𝑖 wektora 𝑞 𝑖,𝑗=0,1,⋯,𝑚 mają następującą postać ogólną (zależną od nieznanych 𝜎 𝑖 2 , 𝑖=0,1,⋯,𝑚): 𝑠 𝑖𝑗 =𝑡𝑟 𝑃 𝑉 𝑖 𝑃 𝑉 𝑗 𝑞 𝑖 = 𝑦 ` 𝑃 𝑉 𝑖 𝑃𝑦 , gdzie 𝑃= 𝑉 −1 − 𝑉 −1 𝑋 𝑋 ` 𝑉 −1 𝑋 − 𝑋 ` 𝑉 −1

V. Kryterium wyboru modelu Predyktor dla wektora efektów losowych 𝑢 = 𝜎 𝑢 2 𝐻 𝑍 ` 𝑉 −1 𝑦−𝑋 𝛽 =𝜌𝐻 𝑍 ` 𝜌𝑍𝐻 𝑍 ` + 𝐼 𝑛 −1 𝑦−𝑋 𝛽 𝛽 = 𝑋 ` 𝑊𝑋 −1 𝑋 ` 𝑊𝑦 𝑢 =𝜌𝐻 𝑍 ` 𝜌𝑍𝐻 𝑍 ` + 𝐼 𝑛 −1 𝑦−𝑋 𝑋 ` 𝑊𝑋 −1 𝑋 ` 𝑊𝑦 =⋯= =𝜌𝐻 𝑍 ` 𝑉 −1 − 𝑉 −1 𝑋 𝑋 ` 𝑉 −1 𝑋 −1 𝑋 ` 𝑉 −1 𝑦=𝜌𝐻 𝑍 ` 𝑃𝑦 gdzie 𝑊= 𝑉 −1 oraz 𝝆= 𝝈 𝒖 𝟐 𝝈 𝒆 𝟐

1. W miejsce macierzy 𝜎 𝑢 2 𝐻 przyjmujemy macierz 𝜎 𝑖 2 𝐼 𝑞 nieznana struktury zależności między obiektami 2. W miejsce macierzy 𝜎 𝑢 2 𝐻 przyjmujemy 𝜎 𝑎 2 𝐴 macierz 𝐴 zawiera wartości współczynników pokrewieństwa rodowodowego (animal model-model zwierzęcia) 3. W miejsce macierzy 𝜎 𝑢 2 𝐻 przyjmujemy 𝜎 𝑔 2 𝐺 macierz 𝐺 zawiera wartości współczynników podobieństwa molekularnego