Nowe warianty selekcji z wykorzystaniem markerów genetycznych Profil ekspresji genów jako kryterium selekcji Dobrostan zwierząt: nowe wyzwanie dla hodowców
Nowe warianty selekcji z wykorzystaniem markerów genetycznych Maciej Szydłowski 2007
Selekcja z wykorzystaniem informacji markerowej (MAS) Nie wymaga znajomości genów, ale tylko ich położenia (QTL) Korzysta z asocjacji pośredniej Asocjacja pośrednia Fenotyp Asocjacja bezpośrednia Asocjacja bezpośrednia Haplotyp Nie obserwowana mutacja funkcjonalna Marker
Największa korzyść dla cech: O niskim h2 (np. odporność, płodność) Trudnych lub drogich w pomiarze (np. oporność na pasożyty) Nie obserwowanych, gdy można już podjąć decyzje selekcyjne (np. mleczność, jakość tuszy)
assocjacja (LD) inna w każdej rodzinie Francja - bydło mleczne (od 2001) 14 QTL 2-3 mikrosatelity / QTL assocjacja (LD) inna w każdej rodzinie Skutki poniżej, a koszty powyżej oczekiwań (Didier Boichard, Utrecht 2007)
Część zmienności genetycznej opisanej markerami MAS - oczekiwania sprzed 17 lat Efektywność MAS w stosunku do selekcji tradycyjnej ...i stan dzisiejszy Część zmienności genetycznej opisanej markerami Lande i Thompson 1990, Genetics 124: 743-756
Mapowanie QTL dla liczby komórek somatycznych Przyczyny braku postępu Mała precyzja mapowania QTL zwierząt? Brak genów o dużych efektach? 10 cM 10 mln pz 83 geny Sahana et al. 2007. Fine Mapping of QTL for Mastitis Resistance on BTA11 in Three Nordic Red Cattle Breeds, EAAP Meeting
Mapy-matryce w oparciu o mikromacierze SNP SNP = polimorfizm podstawień pojedynczych nukleotydów bardzo liczne markery każdy o dwóch allelach (wariantach) Bydło mleczne 60 000 SNP - 2008r Świnie 8 000 SNP - 2007r Kury w użyciu, gęstość? Owce w konstrukcji Mikromacierz firmy Affymetrix pozwala oznaczyć 906 600 SNP u jednej osoby
Poszukiwanie QTL człowieka - przykład Materiał Wzrost – wysokie h2 35 000 białych Europejczyków 364 301 markerów SNP Wynik Tylko jeden gen (HMGA2) Efekt genu = 0,4 cm 0,3% zmienności cechy Weedon i in. 2007, Nature Genetics 39: 1245-1250
Poszukiwanie QTL człowieka – przykład Produkcja erytrocytów zawierających hemoglobinę płodową (ważna w leczeniu niedokrwistości). h2 = 0,89 3 QTL odpowiada za 44% zmienności ogólnej Assocjacje ( -log10(P) ) markerów na 23 chromosomach człowieka. Spośród 308 015 markerów tylko 3225 wykazywało P<0,01 Menzel i in. 2007, Nature Genetics 39: 1197-1199
Wnioski Cechy produkcyjne są prawdopodobnie uwarunkowane genami o małych efektach Ich wykrycie jest mało prawdopodobne Należy zmienić strategię MAS
Selekcja genomowa – nowy wersja MAS Używamy tysiące markerów SNP, bez względu na ich lokalizacje Każdy ma wcześniej oszacowany efekt Wartość hodowlana to suma efektów Lokalizacja QTL i identyfikacja genów ma znaczenie drugorzędne
Rozpatrywane warianty: na podstawie SNP na podstawie haplotypów Selekcja genomowa Rozpatrywane warianty: na podstawie SNP na podstawie haplotypów na podstawie analizy spokrewnień
GG +1 kg TA 0 kg TT +4 kg Selekcja genomowa na podstawie SNP C A G I. Ocena pośrednich efektów SNP SNP 1 SNP 2 SNP 3 . ...GATCGGATT...TATGGTTAAGGA...GGGTATGGTG... C A G G +0,5 kg C - 0,5 kg T +1 kg A - 1 kg T +2 kg G - 2 kg II. Wczesna ocena zarodków / zwierząt na podstawie ich genotypu GG +1 kg TA 0 kg TT +4 kg = + 5 kg
Badania symulacyjne dla cechy niskoodziedziczalnej (h2=10%) Etap I 3 pokolenia uczące oceny zwierząt na podstawie genomu Ocena efektów SNP Ocena W.H. na podstawie fenotypów i markerów Przewaga w dokładności nad BLUP do 30% Etap II Pokolenia bez kontroli użytkowości Ocena tylko na podstawie genomu BLUP na podstawie przodków Przewaga w dokładności nad BLUP do 45%, ale zanika po 7 pokoleniach Muir WM 2007. Genomic selection: a break through for application of marker assisted selection to traits of low heritability, promise and concers, EAAP Meeting
Uwaga! Wyniki symulacji są różne Zależą od przyjętych założeń Wiedza o dziedziczeniu cech ilościowych jest relatywnie mała Nie wiemy jakie założenia przyjąć
Selekcja genomowa na podstawie SNP Problemy Nadmiar SNP (mniej znaczy więcej?) Trudna ocena efektów SNP z powodu statystycznej korelacji między nimi Ignorujemy funkcjonalne interakcje między SNP
Haplotyp = zestaw alleli zwykle dziedziczonych wspólnie Selekcja genomowa Rozpatrywane warianty: na podstawie SNP na podstawie haplotypów na podstawie analizy spokrewnień Haplotyp = zestaw alleli zwykle dziedziczonych wspólnie
Nowoodkryta struktura genomów Zmienność genomów w populacji ma charakter blokowy Zmienność w każdym bloku jest relatywnie mała (rzadkie rekombinacje, kilka haplotypów) Między blokami rekombinacje zachodzą często, a bloki są mało od siebie zależne wiele pokoleń
Znaczenie haplotypów A C T G SNP 1 SNP 2 Haplotyp Białko Mutacja 1 Interakcja T G Zmiana pofałdowania
Selekcja genomowa na podstawie haplotypów Chromosom haplotyp 1 +5 kg haplotyp 2 -2 kg haplotyp 3 -3 kg Trudność: Oznaczanie haplotypów osobnika metodą molekularną jest praktycznie niemożliwe
Oznaczanie haplotypów (1) Chromosom 1 Chromosom 2 Chromosom 3 Chromosom 4 (a) Sekwencjonowanie wielu chromosomów od wielu osobników w populacji doświadczalnej Haplotyp 1 Haplotyp 2 Haplotyp 3 Haplotyp 4 (b) Sąsiadujące SNP, które się dziedziczą wspólnie, są łączone w bloki haplotypowe. Haplotypy są zbierane w bazie danych. (c) Znaczniki - kilka dobrze wybranych SNP identyfikują wszystkie warianty haplotypów.
Oznaczanie haplotypów (2) A/G T/T C/C (b) Ustalenie haplotypów na podstawie haplotypowej bazy danych (a) Genotypowanie znacznikowych SNP
Rzadkie haplotypy zwiększają błąd oceny wartości hodowlanej Selekcja genomowa na podstawie haplotypów Problemy Rzadkie haplotypy zwiększają błąd oceny wartości hodowlanej Położenie i wielkość bloków haplotypowych różne dla poszczególnych ras i populacji
Rozpatrywane warianty: na podstawie SNP na podstawie haplotypów Selekcja genomowa Rozpatrywane warianty: na podstawie SNP na podstawie haplotypów na podstawie analizy spokrewnień
Rodowód tradycyjny Ojciec ojca Ojciec Matka ojca Osobnik Ojciec matki Pozwala ustalić oczekiwany udział DNA o wspólnym pochodzeniu Ojciec ojca Ojciec Matka ojca Osobnik Ojciec matki Matka Matka matki
Wady tradycyjnej miary spokrewnienia (A) Osobniki o nieznanym pochodzeniu nie są spokrewnione (fałsz) Młode buhajki-bracia mają taką samą wartość hodowlaną (fałsz)
Rodowód genomowy (G) Pozwala ustalić faktyczny udział DNA o wspólnym pochodzeniu
Rodowód haplotypowy (T) Pozwala ustalić współdzielenie najważniejszych haplotypów dla doskonalonej cechy ATAGATCGATCG CTGTAGCGATCG CTGTAGCTTAGG AGATCTAGATCG AGGGCGCGCAGT CGATCTAGATCG CTGTCTAGATCG ATGTCGCGCAGT CGGTAGATCAGT AGAGATCGCAGT AGAGATCGATCT ATGTCGCTCACG ATGGCGCGAACG CTATCGCTCAGG
A = oczekiwany % genów identycznego pochodzenia Miary spokrewnienia obecnie A = oczekiwany % genów identycznego pochodzenia Liczony tylko na podstawie rodowodu Wykorzystywana w BLUP-AM G = % identycznych genów ogółem Na podstawie markerów Wszystkie osobniki są spokrewnione (wzrost dokładności oceny) T = % identycznych genów kształtujących cechę Na podstawie markerów i fenotypów Jeszcze bardziej dokładny w ocenie konkretnej cechy Nowość Przyszłość
A G Dokładność oceny W.H. na podstawie rodzeństwa Rodzeństwo 1 25% 26% Symulacja 1000 QTL 50 000 markerów Spokrewnienie rodowodowe Spokrewnienie genomowe Rodzeństwo A G 1 25% 26% 10 45% 50% 100 49% 77% 1000 97% dokładność oceny wartości hodowlanej VanRaden i Tooker 2007, ADSA Joint meeting, SanAntonio
Podsumowanie Mikromacierze otwierają drogę selekcji genomowej Jej praktyczne wykorzystanie będzie wymagało wielu rozwiązań statystycznych, informatycznych i organizacyjnych Mała wiedza o dziedziczeniu cech ilościowych nie pozwala na wiarygodną symulację korzyści hodowlanych Perspektywy Potencjalnie większy postęp hodowlany przy mniejszych kosztach Zastosowanie na szeroką skalę przyczyni się do lepszego poznania dziedziczenia cech ilościowych
Serdecznie dziękuję dr. Paulowi Van Radenowi za inspirację i wspólne rozmowy