Selekcja - nowe perspektywy Maciej Szydłowski 2007
Selekcja z wykorzystaniem informacji markerowej (MAS) Nie wymaga znajomości genów, ale tylko ich położenia (QTL) Korzysta z asocjacji pośredniej Asocjacja pośrednia Fenotyp Asocjacja bezpośrednia Asocjacja bezpośrednia Haplotyp Nie obserwowana mutacja funkcjonalna Marker
Największa korzyść dla cech: O niskim h2 (np. odporność, płodność) Trudnych lub drogich w pomiarze (np. oporność na pasożyty) Nie obserwowanych, gdy można już podjąć decyzje selekcyjne (np. mleczność, jakość tuszy)
Część zmienności genetycznej opisanej markerami MAS - oczekiwania sprzed 17 lat Efektywność MAS w stosunku do selekcji tradycyjnej ...i stan dzisiejszy Część zmienności genetycznej opisanej markerami Lande i Thompson 1990, Genetics 124: 743-756
assocjacja (LD) inna w każdej rodzinie Francja - bydło mleczne (od 2001) 14 QTL 2-3 mikrosatelity / QTL assocjacja (LD) inna w każdej rodzinie Skutki poniżej, a koszty powyżej oczekiwań (Didier Boichard, Utrecht 2007)
Mapowanie QTL dla liczby komórek somatycznych Przyczyny braku postępu Mała precyzja mapowania QTL zwierząt? Brak genów o dużych efektach? 10 cM 10 mln pz 83 geny Sahana et al. 2007. Fine Mapping of QTL for Mastitis Resistance on BTA11 in Three Nordic Red Cattle Breeds, EAAP Meeting
Mapy-matryce w oparciu o mikromacierze SNP SNP = polimorfizm podstawień pojedynczych nukleotydów bardzo liczne markery każdy o dwóch allelach (wariantach) Bydło mleczne 60 000 SNP - 2008r Świnie 8 000 SNP - 2007r Kury w użyciu, gęstość? Owce w konstrukcji Mikromacierz firmy Affymetrix pozwala oznaczyć 500 000 SNP u jednej osoby
Poszukiwanie QTL człowieka – przykład 1 Produkcja erytrocytów zawierających hemoglobinę płodową (ważna w leczeniu niedokrwistości). h2 = 0,89 3 QTL odpowiada za 44% zmienności ogólnej Assocjacje ( -log10(P) ) markerów na 23 chromosomach człowieka. Spośród 308 015 markerów tylko 3225 wykazywało P<0,01 Menzel i in. 2007, Nature Genetics 39: 1197-1199
Poszukiwanie QTL człowieka - przykład 2 Materiał Wzrost – wysokie h2 35 000 białych Europejczyków 364 301 markerów SNP Wynik Tylko jeden gen (HMGA2) Efekt genu = 0,4 cm 0,3% zmienności cechy Weedon i in. 2007, Nature Genetics 39: 1245-1250
Wnioski Cechy produkcyjne są prawdopodobnie uwarunkowane genami o małych efektach Ich wykrycie jest małoprawdopodobne Pierwotna wersja MAS ma małe szanse powodzenia
Selekcja genomowa – nowy wersja MAS Tysiące markerów SNP szkicują ogólną zmienność genomów zwierząt Zmienność doskonalonej cechy rozpisujemy na cały genom Wartości hodowlane kandydatów odczytujemy ustalając ich genomy Lokalizacja QTL i identyfikacja genów ma znaczenie drugorzędne dla selekcji
Rozpatrywane warianty: na podstawie SNP na podstawie haplotypów Selekcja genomowa Rozpatrywane warianty: na podstawie SNP na podstawie haplotypów na podstawie analizy spokrewnień
GG +1 kg TA 0 kg TT +4 kg Selekcja genomowa na podstawie SNP C A G I. Ocena pośrednich efektów SNP SNP 1 SNP 2 SNP 3 . ...GATCGGATT...TATGGTTAAGGA...GGGTATGGTG... C A G G +0,5 kg C - 0,5 kg T +1 kg A - 1 kg T +2 kg G - 2 kg II. Wczesna ocena zarodków / zwierząt na podstawie ich genotypu GG +1 kg TA 0 kg TT +4 kg = + 5 kg
Badania symulacyjne dla cechy niskoodziedziczalnej (h2=10%) Etap I 3 pokolenia uczące oceny zwierząt na podstawie genomu Ocena efektów SNP Ocena W.H. na podstawie fenotypów i markerów Przewaga w dokładności nad BLUP do 30% Etap II Pokolenia bez kontroli użytkowości Ocena tylko na podstawie genomu BLUP na podstawie przodków Przewaga w dokładności nad BLUP do 45%, ale zanika po 7 pokoleniach Muir WM 2007. Genomic selection: a break through for application of marker assisted selection to traits of low heritability, promise and concers, EAAP Meeting
Uwaga! Wyniki symulacji są różne Zależą od przyjętych założeń Wiedza o dziedziczeniu cech ilościowych jest relatywnie mała Nie wiemy jakie założenia przyjąć
Selekcja genomowa na podstawie SNP Problemy Nadmiar SNP (mniej znaczy więcej?) Trudna ocena efektów SNP z powodu statystycznej korelacji między nimi Ignorujemy funkcjonalne interakcje między SNP
Rozpatrywane warianty: na podstawie SNP na podstawie haplotypów Selekcja genomowa Rozpatrywane warianty: na podstawie SNP na podstawie haplotypów na podstawie analizy spokrewnień
Nowoodkryta struktura genomów Zmienność genomów w populacji ma charakter blokowy Zmienność w każdym bloku jest relatywnie mała (rzadkie rekombinacje, kilka haplotypów) Między blokami rekombinacje zachodzą często, a bloki są mało od siebie zależne wiele pokoleń
Znaczenie haplotypów A C T G SNP 1 SNP 2 Haplotyp Białko Mutacja 1 Interakcja T G Zmiana pofałdowania
Selekcja genomowa na podstawie haplotypów Chromosom haplotyp 1 +5 kg haplotyp 2 -2 kg haplotyp 3 -3 kg Trudność: Oznaczanie haplotypów osobnika metodą molekularną jest praktycznie niemożliwe
Oznaczanie haplotypów (1) Chromosom 1 Chromosom 2 Chromosom 3 Chromosom 4 (a) Sekwencjonowanie wielu chromosomów od wielu osobników w populacji doświadczalnej Haplotyp 1 Haplotyp 2 Haplotyp 3 Haplotyp 4 (b) Sąsiadujące SNP, które się dziedziczą wspólnie, są łączone w bloki haplotypowe. Haplotypy są zbierane w bazie danych. (c) Znaczniki - kilka dobrze wybranych SNP identyfikują wszystkie warianty haplotypów.
Oznaczanie haplotypów (2) A/G T/T C/C (b) Ustalenie haplotypów na podstawie haplotypowej bazy danych (a) Genotypowanie znacznikowych SNP
Rzadkie haplotypy zwiększają błąd oceny W.H. Selekcja genomowa na podstawie haplotypów Problemy Rzadkie haplotypy zwiększają błąd oceny W.H. Niektóre haplotypy mają podobny efekt, ale są traktowane oddzielnie Położenie i wielkość bloków są różne dla poszczególnych ras i populacji – trudne oznaczenie haplotypów
Rozpatrywane warianty: na podstawie SNP na podstawie haplotypów Selekcja genomowa Rozpatrywane warianty: na podstawie SNP na podstawie haplotypów na podstawie analizy spokrewnień
Tradycyjne spokrewnienie Oparte na rodowodzie Osobniki o nieznanym pochodzeniu nie są spokrewnione (mają niezależne W.H.) Przykład dla rodzeństwa Dzielą przeciętnie 50% DNA o tym samym pochodzeniu Faktycznie dzielą 45-55% Młode buhajki-bracia mają taką samą wartość hodowlaną (fałsz)
Rodowód tradycyjny Ojciec ojca Ojciec Matka ojca Osobnik Ojciec matki Pozwala ustalić oczekiwany udział DNA o wspólnym pochodzeniu Ojciec ojca Ojciec Matka ojca Osobnik Ojciec matki Matka Matka matki
Rodowód genomowy Pozwala ustalić faktyczny udział DNA o wspólnym pochodzeniu
Rodowód haplotypowy Pozwala ustalić współdzielenie najważniejszych haplotypów dla doskonalonej cechy ATAGATCGATCG CTGTAGCGATCG CTGTAGCTTAGG AGATCTAGATCG AGGGCGCGCAGT CGATCTAGATCG CTGTCTAGATCG ATGTCGCGCAGT CGGTAGATCAGT AGAGATCGCAGT AGAGATCGATCT ATGTCGCTCACG ATGGCGCGAACG CTATCGCTCAGG
A = oczekiwany % genów identycznego pochodzenia Miary spokrewnienia A = oczekiwany % genów identycznego pochodzenia Liczony tylko na podstawie rodowodu Wykorzystywana w BLUP-AM G = % identycznych genów ogółem Na podstawie markerów Wszystkie osobniki są spokrewnione (wzrost dokładności oceny) T = % identycznych genów kształtujących cechę Na podstawie markerów i fenotypów Jeszcze bardziej dokładny w ocenie konkretnej cechy Nowość Przyszłość
A G Dokładność oceny W.H. na podstawie rodzeństwa Rodzeństwo 1 .250 Symulacja 1000 QTL 50 000 markerów Spokrewnienie rodowodowe Spokrewnienie genomowe Rodzeństwo A G 1 .250 .261 10 .454 .502 100 .495 .773 1000 .499 .970 VanRaden i Tooker 2007, ADSA Joint meeting, SanAntonio
Podsumowanie Możliwość wielkoskalowej analizy SNP otwiera drogę selekcji genomowej Jej praktyczne wykorzystanie będzie wymagało wielu rozwiązań statystycznych, informatycznych i organizacyjnych Mała wiedza o dziedziczeniu cech ilościowych nie pozwala na wiarygodną symulację korzyści hodowlanych Perspektywy Potencjalnie większy postęp hodowlany przy mniejszych kosztach Zastosowanie na szeroką skalę przyczyni się do lepszego poznania dziedziczenia cech ilościowych
Serdecznie dziękuję dr. Paulowi Van Radenowi za inspirację i wspólne rozmowy