Bioinformatyczna analiza danych Wykład 1 Dr Wioleta Drobik-Czwarno Katedra Genetyki i Ogólnej Hodowli Zwierząt
Sprawy organizacyjne Prowadzący przedmiot: Dr Wioleta Drobik-Czwarno – koordynator przedmiotu, wykłady, ćwiczenia Pokój:35 (Katedra Genetyki i Ogólnej Hodowli Zwierząt) Telefon: 22 59 36582 Email: wioleta.drobik@gmail.com; wioleta_drobik@sggw.pl Konsultacje: wtorek 9-11 (lub inny termin po wcześniejszym umówieniu się) Dr Zuzanna Nowak – 1 blok ćwiczeniowy Pokój 28, email: zuzanna_nowak@sggw.pl Mgr inż. Marlena Wojciechowska – 1 blok ćwiczeniowy Pokój 23, email: marlena_wojciechowska@sggw.pl
Sprawy organizacyjne Organizacja przedmiotu ECTS: 3 pkt 10 h wykładów – 1 h wykładu w tygodniu 30 h ćwiczeń – 3 h ćwiczeń w tygodniu Planowane daty zakończenia zajęć: 22.05 (wykład, ćw gr 1) i 23.05 (ćw gr 2) – do uzgodnienia
Zasady zaliczenia przedmiotu Egzamin – 40% Pytania z części wykładowej i ćwiczeniowej Pytania otwarte – odpowiedź na kilka zdań, uzupełnianie, uszeregowanie Przykładowe pytania: Wymień znane ci rodzaje mikromacierzy DNA oraz ich zastosowanie W jakim celu wykonujemy analizę PCA przed GWAS? Wypisz etapy analizy bioinformatycznej mającej na celu wykrywanie polimorfizmów typu SNP na podstawie NGS.
Zasady zaliczenia części ćwiczeniowej Projekt ~ 40% oceny Prowadzący dostarcza: dane, zarys problemu badawczego Należy przygotować prezentację w której znajdą się: Wstęp, zarys problemu badawczego Metodologia Wyniki Podsumowanie i wnioski Czas na prezentację projektu: 15-20 minut Grupy od 2 do 4 osób, istnieje możliwość przygotowania projektu samodzielnie.
Zasady zaliczenia części ćwiczeniowej Praca na zajęciach ~ 20% oceny Jak wyżej, czyli zaangażowanie w ćwiczenia, wykonanie przewidzianych analiz Po danym bloku tematycznym (co 1-2 tygodnie) każdy ma obowiązek nadesłać pytanie drogą mailową Czas - do czwartku w danym tygodniu zajęć Pytanie może dotyczyć wykładu lub ćwiczeń. Nie może być to pytanie, o coś na co odpowiedz była już podana. Pytamy o to czego nie zrozumieliśmy, co nas zaintrygowało, w stosunku do czego mamy wątpliwości.
Czym będziemy zajmowali się na zajęciach Programy do zaawansowanych analiz bioinformatycznych analiza danych z mikromacierzy SNP analiza stratyfikacji populacji (analiza głównych składowych PCA, ang. Principal Component Analysis) analiza asocjacyjna w skali genomu (GWAS, and. Genome-Wide Association Studies) sekwencjonowanie nowej generacji (NGS, ang. Next Generation Sequencing) analiza ekspresji genów Podstawy obsługi command line w systemie linux Podstawy programowania w języku Python Do czego przydaje się środowisko R w bioinformatyce
Mikromacierze DNA
Mikromacierze DNA Podstawowe rodzaje mikromacierzy DNA: Mikromacierze cDNA Mikromacierze oligonukleotydowe aCGH (ang. Agilent Comparative Genomic Hybridization) – porównawcza hybrydyzacja genomowa do mikromacierzy, służy do szacowania liczby kopii (ang. CNV)
Mikromacierze cDNA Umożliwia porównanie ekspresji genów w próbie eksperymentalnej i kontrolnej poprzez wyznakowanie prób dwoma różnymi barwnikami Etapy: Izolacja RNA Przepisanie RNA na komplementarny jednoniciowy DNA Dołączanie znakowanych nukleotydów do powstających cząsteczek DNA Wizualizacja wyników – natężenie fluorescencji jest proporcjonalna do ilości wyznakowanych cząstek Veronique Vermeeren and Luc Michiels (2011) Evolution towards the implementation of point-of-care biosensors. ISBN 978-953-307-443-6
Mikromacierze SNP Inaczej chipy DNA, mikromacierze genotypowe Służą do wykrywania wielu, nawet setek tysięcy polimofizmów jednocześnie Największe firmy biotechnologiczne zajmujące się produkcją chipów DNA dla ludzi i zwierząt: Affymetrix - statyczne chipy DNA, sondy syntetyzowane są bezpośrednio na płytce w technice fitolitografii Illumina - sondy zakotwiczone są na powierzchni silikonowych ziaren (ang. beads), każde ziarno to setki tysięcy kopii jednej sondy
Techniki wykrywania polimorfizmu DNA RFLP - polimorfizm długości fragmentów restrykcyjnych AFLP - polimorfizm długości amplifikowanych fragmentów SSCP - Polimorfizm konformacyjny jednoniciowych fragmentów RAPD - Polimorfizm losowo amplifikowanych fragmentów Polimorfizm sekwencji powtarzających się tandemowo Sekwencje mikrosatelitarne (STR) Sekwencje minisatelitarne (VNTR) Zmienność liczby kopii (CNV) Mikromacierze SNP Sekwencjonowanie
Mikromacierze SNP Izolacja DNA z materiału biologicznego Powielenie DNA w procesie amplifikacji oraz fragmentacja Naniesienie na powierzchnię mikromacierzy Hybrydyzacja jednoniciowych fragmentów DNA z sondami o komplementarnej sekwencji Wyznakowanie sondy poprzez dodanie znakowanego fluorescencyjnie nukleotydu Źródło: Affymetrix
Zastosowanie mikromacierzy SNP Zwierzęta: Badania asocjacyjne prowadzone na całym genomie (GWAS) Selekcja genomowa Kontrola pochodzenia Genetyka populacyjna Medycyna: Diagnostyka chorób genetycznych i chorób zakaźnych Wykrywanie aberracji chromosomowych Identyfikacja genów min. odporności na antybiotyki
Programy do analizy surowych danych z mikromacierzy SNP Illumina Genome Studio – demonstracja na ćwiczeniach Axiom Analysis Suite
Axiom Analysis Suite Umożliwia przeprowadzenie pełnej analizy w jednym programie Import plików Konfiguracja ustawień Ustawienia filtrów QC (ang. Quality Control) Domyślne ustawienia dla gatunków di- oraz poliploidalnych Wizualizacja wyników Np. Axiom CNV Summary Tool
A. Pliki .CEL B. Ustawienia analizy C. Kontrola jakości Przechowuje informację o poziomie intensywności fluorescencji każdej z sond mikromacierzowych B. Ustawienia analizy Przygotowywujemy pliki do dalszych analiz Nazywamy projekt C. Kontrola jakości Sample QC – jakość płytki, procent próbek, które przechodzą kontrolę jakości SNP QC – parametry jakości dotyczące markerów SNP
C. Kontrola jakości SNP Cluster Graph Generowane dla każdego markera
Literatura Charon K., Świtoński M. 2012. Genetyka i Genomika Zwierząt. PWN. Wojciechowska M., Olech W. 2013. Wykorzystanie mikromacierzy DNA w badaniach dzikich zwierząt. Studia i Materiały CEPL w Rogowie. R. 15. Zeszyt 36 / 3 / 2013. Platforma Affymetrix: http://www.affymetrix.com/ Platforma Illumina: https://www.illumina.com/