Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

Co nas interesuje? Czy w danym fragmencie DNA jest jakiś gen? W którym miejscu? Gdzie są introny a gdzie eksony? Gdzie jest promotor?

Podobne prezentacje


Prezentacja na temat: "Co nas interesuje? Czy w danym fragmencie DNA jest jakiś gen? W którym miejscu? Gdzie są introny a gdzie eksony? Gdzie jest promotor?"— Zapis prezentacji:

1 Co nas interesuje? Czy w danym fragmencie DNA jest jakiś gen? W którym miejscu? Gdzie są introny a gdzie eksony? Gdzie jest promotor?

2 Strategie poszukiwania genów Metody oparte na składzie Metody oparte na sygnałach Metody porównawcze

3 Metody oparte na składzie Rozpatrują: używalność poszczególnych kodonów okresowość wystąpienia powtórzeń złożoność składu sekwencji

4 Metody oparte na sygnałach Rozpatrują występowanie: miejsc sklejania eksonów i wycinania intronów miejsc wiązania czynników transkrypcyjnych miejsc poliadenylacji kodonów START i STOP translacji

5 Metody porównawcze Potencjalny region kodujący Tłumaczenie na sekwencja białkową Porównanie z bazą danych znanych sekwencji

6 ORF - open reading frames czyli otwarte ramki odczytu Zaczynają się kodonem START (Met), kończą kodonem STOP i zawierają ciągłą sekwencję kodonów. Zawsze jest 6 możliwości: dla sekwencji komplementarnej (zawsze od 5 do 3) Najdłuższa ramka odczytu z reguły jest prawdziwa (w nie kodujących zazwyczaj znajdzie się po drodze przypadkowy kodon STOP). Dobry sposób predykcji, ale tylko dla sekwencji prokariotycznych - introny zqwieraja zwykle przypadkowe kodony STOP

7 Mapa ORF dla Pseudomonas aeruginosa: genyamiC i amiR Pseudomonas aeruginosa; Bacteria; Proteobacteria program plotorf (EMBOSS): start=ATG stop=TAA, TAG, TGA

8 Zjawiska pozwalające ocenić wiarygodność przewidywanych ORF Kodony z sekwencjach kodujących pojawiają się w sposób uporządkowany, a nie całkiem losowy jak w sekwencjach niekodujących. Poszczególne gatunki z różną częstością wykorzystują rożne kodony. Różne geny posiadają często podobne sekwencje.

9 Statystyka TESTCODE W sekwencjach kodujących obserwuje się tendencje do powtarzania się co trzeciej zasady. Zjawisko niezależne od gatunku! Statystyka TESTCODE odzwierciedla tę tendencje. TESTCODE < 0.74 prawdopodobnie region nie kodujący, > 0.95 prawdopodobnie region kodujący, Inny wynik nie mówi nic o sekwencji.

10 Program tcode Pseudomonas aeruginosa: geny amiC i amiR

11 Gatunki różnią się wykorzystaniem kodonów Homo sapiens Saccharomyces cerevisiae UUC UUA UUG 21% 7% 12% 18% 26% 27% LEUCYNA

12 Program CUSP Kodon Aminokwas Udział CTA L CTC L CTG L CTT L TTA L TTG L Pseudomonas aeruginosa: geny amiC i amiR

13 ....CTGGTTTATTGTGCAG TTGACA.....TATAAT GGAGG ATG-otwarta ramka odczytu-TAA konsensus dla miejsca wiązania represora region promotora miejsce wiązania rybosomu na mRNA Sekwencje konserwatywne w regionach regulatorowych genu lexA u E. coli Sygnały w genomie E. coli

14 Sygnały u eukariotów

15 Analiza dyskryminacyjna Metoda klasyfikacji sekwencji na podstawie dwóch lub więcej statystyk: ocena EPS (exon preference score) - odzwierciedla nielosowość w wykorzystaniu par kodonów z eksonach ocena FSS (3-flanking splice site score)

16 Analiza dyskryminacyjna

17 Hidden Markov Model

18 Trzy zagadnienia dla HMM Znając parametry modelu (a, b), jakie jest prawdopodobieństwo zajścia sekwencji y? Algorytm forward Znając parametry modelu oraz sekwencje y, jaka jest najbardziej prawdopodobna sekwencja x? Algorytm Viterbiego Znając y, jakie są parametry modelu (a i b)? - algorytm forward-backward

19 3 kodony STOP Sekwencja między genowa ATG 61 kodonów HMM dla E.coli

20 HMM dla kodonu AAG początek koniec A A G = insercja = delecja

21 Sieć neuronowa

22 Programy do predykcji genów HMMgene GRAIL - sieć neuronowa MZEF - analiza dyskryminacyjna


Pobierz ppt "Co nas interesuje? Czy w danym fragmencie DNA jest jakiś gen? W którym miejscu? Gdzie są introny a gdzie eksony? Gdzie jest promotor?"

Podobne prezentacje


Reklamy Google