Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

Co nas interesuje? Czy w danym fragmencie DNA jest jakiś gen?

Podobne prezentacje


Prezentacja na temat: "Co nas interesuje? Czy w danym fragmencie DNA jest jakiś gen?"— Zapis prezentacji:

1 Co nas interesuje? Czy w danym fragmencie DNA jest jakiś gen?
W którym miejscu? Gdzie są introny a gdzie eksony? Gdzie jest promotor?

2 Strategie poszukiwania genów
Metody oparte na składzie Metody oparte na sygnałach Metody porównawcze

3 Metody oparte na składzie
Rozpatrują: używalność poszczególnych kodonów okresowość wystąpienia powtórzeń złożoność składu sekwencji

4 Metody oparte na sygnałach
Rozpatrują występowanie: miejsc sklejania eksonów i wycinania intronów miejsc wiązania czynników transkrypcyjnych miejsc poliadenylacji kodonów START i STOP translacji

5 Metody porównawcze Potencjalny region kodujący Tłumaczenie
na sekwencja białkową Porównanie z bazą danych znanych sekwencji

6 ORF - open reading frames czyli otwarte ramki odczytu
Zaczynają się kodonem START (Met), kończą kodonem STOP i zawierają ciągłą sekwencję kodonów. Zawsze jest 6 możliwości: dla sekwencji komplementarnej (zawsze od 5’ do 3’) Najdłuższa ramka odczytu z reguły jest prawdziwa (w nie kodujących zazwyczaj znajdzie się po drodze przypadkowy kodon STOP). Dobry sposób predykcji, ale tylko dla sekwencji prokariotycznych - introny zqwieraja zwykle przypadkowe kodony STOP

7 Mapa ORF dla Pseudomonas aeruginosa: genyamiC i amiR
Pseudomonas aeruginosa; Bacteria; Proteobacteria program plotorf (EMBOSS): start=ATG stop=TAA, TAG, TGA

8 Zjawiska pozwalające ocenić wiarygodność przewidywanych ORF
Kodony z sekwencjach kodujących pojawiają się w sposób uporządkowany, a nie całkiem losowy jak w sekwencjach niekodujących. Poszczególne gatunki z różną częstością wykorzystują rożne kodony. Różne geny posiadają często podobne sekwencje.

9 Statystyka TESTCODE W sekwencjach kodujących obserwuje się tendencje do powtarzania się co trzeciej zasady. Zjawisko niezależne od gatunku! Statystyka TESTCODE odzwierciedla tę tendencje. TESTCODE < 0.74 prawdopodobnie region nie kodujący, > 0.95 prawdopodobnie region kodujący, Inny wynik nie mówi nic o sekwencji.

10 Program tcode Pseudomonas aeruginosa: geny amiC i amiR

11 Gatunki różnią się wykorzystaniem kodonów
Saccharomyces cerevisiae Homo sapiens LEUCYNA UUC UUA UUG 18% 26% 27% 21% 7% 12%

12 Program CUSP Kodon Aminokwas Udział CTA L 0.130 CTC L 0.130
CTG L CTT L TTA L TTG L Pseudomonas aeruginosa: geny amiC i amiR

13 Sygnały w genomie E. coli
Sekwencje konserwatywne w regionach regulatorowych genu lexA u E. coli konsensus dla miejsca wiązania represora ....CTGGTTTATTGTGCAG TTGACA.....TATAAT GGAGG ATG-otwarta ramka odczytu-TAA region promotora miejsce wiązania rybosomu na mRNA

14 Sygnały u eukariotów

15 Analiza dyskryminacyjna
Metoda klasyfikacji sekwencji na podstawie dwóch lub więcej statystyk: ocena EPS (exon preference score) - odzwierciedla nielosowość w wykorzystaniu par kodonów z eksonach ocena FSS (3’-flanking splice site score)

16 Analiza dyskryminacyjna

17 Hidden Markov Model

18 Trzy zagadnienia dla HMM
Znając parametry modelu (a, b), jakie jest prawdopodobieństwo zajścia sekwencji y? Algorytm forward Znając parametry modelu oraz sekwencje y, jaka jest najbardziej prawdopodobna sekwencja x? Algorytm Viterbiego Znając y, jakie są parametry modelu (a i b)? - algorytm forward-backward

19 HMM dla E.coli 61 kodonów 3 kodony STOP Sekwencja między genowa ATG

20 HMM dla kodonu AAG A G koniec A początek = insercja = delecja

21 Sieć neuronowa

22 Programy do predykcji genów
HMMgene GRAIL - sieć neuronowa MZEF - analiza dyskryminacyjna


Pobierz ppt "Co nas interesuje? Czy w danym fragmencie DNA jest jakiś gen?"

Podobne prezentacje


Reklamy Google