Pobierz prezentację
Pobieranie prezentacji. Proszę czekać
OpublikowałLudmił Nawrat Został zmieniony 11 lat temu
1
Co nas interesuje? Czy w danym fragmencie DNA jest jakiś gen?
W którym miejscu? Gdzie są introny a gdzie eksony? Gdzie jest promotor?
2
Strategie poszukiwania genów
Metody oparte na składzie Metody oparte na sygnałach Metody porównawcze
3
Metody oparte na składzie
Rozpatrują: używalność poszczególnych kodonów okresowość wystąpienia powtórzeń złożoność składu sekwencji
4
Metody oparte na sygnałach
Rozpatrują występowanie: miejsc sklejania eksonów i wycinania intronów miejsc wiązania czynników transkrypcyjnych miejsc poliadenylacji kodonów START i STOP translacji
5
Metody porównawcze Potencjalny region kodujący Tłumaczenie
na sekwencja białkową Porównanie z bazą danych znanych sekwencji
6
ORF - open reading frames czyli otwarte ramki odczytu
Zaczynają się kodonem START (Met), kończą kodonem STOP i zawierają ciągłą sekwencję kodonów. Zawsze jest 6 możliwości: dla sekwencji komplementarnej (zawsze od 5’ do 3’) Najdłuższa ramka odczytu z reguły jest prawdziwa (w nie kodujących zazwyczaj znajdzie się po drodze przypadkowy kodon STOP). Dobry sposób predykcji, ale tylko dla sekwencji prokariotycznych - introny zqwieraja zwykle przypadkowe kodony STOP
7
Mapa ORF dla Pseudomonas aeruginosa: genyamiC i amiR
Pseudomonas aeruginosa; Bacteria; Proteobacteria program plotorf (EMBOSS): start=ATG stop=TAA, TAG, TGA
8
Zjawiska pozwalające ocenić wiarygodność przewidywanych ORF
Kodony z sekwencjach kodujących pojawiają się w sposób uporządkowany, a nie całkiem losowy jak w sekwencjach niekodujących. Poszczególne gatunki z różną częstością wykorzystują rożne kodony. Różne geny posiadają często podobne sekwencje.
9
Statystyka TESTCODE W sekwencjach kodujących obserwuje się tendencje do powtarzania się co trzeciej zasady. Zjawisko niezależne od gatunku! Statystyka TESTCODE odzwierciedla tę tendencje. TESTCODE < 0.74 prawdopodobnie region nie kodujący, > 0.95 prawdopodobnie region kodujący, Inny wynik nie mówi nic o sekwencji.
10
Program tcode Pseudomonas aeruginosa: geny amiC i amiR
11
Gatunki różnią się wykorzystaniem kodonów
Saccharomyces cerevisiae Homo sapiens LEUCYNA UUC UUA UUG 18% 26% 27% 21% 7% 12%
12
Program CUSP Kodon Aminokwas Udział CTA L 0.130 CTC L 0.130
CTG L CTT L TTA L TTG L Pseudomonas aeruginosa: geny amiC i amiR
13
Sygnały w genomie E. coli
Sekwencje konserwatywne w regionach regulatorowych genu lexA u E. coli konsensus dla miejsca wiązania represora ....CTGGTTTATTGTGCAG TTGACA.....TATAAT GGAGG ATG-otwarta ramka odczytu-TAA region promotora miejsce wiązania rybosomu na mRNA
14
Sygnały u eukariotów
15
Analiza dyskryminacyjna
Metoda klasyfikacji sekwencji na podstawie dwóch lub więcej statystyk: ocena EPS (exon preference score) - odzwierciedla nielosowość w wykorzystaniu par kodonów z eksonach ocena FSS (3’-flanking splice site score)
16
Analiza dyskryminacyjna
17
Hidden Markov Model
18
Trzy zagadnienia dla HMM
Znając parametry modelu (a, b), jakie jest prawdopodobieństwo zajścia sekwencji y? Algorytm forward Znając parametry modelu oraz sekwencje y, jaka jest najbardziej prawdopodobna sekwencja x? Algorytm Viterbiego Znając y, jakie są parametry modelu (a i b)? - algorytm forward-backward
19
HMM dla E.coli 61 kodonów 3 kodony STOP Sekwencja między genowa ATG
20
HMM dla kodonu AAG A G koniec A początek = insercja = delecja
21
Sieć neuronowa
22
Programy do predykcji genów
HMMgene GRAIL - sieć neuronowa MZEF - analiza dyskryminacyjna
Podobne prezentacje
© 2024 SlidePlayer.pl Inc.
All rights reserved.