Podstawy i zastosowania bioinformatyki II Marek Kudła
BLAST
Jak działa BLAST? BAZA DANYCH podobne np. AGI AGL AGV niepodobny AGI np. FGT
BLAST Sekwencja białkowa Sekwencja DNA blastn blastp blastx tblastn tblastx
Pfam – Protein families Białka można grupować w rodziny na podstawie podobieństwa JEDNAK Często można wyróżnić określony motyw – domenę, czy sekwencję peptydową, która występuje u różnych, niespokrewnionych ze sobą pod innym względem białek. Taka domena często ma określoną specyficzną funkcję, np. aktywność helikazy, czy rybonukleazy
Baza danych Pfam zawiera informacje o takich domenach – opis funkcjonalny domeny, linki do struktur krystalograficznych oraz prawdopodobną sekwencję domeny w postaci multiple alignment lub Position Specific Score Matrix Znanych jest 7600 takich domen. 74% białek posiada przynajmniej jedną domenę w bazie Pfam.
Multiple alignment dla domen
Position Specific Score Matrix Pozycja 1: V 0,3 ; G 0,02 ; L 0,68 Pozycja 2: L 0,6 ; M 0,2 ; C 0,2 Pozycja 3: D 0,1 ; F 0,01 ; G 0,01 ; H 0,88 ……… Pozycja N: A 0,99 ; G 0,01
PSI-BLAST