Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

Laboratorium nr.3 Algorytm przyrównania globalnego

Podobne prezentacje


Prezentacja na temat: "Laboratorium nr.3 Algorytm przyrównania globalnego"— Zapis prezentacji:

1 Laboratorium nr.3 Algorytm przyrównania globalnego
(Algorytm Needleman’a-Wunsch’a) – przyrównuje sekwencje na całej długości; wykorzystuje tak dużo znaków, jak to jest tylko możliwe.

2 Dopasowywanie sekwencji (ang. sequence alignment)
Dopasowywanie (przyrównywanie) sekwencji polega na porównywaniu dwóch (z j. ang. pair-wise alignment) lub wielu sekwencji poprzez poszukiwanie serii pojedynczych znaków (lub wzorców znakowych), które występują w tej samej kolejności w sekwencjach; – najprostszy przypadek: zapisanie dwóch sekwencji obok siebie – identyczne lub podobne znaki są umieszczane w tej samej kolumnie - znaki, których nie można dopasować są ustawiane w jednej kolumnie i oznaczane jako brak dopasowania lub ustawiane naprzeciw przerwy (z j.ang. gap) - w przypadku optymalnego dopasowania, przerwy i braki dopasowania są tak ustawiane aby liczba znaków identycznych lub podobnych była możliwie największa – sekwencje, które bez problemu potrafimy w powyższy sposób ustawić określane są mianem podobnych

3 W oparciu o algorytm Needlemana-Wunscha przeprowadzimy przyrównanie dwóch sekwencji: GATACTA oraz GATTACCA TWORZYMY MACIERZ Wypełniamy 1 wiersz i 1 kolumnę: -1 pkt za każde przesunięcie w lewo -1 pkt za każde przesunięcie w dół

4 W oparciu o algorytm Needlemana-Wunscha przeprowadzimy przyrównanie dwóch sekwencji: GATACTA oraz GATTACCA Zasady wypełniania komórek: komórka F(1,1) przesunięcie w prawo pkt – 1 = -2 przesunięcie w dół pkt – 1 = -2 przesunięcie po przekątnej: litery w komórce identyczne G-G więc +1pkt = 1 Wybierz max wartość wstaw w komórkę F(1,1)

5 W oparciu o algorytm Needlemana-Wunscha przeprowadzimy przyrównanie dwóch sekwencji: GATACTA oraz GATTACCA Zasady wypełniania komórek: komórka F(1,2) przesunięcie w prawo pkt – 1 = 0 przesunięcie w dół pkt – 1 = -3 przesunięcie po przekątnej litery w komórkach różne A-G więc -1pkt = -2 Wybierz max wartość wstaw w komórkę F(1,2) itd……

6 W oparciu o algorytm Needlemana-Wunscha przeprowadzimy przyrównanie dwóch sekwencji: GATACTA oraz GATTACCA Zasady wypełniania komórek: komórka F(2,4) przesunięcie w prawo pkt – 1 = 0 przesunięcie w dół pkt – 1 = -3 przesunięcie po przekątnej: litery w komórkach identyczne A - A pkt = 0 Wybierz max wartość wstaw w komórkę F(2,4)

7 PODSUMOWANIE wypełniania macierzy: F(i,j)- wartość w i,j-tej komórce d- kara za lukę (przesunięcie w dół lub w prawo równa -1) S(xi,yi)= nagroda np. +1 gdy znaki w komórkach xi i yi identyczne lub kara -1 gdy znaki w komórkach xi i yi różne

8 Konstrukcja dopasowania:
W oparciu o algorytm Needlemana-Wunscha przeprowadzimy przyrównanie dwóch sekwencji: GATACTA oraz GATTACCA Konstrukcja dopasowania: od prawego dolnego rogu macierzy poruszamy się w kierunku lewego górnego rogu macierzy po najkrótszej ścieżce, która daje nam max wartość sumy z liczonych komórek.

9 Teraz szukamy ścieżki/-ek najlepszego dopasowania sekwencji
=4

10 Zadanie Korzystając z algorytmu przyrównania globalnego Needleman’a-Wunsch’a porównaj dwie sekwencje białek: TTAAG oraz TTTCT dla macierzy podobieństwa s (patrz treści powyżej), wynik wyświetl na ekranie (pamiętaj w miejsce przerw wstaw znak „-”) Uwaga: Zadanie można zrealizować wiele sposobów np. zapisać sekwencje jako listy: dane1 = [' TTAAG '], dane2 = [' TTTCT '] zapisać sekwencje w plikach tekstowych itp. zapisać macierz podobieństwa s jako słownik porównując po 2 litery {'AA': 1, 'AG': -1, ‘AC': -1, ……}, lub zagnieżdżając słownik w słowniku {'A': {'A': 1, 'G': -1, 'C': -1, 'T': -1},……., korzystając z modułu numpy, tworząc macierz w pliku A T G C A T G C itd Warto zajrzeć na:


Pobierz ppt "Laboratorium nr.3 Algorytm przyrównania globalnego"

Podobne prezentacje


Reklamy Google