Laboratorium nr.3 Algorytm przyrównania globalnego

Slides:



Advertisements
Podobne prezentacje
Dokument HTML jest zwykłym
Advertisements

Egzamin.
Bioinformatyczne bazy danych
Wzory Cramera a Macierze
Badania operacyjne. Wykład 2
-Microsoft PowerPoint -Microsoft Word -Microsoft Excel
PRZYKŁAD ROZWIĄZANIA TARCZY
Procesor tekstu Word część 1
Paweł Kupis Jacek Mańdziuk
Edytor tekstu.
Tworzenie nowej biblioteki
KWADRAT PROSTOKĄT RÓWNOLEGŁOBOK ROMB TRAPEZ CZWOROKĄTY.
Jednomiany i sumy algebraiczne
PROJEKTOWANIE TABEL W PROGRAMIE: ACCESS
MODUŁ SZKOLENIOWY CZĘŚĆ 2. WYPEŁNIANIE SRP W WERSJI PAPIEROWEJ Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.
Algorytm Naiwny Ciąg znaków: A B D C E Wzorzec: A B.
ADRESOWANIE WZGLĘDNE I BEZWZGLĘDNE Ćwiczenia
Tworzenie prezentacji w programie PowerPoint
ARKUSZ KALKULACYJNY JUŻ PROŚCIEJ SIĘ NIE DA Wersja OFFICE 2010
Menu Tabela program Microsoft Word
Tajemnice klawiatury.
Wprowadzenie do edytorów tekstu.
Poznaj bliżej program Microsoft Office Word 2007
Algorytmy i Struktury Danych Typy algorytmów
TABLICE C++.
Do czego służą tabulatory?
Arkusz kalkulacyjny Microsoft Excel.
Edytor Vi.
Word Tabela.
Budowanie tabel i relacji
Technologie informacyjne EXCEL I
Formatowanie tabel. Formatowanie warunkowe. Wstawianie funkcji.
FOTOMOZAIKI Tomasz Szymanowski, 8 czerwca Wstęp Fotomozaika – obraz złożony z innych obrazów. Cel projektu – stworzenie programu generującego fotomozaiki.
Edytor tekstu Word.
Tworzenie prezentacji
Analiza danych przy pomocy funkcji • przegląd wybranych funkcji Excela (m.in. wyszukaj.pionowo, jeżeli, suma.jeżeli) • przypisywanie nazw zakresom komórek.
Tytuł:Poradnik do programu PowerPoint?
K o s t k a i k a R u b.
Adresowanie komórek w Excelu
Program Logomocja.
Własności figur płaskich
Treści multimedialne - kodowanie, przetwarzanie, prezentacja Odtwarzanie treści multimedialnych Andrzej Majkowski informatyka +
Excel Filtrowanie Funkcje bazodanowe
TEMAT: WPROWADZENIE DO ARKUSZA KALKULACYJNEGO EXCEL
Formatowanie tabel. Formatowanie warunkowe. Wstawianie funkcji.
Treści multimedialne - kodowanie, przetwarzanie, prezentacja Odtwarzanie treści multimedialnych Andrzej Majkowski 1 informatyka +
Kolumny, tabulatory, tabele, sortowanie
WYKŁAD 06 Programowanie dynamiczne Grażyna Mirkowska.
Zagadnienie i algorytm transportowy
Zagadnienie własne Macierz wektorów własnych V=(v1,v2,...,vn) przekształca zatem macierz A do postaci diagonalnej: W większości zastosowań w chemii i fizyce.
PRZYKŁAD OBLICZENIOWY PRĘT
K ODY ZMIENNEJ DŁUGOŚCI Alfabet Morsa Kody Huffmana.
SciLab.
Przeglądarka Cyfrowego Archiwum EBSCOhost Przewodnik
„Filtry i funkcje bazodanowe w EXCELU”
Przewodnik Wyszukiwanie eKsiążek EBSCO.
Istotą kolumn jest przedzielenie strony na kilka części położonych obok siebie. Ilość kolumn jest generowana przez użytkownika, odpowiednio dla jego potrzeb.
Edytor tekstu Word – możliwości graficzne
 Formuła to wyrażenie algebraiczne (wzór) określające jakie operacje ma wykonać program na danych. Może ona zawierać liczby, łańcuchy znaków, funkcje,
Wyrażenie algebraiczne – wyrażenie w którym obok liczb i znaków działań występują litery Wyrażenia algebraiczne mogą być: - proste – jedna liczba, litera.
ZNAKI PIONOWE NAKAZU Nakaz jazdy w prawo przed znakiem
Przykładowe zadanie egzaminacyjne.
Wybór nazwy lub słów kluczowych dla interesującego nas szeregu czasowego. Opcjonalnie – ustawienie innych dostępnych atrybutów szukania.
Piotr Grzegorzewski klasa 1GB (rok szkolny 2011/2012)
EWOLUCJA SIŁY SZYFRÓW ABCDEFGHIJKLMNOPQRSTUVWXYZ
Wprowadzenie do edytorów tekstu.
ALGORYTMY I STRUKTURY DANYCH
KUSUDAMA
Najważniejsze informacje dotyczące programu Sway.
Zapis prezentacji:

Laboratorium nr.3 Algorytm przyrównania globalnego (Algorytm Needleman’a-Wunsch’a) – przyrównuje sekwencje na całej długości; wykorzystuje tak dużo znaków, jak to jest tylko możliwe.

Dopasowywanie sekwencji (ang. sequence alignment) Dopasowywanie (przyrównywanie) sekwencji polega na porównywaniu dwóch (z j. ang. pair-wise alignment) lub wielu sekwencji poprzez poszukiwanie serii pojedynczych znaków (lub wzorców znakowych), które występują w tej samej kolejności w sekwencjach; – najprostszy przypadek: zapisanie dwóch sekwencji obok siebie – identyczne lub podobne znaki są umieszczane w tej samej kolumnie - znaki, których nie można dopasować są ustawiane w jednej kolumnie i oznaczane jako brak dopasowania lub ustawiane naprzeciw przerwy (z j.ang. gap) - w przypadku optymalnego dopasowania, przerwy i braki dopasowania są tak ustawiane aby liczba znaków identycznych lub podobnych była możliwie największa – sekwencje, które bez problemu potrafimy w powyższy sposób ustawić określane są mianem podobnych

W oparciu o algorytm Needlemana-Wunscha przeprowadzimy przyrównanie dwóch sekwencji: GATACTA oraz GATTACCA TWORZYMY MACIERZ Wypełniamy 1 wiersz i 1 kolumnę: -1 pkt za każde przesunięcie w lewo -1 pkt za każde przesunięcie w dół

W oparciu o algorytm Needlemana-Wunscha przeprowadzimy przyrównanie dwóch sekwencji: GATACTA oraz GATTACCA Zasady wypełniania komórek: komórka F(1,1) przesunięcie w prawo -1 pkt -1 – 1 = -2 przesunięcie w dół -1 pkt -1 – 1 = -2 przesunięcie po przekątnej: litery w komórce identyczne G-G więc +1pkt 0 + 1 = 1 Wybierz max wartość wstaw w komórkę F(1,1)

W oparciu o algorytm Needlemana-Wunscha przeprowadzimy przyrównanie dwóch sekwencji: GATACTA oraz GATTACCA Zasady wypełniania komórek: komórka F(1,2) przesunięcie w prawo -1pkt 1 – 1 = 0 przesunięcie w dół -1pkt -2 – 1 = -3 przesunięcie po przekątnej litery w komórkach różne A-G więc -1pkt -1 - 1 = -2 Wybierz max wartość wstaw w komórkę F(1,2) itd……

W oparciu o algorytm Needlemana-Wunscha przeprowadzimy przyrównanie dwóch sekwencji: GATACTA oraz GATTACCA Zasady wypełniania komórek: komórka F(2,4) przesunięcie w prawo -1pkt 1 – 1 = 0 przesunięcie w dół -1pkt -2 – 1 = -3 przesunięcie po przekątnej: litery w komórkach identyczne A - A +1pkt -1+ 1 = 0 Wybierz max wartość wstaw w komórkę F(2,4)

PODSUMOWANIE wypełniania macierzy: F(i,j)- wartość w i,j-tej komórce d- kara za lukę (przesunięcie w dół lub w prawo równa -1) S(xi,yi)= nagroda np. +1 gdy znaki w komórkach xi i yi identyczne lub kara -1 gdy znaki w komórkach xi i yi różne

Konstrukcja dopasowania: W oparciu o algorytm Needlemana-Wunscha przeprowadzimy przyrównanie dwóch sekwencji: GATACTA oraz GATTACCA Konstrukcja dopasowania: od prawego dolnego rogu macierzy poruszamy się w kierunku lewego górnego rogu macierzy po najkrótszej ścieżce, która daje nam max wartość sumy z liczonych komórek.

Teraz szukamy ścieżki/-ek najlepszego dopasowania sekwencji +1-1+1+1+1-1+1+1=4

Zadanie Korzystając z algorytmu przyrównania globalnego Needleman’a-Wunsch’a porównaj dwie sekwencje białek: TTAAG oraz TTTCT dla macierzy podobieństwa s (patrz treści powyżej), wynik wyświetl na ekranie (pamiętaj w miejsce przerw wstaw znak „-”) Uwaga: Zadanie można zrealizować wiele sposobów np. zapisać sekwencje jako listy: dane1 = [' TTAAG '], dane2 = [' TTTCT '] zapisać sekwencje w plikach tekstowych itp. zapisać macierz podobieństwa s jako słownik porównując po 2 litery {'AA': 1, 'AG': -1, ‘AC': -1, ……}, lub zagnieżdżając słownik w słowniku {'A': {'A': 1, 'G': -1, 'C': -1, 'T': -1},……., korzystając z modułu numpy, tworząc macierz w pliku A T G C A 1 -1 -1 -1 T -1 1 -1 -1 G -1 -1 1 -1 C -1 -1 -1 1 itd Warto zajrzeć na: http://en.wikipedia.org/wiki/Needleman%E2%80%93Wunsch_algorithm