Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

Bioinformatyka 2007/2008 wykład 3 Biotechnologia UWM dr Jan Paweł Jastrzębski Bioinformatyczne bazy danych Genomowe Proteomowe Publikacje Jako merytoryczna.

Podobne prezentacje


Prezentacja na temat: "Bioinformatyka 2007/2008 wykład 3 Biotechnologia UWM dr Jan Paweł Jastrzębski Bioinformatyczne bazy danych Genomowe Proteomowe Publikacje Jako merytoryczna."— Zapis prezentacji:

1 Bioinformatyka 2007/2008 wykład 3 Biotechnologia UWM dr Jan Paweł Jastrzębski Bioinformatyczne bazy danych Genomowe Proteomowe Publikacje Jako merytoryczna weryfikacja danych Biologiczne bazy danych przeszukuje się głównie w celu znalezienia: sekwencji nukleotydowych sekwencji białkowych struktur białkowych informacji merytorycznych i publikacji pierwotne wtórne

2 Bioinformatyka 2007/2008 wykład 3 Biotechnologia UWM dr Jan Paweł Jastrzębski Wyszukiwarki popularnych serwisów

3 Bioinformatyka 2007/2008 wykład 3 Biotechnologia UWM dr Jan Paweł Jastrzębski Przeszukiwanie za pomocą słów kluczowych Słowem kluczowym (keyword) może być dowolna fraza (np. hemoglobin) lub numer ID danego rekordu z bazy Fraza, czyli zapytanie do wyszukiwania może mieć złożoną formę w celu precyzyjnego określenia celu poszukiwania w wyszukiwaniu zaawansowanym: (hemoglobin) AND ((human) OR (bovine)) NOT (alpha) Do przeszukiwania konkretnej bazy w NCBI przydatnym narzędziem jest historia wyszukiwania

4 Bioinformatyka 2007/2008 wykład 3 Biotechnologia UWM dr Jan Paweł Jastrzębski Historia wyszukiwania w NCBI

5 Bioinformatyka 2007/2008 wykład 3 Biotechnologia UWM dr Jan Paweł Jastrzębski Przeszukiwanie za pomocą odnośników

6 Bioinformatyka 2007/2008 wykład 3 Biotechnologia UWM dr Jan Paweł Jastrzębski Przeszukiwanie na podstawie wprowadzonej sekwencji

7 Bioinformatyka 2007/2008 wykład 3 Biotechnologia UWM dr Jan Paweł JastrzębskiBLAST

8 Bioinformatyka 2007/2008 wykład 3 Biotechnologia UWM dr Jan Paweł Jastrzębski Etapy dopasowywania sekwencji

9 Bioinformatyka 2007/2008 wykład 3 Biotechnologia UWM dr Jan Paweł Jastrzębski Kryteria szacowania podobieństwa sekwencji

10 Bioinformatyka 2007/2008 wykład 3 Biotechnologia UWM dr Jan Paweł Jastrzębski Procent identyczności (względny udział odpowiadających sobie pozycji obsadzonych tymi samymi resztami) Długość porównywanych sekwencji (liczba porównywanych pozycji) Rozmieszczenie identycznych pozycji wzdłuż porównywanych sekwencji Typ reszt okupujących pozycje konserwatywne (sekwencje białkowe) Relacje genetyczne/strukturalne między resztami znajdującymi się w odpowiadających sobie nieidentycznych pozycjach (sekwencje białkowe) Kryteria szacowania podobieństwa sekwencji

11 Bioinformatyka 2007/2008 wykład 3 Biotechnologia UWM dr Jan Paweł Jastrzębski Procedura oszacowania stopnia podobieństwa porównywanych sekwencji Bardzo często oszacowanie stopnia podobieństwa porównywanych sekwencji sprowadzane jest jedynie do określenia względnego udziału pozycji identycznych. Pozostałe kryteria analizy zazwyczaj nie są w ogóle brane pod uwagę (np. bezwzględna długość sekwencji, dystrybucja identycznych pozycji wzdłuż łańcucha). Podejście takie jest niekompletne i stwarza ryzyko błędnej interpretacji otrzymanych wyników. Przedstawiona niżej metoda oparta jest na prawdopodobieństwie przypadkowego pojawienia sie zadeklarowanego stopnia identyczności. Uwzględnia ona podstawowe parametry mające znaczenie dla opisu faktycznego związku między porównywanymi sekwencjami. Liczbę wszystkich możliwych stopni identyczności dla danych dwóch sekwencji opisuje poniższe równanie: Gdzie: x – ilość rodzajów jednostek występujących w sekwencjach (20 dla białek; 4 dla kwasów nukleinowych) n – długość sekwencji (liczba porównywanych par pozycji) a – ilość pozycji identycznych

12 Bioinformatyka 2007/2008 wykład 3 Biotechnologia UWM dr Jan Paweł Jastrzębski Alignment, multiple alignment = dopasowanie (wielu) sekwencji Dopasowywanie globalne dopasowanie, którego mechanizm zakłada porównanie całych sekwencji ze sobą Dopasowywanie lokalne dopasowywanie na podstawie podobieństwa oddzielnych rejonów porównywanych sekwencji – ta metoda zakłada modularną strukturę białek i dopuszcza istnienie domen Dopasowywanie dwóch sekwencji

13 Bioinformatyka 2007/2008 wykład 3 Biotechnologia UWM dr Jan Paweł Jastrzębski Programowanie dynamiczne opiera się na podziale rozwiązywanego problemu na podproblemy względem kilku parametrów.

14 Bioinformatyka 2007/2008 wykład 3 Biotechnologia UWM dr Jan Paweł Jastrzębski Dopasowanie globalne (1970) The Needleman and Wunsch Algorithm M i,j = M ij + max(M k,j+1, M i+1,I )

15 Bioinformatyka 2007/2008 wykład 3 Biotechnologia UWM dr Jan Paweł Jastrzębski Powstawanie dot-matrix

16 Bioinformatyka 2007/2008 wykład 3 Biotechnologia UWM dr Jan Paweł Jastrzębski Dot-matrix ścieżka i alignment

17 Bioinformatyka 2007/2008 wykład 3 Biotechnologia UWM dr Jan Paweł JastrzębskiFASTA

18 Bioinformatyka 2007/2008 wykład 3 Biotechnologia UWM dr Jan Paweł JastrzębskiDot-matrix

19 Bioinformatyka 2007/2008 wykład 3 Biotechnologia UWM dr Jan Paweł Jastrzębski Dlaczego FAST?

20 Bioinformatyka 2007/2008 wykład 3 Biotechnologia UWM dr Jan Paweł Jastrzębski Podobieństwa biochemiczne i biofizyczne aminokwasów Diagram Venn-a

21 Bioinformatyka 2007/2008 wykład 3 Biotechnologia UWM dr Jan Paweł Jastrzębski Macierze substytucji (podstawień) Jak za pomocą liczby określić podobieństwa biochemiczne i biofizyczne poszczególnych aminokwasów tak, aby liczba ta wyrażała jednocześnie realny wpływ na całe białko podstawienia danego aminokwasu innym w łańcuchu polipeptydowym? !!! MACIERZE SUBSTYTUCJI !!!

22 Bioinformatyka 2007/2008 wykład 3 Biotechnologia UWM dr Jan Paweł Jastrzębski PAM i BLOSUM

23 Bioinformatyka 2007/2008 wykład 3 Biotechnologia UWM dr Jan Paweł JastrzębskiPAM

24 Bioinformatyka 2007/2008 wykład 3 Biotechnologia UWM dr Jan Paweł Jastrzębski BLOSUM BLOSUM (62)

25 Bioinformatyka 2007/2008 wykład 3 Biotechnologia UWM dr Jan Paweł Jastrzębski Kara za przerwy (gap costs, gappenalty) Kara za otwarcie przerwy – G Kara za przedłużenie przerwy – L Kara = G + Ln gdzie: n – długość przerwy Standardowo: G = L = 1 - 2

26 Bioinformatyka 2007/2008 wykład 3 Biotechnologia UWM dr Jan Paweł Jastrzębski Programowanie dynamiczne – local alignment

27 Bioinformatyka 2007/2008 wykład 3 Biotechnologia UWM dr Jan Paweł Jastrzębski Algorytmy i narzędzia dopasowań lokalnych FASTA (FAST Alignment): –Pierwszy program do przeszukiwania baz w celu znalezienia podobnej sekwencji –Używa szablonów słów (wielkość słowa) –Łączenie słów i prosta algorytmiczna optymalizacja BLAST ( Basic Local Alignment Search Tool ) –Idea sąsiadujących słów (podobne, nie identyczne słowa) – pozwala stosować słowa o dużych rozmiarach –Kilka wersji BLAST-a ClustalW – multiple alignment

28 Bioinformatyka 2007/2008 wykład 3 Biotechnologia UWM dr Jan Paweł Jastrzębski Jak używać BLAST do wyszukiwania sekwencji?

29 Bioinformatyka 2007/2008 wykład 3 Biotechnologia UWM dr Jan Paweł Jastrzębski Jakiego BLAST-a wybrać?

30 Bioinformatyka 2007/2008 wykład 3 Biotechnologia UWM dr Jan Paweł Jastrzębski Formatka BLAST w NCBI

31 Bioinformatyka 2007/2008 wykład 3 Biotechnologia UWM dr Jan Paweł Jastrzębski BLAST – ustawienia zaawansowane

32 Bioinformatyka 2007/2008 wykład 3 Biotechnologia UWM dr Jan Paweł Jastrzębski Jak używać BLAST do wyszukiwania sekwencji?

33 Bioinformatyka 2007/2008 wykład 3 Biotechnologia UWM dr Jan Paweł Jastrzębski Jak analizować wyniki z BLAST w NCBI Graficzny przegląd wyników

34 Bioinformatyka 2007/2008 wykład 3 Biotechnologia UWM dr Jan Paweł Jastrzębski Jak analizować wyniki z BLAST w NCBI Szczegóły znalezionych dopasowań

35 Bioinformatyka 2007/2008 wykład 3 Biotechnologia UWM dr Jan Paweł Jastrzębski Jak analizować wyniki z BLAST w NCBI Alignmenty czyli zestawienia sekwencji

36 Bioinformatyka 2007/2008 wykład 3 Biotechnologia UWM dr Jan Paweł Jastrzębski BLAST w EBI

37 Bioinformatyka 2007/2008 wykład 3 Biotechnologia UWM dr Jan Paweł Jastrzębski ClustalW w EBI

38 Bioinformatyka 2007/2008 wykład 3 Biotechnologia UWM dr Jan Paweł Jastrzębski Analiza wyników ClustalW

39 Bioinformatyka 2007/2008 wykład 3 Biotechnologia UWM dr Jan Paweł Jastrzębski Podstawy genetyczne algorytmów do zestawień aminokwasów? ReplacementPAM250BLOSUM62 Arg/Lys32 Lys/Gln11 Arg/Gln11 Lys/Glu01 Arg/Glu0 ?

40 Bioinformatyka 2007/2008 wykład 3 Biotechnologia UWM dr Jan Paweł Jastrzębski Diagram of amino acid genetic relationshipsDiagram of codon genetic relationships Algorytm semihomologiczny

41 Bioinformatyka 2007/2008 wykład 3 Biotechnologia UWM dr Jan Paweł Jastrzębski Dot matrix pairwise alignment Internal homology (gene multiplication) Chicken ovoinhibitor precursor (7 domains) Chicken ovomucoid precursor (3 domains) BLAST 2 SEQUENCES SEMIHOM

42 Bioinformatyka 2007/2008 wykład 3 Biotechnologia UWM dr Jan Paweł Jastrzębski Fin


Pobierz ppt "Bioinformatyka 2007/2008 wykład 3 Biotechnologia UWM dr Jan Paweł Jastrzębski Bioinformatyczne bazy danych Genomowe Proteomowe Publikacje Jako merytoryczna."

Podobne prezentacje


Reklamy Google