Struktury molekularne Bioinformatyczne metody wizualizacji, formaty plików, przewidywanie struktur biomolekuł (na przykładzie białek). Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Struktury molekuł Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Przykładowe formaty plików Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Model struktury pierwszorzędowej białka Plik w formacie FASTA >gi|5524211|gb|AAD44166.1| cytochrome b [Elephas maximus maximus] LCLYTHIGRNIYYGSYLYSETWNTGIMLLLITMATAFMGYVLPWGQMSFWGATVITNLFSAIPYIGTNLV EWIWGGFSVDKATLNRFFAFHFILPFTMVALAGVHLTFLHETGSNNPLGLTSDSDKIPFHPYYTIKDFLG LLILILLLLLLALLSPDMLGDPDNHMPADPLNTPLHIKPEWYFLFAYAILRSVPNKLGGVLALFLSIVIL GLMPFLHTSKHRSMMLRPLSQALFWTLTMDLLTLTWIGSQPVEYPYTIIGQMASILYFSIILAFLPIAGX IENY >nazwa_sekwencji_1 sekWENCJAdanEGObiaLKAlubniCInukLEOTYDOWEJ >nazwa_sekwencji_2 kolEJNAsekWENCJAdowOLNEGOwybRANEGOBIALKAlubniciDNA >kolejna itd Kryteria formatu FASTA: Tylko sekwencja lub sekwencja z opisem Opis danej sekwencji w oddzielnej linijce (powyżej) i poprzedzony znakiem „>” Sekwencja TYLKO z dozwolonych znaków dowolnej wielkości Każda linijka sekwencji maksymalnie do 80 znaków Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Dozwolone symbole w formacie FASTA A --> adenosine M --> A C (amino) C --> cytidine S --> G C (strong) G --> guanine W --> A T (weak) T --> thymidine B --> G T C U --> uridine D --> G A T R --> G A (purine) H --> A C T Y --> T C (pyrimidine) V --> G C A K --> G T (keto) N --> A G C T (any) - gap of indeterminate length For those programs that use amino acid query sequences (BLASTP and TBLASTN), the accepted amino acid codes are: A alanine P proline B aspartate or asparagine Q glutamine C cystine R arginine D aspartate S serine E glutamate T threonine F phenylalanine U selenocysteine G glycine V valine H histidine W tryptophan I isoleucine Y tyrosine K lysine Z glutamate or glutamine L leucine X any M methionine * translation stop Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Format FASTA >gi|49472664|gb|AAT66182.1| cytochrome c oxidase subunit III [Homo sapiens] MTHQSHAYHMVKPSPWPLTGALSALLMTSGLAMWFHFHSMTLLMLGLLTNTLTMYQWWRDVTRESTYQGH HTPPVQKGLRYGMILFITSEVFFFAGFFWAFYHSSLAPTPQLGGHWPPTGITPLNPLEVPLLNTSVLLAS GVSITWAHHSLMENNRNQMIQALLITILLGLYFTLLQASEYFESPFTISDGIYGSTFFVATGFHGLHVII GSTFLTICFIRQLMFHFTSKHHFGFEAAAWYWHFVDVVWLFLYVSIYWWGS --------------------------------------------------------------- 1 mthqshayhm vkpspwpltg alsallmtsg lamwfhfhsm tllmlglltn tltmyqwwrd 61 vtrestyqgh htppvqkglr ygmilfitse vfffagffwa fyhsslaptp qlgghwpptg 121 itplnplevp llntsvllas gvsitwahhs lmennrnqmi qallitillg lyftllqase 181 yfespftisd giygstffva tgfhglhvii gstflticfi rqlmfhftsk hhfgfeaaaw 241 ywhfvdvvwl flyvsiywwg s Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Model struktury drugorzędowej białka >plik FASTA sekwencji i struktury drugorzedowej fragmentu hemoglobiny SSNYCNQMMKSRNLTKDRCKPVNTFVHESLADVQAVCSQKNVACKNGQTN CCCHHHHHHHHCPCCCCCCCCEEEEECCCHHHHHHHHHCEEECCCCPCCC Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Struktury drugorzędowe Helisy prawoskrętna lewoskrętna 3-turn helix (3/10 helix). Min length 3 residues (G) 4-turn helix (alpha helix). Min length 4 residues (H) 5-turn helix (pi helix). Min length 5 residues (I) Beta-kartki (E) równoległe anty-równoległe PSI-loop Zwroty (spinki) stabilizowane wiązaniami wodorowymi (3, 4 lub 5 turn) (T) Nitka – struktura dowolna, nieokreślona (C) Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Struktury przestrzenne molekuł Wiązanie peptydowe Kąty torsyjne Dozwolone kąty i Ramachandran Plot Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Modele struktur trzecio- i czwartorzędowych białek Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Struktura plików formatu PDB PDB ID i nazwy modeli: 3INS.pdb 1OCC.pdb 1HBB.pdb 1HBS_B.pdb Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Struktura plików formatu PDB Atom | Grupa | koordynaty |inne parametry Atom nr pierw. aa nr X Y Z współcz. rodz ATOM 1 N GLU E 2 61.111 109.195 71.915 1.00 81.22 N ATOM 2 CA GLU E 2 62.536 109.629 72.073 1.00 79.85 C ATOM 3 C GLU E 2 62.684 110.940 72.870 1.00 77.71 C … ATOM 2238 CE LYS E 287 40.779 94.441 56.683 1.00 81.45 C ATOM 2239 NZ LYS E 287 40.358 93.365 55.729 1.00 78.86 N ATOM 2240 N ALA E 288 37.197 93.978 55.486 1.00 89.74 N ATOM 2241 CA ALA E 288 36.979 92.633 54.915 1.00 91.52 C Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
przewidywanie Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Profil hydrofobowości Skale hydrofobowości Analiza pozycji w sekwencji Analiza regionów sekwencji profil Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Metody przewidywania struktury drugorzędowej białek GOR-I Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Metody przewidywania struktury drugorzędowej białek GOR-I Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Regiony transmembranowe Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Regiony transmembranowe The prediction of transmembranous regions is either based on the hydrophobicity method (Kyte & Doolittle, 1982) or on more specific method such as the positive inside rule (Von Heijne, 1992). The method is based on the positive inside rule that indicates that the cytoplasmic side of a membrane is rather positively charged whereas the external side is rather negatively charged. The hydrophobicvity scale is : Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Regiony transmembranowe The hydrophobicity of segments is first measured by calculating the weighted sum on a 21 AA trapezoid sliding window with a central, 11 AA rectangular section and 2 flanking wedge-like sections each 5AA long. The cytoplasmic regions (In) are predicted using the positive-inside rule and the periplasmic regions (Out) of bacterial inner membrane proteins. Thus the formulae is: Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Otrzymywanie modeli struktury białek Metody laboratoryjne NMR, X-ray Teoretyczne przewidywanie struktury Ab initio protein modelling Comparative protein modelling modelowanie homologiczne threading (nawlekanie) Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
NMR Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
X-RAY Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Metody przewidywania struktury przestrzennej białek in silico 1. Ab initio (de novo) symulacje: - Minimalizacja energii (EM), - dynamika molekularna (MD), - Monte Carlo GHIKLSYTVNEQNLKPERFFYTSAVAIL 2. comparative / homology modeling GHIKLSYTVNEQNLKPERFFYTSAVAIL THEESEQTEN-CESALIGN--NICELY ||| ||| || || ||||| |||||| THE—SEQ-EN-CE-ALIGNEDNICELY Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Minimalizacja Energii Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Minimalizacja Energii Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Algorytm „lejkowy” The energy surface of a folding funnel from experimental data for the folding of lysozyme. The axes are defined as follows: E represents the energy of the system, Q is defined as the proportion of native contacts formed, and P is a measure of the available conformational space. Three pathways are shown corresponding to (yellow) fast folding, (green) slow folding pathway that crosses the high energy barrier, and (red) slow folding pathway which returns to a less folded state before following the pathway for fast folding (reproduced from Dobson et al., 1998).[2] Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Protein folding Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Modelowanie homologiczne 1. Odnalezienie modeli białek homologicznych o sekwencji podobnej co najmniej 20-25% Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Modelowanie homologiczne 2. Najlepsze zestawienie sekwencji homologicznych + Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Modelowanie homologiczne 3. Threading - nawlekanie Template Target Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Modelowanie homologiczne 4. Optymalizacja modelu / projektu Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
wizualizacja Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Podstawowe elementy w wizualizacji molekularnej Punkty i linie (druty) (points and wires) Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Podstawowe elementy w wizualizacji molekularnej Kule i pręty (słomki, rurki) (balls and sticks) Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Podstawowe elementy w wizualizacji molekularnej Sfery i powierzchnie (spheres and surfaces) Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Podstawowe elementy w wizualizacji molekularnej Sfery i powierzchnie (spheres and surfaces) Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Podstawowe elementy w wizualizacji molekularnej Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Podstawowe elementy w wizualizacji molekularnej Wstążki i nici (ribbons and coils) Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Podstawowe kolory w wizualizacji molekularnej atomy C O N P S H Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Podstawowe kolory w wizualizacji molekularnej Ładunki (charges) + - Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Podstawowe typy wizualizacji molekularnej wireframe (obraz szkieletowy) Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Podstawowe typy wizualizacji molekularnej backbone (kręgosłup) Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Podstawowe typy wizualizacji molekularnej sticks (pręty, rurki -wiązania chemiczne) Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Podstawowe typy wizualizacji molekularnej ball and sticks (kulki i pręty – atomy i wiązania) Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Podstawowe typy wizualizacji molekularnej ribbons i cartoon (wstążki – wzajemne ułożenie powierzchni wiązań peptydowych) Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Podstawowe typy wizualizacji molekularnej wstążki Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Podstawowe typy wizualizacji molekularnej spacefill (kule / sfery oddziaływać sił Van der Waalsa - VDW) Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Podstawowe typy wizualizacji molekularnej sfery VDW Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
molecular surface (powierzchnia molekularna) accessible surface area (powierzchnia dostępu) Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Molecular vs. Accessible area Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Podstawowe typy wizualizacji molekularnej molecular surface (powierzchnia molekularna) accessible surface area (powierzchnia dostępu) electrostatic surface area (powierzchnia elektrostatyczna) Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Programy do wizualizacji, renderingu i modelowania RasMol Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Programy do wizualizacji i renderingu Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Programy do wizualizacji, renderingu i modelowania SPDBV Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Ray tracing (śledzenia promienia) – jedna z technik renderingu Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Programy do wizualizacji i renderingu PovRay Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Wizualizacja wektorowa Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Wizualizacja renderowana (OpenGL) Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Wizualizacja renderowana (ray-tracing) Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Ray-tracing Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
Programy do wizualizacji, renderingu i modelowania Cn3D Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM