Problem terminologii, nomenklatury i definicji w naukach biologicznych Jacek Leluk Uniwersytet Zielonogórski Instytut Biotechnologii i Ochrony Środowiska Jak to jest, że mamy w 98% taki sam genom co szympans, a tylko w 50% taki jak nasz własny ojciec?
"O składności członów człowieczych" Dlaczego ptacy mleka nie dają? Bo musiałyby mieć cyce, które by im wadziły ku lataniu. Andrzej z Kobylina (XVI w.)
Czy biologia jest logiczna? Bałagan terminologiczny: Mitochondria czy chondriosomy? Co to jest papaina, ficyna, czynnik Hageman? Czy inhibitor Kazala hamuje aktywność Kazala?
Czy biologia jest logiczna? Bałagan terminologiczny, cd. Tłumaczenie podstawowych terminów z różnych dziedzin nauk biologicznych Double helix - podwójna spirala alignment - przyrównywanie, uliniowienie, zestawianie, uzgadnianie, dopasowanie Czy Christmas factor to czynnik bożonarodzeniowy? dot matrix - dot macierz, macierz punktowa Inhibitor Bowmana-Birka, czy Bowmana-Birk? równanie Michalisa-Mentena, czy Michaelisa- Menten
Czy biologia jest logiczna? Bałagan terminologiczny, cd. Tłumaczenie skrótów z różnych dziedzin nauk biologicznych BPTI - Basic Pancreatic Trypsin Inhibitor - Bovine Pancreatic Trypsin Inhibitor - Basic Protein Trypsin Inhibitor PAM - Point Accepted Mutations - Percent Accepted Mutations Inhibitor (trypsyny) Kunitza - BPTI - organy zwierzęce, ssaki - STI - soybean trypsin inhibitor
Czy biologia jest logiczna? Misinterpretacje: Sekwencja aminokwasowa genu? Czy inhibitory z roślin dyniowatych są inhibitorami? Do czego służy aglutynina z ziarniaków pszenicy? Co właściwie robią sojowe inhibitory proteinaz? Dlaczego w biologicznych bazach danych występuje tyle inhibitorów kinaz bez żadnej dokumentacji, że hamują one aktywność kinazową? Interpretacja pojęć – homologia, identyczność, podobieństwo, pokrewieństwo
Czy biologia jest logiczna? Tworzenie teorii w oparciu o wyrywkową wiedzę i fragmentaryczne dane Stochastyczne macierze substytucji aminokwasowych Statystyczny opis procesów biologicznych Symulacje Monte Carlo w analizie struktur białkowych Struktura trzeciorzędowa a wiarygodność badań rentgenografii strukturalnej kryształów
Statistical approaches vs. accuracy How far may they be improved? Protein secondary structure prediction – accuracy 70-72% (not much changed since 1978) 100% accuracy requires the complete database for all possible structures. For 30 AA polypeptides – sequences/secondary structures Searching the database for appropriate sequence/structure with the rate sequences/sec. would proceed 1.8 bilion times longer than the age of the Universe.
Analiza Monte Carlo w analizie i przewidywaniu struktur biomolekularnych - – jaki konkretnie stan jest przewidywany? Modelowanie matematyczne procesów biologicznych – - łańcuchy Markowa, a różnicowanie ewolucyjne białek - problem prawidłowego oszacowania istotności obserwowanego podobieństwa sekwencji nukleotydowych i aminokwasowych Deformowanie rzeczywistości przez błędne stosowanie dobrych narzędzi
? Arginine-to-lysine mutational conversion pathways for arginines of different origin
Błędy interpretacyjne biologów Aminokwasy i białka – - czy białka zbudowane są z aminokwasów? Definicje i teorie – - definicja gatunku a teoria ewolucji „Biologiczne” definicje, a ich potwierdzenie - Mutacje sprzężone (klastry rozproszone)
Pojęcia „prosty, wyspecjalizowany, pierwotny, prymitywny - (Cyanophyta, Archaebacteria, relacje małpa-człowiek) Globalne i lokalne minima energii cząsteczek – - czy można opisać konkretną konformację dla konkretnego czasu jej trwania? Procesy mikroskopowe mezoskopowe i makroskopowe, a narzędzia ich badania - opis kwantowy cząsteczki wody, a przewidywanie wystapienia tsunami Błędy interpretacyjne teoretyków
Problem prawdziwych założeń i właściwych wniosków Czy sekwencja aminokwasowa białek, to tylko eklektyczny łańcuch znaków? Błędy interpretacyjne teoretyków Ile jest podstawowych aminokwasów budujących łańcuchy białkowe? - 64 jeśli chodzi o ich relacje genetyczne (presja zmienności mutacyjnej) - 20 na poziomie wyłącznie fenotypowym (podlegającym presji selekcyjnej)
Sequence multiple alignment Problem of gap manipulation Any protein can be aligned with each other as homologous/similar anybiologicalstring anybilogicalstrip anybiologicalstri-ng anybi-logicalstrip anyprotein canbealigned -an-yprote--i-n canb-----ealigned
Mutacje sprzężone Zjawisko jednoczesnego wystąpienia dwóch lub więcej mutacji warunkującego ich utrzymanie się w sposób wzajemnie zależny. Zgodnie z aktualnie przyjetą hipotezą pozytywnej selekcji darwinowskiej na poziomie molekularnym, mutacje sprzężone odnoszą się do kontaktujących się pozycji w białkach, związane są ze specyficznym oddziaływaniem białko-białko, lub partycypują w zachowaniu aktywności biologicznej i/lub stabilizacji cech strukturalnych cząsteczki.
The current explanation of correlated mutations occurrence (example)
The three types of distribution of correlated positions present in myoglobins The residue location and relative distribution is shown on tertiary structure of human myoglobin (P0244, pdb1bzp) The spot correlation cluster Position no. and occurring residues Correlation versus position [AMSTV]A (58)S (7) 27 [ADEFLNT]ADEFNTE 31 [GKRS]GKRSR 78 [AKLQ]KALQ 109 [DEGNT]DEGTE 116 [AEHKQST]AEHKQSA 117 [AEKNQS]AEKQSE 122 [BDEN]BDEND
The three types of distribution of correlated positions present in Bowman-Birk inhibitor family The residue location and relative distribution is shown on tertiary structure of Bowman- Birk inhibitor from soybean (P01055) The narrow correlation cluster Position no. and occurring residues Correlation versus position [–ADFIKLMPRSTV]L (11)M (10) A (8) 4 [–RSTVY]V–SS 5 [–KPST]K–SS 7 [AEGKP]APP 11 [EFHIKLQRST]TEHQS 21 [EFIKMQT]TQEQ
The three types of distribution of correlated positions present in eglin-like proteins. The residue location and relative distribution is shown on tertiary structure of eglin C (P01051) Position no. and occurring residues Correlation versus position [–DGNT]D (8)G (9) 10 [–ELNQRST]ETLNQRS The dispersed correlation
The three types of distribution of correlated positions present in lysozymes The residue location and relative distribution is shown on tertiary structure of lysozyme from rat (P00697, pdb5lyz) The dispersed correlation Position no. and occurring residues Correlation versus position [GHKNR]G (7)H (31)N (16) 30 [ILMV]MVILMVV 40 [DFKNR]DNNFKNR
The observed number and contribution of three correlation types in four different protein families The correlation sets consist of 2 to over 20 residues The protein family (number of correlated positions/set) The correlation statistics Total number of correlation sets observed Number of dispersed sets Number of narrow clusters Number of undirected clusters Number of sets related to active center Eglin-like proteins (2-13) Bowman-Birk proteinase inhibitors (2-28) Myoglobins (2- 29) n.a. Lysozymes (2-15) All families125 (100%)59 (47.2%)38 (30.4%)28 (22.4%)-
Miski są wklęsłe Miski są wypukłe Dialog informatyk – biolog Problem wspólnego języka
...nie zawsze pierwszy nasuwający się wniosek jest zgodny z rzeczywistością W całym bogactwie zjawisk przyrodniczych...