Małgorzata Gozdecka Dominika Rudnicka SIECI GENOWE „Gene networks: how to put the function in genomics” Paul Brazhnik, Alberto de la Fuente and Pedro Mendes Małgorzata Gozdecka Dominika Rudnicka
Do prawidłowego opisu funkcji komórkowych w systemach biochemicznych niezbędna jest wiedza obejmująca trzy poziomy: - białka - metabolity - ekspresja genów (mRNA)
- białkowa (np. tworzenie kompleksów) - genowa Model biochemiczny przedstawienie powiązań między cząstkami jako sieci zależności Sieci biologiczne: - metaboliczna - białkowa (np. tworzenie kompleksów) - genowa Sieć – uproszczenie całkowitego systemu komórkowego Bardzo udanym modelem w biochemii jest przedstawienie powiązań pomiędzy cząstkami jako sieci zależności. Takie sieci mogą być konstruowane na kilku poziomach, i mogą reprezentować różne typy zależności. Rozważano wiele sieci biologicznych: Metaboliczna- reprezentująca chemiczne przemiany zachodzące pomiędzy metabolitami Białkowa – reprezentująca interakcje białko – białko ( np.. Tworzenie kompleksów ) Genowa- reprezentująca zależności pomiędzy genami (obserwacja jak poziom ekspresji każdego z genów wpływa na poziom ekspresji innego) Każda z tych sieci stanowi uproszczenie całkowitego systemu komórkowego, w którego skład wchodzą wszystkie 3 typy cząstek.( metabolity, białka mRNA )
Uproszczony model globalnej sieci biochemicznej METABOLITY 1 2 2 BIAŁKA KOMPLEKS 3-4 4 1 3 1 4 3 2 GENY Geny nie oddziałują bezpośrednio z innymi genami (tak samo jak i mRNA). To białka, będące produktami ekspresji genów wpływają na indukcję lub represję ekspresji innych genów Ekspresja genów może być również regulowana poprzez metabolity lub przez kompleksy białko-metabolit TRENDS in Biotechnology
Często wprowadza się uproszczenie polegające na zawężeniu globalnej sieci biochemicznej do sieci genowej (wyłączenie z przedstawionych zależności działanie białek i metabolitów) Jednak często użyteczne jest wprowadzenie uproszczenia poprzez wyłączenie z przedstawionych zależności działanie białek i metabolitów ( ukrycie) i przedstawienie genów oddziałujących ze sobą w postaci sieci genowych. 2 3 1 Sieć genowa 4
Dlaczego sieci genowe ? Sieci genowe – stosowane jako modele do badania ekspresji genów (konstruowane na podstawie danych eksperymentalnych) Zastosowania i zalety: - dostarczają obraz stanu fizjologicznego organizmu na poziomie mRNA (duża skala) - przedstawiają w zwięzły sposób interakcje pomiędzy genami, ale również dynamikę badanych interakcji - opis funkcji genów (genomika funkcjonalna) Do identyfikacji sieci genowych – dane pochodzące z analizy profilu ekspresji genów z całego genomu GN stosowane jako modele dla zjawisk na poziomie ekspresji genów i często konstruuje się je na podstawie danych eksperymentalnych. Zastosowania i zalety: Dostarczają obrazu stanu fizjologicznego organizmu na poziomie mRNA Sieci genowe przedstawiają w zwięzły sposób interakcje pomiędzy genami, ale również dynamikę badanych interakcji. Opis funkcji genów i przez to pozostawać wyszukanym sposobem w analizach wykorzystywanych w genomice ( w szczególności w genomice funkcjonalnej) Często nie znamy dokładnego mechanizmu molekularnego wpływu jednego genu na ekspresję drugiego, ale efekty tego działania mogą być łatwo obserwowane. Do identyfikacji sieci genowych – stosować dane pochodzące z analizy profilu ekspresji genów z całego genomu
Fenotyp większości chorób wynik łącznego działania grupy genów Wiedza na temat sieci genów źródłem nowych idei pomocnych w leczeniu złożonych chorób. Fenotyp większości chorób wynik łącznego działania grupy genów Sieci genowe pomagają w określeniu jak powstaje dany zbiór cech i która grupa genów jest za to odpowiedzialna. Wiedza na temat sieci genów może dostarczać wartościowych informacji i być źródłem nowych idei w zakresie leczenia złożonych chorób.( dostosowanie terapi do indywidualnych potrzeb pacjenta). Sieci genowe pozwalają na uszeregowanie genów zgodnie z ich ważnością w kontroli i regulacji procesów komórkowych Większość fenotypów jest wynikiem łącznego działania grupy genów, sieci genowe pomagaja w określeniu jak powstaje dany zbiór cech i która grupa genów jest za to odpowiedzialna.
Zastosowanie sieci genowych w genomice porównawczej Genom człowieka – tylko 2 x większy od genomu C.elegans Hipotezy: - liczba białek kodowanych przez ludzkie geny jest większa niż u innych organizmów -proporcja genów regulatorowych w genomie ludzkim niż w innych genomach - ludzką sieć genową może charakteryzować wyższy stopień komplikacji powiązań Dwie ostatnie hipotezy mogą być weryfikowane przez określenie i porównanie sieci genowych różnych organizmów Jest wiele hipotez wyjaśniających tą prostotę ludzkiego genomu
Reprezentacja sieci genowych Graficzna Macierz Macierz Każda kolumna i rząd reprezentują jeden gen, elementy macierzy reprezentują przyczynowe zależności Jakościowa prezentacja macierzy opiera się na następującym przyporządkowaniu: 1 – interakcja + -1 – interakcja – 0 – brak interakcji Ilościowa prezentacja macierzy- elementy macierzy przyjmują wartości odpowiadające sile i rodzajowi ( +/-) interakcji Prezentacja graficzna może być ilościowa ( wówczas przy końcach strzałek ( dla+) lub obok zakończeń tempych ( dla -)podane są odpowiednie wartości liczbowe. Jakościowa prezentacja macierzy opiera się na następującym przyporządkowaniu: 1 – interakcja + -1 – interakcja – 0 – brak interakcji Ilościowa prezentacja macierzy: elementy macierzy przyjmują określone wartości, odpowiadające sile i rodzajowi (+/-) interakcji
powrót Gen 2 Gen 3 Gen 1 Gen 4 TRENDS in Biotechnology Strzałka + interakcja (wzrost aktywności jednego genu wzrost aktywności drugiego genu) Tępe zakończenie interakcja minus (sprzężenie zwrotne ujemne1,2,3,4) ( wzrost aktywności jednego spadek drugiego) Bespośrednia interakcji np.. 4 2, gen 3 na 2 a 2 na 4 TRENDS in Biotechnology
Wnioskowanie o sieciach genowych na podstawie danych eksperymentalnych Badania sieci genów zostały nakierowane na : zrozumienie dynamiki i kreowanie zasad regulacji genów odtworzenie istniejących sieci genów na podstawie pomiarów eksperymentalnych Ogromny rozwój technik badania ekspresji genów, w szczególności mikromacierzy stanowi doskonałe źródło danych na podstawie których można próbować rekonstruować sieci genowe.
Ideker et al. skonstruowali sieć genową z 348 genów z S Ideker et al. skonstruowali sieć genową z 348 genów z S. cerevisiae w oparciu o informacje na temat 2709 interakcji białko-białko połączonych z 317 znanych interakcji białko-DNA dostępnych w bazach danych W podobny sposób zaproponowano sieć 10 genów zaangażowanych w proces morfogenezy Arabidopsis thaliana Wiele interakcji pomiędzy genami zostały odkryte z wykorzystaniem tradycyjnego podejścia w biologii molekularnej. Sieci genowe można uzyskać korzystając z wiedzy na temat tych zależności
Podejścia próbujące wyjaśnić istotę sieci genów na podstawie danych eksperymentalnych 1. „winny przez powiązanie” – geny z podobnym wzorem ekspresji są funkcjonalnie ze sobą powiązane ok. gdy mała ilość powiązań w sieci, nie sprawdza się przy skomplikowanej sieci powiązań (niejednoznaczne wyniki) 2. Model oparty na bardziej zaawansowanych analizach statystycznych - głównym celem nie jest szczegółowe zrekonstruowanie sieci ale wydobycie maksymalnej ilości informacji z określonej ilości pomiarów 3. Model uproszczony (geny ulegają ekspresji na określonym poziomie albo wcale) Zaproponowano wiele podejść do wyjaśnienia sieci genów z danych eksperymentalnych: „winny przez powiązanie” – powiązanie to badane jest poprzez stosowanie algorytmów i zasad analizy części składowych Głównym celem nie jest szczegółowe zrekonstruowanie sieci ale wydobycie maksymalnej ilości informacji z pewnej ilości pomiarów. Generalnie pomiar korelacji między ekspresją genów często nie jest wystarczający aby wnioskować o konkretnym rodzaju interakcji pomiędzy genami
4. Metoda z użyciem funkcji ciągłych (poziomy ekspresji mogą mieć jakąkolwiek wartość dodatnią)-umożliwia najdokładniejszą reprezentację sieci genów 5. Metoda wyłączania pojedynczych genów i pomiar odpowiedzi całej sieci 6. Metoda oparta na systematycznych zakłóceniach transkrypcji i pomiarach (pośrednich) wpływu tych zakłóceń na badaną sieć genów
Zmiany zachodzące w sieci pod wpływem wyłączenia pojedynczego genu Wyłączenie pojedynczego genu powrót
Wniosek Niezbędne jest przeprowadzenie wielu eksperymentów, by móc wnioskować z dużą dokładnością o sieci genów
Łączność sieci genów Istnieją dwie przeciwstawne teorie na temat tego, jak gęsto połączone są ze sobą sieci genów Jedna zakłada, że połączenia te są dość rzadkie Sieci genów opisują jedynie dynamikę aktywności genów Interakcje na poziomie proteomu i metabolomu są obecne w sieciach genowych, ponieważ dynamika aktywności genów zależy od nich Obecność lub brak interakcji w sieci genów jest determinowana przez kinetyczne właściwości każdego z kroków na ścieżce interakcji, która prowadzi przez proteom i metabolom
Według drugiej teorii sieć połączeń jest bardzo gęsta, gdyż: Geny są powiązane siecią metaboliczną; jeśli konkretny metabolit wpływa na poziom transkrypcji pewnego genu, wówczas inne geny kodujące enzymy, które mają pewien wpływ na ten metabolit będą również oddziaływać na ten gen Transkrypcja wszystkich genów zależy od energii metabolicznej, co wskazuje, że wszystkie geny są do pewnego stopnia pod wpływem genów kodujących enzymy należące do szlaku metabolizmu energetycznego Jeśli polimeraza RNA występuje w małym stężeniu interakcja między jakimikolwiek dwoma genami może być oparta na współzawodnictwie pomiędzy ich miejscami wiążącymi polimerazę. Wówczas wzrost ekspresji jednego genu może się wiązać ze spadkiem ekspresji innych
PODSUMOWANIE Sieci genowe to zbiór zależności regulacyjnych gen-gen w genomie W przeciwieństwie do sieci metabolicznych nie jest tu najważniejszy mechanizm, lecz sama obecność i znaczenie interakcji pomiędzy dwoma genami Sieci genowe są modelami fenomenologicznymi mówiącymi o tym, jak zmiana aktywności jednych genów wpływa na aktywność innych genów Sieci te są użyteczne w ocenie wpływu zewnętrznych zakłóceń na profil ekspresji genów