Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

Komputerowa analiza sieci genowych Agnieszka Marmołowska Jacek Ławrynowicz Promotor: prof. Krzysztof Giaro.

Коpie: 1
Analiza sieci genowych Agnieszka Marmołowska Jacek Ławrynowicz.

Podobne prezentacje


Prezentacja na temat: "Komputerowa analiza sieci genowych Agnieszka Marmołowska Jacek Ławrynowicz Promotor: prof. Krzysztof Giaro."— Zapis prezentacji:

1 Komputerowa analiza sieci genowych Agnieszka Marmołowska Jacek Ławrynowicz Promotor: prof. Krzysztof Giaro

2 Geneza Projektu Projekt grupowy Klient –Instytut oceanologii PAN w Sopocie Cel projektu –Stworzyć aplikację umożliwiającą analizę wyewoluowanych zbiorów populacji sieci genowych

3 Produkty projektu Aplikacja z graficznym interfejsem Aplikacja testowa Dokumentacja –Opis aplikacji –Wyniki analizy na rzeczywistych danych

4 Sieć genowa Zbiór segmentów DNA komórki, które oddziałują ze sobą i innymi elementami komórki. Pokazuje w jakim stopniu geny są transkrybowane na mRNA. Ogólnie mRNA tworzą białka.

5 Sieć genowa - funkcje białka Białka strukturalne – budowa komórki Enzym – np. trawienne Czynnik transkrypcyjny – aktywuje inny gen – łącząc się z promotorem zapoczątkowuje produkcję innego białka.

6 Sieć genowa jako graf Węzły – zbiór segmentów DNA (węzeł lub porty) Krawędzie – połączenie segmentów DNA czynnikiem transmisyjnym Populacje, zbiory populacji

7 Parametry sieci Omawiane parametry mają znaczenie w różnych sieciach (www, sieci społeczne...) Interesują nas własności sieci genowych

8 Rozkład stopni wierzchołków Wzór Outgoing distribution Ingoing distribution

9 Średnica Ścieżka charakterystyczna Najkrótsza ścieżka między parą wierzchołków - Średnica - Ścieżka charakterystyczna - Dla sieci genowych Przykład: 1000 genów, 4000 połączeń – ścieżka charakterystyczna = 3.3

10 Degree Centrality Wzór Przykład: 21% białek o było ważnych, 62% białek o było ważnych Związek między degree centrality a ważnością białek nie jest prosty

11 Closeness Centrality Wzór Przykład: wierzchołki o najwyższej wartości closeness centrality odpowiadają za komunikację komórka- komórka

12 Betweeness Centrality Wzór gdzie: - ilość ścieżek między u i v - ilość ścieżek między u i v przechodzących przez w Przykład: średnia wartość C b dla ważnych protein jest o około 80% wyższa niż dla protein nieważnych. Istnieje związek między betweenes i degree centrality.

13 Architektura programu 3 poziomy analizy –Graf –Populacja –Zbiór populacji

14 Metodologia Lekka –Wymagania w postaci przypadków użycia –Testy jednostkowe –Peer programming przystowowana do dwuosobowego zespołu

15 Wykorzystane technologie C++ –Wydajność –Życzenie klienta Qt –GUI Boost Google Test Framework

16 Boost Graph Wiele przydanych algorytmów –BFS, DFS –Dijkstra, Bellman-Ford –Fruchterman-Reingold –Itd.. Generyczna Mało przyjazna

17 Nasza klasa grafu Reprezentacja w postaci listy sąsiedztwa Niezmienne identyfikatory elementów Edytowalny Szybka iteracja Posiada adapter dla Boost Graph Library Podgrafy

18 Parametry (WIP) Identyfikowany przez nazwę (string) Skarar lub wektor Opisuje sieć, populację lub zbiór populacji Mozliwość zrównoleglania obliczeń

19 Format pliku GraphML –Kompletny Porty Wiele grafow w jednym pliku Podgrafy –Popularny –Rozszerzalny –Czytelny dla człowieka

20 Format pliku - przykład yellow green blue red

21 Obecny status projektu Alpha –Wczytywanie sieci z pliku –Wyswietlanie kilku patrametrów Strona projektu –http://code.google.com/p/geneviz/http://code.google.com/p/geneviz/

22

23 Kierunki rozwoju Parametry Tabele Wykresy Wizualizacja

24 Bibliografia Mason, O. & Verwoerd, M. Graph theory and networks in biology. Systems Biology, IET 1, (2007)


Pobierz ppt "Komputerowa analiza sieci genowych Agnieszka Marmołowska Jacek Ławrynowicz Promotor: prof. Krzysztof Giaro."

Podobne prezentacje


Reklamy Google