Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

Komputerowa analiza sieci genowych (GRN) Agnieszka Marmołowska Jacek Ławrynowicz Promotor: prof. Krzysztof Giaro.

Podobne prezentacje


Prezentacja na temat: "Komputerowa analiza sieci genowych (GRN) Agnieszka Marmołowska Jacek Ławrynowicz Promotor: prof. Krzysztof Giaro."— Zapis prezentacji:

1 Komputerowa analiza sieci genowych (GRN) Agnieszka Marmołowska Jacek Ławrynowicz Promotor: prof. Krzysztof Giaro

2 Przypomnienie Gene regulatory network – sieć genów komórki, które wpływają na siebie

3 Wyewoluowane sieci Grafy

4 Wyewoluowane sieci Dane Sieć 1 Wierzchołki – 14 Krawędzie – 128 Sieć 2 Wierzchołki – 48 Krawędzie – 1082

5 Selektywność (assortativity) Parametr określający, czy wierzchołki o wysokich stopniach lubią łączyć się z ze sobą Różne wzory Różny zakres wartości

6 Selektywność Ilustracja Brak korelacji A = 0 A = 0.26 A = 0.43 Maksymalna (dla sieci o takim rozkładzie stopni) korelacja A = 0.62

7 Selektywność Neighbour connectivity Wzór funkcji Funkcja rosnąca – assortative network Funkcja malejąca – disassortative network

8 Neighbour connectivity Przykład Assortative

9 Neighbour connectivity Przykład Steel assortative

10 Neighbour connectivity Przykład Disassortative

11 Współczynnik selektywności Pearson correlation coefficient Wzór Sumy po wszystkich krawędziach j i i k i – stopnie wierzchołków, które łączy i-ta krawędź r jest znormalizowane

12 Współczynnik selektywności Przykład r = 1 r = 0,849

13 Współczynnik selektywności Przykład r = -0,111 r = -0,714

14 Współczynnik selektywności Sieci z życia Sieci społeczne – assortative Sieci techniczne/biologiczne – disassortative Sieci wyewoluowane A(1) – -0,0234 A(2) - -0,1945 Dlaczego tak jest?

15 Współczynnik klasteryzacji Wzór u – wierzchołek k – stopień wierzchołka u e – ilość krawędzi łączących k sąsiadów u C – średni współczynnik klasteryzacji dla wszystkich wierzchołków C(k) – średni współczynnik klasteryzacji dla wierzchołków o stopniu k

16 Współczynnik klasteryzacji Zbadano: Sieci metabolicznych 43 organizmów Sieci interakcji białek (S. cerevisiae, H. pylori, E. coli, C. elegans) Regulacyjnych sieci genowych (S. Cerevisiae) C(k)~k -1 Wnioski: Pojedyncze moduły składają się z gęsto zgrupowanych wierzchołków o relatywnie niskim stopniu Moduły są połączone przez centralne wierzchołki o wysokim stopniu

17 Współczynnik klasteryzacji Wyewoluowana sieć n = 14, m = 128 C = 0,335 C(k)~k -1 ?

18 Współczynnik klasteryzacji Wyewoluowana sieć n = 48, m = 1028 C = 0,327 C(k)~k -1 ?

19 Współczynnik klasteryzacji Dlaczego? Sieć jest grafem: skierowanym dopuszcza krawędzie wielokrotne Spróbujmy z grafem prostym

20 Współczynnik klasteryzacji Wyewoluowana sieć – graf prosty n = 14, m = 138 C = 0,405

21 Współczynnik klasteryzacji Wyewoluowana sieć – graf prosty n = 48, m = 1206 C = 0,336

22 Struktruty społeczne Występowanie grup wierzchołków gęściej połączonych między sobą niż z wierzchołkami spoza grupy. Wiele algorytmów znajdowania modułów.

23 Algorytmy wykrywania modułów Klasteryzacja hierarchiczna Algorytm Girvan–Newman Maksymalizacja Modularity Filtracja klik (Clique percolation) Minimalne rozdzięcie

24 Klasteryzacja hierarchiczna Dwa rodzaje: Agglomerative – bottom-up, każdy wierzchołek w oddzielnym klastrze Divisive – top-down, wszystkie wierzchołki w jednym klastrz Zarys algorytmu: Każdej krawędzi przypisywana jest waga (edge betweeness centrality ) Wierzchołki są łączone według malejącej wagi (rozdzielane według malejącej wagi) Złożoność O(mn + m) = O(mn) (O(n 2 ))

25 Girvan–Newman Krawędzie są usuwane, tworząc klastry Zarys algorytmu: Każdej krawędzi przypisywana jest waga (edge betweeness) Usuwana jest krawędź o najwyższej wadze Wagi przeliczane są na nowo Złożoność O(nm 2 ) (O(n 3 ))

26 Maksymalizacja Modularity Przeszukiwanie możliwych podziałów na klastry i wybór najlepszego Miara dobroci podziału (modularity) e ij – ilość krawędzi między i-tym i j-tym klastrem Przeszukanie wszystkich możliwości – bardzo nieoptymalne

27 Maksymalizacja Modularity Zarys algorytmu zachłannego: Każdy wierzchołek jest w oddzielnym klastrze, tworzona jest macierz E Krok algorytmu: Obliczenie dla każdej krawędzi - O(m) Wybór krawędzi o największym Poprawienie macierzy E – O(n) Złożoność O((m+n)n) (O(n 2 ))

28 Przedstawienie wyników Wyniki algorytmów GN oraz Maksymalizacji można przedstawić jako dendrogram Dendrogram wytworzony przez algorytm maksymalizacji dla sieci społecznej klubu karate


Pobierz ppt "Komputerowa analiza sieci genowych (GRN) Agnieszka Marmołowska Jacek Ławrynowicz Promotor: prof. Krzysztof Giaro."

Podobne prezentacje


Reklamy Google