Komputerowa analiza sieci genowych (GRN) Agnieszka Marmołowska Jacek Ławrynowicz Promotor: prof. Krzysztof Giaro.

Slides:



Advertisements
Podobne prezentacje
KORELACJA I REGRESJA WIELOWYMIAROWA
Advertisements

Wprowadzenie do budowy usług informacyjnych
Topology of the World Trade Web. Świat jako twór stawiający wysokie wymagania Świat staje się globalną wioską- global village Ogromne znaczenie handlu.
Grafy spełniające nierówność Γ(G) < IR(G)
ALGORYTMY GRAFOWE.
Grafy inaczej, czyli inne modele grafów
ELEMENTY TEORII GRAFÓW
Wykład 6 Najkrótsza ścieżka w grafie z jednym źródłem
Minimalne drzewa rozpinające
Algorytm Dijkstry (przykład)
Inteligencja Obliczeniowa Sieci dynamiczne.
Inteligencja Obliczeniowa Sieci o zmiennej strukturze.
Małgorzata Gozdecka Dominika Rudnicka
WYKŁAD 2. Kolorowanie wierzchołków
WYKŁAD 7. Spójność i rozpięte drzewa
WYKŁAD 1. Grafy są wokół nas. Pojęcia wstępne.
WYKŁAD 8. Siła spójności A,B – dowolne podzbiory V(G)
GRAFY PLANARNE To grafy, które można narysować na płaszczyźnie tak, by krawędzie nie przecinały się (poza swoimi końcami). Na przykład K_4, ale nie K_5.
Dariusz Odejewski Krzysztof Wójcik
Inteligencja Obliczeniowa Klasteryzacja i uczenie bez nadzoru.
Promotor: dr inż. Leszek Koszałka Autor: Markuszewski Kamil
Drzewa i grafy aktywów na rynkach finansowych
Proces analizy i rozpoznawania
Grupowanie Wprowadzanie Definicja problemu
Macierz incydencji Macierzą incydencji grafu skierowanego D = (V, A), gdzie V = {1, ..., n} oraz A = {a1, ..., am}, nazywamy macierz I(D) = [aij]i=1,...,n,
Algorytmy grafowe Reprezentacja w pamięci
Hipergrafy Hipergraf jest rozszerzeniem pojęcia grafu. Hipergraf różni się od grafu nieskierowanego tym, że każda hiperkrawędź może być incydentna do dowolnej.
Sieci Hopfielda.
Komputerowa analiza sieci genowych (GRN)
Komputerowa analiza sieci genowych (GRN)
Komputerowa analiza sieci genowych (GRN) Agnieszka Marmołowska Jacek Ławrynowicz Promotor: prof. Krzysztof Giaro.
Komputerowa analiza sieci genowych (GRN) Agnieszka Marmołowska Promotor: prof. Krzysztof Giaro.
Komputerowa analiza sieci genowych
Analiza sieci genowych Agnieszka Marmołowska Jacek Ławrynowicz.
Komputerowa analiza sieci genowych (GRN) Agnieszka Marmołowska Jacek Ławrynowicz Promotor: prof. Krzysztof Giaro.
Komputerowa analiza sieci genowych
WYKŁAD 7. Spójność i rozpięte drzewa Graf jest spójny, gdy dla każdego podziału V na dwa rozłączne podzbiory A i B istnieje krawędź z A do B. Definicja.
TRANSAKCJE TYLKO ODCZYT TYLKO ZAPIS
The functional organization of mitochondrial genomes in human cells
Minimalne drzewa rozpinające
Przepływy w sieciach. Twierdzenie minimaksowe.
SKIEROWANE Marek Bil Krzysztof Fitrzyk Krzysztof Godek.
Graf - jest to zbiór wierzchołków, który na rysunku przedstawiamy za pomocą kropek oraz krawędzi łączących wierzchołki. Czasami dopuszcza się krawędzie.
Algorytmy i struktury danych
Komputerowe metody przetwarzania obrazów cyfrowych
Modelowanie populacji i przepływu opinii pomiędzy aktorami sztucznej inteligencji za pomocą sieci społecznej Wojciech Toman.
Rodzaje, przechodzenie grafu
autorzy: Michał Przykucki Małgorzata Sulkowska
Podstawy statystyki, cz. II
VII EKSPLORACJA DANYCH
Jacek Wasilewski Politechnika Warszawska Instytut Elektroenergetyki
Seminarium licencjackie Beata Kapuścińska
Algorytmy i Struktury Danych
Komputerowa analiza sieci genowych (GRN) Agnieszka Marmołowska Jacek Ławrynowicz Promotor: prof. Krzysztof Giaro.
PLANARNOŚĆ i KOLOROWANIE MAP. Problem Jaka jest minimalna liczba kolorów, za pomocą których można pokolorować obszary województw na mapie Polski tak,
Drogi i cykle Eulera w grafach nieskierowanych
Przeszukiwanie wszerz
Grafy.
Modelowanie matematyczne – złożoność obliczeniowa, teoria a praktyka
Pojęcia podstawowe c.d. Rachunek podziałów Elementy teorii grafów
Analiza Sieci Społecznych
Modele sieci społecznych
Metody Badań Operacyjnych Michał Suchanek Katedra Ekonomiki i Funkcjonowania Przedsiębiorstw Transportowych.
Zagadnienia transportowe Katedra Ekonomiki i Funkcjonowania Przedsiębiorstw Transportowych.
1 Proces analizy i rozpoznawania. 2 Jak przygotować dwie klasy obiektów?
Koło Naukowe Metod Ilościowych
Działania na grafach Autor: Anna Targońska.
Wybór nazwy lub słów kluczowych dla interesującego nas szeregu czasowego. Opcjonalnie – ustawienie innych dostępnych atrybutów szukania.
Algorytmy i struktury danych
KORELACJA WIELOKROTNA I CZĄSTKOWA
Zapis prezentacji:

Komputerowa analiza sieci genowych (GRN) Agnieszka Marmołowska Jacek Ławrynowicz Promotor: prof. Krzysztof Giaro

Przypomnienie Gene regulatory network – sieć genów komórki, które wpływają na siebie

Wyewoluowane sieci Grafy

Wyewoluowane sieci Dane Sieć 1 Wierzchołki – 14 Krawędzie – 128 Sieć 2 Wierzchołki – 48 Krawędzie – 1082

Selektywność (assortativity) Parametr określający, czy wierzchołki o wysokich stopniach lubią łączyć się z ze sobą Różne wzory Różny zakres wartości

Selektywność Ilustracja Brak korelacji A = 0 A = 0.26 A = 0.43 Maksymalna (dla sieci o takim rozkładzie stopni) korelacja A = 0.62

Selektywność Neighbour connectivity Wzór funkcji Funkcja rosnąca – assortative network Funkcja malejąca – disassortative network

Neighbour connectivity Przykład Assortative

Neighbour connectivity Przykład Steel assortative

Neighbour connectivity Przykład Disassortative

Współczynnik selektywności Pearson correlation coefficient Wzór Sumy po wszystkich krawędziach j i i k i – stopnie wierzchołków, które łączy i-ta krawędź r jest znormalizowane

Współczynnik selektywności Przykład r = 1 r = 0,849

Współczynnik selektywności Przykład r = -0,111 r = -0,714

Współczynnik selektywności Sieci z życia Sieci społeczne – assortative Sieci techniczne/biologiczne – disassortative Sieci wyewoluowane A(1) – -0,0234 A(2) - -0,1945 Dlaczego tak jest?

Współczynnik klasteryzacji Wzór u – wierzchołek k – stopień wierzchołka u e – ilość krawędzi łączących k sąsiadów u C – średni współczynnik klasteryzacji dla wszystkich wierzchołków C(k) – średni współczynnik klasteryzacji dla wierzchołków o stopniu k

Współczynnik klasteryzacji Zbadano: Sieci metabolicznych 43 organizmów Sieci interakcji białek (S. cerevisiae, H. pylori, E. coli, C. elegans) Regulacyjnych sieci genowych (S. Cerevisiae) C(k)~k -1 Wnioski: Pojedyncze moduły składają się z gęsto zgrupowanych wierzchołków o relatywnie niskim stopniu Moduły są połączone przez centralne wierzchołki o wysokim stopniu

Współczynnik klasteryzacji Wyewoluowana sieć n = 14, m = 128 C = 0,335 C(k)~k -1 ?

Współczynnik klasteryzacji Wyewoluowana sieć n = 48, m = 1028 C = 0,327 C(k)~k -1 ?

Współczynnik klasteryzacji Dlaczego? Sieć jest grafem: skierowanym dopuszcza krawędzie wielokrotne Spróbujmy z grafem prostym

Współczynnik klasteryzacji Wyewoluowana sieć – graf prosty n = 14, m = 138 C = 0,405

Współczynnik klasteryzacji Wyewoluowana sieć – graf prosty n = 48, m = 1206 C = 0,336

Struktruty społeczne Występowanie grup wierzchołków gęściej połączonych między sobą niż z wierzchołkami spoza grupy. Wiele algorytmów znajdowania modułów.

Algorytmy wykrywania modułów Klasteryzacja hierarchiczna Algorytm Girvan–Newman Maksymalizacja Modularity Filtracja klik (Clique percolation) Minimalne rozdzięcie

Klasteryzacja hierarchiczna Dwa rodzaje: Agglomerative – bottom-up, każdy wierzchołek w oddzielnym klastrze Divisive – top-down, wszystkie wierzchołki w jednym klastrz Zarys algorytmu: Każdej krawędzi przypisywana jest waga (edge betweeness centrality ) Wierzchołki są łączone według malejącej wagi (rozdzielane według malejącej wagi) Złożoność O(mn + m) = O(mn) (O(n 2 ))

Girvan–Newman Krawędzie są usuwane, tworząc klastry Zarys algorytmu: Każdej krawędzi przypisywana jest waga (edge betweeness) Usuwana jest krawędź o najwyższej wadze Wagi przeliczane są na nowo Złożoność O(nm 2 ) (O(n 3 ))

Maksymalizacja Modularity Przeszukiwanie możliwych podziałów na klastry i wybór najlepszego Miara dobroci podziału (modularity) e ij – ilość krawędzi między i-tym i j-tym klastrem Przeszukanie wszystkich możliwości – bardzo nieoptymalne

Maksymalizacja Modularity Zarys algorytmu zachłannego: Każdy wierzchołek jest w oddzielnym klastrze, tworzona jest macierz E Krok algorytmu: Obliczenie dla każdej krawędzi - O(m) Wybór krawędzi o największym Poprawienie macierzy E – O(n) Złożoność O((m+n)n) (O(n 2 ))

Przedstawienie wyników Wyniki algorytmów GN oraz Maksymalizacji można przedstawić jako dendrogram Dendrogram wytworzony przez algorytm maksymalizacji dla sieci społecznej klubu karate