Komputerowa analiza sieci genowych (GRN) Agnieszka Marmołowska Jacek Ławrynowicz Promotor: prof. Krzysztof Giaro.

Slides:



Advertisements
Podobne prezentacje
Niezawodności sieci telekomunikacyjnych
Advertisements

Z. Gburski, Instytut Fizyki UŚl.
Topology of the World Trade Web. Świat jako twór stawiający wysokie wymagania Świat staje się globalną wioską- global village Ogromne znaczenie handlu.
DOMINOWANIE W GRAFACH Magdalena Lemańska.
Grafy spełniające nierówność Γ(G) < IR(G)
Grafy inaczej, czyli inne modele grafów
Wykład 6 Najkrótsza ścieżka w grafie z jednym źródłem
Minimalne drzewa rozpinające
Zadanie z dekompozycji
Ludwik Antal - Numeryczna analiza pól elektromagnetycznych –W10
Algorytm Dijkstry (przykład)
Inteligencja Obliczeniowa Sieci dynamiczne.
Małgorzata Gozdecka Dominika Rudnicka
WYKŁAD 2. Kolorowanie wierzchołków
WYKŁAD 7. Spójność i rozpięte drzewa
WYKŁAD 8. Siła spójności Wierzchołek v nazywamy wierzchołkiem cięcia grafu G, gdy podgraf G-v ma więcej składowych spójności niż G. Krawędź e nazywamy.
WYKŁAD 8. Siła spójności A,B – dowolne podzbiory V(G)
WYKŁAD 3. Kliki i zbiory niezależne
Dariusz Odejewski Krzysztof Wójcik
Zastosowanie programu SYBYL do wygładzania przybliżonych modeli białkowych SEKWENCJA AMINOKWASOWA MODELOWANIE METODĄ DYNAMIKI MONTE CARLO NA TRÓJWYMIAROWEJ.
Wpływ warunków na niewiadome na wyniki wyrównania.
Jakość sieci geodezyjnych. Pomiary wykonane z największą starannością, nie dostarczają nam prawdziwej wartości mierzonej wielkości, lecz są zwykle obarczone.
Inteligencja Obliczeniowa Klasteryzacja i uczenie bez nadzoru.
Analiza korelacji.
ALGORYTMY STEROWANIA KILKOMA RUCHOMYMI WZBUDNIKAMI W NAGRZEWANIU INDUKCYJNYM OBRACAJĄCEGO SIĘ WALCA Piotr URBANEK, Andrzej FRĄCZYK, Jacek KUCHARSKI.
Macierz incydencji Macierzą incydencji grafu skierowanego D = (V, A), gdzie V = {1, ..., n} oraz A = {a1, ..., am}, nazywamy macierz I(D) = [aij]i=1,...,n,
Algorytmy grafowe Reprezentacja w pamięci
Sieci Hopfielda.
Komputerowa analiza sieci genowych (GRN)
Komputerowa analiza sieci genowych (GRN)
Komputerowa analiza sieci genowych (GRN) Agnieszka Marmołowska Jacek Ławrynowicz Promotor: prof. Krzysztof Giaro.
Paweł Stasiak Radosław Sobieraj Michał Wronko
Komputerowa analiza sieci genowych (GRN) Agnieszka Marmołowska Jacek Ławrynowicz Promotor: prof. Krzysztof Giaro.
Komputerowa analiza sieci genowych (GRN) Agnieszka Marmołowska Promotor: prof. Krzysztof Giaro.
Komputerowa analiza sieci genowych
Analiza sieci genowych Agnieszka Marmołowska Jacek Ławrynowicz.
Komputerowa analiza sieci genowych
Spis treści Możliwości biblioteki logiczno-fizycznej
WYKŁAD 7. Spójność i rozpięte drzewa Graf jest spójny, gdy dla każdego podziału V na dwa rozłączne podzbiory A i B istnieje krawędź z A do B. Definicja.
Minimalne drzewa rozpinające
Przepływy w sieciach. Twierdzenie minimaksowe.
SKIEROWANE Marek Bil Krzysztof Fitrzyk Krzysztof Godek.
Modelowanie Symbiozy.
Graf - jest to zbiór wierzchołków, który na rysunku przedstawiamy za pomocą kropek oraz krawędzi łączących wierzchołki. Czasami dopuszcza się krawędzie.
Algorytmy i struktury danych
Komputerowe metody przetwarzania obrazów cyfrowych
Reprezentacja grafów i operacje na grafach na przykładzie algorytmu Dijkstry i algorytmu na odnajdywanie Silnych Spójnych Składowych Temat Opracowali:
Topologie sieci lokalnych.
Dana jest sieć dystrybucji wody w postaci: Ø      m- węzłów,
Podstawy statystyki, cz. II
VII EKSPLORACJA DANYCH
Jacek Wasilewski Politechnika Warszawska Instytut Elektroenergetyki
Algorytmy i Struktury Danych
Rozwiązywanie układów równań liniowych różnymi metodami
Komputerowa analiza sieci genowych (GRN) Agnieszka Marmołowska Jacek Ławrynowicz Promotor: prof. Krzysztof Giaro.
Elementy geometryczne i relacje
PLANARNOŚĆ i KOLOROWANIE MAP. Problem Jaka jest minimalna liczba kolorów, za pomocą których można pokolorować obszary województw na mapie Polski tak,
Drogi i cykle Eulera w grafach nieskierowanych
GRA CHOMP. Czym jest chomp? Jest to gra dla dwóch osób, rozgrywana na prostokątnej tablicy, zwanej „tabliczką czekolady”
NP-zupełność Problemy: rozwiązywalne w czasie wielomianowym - O(nk)
Grafy.
Modelowanie matematyczne – złożoność obliczeniowa, teoria a praktyka
Pojęcia podstawowe c.d. Rachunek podziałów Elementy teorii grafów
Analiza Sieci Społecznych
Modele sieci społecznych
DALEJ Sanok Spis treści Pojęcie funkcji Sposoby przedstawiania funkcji Miejsce zerowe Monotoniczność funkcji Funkcja liniowa Wyznaczanie funkcji liniowej,
Zagadnienia transportowe Katedra Ekonomiki i Funkcjonowania Przedsiębiorstw Transportowych.
1.problem próbkowania (sampling problem) dobór charakterystycznych punktów powierzchni w celu uzyskania najlepszego efektu przy minimalizacji ilości danych.
Działania na grafach Autor: Anna Targońska.
Algorytmy i struktury danych
Zapis prezentacji:

Komputerowa analiza sieci genowych (GRN) Agnieszka Marmołowska Jacek Ławrynowicz Promotor: prof. Krzysztof Giaro

Przypomnienie Gene regulatory network – sieć genów komórki, które wpływają na siebie

Wyewoluowane sieci Grafy

Wyewoluowane sieci Dane Sieć 1 Wierzchołki – 14 Krawędzie – 128 Gęstość – 1,41 Sieć 2 Wierzchołki – 48 Krawędzie – 1082 Gęstość – 0,

Struktruty społeczne Występowanie grup wierzchołków gęściej połączonych między sobą niż z wierzchołkami spoza grupy. Jakie mogą być moduły? Skąd wiadomo czy sieć posiada moduły?

Selektywność (assortativity) Parametr określający, czy wierzchołki o wysokich stopniach lubią łączyć się z ze sobą Różne wzory Różny zakres wartości

Selektywność Ilustracja Brak korelacji A = 0 A = 0.26 A = 0.43 Maksymalna (dla sieci o takim rozkładzie stopni) korelacja A = 0.62

Selektywność Neighbour connectivity Wzór funkcji Funkcja rosnąca – assortative network Funkcja malejąca – disassortative network

Neighbour connectivity Przykład Assortative

Neighbour connectivity Przykład Steel assortative

Neighbour connectivity Przykład Disassortative

Współczynnik selektywności Pearson correlation coefficient Wzór Sumy po wszystkich krawędziach j i i k i – stopnie wierzchołków, które łączy i-ta krawędź r jest znormalizowane

Współczynnik selektywności Przykład r = 1 r = 0,849

Współczynnik selektywności Przykład r = -0,111 r = -0,714

Współczynnik selektywności Sieci z życia Sieci społeczne – assortative Sieci techniczne/biologiczne – disassortative Sieci wyewoluowane A(1) – -0,0234 A(2) - -0,1945 Dlaczego tak jest?

Współczynnik klasteryzacji Wzór u – wierzchołek k – stopień wierzchołka u e – ilość krawędzi łączących k sąsiadów u C – średni współczynnik klasteryzacji dla wszystkich wierzchołków C(k) – średni współczynnik klasteryzacji dla wierzchołków o stopniu k

Współczynnik klasteryzacji Zbadano: Sieci metabolicznych 43 organizmów Sieci interakcji białek (S. cerevisiae, H. pylori, E. coli, C. elegans) Regulacyjnych sieci genowych (S. Cerevisiae) C(k)~k -1 Wnioski: Pojedyncze moduły składają się z gęsto zgrupowanych wierzchołków o relatywnie niskim stopniu Moduły są połączone przez centralne wierzchołki o wysokim stopniu

Współczynnik klasteryzacji Wyewoluowana sieć n = 14, m = 128 C = 0,335 C(k)~k -1 ?

Współczynnik klasteryzacji Wyewoluowana sieć n = 48, m = 1028 C = 0,327 C(k)~k -1 ?

Współczynnik klasteryzacji Dlaczego? Sieć jest grafem: skierowanym dopuszcza krawędzie wielokrotne Spróbujmy z grafem prostym

Współczynnik klasteryzacji Wyewoluowana sieć – graf prosty n = 14, m = 138 C = 0,405

Współczynnik klasteryzacji Wyewoluowana sieć – graf prosty n = 48, m = 1206 C = 0,336

Algorytmy wykrywania modułów Klasteryzacja hierarchiczna Algorytm Girvan–Newman Maksymalizacja Modularity Filtracja klik (Clique percolation) Minimalne rozdzięcie

Klasteryzacja hierarchiczna Dwa rodzaje: Agglomerative – bottom-up, każdy wierzchołek w oddzielnym klastrze Divisive – top-down, wszystkie wierzchołki w jednym klastrz Zarys algorytmu: Każdej krawędzi przypisywana jest waga (edge betweeness centrality ) Wierzchołki są łączone według malejącej wagi (rozdzielane według malejącej wagi) Złożoność O(mn + m) = O(mn) (O(n 2 ))

Girvan–Newman Usuwanie krawędzi Zarys algorytmu: Wszystkie wierzchołki w jednym klastrze Każdej krawędzi przypisywana jest waga (edge betweeness) Usuwana jest krawędź o najwyższej wadze Wagi przeliczane są na nowo Złożoność O(nm 2 ) (O(n 3 ))

Maksymalizacja Modularity Przeszukiwanie możliwych podziałów na klastry i wybór najlepszego Miara dobroci podziału (modularity) e ij – ilość krawędzi między i-tym i j-tym klastrem Przeszukanie wszystkich możliwości – bardzo nieoptymalne

Maksymalizacja Modularity Zarys algorytmu zachłannego: Każdy wierzchołek jest w oddzielnym klastrze, tworzona jest macierz E Krok algorytmu (n-1 razy): Obliczenie dla każdej krawędzi - O(m) Wybór krawędzi o największym Poprawienie macierzy E – O(n) Złożoność O((m+n)n) (O(n 2 ))

Przedstawienie wyników Wyniki algorytmów klasteryzacji hierarchicznej (divisive), GN oraz Maksymalizacji można przedstawić jako dendrogram Umożliwia on wybranie odpowiedniej ilości grup, wyodrębnienie podgrup... Dendrogram wytworzony przez algorytm maksymalizacji dla sieci społecznej klubu karate

Ocena wyniku Przedstawione algorytmy zawsze tworzą jakiś podział – niezależnie od tego czy taki podział w rzeczywistości istnieje. Jak sprawdzić jakość podziału? Modularity

Filtracja klik k-klika – podgraf pełny o k wierzchołkach k-kliki sąsiadujące – kiedy mają przynajmniej k-1 wspólnych wierzchołków

Filtracja klik Kliki sąsiadujące Wykrywanie zbiorów sąsiadujących k-klik: Szablon k-kliki – umieścić w grafie Jeden z wierzchołków szablonu przenieść na inny wierzchołek grafu z zachowaniem kliki Łańcuch połączonych w ten sposób klik staje się modułem

Filtracja klik Przykład Moduły k- klik dla k=4 Na czerwono oznaczone są overlapps

Filtracja klik Problemy Szukanie k-kliki w grafie – wielomianowe Szukanie maksymalnej k-kliki w grafie NP-trudne Czy wystarczy szukanie k-klik dla ustalonego k?

Filtracja klik Rozwiązanie Sieć modułów wyodrębnionych za pomocą filtracji klik dla k=4 Węzły – moduły, wielkość węzła odpowiada ilości wierzchołków Krawędzie – połączenia między modułami, grubość krawędzi odpowiada ilości połączeń między modułami

Filtracja klik Rozwiązanie Moduły odpowiadają rzeczywistości Wartość k miedzy 4 a 6 wystarcza dla wyodrębnienia rzeczywistych modułów

Rysowanie sieci Metoda symulacji fizycznej (force- based) Kryteria ładnego rysunku Połączone wierzchołki blisko siebie Wierzchołki nie nachodzą na siebie Minimalna liczba przecięć krawędzi Długość krawędzi odwrotnie proporcjonalna do wagi Równomierne rozmieszczenie w obrębie ramki Zachowanie symetrii

Ładny graf - Przykład 37

Symulacja fizyczna Sieć jest modelowana jako układ fizyczny Wierzchołki są ciałami tego układu Między ciałami oddziaływają siły Mogą to być np.: Siły magnetyczne Siły grawitacyjne

Przykładowy układ fizyczny Wierzchołki, to naładowane metalowe kuleczki Prawo Coulomba F=k*q1*q1/r^2 Krawędzie, to sprężyny Prawo Hooka F=-kx 39

Algorytm symulacji fizycznej Znajduje lokalne minimum energii układu W każdym kroku Dla każdego wierzchołka Oblicza siły Aktualizuje pozycje Oblicza energie układu W zależności od modelu Energia kinetyczna, potencjalna, itp. Poprawia współczynniki Np. tarcia 40

Energia układu 41 Niska energia układu powiązana jest z jakością rysunku grafu Energia: 1.77x Energia: 2.23x10 6 By Yehuda Koren

Rysowanie grafu = minimalizacja energii układu Algorytm rysowania jest procesem optymalizacyjnym Osiągnięcie globalnego minimum nie jest gwarantowane 42 Iteracja Energia

Złożoność Złożoność pojedynczej iteracji O(n2) Obliczenie energii układu Przybliżona liczba iteracji O(n) Złożoność całkowita ~ O(n3) Algorytmy symulacji fizycznej słabo się skalują 43

Rysowanie dużych sieci Tradycyjne algorytmy symulacji fizycznej ograniczone są do grafów o kilkuset wierzchołkach Paradygmat FADE Geometryczna klasteryzacja Np. rekursywny podział za pomocą Drzewa czwórkowego (ang. quadtree) Wielopoziomowa wizualizacja Ułatwia nawigacje po dużych grafach Siły obliczne miedzy klastrami i w obrębię klastrów

Źródła THOMAS M. J. FRUCHTERMAN, EDWARD M. REINGOLD, Graph Drawing by Force- directed Placement Adel Alshayji Force Directed Algorithm 45