Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

Modelowanie zależności ekspresji genów Paweł Szlendak Promotor: dr inż. Robert Nowak.

Podobne prezentacje


Prezentacja na temat: "Modelowanie zależności ekspresji genów Paweł Szlendak Promotor: dr inż. Robert Nowak."— Zapis prezentacji:

1 Modelowanie zależności ekspresji genów Paweł Szlendak Promotor: dr inż. Robert Nowak

2 INPUT: zestaw danych OUTPUT: zależności przyczynowo-skutkowe atrybutów Atrybut AAtrybut …Atrybut X 12.40istnieje 23.61nie istnieje A … X C B D

3 Występy w poprzednich turniejach DrużynaMZFLT Drużyna Drużyna Drużyna ……………… M – byli już mistrzami Z – są zmęczeni sezonem F – są w formie L – mają łatwą grupę T – mają dobrą technikę

4 Z M L T F M – byli już mistrzami Z – są zmęczeni sezonem F – są w formie L – mają łatwą grupę T – grają technicznie BUDOWA STRUKTURY

5 Z M L T F P(z1) = 0.6 P(f1|z1) = 0.05 P(f1|z0) =0.3 P(l1) = 0.2 P(m1|f1, l1) = 0.2 P(m1|f1, l0) = 0.1 P(m1|f0, l1) = 0.02 P(m1|f0, l0) = 0.01 P(t1|m1) = 0.7 P(t1|m0) = 0.4 P(m1|l1, f1, z0) = ? UCZENIE PARAMETRÓW INTERFERENCJA

6 Jakie jest prawdopodobieństwo, że Polska zdobędzie mistrzostwo, wiedząc że mamy łatwą grupę a zawodnicy są w formie i nie są zmęczeni?

7 Z M L T F 20% szans, że Polacy zdobędą mistrzostwo

8 Sieć Bayesa to para (G, P) spełniająca warunek Markova, gdzie P to łączny rozkład prawdopodobieństwa zmiennych losowych ze zbioru V, a G = (V, E) to DAG.

9 Uczenie sieci Bayesa Budowa grafu Z wiedzy eksperta Z danych Uczenie się parametrów Interferencja

10 Problem optymalizacji kombinatorycznej Search - zbiór grafów DAG Score Na przykład: |G 3 | = 25 |G 5 | = |G 10 | = 4.2 x 10 18

11 Algorytm k2 Gdy znamy potencjalnych kandydatów na rodziców dla danego węzła Algorytm dag search Każdy węzeł może być rodzicem danego węzła

12 void k2(int k, int n, data d, Pred(X i ), ParentSet& PA i ) { for(i=1; i <= n; i++) { PA i = Ø; P = score(d, X i, PA i ); findmore = true;//są nieprzejrzane węzły w Pred(X i ) while (findmore && |PA i | < k) { Z = node in Pred(X i ) – PA i that maximizes score(d, X i, PA i u {Z}); P new = score(d, X i, PA i u {Z}); if (P new > P old ) { P old = P new ; PA i = PA i u {Z}; } else findmore = false; } } } }

13 Graf:Kolejność : Z, F, L, M, T Z Score = 2 Z F Score = 3 Z Score = 5 F Z L F Z F Z L L Score = 7Score = 4 Score = 3 L M T F Z L Score = 2

14 void dag_search (data d, EdgeSet& E) { E = Ø; G = (V, E); do if (any DAG in the neighborhood of current DAG increases score(d, G)) modify E according to the one that increases score(d, G) the most; while (some operation increases score(d, G)); } Grafy w sąsiedztwie grafu G: grafy otrzymane przez operacje dodaj krawędź, usuń krawędź, zmień kierunek krawędzi na grafie G

15 Zastosowanie sieci Bayesa do modelowania ekspresji (aktywności) genów Technologia microarray DNA

16

17 BadanyGen 1…Gen M 112.3…45.6 ………… N18.3…23.9 N << M Ciągłe wartości ekspresji genów

18 Relacje Markova Kilka podobnie ocenionych sieci, szukamy stałych Markov blankets Relacje kolejności Kilka najwyżej ocenionych sieci, sprawdzamy czy X jest rodzicem Y we wszystkich sieciach

19 Dla każdej pary atrybutów X, Y policzyć: Obliczyć maksymalne drzewo rozpinające na grafie pełnym z powyższymi wagami krawędzi (np. Boost Graph Library) Ukierunkować krawędzie wedle uznania

20


Pobierz ppt "Modelowanie zależności ekspresji genów Paweł Szlendak Promotor: dr inż. Robert Nowak."

Podobne prezentacje


Reklamy Google