Metody analizy zależności filogenetycznych
Metoda UPGMA (Unweighted Pair Group Method with Arthmatic Mean) dij A B C D E 2 4 6 F 8 Macierz odległości miedzy 6 OTU Wybieramy parę o najmniejszej odległości, czyli A i B (różnią się dwiema substytucjami) A B 1 Punkt rozgałęzienia sytuujemy w odległości równej dAB/2, czyli 1substytucja
Kalkulacja nowej macierzy odległości (traktujemy parę AB jako osobny OTU stanowiący całość): Drugi cykl : Znajdujemy nową parę o najmniejszej odległości (DE) dij AB C D E 4 6 F 8 D E 2 dij AB C DE 4 6 F 8
dij AB,C DE 6 F 8 dij ABC, DE F 8 1 Czwarta iteracja A B 1 A B 2 C 2 C Trzecia iteracja dij AB,C DE 6 F 8 A B 1 C 2 A B 1 C 2 D E dij ABC, DE F 8
Ostatni krok-przyłączanie OTU F i ukorzenianie drzewa B 1 C 2 D E Midpoint rooting – teoretyczny wspólny przodek powinien być równoodległy od wszystkich OTU, czyli ; d(ABCDE,F)/2 = 8/2 =4 1 ROOT 4 F
Założenia i ograniczenia metody UPGMA Jednakowe tempo mutacji wzdłuż wszystkich gałęzi drzewa Są spełnione założenia „three point conditions”; Dla każdych trzech taksonów A,B, C prawdziwy jest warunek że: dAC<=max(dAB,dBC) Analiza skupień działa dobrze tylko jeżeli dane są ultrameryczne
Metoda NJ (Neighbor Joining) OTU – operational taxonomic unit Pair of neighbors- para sąsiadów – dwie jednostki taksonomiczne połączone jednym wewnętrznym węzłem na nieukorzenionym bifurkacyjnym drzewie filogenetycznym 5 Para sąsiadów Względem węzła A 1 4 1,2,3 4 Para sąsiadów względem węzła B A C D E B 2 6 F 7 3 8
Macierz odległości dij A B C D E 5 4 7 10 6 9 F 8 11 30 42 32 38 34 N OTU = 6 A,B,C,D,E,F Elementy macierzy (dij ) -odległości między OTU liczone jako liczba różnic między każda parą dopasowanych sekwencji (np. liczba substytucji zaobserwowanych między sekwencja A i B) Net divergence- r i– suma odległości miedzy OTU i-tym a wszystkimi pozostałymi OTU Kalkulacja nowej macierzy odległości wg formuły: dij A B C D E 5 4 7 10 6 9 F 8 11 R(X) 30 42 32 38 34
Nowa macierz odległości Mij A B C D E -13 -11.5 -10 -10.5 F -11 A B C D E F 1 wspólny węzeł Drzewko wyjściowe- star tree Wybieramy 1 z dwóch par o minimalnej wartości Mij
Dodawanie węzła U C D E 3 6 7 5 F 8 9 A E SAU U B Kalkulujemy odległości między węzłem U a pozostałymi OUTu F C D
Iteracja powtórzenie całej procedury dla NOTU=N-1=5 i macierzy odległości ; Liczymy r(X) i nową macierz Mij wyznaczamy parę OTU o minimalnej wartości Mij wstawiamy kolejny węzeł W U C D E 3 6 7 5 F 8 9
Metoda FM (Fitch-Margoliash) B C - 22 39 41 Algebraiczna kalkulacja długości gałęzi a+b=22 a+c=39 b+c=41 a=10 b-=12 c=29 A a c C b B
A B C D E - 22 39 41 43 18 20 10 A B C DE - 22 39 40 41 42 19
- 10 32.7 34.7 D E ABC sr E i ABC = 34.7 = e + m 10=d+e średnia odległość między D i ABC= 32.7 =d+m, gdzie m=g+[(c+2f+a+b)/2] E i ABC = 34.7 = e + m 10=d+e układ trzech równań z trzema niewiadomymi – wyliczamy m, d i e D E ABC sr - 10 32.7 34.7 A B D E a b c e d f g C (39+41+18)/3 (41+43+20)/3
SSQ suma kwadratów odchyleń Average percent standard deviation