Metody analizy sekwencji DNA Marta Koczyńska 1/26.

Slides:



Advertisements
Podobne prezentacje
Przykład liczbowy Rozpatrzmy dwuwymiarową zmienną losową (X,Y), gdzie X jest liczbą osób w rodzinie, a Y liczbą izb w mieszkaniu. Niech f.r.p. tej zmiennej.
Advertisements

Klasyfikacja roczna w roku szkolnym 2012/2013
Znaki informacyjne.
Informacja o stanie bezpieczeństwa i porządku publicznego za rok 2008 w powiecie nidzickim Nidzica, r.
Wprowadzenie do informatyki Wykład 6
POWIAT MYŚLENICKI Tytuł Projektu: Poprawa płynności ruchu w centrum Myślenic poprzez przebudowę skrzyżowań dróg powiatowych K 1935 i K 1967na rondo.
Ludwik Antal - Numeryczna analiza pól elektromagnetycznych –W10
Liczby pierwsze.
Domy Na Wodzie - metoda na wlasne M
ZNACZENIE ZDROWIA PSYCHICZNEGO DLA EFEKTYWNOŚCI PRACOWNIKA
Podatki i opłaty lokalne w 2010 roku
NOWE TECHNOLOGIE NA USŁUGACH EDUKACJI Publiczna Szkoła Podstawowa nr 3 w Grodkowie Zajęcia w ramach projektu NTUE.
UŁAMKI DZIESIĘTNE porównywanie, dodawanie i odejmowanie.
Badania biegłości oczami organizatora
PREPARATYWNA CHROMATOGRAFIA CIECZOWA.
Prezentacja poziomu rozwoju gmin, które nie korzystały z FS w 2006 roku. Eugeniusz Sobczak Politechnika Warszawska KNS i A Wykorzystanie Funduszy.
Fundusze nieruchomości jako inwestycja z celem zdobycia kapitału emerytalnego Karolina Oleszek.
Burze pyłowe na Marsie.
Co nas interesuje? Czy w danym fragmencie DNA jest jakiś gen?
Ministerstwo Gospodarki Poland'sexperience Waldemar Pawlak Deputy Prime Minister, Minister of Economy March 2010.
Klasyfikacja systemów
Klamki do drzwi Klamki okienne i inne akcesoria
Opracował: Zespół Humanistyczny. Klasa Średnia ww - wielokrotnego wyboru (na 20 p) Średnia KO - krótkie odpowiedzi (na 10 p) Średnia za zaproszenie (na.
JO16-75 Dane techniczne: Wysokość-130 Płaszczyzna dolna-90
Pytania konkursowe.
Tytuł prezentacji Warszawa, r..
Matura 2005 Wyniki Jarosław Drzeżdżon Matura 2005 V LO w Gdańsku
Ogólnopolski Konkurs Wiedzy Biblijnej Analiza wyników IV i V edycji Michał M. Stępień
Analiza wyników „Matura próbna”
Agnieszka Jankowicz-Szymańska1, Wiesław Wojtanowski1,2
Raport z badań termowizyjnych – RECTICEL Rys. 1a. Rozdzielnia RS14 Temperatura maksymalna 35,27 o C Rys. 1b. Rozdzielnia RS14 (wizyjny) 3.
„Rynek pracy w powiecie trzebnickim: struktura bezrobocia i miejsca pracy.”
Sekcja Programów Profilaktycznych Dział Lecznictwa Ambulatoryjnego
1/34 HISTORIA BUDOWY /34 3/34 6 MAJA 2011.
AKASA Bank Sebastian Marchel Anna Karpińska Anna Matusiewicz
Podsumowanie sezonu Wyniki współzawodnictwa sportu dzieci i młodzieży za 2012: W ramach współzawodnictwa MSiT sekcja uzyskała 45 pkt (43%), z pośród.
KOLEKTOR ZASOBNIK 2 ZASOBNIK 1 POMPA P2 POMPA P1 30°C Zasada działanie instalacji solarnej.
VI przegląd plastyczny z rysunku, malarstwa i rzeźby
EGZAMIN GIMNAZJALNY W SUWAŁKACH 2009 Liczba uczniów przystępująca do egzaminu gimnazjalnego w 2009r. Lp.GimnazjumLiczba uczniów 1Gimnazjum Nr 1 w Zespole.
Ze szczególnym uwzględnieniem stosowanych ćwiczeń specjalnych OPRACOWAŁ Z.LIPIŃSKI.
Ewa Meller Koło Naukowe Metod Ilościowych Wydział Zarządzania Uniwersytet Gdański.
w ramach projektu Szkoła z Klasą 2.0
Analiza wykonania budżetu za 2007 rok w szkołach i placówkach oświatowych na terenie Dzielnicy Wola. Dzielnicowe Biuro Finansów Oświaty – Wola m.st. Warszawy.
Kuratorium Oświaty w Szczecinie WYNIKI EGZAMINU MATURALNEGO 2008 W SZKOŁACH WOJEWÓDZTWA ZACHODNIOPOMORSKIEGO Wyniki opracowano na podstawie danych zamieszczonych.
1. Pomyśl sobie liczbę dwucyfrową (Na przykład: 62)
- powtórzenie wiadomości
Analiza matury 2013 Opracowała Bernardeta Wójtowicz.
Badanie kwartalne BO 2.3 SPO RZL Wybrane wyniki porównawcze edycji I- VII Badanie kwartalne Beneficjentów Ostatecznych Działania 2.3 SPO RZL – schemat.
-17 Oczekiwania gospodarcze – Europa Wrzesień 2013 Wskaźnik > +20 Wskaźnik 0 a +20 Wskaźnik 0 a -20 Wskaźnik < -20 Unia Europejska ogółem: +6 Wskaźnik.
Spływ należności w Branży Elektrycznej
Wstępna analiza egzaminu gimnazjalnego.
EGZAMINU GIMNAZJALNEGO 2013
EcoCondens Kompakt BBK 7-22 E.
EcoCondens BBS 2,9-28 E.
. Inwestycja obejmie budowę bliźniaczego budynku mieszkalnego przy ul. Strzelców Bytomskich w Pyskowicach, zlokalizowanego w sąsiedztwie już wybudowanego.
Projekt Badawczo- Rozwojowy realizowany na rzecz bezpieczeństwa i obronności Państwa współfinansowany ze środków Narodowego Centrum Badań i Rozwoju „MODEL.
User experience studio Użyteczna biblioteka Teraźniejszość i przyszłość informacji naukowej.
WYNIKI EGZAMINU MATURALNEGO W ZESPOLE SZKÓŁ TECHNICZNYCH
Komenda Powiatowa Policji
EGZAMIN GIMNAZJALNY Charakterystyka wyników osiągniętych przez uczniów.
Testogranie TESTOGRANIE Bogdana Berezy.
Jak Jaś parował skarpetki Andrzej Majkowski 1 informatyka +
Nowy Jork Londyn Mleko, (1l) 0,81£ 0,94 £ Bochenek świeżego chleba (500g) 1,78 £ 0,96 £ Ryż (biały), (1kg) 2,01 £ 1,51 £ Jajka(12) 1,86 £ 2,27 £ Lokalny.
Dr hab. Renata Babińska- Górecka
1 Używanie alkoholu i narkotyków przez młodzież szkolną w województwie opolskim w 2007 r. Na podstawie badań przeprowadzonych przez PBS DGA (w pełni porównywalnych.
Współrzędnościowe maszyny pomiarowe
Ankieta dotycząca kart bankomatowych i kont bankowych.
Elementy geometryczne i relacje
Strategia pomiaru.
LO ŁobżenicaWojewództwoPowiat pilski 2011r.75,81%75,29%65,1% 2012r.92,98%80,19%72,26% 2013r.89,29%80,49%74,37% 2014r.76,47%69,89%63,58% ZDAWALNOŚĆ.
Zapis prezentacji:

Metody analizy sekwencji DNA Marta Koczyńska 1/26

Plan seminarium Biologiczne znaczenie DNA Periodyczności w sekwencji DNA Codon usage Codon prototype Modele Markova Periodyczna struktura sekwencji DNA Model AR Podsumowanie i wnioski 2/26

3/26

Kod genetyczny Niejednoznaczny Bezprzecinkowy Niezachodzący Uniwersalny 4/26

ATGAAGGCTTTCATCGTTCTGGTTGCCCTGGCTCTGGCCGCTCCTGCTCTTGG TCGCACCTTGGACCGTTGCTCCCTGGCCCGCGAGATGTCCAACCTGGGCGTT CCTCGTGACCAATTGGCTCGTTGGGCCTGTATTGCCGAGCACGAGTCCTCCTA CCGCACCGGAGTGGTTGGTTAA Przekodowanie 5/26

gdzie f j = j/N ( j = 0,..., N – 1) Jeśli w sekwencji o długości N ma pozycji j występuje określony nukleotyd to x j = 1, w innym przypadku x j = 0 dla j = 0, 1, 2,..., N-1 to widmo sekwencji x u o długości N wyraża się wzorem: Widmo sekwencji DNA 6/26

3 – bp periodicity – w sekwencjach kodujących, (GCT) n Periodyczności w sekwencji DNA 7/26

Periodyczności w sekwencji DNA cd ± 0.01 – bp periodicity alfa helisa 8/26

Periodyczności w sekwencji DNA cd. Inne specyficzne periodyczności 9/26

10/26

gdzie: P i (S) - prawdopodobieństwo że sekwencja S jest kodująca w ramce i, P 0 (S) - prawdopodobieństwo że sekwencja S jest niekodująca. Jeśli LP i (S) > 0 to sekwencja S jest kodująca w ramce i Jeśli LP 0 (S) < 0 to sekwencja S jest niekodująca w ramce i Miara prawdopodobieństwa 11/26

Codon usage Jeśli mamy dana sekwencją S = s 1 s 2 s 3...s n to P i (S) = F(s 1 )F(s 2 )....F(s n ) Zakładamy, że sekwencja niekodująca jest czysto losowa czyli F 0 (s n ) = 1/64 P 0 (s) = n F 0 (s n ) 12/26

Table 1: The human codon usage and codon preference table as published in For each codon, the table displays the frequency of usage of each codon (per thousand) in human coding regions (first column) and the relative frequency of each codon among synonymous codons (second column). The Human Codon Usage Table Gly GGG Arg AGG Trp TGG Arg CGG Gly GGA Arg AGA End TGA Arg CGA Gly GGT Ser AGT Cys TGT Arg CGT Gly GGC Ser AGC Cys TGC Arg CGC Glu GAG Lys AAG End TAG Gln CAG Glu GAA Lys AAA End TAA Gln CAA Asp GAT Asn AAT Tyr TAT His CAT Asp GAC Asn AAC Tyr TAC His CAC Val GTG Met ATG Leu TTG Leu CTG Val GTA Ile ATA Leu TTA Leu CTA Val GTT Ile ATT Phe TTT Leu CTT Val GTC Ile ATC Phe TTC Leu CTC Ala GCG Thr ACG Ser TCG Pro CCG Ala GCA Thr ACA Ser TCA Pro CCA Ala GCT Thr ACT Ser TCT Pro CCT Ala GCC Thr ACC Ser TCC Pro CCC /26

Codon prototype Jeśli f(b,r) jest prawdopodobieństwem nukleotydu b na pozycji r to prawdopodobieństwo kodonu C w sekwencji kodujące wynosi: Dla trójek nukleotydów w niekodującej sekwencji DNA: F 0 (C) = 1/64 Prawdopodobieństwo że sekwencja S jest kodująca wynosi: 14/26

Frequency of the four different nucleotides at the three different codon positions in human coding regions. Derived from Table 1 nucleotidecodon position 123 A C G T /26

Modele Markova W modelach Markova prawdopodobieństwo pojawienia się nukleotydu na danej pozycji zależy od poprzedzających go nukleotydów. W modelu I rzędu prawdopodobieństwo nukleotydu zależy wyłącznie od poprzedzającego nukleotydu. Model ten bazuje na prawdopodobieństwach zależnych od pozycji nukleotydu w kodonie. Dla sekwencji niekodujący F 0 (i,j) = /26

Probabilities of the four nucleotides at the different codon positions conditioned to the nucleotide in the preceding codon position. Estimated from our set of human exon and intron sequences. codon position 1 ACGT A C G T codon position 2 ACGT A C G T codon position 3 ACGT A C G T /26

Values of different coding statistics in the 223 bp long second coding exon of the human -globin gene, and in a 223 bp long sequence from the middle of the second intron of the same gene exon sequence intron sequence coding frame non coding frames frame 1 frame 2 frame3 Codon Usage Codon Prototype Markov Model: order order order /26

Codon usage cd. Values of the model based Coding Statistics along the 2000 bp human -globin gene sequence, computed on an sliding window of length 120 and step /26

Codon prototype cd. Values of the model based Coding Statistics along the 2000 bp human -globin gene sequence, computed on an sliding window of length 120 and step /26

Modele Markowa cd. Values of the model based Coding Statistics along the 2000 bp human -globin gene sequence, computed on an sliding window of length 120 and step /26

Periodyczna struktura w sekwencji DNA Jeśli w danej sekwencji S, możemy zliczyć ile razy nukleotyd i występuje w odległości k od nukleotydu j.. Periodic structure in DNA sequences. The absolute frequency of the pair with (from 0 to 5) nucleotides between the two A's in the 200 first base pairs of the sequences in the set of 1761 human exons and 1753 human introns. A clear period-3 pattern appears in coding regions, which is absent in non-coding regions. Due to the finite size of the sequences (200 bp) the periodic pattern vanishes at longer distances. A similar periodic pattern appears in coding regions for the other fifteen possible pairs of nucleotides 22/26

Model AR (autoregresyjny) 23/26

Model AR cd. 2426

Podsumowanie Przedstawione metody analizy sekwencji DNA pozwalają:  rozróżniać sekwencje kodujące od nie kodujący  znaleźć nieznane dotąd cechy DNA  stwarzają nowe perspektywy na przyszłość 25/26

Dziękuję za uwagę 26/26