Analiza danych genomicznych metodami statystycznymi i inteligencji obliczeniowej Wiktor Młynarski
Plan prezentacji ● Ekspresja genu ● Eksperymenty mikromacierzowe ● Klasyczne metody statystyczne ● Biclustering ● Inteligencja obliczeniowa ● Przykładowe algorytmy ● Podsumowanie
Ekspresja genu
Eksperymenty mikromacierzowe
Zadanie: identyfikacja zmian ekspresji genów
Klasyczne metody statystyczne ● Testy: t-Test, ANOVA
Klasyczne metody statystyczne ● Korekcje na ilość porównań np. Bonferroni, FDR
Klasyczne metody statystyczne
● Dataset: 6 substancji uzależniających + kontrola, 2 Mus musculus na macierz, 4 pomiary co 2 h – 3 macierze na pomiar ● Analiza niskopoziomowa: RMA, normalizacja kwantylowa, transformacja logarytmiczna (2) ● Standaryzacja zerojedynkowa (Z-score) ● Statystyka: ANOVA + Bonferroni ● Klasteryzacja hierarchiczna z metryką eukulidesową i uśrednianiem ● Literature Mining: Gene Ontology
Klasyczne metody statystyczne Michał Korostyński, Marcin Piechota, Wojciech Solecki and Ryszard Przewłocki ”The dissection of transcriptional networks regulated by drugs of abuse in the striatum” Institute of Pharmacology PAS, Krakow
Eksperymenty mikromacierzowe „[...] there is no such thing as a single correct classification, although different techniques might be more or less appropriate for different data sets. Furthermore, the application of more than one technique to the analysis of a particular data set might illuminate different relationships between the data.” Quackenbush J., ”Computational analysis of gene expression data”, Nature Reviews: Genetics vol.2, June 2001
Biclustering Y. Cheng, G.M. Church. ”Biclustering of gene expression data”, in:Proceedings of ISMB 2000 pp. 93–103, 2000
Inteligencja Obliczeniowa Computational Intelligence „Zamiast usiłować napisać program imitujący umysł dorosłego, dlaczego by raczej nie spróbować symulować umysłu dziecka?” Turing A., ”Computing machinery and intelligence”, Mind 59, October 1950
Inteligencja Obliczeniowa ● Sieci neuronowe ● Obliczenia ewolucyjne ● Algorytmy rojowe ● Sztuczne systemy odpornościowe ● Obliczenia rozmyte
Inteligencja obliczeniowa ● Algorytmy estymacji rozkładu (EDA): ● Cano C., Garcia F., Lopez F. J., Blanco A., ”Intelligent system for the analysis of microarray data using principal components and estimation of distribution algorithms”, Expert Systems with Applications 36: 4654 – 4663, 2009
Inteligencja Obliczeniowa ● Algorytmy mrówkowe (ACO): ● Yulan H., Hui S.C. “Exploring ant-based algorithms for gene expression data analysis”, Artificial Intelligence in Medicine 47: 105—119, March 2009
Dziękuję za uwagę