Pobierz prezentację
Pobieranie prezentacji. Proszę czekać
OpublikowałGabriela Zych Został zmieniony 9 lat temu
1
Czy komputery zabiją genomikę?
2
Problemy Ogromne ilości danych do przechowywania Zbyt słabe komputery aby „łączyć” sekwencje Nieoptymalne formaty danych
3
Genom Genom to łańcuch zasad Zasady mogą występować w jednej z kilkudziesięciu odmian Genom może się składać z 4000 do 670000000000 zasad Genom człowieka składa się z 2 kopii, a każda ma 3200000000 zasad
4
Łączenie sekwencji Dzisiejsze maszyny generują krótkie sekwencje (50 – 120 zasad), które trzeba połączyć w całość Wynikiem działania najczęściej jest obraz, zamiast bardziej przyjaznych formatów
5
Przechowywanie danych Współczesne urządzenia są w stanie wyprodukować 5TB dziennie Baza danych zawierająca pełne genomy 629 ludzi ma 7.3TB danych Oprócz samego wyniku trzeba zapisać jak dokładna była analiza Możliwości sekwencjonowania podwajają się co 5 miesięcy
6
Przechowywanie danych cd.
7
Możliwe rozwiązania Cloud computing Lepsze formaty danych Zamiast zapamiętywać dane, za każdym razem od nowa sekwencjonować
8
Formaty danych Zapamiętywać zasady wraz z ich jakością Zapamiętać jeden wzorzec, i różnice pomiędzy nim a nowym genomem Takie różnice występują statystycznie na 0.1% pozycji Tracimy wtedy informacje o jakości
9
Cloud computing - zalety Możliwość taniego składowania danych Dostęp do dużej mocy obliczeniowej Nie trzeba za każdym razem ściągać danych, tylko wykonywać obliczenia w chmurze Trudniej zniszczyć dane w chmurze
10
Cloud computing - wady Bezpieczeństwo danych Upload/download danych może trwać wiele tygodni Wymiana informacji między chmurami Mało programów, które wspierają prace w chmurze Obecnie ceny nie uzasadniają przejścia do chmury Brak standardów przechowywania danych, protokołów itp.
Podobne prezentacje
© 2024 SlidePlayer.pl Inc.
All rights reserved.