Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

Specjalizowane języki programowania dr inż. Maciej Miłostan.

Podobne prezentacje


Prezentacja na temat: "Specjalizowane języki programowania dr inż. Maciej Miłostan."— Zapis prezentacji:

1 Specjalizowane języki programowania dr inż. Maciej Miłostan

2 Harmonogram zajęć Wykłady odbywają się co drugi tydzień, laboratoria co tydzień 8 wykładów (w tygodniach parzystych - „pod kreską”) 16 spotkań na laboratoriach Lista tygodni: http://fc.put.poznan.pl/sites/default/fil es/WI_tygodnie%202015_16.pdf http://fc.put.poznan.pl/sites/default/fil es/WI_tygodnie%202015_16.pdf Przedmiot kończy się zaliczeniem przed końcem semestru (tj. przed 29.01.2016) Wykłady odbywają się co drugi tydzień, laboratoria co tydzień 8 wykładów (w tygodniach parzystych - „pod kreską”) 16 spotkań na laboratoriach Lista tygodni: http://fc.put.poznan.pl/sites/default/fil es/WI_tygodnie%202015_16.pdf http://fc.put.poznan.pl/sites/default/fil es/WI_tygodnie%202015_16.pdf Przedmiot kończy się zaliczeniem przed końcem semestru (tj. przed 29.01.2016)

3 Zasady zaliczenia Zgodnie z regulaminem studiów: 1. „Nieobecność studenta, nawet usprawiedliwiona, na więcej niż 1/3 zajęć, może być podstawą do niezaliczenia tych zajęć. Niewykonanie ćwiczeń określonych regulaminem laboratorium uniemożliwia zaliczenie zajęć laboratoryjnych.” 2. „Podstawą do zaliczenia wszystkich rodzajów ćwiczeń i wykładów niekończących się egzaminem są pozytywne wyniki bieżącej kontroli wiadomości. Formę tej kontroli określa prowadzący zajęcia i wystawia ocenę do końca semestru.” 3. „Studentowi, który w wyniku bieżącej kontroli wiadomości otrzymał ocenę niedostateczną, przysługuje prawo do jednego zaliczenia poprawkowego.” Ergo: Można opuścić maksimum pięć laboratoriów (dwa bez usprawiedliwienia) Na laboratoriach będą obowiązywały regularne sprawozdania z zajęć jako forma sprawdzania wiedzy Mogą wystąpić tzw. wejściówki Zgodnie z regulaminem studiów: 1. „Nieobecność studenta, nawet usprawiedliwiona, na więcej niż 1/3 zajęć, może być podstawą do niezaliczenia tych zajęć. Niewykonanie ćwiczeń określonych regulaminem laboratorium uniemożliwia zaliczenie zajęć laboratoryjnych.” 2. „Podstawą do zaliczenia wszystkich rodzajów ćwiczeń i wykładów niekończących się egzaminem są pozytywne wyniki bieżącej kontroli wiadomości. Formę tej kontroli określa prowadzący zajęcia i wystawia ocenę do końca semestru.” 3. „Studentowi, który w wyniku bieżącej kontroli wiadomości otrzymał ocenę niedostateczną, przysługuje prawo do jednego zaliczenia poprawkowego.” Ergo: Można opuścić maksimum pięć laboratoriów (dwa bez usprawiedliwienia) Na laboratoriach będą obowiązywały regularne sprawozdania z zajęć jako forma sprawdzania wiedzy Mogą wystąpić tzw. wejściówki

4 Konsultacje i kontakt Gdzie? Centrum Wykładowo-Konferencyjne Politechniki Poznańskiej Pokój 122 (na I piętrze) Kiedy? Poniedziałki od 8.15 do 9.45 lub inny umówiony termin (np. przed laboratorium) Informacje kontaktowe: Maciej.Milostan@cs.put.poznan.pl Tel.: +48-61-665-29-78 Gdzie? Centrum Wykładowo-Konferencyjne Politechniki Poznańskiej Pokój 122 (na I piętrze) Kiedy? Poniedziałki od 8.15 do 9.45 lub inny umówiony termin (np. przed laboratorium) Informacje kontaktowe: Maciej.Milostan@cs.put.poznan.pl Tel.: +48-61-665-29-78

5 Plan przedmiotu Treści kształcenia Języki programowania ukierunkowane na specyficzne zastosowania, ze szczególnym uwzględnieniem przetwarzania ciągów znaków. Języki skryptowe. Perl. Python. Przetwarzanie danych tekstowych. Efekty kształcenia - umiejętności i kompetencje Student zna wybrane specjalizowane języki programowania w stopniu umożliwiającym swobodne pisanie programów, ze szczególnym uwzględnieniem przetwarzania danych tekstowych, w tym sekwencji nukleotydowych i aminokwasowych. Pełna specyfikacja przedmiotu znajduje się w kartach ETCS: http://fc.put.poznan.pl/studia/krajowe-ramy-kwalifikacji-krk%2C417.htm l Treści kształcenia Języki programowania ukierunkowane na specyficzne zastosowania, ze szczególnym uwzględnieniem przetwarzania ciągów znaków. Języki skryptowe. Perl. Python. Przetwarzanie danych tekstowych. Efekty kształcenia - umiejętności i kompetencje Student zna wybrane specjalizowane języki programowania w stopniu umożliwiającym swobodne pisanie programów, ze szczególnym uwzględnieniem przetwarzania danych tekstowych, w tym sekwencji nukleotydowych i aminokwasowych. Pełna specyfikacja przedmiotu znajduje się w kartach ETCS: http://fc.put.poznan.pl/studia/krajowe-ramy-kwalifikacji-krk%2C417.htm l

6 Plan zajęć Informacje organizacyjne i wprowadzenie do przedmiotu Języki skryptowe Perl i BioPerl (3x) Python i BioPython (3x) Zaliczenie (1x) Informacje organizacyjne i wprowadzenie do przedmiotu Języki skryptowe Perl i BioPerl (3x) Python i BioPython (3x) Zaliczenie (1x)

7 Motywacja Współczesne eksperymenty generują duże ilości danych, które wymagają zautomatyzowanego przetwarzania i gromadzenia w rozmaitych bazach danych

8 Motywacja Istnieje wiele formatów przechowywania podobnych danych Np. formaty sekwencji aminokwasowych i nukleotydowych: PIR FASTA Sama sekwencja (bare sequence) Sekwencja z numeracją i spacjami Istnieje wiele formatów przechowywania podobnych danych Np. formaty sekwencji aminokwasowych i nukleotydowych: PIR FASTA Sama sekwencja (bare sequence) Sekwencja z numeracją i spacjami

9 Motywacja Informacje z baz danych, w celu dalszej analizy, często muszą zostać pobrane i przekonwertowane do formatu kompatybilnego z wykorzystywaną aplikacją Z plików danych musi zostać wyekstrahowana tylko część danych np. pojedynczy model białka z pliku PDB Dane generowane przez różne aplikacje muszą zostać zagregowane Informacje z baz danych, w celu dalszej analizy, często muszą zostać pobrane i przekonwertowane do formatu kompatybilnego z wykorzystywaną aplikacją Z plików danych musi zostać wyekstrahowana tylko część danych np. pojedynczy model białka z pliku PDB Dane generowane przez różne aplikacje muszą zostać zagregowane

10 Rodzaje danych biologicznych Sekwencje, np. dane genomowe Struktury przestrzenne Drzewa filogenetyczne Sieci / grafy – np. mapy interakcji białek, modelowanie oddziaływań Szlaki metaboliczne Dane z mikromacierzy i ekspresja genów Dane obrazowe Sekwencje, np. dane genomowe Struktury przestrzenne Drzewa filogenetyczne Sieci / grafy – np. mapy interakcji białek, modelowanie oddziaływań Szlaki metaboliczne Dane z mikromacierzy i ekspresja genów Dane obrazowe

11 Źródło danych – rodzaje baz Pochodzenie Dane pochodzące bezpośrednio z eksperymentu Dane wywiedzione z danych eksperymentalnych Dane zagregowane Jakość Dane deponowane bezpośrednio Dane deponowane przez „kuratorów” Zarządzanie błędami – usuwanie błędnych danych lub ich znakowanie Sprawdzanie błędów Spójność, aktualizacje Pochodzenie Dane pochodzące bezpośrednio z eksperymentu Dane wywiedzione z danych eksperymentalnych Dane zagregowane Jakość Dane deponowane bezpośrednio Dane deponowane przez „kuratorów” Zarządzanie błędami – usuwanie błędnych danych lub ich znakowanie Sprawdzanie błędów Spójność, aktualizacje

12 Organizacja danych Pliki płaskie Relacyjne bazy danych Obiektowe bazy danych Bazy danych typu NoSQL Pliki płaskie Relacyjne bazy danych Obiektowe bazy danych Bazy danych typu NoSQL

13 Dostępność danych Dostępne publicznie bez restrykcji Dostępne, ale chronione prawami autorskimi Dostępne, ale bez możliwość pobrania Dostępne dla środowiska akademickiego Komercyjne Dostępne publicznie bez restrykcji Dostępne, ale chronione prawami autorskimi Dostępne, ale bez możliwość pobrania Dostępne dla środowiska akademickiego Komercyjne

14 Opiekunowie/kuratorzy baz Duże instytucje publiczne (NCBI, EMBL) Instytucje kwasi-akademickie (Swiss Institute of Bioinformatics) Grupa akademicka lub naukowiec/ekspert Firma komercyjna Duże instytucje publiczne (NCBI, EMBL) Instytucje kwasi-akademickie (Swiss Institute of Bioinformatics) Grupa akademicka lub naukowiec/ekspert Firma komercyjna

15 Algorytmy i analizy 1) Proste operacje – wyszukiwanie ciągów znaków, zliczanie, itp. 2) Porównywanie sekwencji 3) Konstrukcja drzew (filogenetycznych) 4) Detekcja wzorców w sekwencjach 5) Modelowanie struktur 3D z sekwencji 6) Wnioskowanie dot. mechanizmów regulacji komórkowej 7) Przewidywanie lub determinacja funkcji białek i szlaków metabolicznych 8) Asemblacja fragmentów DNA 1) Proste operacje – wyszukiwanie ciągów znaków, zliczanie, itp. 2) Porównywanie sekwencji 3) Konstrukcja drzew (filogenetycznych) 4) Detekcja wzorców w sekwencjach 5) Modelowanie struktur 3D z sekwencji 6) Wnioskowanie dot. mechanizmów regulacji komórkowej 7) Przewidywanie lub determinacja funkcji białek i szlaków metabolicznych 8) Asemblacja fragmentów DNA

16 Języki skryptowe Języki interpretowane Zwykle nie wymagają kompilacji Często stosują automatyczne typowanie Przykłady: Powłoka systemu linux/unix np. język skryptów Bash Pliki wsadowe.bat, skrypty w PowerShell AWK (Zobacz: http://www.cs.put.poznan.pl/jnawrocki/ics/0203/02wpr5- awk.ppt) Perl Python Ruby Języki interpretowane Zwykle nie wymagają kompilacji Często stosują automatyczne typowanie Przykłady: Powłoka systemu linux/unix np. język skryptów Bash Pliki wsadowe.bat, skrypty w PowerShell AWK (Zobacz: http://www.cs.put.poznan.pl/jnawrocki/ics/0203/02wpr5- awk.ppt) Perl Python Ruby

17 Języki skryptowe BioPerl jest zbiorem modułów Perl-a Trzy paradygmaty projektowe w BioPerlu Separacja interfejsów od implementacji Dostarczenie bazowego wzorca (framework- u) dla odpowiednich operacji poprzez generalizacię typowych procedur do pojedynczego modułu Wykorzystanie wzorców projektowych opracowanych przez Ericha Gamma: metoda wytwórcza i wzorzec strategii

18 Języki skryptowe Biopython jest zbiorem modułów Python Kluczowe elementy projektu BioPython tworzenie parserów do danych biologicznych Projektowanie interfejsów użytecznych w przetwarzaniu sekwencji Biopython jest zbiorem modułów Python Kluczowe elementy projektu BioPython tworzenie parserów do danych biologicznych Projektowanie interfejsów użytecznych w przetwarzaniu sekwencji

19 Języki skryptowe BioPHP dawniej GenePHP, „seeks to encourage the use of PHP as a “glue” language to bind web-based bioinformatics applications and databases” Funkcje zaimplementowane w BioPHP Odczyt danych biologicznych w formatach GenBank-u, Swissprot-a, Fasta, alignment-ów Clustal-a (ALN) Proste analizy sekwencji BioPHP dawniej GenePHP, „seeks to encourage the use of PHP as a “glue” language to bind web-based bioinformatics applications and databases” Funkcje zaimplementowane w BioPHP Odczyt danych biologicznych w formatach GenBank-u, Swissprot-a, Fasta, alignment-ów Clustal-a (ALN) Proste analizy sekwencji

20 Języki skryptowe Ruby jest obiektowym językiem skryptowym Projekt BioRuby jest wspierany i finansowany przez: Human Genome Center na Uniwersytecie w Tokyo Bioinformatics Center na Uniwersytecie w Kyoto

21 XML i składowanie danych XML jest uniwersalnym i roszerzalnym formatem przechowywania i wymiany danych oraz dokumentów ustrukturalizowanych Dwie inicjatywy godne odnotowania: Bioinformatics Sequence Markup Language (BSML) BIOpolymer Markup Language (BioML) XML jest uniwersalnym i roszerzalnym formatem przechowywania i wymiany danych oraz dokumentów ustrukturalizowanych Dwie inicjatywy godne odnotowania: Bioinformatics Sequence Markup Language (BSML) BIOpolymer Markup Language (BioML)

22 Programowanie deklaratywne i funkcyjne Przykład czysto funkcyjnego języka Pod nazwa Biohaskell zbierane są wszelkie programy i biblioteki związane z zastosowaniem haskell-a w biologii. Przykład czysto funkcyjnego języka Pod nazwa Biohaskell zbierane są wszelkie programy i biblioteki związane z zastosowaniem haskell-a w biologii.

23 Programowanie deklaratywne i funkcyjne Biomedical Logic Programming (Blip) Zbiór modułów stworzonych z myślą o zastosowaniach bioinformatycznych i biomedycznych Zintregrowany system zapytań Zaimplementowane w SWI-Prolog Biomedical Logic Programming (Blip) Zbiór modułów stworzonych z myślą o zastosowaniach bioinformatycznych i biomedycznych Zintregrowany system zapytań Zaimplementowane w SWI-Prolog

24 Programowanie deklaratywne i funkcyjne BioBike jest interaktywnym (z interfejsem web) środowiskiem programistycznym, które umożliwia biologom analizę systemów biologicznych poprzez połączenie wiedzy i danych poprzez bezpośrednie programowanie dokonywane przez użytkownika końcowego Zaimplementowano przy użyciu BioLisp (Lisp z dodatkiem funkcjonalności biologicznej) BioBike jest interaktywnym (z interfejsem web) środowiskiem programistycznym, które umożliwia biologom analizę systemów biologicznych poprzez połączenie wiedzy i danych poprzez bezpośrednie programowanie dokonywane przez użytkownika końcowego Zaimplementowano przy użyciu BioLisp (Lisp z dodatkiem funkcjonalności biologicznej)

25 ZADANIE DOMOWE: AWK - PRZYPOMNIENIE http://www.cs.put.poznan.pl/jnawrocki/ics/0203/02wpr5-awk.ppt


Pobierz ppt "Specjalizowane języki programowania dr inż. Maciej Miłostan."

Podobne prezentacje


Reklamy Google