Biologiczne nanosystemy informatyki Sławomir Nowak
Wprowadzenie System – grupa interaktywnych komponentów stanowiących razem całość, rozróżnialnych od otoczenia. System rozpatrywany na „wyższym” poziomie opisu wykazuje się nowopowstałymi właściwościami (emergentnymi), które nie wynikają bezpośrednio z budowy i własności poszczególnych komponentów. Informatyka jako dziedzina nauki zakłada różnorodność w reprezentacji informacji, umożliwiając wykorzystanie nowych koncepcji obliczeniowych (komputery kwantowe) Struktura: mówi się o części programowej jak i urządzeniowej
Podstawowe definicje Przez systemy informatyki rozumiemy systemy realizujące odpowiednie procesy kodowania, przechowywania, przetwarzania i przekazywania danych. Informatyka jako dziedzina nauki zakłada różnorodność w reprezentacji informacji, umożliwiając wykorzystanie nowych koncepcji obliczeniowych Dawna rola –funkcje obliczeniowe
Nanosystemy informatyki Nanosystemy informatyki: Przetwarzanie informacji zapisanych w postaci odpowiednich molekuł prowadzi do otrzymania w rezultacie określonych struktur materialnych (materiałów i produktów). Informatyka jako dziedzina nauki zakłada różnorodność w reprezentacji informacji, umożliwiając wykorzystanie nowych koncepcji obliczeniowych (komputery kwantowe) Struktura: mówi się o części programowej jak i urządzeniowej ALGORYTMY realizowane w nanosystemach informatyki to zbiory operacji molekularnych na argumentach którymi są struktury fizyczne (molekuły i atomy) po wykonaniu których otrzymujemy jako wynik określone struktury materialne
Nanosystemy wytwarzające STRUKTURA 1) układ części składowych oraz zespół związków między nimi 2) sposób wzajemnego podporządkowania części składowych i połączenia ich w pewną całość. Nanosystemy wytwarzające Jak wytworzyć strukturę materialną o pożądanych własnościach (funkcjach, kształcie) działając w warunkach specyficznych dla nanosystemów? Porównując – można powiedzieć, że technika ludzka od setek lat posiadała technologie do otrzymania wszystkich części samochodu, jednak nie wiedziała jak mają wyglądać i jak połączyć wszystkie części w całość. Brakowało koncepcji. Systemy biologiczne jako przykład systemów informatycznych bezpośredniego wytwarzania
Samoreplikacja Samoorganizacja W nanosystemach informatyki postuluje się odejście od klasycznej architektury systemów informatycznych. Samoreplikacja Samoorganizacja Przyjmuje się, że efektywna realizacja procesów nanotechnologicznych (wytwórczych) jest trudna bez uwzględnienia tych właściwości.
Zrozumieć biologię 1953 - James Watson i Francis Crick donieśli o odkryciu podwójnej spirali cząsteczki DNA
Systemy biologiczne jako systemy informatyki Życie to obliczenia Materialny charakter informacji Idea systemów biologicznych RNA jako przykład dwoistej natury struktur biologicznych Informacja nabiera pewnego rodzaju „mocy sprawczej”
Biologiczne systemy informatyki Systemy biologiczne jako nanosystemy informatyki Można je scharakteryzować opierając się na trzech podstawowych cechach: molekularny zapis programu synteza molekularna metodami „lepkiej matrycy” zdolność replikacji i samoorganizacji
Format informacji
Ludzki włos jest dość gruby… Rozmiary DNA: - Średnica ok. 2,5 [nm] Długość u człowieka do 2 [m] !!! Włos ludzki ma 0,07 [mm]
Format informacji Fundament: Słabe wiązania wodorowe tworzą komplementarność par: A – T G - C
Format informacji „Molekularna tablica ASCII”
Organizacja informacji w DNA Fragment całego programu DNA stanowi właściwy program komórki sekwencje kodujące i niekodujące organizacja hierarchiczna chromatyna DNA Domena 1 Domena 2 Domena 3 Domena n kompresja
Organizacja informacji w DNA Chromatyna Rysunek autorstwa Nicolasa Bouviera
Synteza molekularna informacji (w postaci materialnej) Odczyt informacji Synteza molekularna informacji (w postaci materialnej) Ekspresja genów: transkrypcja, translacja, obróbka posttranslacyjna
Cecha – własność danego obiektu Determinowanie cech przez program genetyczny Cecha – własność danego obiektu cecha DNA cecha 1 cecha 2 cecha DNA
Odczyt informacji Przepisanie genu na matrycę RNA: <kodonRNA> ::= <nukleotydRNA><nukleotydRNA><nukleotydRNA> <nukleotydRNA> ::= U | A | G | C
1) informacja w postaci „lepkiej” matrycy Przetwarzanie („wytwarzanie”) informacji Koncepcja lepkiej matrycy opiera się na twierdzeniu, że jeśli „fizycznie” jest możliwe istnienie danej molekuły, to można ją otrzymać poprzez odpowiednie zbliżenie składowych atomów molekularna struktura produktu „Lepka” matryca 1) informacja w postaci „lepkiej” matrycy 2) integracja produktu 3) uwolnienie gotowego produktu Czy możliwa jest modyfikacja istniejących systemów biologicznych? Zaprojektowanie nowych systemów, opartych o inny niż w systemach biologicznych zbiór molekuł, bardziej użyteczny z punktu widzenia technologicznego
Przetwarzanie („wytwarzanie”) informacji Kształtowanie białek przebiega w trzech etapach, nazywanych strukturami odpowiednich rzędów Ogólna liczba białek w systemie biologicznym przekracza liczbę genów zapisanych w sekwencji DNA
Przetwarzanie („wytwarzanie”) informacji
Kolejne etapy samoorganizacji struktur biologicznych Informacja nabiera pewnego rodzaju „mocy sprawczej”
Przykładowe obrazy 3D białek Rybosom http://www.hero.ac.uk/uk/research/archives/2001/secrets_of_the_life_facto983.cfm
Przykładowe obrazy 3D białek Hemoglobina http://www.hero.ac.uk/uk/research/archives/2001/secrets_of_the_life_facto983.cfm
Przykładowe obrazy 3D białek Kompleks połączonych białek FRAP/FKBP http://www.ch.ic.ac.uk/local/projects/russell/binding.html
Replikacja, multiplikacja http://www.ulapoz.waw.pl/pierwotniaki.htm http://sciaga.onet.pl/12581,57,156,86,0,20062,sciaga.html
Zdolność replikacji Jeśli więc w wyniku rozwoju obiektu w systemie następuje jego podział na kolejne obiekty zdolne do niezależnego kontynuowania procesów rozwoju z zachowaniem zdolności do kolejnych podziałów, to nazywamy to zjawiskiem samoreplikacji (replikacji) Samoreplikacja zapewnia wytworzenie w systemie dużej liczby niezależnie funkcjonujących obiektów, równolegle wykonujących własne programy działania
Najszybszy wzrost całkowitej liczby obiektów ma miejsce dla ich dychotomicznych podziałów, to znaczy dla n = 2, co ma np. miejsce w przypadku samoreplikacji komórek organizmów biologicznych Systemy replikujące się: Integralną częścią wytwarzanych obiektów są zakodowane w tej samej technologii, w której budowany jest obiekt, programy budowy tego obiektu
Dobór okresów multiplikacji Jeżeli założyć, że czas potrzebny dla osiągnięcia rozmiaru obiektu, przy którym możliwa jest jego multiplikacja jest proporcjonalny do liczby obiektów potomnych, które powstają w momencie multiplikacji obiektu, to można wykazać, że najszybszy wzrost całkowitej liczby obiektów utworzonych w dowolnym przedziale czasu T następuje wówczas, gdy n = 2 to znaczy, obiekty dzielą się na dwie części. Dychotomia (gr. dichotomos = przecięty na dwie części) – dwudzielność; podział na dwie części, wzajemnie się wykluczające i uzupełniające do całości.
Dobór okresów multiplikacji Co można pokazać i udowodnić
Działanie biologicznego systemu informatycznego DNA Program komórki translacja RNA ... Białka (samoorganizują-cy proces tworzenia struktury przestrzennej) czynniki zewnętrzne transkrypcja Struktura funkcjonalna komórki komunikacja Poziom jądra Poziom komórki Zasoby (aminokwasy)
Systemy biologiczne jako systemy informatyki Biologiczny system informatyczny Odpowiednikiem pamięci dynamicznych (RAM) jest cały złożony system białek enzymatycznych Informacja nabiera pewnego rodzaju „mocy sprawczej” Tutaj animacja
Systemy biologiczne jako systemy informatyki Logiczne funkcje składników systemu biologicznego Informacja nabiera pewnego rodzaju „mocy sprawczej”
Biologiczne nanosystemy informatyki Funkcje systemu, system operacyjny System operacyjny, w pojęciu klasycznym (związanym z technicznymi systemami informatyki) jest programem, którzy zarządza zasobami komputera, obsługuje programistów i szereguje wykonywanie innych programów. Wśród głównych celów stosowanie systemów operacyjnych wymienia się sprawność (system operacyjny umożliwia sprawne eksploatowanie zasobów systemu komputerowego). system operacyjny DNA
Biologiczne nanosystemy informatyki Funkcje systemu, system operacyjny Mechanizmy kontroli w DNA nie zostały w pełni poznane Sekwencje bezpośrednio kodujące geny zajmują jedynie ok. 3% długości łańcucha DNA Należy też zwrócić uwagę na równoległość funkcjonowania systemu biologicznego już na poziomie DNA. W ramach jednego łańcucha DNA może działać wiele aktywnych głowic odczytujących, przez co jednocześnie może być realizowanych wiele programów genetycznych. Można powiedzieć, że w ramach systemu DNA pozostaje wiele aktywnych procesów, które mogą jednocześnie realizować wiele sekwencji programów genetycznych. W systemach biologicznych nie można wyodrębnić żadnego centralnego zegara (czas realizacji zadań wynika z czasu potrzebnego na wykonanie określonych reakcji chemicznych). Wiele podobieństwa – kompresja informacji - chromatyna
Biologiczne nanosystemy informatyki Obserwacje i wnioski Sekwencje sterujące są programami, zapisanymi w pamięci Realizacja programów w systemach technicznych odpowiada odczytywaniu sekwencji nukleotydów w łańcuchu DNA Podobnie jak w systemach technicznych na przemian odczytywane są sekwencje sterujące i na ich podstawie odpowiednie sekwencje programu genetycznego (przekazywanie sterowania) Biologiczny system operacyjny DNA reguluje i synchronizuje wykonywanie programów genetycznych w zależności od określonych, dynamicznie zmieniających się potrzeb i wymagań. Brak centralnego zegara systemowego
Biologiczne nanosystemy informatyki Obserwacje i wnioski Systemy biologiczne jako systemy z przesyłem komunikatów, komunikaty te mają określoną postać materialną (są określonymi produktami, półproduktami) System składa się z procesów, których realizacja uzależniona jest od spełnienia określonych warunków. Ponieważ nie istnieje centralny mechanizm synchronizacji zachodzących w systemie biologicznym procesów, procesy te możemy traktować jako asynchroniczne Można więc określić biologiczny system informatyczny jako rozproszony, asynchroniczny system sterowany za pomocą przesyłu komunikatów
(informacja genetyczna) Biologiczne nanosystemy informatyki Hierarchiczność Prosty podział Organizm Organ Tkanka Komórka Jądro komórkowe (informacja genetyczna) Udostępnianie informacji genetycznej Zmniejsza się zróżnicowanie organizmów System hierarchiczny - układ wzajemnie powiązanych podsystemów, z których każdy ma również strukturę hierarchiczną, aż do osiągnięcia najniższego poziomu – podsystemu elementarnego Poziom określa odpowiednia struktura, czyli sposób wzajemnego powiązania składników oraz funkcje, które określają działanie poszczególnych składników jako części struktury
„Trudne” własności: Emergentność Biologiczne nanosystemy informatyki Obserwacje i wnioski „Trudne” własności: Emergentność Zdolność do samoorganizacji (wraz z samoreplikacją) wzrost złożoności źródło efektywności systemu
Emergentność Trudne jest przewidzenie własności białek na podstawie sekwencji nukleotydów Zasadnicza różnica polega na tym, że własności te w systemach technicznych wynikają wprost z własności i organizacji komponentów danego podsystemu. Są nie tylko przewidywalne, określone przez projektanta lub programistę. Ta oczywista właściwość systemów technicznych nie ma jednak zastosowania w systemach biologicznych, w których własności kolejnych w hierarchii komponentów systemu nie wynikają wprost z własności elementów składowych. Możemy jedynie obserwować „pojawianie się” nowych cech w systemie. Taką własność nazywamy emergentnością.
Brak centralnej kontroli Odporność i elastyczność Samoorganizacja Samoorganizacja jest rezultatem działania każdego elementu układu w ramach systemu, w warunkach stworzonych przez oddziaływanie innych elementów tego systemu. W wyniku tych oddziaływań można obserwować pojawienie się globalnej struktury a jednocześnie komponenty systemu mogły oddziaływać ze sobą jedynie lokalnie. Cechy biologicznych systemów informatyki: Brak centralnej kontroli Odporność i elastyczność Zdolność do regeneracji Zdolność do adaptacji - Różnorodność W systemach biologicznych samoorganizacja jest podstawowym zjawiskiem, na którym opiera się funkcjonowanie tych systemów.
Trywializując, można powiedzieć, że samoorganizacja jest rezultatem "dbania o własne interesy" każdego elementu układu w warunkach działania konkurencji ze strony innych elementów tegoż układu. W przyrodzie "dbanie o własne interesy" jest zazwyczaj dążeniem każdego atomu lub molekuły do obniżenia swej energii swobodnej (redukcji wszelkiego rodzaju gradientów w swoim otoczeniu) tak bardzo, jak to możliwe.
Przykładem samoorganizacji w społeczeństwie jest mechanizm działania dużych, nowoczesnych społeczności, np. Manhattanu. Tam nie ma centralnego planisty; każdy z członków społeczności – działając w sprzężeniu ze swoim bliskim otoczeniem - dba o własne interesy lokalne (korelacje lokalne), nie zaś o miasto (korelacje globalne), a całość funkcjonuje znakomicie.
Czy możliwa jest, poza organizmami biologicznymi, techniczna realizacja systemów informatyki służących do bezpośredniej realizacji niektórych, potrzebnych nam materiałów i produktów?
Komputery DNA 1993 rok Leonard Adleman (jeden z twórców algorytmu RSA) jako pierwszy przeprowadził przy pomocy DNA obliczenia, rozwiązując tzw. problem drogi Hamiltona "Jak można odwiedzić 7 miast połączonych 14 drogami, bez dwukrotnego przechodzenia przez to samo miasto?"
Komputery DNA Każde miasto było reprezentowane przez losowy łańcuch DNA o długości 20, np: G-C-A-C-T-G-G-A-C-T-C-A-T-G-C-A-C-T-G-T Droga między miastami 1 i 2 reprezentowana była przez łańcuch długości 20 składający się z cząsteczek stanowiących dopełnienie (na zasadzie komplementarności: A-T, C-G) G-T-A-C-G-T-G-A-C-A-C-A-T-G-C-A-C-T-G-T
Komputery DNA Tu mogą przyłączać się kolejne łańcuchy Przykładowo, łańcuchy miasto 1 i miasto 2 można połączyć łańcuchem reprezentującym drogę w następujący sposób: C-T-A-G-C-A-T-A-G-T-A-T-G-C-G-T-C-G-A-G G-C-A-C-T-G-G-A-C-T-C-A-T-G-C-A-C-T-G-T | | | | | | | | | | | | | | | | | | | | T-A-C-G-C-A-G-C-T-C-C-G-T-G-A-C-C-T-G-A Tu mogą przyłączać się kolejne łańcuchy
Komputery DNA Przy zastosowaniu pewnych reakcji chemicznych wyeliminowane zostają wszystkie ścieżki poza tymi, które zawierają dokładnie 7 różnych podłańcuchów. Znalezienie wszystkich możliwych ścieżek zajęło kilka sekund, jednak wykluczenie nie spełniających warunków zadania trwało kilka dni. Komputer DNA rozwiązał swoje zadanie
Komputery DNA Jakimi dysponujemy „narzędziami”? - Enzymy restrykcyjne – nożyczki do cięcia DNA w ściśle określonych miejscach; - Ligazy – enzymy łączące cząsteczki’ - Metoda PCR pozwala uzyskać miliony kopii cząsteczek; - Metoda próbnika - rozpoznawanie określonych sekwencji (fragmentów); - i inne…
Komputer DNA Czy to jest szybkie? Baaardzo… nawet około 1 operacja/sekundę
Komputery DNA DNA gra w kółko i krzyżyk (rok 2003)
Komputery DNA 1. Ruch człowieka polegał na dodaniu jednego z ośmiu DNA do każdego z pól. Każdy rodzaj DNA miał inną sekwencję i oznaczał wybór innego pola w grze. 2. W wyniku reakcji wewnątrz pól, bramki wywoływały fluorescencję odpowiedniego pola, co oznaczało ruch komputera. 3. Pierwszy ruch w grze należał do komputera i wykonywał go zawsze w centralnym polu. 4. Drugi ruch człowieka ograniczony był tylko do dwóch pól: górnego i środkowego w lewej kolumny. 5. Komputer nigdy nie przegrywał Gra zajmuje dużo czasu. Obliczenie jednego ruchu trwa od 2 do 30 minut. Znów ta szybkość…
Komputer DNA Fakty: - Jeden z najszybszych obecnie komputerów elektronicznych wykonuje około 100 TFLOPS (superkomputer Departamentu Energii USA) - 1Dżul energii wystarcza na około 109 operacji
Komputer DNA Fakty (komputery DNA): - 1 cząsteczka = 1 operacja elementarna / sec - 1 kropla roztworu wodnego może zawierać bilion cząsteczek! - Energia 1 Dżula pozwala wykonać 2*1019 operacji! - Komputer DNA prof. Saphiro dysponuje teoretycznie mocą 330 TFLOPS !!!
Wpisany do Księgi rekordów Guinessa jako najmniejszy komputer świata. Komputer DNA Komputer prof. Shapiry jest molekularną realizacją automatu skończonego, pewnej podklasy uniwersalnej maszyny Turinga. Automat skończony operuje na wejściowej sekwencji symboli. Oprogramowanie automatu stanowi zbiór reguł przejść, w jaki mają zmieniać się stany automatu pod wpływem pojawiających się symboli wejściowych i aktualnego stanu maszyny. Obliczenia kończą się, gdy przetworzony zostanie ostatni wejściowy symbol. Opracowano i przeprowadzono już kilkadziesiąt programów (eksperymentów), od sprawdzania parzystości ciągu wejściowego do wykrywania rakowych RNA Wpisany do Księgi rekordów Guinessa jako najmniejszy komputer świata.
Komputery DNA Perspektywy: Zastosowanie gdy trzeba przeanalizować ogromną liczbę potencjalnych rozwiązań; Perspektywy przy opracowywaniu pamięci o dużej pojemności; Zastosowania w medycynie – inteligentne leki;
Podsumowanie i wnioski Rozwiązanie problemu wytwarzania w oparciu o koncepcję „lepkiej matrycy” nie rozwiązuje problemu kształtowania struktur wyższego rzędu o określonej strukturze funkcjonalnej. Powstaje więc problem opracowania odpowiednich systemów operacyjnych oraz struktury urządzeniowej systemu. ogromna liczba współpracujących elementów dysponują ograniczoną pamięcią zdolnych do samoreplikacji kształtowanie struktur następuje w wyniku samoorganizacji
Przedstawiona koncepcja technicznej realizacji produktów Podsumowanie i wnioski Przedstawiona koncepcja technicznej realizacji produktów w nanosystemach opiera się na podstawowym mechanizmie biologicznym, związanym z budową białek, tzw. „lepką matrycą”. Dwie fazy wytwarzania: Wytwarzanie oraz powielanie elementarnych obiektów w systemie (w systemach biologicznych – budowa I rzędowej struktury białka oraz replikacja DNA i inne mechanizmy związane z udostępnianiem informacji genetycznej) Kształtowanie struktury przestrzennej oraz funkcjonalnej produktu w wyniku samoorganizacji i samoreplikacji (w systemach biologicznych – kształtowanie przestrzennej struktury białek, tkanek, organów, procesy podziałów komórek itp.)
Podsumowanie i wnioski Systemy realizujące bezpośrednio procesy wytwarzania: rozproszone, asynchroniczne systemy sterowane za pomocą przesyłu komunikatów, oraz hierarchicznie zorganizowane, dynamiczne systemy samoorganizujące dalekie od stanu równowagi. Badania nad przewidywalnością oraz funkcjonalnością takich systemów (w określonych zakresie). Dalsze badania w oparciu o przedstawione w pracy podstawowe założenia oraz model teoretyczny stanowi szeroki i ciekawy temat do dalszych prac. Szczególną rolę odgrywają tutaj prace symulacyjne.