Transkrypcja u eukaryota i jej regulacja Andrzej Jerzmanowski Zakład Biologii Systemów UW
Co to jest gen - zmieniające się wyobrażenia i definicje gen Definicja wg encyklopedii: Funkcjonalna i fizyczna jednostka dziedziczności przekazywana potomstwu przez rodziców w trakcie mitozy. Geny są fragmentami DNA, większośc genów zawiera informację potrzebna do wytworzenia specyficznych białek i, w konsekwencji, komórek. Terapia genowa bada możliwości wykorzystania genów do leczenia nowotworów. Zob. ‘chromosomy’
Wszystkie transkrypty mRNA mają niekodujące fragmenty 5’ i 3’ końcowe Klasyczne wyobrażenie genu – fragment DNA, który koduje funkcjonalny mRNA Wszystkie transkrypty mRNA mają niekodujące fragmenty 5’ i 3’ końcowe
Definicje historyczne Niektórzy wciąż używają definicji podobnej do tej, z przed pół wieku: gen to sekwencja kodująca polipeptyd. Jest tak zwana definicja ‘jeden gen – jedno białko’. Raczej staromodna. Istnieją geny, które nie kodują białek, choć zwykle, gdy mówimy o typowych genach, mamy na myśli właśnie geny kodujące białka. Są geny kodujące przenośnikowe RNA (tRNA), rybosomalne RNA (rRNA), czy wielkie heterogenne RNA (hnRNA). Żadne z nich nie mają rejonów kodujących białka. Transkrypt jest produktem funkcjonalnym, często powstającym w wyniku obróbki RNA.
Współczesne definicje odnoszą się do produktu, jakim jest transkrypt, i nie biorą pod uwagę białka Jak zawsze w biologii, istnieją wyjątki. Oto lista genów, które nie pasują do ‘definicji odnoszącej się do transkryptu’. Operony: Niekiedy sąsiadujące ‘geny’ są transkrybowane łącznie, co prowadzi do powstania wielkiego początkowego transkryptu zawierającego szereg rejonów kodujących. W innych wypadkach początkowy transkrypt jest szybko przecinany na liczne funkcjonalne RNA. Nie ma sensu w tej sytuacji odnosić się do ko-transkrybowanych genów, jako do ‘pojedynczego genu’. Zamiast tego, ‘genami’ nazwiemy odcinki DNA odpowiadające pojedynczym jednostkom funkcjonalnym. Tak więc, operon lac operon zawiera trzy “geny” a operony rRNA zawierają, dwa, trzy lub cztery ‘geny’. Trans-splicing: Istnieją geny ‘ w kawałkach’. Transkrypt pochodzący z jednego fragmentu jest łączony z transkryptem z innego fragemntu, aby mógł powstać funkcjonalny RNA. Geny nakładające się: Niektóre ‘geny’ nakładają się. Oznacza to, że pojedynczy fragment DNA może być częścią dwóch lub nawet trzech genów. Redagowanie RNA: Niekiedy pierwotny transkrypt ulega intensywnemu redagowaniu zanim stanie się transkryptem funkcjonalnym. W najbardziej skrajnych przypadkach dochodzi do wstawiania lub usuwania nukleotydów. Ozna cza to, że zawartość informacyjna ‘genu’ jest niepełna dla zapewnienia jego funkcjonalności i musi być uzupełniona z udziałem innych ‘genów’
Czy gen obejmuje także sekwencje regulatorowe? Niektóre definicje genu obejmują promotor i rejony regulatorowe. Takie definicje rodzą problemy logiczne i semantyczne. Nie mówimy, że tylko ‘część’ genu jest transkrybowana, albo że sekwencje regulatorowe kontrolują ekspresję ‘części’ genu, co byłoby poprawne, gdyby definicja obejmowała także sekwencje regulatorowe. Włączając sekwencje regulatorowe do definicji genu, rozmywamy jego tożsamość. W odniesieniu do większości genów nie wiemy, jak daleko rozciągają się sekwencje regulatorowe, ani gdzie dokładnie są zlokalizowane w stosunku do początku genu. Tak więc tracimy pewnośc, gdzie zaczyna się i gdzie kończy tak zdefiniowany gen. (Cyt. za L. Moran)
Nowa definicja genu według Encode Ten obszar genomu wytwarza trzy transkrypty. Po alternatywnym splicingu, produkty dwóch z tych transkryptów kodują pięć białek, natomiast trzeci traskrypt zawiera informacje o niekodującym RNA (ncRNA). Białka są kodowane przez trzy zestawy sekwencji DNA łączących różne fragmenty (A, B, i C; D; i E). W przypadku trzech fragmentów (A, B, C), każdy występuje przynajmniej w dwóch białkach. Dwa pierwotne transkrypty mają ten sam nie ulegający translacji rejon 5’, ale ich ulegające translacji rejony D i E nie nakładają się. Ponieważ trzeci transkrypt koduje ncRNA, fakt że jego fragmenty X i Y pokrywają się z fragmentami genów kodujących białka A i E, nie oznacza, że jest on ko-produktem tych genów. W sumie, w tym rejonie DNA występują cztery geny obejmujące zaznaczone sekwencje: Gen 1 składa się z fragmentów sekwencji A, B, i C; gen 2 to sekwencja D; gen 3 - E; gen 4 składa się z fragmentów sekwencji X i Y.
Kontekst transkrypcji – chromosomy eukariotyczne Nukleosomy Struktury chromatynowe wyższego rzędu Heterochromatyna Euchromatyna
Umiejscowienie transkrypcji w komórce
Przestrzenna lokalizacja struktur w komórce eukariotycznej
Zawartość nie kodującego białek DNA (jako % całkowitego DNA) u różnych organizmów
Zawartość DNA: Paradoks wartości C
Płazy cechuje najwyższa zmienność wartości C wśród kręgowców . Paradoks wartości C oddaje niemożliwość wyjaśnienia relacji między wielkością genomu a funkcją na poziomie organizmu. Jedną z większych zagadek w biologii jest ogromne zróżnicowanie wartości C pomiędzy gatunkami, których przedstawiciele nie różnią się w podobny sposób poziomem złożoności. Skrajne różnice w wartości C charakteryzują płazy. Najmniejsze genomy w tej gromadzie zawierają nieco poniżej 109 par zasad, podczas gdy największe – prawie 1011. Nie jest możliwe, by do funkcjonowania jednych płazów potrzeba było 100 razy więcej genów niż do funkcjonowania innych.
Transkrypcja Przetwarzanie informacji z zapisanej w DNA na zapisaną w RNA Katalizowana przez zależne od DNA RNA-polimerazy Podlega ścisłej regulacji
RNA zawiera rybonukleotydy, a nie deoksyrybonukleotydy, jak DNA U replaces T in RNA Różnice pomiędzy RNA i DNA RNA zawiera rybonukleotydy, a nie deoksyrybonukleotydy, jak DNA Grupa 2’ hydroksylowa w RNA, w DNA ta grupa jest ‘deoksy’ (nie zawiera atomu tlenu)
RNA jest syntetyzowany w kierunku 5’ 3’ Matryca DNA Nowy RNA
Geny mogą być ułożone w różnych kierunkach Promoter region
Reakcja polimeryzacji RNA β- i γ-grupy fosforanowe są usuwane z dołączanego trifosfonukleozydu, a grupa hydroksylowa jest usuwana z atomu węgla 3′- nukleotydu na końcu łańcucha. Rozpad powstającego w reakcji pirofosforanu przesuwa równowagę na korzyść reakcji polimeryzacji
Rodzaje RNA w komórkach eukariontów RNA związane z zjawiskiem interferencji RNA (RNAi)
Initiation Elongation Etapy transkrypcji Termination This is a file from the Wikimedia Commons
Typy eukariotycznych polimeraz RNA Chloroplasty: jak mitochondria
Struktura α-amanityny i innych inhibitorów transkrypcji Rifampicina hamuje polimerazy prokariotyczne, α-amanityna hamuje eukariotyczną RNA pol II. Kordycepina hamuje ze względu na brak 3'-OH, Aktynomycyna D wiąże się do DNA
Polimerazy RNA u pro- i eukariontów Prokarionty Eukarionty Homologi Homologi
Historia poznawania RNA polimerazy II
Kompleks a-amanityna-RNA Polimeraza II
Kompleks z inhibitorem wiązania RNA
Widok z boku (w przekroju) kompleksu transkrybującego RNA Pol II, ukazujący ułożenie kwasów nukleinowych i lokalizację niektórych elementów funkcjonalnych enzymu Location of α-amanitin bound to pol II. (A) Cutaway view of a pol II-transcribing complex showing the location of α-amanitin binding (red dot) in relation to the nucleic acids and functional elements of the enzyme. Adapted from ref. 24. (B) Ribbons representation of the pol II structure (top view in refs. 1 and 7). Eight zinc atoms are shown in light blue, the active site magnesium is magenta, the region of Rpb1 around α-amanitin is light green (funnel) and dark green (bridge helix), the region of Rpb2 near α-amanitin is dark blue, and α-amanitin is red. This figure was prepared by using RIBBONS (25). Lokalizacja α-amanityny związanej z Pol II Bushnell D A et al. PNAS 2002;99:1218-1222 ©2002 by The National Academy of Sciences
Duża liczba równoległych łańcuchów DNA tworzy grube prążki widoczne w chromosomach politenicznych
Kluczowe znaczenie domeny karboksylowej (C-końcowej) RNA Pol II “CTD” to domena C-końcowa największej podjednostki RNA polimerazy II. U człowieka liczy ponad 350 aminokwasów złożonych z wielokrotnych powtórzeń 7-aminokwasowego motywu o sekwencji konsensusowej: tyr-ser-pro-thr-ser-pro-ser. CTD ma kluczowe znacznie dla mechanizmów, które łączą zdarzenia po-transkrypcyjne z transkrypcją. Na przykład, praktycznie wszystkie kompleksy zaangażowane w obróbkę RNA (RNA processing) zawierają składniki, które wiążą się do CTD. Wciąż niewiele wiadomo, jak CTD lokalizuje się przestrzennie w stosunku do głównej części polimerazy. Wiadomo jedynie, że CTD jest bardzo elastyczna i może się dynamicznie przekształcać w trakcie pełnienia swoich licznych funkcji.
Chromosomy politeniczne uwidocznione za pomocą przeciwciał: czerwone – fosforylowana domena CTD RNA Pol II, zielone - nieufosforylowana domena CTD RNA Pol II. Kolor czerwony kolokalizuje z ’puffami’, w których aktywnie zachodzi transkrypcja.
Sekwencje regulatorowe w transkrypcji RNA POL II – promotor i ‘TATA box’ (kaseta TATA)
RNA DNA Do czego służy regulacja? Transkrypcja rRNA – przypadek szczególny RNA DNA
‘Włączanie’ i ‘wyłączanie’ genów zależy od sekwencji DNA i oddziałujących z nimi specyficznie białek
Idea działania białek wiążących się do sekwencji cis-regulatorowych
Operon laktozowy Prokarionty
Operon tryptofanowy Prokarionty
Eukarionty Promotory i Enhancery (wzmacniacze)
Podstawowe elementy bliskiego promotora Pol II Most eukaryotic promoters have TATA box
Ogólny Aparat Transkrypcyjny
Sekwencyjny model składania Kompleksu Preinicjacyjnego (PIC) -30 +1 TATA Inr Sekwencyjny model składania Kompleksu Preinicjacyjnego (PIC) IIB RNA polimeraza II TFIID } TBP TAFs IIE Pol IIa or TBP IIA IIF helicase protein kinase IIH TATA Inr Kompleks preinicjacyjny ATP - hydroliza Kompleks inicjacyjny, DNA na I nukl. stopiony TFII A, B, D,E, H, F – Ogólne Czynniki Transkrypcyjne (GTF) TAFs - TBP Associated Factors CTD TFIID EMSA analysis and commitment assays led to sequencial model for preinitiation complex (PIC) formation: D to DA to DAB PolIIF toDABPolIIFEH. TFIID us multi-subunit complex = TBP + TAFs. TBP components recognizes the TATAA sequence. However, TFIID can also recognize TATAA les promoters by alternate binding modes. TBP is also found in promoter recognition complexes for the other polymerases. = PIC Polimeryzacja pierwszych kilku nukleozydotrifosforanów i fosforylacja CTD prowadzą do uwolnienia promotora. TFIIB, TFIIE i TFIIH dysocjują, PolII+IIF rozpoczyna elongację, a TFIID + TFIIA pozostają na TATA. Activated PIC
TATA binding protein (TBP) w kompleksie z DNA w rejonie ‘TATA-box’
Elementy cis-regulatorowe w sekwencji DNA (dalszy promotor, enhancery) Czynniki transkrypcyjne (TF)
Sekwencje w promotorze Pol II Promotory maja budowę modułową
Promotory genów różnią się układem modułów
Motywy sekwencji cis-regulatorowych i czynniki transkrypcyjne (TF) regulujące geny histonów rdzeniowych
Motywy w TF umożliwiające oddziaływania z DNA a-helix Zinc fingers Leucine Zippers
Kompleks Mediatora – wielopodjednostkowy kompleks 25 białek, kluczowy podczas aktywacji RNA polimerazy II w trakcie inicjacji transkrypcji (odkrywca: R. Kornberg)
Lokalizacja Mediatora w stosunku do Ogólnego Aparatu Transkrypcyjnego (OAT) w układzie aktywacji transkrypcji Aktywatory Osobny moduł kompleksu Mediatora odpowiedzialny za represję transkrypcji CTD Pol II OAT Pol II
Lokalizacja Mediatora w stosunku do Ogólnego Aparatu Transkrypcyjnego (OAT) w układzie represji transkrypcji Mediator przyłączony do Represora (REPR) zawiera moduł SRB 8-11, który uniemożliwia oddziaływanie z Pol II i OAT
Regulacja przez TF działające na kompleks mediatora Strzałki pokazują rejon dalszego promotora
Czynnik transkrypcyjny Sp1 – dwudomenowa budowa TF
Enhancery i Silencery Enhancery stymulują transkrypcję, silencery hamują transkrypcję . Jedne i drugie działają niezależnie od orientacji, tj odwrócenie ich sekwencji nie wpływa na efekt. Jedne i drugie działają niezależnie od miejsca położenia w genomie. Mogą działać na odległość w stosunku do promotora Enhancery wykrywa się nieomal wszędzie Jedne i drugie stanowią miejsce wiązania dla specyficznie regulowanych czynników transkrypcyjnych.
Oddziaływania enhancera z transaktywatorami
Enhancery działają na odległość
Lokalizacja i funkcje izolatorów
Czynniki transkrypcyjne i funkcjonowanie organizmów
Zawartość i liczebność rodzin czynników transkrypcyjnych u eukariontów
Porównanie rodzin czynników transkrypcyjnych u eukariontów
Gen kontrolujący inne geny za pomocą kodowanego czynnika transkrypcyjnego
Czynniki transkrypcyjne w ogólnej sieci sygnałowej komórki Białka stanowiące czynniki transkrypcyjne zaznaczono kolorem niebieskim
Oscylacje różnych czynników transkrypcyjncyh w cyklu dobowym Oscylacje różnych czynników transkrypcyjncyh w cyklu dobowym . Mierzono poziom transkryptów poziom 42 TF z trzech rodzin: MYB, bHLH, i bZIP Hanano et al. BMC Genomics 2008 9:182 doi:10.1186/1471-2164-9-182
Losy transkryptów u eu- i prokaryota
Obróbka nowozsyntetyzowanego (prekursorowego) mRNA Czapeczka “Cap” jest dodawana na 5’ końcu mRNA Introny są usuwane Ogon ‘Poli A’ jest dodawany na 3’ końcu mRNA
Obróbka nowozsyntetyzowanego mRNA
Funkcje ‘CAP’ 5' cap pełni 4 główne funkcje: Reguluje eksport z jądra. Zapobiega degradacji przez egzonukleazy. Promuje translację. Promuje wycinanie sąsiadującego z końcem 5’ intronu. Eksport RNA z jądra jest regulowany przez Cap Binding Complex (CBC), który przyłącza się wyłącznie do RENA z ‘CAP’. CBC jest następnie rozpoznawany przez Kompleks Poru Jądrowego i eksportowany. Zapobieganie degradacji 5‘ końca przez egzonuklelazy polega na upodobnieniu tego końca funkcjonalnie do końca 3'. Wydłuża to okres pół-trwania mRNA, co jest niezbędne u eukariontów ze względu na długi czas potrzebny na eksport mRNA z jądra. Podczas aktywnej translacji do ‘CAP’ wiąże się czynnik inicjacji translacji eIF-4E, który następnie przyłącza czynnik eIF-4G i w następstwie, rybosom. Usunięcie ‘CAP’ z mRNA jest katalizowane przez kompleks białkowy (Decapping complex) zawierający czynniki dcp1 i dcp2, które konkurują z eIF-4E o wiązanie z ‘CAP’. Mechanizm promowania przez ‘CAP’ wycinania sąsiadującego z 5' końcem intronu obejmuje oddziaływanie ze spliceosomem.
Dodawanie czapeczki na 5’ końcu transkryptu
Introny U prokariontów geny są ciągłe, tj. kolinearne z ich mRNA. U wyższych eukariontów geny są nieciągłe, tj. niekolinearne z ich mRNA. Części genu ulegające ekspresji noszą nazwę eksonów, zaś sekwencje przedzielające eksony – intronów.
Precyzyjne usuwanie intronów Sekwencje konsensusowe oskrzydalające miejca: 5’ donorowe i 3’ akceptorowe nnnnnnG//GUn-----nnAnn--------AG//Gnnnnn Miejsce 5’donorowe Miejsce 3’ akceptorowe
Sekwencje rozpoznawane przez system splicingu
Mechanizm splicingu
W każdej chwili w jądrze komórki ludzkiej odbywa się średnio 63,000 wydarzeń splicingowych. Current Drug Discovery Nov. 2004, page 15
Alternatywny splicing prekursorów mRNA Genom ludzki zawiera 22 tysiące genów, ale koduje ponad 100 tysięcy białek Przyczyna? Alternatywny splicing prekursorów mRNA
Z jednego genu powstają dwa mRNA kodujące dwa różne białka Alternatywny splicing pre-mRNA I III mRNA 2 GU AG GU I II AG III 1 gen I II III mRNA 1 Z jednego genu powstają dwa mRNA kodujące dwa różne białka
Terminacja – dodawanie poliA …AAUAAA………
Poliadenylacja 3’ końca mRNA
Struktura 3’ szpilki w mRNA histonów
NMD- Nonsense-Mediated Decay System degradacji nieprawidłowych mRNA, zawierających PTC (Premature Terminantion Codon) - przedwczesne kodony terminacyjne translacji Ścieżka NMD wywiera bezpośredni wpływ na setki zaburzeń genetycznych w populacji ludzkiej. ¼ wszystkich znanych mutacji u człowieka indukuje NMD
Rejony kontrolne RNA polimeraz I i III
Świat małych RNA www.plantcell.org/cgi/doi/10.1105/tpc.110.tt0210
Czym są małe RNA? Małe RNA to populacja cząsteczek RNA o długości 21 to 24 nt, które generalnie powodują wyciszanie genów (gene silencing) Małe RNA przyczyniają się do potranskrypcyjnego wyciszania genów (post-transcriptional gene silencing-PTGS) poprzez negatywne działanie na translację lub stabilność mRNA Małe RNA przyczyniają się do transkrypcyjnego wyciszania genów (transcriptional gene silencing-TGS) poprzez epigenetyczne modyfikacje chromatyny AAAAA RNA Pol Modyfikacje histonów, metylacja DNA The red symbol represents the small RNA. The green symbol with the AAAAA indicates an mRNA. The drawing on the bottom represents double stranded DNA being transcribed by RNA Polymerase to produce a transcript. Association of a small RNA with this transcript helps to target the enzymes that covalently modify chromatin (histone modifying enzymes and DNA methyltransferases) to confer silencing.
Podstawa wyciszania przez RNA – białka Dicer i Argonaute Wyciszanie przez RNA opiera się na dwóch podstawowych reakcjach: a) Dwuniciowy RNA (dsRNA) jest rozcinany przez Dicer i jego homologi na krótkie dwuniciowe RNA. b) Te małe RNA asocjują następnie z białkami rodziny ARGONAUTE i powodują wyciszenie. DICER AGO Silencing The Dicer or (in plants) Dicer-like enzymes cleave dsRNA. Small RNAs associate with ARGONAUTEs (AGOs) to target them to their targets.
Dicer i białka podobne do Dicer W biogenezie siRNA i miRNA, Dicer lub białka podobne do Dicer (Dicer-like – DCL proteins) rozcinają dsRNA lub RNA ze spinką (hairpin) na fragmenty ~ 21 – 25 nt. Note the two strands of the RNA molecule. The cleavage sites are indicated by yellow arrows. Struktura Dicer’a pozwala mu „mierzyć” RNA, który rozcina. Podobnie jak kucharz szatkujący marchewkę, Dicer tnie RNA na równe fragmenty. From MacRae, I.J., Zhou, K., Li, F., Repic, A., Brooks, A.N., Cande, W.., Adams, P.D., and Doudna, J.A. (2006) Structural basis for double-stranded RNA processing by Dicer. Science 311: 195 -198. Reprinted with permission from AAAS. Photo credit: Heidi
Mutant Arabidopsis ago1 i ośmiornica Argonauta argo Białka Argonaute Mutant Arabidopsis ago1 i ośmiornica Argonauta argo Białka ARGONAUTE nazwano tak ze względu na wygląd mutanta Arabidopsis argonaute1 ; ago1 ma promieniście rozłożone liście przez co przypomina ośmiornicę o nazwie Argonauta. Białka ARGONAUTE wiążą małe RNA i ich cele http://youdpreferanargonaute.com/2009/06/ Reprinted by permission from Macmillan Publishers Ltd: EMBO J. Bohmert, K., Camus, I., Bellini, C., Bouchez, D., Caboche, M., and Benning, C. (1998) AGO1 defines a novel locus of Arabidopsis controlling leaf development. EMBO J. 17: 170–180. Copyright 1998; Reprinted from Song, J.-J., Smith, S.K., Hannon, G.J., and Joshua-Tor, L. (2004) Crystal structure of Argonaute and its implications for RISC slicer activity. Science 305: 1434 – 1437. with permission of AAAS.
Wyciszanie przez RNA – obraz ogólny DCL MIR gene RNA Pol AAAn AGO MicroRNA – działa poprzez wyciszanie mRNA i represję translacji mRNA siRNA- działa poprzez potranskrypcyjne i transkrypcyjne wyciszanie genów MicroRNAs are encoded by MIR genes, fold into hairpin structures that are recognized and cleaved by DCL (Dicer-like) proteins.
Zastosowania technologii małych RNA Wyciszanie genów służy do eliminacji alergenów z orzeszków ziemnych. Wyciszanie genów służy do usuwania szkodliwych związków z nasion bawełny, co pozwala na ich zastosowanie jako pokarmu. DNA tworzące siRNA lub miRNA mogą być stabilnie wprowadzane do genomów roślin w celu selektywnego wyciszenia genów. Kontrola zainfekowana przez pasożytniczegio nicienia Oporność indukowana RNAi Rośliny wyrażające dsRNA odpowiadające wybranym genom nicienia sa odporne na infekcje. Wchlonietę przez nicienia dsRNA indukuje wyciszenie jego genów. Kontrola szkodników The use of small RNAs in human therapies is likely to be of interest to some students as well; see lecture notes for more on these applications. Huang, G., Allen, R., Davis, E.L., Baum, T.J., and Hussey, R.S. (2006) Engineering broad root-knot resistance in transgenic plants by RNAi silencing of a conserved and essential root-knot nematode parasitism gene. Proc. Natl. Acad. Sci. USA 103: 14302–14306.
Podsumowanie Małe RNA biorą udział w regulacji aktywności i ochronie genomu; specyficzność ich działania wyciszającego opiera się na parowaniu zasad. Celami dla siRNA sa bogate w sekwencje powtarzalne rejony heterochromatyny, transpozony, wirusy i inne patogeny. Celami dla miRNAs i tasiRNAs sa geny regulatorowe wpływające za czasowy i przestrzenny wzór rozwoju, homeostazę pokarmową i odpowiedzi na czynniki stresowe.