Regulační sekvence - Regulatory sequence

Regulační sekvence je segment nukleové kyseliny, molekuly, která je schopná zvýšení nebo snížení exprese specifických genů v organismu. Regulace genové exprese je základním rysem všech živých organismů a virů.

Popis

Výše uvedený obrázek obsahuje odkazy, na které lze kliknout
Struktura genu kódujícího eukaryotický protein . Regulační sekvence kontroluje, kdy a kde dochází k expresi pro oblast kódující protein (červená). Oblasti promotoru a zesilovače (žlutá) regulují transkripci genu do pre-mRNA, která je upravena tak, aby se odstranily introny (světle šedá) a přidal se 5 'uzávěr a poly-A ocas (tmavě šedá). Netranslatované oblasti mRNA 5 ' a 3' (modré) regulují translaci do konečného proteinového produktu.

V DNA se regulace genové exprese normálně děje na úrovni biosyntézy RNA ( transkripce ) a je prováděna prostřednictvím sekvenčně specifické vazby proteinů ( transkripční faktory ), které transkripci aktivují nebo inhibují. Transkripční faktory mohou působit jako aktivátory , represory nebo obojí. Represory často působí tak, že brání RNA polymerase ve vytváření produktivního komplexu s oblastí iniciace transkripce ( promotor ), zatímco aktivátory usnadňují tvorbu produktivního komplexu. Kromě toho se ukázalo, že motivy DNA předpovídají epigenomické modifikace, což naznačuje, že transkripční faktory hrají roli při regulaci epigenomu.

V RNA může dojít k regulaci na úrovni proteinové biosyntézy ( translace ), štěpení RNA, sestřihu RNA nebo ukončení transkripce. Regulační sekvence jsou často asociovány s molekulami messenger RNA (mRNA), kde jsou použity ke kontrole biogeneze nebo translace mRNA. K dosažení této regulace se na RNA může vázat celá řada biologických molekul, včetně proteinů (např. Translačních represorů a sestřihových faktorů), dalších molekul RNA (např. MiRNA ) a malých molekul , v případě riboswitchů .

Aktivace a implementace regulačních sekvencí

Regulační sekvence DNA nereguluje, pokud není aktivována. Aktivují se různé regulační sekvence a poté implementují jejich regulaci různými mechanismy.

Aktivace a implementace Enhanceru

Regulace transkripce u savců . Aktivní enhancerová regulační sekvence DNA umožňuje interakci s regulační sekvencí promotorové DNA svého cílového genu vytvořením chromozomové smyčky. To může iniciovat syntézu messengerové RNA (mRNA) RNA polymerázou II (RNAP II) navázanou na promotor v počátečním místě transkripce genu. Smyčka je stabilizována jedním architektonickým proteinem ukotveným k zesilovači a jedním ukotveným k promotoru a tyto proteiny jsou spojeny za vzniku dimeru (červené cikcaky). Specifické regulační transkripční faktory se vážou k motivům sekvencí DNA na zesilovači. Obecné transkripční faktory se vážou na promotor. Když je transkripční faktor aktivován signálem (zde označeným jako fosforylace zobrazená malou červenou hvězdou na transkripčním faktoru na zesilovači), aktivátor je aktivován a nyní může aktivovat svůj cílový promotor. Aktivní zesilovač je transkribován na každém řetězci DNA v opačných směrech navázanými RNAP II. Mediátor (komplex sestávající z přibližně 26 proteinů v interagující struktuře) sděluje promotoru regulační signály z transkripčních faktorů vázaných na zesilovač DNA.

Upregulovanou expresi genů u savců lze zahájit přenosem signálů do promotorů spojených s geny. Cis-regulační DNA sekvence, které se nacházejí v DNA oblastech vzdálených od promotorů genů, mohou mít velmi velké účinky na genovou expresi, přičemž některé geny procházejí až 100násobně zvýšenou expresí díky takové cis-regulační sekvenci. Tyto cis-regulační sekvence zahrnují zesilovače , tlumiče , izolátory a prvky uvázání. Mezi touto konstelací sekvencí mají zesilovače a jejich přidružené proteiny transkripčního faktoru vedoucí úlohu v regulaci genové exprese.

Enhancery jsou sekvence genomu, které jsou hlavními prvky regulace genů. Zesilovače kontrolují programy genové exprese specifické pro buněčný typ, nejčastěji smyčkou na dlouhé vzdálenosti, aby se dostaly do fyzické blízkosti promotorů jejich cílových genů. Ve studii mozkových kortikálních neuronů bylo nalezeno 24 937 smyček, které přinesly promotory promotory. Několik zesilovačů, každý často v desítkách nebo stovkách tisíc nukleotidů vzdálených od jejich cílových genů, se smyčkou spojí se svými promotory cílového genu a navzájem se koordinují, aby řídily expresi svého společného cílového genu.

Schematické znázornění v této části ukazuje smyčku zesilovače, aby se dostala do těsné fyzické blízkosti s promotorem cílového genu. Smyčka je stabilizována dimerem spojovacího proteinu (např. Dimerem CTCF nebo YY1 ), přičemž jeden člen dimeru je ukotven ke svému vazebnému motivu na zesilovači a druhý člen je ukotven ke svému vazebnému motivu na promotoru (reprezentovaném červené cikcaky na obrázku). Několik proteinů specifických pro transkripční faktor specifických pro buněčnou funkci (v roce 2018 Lambert et al. Uvedli, že v lidské buňce bylo asi 1600 transkripčních faktorů) se obecně váže na specifické motivy na zesilovači a malé kombinaci těchto transkripčních faktorů vázaných na zesilovač, když se přiblíží promotor DNA smyčkou, řídí úroveň transkripce cílového genu. Mediátor (koaktivátor) (komplex obvykle sestávající z přibližně 26 proteinů v interagující struktuře) sděluje regulační signály z transkripčních faktorů vázaných na zesilovač DNA přímo na enzym RNA polymerázy II (RNAP II) navázaný na promotor.

Pokud jsou zesilovače aktivní, jsou obecně transkribovány z obou řetězců DNA RNA polymerázami působícími ve dvou různých směrech, čímž se vytvoří dvě eRNA, jak je znázorněno na obrázku. Neaktivní zesilovač může být vázán neaktivním transkripčním faktorem. Fosforylace transkripčního faktoru jej může aktivovat a aktivovaný transkripční faktor pak může aktivovat zesilovač, ke kterému je vázán (viz malá červená hvězda představující fosforylaci transkripčního faktoru vázaného na zesilovač na obrázku). Aktivovaný zesilovač začíná transkripci své RNA před aktivací promotoru k zahájení transkripce messengerové RNA ze svého cílového genu.

Methylace a demetylace ostrova CpG

To ukazuje, kde se methylová skupina přidává, když se tvoří 5-methylcytosin

5-methylcytosin (5-mC) je methylovaná forma cytosinu na bázi DNA (viz obrázek). 5-mC je epigenetický marker nacházející se převážně na cytosinech v dinukleotidech CpG, kde za 5 'cytosinem následuje 3' guanin ( místa CpG ). V lidském genomu se vyskytuje asi 28 milionů dinukleotidů CpG. Ve většině tkání savců je v průměru methylováno 70% až 80% CpG cytosinů (tvořících 5-methylCpG nebo 5-mCpG). Metylované cytosiny v 3'-sekvencích cytosin-guanin 3 'se často vyskytují ve skupinách, nazývaných CpG ostrovy . Asi 59% sekvencí promotoru má ostrov CpG, zatímco pouze asi 6% sekvencí zesilovače má ostrov CpG. CpG ostrovy představují regulační sekvence, protože pokud jsou CpG ostrovy methylované v promotoru genu, může to snížit nebo umlčet expresi genu.

Methylace DNA reguluje genovou expresi prostřednictvím interakce s proteiny metylové vazebné domény (MBD), jako je MeCP2, MBD1 a MBD2. Tyto MBD proteiny se nejsilněji vážou na vysoce methylované CpG ostrovy . Tyto MBD proteiny mají doménu vázající methyl-CpG i doménu transkripční represe. Vázají se na methylovanou DNA a navádějí nebo nasměrují proteinové komplexy s remodelací chromatinu a/nebo aktivitou modifikující histon na methylované CpG ostrovy. Proteiny MBD obecně potlačují místní chromatin, například katalyzováním zavedení represivních histonových značek nebo vytvořením celkového represivního chromatinového prostředí prostřednictvím remodelace nukleosomů a reorganizace chromatinu.

Jak bylo uvedeno v předchozí části, transkripční faktory jsou proteiny, které se vážou na specifické sekvence DNA, aby regulovaly expresi daného genu. Vazebná sekvence pro transkripční faktor v DNA je obvykle dlouhá asi 10 nebo 11 nukleotidů. Jak bylo shrnuto v roce 2009, Vaquerizas et al. uvedeno, že v lidském genomu je kódováno přibližně 1400 různých transkripčních faktorů a tvoří asi 6% všech genů kódujících lidský protein. Asi 94% vazebných míst transkripčního faktoru (TFBS), která jsou spojena s geny reagujícími na signál, se vyskytuje v zesilovačích, zatímco pouze asi 6% takových TFBS se vyskytuje v promotorech.

Protein EGR1 je konkrétním transkripčním faktorem, který je důležitý pro regulaci methylace ostrovů CpG. EGR1 vazebné místo transkripčního faktoru se často nachází v zesilovací nebo promotorové sekvence. V savčím genomu je asi 12 000 vazebných míst pro EGR1 a asi polovina vazebných míst EGR1 je umístěna v promotorech a polovina v zesilovačích. Vazba EGR1 na jeho cílové vazebné místo DNA je necitlivá na methylaci cytosinu v DNA.

Zatímco v buňkách, které nejsou stimulovány, je detekovatelné pouze malé množství proteinu transkripčního faktoru EGR1, translace EGR1 do proteinu jednu hodinu po stimulaci je drasticky zvýšená. Exprese proteinů transkripčního faktoru EGR1 v různých typech buněk může být stimulována růstovými faktory, neurotransmitery, hormony, stresem a zraněním. V mozku, když jsou aktivovány neurony, jsou proteiny EGR1 up-regulovány a vážou se (rekrutují) již existující enzymy TET1, které jsou v neuronech vysoce exprimovány. Enzymy TET mohou katalyzovat demetylaci 5-methylcytosinu. Když transkripční faktory EGR1 přivedou enzymy TET1 na vazebná místa EGR1 v promotorech, mohou enzymy TET demetylovat methylované ostrovy CpG na těchto promotorech. Po demetylaci mohou tyto promotory poté zahájit transkripci svých cílových genů. Stovky genů v neuronech jsou různě exprimovány po aktivaci neuronů prostřednictvím EGR1 náboru TET1 do methylovaných regulačních sekvencí v jejich promotorech.

Signál reagující promotory a zesilovače podléhající omezeným, krátkodobým, dvouvláknovým nebo jednořetězcovým přestávkám

Zdá se, že asi 600 regulačních sekvencí v promotorech a asi 800 regulačních sekvencí v zesilovačích závisí na aktivaci dvouřetězcových zlomů iniciovaných topoizomerázou 2-beta ( TOP2B ). Indukce konkrétních dvouvláknových zlomů je specifická s ohledem na jejich indukční signál. Když jsou neurony aktivovány in vitro , dojde v jejich genomech pouze k 22 zlomům dvouvláken indukovaných TOP2B . Když se však u myši provádí kondicionování kontextového strachu , způsobí toto kondicionování stovky DSB spojených s genem v mediálním prefrontálním kortexu (mPFC) a hippocampu, které jsou důležité pro učení a paměť.

Regulační sekvence v promotoru na počátečním místě transkripce s pozastavenou RNA polymerázou a dvouřetězcovým zlomem indukovaným TOP2B

Takové dvouvláknové přerušení indukované TOP2B jsou doprovázeny alespoň čtyřmi enzymy cesty opravy DNA nehomologního konce (NHEJ) (DNA-PKcs, KU70, KU80 a DNA LIGASE IV) (viz obrázek). Tyto enzymy opraví dvouvláknové přestávky během asi 15 minut až dvou hodin. Dvouřetězcové zlomy v promotoru jsou tedy spojeny s TOP2B a alespoň s těmito čtyřmi opravnými enzymy. Tyto proteiny jsou přítomny současně na jednom promotorovém nukleosomu (v sekvenci DNA je kolem 147 nukleotidů zabaleno kolem jednoho nukleozomu) umístěných poblíž místa startu transkripce jejich cílového genu.

Přerušení dvou vláken zavedené pomocí TOP2B zjevně uvolňuje část promotoru na počátečním místě transkripce vázané na RNA polymerázu, aby se fyzicky přesunulo do svého přidruženého zesilovače. To umožňuje zesilovači s navázanými transkripčními faktory a mediátorovými proteiny přímo interagovat s RNA polymerázou pozastavenou v místě zahájení transkripce za účelem zahájení transkripce.

Enzymy topoizomerázy I (TOP1) se zdají být umístěny na velkém počtu zesilovačů a tyto zesilovače se aktivují, když TOP1 zavede přerušení jednoho vlákna. TOP1 způsobuje přerušení jednoho vlákna v konkrétních regulačních sekvencích zesilovače DNA, když je signalizováno specifickým transkripčním faktorem vázajícím zesilovač. Přerušení topoizomerázy I jsou spojeny s jinými faktory opravy DNA než ty, které obklopují zlomy TOP2B. V případě TOP1 jsou zlomy spojeny nejvíce bezprostředně s enzymy pro opravu DNA MRE11 , RAD50 a ATR .

Příklady

Probíhá výzkum zaměřený na nalezení všech regulačních oblastí v genomech všech druhů organismů. Konzervované nekódující sekvence často obsahují regulační oblasti, a proto jsou často předmětem těchto analýz.

Gen pro inzulín

Regulační sekvence pro inzulínový gen jsou:

Viz také

Reference

externí odkazy