Esenciální gen - Essential gene

Esenciální geny jsou nepostradatelné geny pro organismy k růstu a reprodukci potomků v určitém prostředí. Nicméně, je důležité, je velmi závislý na okolnostech, ve kterých žije organismus. Například gen potřebný k trávení škrobu je nezbytný pouze tehdy, je -li škrob jediným zdrojem energie. V poslední době byly učiněny systematické pokusy identifikovat ty geny, které jsou naprosto nezbytné pro udržení života, za předpokladu, že jsou k dispozici všechny živiny. Takové experimenty vedly k závěru, že absolutně požadovaný počet genů pro bakterie je řádově asi 250–300. Esenciální geny jednobuněčných organismů kódují proteiny pro tři základní funkce včetně zpracování genetických informací, buněčných obalů a produkce energie. Tyto genové funkce se používají k udržování centrálního metabolismu , replikaci DNA , překládání genů do proteinů , udržování základní buněčné struktury a zprostředkování transportních procesů do a ven z buňky. Ve srovnání s jednobuněčnými organismy mají mnohobuněčné organismy důležitější geny související s komunikací a vývojem. Většina základních genů ve virech souvisí se zpracováním a udržováním genetické informace. Na rozdíl od většiny jednobuněčných organismů chybí virům mnoho esenciálních genů pro metabolismus, což je nutí unést metabolismus hostitele. Většina genů není nezbytných, ale přináší selektivní výhody a zvýšenou kondici . Drtivá většina genů tedy není nezbytná a mnoho z nich lze bez následků odstranit, alespoň za většiny okolností.

Bakterie: studie celého genomu

K identifikaci esenciálních genů na celém genomu byly použity dvě hlavní strategie: cílená delece genů a náhodná mutageneze pomocí transpozonů . V prvním případě jsou anotované jednotlivé geny (nebo ORF ) zcela systematicky vymazány z genomu . Při mutagenezi zprostředkované transpozony jsou transpozony náhodně vloženy do tolika poloh v genomu, aby se narušila funkce cílených genů (viz obrázek níže). Inzerční mutanty, které jsou stále schopné přežít nebo růst, naznačují, že transpozon je vložen do genu, který není nezbytný pro přežití. Umístění transpozonových inzercí lze určit hybridizací na mikročipy nebo sekvenováním transpozonu . Souhrn těchto obrazovek je uveden v tabulce.

Organismus Mutageneze Metoda Čtení ORF Nees. Nezbytný % Ess. Poznámky Ref.
Mycoplasma genitalium/pneumoniae Náhodný Počet obyvatel Sekvenování 482 130 265–350 55–73% ---
Mycoplasma genitalium Náhodný Klony Sekvenování 482 100 382 79% před naším letopočtem
Staphylococcus aureus WCUH29 Náhodný Klony Sekvenování 2600 není k dispozici 168 není k dispozici před naším letopočtem
Staphylococcus aureus RN4220 Náhodný Klony Sekvenování 2 892 není k dispozici 658 23% ---
Haemophilus influenzae Rd Náhodný Počet obyvatel Footprint-PCR 1657 602 670 40% ---
Streptococcus pneumoniae Rx-1 Cílené Klony Tvorba kolonií 2043 234 113 není k dispozici C
Streptococcus pneumoniae D39 Cílené Klony Tvorba kolonií 2043 560 133 není k dispozici C
Streptococcus pyogenes 5448 Náhodný Transpozon Tn-seq 1865 ? 227 12% ---
Streptococcus pyogenes NZ131 Náhodný Transpozon Tn-seq 1700 ? 241 14% ---
Streptococcus sanguinis SK36 Cílené Klony Tvorba kolonií 2270 2,052 218 10% aj
Mycobacterium tuberculosis H37Rv Náhodný Počet obyvatel Microarray 3,989 2567 614 15% ---
Mycobacterium tuberculosis Náhodný Transpozon ? 3,989 ? 401 10% ---
Mycobacterium tuberculosis H37Rv Náhodný Transpozon Sekvenování NG 3,989 ? 774 19% ---
Mycobacterium tuberculosis H37Rv Náhodný Transpozon Sekvenování NG 3,989 3,364 625 16% Ahoj
Mycobacterium tuberculosis --- Výpočetní Výpočetní 3,989 ? 283 7% ---
Bacillus subtilis 168 Cílené Klony Tvorba kolonií 4,105 3830 261 7% a, d, g
Escherichia coli K-12 MG1655 Náhodný Počet obyvatel Footprint-PCR 4,308 3,126 620 14% ---
Escherichia coli K-12 MG1655 Cílené Klony Tvorba kolonií 4,308 2,001 není k dispozici není k dispozici a, e
Escherichia coli K-12 BW25113 Cílené Klony Tvorba kolonií 4,390 3,985 303 7% A
Pseudomonas aeruginosa PAO1 Náhodný Klony Sekvenování 5 570 4,783 678 12% A
Porphyromonas gingivalis Náhodný Transpozon Sekvenování 1 990 1527 463 23% ---
Pseudomonas aeruginosa PA14 Náhodný Klony Sekvenování 5 688 4,469 335 6% a, f
Salmonella typhimurium Náhodný Klony Sekvenování 4,425 není k dispozici 257 ~ 11% před naším letopočtem
Helicobacter pylori G27 Náhodný Počet obyvatel Microarray 1576 1 178 344 22% ---
Corynebacterium glutamicum Náhodný Počet obyvatel ? 3002 2 352 650 22% ---
Francisella novicida Náhodný Transpozon ? 1719 1327 392 23% ---
Mycoplasma pulmonis UAB CTIP Náhodný Transpozon ? 782 472 310 40% ---
Vibrio cholerae N16961 Náhodný Transpozon ? 3 890 ? 779 20% ---
Salmonella Typhi Náhodný Transpozon ? 4,646 ? 353 8% ---
Staphylococcus aureus Náhodný Transpozon ? ~ 2600 ? 351 14% ---
Caulobacter crescentus Náhodný Transpozon Tn-Sek 3,876 3240 480 12,2% ---
Neisseria meningitidis Náhodný Transpozon ? 2,158 ? 585 27% ---
Desulfovibrio alaskensis Náhodný Transpozon Sekvenování 3,258 2871 387 12% ---

Tabulka 1. Esenciální geny v bakteriích . Mutageneze : cílené mutanty jsou genové delece; náhodné mutanty jsou transpozonové inzerce. Metody : Klony indikují delece jednoho genu, populace označuje mutagenezi celé populace, např. Pomocí transpozonů. Mezi základní geny z populačních obrazovek patří geny nezbytné pro kondici (viz text). ORF : počet všech otevřených čtecích rámců v tomto genomu. Poznámky : a) je k dispozici sbírka mutantů; b) metoda přímého esenciálního screeningu (např. prostřednictvím antisense RNA), která neposkytuje informace o nepodstatných genech. (c) K dispozici je pouze částečný datový soubor. d) Zahrnuje predikovanou genovou esenciálnost a kompilaci dat z publikovaných studií esenciality s jedním genem. (e) Probíhá projekt. (f) Sečteno porovnáním dvou datových souborů genové esenciality získaných nezávisle v kmenech P. aeruginosa PA14 a PAO1. (g) Původní výsledek 271 esenciálních genů byl opraven na 261, přičemž 31 genů, které byly považovány za esenciální, byly ve skutečnosti neesenciální, zatímco od té doby bylo popsáno 20 nových esenciálních genů. (h) Počítání genů s esenciálními doménami a těmi, které vedou k poruchám růstu, když jsou narušeny, jako zásadní, a těch, které vedou k růstové výhodě, když jsou narušeny jako neesenciální. (i) Zahrnuje plně nasycenou mutantní knihovnu se 14 replikáty, s 84,3% možných inzertních míst s alespoň jednou transpozonovou inzercí. j) Každý základní gen byl nezávisle potvrzen nejméně pětkrát.

Esenciální geny v Mycobacterium tuberculosis H37Rv, jak byly nalezeny pomocí transpozonů, které se vkládají do náhodných poloh v genomu. Pokud v genu nejsou nalezeny žádné transpozony, je tento gen s největší pravděpodobností nezbytný, protože nemůže tolerovat žádnou inzerci. V tomto příkladu esenciální hemové biosyntetické geny hemA, hemB, hemC, hemD postrádají inzerce. Počet přečtených sekvencí ('' čtení/TA '') je uveden pro uvedenou oblast chromozomu H37Rv. Jsou naznačena potenciální místa pro vložení dinukleotidů TA. Obrázek od Griffina a kol. 2011.

Na základě experimentů z celého genomu a analýzy systémové biologie Kong a kol. (2019) pro předpovídání> 4000 bakteriálních druhů.

Eukaryota

U Saccharomyces cerevisiae (pučící kvasinky) je nezbytných 15–20% všech genů. V Schizosaccharomyces pombe (štěpné kvasinky) bylo zkonstruováno 4 836 heterozygotních delecí pokrývajících 98,4% z 4 914 otevřených čtecích rámců kódujících protein. Ukázalo se, že 1 260 z těchto vymazání je nezbytných.

Podobná vyšetření se z technických důvodů obtížněji provádějí u jiných mnohobuněčných organismů, včetně savců (jako model pro lidi), a jejich výsledky jsou méně jasné. Byly však vyvinuty různé metody pro nematodový červ C. elegans , ovocnou mušku a zebrafish (viz tabulka). Nedávná studie 900 myších genů dospěla k závěru, že 42% z nich bylo esenciálních, i když vybrané geny nebyly reprezentativní.

Experimenty s vyřazováním genů nejsou u lidí možné nebo přinejmenším neetické. Přirozené mutace však vedly k identifikaci mutací, které vedou k časné embryonální nebo pozdější smrti. Všimněte si, že mnoho genů u lidí není zcela nezbytných pro přežití, ale při mutaci může způsobit vážné onemocnění. Takové mutace jsou katalogizovány v databázi OMIM ( Online Mendelian Inheritance in Man ). Ve výpočetní analýze genetických variací a mutací u 2472 lidských ortologů známých základních genů u myši Georgi et al. našel silnou, purifikující selekci a srovnatelně snížené úrovně variací sekvence, což naznačuje, že tyto lidské geny jsou také zásadní.

I když může být obtížné prokázat, že gen je u lidí nezbytný, lze prokázat, že gen není nezbytný nebo dokonce nezpůsobuje onemocnění. Například sekvenováním genomů 2 636 islandských občanů a genotypizací 101 584 dalších subjektů bylo nalezeno 8 041 jedinců, kteří měli 1 gen zcela vyřazen (tj. Tito lidé byli homozygotní pro nefunkční gen). Z 8 041 jedinců s úplnými knock-outy bylo odhadováno, že 6 885 jsou homozygoti , 1 249 bylo odhadnuto jako složené heterozygoty (tj. Měly obě alely genu vyřazené, ale dvě alely měly různé mutace). U těchto jedinců bylo celkem vyřazeno celkem 1171 z 19 135 lidských ( RefSeq ) genů (6,1%). Byl učiněn závěr, že těchto 1171 genů není u lidí nezbytných- přinejmenším nebyla hlášena žádná související onemocnění. Podobně exomové sekvence 3222 dospělých britského pákistánského dědictví s vysokou rodičovskou příbuzností odhalily 1111 vzácných variant homozygotních genotypů s předpovídanou ztrátou genové funkce (LOF = knockouts) v 781 genech. Tato studie zjistila v průměru 140 predikovaných genotypů LOF (na subjekt), včetně 16 vzácných ( frekvence alel <1%) heterozygotů, 0,34 vzácných homozygotů, 83,2 běžných heterozygotů a 40,6 běžných homozygotů. V autozygotních segmentech byly nalezeny téměř všechny vzácné homozygotní genotypy LOF (94,9%). Přestože většina těchto jedinců neměla žádný zjevný zdravotní problém vyplývající z jejich defektních genů, je možné, že menší zdravotní problémy lze nalézt při podrobnějším zkoumání.

Souhrn obrazovek zásadnosti je uveden v následující tabulce (většinou vychází z databáze základních genů.

Organismus Metoda Základní geny Ref.
Arabidopsis thaliana Inzerce T-DNA 777
Caenorhabditis elegans (červ) Interference RNA 294
Danio rerio (zebrafish) Inzerční mutageneze 288
Drosophila melanogaster (ovocná muška) Mutageneze inzerce P-elementu 339
Homo sapiens (člověk) Hledání literatury 118
Homo sapiens (člověk) Obrazovka založená na CRISPR/Cas9 1878
Homo sapiens (člověk) Screen pasti na haploidní gen ~ 2 000
Homo sapiens (člověk) ortology myší 2472
Mus musculus (myš) Hledání literatury 2114
Saccharomyces cerevisiae (kvasinky) Delece jednoho genu 878
Saccharomyces cerevisiae (kvasinky) Delece jednoho genu 1,105
Schizosaccharomyces pombe (kvasnice) Delece jednoho genu 1 260

Viry

Virům chybí mnoho genů nezbytných pro metabolismus, což je nutí unést metabolismus hostitele. U několika virů byly provedeny testy základních genů. Například bylo zjištěno , že lidský cytomegalovirus (CMV) má 41 esenciálních, 88 neesenciálních a 27 augmentujících ORF (150 celkových ORF). Většina esenciálních a augmentujících genů se nachází v centrální oblasti a neesenciální geny se obvykle shlukují poblíž konců virového genomu.

Tscharke a Dobson (2015) sestavili komplexní průzkum základních genů viru Vaccinia a přiřazili role každému z 223 ORF kmene Western Reserve (WR) a 207 ORF kmene Kodaň, přičemž zhodnotili jejich roli v replikaci v buněčné kultuře. Podle jejich definice je gen považován za esenciální (tj. Má roli v buněčné kultuře), pokud jeho delece má za následek snížení titru viru více než 10krát v jednokrokové nebo vícestupňové růstové křivce. Všechny geny zapojené do produkce zabaleného virionu, tvorby aktinového ocasu a uvolnění extracelulárního virionu byly také považovány za zásadní. Geny, které ovlivňují velikost plaku, ale ne replikaci, byly definovány jako neesenciální. Podle této definice je pro replikaci viru vakcínie v buněčné kultuře zapotřebí 93 genů, zatímco 108 a 94 ORF z WR a Kodaň v tomto pořadí nejsou podstatné. Viry vakcinie s delecemi na obou koncích genomu se chovaly podle očekávání a vykazovaly pouze mírné defekty nebo defekty hostitelského rozsahu. Naproti tomu kombinace delecí na obou koncích genomu pro kmen VACV WR způsobila zničující růstový defekt na všech testovaných buněčných liniích. To ukazuje, že delece jednoho genu nestačí k posouzení esenciality genů a že ve viru Vaccinia je podstatných více genů, než se původně předpokládalo.

Jeden z bakteriofágů testovaných na esenciální geny zahrnuje mycobacteriophage Giles. Nejméně 35 ze 78 predikovaných genů Giles (45%) je pro lytický růst nepodstatných. Bylo zjištěno, že 20 genů je nezbytných. Hlavním problémem fágových genů je to, že většina jejich genů zůstává funkčně neznámá, a proto je jejich role obtížně hodnotitelná. Obrazovka fága SPN3US Salmonella enterica odhalila 13 esenciálních genů, i když zůstává poněkud nejasné, kolik genů bylo skutečně testováno.

Kvantitativní analýza esence genů

Základní geny jsou teoreticky kvalitativní. V závislosti na okolním prostředí však určité esenciální genové mutanty mohou vykazovat dílčí funkce, které lze v některých studiích kvantitativně určit. Například konkrétní delece genu může snížit rychlost růstu (nebo míru plodnosti nebo jiné znaky) na 90% divokého typu. Pokud existují izozymy nebo alternativní cesty pro esenciální geny, lze je zcela vymazat.

Syntetická letalita

Dva geny jsou syntetické smrtící, pokud ani jeden není nezbytný, ale když jsou oba mutovány, dvojitý mutant je smrtelný. Některé studie odhadují, že počet syntetických letálních genů může být řádově 45% všech genů.

Podmíněně esenciální geny

Schematický pohled na esenciální geny (nebo proteiny) v biosyntéze lysinu různých bakterií . Stejný protein může být nezbytný u jednoho druhu, ale u jiného ne.

Mnoho genů je nezbytných pouze za určitých okolností. Pokud je například aminokyselina lysin dodávána do buňky, žádný gen, který je nutný k výrobě lysinu, není nezbytný. Když však není dodáván žádný lysin, geny kódující enzymy pro biosyntézu lysinu se stávají nezbytnými, protože bez lysinu není možná žádná syntéza bílkovin.

Zdá se, že Streptococcus pneumoniae vyžaduje 147 genů pro růst a přežití ve slinách , více než 113–133, které byly nalezeny v předchozích studiích.

Vymazání genu může mít za následek smrt nebo blok buněčného dělení . Zatímco druhý případ může nějakou dobu znamenat „přežití“, bez dělení buňky může buňka nakonec stejně zemřít. Podobně místo blokovaného dělení buněk může mít buňka snížený růst nebo metabolismus v rozsahu od téměř nezjistitelného po téměř normální. Existuje tedy gradient od „esenciálního“ k zcela nepodstatnému, opět v závislosti na stavu. Někteří autoři tak rozlišovali mezi geny „ nezbytnými pro přežití “ a „ nezbytnými pro kondici “.

Role genetického pozadí . Podobně jako v podmínkách prostředí může genetické pozadí určovat podstatu genu: gen může být u jednoho jedince zásadní, ale u jiného ne, vzhledem k jeho genetickému pozadí. Jedním z možných vysvětlení jsou duplikace genů (viz níže).

Metabolická závislost . Geny zapojené do určitých biosyntetických drah, jako je syntéza aminokyselin , se mohou stát neesenciálními, pokud je jedna nebo více aminokyselin dodáváno kultivačním médiem nebo jiným organismem. To je hlavní důvod, proč mnoho parazitů (např. Cryptosporidium hominis ) nebo endosymbiontických bakterií ztratilo mnoho genů (např. Chlamydia ). Tyto geny mohou být nezbytné, ale jsou přítomny pouze v hostitelském organismu. Například, Chlamydia trachomatis nemohou syntetizovat purin a pyrimidin nukleotidů de novo , takže tyto bakterie jsou závislé na nukleotidových biosyntetické geny hostitele.

Jiný druh metabolické závislosti, který nesouvisí s mezidruhovými interakcemi, lze nalézt, když jsou bakterie pěstovány za specifických nutričních podmínek . Například více než 100 genů se stává nezbytnými, když se Escherichia coli pěstuje na živinách omezených médiích. Konkrétně isocitrát dehydrogenáza (icd) a citrát syntáza (gltA) jsou dva enzymy, které jsou součástí cyklu trikarboxylových kyselin (TCA) . Oba geny jsou nezbytné v minimálním médiu M9 (které poskytuje pouze nejzákladnější živiny). Když se však média doplňují 2-oxoglutarátem nebo glutamátem , tyto geny již nejsou podstatné.

Genové duplikace a alternativní metabolické cesty

Mnoho genů je duplikováno v genomu a mnoho organismů má různé metabolické cesty (alternativní metabolická cesta) k syntéze stejných produktů. Takové duplikace ( paralogy ) a alternativní metabolické cesty často činí esenciální geny nepodstatnými, protože duplikát může nahradit původní kopii. Například gen kódující enzym aspartokinázu je nezbytný v E. coli . Naproti tomu genom Bacillus subtilis obsahuje tři kopie tohoto genu, z nichž žádná sama o sobě není nezbytná. Trojnásobná delece všech tří genů je však smrtelná. V takových případech lze často predikovat esenciálnost genu nebo skupiny paralogů na základě esenciality esenciálního jediného genu v jiném druhu. V kvasinkách je v genomu duplikováno několik esenciálních genů: 8,5% neesenciálních genů, ale pouze 1% esenciálních genů má v genomu kvasinek homolog.

U červa C. elegans jsou neesenciální geny mezi duplikáty vysoce zastoupeny, pravděpodobně proto, že duplikace esenciálních genů způsobuje nadměrnou expresi těchto genů. Woods a kol. zjistili, že neesenciální geny jsou častěji úspěšně duplikovány (fixovány) a ztraceny ve srovnání s esenciálními geny. Naproti tomu esenciální geny jsou méně často duplikovány, ale po úspěšné duplikaci jsou udržovány po delší dobu.

Zachování

Zachování esenciálních genů v bakteriích , adaptováno z

U bakterií se zdá, že esenciální geny jsou konzervativnější než neesenciální geny, ale korelace není příliš silná. Například pouze 34% esenciálních genů B. subtilis má spolehlivé ortology ve všech Firmicutes a 61% esenciálních genů E. coli má spolehlivé ortology ve všech gama-proteobakteriích . Fang a kol. (2005) definovali perzistentní geny jako geny přítomné ve více než 85% genomů kladu. Našli 475 respektive 611 takových genů pro B. subtilis a E. coli . Kromě toho klasifikovali geny do pěti tříd podle perzistence a podstatnosti: perzistentní geny, esenciální geny, perzistentní neesenciální (PNE) geny (276 v B. subtilis , 409 v E. coli ), esenciální nepersistentní (ENP) geny (73 v B . subtilis , 33 v E. coli ), a nonperzistentní neesenciální (NPNE) geny (3558 u B. subtilis , 3525 v E. coli ). Fang a kol. nalezeno 257 perzistentních genů, které existují jak v B. subtilis (pro Firmicutes), tak v E. coli (pro gama-proteobakterie). Mezi nimi bylo 144 (respektive 139) dříve identifikováno jako zásadní u B. subtilis (respektive E. coli ) a 25 (respektive 18) z 257 genů není přítomných v 475 B. subtilis (respektive 611 E. coli) perzistentních geny. Všichni ostatní členové skupiny jsou geny PNE.

U eukaryot má 83% ortologů typu one-to-one mezi Schizosaccharomyces pombe a Saccharomyces cerevisiae zachovanou esenciálnost, to znamená, že jsou u obou druhů nepodstatné nebo u obou druhů esenciální. Zbývajících 17% genů je u jednoho druhu nepodstatných a u druhého nezbytných. To je docela pozoruhodné, vzhledem k tomu, že S. pombe je od S. cerevisiae odděleno přibližně 400 miliony let evoluce.

Obecně platí, že vysoce konzervované, a tedy starší geny (tj. Geny s dřívějším fylogenetickým původem) jsou pravděpodobnější než mladé geny - i když byly duplikovány.

Studie

Experimentální studie esenciálních genů je omezena skutečností, že podle definice je inaktivace esenciálního genu smrtelná pro organismus. Proto je nelze jednoduše vymazat ani zmutovat k analýze výsledných fenotypů (běžná technika v genetice ).

Existují však určité okolnosti, za kterých lze manipulovat se základními geny. V diploidních organismech může být zapotřebí pouze jedna funkční kopie některých esenciálních genů ( haplosuficience ), přičemž heterozygot vykazuje instruktivní fenotyp. Některé základní geny mohou tolerovat mutace, které jsou škodlivé, ale nejsou zcela smrtící, protože zcela nezruší funkci genu.

Výpočetní analýza může odhalit mnoho vlastností proteinů, aniž by je experimentálně analyzovala, např. Při pohledu na homologní proteiny , funkci, strukturu atd. (Viz také níže, Předpovídání esenciálních genů ). Produkty esenciálních genů lze také studovat, jsou -li exprimovány v jiných organismech , nebo jsou -li purifikovány a studovány in vitro .

Podmíněně esenciální geny se snadněji studují. Byly identifikovány teplotně citlivé varianty esenciálních genů, které kódují produkty, které při vysokých teplotách ztrácejí funkci, a proto vykazují fenotyp pouze při zvýšené teplotě.

Reprodukovatelnost

Pokud se testy na esenciální geny opakují v nezávislých laboratořích, často vyústí v různé seznamy genů. Například screeningy v E. coli poskytly ~ 300 až ~ 600 esenciálních genů (viz tabulka 1 ). Tyto rozdíly jsou ještě výraznější při použití různých bakteriálních kmenů (viz obrázek 2 ). Obvyklým vysvětlením je, že experimentální podmínky jsou různé nebo že povaha mutace může být odlišná (např. Úplná delece genu vs. transpozonový mutant). Obzvláště transpozonové obrazovky je obtížné reprodukovat, vzhledem k tomu, že transpozon se může vložit do mnoha poloh v rámci genu. Inzerce směrem ke 3 'konci esenciálního genu nemusí mít letální fenotyp (nebo žádný fenotyp vůbec), a proto nemusí být jako takové rozpoznány. To může vést k chybným anotacím (zde: falešné negativy).

Porovnání CRISPR / cas9 a RNAi obrazovky . Screeny k identifikaci esenciálních genů v buněčné linii K562 lidské chronické myelogenní leukémie vykazovaly pouze omezené překrývání. Při 10% falešně pozitivním výskytu bylo na obrazovce Cas9 identifikováno ~ 4 500 genů oproti ~ 3 100 na obrazovce shRNA , přičemž v obou bylo identifikováno pouze ~ 1 200 genů.

Různé esenciální geny v různých organismech

Různé organismy mohou mít různé esenciální geny. Například Bacillus subtilis má 271 esenciálních genů. Nezbytná je také asi polovina (150) ortologických genů v E. coli . Dalších 67 genů, které jsou v E. coli esenciální, není u B. subtilis esenciálních , zatímco 86 základních genů E. coli nemá ortolog B. subtilis . U Mycoplasma genitalium je nezbytných alespoň 18 genů, které nejsou u M. bovis podstatné . Mnoho z těchto různých esenciálních genů je způsobeno paralogy nebo alternativními metabolickými cestami.

Tyto různé esenciální geny v bakteriích lze použít k vývoji cílených antibakteriálních terapií proti určitým specifickým patogenům ke snížení odolnosti vůči antibiotikům v éře mikrobiomů. Stone et al (2015) použili rozdíl v základních genech v bakteriích k vývoji selektivních léků proti orálnímu patogenu Porphyromonas gingivalis , spíše než proti prospěšným bakteriím Streptococcus sanguis .

Předpověď

Esenciální geny lze předpovědět výpočetně. Většina metod však do určité míry využívá experimentální data („tréninkové sady“). Chen a kol. určil čtyři kritéria pro výběr tréninkových sad pro takové předpovědi: (1) základní geny ve vybraném tréninkovém souboru by měly být spolehlivé; (2) podmínky růstu, ve kterých jsou definovány základní geny, by měly být konzistentní v tréninkových a predikčních souborech; 3) druhy používané jako výcvikový soubor by měly úzce souviset s cílovým organismem; a (4) organismy používané jako tréninkové a predikční soubory by měly vykazovat podobné fenotypy nebo životní styl. Zjistili také, že velikost tréninkové sady by měla být alespoň 10% z celkových genů, aby se získaly přesné předpovědi. Některé přístupy k predikci základních genů jsou:

Srovnávací genomika . Krátce poté, co byly k dispozici první genomy ( Haemophilus influenzae a Mycoplasma genitalium ), Mushegian et al. pokusil se předpovědět počet esenciálních genů na základě společných genů u těchto dvou druhů. Předpokládalo se, že na dlouhou evoluční vzdálenost, která odděluje dvě bakterie, by měly být zachovány pouze esenciální geny. Tato studie identifikovala přibližně 250 kandidátních esenciálních genů. Jak bylo k dispozici více genomů, počet predikovaných esenciálních genů se stále zmenšoval, protože více genomů sdílelo stále méně genů. V důsledku toho byl učiněn závěr, že univerzální konzervované jádro se skládá z méně než 40 genů. Tento soubor konzervovaných genů však není totožný se souborem esenciálních genů, protože různé druhy spoléhají na různé esenciální geny.

Podobný přístup byl použit k odvození esenciální geny z pan-genomu z Brucella druhů. K předpovědi 1252 potenciálních esenciálních genů, odvozených z jádrového genomu, bylo porovnáno s prokaryotickou databází esenciálních genů použito 42 kompletních genomů Brucella a celkem 132 143 genů kódujících protein.

Analýza sítě . Poté, co byly publikovány první proteinové interakční sítě kvasinek , bylo zjištěno, že vysoce propojené proteiny (např. Interakcemi protein-protein ) jsou pravděpodobněji esenciální. Vysoce propojené proteiny však mohou být experimentálními artefakty a vysoká konektivita může místo esenciality spíše představovat pleiotropii . Síťové metody však byly vylepšeny přidáním dalších kritérií, a proto mají určitou hodnotu při předpovídání základních genů.

Strojové učení . Hua a kol. použil strojové učení k předpovědi základních genů u 25 bakteriálních druhů .

Hurstův index . Liu a kol. (2015) použil Hurstův exponent , charakteristický parametr k popisu korelace dlouhého dosahu v DNA k předpovědi základních genů. V 31 z 33 bakteriálních genomů byly hladiny významnosti Hurstových exponentů esenciálních genů významně vyšší než u odpovídajících kompletních genových sad, zatímco hladiny významnosti Hurstových exponentů neesenciálních genů zůstaly beze změny nebo se zvýšily jen mírně.

Minimální genomy . Předpokládalo se také, že esenciální geny lze odvodit z minimálních genomů, které údajně obsahují pouze esenciální geny. Problém je v tom, že nejmenší genomy patří parazitickým (nebo symbiontickým) druhům, které mohou přežít se sníženou sadou genů, protože od svých hostitelů získávají mnoho živin. Jedním z nejmenších genomů je například Hodgkinia cicadicola , symbiont cikád, obsahující pouze 144 Kb DNA kódující pouze 188 genů. Stejně jako ostatní symbionti, Hodgkinia přijímá mnoho svých živin od svého hostitele, takže její geny nemusí být zásadní.

Metabolické modelování . Esenciální geny lze také předpovídat v kompletně sekvenovaných genomech metabolickou rekonstrukcí , to znamená rekonstrukcí kompletního metabolismu z obsahu genu a poté identifikací těch genů a cest, u kterých bylo zjištěno, že jsou podstatné u jiných druhů. Tato metoda však může být ohrožena proteiny neznámé funkce. Mnoho organismů má navíc záložní nebo alternativní cesty, které je třeba vzít v úvahu (viz obrázek 1). Metabolické modelování použil také Basler (2015) k vývoji metody pro předpovídání esenciálních metabolických genů. Analýza rovnováhy toku , metoda metabolického modelování, byla nedávno použita k predikci esenciálních genů v metabolismu karcinomu z renálních buněk jasných buněk.

Geny neznámé funkce . Překvapivě značný počet esenciálních genů nemá žádnou známou funkci. Například mezi 385 esenciálními kandidáty v M. genitalium nemohla být žádná funkce připsána 95 genům, přestože tento počet byl do roku 2011 snížen na 75. Většina neznámých funkčně esenciálních genů má potenciální biologické funkce související s jednou ze tří základních funkce.

ZUPLS . Song a kol. představil novou metodu předpovědi základních genů, která používá pouze křivku Z a další funkce založené na sekvenci. Tyto vlastnosti lze snadno vypočítat ze sekvencí DNA/aminokyseliny. Spolehlivost této metody však zůstává poněkud nejasná.

Základní servery pro predikci genů . Guo a kol. (2015) vyvinuli tři online služby k předpovědi základních genů v bakteriálních genomech. Tyto volně dostupné nástroje jsou použitelné pro sekvence jednoho genu bez komentovaných funkcí, jednotlivé geny s určitými názvy a kompletní genomy bakteriálních kmenů. Kong a kol. (2019) vyvinuli databázi ePath , kterou lze použít k vyhledávání> 4 000 bakteriálních druhů pro predikci základních genů.

Esenciální proteinové domény

Ačkoli většina esenciálních genů kóduje proteiny, mnoho esenciálních proteinů se skládá z jediné domény. Tato skutečnost byla použita k identifikaci esenciálních proteinových domén. Goodacre a kol. identifikovali stovky základních domén neznámé funkce (eDUF). Lu a kol. představil podobný přístup a identifikoval 3450 domén, které jsou nezbytné u alespoň jednoho mikrobiálního druhu.

Viz také

Reference

Další čtení

externí odkazy