Aktualizace doplňování a anotací lidského genomu: Nomenklatura genů

Pro každý jednoznačně stanovený lidský gen je HGNC schválen název a symbol (zkratka). Každý symbol je jedinečný a každý gen bude mít pouze jeden schválený symbol genu . Je důležité poskytnout pro každý gen jedinečnou reprezentaci, aby kolegové mohli mezi sebou hovořit o každé konkrétní genové sekvenci nebo rodině. Existence jednoho jedinečného symbolu také usnadňuje elektronické vyhledávání dat z publikací a databází. Dále je důležité, aby každý symbol pokud možno zachovával paralelní konstrukci například v různých členech genové rodiny.

Na HGNC je třeba se co nejrychleji obrátit s novými členy genových rodin, protože některé symboly mohou být v jejich databázi rezervovány. Získání symbolu genu před zveřejněním zabrání případným konfliktům s existujícími symboly a zajistí, že gen bude neprodleně zaznamenán v databázích LocusLink (http://www.ncbi.nlm.nih.gov/LocusLink/) a Genew (http://www.gene.ucl.ac.uk/cgi-bin/nomenclature/searchgenes.pl).

K září 2003 je schváleno 16 765 symbolů lidských genů – to znamená, že cíl pojmenovat všechny geny v lidském genomu je splněn někde mezi jednou třetinou a možná více než jednou polovinou. Jednotlivé nové symboly požadují nejen vědci, ale také stále více časopisů (např. časopisy American Journal of Human Genetics; Animal Genetics; Annals of Human Genetics; Cytogenetic & Genomic Research; Genes, Chromosomes & Cancer; Genomics; Human Mutation; Lancet; Molecular Therapy; Nature Genetics; Radiation Research). K publikaci článku v některém z těchto časopisů dojde až po oficiálním pojmenování zkoumaného genu. Tím je také zajištěno, že všechny nově zveřejněné symboly jsou okamžitě křížově indexovány s dalšími databázemi (např. LocusLink, Ref Seq, OMIM a MGD), což zvyšuje potenciální dostupnost a dopad těchto genů v databázích.

Bylo navrženo, že proces nomenklatury by mohl být automatizován, a nedávné publikace jistě naznačují, že to může být reálná možnost. Zatímco automatizované přiřazování názvů a symbolů genů může dobře poskytnout vysoce systematické klasifikace, ne vždy to však umožňuje zahrnout nejužitečnější, nebo dokonce zapamatovatelné informace.

Příklady vyhledávání nebo předkládání symbolu genu

Tabulka 1 shrnuje kroky, které je třeba učinit k zajištění správné nomenklatury jakéhokoli genu. Zde budou uvedeny tři příklady, které dále ilustrují, jak a proč je třeba usilovat o standardizovaný systém nomenklatury genů. V těchto příkladech je kladen důraz na použití názvů genů jako vyhledávacích termínů, nikoli na porovnávání právě určené sekvence DNA nebo proteinu, a to vyhledáváním pomocí BLAST (http://www.ncbi.nlm.nih.gov/BLAST/). Tři níže uvedené příklady zahrnují geny kódující enzymy; budoucí aktualizace se zaměří na nomenklaturu jiných typů genových produktů a motivů DNA.

Tabulka 1 Kontrolní seznam Výboru pro nomenklaturu genů HUGO (HGNC) pro rozhodování o novém symbolu lidského genu

Cyklooxygenáza

Postup při psaní přehledu o prostaglandin G/H syntáze-1 a -2, známé také jako cyklooxygenáza-1 a -2, v mnoha časopisech běžně přezdívané „COX-1“ a „COX-2“, je uveden níže. Tyto enzymy, které jsou cílem nesteroidních protizánětlivých léčiv, hrají klíčovou roli při přeměně kyseliny arachidonové na prostaglandiny G a H, které jsou spojeny se zánětlivými procesy, bolestí, revmatoidním onemocněním, aterosklerózou, mrtvicí, poškozením a opravou gastrointestinálního traktu, oxidačním stresem a různými druhy rakoviny. Aby bylo možné určit správný schválený symbol, je třeba nejprve vyhledat na serveru LocusLink (pro všechny organismy) úplné názvy „prostaglandin g synthase“ nebo „prostaglandin h synthase“. Tím se vyhledá deset, resp. 12 lokusů, z nichž čtyři v obou případech obsahují schválené symboly pro člověka, PTGS1 a PTGS2, a myší a potkaní Ptgs2. Vyhledávání na LocusLink pomocí „cyclooxygenase“ získá opět 49 shod – řazených abecedně – z nichž čtyři zahrnují záznamy lidských genů PTGS1 a PTGS2 a myšího a potkaního genu Ptgs2. Při vyhledávání na LocusLink pro „cox1“ se najdou tři lokusy, které zahrnují lidský PTGS1, krysí Ptgs1 a krysí mitochondriální Mt-Co1. Při vyhledávání na LocusLink pro „cox2“ je nalezeno sedm shod, z nichž tři jsou lidské PTGS2 a myší a potkaní Ptgs2; registrován je také potkaní mitochondriální Mt-Co2.

Vyhledávání na Genew s použitím „prostaglandin g synthase“ nebo „prostaglandin h synthase“ jako plných názvů však nevyhledá žádné záznamy genů. Vyhledáním Genew pomocí ‚cyclooxy-genase‘ lze potvrdit, že symboly lidských genů jsou PTGS1 a PTGS2, jejich schválené názvy jsou prostaglandin-endoperoxid syntáza 1 (prostaglandin G/H syntáza a cyklooxygenáza) (M59979; NM_000962) a prostaglandin-endoperoxid syntáza 2 (prostaglandin G/H syntáza a cyklooxygenáza) (D28235; NM_000963), které se nacházejí na lidských chromozomech 9q32-q33.3 a 1q25.2-q25.3; aliasy pro PTGS1 zahrnují COX1, PGHS-1 a PTGHS a pro PTGS2 zahrnují pouze COX2. Je vidět, že existuje určitý zmatek v používání dalších aliasů, jako je COX, protože při vyhledávání všech záznamů začínajících na COX v databázi Genew se vyhledá 46 záznamů, z nichž většina se týká genů pro podjednotku cytochrom c oxidázy. Proto by použití „COX“ pro označení enzymů cyklooxygenázy-1 a -2, které někdo studuje, nebylo pro komunitu užitečné, protože by to do literatury vneslo jen další zmatek.

Syntázy mastných kyselin

Syntáza mastných kyselin, jeden z hlavních lipogenních enzymů, přeměňuje kalorie z potravy na zásobní formu energie . Samotné mastné kyseliny mohou také působit jako signály, které regulují genovou expresi, a syntetáza mastných kyselin je downregulována polynenasycenými mastnými kyselinami . Představme si, že jste izolovali cDNA pro lidskou jaterní syntázu mastných kyselin a uvažujete o pojmenování svého genu FAS . Při vyhledávání na LocusLink pomocí „fatty acid synthase“ je nalezeno 58 lokusů – včetně lidského FASN, myšího a potkaního Fasn a Fas ovocné mušky. Při vyhledávání na LocusLink pomocí symbolu „fas“ je nalezeno 149 výsledků, mezi nimiž je lidská FASN a myší Fasn. FASN se nachází na chromozomu 17q25 a má přístupové číslo GenBank NM_004104; váš gen tedy již má tento schválený symbol. Možná se však domníváte, že vaše původní volba FAS je vhodnější; v takovém případě byste se měli obrátit na HGNC a vyargumentovat, proč se domníváte, že „FAS“ je pro tento gen lepší symbol než FASN.

Předpokládejme tedy, že jste charakterizovali geny kódující novou cytosolickou syntázu mastných kyselin s krátkým řetězcem a novou cytosolickou syntázu mastných kyselin s dlouhým řetězcem. Při vyhledávání na LocusLink s použitím plných názvů najdete pět lokusů pro syntetázu mastných kyselin s krátkým řetězcem, které zahrnují myší a potkaní Fasn, a 12 lokusů pro syntetázu mastných kyselin s dlouhým řetězcem, které zahrnují lidský FASN a tři geny „fatty acid-coenzyme A ligases, long-chain“ (FACL1, FACL3 a FACL4) představující malou rodinu. Při vyhledávání na LocusLink pomocí symbolů „fascs“, „falcs“, „facs“, „fass“, „fasc“ nebo „falc“ naleznete nulové shody, kromě „facs“, který vám poskytne lidský FACL2 a myší a potkaní Facl2. Při vyhledávání v databázi Genew s použitím plných názvů nenajdete žádné shody, které by se vztahovaly k některému z těchto enzymů. Vyhledávání v databázi Genew pomocí symbolů „fascs“, „falcs“, „facs“, „fass“, „fasc“ nebo „falc“ rovněž vygeneruje nulové shody. Váš závěr by byl, že existuje kořenový symbol pro nejméně čtyři lidské geny pro dlouhé řetězce mastných kyselin a koenzymu A (členové evolučně příbuzné rodiny), ale nic pro vaši syntázu mastných kyselin s krátkým řetězcem.

Dalším krokem by bylo kontaktovat HGNC, abyste se ujistili, že nic nebylo „rezervováno“, pokud jde o popis této rodiny genů. Jakmile to bude zjištěno, lze vám doporučit, abyste se spojili s několika významnými hráči v oblasti mastných kyselin s krátkým řetězcem a dalšími v oblasti mastných kyselin s dlouhým řetězcem a pokusili se dospět ke konsenzuální dohodě (za účasti HGNC) o kořenech symbolů pro pojmenování genu nebo genů v rodině syntázy mastných kyselin s krátkým řetězcem. Protože FACL je kořenový symbol pro synthasu dlouhých řetězců mastných kyselin (nebo ligasu), „FACS“ by patřil mezi nejrozumnější a nejkonzistentnější kořeny pro váš gen pro synthasu krátkých řetězců mastných kyselin. V LocusLink je také lidský ECHS1, gen pro „mitochondriální enoyl-koenzym A hydratázu, krátký řetězec“, o kterém musíte potvrdit, že není novým genem, který jste identifikovali. FACS1 tedy zůstává nejrozumnějším navrhovaným názvem – zejména pokud ostatní kolegové v oboru souhlasí s vaším návrhem.

NADPH-cytochrom P450 reduktáza

Tento enzym přenáší první elektron z NADPH na různé monooxygenázy cytochromu P450 (CYP) . Ale co když má být na toto téma napsán přehled? Při vyhledávání na serveru LocusLink s použitím plného názvu „nadph cytochrome p450 oxidoreductase“ (nebo „reductase“ bez „oxido“) je k dispozici devět, resp. jedenáct shod, včetně lidského POR, myšího Por a Cpr ovocné mušky. Včetně spojovníku (nadph-cytochrome p450 oxidoreductase) se objeví pouze dva – lidský POR a Cpr ovocné mušky. vyhledávání na LocusLink s použitím staršího názvu „nadph cytochrome c oxidoreductase“ (nebo „reductase“) kupodivu vede pouze k NADPH oxidase plus lidskému (TP53) a myšímu (Trp53) nádorovému proteinu-53. Při vyhledávání pomocí termínu „p450 oxido-reductase“ lze nalézt lidský POR a myší a potkaní Por, ale také více než 90 nálezů pro geny CYP. Při vyhledávání na LocusLink s výrazem „por“ lze nalézt čtyři shody – lidský POR, myší a potkaní Por a Por dikobraza ovocného. Symbol lidského POR je v LocusLink označen jako „Official Gene Symbol and Name (HGNC)“.

Vyhledávání v databázi Genew pomocí plných názvů: „nadph cytochrome p450 oxidoreductase“ (nebo „reductase“), „nadph cytochrome c oxidoreductase“ (nebo „reductase“), „p450 oxidoreductase“ (nebo „reductase“), „cytochrome c oxidoreductase“ (nebo „reductase“), nebo „p450 (cytochrom) oxidoreduktáza“ (nebo „reduktáza“) však nevyhledá žádná data, ačkoli při vyhledávání v databázi Genew pomocí příkazu „por“ lze nalézt „shodu“ pro gen s názvem „P450 (cytochrom) oxidoreduktáza“, který se nachází na lidském chromozomu 7q11.2 s aliasem „CYPOR“. To ukazuje, že v programu Genew chybí některé relevantní aliasy, protože dotaz na celý název ‚P450 (cytochrom) oxidoreduktáza‘ nevede k POR jako názvu genu, zatímco symbol ‚por‘ vede k celému názvu. Naproti tomu zahájení vyhledávání pomocí LocusLink vás pošle přímo na lidské geny POR a Por hlodavců. Tato drobná závada v systému Genew by měla být co nejdříve nahlášena HGNC.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.