Update over voltooiing van humaan genoom en annotaties: Gennomenclatuur

Voor elk ondubbelzinnig vastgesteld menselijk gen worden een naam en een symbool (verkorte vorm van afkorting) goedgekeurd door het HGNC. Elk symbool is uniek, en elk gen zal slechts één goedgekeurd gen-symbool hebben. Het is belangrijk om voor elk gen een unieke voorstelling te geven, zodat collega’s met elkaar kunnen praten over een bepaalde gensequentie of familie. Het hebben van één uniek symbool vergemakkelijkt ook het elektronisch terugvinden van gegevens uit publicaties en databanken. Verder is het belangrijk dat elk symbool bij voorkeur een parallelle opbouw behoudt in bijvoorbeeld verschillende leden van een genfamilie.

Met nieuwe leden van genfamilies moet zo snel mogelijk contact worden opgenomen met het HGNC, omdat sommige symbolen in hun database gereserveerd kunnen zijn. Het verkrijgen van een gensymbool vóór publicatie vermijdt mogelijke conflicten met bestaande symbolen en zorgt ervoor dat het gen onmiddellijk wordt opgenomen in de databases LocusLink (http://www.ncbi.nlm.nih.gov/LocusLink/) en Genew (http://www.gene.ucl.ac.uk/cgi-bin/nomenclature/searchgenes.pl).

Tegen september 2003 zijn er 16.765 goedgekeurde menselijke gensymbolen — wat betekent dat het doel om alle genen in het menselijk genoom een naam te geven, ergens tussen een derde en misschien meer dan de helft voltooid is. Afzonderlijke nieuwe symbolen worden niet alleen door wetenschappers aangevraagd, maar ook door een toenemend aantal tijdschriften (bv. American Journal of Human Genetics; Animal Genetics; Annals of Human Genetics; Cytogenetic & Genomic Research; Genes, Chromosomes & Cancer; Genomics; Human Mutation; Lancet; Molecular Therapy; Nature Genetics; Radiation Research). Publicatie van een artikel in een van deze tijdschriften gaat pas door als het bestudeerde gen officieel is benoemd. Dit zorgt er ook voor dat alle nieuw vrijgegeven symbolen onmiddellijk worden gekruist met andere databanken (b.v. LocusLink, Ref Seq, OMIM en MGD), wat de potentiële toegankelijkheid en impact van deze genen in de databanken vergroot.

Er is gesuggereerd dat het nomenclatuurproces zou kunnen worden geautomatiseerd, en recente publicaties wijzen er zeker op dat dit een haalbare mogelijkheid is. Geautomatiseerde toekenning van gennamen en symbolen kan weliswaar zeer systematische classificaties opleveren, maar dit staat niet altijd toe dat de nuttigste, of zelfs memorabele, informatie wordt opgenomen.

Voorbeelden van het zoeken naar, of indienen van, een gensymbool

Tabel 1 geeft een overzicht van de stappen die moeten worden ondernomen om een juiste nomenclatuur van een gen te verzekeren. Drie voorbeelden zullen hier worden gegeven om verder te illustreren hoe en waarom men zou moeten streven naar een gestandaardiseerd genennomenclatuursysteem. In deze voorbeelden ligt de nadruk op het gebruik van de gennamen als zoektermen, eerder dan op het vergelijken van een DNA- of eiwitsequentie die net is bepaald, door te zoeken via BLAST (http://www.ncbi.nlm.nih.gov/BLAST/). De drie onderstaande voorbeelden betreffen genen die coderen voor enzymen; toekomstige updates zullen zich richten op de nomenclatuur van andere typen genproducten en DNA-motieven.

Tabel 1 De checklist van het HGNC (HUGO Gene Nomenclature Committee) voor het bepalen van een nieuw menselijk gensymbool

Cyclooxygenase

De procedure voor het schrijven van een review over prostaglandine G/H synthase-1 en -2, ook bekend als cyclooxygenase-1 en -2, in veel tijdschriften gewoonlijk bijgenaamd “COX-1” en “COX-2”, wordt hieronder uiteengezet. Deze enzymen, die doelwitten zijn van niet-steroïdale ontstekingsremmende geneesmiddelen, spelen een sleutelrol bij de omzetting van arachidonzuur in prosta-glandines G en H, routes die in verband worden gebracht met ontstekingsprocessen, pijn, reumatoïde ziekte, atherosclerose, beroerte, letsel aan en herstel van het maagdarmkanaal, oxidatieve stress en diverse vormen van kanker . Om het juiste goedgekeurde symbool te bepalen, bestaat de eerste benadering erin op LocusLink (voor alle organismen) te zoeken met “prostaglandin g synthase” of “prostaglandin h synthase” als volledige naam. Dit levert respectievelijk tien en twaalf loci op, waarvan er in beide gevallen vier de goedgekeurde symbolen voor de mens, PTGS1 en PTGS2, en de muis en rat Ptgs2 bevatten. Zoeken op LocusLink met ‘cyclooxygenase’ levert 49 treffers op – alfabetisch gerangschikt – waarvan er vier de menselijke PTGS1- en PTGS2-genrecords en de muis- en rat-Ptgs2-genrecords bevatten. Zoeken op LocusLink naar ‘cox1’ levert drie loci op, waaronder het menselijke PTGS1, het rat Ptgs1 en het rat mitochondriale Mt-Co1. Zoeken op LocusLink naar ‘cox2’ levert zeven treffers op, waarvan drie menselijke PTGS2 en muizen- en ratten-Ptgs2; ook ratten-mitochondriaal Mt-Co2 is geregistreerd.

Zoeken in Genew met ‘prostaglandin g synthase’ of ‘prostaglandin h synthase’ als volledige naam levert echter geen genrecords op. Als Genew wordt doorzocht met “cyclooxy-genase”, kan worden bevestigd dat de menselijke gensymbolen PTGS1 en PTGS2 zijn, hun goedgekeurde namen zijn prostaglandine-endoperoxide synthase 1 (prostaglandine G/H synthase en cyclooxygenase) (M59979; NM_000962) en prostaglandine-endoperoxide synthase 2 (prostaglandine G/H synthase en cyclooxygenase) (D28235; NM_000963), gelegen op de menselijke chromosomen 9q32-q33.3 en 1q25.2-q25.3, respectievelijk; aliassen voor PTGS1 zijn COX1, PGHS-1 en PTGHS en voor PTGS2 alleen COX2. Er is enige verwarring over het gebruik van andere aliassen zoals COX, omdat zoeken in Genew naar alle records die met COX beginnen 46 records oplevert, waarvan de meeste verwijzen naar de cytochroom c oxidase subunit genen. Het gebruik van “COX” voor de cyclooxygenase-1 en -2 enzymen die men bestudeert, zou dus niet nuttig zijn voor de gemeenschap, omdat dit alleen maar meer verwarring in de literatuur zou brengen.

Vetzurensynthasen

Vetzurensynthase, een van de voornaamste lipogene enzymen, zet calorieën uit de voeding om in een opslagvorm van energie . Vetzuren zelf kunnen ook fungeren als signalen die genexpressie reguleren, en vetzuursynthase wordt gedownreguleerd door meervoudig onverzadigde vetzuren . Laten we ons eens voorstellen dat u het cDNA voor menselijke levervetzuursynthase hebt geïsoleerd en overweegt uw gen FAS te noemen. Als je LocusLink doorzoekt met ‘fatty acid synthase’, worden 58 loci gevonden — waaronder menselijk FASN, muis en rat Fasn, en fruitvlieg Fas. Zoeken op LocusLink met het symbool ‘fas’ levert 149 hits op, waaronder menselijk FASN en muis Fasn. FASN bevindt zich op chromosoom 17q25 en heeft een GenBank toetredingsnummer van NM_004104; uw gen heeft dus al dit goedgekeurde symbool. U kunt echter van mening zijn dat uw oorspronkelijke keuze van FAS meer geschikt is, in welk geval u contact moet opnemen met het HGNC en moet beargumenteren waarom u van mening bent dat ‘FAS’ een beter symbool voor dit gen is dan FASN.

Laten we dan veronderstellen dat u genen hebt gekarakteriseerd die coderen voor een nieuw cytosolisch korte-keten vetzuursynthase en een nieuw cytosolisch lange-keten vetzuursynthase. Als u LocusLink doorzoekt met gebruikmaking van de volledige namen, vindt u vijf loci voor kortketenvetzuursynthase, waaronder Fasn in muizen en ratten, en twaalf loci voor langketenvetzuursynthase, waaronder FASN in mensen en drie ‘vetzuur-co-enzym A ligasen, lange keten’ genen (FACL1, FACL3 en FACL4) die een kleine familie vormen. Zoeken op LocusLink met de symbolen ‘fascs’, ‘falcs’, ‘facs’, ‘fass’, ‘fasc’ of ‘falc’ levert nul hits op, behalve voor ‘facs’, dat humaan FACL2 en muis en rat Facl2 oplevert. Zoeken in Genew met gebruikmaking van de volledige namen levert nul treffers op die naar een van deze enzymen verwijzen. Zoeken in Genew met het symbool ‘fascs’, ‘falcs’, ‘facs’, ‘fass’, ‘fasc’ of ‘falc’ levert ook nul hits op. Uw conclusie zou zijn dat er een wortelsymbool is voor ten minste vier menselijke vetzuur-co-enzym A lange-keten genen (leden van een evolutionair verwante familie), maar niets voor uw korte-keten vetzuur synthase.

De volgende stap zou zijn om contact op te nemen met het HGNC om er zeker van te zijn dat er niets is ‘gereserveerd’, betreffende de beschrijving van deze gen familie. Zodra dit is vastgesteld, kunt u worden aangemoedigd om contact op te nemen met verschillende belangrijke spelers op het gebied van korte-keten vetzuren, en anderen op het gebied van lange-keten vetzuren, en proberen om tot een consensus te komen (met betrokkenheid van HGNC) over symboolstammen voor de naamgeving van het gen of de genen in de korte-keten vetzuursynthase familie. Omdat FACL het wortelsymbool is voor vetzuur lange-keten synthase (of ligase), zou ‘FACS’ een van de meest redelijke en consistente wortels zijn voor uw vetzuur korte-keten synthase-gen. In LocusLink is er ook menselijke ECHS1, het gen voor een ‘mitochondriaal enoyl-coenzym A hydratase, korte-keten’, waarvan u moet bevestigen dat het niet het nieuwe gen is dat u hebt geïdentificeerd. FACS1 blijft dus de meest redelijke voorgestelde naam — vooral als andere collega’s in het veld het eens zijn met uw suggestie.

NADPH-cytochrome P450 reductase

Dit enzym brengt het eerste elektron van NADPH over naar de verschillende cytochrome P450 (CYP) mono-oxygenasen . Maar wat als er een review over dit onderwerp moet worden geschreven? Zoeken op LocusLink met de volledige naam, ‘nadph cytochrome p450 oxidoreductase’ (of ‘reductase’ zonder ‘oxido’), levert respectievelijk negen en 11 hits op, waaronder menselijke POR, muis Por en fruitvlieg Cpr. Met een koppelteken erbij (nadph-cytochrome p450 oxidoreductase) levert dit slechts twee hits op: menselijke POR en fruitvlieg Cpr. Zoeken op LocusLink met de oudere naam ‘nadph cytochrome c oxidoreductase’ (of ‘reductase’) levert merkwaardigerwijs alleen een NADPH-oxidase op, plus de menselijke (TP53) en muis (Trp53) tumor proteïne-53. Zoeken met de term “p450 oxido-reductase” levert menselijke POR en muizen- en ratten-Por op, maar ook meer dan 90 treffers voor de CYP-genen. Zoeken op LocusLink met ‘por’ levert vier treffers op — menselijke POR, muizen- en rattenpor, en fruitvlieg porcupine por. Het menselijke POR-symbool wordt in LocusLink aangeduid als het ‘Official Gene Symbol and Name (HGNC)’.

Gezocht in Genew met de volledige namen, ‘nadph cytochrome p450 oxidoreductase’ (of ‘reductase’), ‘nadph cytochrome c oxidoreductase’ (of ‘reductase’), ‘p450 oxidoreductase’ (of ‘reductase’), ‘cytochrome c oxidoreductase’ (of ‘reductase’), of “p450 (cytochroom) oxidoreductase” (of “reductase”) levert echter geen gegevens op, hoewel zoeken in Genew met “por” een “hit” oplevert voor het gen met de naam “P450 (cytochroom) oxidoredductase”, gelegen op humaan chromosoom 7q11.2 met een alias van “CYPOR”. Dit toont aan dat Genew enkele relevante aliassen mist, omdat de volledige-naam query ‘P450 (cytochrome) oxidoreductase’ u niet leidt naar POR als gennaam, terwijl het ‘por’ symbool u wel leidt naar de volledige naam. Als u daarentegen uw zoekactie start met LocusLink, komt u rechtstreeks bij de menselijke POR- en knaagdier-POR-genen terecht. Deze kleine hapering in Genew moet zo snel mogelijk aan het HGNC worden gemeld.

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.