Ajourføring om færdiggørelse og annotationer af det menneskelige genom: Gen-nomenklatur

For hvert entydigt fastslået humant gen er der af HGNC godkendt et navn og et symbol (forkortelse i kort form). Hvert symbol er unikt, og hvert gen vil kun have ét godkendt gen-symbol . Det er vigtigt at give en unik repræsentation for hvert gen, så kolleger kan tale med hinanden om en bestemt gensekvens eller -familie. Et unikt symbol gør det også lettere at finde elektroniske data fra publikationer og databaser. Endvidere er det vigtigt, at hvert symbol helst opretholder en parallel konstruktion i f.eks. forskellige medlemmer af en genfamilie.

HGNC bør kontaktes hurtigst muligt med nye medlemmer af genfamilier, da nogle symboler kan være reserveret i deres database. Ved at få et gensymbol inden offentliggørelse undgås eventuelle konflikter med eksisterende symboler, og det sikres, at genet straks registreres i LocusLink (http://www.ncbi.nlm.nih.gov/LocusLink/) og Genew (http://www.gene.ucl.ac.uk/cgi-bin/nomenclature/searchgenes.pl) databaserne.

I september 2003 er der 16.765 godkendte menneskelige gensymboler – hvilket betyder, at målet om at navngive alle gener i det menneskelige genom er et sted mellem en tredjedel og måske mere end halvdelen gennemført. De enkelte nye symboler efterspørges ikke kun af forskere, men også af et stigende antal tidsskrifter (f.eks. American Journal of Human Genetics; Animal Genetics; Annals of Human Genetics; Cytogenetic & Genomic Research; Genes, Chromosomes & Cancer; Genomics; Human Mutation; Lancet; Molecular Therapy; Nature Genetics; Radiation Research). Offentliggørelse af en artikel i et af disse tidsskrifter vil ikke finde sted, før det gen, der undersøges, er blevet officielt navngivet. Dette sikrer også, at alle nyligt frigivne symboler straks krydsindekseres med andre databaser (f.eks. LocusLink, Ref Seq, OMIM og MGD), hvilket øger den potentielle tilgængelighed og virkning af disse gener i databaserne.

Det er blevet foreslået, at nomenklaturprocessen kunne automatiseres, og nylige publikationer tyder bestemt på, at dette kan være en farbar mulighed. Automatiseret tildeling af gennavne og -symboler kan ganske vist give meget systematiske klassifikationer, men det giver ikke altid mulighed for at medtage de mest nyttige eller endog mindeværdige oplysninger.

Eksempler på søgning efter eller indsendelse af et gen-symbol

Tabel 1 opsummerer de skridt, man opfordres til at tage for at sikre korrekt nomenklatur af et gen. Der vil her blive givet tre eksempler for yderligere at illustrere, hvordan og hvorfor man bør stræbe efter et standardiseret gennomenklatursystem. I disse eksempler er der fokus på at bruge gennavnene som søgetermer og ikke på at sammenligne en DNA- eller proteinsekvens, der netop er blevet bestemt, ved at søge via BLAST (http://www.ncbi.nlm.nih.gov/BLAST/). De tre eksempler nedenfor omfatter gener, der koder for enzymer; fremtidige opdateringer vil fokusere på nomenklaturen for andre typer genprodukter og DNA-motiver.

Tabel 1 HUGO Gene Nomenclature Committee (HGNC)’s tjekliste til afgørelse af et nyt humant gensymbol

Cyclooxygenase

Der er nedenfor beskrevet proceduren for at skrive et review om prostaglandin G/H-syntase-1 og -2, også kendt som cyclooxygenase-1 og -2, der i mange tidsskrifter almindeligvis har fået tilnavnet “COX-1” og “COX-2”. Disse enzymer, som er mål for ikke-steroide antiinflammatoriske lægemidler, er afgørende for omdannelsen af arachidonsyre til prosta-glandinerne G og H, som er forbundet med inflammatoriske processer, smerter, reumatoid sygdom, aterosklerose, slagtilfælde, skader og reparation af mave-tarmkanalen, oxidativ stress og forskellige kræftformer . For at finde frem til det korrekte godkendte symbol er den første metode at søge i LocusLink (for alle organismer) ved at bruge “prostaglandin g synthase” eller “prostaglandin h synthase” som fulde navne. Dette vil finde henholdsvis 10 og 12 loci, hvoraf fire i begge tilfælde indeholder de godkendte symboler for mennesker, PTGS1 og PTGS2, og for mus og rotte Ptgs2. Søgning på LocusLink med “cyclooxygenase” giver igen 49 hits — alfabetisk opstillet — hvoraf fire omfatter de humane PTGS1- og PTGS2-genoptegnelser og Ptgs2-genoptegnelserne for mus og rotte. Ved at søge på LocusLink efter “cox1” finder man tre loci, som omfatter det menneskelige PTGS1, rotte Ptgs1 og det mitokondrielle Mt-Co1 fra rotter. Ved at søge i LocusLink efter ‘cox2’ finder man syv hits, hvoraf tre er human PTGS2 og mus og rotte Ptgs2; rotte mitokondrie Mt-Co2 er også registreret.

Søgning i Genew med ‘prostaglandin g synthase’ eller ‘prostaglandin h synthase’ som fulde navne giver imidlertid ingen genoptegnelser. Ved at søge i Genew med “cyclooxy-genase” kan man bekræfte, at de menneskelige gen-symboler er PTGS1 og PTGS2, deres godkendte navne er prostaglandin-endoperoxid-syntase 1 (prostaglandin G/H-syntase og cyclooxygenase) (M59979; NM_000962) og prostaglandin-endoperoxid-syntase 2 (prostaglandin G/H-syntase og cyclooxygenase) (D28235; NM_000963), placeret på de menneskelige kromosomer 9q32-q33.3 og 1q25.2-q25.3; aliaser for PTGS1 omfatter COX1, PGHS-1 og PTGHS, og for PTGS2 omfatter kun COX2. Det kan ses, at der er en vis forvirring omkring brugen af andre aliasser som f.eks. COX, fordi søgning i Genew efter alle poster, der begynder med COX, giver 46 poster, hvoraf de fleste henviser til generne for cytochrom c oxidase-subunit. Det ville således ikke være nyttigt for samfundet at bruge “COX” til at henvise til de cyclooxygenase-1- og -2-enzymer, som man studerer, da det kun ville skabe yderligere forvirring i litteraturen.

Fedtsyresyntaser

Fedtsyresyntase, et af de vigtigste lipogene enzymer, omdanner kalorier fra kosten til en lagringsform af energi . Fedtsyrer i sig selv kan også virke som signaler, der regulerer genekspressionen, og fedtsyresyntase nedreguleres af flerumættede fedtsyrer . Lad os forestille os, at du har isoleret cDNA’et for fedtsyresyntase fra den menneskelige lever og overvejer at navngive dit gen FAS. Ved at søge i LocusLink ved hjælp af “faty acid synthase” findes 58 loci, herunder menneskelig FASN, mus og rotte Fasn og frugtflue Fas. Søgning i LocusLink ved hjælp af symbolet “fas” giver 149 hits, herunder human FASN og mus Fasn. FASN er placeret på kromosom 17q25 og har et GenBank-adgangsnummer NM_004104; derfor har dit gen allerede dette godkendte symbol. Det kan dog være, at De mener, at Deres oprindelige valg af FAS er mere passende, og i så fald bør De kontakte HGNC og argumentere for, hvorfor De mener, at “FAS” er et bedre symbol for dette gen end FASN.

Lad os så antage, at De har karakteriseret gener, der koder for en ny cytosolisk kortkædet fedtsyresyntase og en ny cytosolisk langkædet fedtsyresyntase. Ved at søge i LocusLink ved hjælp af de fulde navne finder du fem loci for kortkædet fedtsyresyntase, som omfatter Fasn fra mus og rotte, og 12 loci for langkædet fedtsyresyntase, som omfatter humant FASN og tre “fedtsyre-coenzym A-ligaser, langkædet” gener (FACL1, FACL3 og FACL4), der repræsenterer en lille familie. Ved at søge i LocusLink med symbolerne “fascs”, “falcs”, “facs”, “fass”, “fasc” eller “falc” finder man nul hits, bortset fra “facs”, som giver menneskelig FACL2 og Facl2 fra mus og rotte. Ved at søge i Genew ved hjælp af de fulde navne finder man nul hits, der henviser til nogen af disse enzymer. Søgning i Genew ved hjælp af symbolet “fascs”, “falcs”, “facs”, “fass”, “fasc” eller “falc” giver også nul hits. Din konklusion ville være, at der findes et rodsymbol for mindst fire menneskelige fedtsyre-coenzym A gener med lang kæde (medlemmer af en evolutionært beslægtet familie), men intet for din kortkædede fedtsyresyntase.

Det næste skridt ville være at kontakte HGNC for at sikre sig, at intet er blevet “reserveret”, hvad angår beskrivelsen af denne genfamilie. Når dette er blevet fastslået, kan du blive opfordret til at tage kontakt med flere vigtige aktører inden for kortkædede fedtsyrer og andre inden for langkædede fedtsyrer og forsøge at nå til enighed (med HGNC’s inddragelse) om symbolrødder til navngivning af genet eller generne i den kortkædede fedtsyresyntasefamilie. Da FACL er rodsymbolet for fedtsyre-langkædesyntase (eller ligase), ville “FACS” være blandt de mest fornuftige og konsekvente rødder for dit gen for kortkædet fedtsyresyntase. I LocusLink findes der også humane ECHS1, genet for en “mitokondriel enoyl-coenzym A hydratase, kortkædet”, som du skal bekræfte, at det ikke er det nye gen, du har identificeret. FACS1 er således fortsat det mest rimelige foreslåede navn — især hvis andre kolleger på området er enige i dit forslag.

NADPH-cytochrom P450 reduktase

Dette enzym overfører den første elektron fra NADPH til de forskellige cytochrom P450 (CYP) monooxygenaser . Men hvad nu, hvis der skal skrives en anmeldelse om dette emne? Ved at søge i LocusLink med det fulde navn, “nadph cytochrome p450 oxidoreductase” (eller “reductase” uden “oxido”), er der henholdsvis ni og 11 hits, herunder human POR, mouse Por og fruit fly Cpr. Med en bindestreg (nadph-cytochrome p450 oxidoreductase) fås kun to – human POR og frugtflue Cpr. Søgning på LocusLink med det ældre navn “nadph cytochrome c oxidoreductase” (eller “reductase”) giver mærkeligt nok kun en NADPH-oxidase plus det humane (TP53) og muse (Trp53) tumorprotein-53. Ved at søge med udtrykket “p450 oxido-reductase” finder man human POR og mus og rotte Por, men også mere end 90 hits for CYP-gener. Ved at søge på LocusLink med “por” finder man fire hits – human POR, mouse and rat Por og fruit fly porcupine Por. Det menneskelige POR-symbol er identificeret i LocusLink som “Official Gene Symbol and Name (HGNC)”.

Søgning i Genew ved hjælp af de fulde navne, ‘nadph cytochrome p450 oxidoreductase’ (eller ‘reductase’), ‘nadph cytochrome c oxidoreductase’ (eller ‘reductase’), ‘p450 oxidoreductase’ (eller ‘reductase’), ‘cytochrome c oxidoreductase’ (eller ‘reductase’), eller “p450 (cytochrome) oxidoreductase” (eller “reductase”) giver dog ingen data, men ved at søge i Genew med “por” finder man et “hit” for genet “P450 (cytochrome) oxido-reductase”, der er placeret på det menneskelige kromosom 7q11.2 med et alias “CYPOR”. Dette viser, at Genew mangler nogle relevante aliaser, fordi forespørgslen med det fulde navn “P450 (cytochrom) oxidoreductase” ikke fører til POR som gennavn, mens symbolet “por” fører til det fulde navn. Hvis du derimod starter din søgning med LocusLink, bliver du sendt direkte til POR-genet for mennesker og Por-genet for gnavere. Denne mindre fejl i Genew bør rapporteres til HGNC så hurtigt som muligt.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.