Update on human genome completion and annotations: Nomenclatura genelor

Pentru fiecare genă umană stabilită fără echivoc, un nume și un simbol (abrevierea sub formă scurtă) sunt aprobate de HGNC. Fiecare simbol este unic, iar fiecare genă va avea un singur simbol genetic aprobat . Este important să se ofere o reprezentare unică pentru fiecare genă, astfel încât colegii să poată discuta între ei despre o anumită secvență sau familie de gene. Existența unui simbol unic facilitează, de asemenea, recuperarea electronică a datelor din publicații și baze de date. În plus, este important ca fiecare simbol să mențină, de preferință, o construcție paralelă în, de exemplu, diferiți membri ai unei familii de gene.

HGNC ar trebui să fie contactat cât mai repede posibil cu noi membri ai familiilor de gene, deoarece unele simboluri pot fi rezervate în baza lor de date. Obținerea unui simbol de genă înainte de publicare va evita orice posibile conflicte cu simbolurile existente și va asigura înregistrarea promptă a genei în bazele de date LocusLink (http://www.ncbi.nlm.nih.gov/LocusLink/) și Genew (http://www.gene.ucl.ac.uk/cgi-bin/nomenclature/searchgenes.pl).

În septembrie 2003, există 16.765 de simboluri de gene umane aprobate – ceea ce înseamnă că obiectivul de a numi toate genele din genomul uman este undeva între o treime și poate mai mult de jumătate realizat. Noile simboluri individuale noi sunt solicitate nu numai de oamenii de știință, ci și de un număr tot mai mare de reviste (de exemplu, American Journal of Human Genetics; Animal Genetics; Annals of Human Genetics; Cytogenetic & Genomic Research; Genes, Chromosomes & Cancer; Genomics; Human Mutation; Lancet; Molecular Therapy; Nature Genetics; Radiation Research). Publicarea unui articol în oricare dintre aceste reviste nu va avea loc până când gena studiată nu va fi numită oficial. Acest lucru asigură, de asemenea, că toate simbolurile nou publicate sunt imediat indexate încrucișat cu alte baze de date (de exemplu, LocusLink, Ref Seq, OMIM și MGD), ceea ce sporește accesibilitatea potențială și impactul acestor gene în bazele de date.

S-a sugerat că procesul de nomenclatură ar putea fi automatizat, iar publicațiile recente indică, cu siguranță, că aceasta ar putea fi o posibilitate viabilă. În timp ce atribuirea automată a numelor și simbolurilor genelor poate foarte bine să ofere clasificări foarte sistematice, totuși, acest lucru nu permite întotdeauna includerea celor mai utile sau chiar memorabile informații.

Exemple de căutare sau de trimitere a unui simbol de genă

Tabelul 1 rezumă pașii pe care cineva este îndemnat să îi urmeze pentru a asigura o nomenclatură adecvată a oricărei gene. Aici vor fi date trei exemple, pentru a ilustra și mai mult cum și de ce ar trebui să se facă eforturi pentru un sistem standardizat de nomenclatură a genelor. În aceste exemple, accentul este pus pe utilizarea numelor genelor ca termeni de căutare, mai degrabă decât pe compararea unei secvențe de ADN sau de proteine care tocmai a fost determinată, prin căutarea prin BLAST (http://www.ncbi.nlm.nih.gov/BLAST/). Cele trei exemple de mai jos cuprind gene care codifică enzime; actualizările viitoare se vor concentra pe nomenclatura altor tipuri de produse genetice și motive ADN.

Tabelul 1 Lista de verificare a HUGO Gene Nomenclature Committee (HGNC) pentru a decide asupra unui nou simbol genetic uman

Ciclooxigenaza

Procedura de redactare a unei recenzii privind prostaglandina G/H sintetaza-1 și -2, cunoscută și sub numele de ciclooxigenaza-1 și -2, poreclită în mod obișnuit în multe reviste ca „COX-1” și „COX-2”, este prezentată mai jos. Aceste enzime, care sunt ținte ale medicamentelor antiinflamatoare nesteroidiene, sunt esențiale în conversia acidului arahidonic în prostaglandine G și H, căi care sunt asociate cu procesele inflamatorii, durerea, boala reumatoidă, ateroscleroza, accidentul vascular cerebral, leziunile și repararea tractului gastrointestinal, stresul oxidativ și diverse tipuri de cancer . Pentru a determina simbolul aprobat corect, prima abordare este de a căuta în LocusLink (pentru toate organismele) folosind „prostaglandină g sintetază” sau „prostaglandină h sintetază” ca nume complet. Astfel, se vor găsi zece și, respectiv, 12 loci, dintre care patru includ, în ambele cazuri, simbolurile aprobate pentru om, PTGS1 și PTGS2, precum și pentru șoarece și șobolan Ptgs2. Căutând LocusLink cu „cyclooxygenase” se vor obține 49 de rezultate pozitive – enumerate în ordine alfabetică – din nou, dintre care patru includ înregistrările genelor umane PTGS1 și PTGS2 și Ptgs2 de șoarece și șobolan. Căutând LocusLink pentru „cox1”, se găsesc trei loci, care includ PTGS1 umană, Ptgs1 de șobolan și Mt-Co1 mitocondrială de șobolan. Căutând LocusLink pentru „cox2”, se găsesc șapte rezultate pozitive, dintre care trei sunt PTGS2 uman și Ptgs2 de șoarece și șobolan; Mt-Co2 mitocondrial de șobolan este, de asemenea, înregistrat.

Cercetarea Genew folosind „prostaglandin g synthase” sau „prostaglandin h synthase” ca nume complete, cu toate acestea, nu găsește nicio înregistrare genetică. Căutând Genew cu „cyclooxy-genase”, se poate confirma că simbolurile genelor umane sunt PTGS1 și PTGS2, numele lor aprobate sunt prostaglandină-endoperoxid sintetază 1 (prostaglandină G/H sintetază și ciclooxigenază) (M59979; NM_000962) și prostaglandină-endoperoxid sintetază 2 (prostaglandină G/H sintetază și ciclooxigenază) (D28235; NM_000963), localizate pe cromozomii umani 9q32-q33.3 și, respectiv, 1q25.2-q25.3; pseudonimele pentru PTGS1 includ COX1, PGHS-1 și PTGHS, iar pentru PTGS2 includ numai COX2. Se poate observa că există o oarecare confuzie în ceea ce privește utilizarea altor pseudonime, cum ar fi COX, deoarece căutarea în Genew a tuturor înregistrărilor care încep cu COX generează 46 de înregistrări, dintre care cele mai multe se referă la genele subunității citocromului c oxidază. Astfel, a folosi „COX” pentru a se referi la enzimele ciclooxigenază-1 și -2 pe care cineva le studiază nu ar fi de ajutor comunității, deoarece acest lucru nu ar face decât să aducă și mai multă confuzie în literatura de specialitate.

Sintetaze ale acizilor grași

Sintetaza acizilor grași, una dintre principalele enzime lipogenetice, transformă caloriile alimentare într-o formă de stocare a energiei . Acizii grași înșiși pot acționa, de asemenea, ca semnale care reglează expresia genelor, iar sintetaza acizilor grași este reglată în jos de către acizii grași polinesaturați . Să ne imaginăm că ați izolat ADNc pentru sintetaza acidului gras din ficatul uman și vă gândiți să numiți gena FAS. Căutând în LocusLink folosind „fatty acid synthase”, se găsesc 58 de loci – inclusiv FASN uman, Fasn la șoareci și șobolani și Fas la musca fructelor. Căutând LocusLink folosind simbolul „fas”, se obțin 149 de rezultate, care includ FASN uman și Fasn de șoarece. FASN este localizat pe cromozomul 17q25 și are un număr de acces GenBank de NM_004104; prin urmare, gena dumneavoastră are deja acest simbol aprobat. Cu toate acestea, este posibil să considerați că alegerea inițială FAS este mai potrivită, caz în care ar trebui să contactați HGNC și să argumentați de ce credeți că „FAS” este un simbol mai bun pentru această genă decât FASN.

Să presupunem că ați caracterizat genele care codifică o nouă sintetază citosolică a acizilor grași cu lanț scurt și o nouă sintetază citosolică a acizilor grași cu lanț lung. Căutând în LocusLink folosind denumirile complete, găsiți cinci loci pentru sintetaza acizilor grași cu lanț scurt, care includ Fasn de șoarece și șobolan, și 12 loci pentru sintetaza acizilor grași cu lanț lung, care includ FASN uman și trei gene „ligaze ale acizilor grași-coenzima A cu lanț lung” (FACL1, FACL3 și FACL4) care reprezintă o familie mică. Căutând în LocusLink folosind simbolurile „fascs”, „falcs”, „facs”, „fass”, „fasc” sau „falc”, nu veți găsi niciun rezultat, cu excepția lui „facs”, care vă oferă FACL2 umană și Facl2 de șoarece și șobolan. Căutând Genew folosind denumirile complete, nu veți găsi niciun rezultat care să se refere la oricare dintre aceste enzime. Căutarea Genew folosind simbolul „fascs”, „falcs”, „facs”, „fass”, „fasc” sau „falc” generează, de asemenea, zero rezultate. Concluzia dvs. ar fi că există un simbol rădăcină pentru cel puțin patru gene umane ale acizilor grași-coenzimei A cu lanț lung (membri ai unei familii înrudite din punct de vedere evolutiv), dar nimic pentru sintetaza dvs. de acizi grași cu lanț scurt.

Următorul pas ar fi să contactați HGNC pentru a vă asigura că nimic nu a fost „rezervat”, în ceea ce privește descrierea acestei familii de gene. Odată ce acest lucru a fost stabilit, ați putea fi încurajat să luați legătura cu mai mulți actori importanți din domeniul acizilor grași cu lanț scurt și cu alții din domeniul acizilor grași cu lanț lung și să încercați să ajungeți la un acord de consens (cu implicarea HGNC) privind rădăcinile simbolice pentru denumirea genei sau a genelor din familia sintetazei acizilor grași cu lanț scurt. Deoarece FACL este simbolul rădăcină pentru acidul gras sintetază cu lanț lung (sau ligază), „FACS” ar fi una dintre rădăcinile cele mai rezonabile și consecvente pentru gena dvs. de acid gras sintetază cu lanț scurt. În LocusLink, există, de asemenea, gena umană ECHS1, gena pentru o „enoil-coenzima A hidratază mitocondrială cu lanț scurt”, pe care trebuie să confirmați că nu este noua genă pe care ați identificat-o. FACS1 rămâne astfel cea mai rezonabilă denumire propusă – mai ales dacă și alți colegi din domeniu sunt de acord cu sugestia dumneavoastră.

NADPH-citocrom P450 reductază

Această enzimă transferă primul electron de la NADPH la diversele monooxigenaze ale citocromului P450 (CYP) . Dar ce se întâmplă dacă se va scrie o recenzie pe această temă? Căutând în LocusLink folosind numele complet, „nadph cytochrome p450 oxidoreductase” (sau „reductase” fără „oxido”), există nouă și, respectiv, 11 rezultate, inclusiv POR uman, Por de șoarece și Cpr de muscă de fructe. Incluzând o cratimă (nadph-citocrom p450 oxidoreductază), se obțin doar două rezultate – POR uman și Cpr de la musca fructelor. În mod curios, căutarea în LocusLink folosind denumirea mai veche „nadph citocrom c oxidoreductază” (sau „reductază”) produce doar o NADPH-oxidază, plus proteina tumorală-53 umană (TP53) și de șoarece (Trp53). Dacă se caută cu termenul „p450 oxido-reductază”, se găsesc POR umană și Por de șoarece și șobolan, dar și peste 90 de rezultate pentru genele CYP. Dacă se caută în LocusLink cu termenul „por”, se găsesc patru rezultate pozitive: POR umană, Por de șoarece și șobolan și Por de muscă de fructe. Simbolul POR uman este identificat în LocusLink ca „Official Gene Symbol and Name (HGNC)”.

Cercetarea Genew folosind numele complete, ‘nadph cytochrome p450 oxidoreductase’ (sau ‘reductase’), ‘nadph cytochrome c oxidoreductase’ (sau ‘reductase’), ‘p450 oxidoreductase’ (sau ‘reductase’), ‘cytochrome c oxidoreductase’ (sau ‘reductase’), sau „p450 (citocrom) oxidoreductază” (sau „reductază”), însă nu se obține nicio informație, deși, căutând Genew cu „por”, se găsește un „hit” pentru gena numită „P450 (citocrom) oxidoreductază” situată pe cromozomul uman 7q11.2 cu pseudonimul „CYPOR”. Acest lucru arată că Genew omite unele pseudonime relevante, deoarece interogarea cu numele complet „P450 (citocrom) oxidoreductază” nu vă conduce la POR ca nume de genă, în timp ce simbolul „por” vă conduce la numele complet. În schimb, începerea căutării cu LocusLink vă trimite direct la genele POR la om și Por la rozătoare. Această eroare minoră din Genew ar trebui să fie raportată la HGNC cât mai curând posibil.

.

Lasă un răspuns

Adresa ta de email nu va fi publicată.