Il y a probablement peu de lecteurs – voire aucun – pour lesquels le nom de Barbara McClintock ne leur dit rien. Si tous les lauréats du prix Nobel obtiennent une large reconnaissance, dans son cas, celle-ci a été aggravée par la bataille difficile qu’elle a dû mener pour faire accepter ses travaux. Cytogénéticienne travaillant sur le maïs comme système modèle, elle était arrivée à la conclusion que tous les gènes n’étaient pas des loci fixes statiques à des points définis du génome. Dire que sa conclusion sur l’existence de « gènes sauteurs » – codant des éléments d’ADN capables de se déplacer d’un emplacement chromosomique à un autre – a été accueillie avec une incrédulité généralisée est un euphémisme poli. Le temps et le poids des données lui ont donné raison et son Nobel de physiologie ou de médecine de 1983, à l’âge de 81 ans, témoignait autant de sa persévérance que de la qualité de la science.
Les caractéristiques de l’ADN qu’elle a découvertes sont correctement appelées éléments transposables ou transposons. Structurellement, ils partagent un certain nombre de caractéristiques similaires à certains types de virus (rétrovirus) et peuvent d’une certaine manière être considérés comme apparentés à un virus, dans la mesure où ils peuvent se répliquer de manière semi-autonome en utilisant la machinerie de la cellule hôte. Contrairement aux véritables virus, les transposons ne quittent pas la cellule et leur progéniture se déplace simplement vers un nouvel emplacement génomique où elle s’installe. Ils sont en fait l’exemple le plus simple de ce que l’on appelle « le gène égoïste », un postulat selon lequel les éléments génétiques cherchent simplement à se répliquer. Alors que la plupart d’entre eux ont « choisi » de le faire par le biais d’une association coopérative avec d’autres gènes pour créer des organismes de réplication viables, les transposons le font purement pour leur propre compte et davantage comme un parasite de la cellule hôte que comme un composant productif d’un ensemble plus vaste. L’intérêt que nous leur portons aujourd’hui vient d’abord du fait qu’ils ne se limitent pas à exister dans le maïs mais se trouvent en fait dans la plupart des organismes, y compris l’homme, et ensuite en ce qui concerne ce mode de vie intracellulaire dévoyé, tout-gène-pour-soi.
Lignes et SINES
Les humains n’ont pas qu’un seul type de transposon – il y a en fait un certain nombre de types qui sont vaguement regroupés en fonction de leur taille physique en éléments intercalés longs (LINES) et éléments intercalés courts (SINES). Comme on peut s’y attendre, plus ils sont grands physiquement, plus ils peuvent coder d’informations génétiques. L’élément connu sous le nom de LINE-1, d’une taille de ~6000 paires de bases, code pour deux cadres de lecture ouverts (régions qui peuvent être transcrites en ARNm puis traduites en protéines). L’une de ces protéines a une activité de liaison à l’ARN mais une fonction biologique peu claire ; la seconde a une activité d’endonucléase (coupure de l’ADN) et de transcription inverse (génération de séquences d’ADN à partir de matrices d’ARN). Essentiellement, après qu’un élément LINE-1 a été transcrit (en partie grâce aux sites de liaison des facteurs de transcription situés à son extrémité 5′), la seconde protéine exprimée effectue des coupures dans l’ADN hôte grâce à sa fonction endonucléase. Elle réalise ensuite une copie d’ADN de la transcription complète de l’élément LINE-1 grâce à sa fonction de transcriptase inverse. Cette copie d’ADN est insérée dans le génome hôte coupé et les mécanismes de réparation de l’ADN de la cellule hôte la mettent en place. Le chromosome hôte a maintenant obtenu une nouvelle copie de LINE-1 et chaque cycle de réplication cellulaire suivant réplique cette copie comme faisant partie de son ADN nucléaire « normal et inné ». Ce phénomène est considéré comme une rétrotransposition autonome, car LINE-1 fournit ses propres fonctions enzymatiques clés pour le processus. Bien que le processus lui-même se produise rarement, il est facile de voir comment, sur de longues échelles de temps biologiques, cela peut conduire à l’accumulation de multiples copies répliquées de l’élément LINE-1. On pense que LINE-1 est le seul élément transposable entièrement autonome du génome humain, et il s’est avéré être une stratégie biologique efficace avec près de 17 pour cent du génome humain constitué de cette séquence (environ 170 000 copies par cellule) !
Notre attention aujourd’hui, cependant, se porte sur un SINE, et en particulier celui (vraiment, la seule famille) connu sous le nom d’éléments Alu. Nommés d’après un site d’endonucléase de restriction (Alu I) qu’ils contiennent de manière caractéristique, ils sont beaucoup plus courts que la LIGNE-1, avec seulement environ 280 paires de bases de long. Cela signifie qu’ils n’ont pas une grande capacité de codage propre au-delà de certains signaux de démarrage de la transcription et qu’ils ne sont donc pas autonomes. En fait, les éléments Alu ont besoin à la fois de facteurs cellulaires et du second produit protéique de LINE-1 pour leur réplication, étant en quelque sorte parasites à la fois de la cellule hôte et des éléments LINE-1. Cette approche de parasite d’un parasite est apparemment une stratégie de gène égoïste encore plus efficace, puisque les éléments Alu représentent environ 11 pour cent du génome humain (environ 2 millions de copies par cellule).
Conséquences biologiques
Non surprenant, il y a des conséquences très réelles d’avoir autant de francs-tireurs génétiques dans notre génome, et des instables en plus. En particulier par le biais des signaux transcriptionnels et autres signaux génétiques qu’il transporte, un élément Alu peut influencer de nombreux aspects de l’expression des gènes de l’hôte proximal, notamment les niveaux d’expression basale des gènes, l’épissage et la polyadénylation des introns, et l’édition de l’ARN. La pression évolutive qui s’exerce sur la cellule dans son ensemble conduit généralement à l’adaptation du génome de l’hôte pour qu’il s’adapte, compense ou peut-être même, dans certains cas, tire un avantage de l’impact d’un élément Alu particulier dans son contexte. De telles adaptations de l’hôte prennent cependant du temps, et des pathologies cliniques peuvent survenir lorsqu’un nouvel événement de transposition Alu se produit, conduisant à un changement génétique abrupt à ce qui est essentiellement un loci aléatoire – l’insertion d’une nouvelle copie Alu.
Certaines choses à savoir à ce sujet sont que, puisqu’il s’agit d’un processus de réplication initié par la transcription (ARN), la réplication est sujette aux erreurs. Contrairement aux ADN polymérases, dont beaucoup contiennent ce que l’on appelle une fonction de relecture par laquelle chaque nucléotide ajouté à la copie naissante du modèle est soumis à un second regard pour confirmer une véritable correspondance complémentaire par opposition à une correspondance basée sur un décalage tautomérique transitoire, les ARN polymérases sont biologiquement optimisées pour la vitesse et la processivité. Dès qu’un nucléotide est ajouté à un transcrit en croissance, la polymérase se précipite vers la base suivante. Puisqu’une proportion de toutes les bases composant l’ADN et l’ARN peut exister et existe effectivement sous des formes tautomères où il y a de brefs réarrangements des hydrogènes et des doubles liaisons par rapport aux formes que nous voyons dans les manuels, les transcriptions d’ARN ont tendance à avoir des taux de mauvaise copie faibles mais significatifs à partir de leur modèle d’ADN.
Je sens que certains lecteurs paniquent soudainement, pourquoi si c’est le cas, ne sommes-nous pas tous dans la merde à cause d’erreurs dans les transcriptions régulières d’ARNm ? C’est parce que nous faisons de multiples copies des transcriptions des gènes actifs, et en moyenne elles sont OK. Qu’elles soient correctes ou non, elles ont une courte durée de vie avant d’être dégradées et remplacées par de nouvelles transcriptions selon les besoins. Les rares erreurs sporadiques dans les ARNm ne sont donc pas susceptibles d’être significatives.
Si, toutefois, vous prenez maintenant cette copie ARN pas tout à fait parfaite d’un ADN, puis que vous la transcrivez à nouveau en ADN pour une propagation à long terme, vous avez maintenant fixé ce changement génétique à long terme. En conséquence, seule une petite partie des éléments Alu de nos gènes sont effectivement capables de se répliquer et d’insérer de nouvelles copies d’eux-mêmes. En tout, on estime qu’il n’y a qu’une seule insertion Alu nouvelle. C’est une très bonne chose, car ces événements d’insertion sont potentiellement problématiques.
Rappellez-vous qu’environ un pour cent ou un peu plus du génome humain code pour des protéines hôtes (environ 21 000 gènes). Si nous faisons des coupures et introduisons de l’ADN non apparenté dans le génome, il est logique qu’environ un pour cent de ces coupures se trouvent dans des gènes et que le résultat soit une inactivation insertionnelle du gène. Étant donné que l’élément Alu transporte des signaux transcriptionnels et potentiellement d’autres éléments régulateurs, il est également tout à fait possible qu’il exerce des influences indésirables sur l’expression génétique des éléments dont il est simplement proche. Dans les deux cas, le résultat est la dysrégulation d’un ou de plusieurs gènes, presque certainement avec des résultats délétères.
Autre parenthèse, exactement ce processus est utilisé dans certains organismes modèles pour identifier les gènes relatifs à un trait phénotypique. De manière simpliste, les transposons endogènes à l’organisme peuvent être encouragés à s’activer, et les organismes de la descendance présentant des modifications du phénotype d’intérêt sont examinés pour tout nouveau site d’insertion de transposon en supposant qu’ils peuvent être dans ou près des gènes liés au phénotype. C’est ce qu’on appelle le marquage des transposons.
En dehors des nouveaux événements de rétrotransposition provoquant une inactivation par insertion, le nombre total élevé d’éléments Alu en soi peut entraîner d’autres problèmes génétiques. Plus précisément, ces îlots locaux de similarité de séquence peuvent être des points pour des événements de recombinaison homologue inégale, où le contexte chromosomique autour de chaque élément Alu n’est pas le même. Ceux-ci peuvent se produire à la fois de manière extrachromosomique (conduisant à l’échange de segments chromosomiques non homologues) et intrachromosomique (où ils tendent à conduire à la délétion ou à la duplication de régions, selon que les deux éléments Alu sont dans des orientations de polarité identique ou inverse).
Exemples de la vie réelle
Alors, maintenant que nous avons couvert la théorie selon laquelle il existe vraiment des éléments génétiques mobiles chez les humains, ils s’activent parfois et insèrent de nouvelles copies d’eux-mêmes, et cela peut avoir de mauvaises conséquences pour la cellule – qu’en est-il des exemples de la vie réelle ? Des personnes se présentent-elles en milieu clinique avec des problèmes attribuables à de nouvelles insertions d’Alu ? Absolument ; dès 19991, on a estimé que les nouvelles insertions Alu étaient détectables dans environ une naissance vivante sur 200 et qu’elles étaient responsables de 0,1 % des troubles génétiques connus. Des rapports particuliers tirés de la littérature incluent des occurrences spontanées d’hémophilie;2-4 de syndrome d’Apert;5 de neurofibromatose de type 1;6 et d’atrophie optique.7 Les lecteurs à la recherche d’une liste plus longue sont dirigés vers une revue de 2012 et ses références, listées comme référence huit ci-dessous.
Les présentations cliniques liées à des événements recombinatoires influencés par Alu sont probablement plus difficiles à identifier avec certitude que celles provenant d’événements insertionnels, mais des cas ont été rapportés (voir référence neuf pour un exemple) et sont probablement plus fréquents que nous le savons.
D’un point de vue thérapeutique, chaque mutation induite par Alu – insertionnelle ou recombinatoire – est unique et le traitement (s’il y en a un) devrait probablement se rapporter à une intervention biochimique directe dans la ou les voies impactées lorsque cela est possible, ou peut-être à des outils de génie génétique comme envisagé dans d’autres troubles génétiques innés. Ils restent donc pour le clinicien plutôt une curiosité qu’un type d’affection avec un traitement ou une prévention commune – mais probablement une fréquence non négligeable à l’origine d’une présentation génétique nouvelle.
- Alu Repeats and Human Disease. Deininger P, Batzer M. Molecular Genetics and Metabolism 1999 ; 67(3):183-193.
- Un insert Alu comme cause d’une forme grave d’hémophilie A. Sukarova E, Dimovski AJ, Tchacarova P, et al. Acta Haematol. 2001;106(3):126-9.
- Hémophilie B due à une insertion de novo d’un membre de la sous-famille Alu spécifique de l’homme dans la région codante du gène du facteur IX. Vidaud D, Vidaud M, Bahnak BR, et al. European Journal of Human Genetics 1993 ; 1(1):30-36.
- Le saut d’exon causé par une insertion intronique d’un jeune élément Alu Yb9 entraîne une hémophilie A sévère. Ganguly A, Dunbar T, Chen P, et al. Human Genetics 2003 ; 113(4) ; 348-352.
- Les insertions de novo de l’élément Alu dans le FGFR2 identifient une base pathologique distincte pour le syndrome d’Apert. Oldridge M, Zackai EH, McDonald-McGinn DM, et al. American Journal of Human Genetics 1999 ; 64(2);446-461.
- Une insertion Alu de novo entraîne une neurofibromatose de type 1. Wallace MR, Andersen LB, Saulino AM, et al. Nature 1991 ; 353(6347) ; 864-866.
- Une insertion d’élément Alu dans une séquence d’intron OPA1 associée à une atrophie optique autosomique dominante. Gallus GN, Cardaioli E, Rufa A, et al. Molecular Vision 2010 ; 16 ; 178-183.
- Éléments mobiles Alu : De l’ADN poubelle aux joyaux génomiques. Dridi S. Scientifica 2012. Article ID 545328, 11 pages.
- Mutation du récepteur des LDL : La recombinaison Alu-Alu supprime les exons codant pour les domaines transmembranaires et cytoplasmiques. Lehrman MA, Schneider WJ, Südhof TC, et al. Science 1985 ; 227(4683) ; 140-146.