Annonce du génome
Escherichia coli BL21 et BL21(DE3), créées par F. William Studier et Barbara A. Moffatt (1), sont des souches de laboratoire courantes pour la production de protéines recombinantes. L’absence des protéases lon et ompT, souvent considérées comme des caractéristiques communes à la lignée B, a motivé le développement de ces souches comme hôtes d’expression de protéines. E. coli BL21(DE3), un dérivé de BL21, est probablement le plus largement utilisé pour l’expression de haut niveau de protéines recombinantes, et il héberge un prophage DE3 dérivé d’un bactériophage λ, qui porte le gène de l’ARN polymérase T7 sous le contrôle du promoteur lacUV5. E. coli BL21 a été couramment utilisé pour l’expression non T7, et il a également été récemment modifié pour produire un vaccin à ADN plasmidique, en raison de sa meilleure performance dans les cultures fed-batch à haute densité cellulaire par rapport aux souches K-12 (2).
La séquence du génome de E. coli BL21(DE3) a été précédemment déterminée par notre institut (3). En principe, la séquence du génome de BL21 devrait être identique à celle de BL21(DE3), à l’exception du prophage DE3. Cependant, des variations d’un stock à l’autre peuvent se produire et avoir de sérieuses implications pour les expériences (4). Avec les informations sur le génome de E. coli BL21(DE3) comme référence, la séquence complète du génome de BL21 a été construite en utilisant uniquement le séquençage de nouvelle génération, et les différences génomiques base par base ont été identifiées.
La souche BL21 de E. coli a été achetée auprès de TaKaRa Bio (numéro de code 9126, numéro de lot K142). Le séquençage du génome a été effectué au Human Derived Material Center, Korea Research Institute of Bioscience and Biotechnology (KRIBB), à l’aide du système Illumina HiSeq 2000. La séquence complète du génome de BL21 a été produite à la fois par cartographie de référence élaborée et par assemblage de novo de lectures Illumina de 101 nt (47 123 524 lectures en paires provenant d’une bibliothèque de ~150 pb) à l’aide de la version 6.5 de CLC Genomics Workbench.1 (CLC bio).
Nous nous attendions à ce qu’une séquence du génome BL21(DE3) modifiée (CP001509.3) – de laquelle la région du prophage a été supprimée, laissant une copie du site d’attachement lambda (attB) – serve de meilleure séquence de référence. Cependant, l’analyse de la couverture de la première cartographie a montré que l’attB de BL21 n’était pas vide mais occupée par un prophage λ*B de 12,1 kb de long comme dans E. coli REL606 (3), ce qui a été signalé comme étant une caractéristique commune parmi la lignée B (5). Un deuxième essai de cartographie de référence, utilisant une séquence modifiée ayant une séquence de prophage λ*B, a révélé une autre région à faible couverture entre le gène ybhC et la limite gauche du site d’attachement lambda, attL. Par comparaison de séquences, la meilleure séquence correspondante a été identifiée à partir de contigs assemblés de novo et était 23 pb plus longue que la région correspondante de BL21(DE3). Une séquence de référence mise à jour a ensuite été préparée en remplaçant la région à faible couverture et sa voisine (~200 pb), et la cartographie a été effectuée à nouveau. Une couverture de lecture uniforme sur l’ensemble de la séquence de référence finale a été confirmée par un examen visuel, et aucune autre différence n’a été trouvée par la détection des SNV/variations structurelles basée sur la qualité ou par l’analyse des points de rupture. L’assemblage à l’aide de lectures non mappées n’a pas donné lieu à des contigs pouvant confirmer la présence de régions spécifiques à BL21. L’annotation du génome a été effectuée par le service NCBI Prokaryotic Genome Automatic Annotation Pipeline (PGAAP).
Numéro d’accession de la séquence nucléotidique.
Ce projet de shotgun du génome entier a été déposé à la DDBJ/EMBL/GenBank sous le numéro d’accession CP010816.
.