ANUNCIO DEL GENOMA
Escherichia coli BL21 y BL21(DE3), creadas por F. William Studier y Barbara A. Moffatt (1), son cepas comunes de laboratorio para la producción de proteínas recombinantes. La falta de proteasas lon y ompT, a menudo consideradas como características comunes entre las cepas B, ha impulsado el desarrollo de esas cepas para albergar la expresión de proteínas. E. coli BL21(DE3), un derivado de BL21, es probablemente el más utilizado en la expresión de alto nivel de proteínas recombinantes, y alberga un profago DE3 derivado de un bacteriófago λ, que porta el gen de la ARN polimerasa T7 bajo el control del promotor lacUV5. E. coli BL21 se ha utilizado de forma rutinaria para la expresión no T7, y también se ha modificado recientemente para producir una vacuna de ADN plasmídico, debido a su mejor rendimiento en cultivos de alta densidad celular en lote alimentado en comparación con las cepas K-12 (2).
La secuencia del genoma de E. coli BL21(DE3) fue determinada previamente por nuestro instituto (3). En principio, la secuencia del genoma de BL21 sería idéntica a la de BL21(DE3), excepto por el profago DE3. Sin embargo, pueden producirse variaciones de cepa a cepa que pueden tener graves implicaciones para los experimentos (4). Con la información del genoma de E. coli BL21(DE3) como referencia, se construyó la secuencia completa del genoma de BL21 utilizando únicamente la secuenciación de próxima generación, y se identificaron las diferencias genómicas base a base.
La cepa de E. coli BL21 se compró a TaKaRa Bio (número de código 9126, número de lote K142). La secuenciación del genoma se llevó a cabo en el Centro de Material Derivado Humano del Instituto de Investigación de Biociencia y Biotecnología de Corea (KRIBB), utilizando el sistema Illumina HiSeq 2000. La secuencia completa del genoma de BL21 se produjo tanto por el mapeo de referencia elaborado como por el ensamblaje de novo de las lecturas de 101 nt de Illumina (47.123.524 lecturas de extremo pareado de una biblioteca de ~150 bp) utilizando la versión 6.5 de CLC Genomics Workbench.Esperábamos que una secuencia genómica modificada de BL21(DE3) (CP001509.3) -de la que se eliminó la región profágica, dejando una copia del sitio de fijación de lambda (attB)- sirviera como la mejor secuencia de referencia. Sin embargo, el análisis de cobertura del primer mapeo mostró que el attB de BL21 no estaba vacío, sino que estaba ocupado por un profago λ*B de 12,1 kb de longitud, como en E. coli REL606 (3), lo que, según se ha informado, es una característica común entre el linaje B (5). Un segundo ensayo de mapeo de referencia, utilizando una secuencia modificada que tenía una secuencia de profago λ*B, reveló otra región de baja cobertura entre el gen ybhC y el límite izquierdo del sitio de fijación de lambda, attL. Por comparación de secuencias, se identificó la mejor secuencia coincidente a partir de los contigs ensamblados de novo y era 23 pb más larga que la región correspondiente de BL21(DE3). A continuación se preparó una secuencia de referencia actualizada sustituyendo la región de baja cobertura y su vecina (~200 pb), y se volvió a realizar el mapeo. La cobertura uniforme de las lecturas en toda la secuencia de referencia final se confirmó mediante una investigación visual, y no se encontró ninguna otra diferencia mediante la detección de variaciones estructurales/de SNV basadas en la calidad o mediante el análisis de puntos de ruptura. El ensamblaje utilizando lecturas no mapeadas no dio lugar a ningún contig que pudiera apoyar la presencia de regiones específicas de BL21. La anotación del genoma se llevó a cabo mediante el servicio NCBI Prokaryotic Genome Automatic Annotation Pipeline (PGAAP).
Número de acceso a la secuencia de nucleótidos.
Este proyecto de escopeta de genoma completo se ha depositado en DDBJ/EMBL/GenBank con el número de acceso CP010816.