ANUNCIAÇÃO GENOMA
Escherichia coli BL21 e BL21(DE3), criadas por F. William Studier e Barbara A. Moffatt (1), são cepas de laboratório comuns para a produção de proteínas recombinantes. A falta de proteases longas e ompT, muitas vezes consideradas como características comuns entre as linhagens B, impulsionou o desenvolvimento dessas linhagens para os hospedeiros de expressão protéica. E. coli BL21(DE3), uma derivada de BL21, é provavelmente a mais utilizada na expressão de proteínas recombinantes de alto nível, e abriga um DE3 prophage derivado de uma bacteriófaga λ, que carrega o gene RNA polimerase T7 sob o controle do promotor lacUV5. A E. coli BL21 tem sido usada rotineiramente para expressão não-T7, e também foi modificada recentemente para produzir uma vacina de DNA plasmídeo, devido ao seu melhor desempenho em culturas de alta densidade de células alimentadas em lotes comparadas com as cepas K-12 (2).
A sequência genómica da E. coli BL21(DE3) foi previamente determinada pelo nosso instituto (3). Em princípio, a sequência genómica de BL21 seria idêntica à de BL21(DE3), excepto para o profágio DE3. Entretanto, podem ocorrer variações de estoque para estoque que podem ter sérias implicações para os experimentos (4). Com a informação do genoma E. coli BL21(DE3) como referência, a sequência completa do genoma de BL21 foi construída usando apenas sequenciamento de próxima geração, e diferenças genômicas base a base foram identificadas.
E. A cepa coli BL21 foi comprada da TaKaRa Bio (número de código 9126, número de lote K142). O sequenciamento genético foi realizado no Human Derived Material Center, Korea Research Institute of Bioscience and Biotechnology (KRIBB), usando o sistema Illumina HiSeq 2000. A sequência completa do genoma do BL21 foi produzida tanto por mapeamento de referência elaborado como pelo novo conjunto de 101-nt Illumina (47.123.524 leituras em ponta de página de uma biblioteca de ~150-bp) utilizando o CLC Genomics Workbench versão 6.5.1 (CLC bio).
Tínhamos esperado que uma sequência de genoma BL21(DE3) modificada (CP001509.3)-da qual a região de profilaxia foi apagada, deixando uma cópia do sítio de anexo lambda (attB)-seria a melhor sequência de referência. Entretanto, a análise de cobertura do primeiro mapeamento mostrou que o atB do BL21 não estava vazio, mas ocupado por uma linhagem de 12,1-kb-long λ*B como na E. coli REL606 (3), que foi relatada como uma característica comum entre a linhagem B (5). Uma segunda tentativa de mapeamento de referência, usando uma seqüência modificada com uma seqüência de profecia λ*B, revelou outra região de baixa cobertura entre o gene ybhC e o limite esquerdo do local de ligação lambda, attL. Por comparação de sequências, a melhor sequência de correspondência foi identificada a partir de contigs de novo montado e foi 23 bp mais longa que a região correspondente de BL21(DE3). Uma seqüência de referência atualizada foi então preparada, substituindo a região de baixa cobertura e sua vizinha (~200 bp), e o mapeamento foi realizado novamente. A cobertura de leitura uniforme em toda a sequência de referência final foi confirmada por investigação visual, e nenhuma outra diferença foi encontrada pela detecção de SNV/ variação estrutural baseada na qualidade ou pela análise do breakpoint. A montagem usando leituras não mapeadas não resultou em nenhuma contiguidade que possa suportar a presença de regiões específicas de BL21. A anotação do genoma foi realizada pelo serviço NCBI Prokaryotic Genome Automatic Annotation Pipeline (PGAAP).
Nucleotide sequence accession number.
Este projecto de caçadeira de genoma inteiro foi depositado no DDBJ/EMBL/GenBank sob o número de acesso CP010816.