GENOME ANNOUNCEMENT
Escherichia coli BL21 und BL21(DE3), geschaffen von F. William Studier und Barbara A. Moffatt (1), sind gängige Laborstämme für die rekombinante Proteinproduktion. Das Fehlen von lon- und ompT-Proteasen, die oft als gemeinsame Merkmale der B-Linie angesehen werden, hat die Entwicklung dieser Stämme als Wirte für die Proteinexpression vorangetrieben. E. coli BL21(DE3), ein Derivat von BL21, wird wahrscheinlich am häufigsten für die hochgradige Expression rekombinanter Proteine verwendet und beherbergt einen Prophagen DE3, der von einem Bakteriophagen λ abgeleitet ist, der das T7-RNA-Polymerase-Gen unter der Kontrolle des lacUV5-Promotors trägt. E. coli BL21 wird routinemäßig für die Expression von Nicht-T7-Genen verwendet und wurde vor kurzem auch für die Herstellung eines Plasmid-DNA-Impfstoffs modifiziert, da es im Vergleich zu K-12-Stämmen eine bessere Leistung in Fed-Batch-Kulturen mit hoher Zelldichte aufweist (2).
Die Genomsequenz von E. coli BL21(DE3) wurde zuvor von unserem Institut bestimmt (3). Im Prinzip wäre die Genomsequenz von BL21 mit der von BL21(DE3) identisch, mit Ausnahme des DE3-Prophagen. Es kann jedoch zu Abweichungen zwischen den einzelnen Stämmen kommen, die schwerwiegende Auswirkungen auf die Experimente haben können (4). Auf der Grundlage der Genominformationen von E. coli BL21(DE3) wurde die vollständige Genomsequenz von BL21 ausschließlich mit Hilfe der Next-Generation-Sequenzierung erstellt, und es wurden Base-für-Base-Unterschiede im Genom identifiziert.
Der E. coli BL21-Stamm wurde von TaKaRa Bio erworben (Codenummer 9126, Losnummer K142). Die Genomsequenzierung wurde am Human Derived Material Center, Korea Research Institute of Bioscience and Biotechnology (KRIBB), mit dem Illumina HiSeq 2000 System durchgeführt. Die vollständige Genomsequenz von BL21 wurde sowohl durch elaboriertes Referenz-Mapping als auch durch de-novo-Assemblierung von 101-nt Illumina-Reads (47.123.524 Paired-End-Reads aus einer ~150-bp-Bibliothek) unter Verwendung der CLC Genomics Workbench Version 6.5.1 (CLC bio).
Wir hatten erwartet, dass eine modifizierte BL21(DE3)-Genomsequenz (CP001509.3) – aus der die Prophagenregion entfernt wurde, so dass eine Kopie der Lambda-Anheftungsstelle (attB) übrig blieb – als beste Referenzsequenz dienen würde. Die Abdeckungsanalyse der ersten Kartierung zeigte jedoch, dass die attB von BL21 nicht leer war, sondern wie bei E. coli REL606 (3) von einem 12,1 kb langen λ*B-Prophagen besetzt war, was als gemeinsames Merkmal der B-Linie berichtet wurde (5). Ein zweiter Versuch der Referenzkartierung unter Verwendung einer modifizierten Sequenz mit einer λ*B-Prophagen-Sequenz ergab eine weitere Region mit geringer Abdeckung zwischen dem ybhC-Gen und der linken Grenze der Lambda-Anheftungsstelle, attL. Durch einen Sequenzvergleich wurde die beste übereinstimmende Sequenz aus de novo assemblierten Contigs identifiziert und war 23 bp länger als die entsprechende Region aus BL21(DE3). Anschließend wurde eine aktualisierte Referenzsequenz erstellt, indem die Region mit geringer Abdeckung und ihr Nachbar (~200 bp) ersetzt wurden, und das Mapping wurde erneut durchgeführt. Die gleichmäßige Leseabdeckung der gesamten endgültigen Referenzsequenz wurde durch eine visuelle Untersuchung bestätigt, und weder bei der qualitätsbasierten SNV-/Strukturvariationserkennung noch bei der Bruchpunktanalyse wurden weitere Unterschiede festgestellt. Die Assemblierung mit ungemappten Reads ergab keine Contigs, die das Vorhandensein von BL21-spezifischen Regionen belegen könnten. Die Genom-Annotation wurde mit dem NCBI Prokaryotic Genome Automatic Annotation Pipeline (PGAAP) Service durchgeführt.
Nukleotidsequenz-Zugangsnummer.
Dieses Whole-Genome-Shotgun-Projekt wurde bei DDBJ/EMBL/GenBank unter der Zugangsnummer CP010816 hinterlegt.