GENOME ANNOUNCEMENT
Escherichia coli BL21 en BL21(DE3), gecreëerd door F. William Studier en Barbara A. Moffatt (1), zijn gangbare laboratoriumstammen voor de productie van recombinante eiwitten. Het ontbreken van de proteasen lon en ompT, die vaak worden beschouwd als gemeenschappelijke kenmerken van de B-stammen, heeft de ontwikkeling van deze stammen voor eiwitexpressie-gastheren gestimuleerd. E. coli BL21(DE3), een afgeleide van BL21, wordt waarschijnlijk het meest gebruikt voor de expressie van recombinante eiwitten op hoog niveau, en het bevat een prophage DE3 afgeleid van een bacteriofaag λ, die het T7 RNA polymerase gen draagt onder controle van de lacUV5 promoter. E. coli BL21 is routinematig gebruikt voor niet-T7 expressie, en het werd onlangs ook gemodificeerd voor de productie van een plasmide DNA-vaccin, vanwege zijn betere prestaties in hoge-celdichtheid fed-batch culturen in vergelijking met K-12 stammen (2).
De genoomsequentie van E. coli BL21(DE3) werd eerder bepaald door ons instituut (3). In principe zou de genoomsequentie van BL21 identiek zijn aan die van BL21(DE3), met uitzondering van de DE3 prophage. Er kunnen echter stock-to-stock variaties optreden die ernstige implicaties kunnen hebben voor experimenten (4). Met E. coli BL21(DE3) genoominformatie als referentie, werd de volledige genoomsequentie van BL21 geconstrueerd met alleen next-generation sequencing, en werden base-voor-base genomische verschillen geïdentificeerd.
E. coli BL21 stam werd aangekocht bij TaKaRa Bio (codenummer 9126, lotnummer K142). De genoomsequentiebepaling werd uitgevoerd in het Human Derived Material Center, Korea Research Institute of Bioscience and Biotechnology (KRIBB), met behulp van het Illumina HiSeq 2000-systeem. De volledige genoomsequentie van BL21 werd geproduceerd door zowel uitgebreide referentie mapping als de novo assemblage van 101-nt Illumina reads (47.123.524 gepaarde-end reads van een ~150-bp bibliotheek) met behulp van de CLC Genomics Workbench versie 6.5.1 (CLC bio).
We hadden verwacht dat een gemodificeerde BL21(DE3) genoomsequentie (CP001509.3)-waaruit de prophage regio was verwijderd, waardoor één kopie van de lambda attachment site (attB)-zou dienen als de beste referentie sequentie. Uit de dekkingsanalyse van de eerste kartering bleek echter dat de attB van BL21 niet leeg was, maar bezet werd door een 12,1-kb lange λ*B prophage zoals in E. coli REL606 (3), waarvan gemeld werd dat het een gemeenschappelijk kenmerk van de B-lijn was (5). Een tweede poging tot referentiekartering, waarbij gebruik werd gemaakt van een gewijzigde sequentie met een λ*B prophage sequentie, bracht een ander weinig dekkend gebied aan het licht tussen het ybhC gen en de linkergrens van de lambda aanhechtingsplaats, attL. Door sequentievergelijking werd de best passende sequentie geïdentificeerd uit de novo geassembleerde contigs en was 23 bp langer dan de corresponderende regio uit BL21(DE3). Een bijgewerkte referentie-sequentie werd vervolgens bereid door het vervangen van de lage dekking regio en zijn buurman (~ 200 bp), en mapping werd opnieuw uitgevoerd. Een uniforme leesdekking op de gehele uiteindelijke referentiesequentie werd bevestigd door visueel onderzoek, en er werd geen ander verschil gevonden door SNV/structurele variatie detectie op basis van kwaliteit of door breekpuntanalyse. Assemblage met gebruikmaking van niet-gemapte gelezen resulteerde niet in contigs die de aanwezigheid van BL21-specifieke regio’s kunnen ondersteunen. Genoomannotatie werd uitgevoerd door de NCBI Prokaryotic Genome Automatic Annotation Pipeline (PGAAP) service.
Nucleotide sequence accession number.
Dit whole-genome shotgun project is gedeponeerd bij DDBJ/EMBL/GenBank onder het toetredingsnummer CP010816.