GENOMMEDDELELSE
Escherichia coli BL21 og BL21(DE3), der er skabt af F. William Studier og Barbara A. Moffatt (1), er almindelige laboratoriestammer til produktion af rekombinante proteiner. Manglen på lon- og ompT-proteaser, der ofte betragtes som fælles karakteristika for B-linjen, har været drivkraften bag udviklingen af disse stammer som værter for proteinekspression. E. coli BL21(DE3), et derivat af BL21, er sandsynligvis den mest udbredte til ekspression af rekombinante proteiner på højt niveau, og den indeholder en profage DE3, der stammer fra en bakteriofag λ, som bærer T7 RNA-polymerase-genet under kontrol af lacUV5-promotoren. E. coli BL21 er rutinemæssigt blevet anvendt til ikke-T7-ekspression, og den er også for nylig blevet modificeret til fremstilling af en plasmid-DNA-vaccine på grund af dens bedre ydeevne i fed-batch-kulturer med høj celletæthed sammenlignet med K-12-stammer (2).
Genomsekvensen af E. coli BL21(DE3) er tidligere blevet bestemt af vores institut (3). I princippet ville genomsekvensen af BL21 være identisk med genomsekvensen af BL21(DE3), bortset fra DE3-profagen. Der kan imidlertid forekomme variationer fra lager til lager, som kan have alvorlige konsekvenser for eksperimenterne (4). Med E. coli BL21(DE3)-genomoplysningerne som reference blev den komplette genomsekvens for BL21 konstrueret udelukkende ved hjælp af næste generations sekventering, og der blev identificeret genomforskelle base for base.
E. coli BL21-stammen blev købt hos TaKaRa Bio (kodenummer 9126, partinummer K142). Genomsekventering blev udført på Human Derived Material Center, Korea Research Institute of Bioscience and Biotechnology (KRIBB), ved hjælp af Illumina HiSeq 2000-systemet. Den fuldstændige genomsekvens af BL21 blev fremstillet både ved udførlig referencekortlægning og de novo-assemblering af 101-nt Illumina-reads (47 123 524 parrede end-reads fra et ~150-bp-bibliotek) ved hjælp af CLC Genomics Workbench version 6.5.1 (CLC bio).
Vi havde forventet, at en modificeret BL21(DE3)-genomsekvens (CP001509.3) – hvorfra profage-regionen blev slettet, hvilket efterlod én kopi af lambda-tilhæftningsstedet (attB) – ville tjene som den bedste referencesekvens. Dækningsanalysen fra den første kortlægning viste imidlertid, at attB i BL21 ikke var tomt, men besat af en 12,1 kb lang λ*B-profage som i E. coli REL606 (3), hvilket blev rapporteret at være et fælles kendetegn blandt B-linjen (5). Et andet forsøg med referencekortlægning ved hjælp af en modificeret sekvens med en λ*B-profagsekvens afslørede et andet område med lav dækning mellem ybhC-genet og den venstre grænse af lambda-tilhæftningsstedet, attL. Ved sekvenssammenligning blev den bedst matchende sekvens identificeret fra de novo assemblerede contigs og var 23 bp længere end den tilsvarende region fra BL21(DE3). Der blev derefter udarbejdet en opdateret referencesekvens ved at udskifte den lavt dækkende region og dens nabo (~200 bp), og kortlægningen blev udført igen. En ensartet læsedækning på hele den endelige referencesekvens blev bekræftet ved visuel undersøgelse, og der blev ikke fundet andre forskelle ved kvalitetsbaseret SNV/strukturel variationsdetektion eller ved breakpoint-analyse. Samling ved hjælp af ikke-kortlagte læsninger resulterede ikke i nogen contigs, der kan understøtte tilstedeværelsen af BL21-specifikke regioner. Genomannotation blev udført af NCBI Prokaryotic Genome Automatic Annotation Pipeline (PGAAP)-tjenesten.
Nucleotide sequence accession number.
Dette helgenom shotgun-projekt er blevet deponeret på DDBJ/EMBL/GenBank under accessionsnummeret CP010816.