ZVEŘEJNĚNÍ GENOMU
Escherichia coli BL21 a BL21(DE3), které vytvořili F. William Studier a Barbara A. Moffatt (1), jsou běžné laboratorní kmeny pro produkci rekombinantních proteinů. Absence proteáz lon a ompT, které jsou často považovány za společné vlastnosti kmenů linie B, vedla k vývoji těchto kmenů jako hostitelů pro expresi proteinů. E. coli BL21(DE3), derivát kmene BL21, je pravděpodobně nejpoužívanější pro expresi rekombinantních proteinů na vysoké úrovni a je nositelem profága DE3 odvozeného z bakteriofága λ, který nese gen T7 RNA polymerázy pod kontrolou promotoru lacUV5. E. coli BL21 se běžně používá pro expresi bez T7 a nedávno byla také modifikována pro výrobu vakcíny s plazmidovou DNA, a to díky lepší výkonnosti v kulturách s vysokou hustotou buněk v krmné dávce ve srovnání s kmeny K-12 (2).
Sekvence genomu E. coli BL21(DE3) byla dříve určena naším ústavem (3). Sekvence genomu BL21 by byla v zásadě identická se sekvencí BL21(DE3), s výjimkou profága DE3. Mohou se však vyskytnout odchylky mezi jednotlivými zásobami, které mohou mít závažné důsledky pro experimenty (4). S informacemi o genomu E. coli BL21(DE3) jako referencí byla sestavena kompletní sekvence genomu BL21 pouze pomocí sekvenování nové generace a byly identifikovány rozdíly v genomu báze po bázi.
Kmen E. coli BL21 byl zakoupen od společnosti TaKaRa Bio (kódové číslo 9126, číslo šarže K142). Sekvenování genomu bylo provedeno ve středisku Human Derived Material Center, Korea Research Institute of Bioscience and Biotechnology (KRIBB), pomocí systému Illumina HiSeq 2000. Kompletní sekvence genomu BL21 byla získána jak vypracovaným referenčním mapováním, tak de novo sestavením 101-nt čtení Illumina (47 123 524 čtení s párovým koncem z knihovny o velikosti ~150 bp) pomocí programu CLC Genomics Workbench verze 6.5.1 (CLC bio).
Očekávali jsme, že upravená sekvence genomu BL21(DE3) (CP001509.3) – z níž byla odstraněna profágová oblast a ponechána jedna kopie místa připojení lambda (attB) – bude sloužit jako nejlepší referenční sekvence. Analýza pokrytí z prvního mapování však ukázala, že attB u BL21 není prázdné, ale obsazené 12,1 kb dlouhým profágem λ*B jako u E. coli REL606 (3), což je údajně společná vlastnost linie B (5). Druhý pokus referenčního mapování s použitím modifikované sekvence, která měla sekvenci profága λ*B, odhalil další oblast s nízkým pokrytím mezi genem ybhC a levou hranicí místa připojení lambdy, attL. Porovnáním sekvencí byla identifikována nejlépe odpovídající sekvence z de novo sestavených kontigů a byla o 23 bp delší než odpovídající oblast z BL21(DE3). Poté byla připravena aktualizovaná referenční sekvence nahrazením oblasti s nízkým pokrytím a jejího souseda (~200 bp) a znovu bylo provedeno mapování. Vizuálním šetřením bylo potvrzeno rovnoměrné pokrytí čtení na celé konečné referenční sekvenci a detekcí SNV/strukturálních variací na základě kvality ani analýzou bodů zlomu nebyl zjištěn žádný další rozdíl. Sestavení pomocí nemapovaných čtení nevedlo k žádným kontigům, které by mohly podpořit přítomnost oblastí specifických pro BL21. Anotace genomu byla provedena pomocí služby NCBI Prokaryotic Genome Automatic Annotation Pipeline (PGAAP).
Přístupové číslo sekvence nukleotidů.
Tento celogenomový shotgun projekt byl uložen v DDBJ/EMBL/GenBank pod přístupovým číslem CP010816.
.