Genommeddelande
Escherichia coli BL21 och BL21(DE3), som skapades av F. William Studier och Barbara A. Moffatt (1), är vanliga laboratoriestammar för produktion av rekombinanta proteiner. Avsaknaden av lon- och ompT-proteaser, som ofta anses vara gemensamma egenskaper hos B-linjerna, har drivit utvecklingen av dessa stammar som värdar för proteinuttryck. E. coli BL21(DE3), ett derivat av BL21, är förmodligen den mest använda för högnivåexpression av rekombinanta proteiner, och den har en profag DE3 som härrör från en bakteriofag λ, som bär på T7 RNA-polymerasgenen under kontroll av lacUV5-promotorn. E. coli BL21 har använts rutinmässigt för icke-T7-uttryck, och den har också nyligen modifierats för att producera ett plasmid-DNA-vaccin, på grund av dess bättre prestanda i fed-batchkulturer med hög celltäthet jämfört med K-12-stammar (2).
Den genetiska sekvensen av E. coli BL21(DE3) har tidigare bestämts av vårt institut (3). I princip skulle genomsekvensen för BL21 vara identisk med den för BL21(DE3), med undantag för DE3-profagen. Det kan dock förekomma variationer från lager till lager som kan få allvarliga konsekvenser för experimenten (4). Med E. coli BL21(DE3)-genominformationen som referens konstruerades BL21:s fullständiga genomsekvens enbart med hjälp av nästa generations sekvensering, och genomiska skillnader bas för bas identifierades.
E. coli BL21-stammen köptes från TaKaRa Bio (kodnummer 9126, partinummer K142). Genomsekvensering utfördes vid Human Derived Material Center, Korea Research Institute of Bioscience and Biotechnology (KRIBB), med hjälp av Illumina HiSeq 2000-systemet. Den fullständiga genomsekvensen av BL21 framställdes både genom utarbetad referenskartläggning och de novo-sammanställning av 101-nt Illumina-avläsningar (47 123 524 parvisa avläsningar från ett ~150-bp-bibliotek) med hjälp av CLC Genomics Workbench version 6,5.1 (CLC bio).
Vi hade förväntat oss att en modifierad BL21(DE3)-genomsekvens (CP001509.3) – från vilken profageregionen raderades, vilket lämnade kvar en kopia av lambda-anslutningsstället (attB) – skulle fungera som den bästa referenssekvensen. Täckningsanalysen från den första kartläggningen visade emellertid att attB i BL21 inte var tom utan upptagen av ett 12,1 kb långt λ*B-profag som i E. coli REL606 (3), vilket rapporterades vara ett gemensamt kännetecken bland B-linjen (5). Ett andra försök med referenskartläggning, där man använde en modifierad sekvens med en λ*B-profagsekvens, avslöjade en annan region med låg täckning mellan ybhC-genen och den vänstra gränsen för lambdafästplatsen, attL. Genom sekvensjämförelse identifierades den bäst matchande sekvensen från de novo sammansatta contigs och var 23 bp längre än motsvarande region från BL21(DE3). En uppdaterad referenssekvens utarbetades sedan genom att ersätta regionen med låg täckning och dess granne (~200 bp), och kartläggningen utfördes på nytt. En enhetlig lästäckning på hela den slutliga referenssekvensen bekräftades genom visuell undersökning, och ingen annan skillnad hittades genom kvalitetsbaserad SNV-/strukturvariationsdetektering eller genom brytpunktsanalys. Samling med hjälp av icke-mappade läsningar resulterade inte i några contigs som kan stödja förekomsten av BL21-specifika regioner. Annotering av genomet utfördes av tjänsten NCBI Prokaryotic Genome Automatic Annotation Pipeline (PGAAP).
Nukleotidsekvensanslutningsnummer.
Detta helgenomprojekt har deponerats hos DDBJ/EMBL/GenBank under accessionsnumret CP010816.