GENOMI KÖZLEMÉNY
A F. William Studier és Barbara A. Moffatt (1) által létrehozott BL21 és BL21(DE3) Escherichia coli törzsek rekombináns fehérjék előállítására használt gyakori laboratóriumi törzsek. A B-vonalban gyakran közös jellemzőnek tekintett lon és ompT proteázok hiánya vezette e törzsek fehérjeexpressziós gazdaszervezetként való kifejlesztését. Az E. coli BL21(DE3), a BL21 származéka, valószínűleg a rekombináns fehérjék magas szintű expressziójában a legszélesebb körben használt, és egy λ bakteriofágból származó DE3 profágot hordoz, amely a T7 RNS-polimeráz gént hordozza a lacUV5 promóter ellenőrzése alatt. Az E. coli BL21-et rutinszerűen használják nem-T7 expresszióra, és nemrégiben módosították plazmid DNS vakcina előállítására is, mivel a K-12 törzsekhez képest jobb teljesítményt nyújt a nagy sejtsűrűségű, etetett tételes kultúrákban (2).
Az E. coli BL21(DE3) genomszekvenciáját korábban intézetünkben meghatározták (3). Elvileg a BL21 genomszekvenciája azonos lenne a BL21(DE3) genomszekvenciájával, kivéve a DE3 profágot. Előfordulhatnak azonban állományonkénti eltérések, amelyeknek komoly következményei lehetnek a kísérletekre (4). Az E. coli BL21(DE3) genominformációját referenciaként használva, a BL21 teljes genomszekvenciáját kizárólag újgenerációs szekvenálással állítottuk elő, és bázisonként azonosítottuk a genomiális különbségeket.
Az E. coli BL21 törzset a TaKaRa Bio-tól vásároltuk (kódszám 9126, tételszám K142). A genomszekvenálást a Korea Research Institute of Bioscience and Biotechnology (KRIBB) Human Derived Material Centerben végezték Illumina HiSeq 2000 rendszerrel. A BL21 teljes genomszekvenciáját mind a kidolgozott referencia-térképezéssel, mind a 101 nt-os Illumina leolvasások de novo összeállításával (47 123 524 párosított végű leolvasás egy ~150 bp-os könyvtárból) állították elő a CLC Genomics Workbench 6.5-ös verziójának használatával.1 (CLC bio).
Arra számítottunk, hogy egy módosított BL21(DE3) genomszekvencia (CP001509.3) – amelyből a profág régiót töröltük, meghagyva a lambda csatolási hely (attB) egy példányát – szolgál majd a legjobb referenciaszekvenciaként. Az első térképezésből származó lefedettségi elemzés azonban azt mutatta, hogy a BL21 attB-je nem üres, hanem egy 12,1 kb hosszúságú λ*B-profág foglalja el, mint az E. coli REL606-ban (3), amely a B-vonal közös jellemzőjeként jelent meg (5). A referenciatérképezés második kísérlete, amely egy módosított, λ*B profág szekvenciával rendelkező szekvenciát használt, egy másik, alacsony lefedettségű régiót mutatott ki az ybhC gén és a lambda csatolási hely bal oldali határa, az attL között. Szekvencia-összehasonlítással a de novo összeállított kontigokból azonosítottuk a legjobban illeszkedő szekvenciát, amely 23 bp-mal hosszabb volt, mint a BL21(DE3) megfelelő régiója. Ezután egy frissített referenciaszekvenciát készítettünk az alacsony lefedettségű régió és a szomszédos régió (~200 bp) cseréjével, és újra elvégeztük a térképezést. A teljes végleges referenciaszekvencia egyenletes leolvasási lefedettségét vizuális vizsgálattal igazoltuk, és a minőségalapú SNV/szerkezeti variáció detektálással vagy töréspont-elemzéssel nem találtunk egyéb eltérést. A le nem térképezett leolvasások felhasználásával végzett összeszerelés nem eredményezett olyan kontigokat, amelyek alátámasztották volna a BL21-specifikus régiók jelenlétét. A genom annotációját az NCBI Prokaryotic Genome Automatic Annotation Pipeline (PGAAP) szolgáltatásával végeztük.
Nukleotid szekvencia hozzáférési szám.
Ezt a teljes genom shotgun projektet a DDBJ/EMBL/GenBankban a CP010816 csatlakozási szám alatt helyezték letétbe.