GENOME ANNOUNCEMENT
Escherichia coli BL21 i BL21(DE3), stworzone przez F. Williama Studiera i Barbarę A. Moffatt (1), są powszechnie stosowanymi szczepami laboratoryjnymi do produkcji białek rekombinowanych. Brak proteaz lon i ompT, często uważanych za wspólne cechy linii B, przyczynił się do rozwoju tych szczepów jako gospodarzy do ekspresji białek. E. coli BL21(DE3), pochodna BL21, jest prawdopodobnie najszerzej stosowana w wysokopoziomowej ekspresji białek rekombinowanych, a jej nośnikiem jest profag DE3 pochodzący z bakteriofaga λ, który przenosi gen polimerazy T7 RNA pod kontrolą promotora lacUV5. E. coli BL21 jest rutynowo używana do ekspresji nie-T7, a ostatnio została również zmodyfikowana do produkcji szczepionki z plazmidowym DNA, ze względu na jej lepszą wydajność w hodowlach wsadowych o wysokiej gęstości komórek w porównaniu do szczepów K-12 (2).
Sekwencja genomu E. coli BL21(DE3) została wcześniej określona przez nasz instytut (3). W zasadzie, sekwencja genomu BL21 byłaby identyczna z sekwencją BL21(DE3), z wyjątkiem profaga DE3. Jednakże, mogą wystąpić różnice między stadami, które mogą mieć poważne konsekwencje dla eksperymentów (4). Mając informacje o genomie E. coli BL21(DE3) jako odniesienie, skonstruowano pełną sekwencję genomu BL21 używając jedynie sekwencjonowania następnej generacji i zidentyfikowano różnice genomowe baza po bazie.
Szczep E. coli BL21 został zakupiony od TaKaRa Bio (numer kodu 9126, numer partii K142). Sekwencjonowanie genomu przeprowadzono w Human Derived Material Center, Korea Research Institute of Bioscience and Biotechnology (KRIBB), przy użyciu systemu Illumina HiSeq 2000. Kompletną sekwencję genomu BL21 uzyskano zarówno poprzez opracowane mapowanie referencyjne, jak i montaż de novo 101-nt odczytów Illumina (47 123 524 sparowanych odczytów z biblioteki ~150-bp) przy użyciu CLC Genomics Workbench w wersji 6.5.1 (CLC bio).
Oczekiwaliśmy, że zmodyfikowana sekwencja genomu BL21(DE3) (CP001509.3)- z której usunięto region profagów, pozostawiając jedną kopię miejsca przyłączenia lambda (attB)- będzie służyć jako najlepsza sekwencja referencyjna. Jednakże, analiza pokrycia z pierwszego mapowania wykazała, że attB BL21 nie było puste, ale zajęte przez 12,1-kb długości λ*B profaga, jak u E. coli REL606 (3), co było zgłaszane jako wspólna cecha wśród linii B (5). Druga próba mapowania referencyjnego, z użyciem zmodyfikowanej sekwencji posiadającej sekwencję profaga λ*B, ujawniła inny region o niskim pokryciu pomiędzy genem ybhC a lewą granicą miejsca przyłączenia lambda, attL. Poprzez porównanie sekwencji, najlepiej pasująca sekwencja została zidentyfikowana z kontigów zmontowanych de novo i była o 23 bp dłuższa niż odpowiadający jej region z BL21(DE3). Następnie przygotowano zaktualizowaną sekwencję referencyjną poprzez zastąpienie regionu o niskim pokryciu i jego sąsiada (~200 bp) i ponownie przeprowadzono mapowanie. Jednolite pokrycie odczytów na całej końcowej sekwencji referencyjnej zostało potwierdzone wizualnie, a żadna inna różnica nie została znaleziona przez jakościową detekcję SNV/zmian strukturalnych lub przez analizę punktów przerwania. Asocjacja z użyciem niezmapowanych odczytów nie doprowadziła do powstania kontigów, które mogłyby potwierdzić obecność regionów specyficznych dla BL21. Anotacja genomu została przeprowadzona przez usługę NCBI Prokaryotic Genome Automatic Annotation Pipeline (PGAAP).
Nucleotide sequence accession number.
Ten projekt whole-genome shotgun został zdeponowany w DDBJ/EMBL/GenBank pod numerem akcesyjnym CP010816.
.