董 輝,李軒豪,常靜林,賀 欣,侯沁蓮,龍 偉
中國(guó)醫(yī)學(xué)科學(xué)院 北京協(xié)和醫(yī)學(xué)院 放射醫(yī)學(xué)研究所天津市放射醫(yī)學(xué)與分子核醫(yī)學(xué)重點(diǎn)實(shí)驗(yàn)室,天津 300192
高效聚γ谷氨酸(poly-γ-glutamate,γ-PGA)是一種陰離子、可生物降解的水溶性生物聚合物,可以食用且對(duì)人體和環(huán)境無(wú)害[1]。這種生物聚合物具有多種功能,已廣泛應(yīng)用于食品、化妝品、藥品和水處理等工業(yè)領(lǐng)域。因此,從工業(yè)觀點(diǎn)來(lái)看,其潛在的應(yīng)用已被研究[2- 3]。由于D-和/或L-構(gòu)型的谷氨酸鹽通過(guò)γ-酰胺鍵聚合,在每一個(gè)谷氨酸單元(γ-L-PGA和γ-D-PGA)中存在手性中心旋光性聚合物,不同的聚合物有不同的用途。那么,為了讓這個(gè)有前途的生物聚合物用于實(shí)際的工業(yè)生產(chǎn)中,兩個(gè)主要問(wèn)題仍有待解決:如何以更適中的價(jià)格大量生產(chǎn),以及如何控制其結(jié)構(gòu)的多樣性[2]。
γ-PGA首先在20世紀(jì)初被描述于炭疽菌群(Bacillusanthracis),這種菌株也生產(chǎn)γ-D-PGA。然而,由于其生物毒性,不能直接使用這種微生物。有研究證明,一些細(xì)菌(大部分來(lái)自芽孢桿菌屬)可分泌γ-PGA作為發(fā)酵的產(chǎn)物到培養(yǎng)基中[4]。這些細(xì)菌中,研究最深入的是枯草芽孢桿菌(B.subtilis)與地衣芽孢桿菌(B.licheniformis)[5- 6]。與地衣芽孢桿菌相比,枯草芽孢桿菌則顯示出更高的生產(chǎn)力,因此這種菌株的應(yīng)用越來(lái)越受到人們的重視[7]??莶菅挎邨U菌是一種能夠產(chǎn)生內(nèi)生孢子、需氧的革蘭氏陽(yáng)性菌。γ-PGA由枯草芽孢桿菌(納豆)所產(chǎn)生,在日本被用作發(fā)酵大豆食品納豆的起動(dòng)器,具有悠久的歷史[8]。最近,從土壤中分離出的枯草芽孢桿菌菌株被命名為枯草芽孢桿菌KH2,已保藏于中國(guó)普通微生物培養(yǎng)收集中心(CGMCC № 12426)。研究顯示,在含有4%L-谷氨酸的培養(yǎng)基中培養(yǎng)該菌株48 h后,γ-PGA產(chǎn)率達(dá)到最大41 g/L。在所用條件下,γ-谷氨酸含量維持在84%~86%,避免了不規(guī)則的立體化學(xué)問(wèn)題[2]。本研究描述了枯草芽孢桿菌CGMCC 12426的微生物特征,對(duì)其進(jìn)行了全基因組測(cè)序和注釋,以期為將來(lái)該菌株的代謝和調(diào)控機(jī)制的深入研究提供實(shí)驗(yàn)基礎(chǔ)。
分類和特點(diǎn)枯草芽孢桿菌菌株KH2(CGMCC 12426)是革蘭氏陽(yáng)性需氧菌,能夠產(chǎn)生內(nèi)生孢子,為桿狀芽孢桿菌,最適生長(zhǎng)條件為pH為7.0、30℃(表1、圖1)。在LB瓊脂培養(yǎng)基上生長(zhǎng)時(shí),菌落呈乳白色,表面光滑。能產(chǎn)生過(guò)氧化氫酶。菌株KH2能夠利用D-葡萄糖、麥芽糖、乳糖和蔗糖作為唯一碳源。基于16S rRNA基因的BLAST結(jié)果,菌株KH2與枯草芽孢桿菌物種的相似度最高[9]。菌株KH2和枯草芽孢桿菌DSM 10T之間的16S rRNA基因序列的相似性為100%。在默認(rèn)設(shè)置下,從菌株KH2的基因組序列中得到16S rRNA基因的完整序列,從NCBI數(shù)據(jù)庫(kù)中調(diào)取芽孢桿菌屬的代表性成員序列[10- 15],使用鄰接連接法構(gòu)建系統(tǒng)發(fā)育樹,分析菌株KH2和芽孢桿菌屬其他成員之間的系統(tǒng)進(jìn)化關(guān)系(圖2)。
基因組測(cè)序選擇枯草芽孢桿菌CGMCC 12426用于測(cè)序,因?yàn)樗苌a(chǎn)具有規(guī)則立體化學(xué)的γ-PGA。基因組序列提交至Genbank公用數(shù)據(jù)庫(kù),存儲(chǔ)號(hào)為CP018184-CP018185,基因組信息存放在Gp0203613的Genomes on Line Database中[18]?;蚪M測(cè)序和注釋由上海中國(guó)人類基因組中心進(jìn)行。該項(xiàng)目的總結(jié)如表2所示。
菌株生長(zhǎng)條件和基因組DNA制備:將枯草芽孢桿菌CGMCC 12426接種在50 ml LB培養(yǎng)基中,并在轉(zhuǎn)度為200 r/min的搖床中30℃培養(yǎng)12 h。使用QIAamp DNA Mini Kit(Qiagen,CA)提取枯草芽孢桿菌CGMCC 12426的基因組DNA。在Agilent 2100生物分析儀(Agilent,美國(guó))上評(píng)估基因組DNA的數(shù)量和質(zhì)量。將基因組DNA儲(chǔ)存在-20℃冷凍器中。
基因組測(cè)序和組裝:使用基因組DNA構(gòu)建10 kb插入片段SMRT-bell文庫(kù),然后在Pacific Biosciences(PacBio)RS Ⅱ測(cè)序儀(Pacific Biosciences,CA)的單分子實(shí)時(shí)(SMRT)DNA測(cè)序平臺(tái)上測(cè)序[19]。在1個(gè)3 h電影次數(shù)的SMRT細(xì)胞上共計(jì)150 292次聚合酶讀數(shù),最終獲得總共1 386 478 854個(gè)核苷酸堿基。經(jīng)過(guò)濾除去低精度值小于0.8的讀數(shù)后,以0.866讀數(shù)質(zhì)量獲得1 256 996 185讀數(shù)堿基。所有過(guò)濾的序列在SMRT分析軟件2.3.0版(Pacific Biosciences)中使用RS等級(jí)基因組裝配過(guò)程(HGAP)裝配協(xié)議2.0進(jìn)行重新組裝[20]。
基因組注釋:使用NCBI原核基因組注釋管道(prokaryotic genome annotation pipeline,PGAP)進(jìn)行注釋。用KEGG數(shù)據(jù)庫(kù)于重建代謝途徑[21]。通過(guò)RNAmmer和tRNAscan-SE程序預(yù)測(cè)核糖體RNA和轉(zhuǎn)移RNA[22- 23]。
菌株CGMCC 12426完整基因組序列由長(zhǎng)度為74 165 bp的質(zhì)粒和長(zhǎng)度為4 138 265 bp的環(huán)狀染色體組成。基因組G + C含量為43.4 mol%。在CGMCC 12426基因組中預(yù)測(cè)了4581個(gè)ORF,30組rRNA(5S rRNA、16S rRNA和23S rRNA)操縱子和87個(gè)tRNA(表3)。在總共4581個(gè)預(yù)測(cè)ORFs中,3288個(gè)是功能單位,其中1173個(gè)被注釋為假設(shè)蛋白質(zhì)。當(dāng)根據(jù)COG類別分析生物學(xué)作用時(shí),氨基酸轉(zhuǎn)運(yùn)和代謝蛋白占所有功能分配蛋白質(zhì)的最大數(shù)量(307),其次是轉(zhuǎn)錄蛋白(304)和碳水化合物轉(zhuǎn)運(yùn)和代謝蛋白質(zhì)(286)。基因在COGs功能分類中的分布見表4。該菌株包含1個(gè)質(zhì)粒,該質(zhì)粒的重要基因及其功能注解見表5。
表1 根據(jù)MIGS建議的枯草芽孢桿菌CGMCC 12426的分類和一般特征[16]Table 1 Classification and general characteristics of Bacillus subtilis CGMCC 12426 suggested by MIGS
證據(jù)代碼-從直接分析中推斷出IDA,TAS可追溯作者陳述(即文獻(xiàn)中存在直接報(bào)告),NAS不可追溯作者陳述(即,不直接觀察活的、孤立的樣本,但基于該物種的普遍特性,或軼事證據(jù)),這些證據(jù)代碼來(lái)自基因本體項(xiàng)目
Evidence codes-IDA inferred from direct assay;TAS,traceable author statement(i.e.,a direct report exists in the literature);NAS,non-traceable author statement(i.e.,not directly observed for the living,isolated sample but based on a generally accepted property for the species or anecdotal evidence),these evidence codes come from the Gene Ontology project[17]
圖1菌株KH2的透射電子顯微鏡
Fig1Transmission electron microscopy of strain KH2
這些菌株及其16S rDNA序列的GenBank登錄號(hào)分別為:枯草芽孢桿菌KH2(CP018184)、枯草芽孢桿菌PPL-SC9(KM226924)、淀粉樣芽孢桿菌BCRC 11601(NR_116022)、秈型芽孢桿菌SD/3(AJ583158)、偶氮共振菌NBRC 15712(AB363732)、甲烷芽孢桿菌NCIMB 13113(AB112727)、硫雜環(huán)桿菌BMP- 1(DQ371431)、硒砷芽孢桿菌SF- 1(AB262082)、柯氏芽孢桿菌DSM 6307(X76437)、蠟樣芽孢桿菌ATCC 14579(NR_074540)、砷桿菌cona/3(AJ606700)、結(jié)核分枝桿菌MLTeJB(FJ825145)、砷黃桿菌E1H(AF064705)和麻黃芽孢桿菌JMM- 4(AY32601)
The strains and their corresponding GenBank accession numbers for 16S rDNA sequences areBacillussubtilisstrain KH2(CP018184),BacillussubtilisPPL-SC9(KM226924),BacillusamyloliquefaciensBCRC 11601(NR_116022),BacillusindicusSd/3(AJ583158),BacillusazotoformansNBRC 15712(AB363732),BacillusmethanolicusNCIMB 13113(AB112727),BacillusthioparansBMP- 1(DQ371431),BacillusselenatarsenatisSF- 1(AB262082),BacilluscohniiDSM 6307(X76437),BacilluscereusATCC 14579(NR_074540),Bacillusarsenicuscon a/3(AJ606700),BacillusbeveridgeiMLTeJB(FJ825145),BacillusarseniciselenatisE1H(AF064705),andBacillusmacyaeJMM- 4(AY032601)
圖2基于16S rRNA基因序列的MEGA 5構(gòu)建的鄰接系統(tǒng)發(fā)生樹
Fig2Adjacent phylogenetic trees constructed based on the 16S rRNA gene sequence(by MEGA 5 phylogeny software)
表2 基因組測(cè)序項(xiàng)目信息Table 2 Genome sequencing project information
表3 枯草芽孢桿菌菌株CGMCC 12426的基因組統(tǒng)計(jì)Table 3 Genome statistics of Bacillus subtilis strain CGMCC 12426
NA:無(wú)法使用
NA:not available
表4 與一般COG功能類別相關(guān)的基因數(shù)量Table 4 The number of genes associated with general COG function categories
總數(shù)是根據(jù)注釋基因組中蛋白質(zhì)編碼基因的總數(shù)計(jì)算
The total is based on the total number of protein coding genes in the annotated genome
表5 枯草芽孢桿菌菌株CGMCC 12426質(zhì)粒的重要相關(guān)基因及其功能Table 5 Important genes and functions of Bacillus subtilis strain CGMCC 12426
枯草芽孢桿菌CGMCC 12426的基因組測(cè)序進(jìn)一步闡明了該菌株的遺傳背景和基礎(chǔ),為研究乙醇、有機(jī)酸、氨基酸等形成的代謝和調(diào)控機(jī)制提供了重要理論依據(jù)。與枯草芽孢桿菌亞種枯草芽孢桿菌菌株168的擴(kuò)展研究模型菌株相比,枯草芽孢桿菌菌株KH2的遺傳操作效率低得多?;虮葘?duì)分析發(fā)現(xiàn),KH2中存在1個(gè)限制性內(nèi)切酶,WP_014480489.1 type I restriction-modification system deoxyribonuclease,該酶的存在很可能是KH2這個(gè)菌株遺傳操作效率比枯草芽孢桿菌菌株168低很多的原因所在。對(duì)這兩種菌株的基因組特征的比較分析結(jié)果發(fā)現(xiàn),兩種菌株間只有較小的差異,相似度較高(表6)。該結(jié)果有助于鑒定合適的靶基因,可通過(guò)系統(tǒng)代謝工程幫助開發(fā)具有更高濃度、產(chǎn)量且生產(chǎn)率優(yōu)良的微生物細(xì)胞工廠。
總之,枯草芽孢桿菌CGMCC 12426基因組測(cè)序的完成,為其菌株代謝工程改造及調(diào)控機(jī)制研究提供了大量的生物學(xué)信息。該基因組測(cè)序?yàn)檫M(jìn)一步闡明該菌株的遺傳背景提供了基礎(chǔ),也為研究代謝和調(diào)控機(jī)制提供了重要理論依據(jù)。使得以適中的價(jià)格大量生產(chǎn)γ-PGA,以及控制其結(jié)構(gòu)的多樣性成為了可能,隨著枯草芽孢桿菌功能基因組學(xué)研究的不斷深入,將會(huì)獲得更多優(yōu)良性狀的基因工程菌株,推進(jìn)生產(chǎn)γ-PGA的產(chǎn)業(yè)化進(jìn)程。
表6 菌株KH2和菌株168之間的基因組特征的比較Table 6 Comparison of genomic features between Strain KH2 and Strain 168