舒培軍,曾鴻俏,張力雄,劉明明,方再光
(海南大學(xué) 熱帶生物資源教育部重點(diǎn)實(shí)驗(yàn)室,海南省熱帶水生生物技術(shù)重點(diǎn)實(shí)驗(yàn)室,海南 海口570228)
瓊膠降解菌FG12的全基因組測序
舒培軍,曾鴻俏,張力雄,劉明明,方再光
(海南大學(xué) 熱帶生物資源教育部重點(diǎn)實(shí)驗(yàn)室,海南省熱帶水生生物技術(shù)重點(diǎn)實(shí)驗(yàn)室,海南 ???70228)
為了獲得瓊膠寡糖的高產(chǎn)瓊膠降解菌,本研究通過Illumina Hiseq2000平臺(tái)測序,使用SOAPdenovo 2.04軟件(拼接組裝),Glimmer 3.02預(yù)測基因的開放性閱讀框,RNAmmer 1.2預(yù)測rRNA,tRNAscan-SE 1.23預(yù)測tRNA以及COG、CO和KEGG等來預(yù)測FG12的基因功能,并對其進(jìn)行了全基因組測序,結(jié)果表明:FG12的基因組大小為4.11Mb,GC含量為37.76%;共有4 441個(gè)開放性閱讀框,其平均長度為780 bp,有76個(gè)tRNA和5個(gè)rRNA;有與瓊膠寡糖代謝相關(guān)的基因和抗生素的代謝途徑,因此得出,瓊膠降解菌FG12有改造成為高效工程菌的潛力.
瓊膠降解菌; 瓊膠寡糖; 全基因組測序; 基因功能
瓊膠降解菌可產(chǎn)生瓊膠酶,降解瓊脂并生成瓊膠寡糖.根據(jù)瓊膠酶作用方式的不同,可將其分為α-瓊膠酶和β-瓊膠酶[1].α-瓊膠酶可產(chǎn)生以3,6-內(nèi)醚-α-L半乳糖為還原性末端的瓊寡糖(agaro-oligosaccharides);β-瓊膠酶則產(chǎn)生以β-D-半乳糖為還原性末端的新瓊寡糖(neoagaro-oligosaccharades)[2].瓊膠酶降解所產(chǎn)生的瓊膠寡糖具有抗炎、抗病毒、抗氧化、增強(qiáng)免疫等作用[3],其在食品、藥物及化妝品等行業(yè)具有非常好的應(yīng)用前景,因此已經(jīng)成為國內(nèi)外研究的熱點(diǎn).但是,由于缺乏性狀穩(wěn)定且產(chǎn)酶能力強(qiáng)的瓊膠降解菌,因此瓊膠寡糖的應(yīng)用受到了很大的限制.
全基因組De novo測序,也稱為基因組從頭測序,其先是在沒有任何參照序列的情況下進(jìn)行基因組測序,然后再利用生物信息學(xué)方面的技術(shù)拼接和組裝已經(jīng)獲得的序列,進(jìn)而獲得其基因圖譜[4].全基因組測序?qū)θ媪私庖粋€(gè)物種的分子進(jìn)化、基因組成和基因調(diào)控等有著非常重要的意義.隨著基因組學(xué)和DNA測序技術(shù)的迅速發(fā)展,微生物的全基因組測序已經(jīng)變得越來越便捷和高效.目前,已有類芽孢桿菌[6]、大麗輪枝菌[7]、多殺性巴氏桿菌[8]、鱖魚彈狀病毒[9]等微生物得到測序.盡管如此,然而關(guān)于熱帶瓊膠降解菌全基因組測序的相關(guān)研究在國內(nèi)仍尚未見報(bào)道.
為此,本研究通過全基因組測序,分析了高效瓊膠降解菌Vibriosp.FG12[10]的基因組分,并通過與COG、CO和KEGG等數(shù)據(jù)庫的比對預(yù)測了其基因功能,旨在通過基因改造來獲得瓊膠寡糖的高產(chǎn)菌株并為其提供理論依據(jù).
1.1 菌株 以海南島熱帶海洋環(huán)境分離和鑒定的瓊膠降解菌Vibriosp.FG12為實(shí)驗(yàn)對象.
1.2 細(xì)菌基因組DNA的提取 待細(xì)菌達(dá)到純培養(yǎng)后,挑單菌落進(jìn)行液體培養(yǎng),并在28 ℃,150 r·min-1搖床培養(yǎng)16 h后,按照細(xì)菌基因組DNA提取試劑盒的說明進(jìn)行提取,同時(shí)將所提取的DNA用瓊脂糖凝膠進(jìn)行電泳檢測.
1.3 全基因組測序 在所提取的基因組DNA經(jīng)電泳檢測后,對其DNA含量進(jìn)行估計(jì),并在其濃度達(dá)到深圳華大基因研究院所送樣品的標(biāo)準(zhǔn)后,采用干冰保存并寄送至華大基因研究院進(jìn)行全基因組測序.
1.3.1 序列組裝 通過Illumina Hiseq2000平臺(tái)測序,使用SOAPdenovo 2.04短序列組裝軟件進(jìn)行組裝.基于reads之間的overlap區(qū),通過reads高通量測序平臺(tái)產(chǎn)生的序列,拼接并獲得Contigs,然后構(gòu)建454 Paired-nd庫以確定來自同一轉(zhuǎn)錄本的不同Contig的先后順序,并利用先后順序已知的Contigs來共同組成Scaffold.
1.3.2 基因預(yù)測 將Glimmer3.02預(yù)測基因ORFs,RNAmmer 1.2(http://www.cbs.dtu.dk/services/RNAmmer/)預(yù)測rRNA,tRNAscan-SE 1.23(http://gtrnadb.ucsc.edu/)預(yù)測tRNA與Rfam10.1數(shù)據(jù)庫進(jìn)行比對,尋找sRNA, TRF(Tandem Repeat Finder)4.04(http://rfam.sanger.ac.uk/),預(yù)測串聯(lián)重復(fù)序列,并根據(jù)重復(fù)單元長度及數(shù)目篩選出其中的微衛(wèi)星以及小衛(wèi)星序列.
1.3.3 基因組功能注釋 通過blastx將基因序列與NR數(shù)據(jù)庫、京都基因和基因組百科全書(Kyoto Encyclopedia of Genes and Genomes,KEGG)、SwissProt、蛋白質(zhì)直系同源基因簇(Cluster of Orthologous Groups of Proteins,COG)等進(jìn)行比對,得到和給定序列具有最高序列相似性的蛋白,從而得到該基因的蛋白功能注釋信息.根據(jù)NR的注釋信息,通過預(yù)測得到基因的GO注釋信息,再通過網(wǎng)絡(luò)基因本體論注解繪圖工具(Web Gene Ontology Annotation Plot,WEGO)對其進(jìn)行詳細(xì)的功能分類;再根據(jù)COG數(shù)據(jù)庫的注釋信息將所預(yù)測的功能分類;最后根據(jù)KEGG注釋信息進(jìn)一步得到基因的代謝途徑.
2.1 基因組裝結(jié)果的分析 基于軟件SOAPdenovo 2.04的測序數(shù)據(jù),組裝并得到FG12基因組,大小為4.11Mb,GC含量為37.76%,共135個(gè)Scaffolds,299個(gè)Contigs(見表1).將所有拼接得到的Contigs按照從大到小進(jìn)行排序,其累加片段的長度達(dá)到所有Contigs總長度的50%時(shí),其所對應(yīng)的Contig長度為N50值,它是評價(jià)序列組裝好壞的一個(gè)指標(biāo).一般來說,N50越大,說明組裝得越好,大片段的比例則越高[11].
表1 FG12組裝結(jié)果
2.2 基因預(yù)測結(jié)果的分析 通過基因預(yù)測、重復(fù)序列預(yù)測、非編碼RNA預(yù)測等方法來獲取測序菌株基因組的組成情況(見表2).通過對基因組組分分析后發(fā)現(xiàn),F(xiàn)G12的基因組含有4 441個(gè)基因,總長度為3 465 972 bp,平均長度780 bp,占基因組全長的84.35%;含有72個(gè)串聯(lián)重復(fù)序列,總長為5 993bp,占基因組全長的0.145 9%;此外,還含有42個(gè)小衛(wèi)星序列,10個(gè)微衛(wèi)星序列以及76個(gè)tRNA和5個(gè)rRNA.
2.3 功能注釋結(jié)果的分析 基因功能注釋主要是通過與相應(yīng)的蛋白質(zhì)數(shù)據(jù)庫進(jìn)行比對來預(yù)測其可能的基因功能,然后對其功能進(jìn)行分類和統(tǒng)計(jì).
2.3.1 COG功能分類 由COG蛋白功能注釋信息(見圖1)可知:FG12最多的功能歸類為通用功能(General Function Prediction Only),占12.85%;氨基酸轉(zhuǎn)移與代謝(Amino Acid Transport And Metabolism)占10.16%;糖類的運(yùn)輸與代謝(Carbohydrate Transport And Metabolism)占6.68%;能量產(chǎn)生與轉(zhuǎn)化(Energy Production And Conversion)占5.49%;信號(hào)轉(zhuǎn)導(dǎo)機(jī)制(Signal Transduction Mechanisms)占3.81%.
2.3.2 GO功能注釋 GO功能分類主要包括生物過程、細(xì)胞組分和分子功能三大類.GO功能分類圖顯示(見圖2):細(xì)胞過程(Cellular Process)和代謝過程(Metabolic Process)在生物過程中十分活躍;細(xì)胞(Cell)和細(xì)胞部位(Cell Part)在細(xì)胞中占主導(dǎo)地位;結(jié)合(Binding)和催化活力(Catalytic Activity)在分子功能中起重要作用.
在FG12中,與生物過程(Biological Process)有關(guān)的基因有4 399條,與細(xì)胞組分(Cellular Component)有關(guān)的基因有1 951條,對應(yīng)到分子功能(Molecular Function)的基因有3 085條.
2.3.3 KEGG代謝通路 根據(jù)KEGG的注釋信息可知(見圖3):參與膜運(yùn)輸(Membrane Transport)代謝途徑的基因最多,其次為糖代謝(Carbohydrate Metabolism),再次為氨基酸代謝(Amino Acid Metabolism).FG12中參與糖代謝(Carbohydrate Metabolism)的基因有385個(gè);參與氨基酸代謝(Amino Acid Metabolism)的基因有345個(gè);參與酶家族(Enzyme Families)代謝的基因有96個(gè).
代謝途徑的分析表明:基因組含糖類代謝、能量代謝、脂類代謝、核苷酸和氨基酸代謝、次生代謝產(chǎn)物的合成代謝等基因.糖代謝途徑中都包含了糖酵解途徑、磷酸戊糖途徑,此外還發(fā)現(xiàn),F(xiàn)G12可以利用果糖、甘露糖、半乳糖、C5分支的二元酸等.在次生代謝產(chǎn)物的合成代謝途徑中,F(xiàn)G12能合成頭孢菌素、新生霉素、鏈霉素、丁苷菌素和新霉素.根據(jù)代謝途徑的酶和基因的異同,圖3用不同顏色來表示選中的代謝途徑及酶的差異.
利用全基因組測序技術(shù)對FG12基因組進(jìn)行研究,可預(yù)測其基因組的組分,注釋相應(yīng)的功能基因,并探究其代謝途徑.
FG12基因組大小為4.11 Mb,G+C含量為37.76%,共135個(gè)Scaffolds,299個(gè)Contigs,42個(gè)小衛(wèi)星序列,10個(gè)微衛(wèi)星序列,76個(gè)tRNA,5個(gè)rRNA.與嗜瓊膠卵鏈菌(CatenovulumagarivoransYM01T)G+C的含量(為44.8%)[12]和白色噬瓊膠菌(AgarivoransalbusMKT106)的G+C含量(為48%~50%)[13]相比,F(xiàn)G12的G+C含量偏低.
COG注釋信息中,F(xiàn)G12含有21種COG功能類型,主要包括細(xì)胞代謝、細(xì)胞信號(hào)轉(zhuǎn)導(dǎo)等.
`
圖2 FG12的GO功能注釋
GO注釋分別將FG12基因組注釋到3大類39個(gè)COG功能亞類上, KEGG分析能把其定位到146個(gè)代謝通路中,包括物質(zhì)代謝、次生代謝產(chǎn)物的生物合成等,其中參與糖代謝的基因?yàn)?85條;參與氨基酸代謝的基因?yàn)?45條.
目前,對于瓊膠降解菌的全基因組測序尚無相關(guān)報(bào)道.高效海洋瓊膠降解菌FG12的全基因組序列的測序?qū)?huì)為后續(xù)功能基因組學(xué)的研究提供理論依據(jù),研究瓊膠降解菌活性物質(zhì)產(chǎn)生的調(diào)控機(jī)制將有助于海洋高效瓊膠降解菌在工業(yè)生產(chǎn)的開發(fā)和應(yīng)用.全基因組測序技術(shù)只是基因組學(xué)研究的起點(diǎn),它所能解釋的生物學(xué)現(xiàn)象和機(jī)制不多,在獲得了細(xì)菌的基因組信息的基礎(chǔ)上,如何去理解和消化乃至于運(yùn)用龐大的信息依舊任重道遠(yuǎn).
[1] Duckworth M, Turvey J R. The specificity of an agarase from aCytophagaspecies[J]. Biochemical Journal, 1969, 113(4): 693-696.
[2] Arnott S, Fulmer A, Seott W E, et al. The agarose double helix and its function in agarose gel structure[J]. Journal of Molecular Biology, 1974, 90(2): 269-284.
[3] Wang J, Ma J F, Miao T T, et al. Cloning and expression ofAgarivoransalbusQM38β-agarase gene agaDO2[J]. Marine Sciences, 2010(8):6-10.
[4] 聶小軍. 基于高通量測序技術(shù)的小麥和紫莖澤蘭基因組學(xué)初步研究[D]. 西安:西北農(nóng)林科技大學(xué), 2013.
[5] 劉蓉蓉. 高等植物基因組測序回顧與展望[J]. 生物技術(shù)通報(bào), 2011(5): 10-14.
[6] 夏天.Paenibacillussp.Aloe-11全基因組測序及比較基因組學(xué)研究[D]. 重慶:西南大學(xué),2012.
[7] 陳相永. 大麗輪枝菌不同毒力菌株全基因組測序及重測序分析[D].北京:中國農(nóng)業(yè)科學(xué)院,2012.
[8] 劉文靜. 多殺性巴氏桿菌全基因組測序與比較基因組學(xué)分析[D]. 武漢:華中農(nóng)業(yè)大學(xué), 2012.
[9] 陶建軍. 鱖魚彈狀病毒的分離、鑒定及基因組測序[D]. 北京:中國科學(xué)院水生生物研究所,2006.
[10] 尹群健,陳瀟驍,楊宏勝,等. 瓊膠降解菌產(chǎn)酶條件優(yōu)化、酶學(xué)性質(zhì)和糖代謝途徑[J]. 廣東農(nóng)業(yè)科學(xué),2014(9):117-122.
[11] 黃勇. 基于高通量測序的微生物基因組學(xué)研究[D]. 北京:軍事醫(yī)學(xué)科學(xué)院, 2013.
[12] 嚴(yán)書林. 3株新菌的分類鑒定及新型耐熱瓊膠酶基因的克隆表達(dá)[D].青島:中國海洋大學(xué), 2011.
[13] Midori K, Akira Y.Agarivoransalbusgen. nov. sp. nov. aγ-proteobacterium isolated from marine animals[J]. International journal of systematic and evolutionary microbiology, 2004, 54: 693-697.
Whole Genome Sequencing of Agar-degrading Strain FG12
Shu Peijun, Zeng Hongqiao, Zhang Lixiong, Liu Mingming, Fang Zaiguang
(Key Laboratory of Tropical Biological Resources of Ministry of Education, Key Laboratory of Biotechnology of Tropical Aquatic Organisms of Hainan Province, Hainan University, Haikou 570228, China)
To obtain agar-degrading strain high-producing agarooligosaccharide, the genome of FG12 was sequenced on the Illumina Hiseq2000 sequencing platform. SOAP denovo 2.04 was used for assembling. Glimmer 3.02 was used to predict open reading frame of the gene. RNAmmer 1.2 was used to predict rRNA. tRNAscan-SE 1.23 was used to predict tRNA. Gene function was annotated by COG, CO, and KEGG databases. The results showed that the genome size of FG12 was 4.11 Mb with the G+C content of 37.76%, containing 4,441 open reading frames (ORFs), the average length of which was 780 bp, and which included 76 tRNA and 5 rRNA. Agar oligosaccharide metabolism-related genes and metabolic pathways of antibiotics were observed. These data suggested that Agar-degrading bacteria FG12 has the potential to be transformed into efficient engineering bacteria.
agar-degrading strain; agarooligosaccharide; whole genome sequencing; gene function
2017-02-27
海南大學(xué)青年基金(qnjj1205),校縣合作項(xiàng)目(02005001)
舒培軍(1988-),男,貴州興義人,海南大學(xué)海洋學(xué)院2012級(jí)碩士研究生,E-mail: xiubinsharp@126.com
方再光(1975-),男,湖南新化人,副教授,研究方向:海洋生物技術(shù),E-mail: guangyan0508@163.com
1004-1729(2017)02-0140-05
Q523+.8
A DOl:10.15886/j.cnki.hdxbzkb.2017.0025