李向陽何蘭
四氫嘧啶基因簇在假單胞菌基因組中的分布研究
李向陽1,2,何蘭1
(1.凱里學院 大健康學院,貴州 黔東南苗族侗族自治州 556011;2.復旦大學 環(huán)境科學與工程系,上海 200433)
四氫嘧啶(Ectoine)是由細菌產(chǎn)生的一種次級代謝產(chǎn)物,賦予細菌抵御高滲透壓環(huán)境的一種相容性溶質(zhì)。研究顯示許多細菌具有四氫嘧啶基因簇(ectABCD-ask),然而關(guān)于該基因簇在假單胞菌屬(Pseudomonas)中的分布還沒有系統(tǒng)報道。鑒于此,以公共數(shù)據(jù)庫中已測序的9 548株假單胞菌屬菌株全基因組序列為數(shù)據(jù),采用深度生物信息學分析方法探究假單胞菌中的四氫嘧啶基因簇分布及其組成共線性特征。結(jié)果顯示165株假單胞菌攜帶有四氫嘧啶基因簇,占假單胞菌株總數(shù)的1.78%,歸屬于32個不同的種,超過一半的菌株屬于施氏假單胞菌(P.stutzeri);同一種內(nèi)菌株間,ectABCD-ask及其側(cè)翼基因高度保守,共線性水平程度高。系統(tǒng)地揭示了假單胞菌基因組中四氫嘧啶基因簇分布規(guī)律,將為開展生物合成四氫嘧啶提供重要菌種資源信息。
假單胞菌;基因組;四氫嘧啶;四氫嘧啶合成基因簇
四氫嘧啶(1,4,5,6-四氫-2-甲基-4-嘧啶羧酸)是由某些嗜鹽和耐鹽微生物生物合成的相容性溶質(zhì),能夠賦予細菌抵御胞外高滲透壓環(huán)境壓力[1]。由于這些相容性溶質(zhì)對蛋白質(zhì)、細胞膜、核酸,甚至整個細胞都具有良好的穩(wěn)定性能,因此在皮膚護理、食品加工、農(nóng)業(yè)以及生物技術(shù)等領(lǐng)域具有廣泛應用價值[1-2]。
假單胞菌(Pseudomonas)是一類革蘭氏陰性菌,廣泛分布于空氣、土壤、水中等各種環(huán)境中,假單胞菌屬種類繁多,約200余種[3-4],其中不乏有對人體造成危害的種類,例如銅綠假單胞菌可引起慢性感染[5]。根據(jù)本研究團隊前期相關(guān)研究顯示,一些斯氏假單胞菌(P.stutzeri)攜帶有由ectA、ectB、ectC、ectD、ask_ect 呈簇分布的基因組成的四氫嘧啶生物基因簇[6],如生物固氮菌P.stutzeri A1501[7]和砷氧化菌株P(guān).stutzeri TS44[8]。該基因簇能夠以L-天冬氨酸β半醛(ASA)為前體物質(zhì),通過二氨基丁酸轉(zhuǎn)氨酶(由ectB基因編碼)、二氨基丁酸乙酰轉(zhuǎn)移酶(由ectA基因編碼)和四氫嘧啶合成酶(由ectC基因編碼)進行一系列的生物化學反應最終合成四氫嘧啶[1]。
隨著高通量基因組測序技術(shù)的發(fā)展,使得細菌全基因組序列所需的時間和成本急劇下降。目前美國國立生物信息與技術(shù)中心(NCBI)基因組數(shù)據(jù)庫中已有將近10 000株假單胞菌屬菌株完成了全基因組序列測定,因而利用大量基因組系統(tǒng)分析四氫嘧啶基因簇在該屬菌株基因中的分布、組成及側(cè)翼序列共線性成為可能。
在惠普服務器DL388G9中安裝有Bio-Linux系統(tǒng)[9],該系統(tǒng)集成了常用生物信息學分析軟件。主要硬件配置為:CPU為雙核16線程,內(nèi)存容量128 GB,硬盤存儲總?cè)萘?0 TB。本研究所有分析均使用該服務器完成。
本研究以NCBI基因組資源庫中已測序的9 548株假單胞菌全基因組為實驗數(shù)據(jù)。具體獲取方法如下:打開NCBI基因組FTP資源庫網(wǎng)址http://www.ncbi.nlm.nih.gov/genome/ browse/,輸入假單胞菌屬名“Pseudomonas”進行檢索,共獲得9 548個基因組信息列表;下載基因組信息列表文件后,采用Excel軟件打開從中獲取所有假單胞菌屬菌株基因組數(shù)據(jù)FTP存儲地址和菌株名列表;然后根據(jù)每一個基因組數(shù)據(jù)的FTP地址,采用Aspera(https://downloads.asperasoft.com)高速批量下載所有假單胞菌屬菌株基因組數(shù)據(jù)(Genbank 格式)。
本研究結(jié)合ectC基因預篩選和基因簇可視化復篩方法分析四氫嘧啶基因簇在所有已測序假單胞菌中的分布情況。
ectC預篩選:ectC是四氫嘧啶合成酶基因簇關(guān)鍵基因,該基因編碼四氫嘧啶合成酶,為了減少計算量,首先分析ectC基因在假單胞菌中的分布情況。將所有9 548個基因組序列文件批量解壓后,采用Gcluster[10]軟件中自帶的interested_gene_generation.pl腳本獲取菌株攜帶的候選四氫嘧啶合成酶編碼基因。
interested_gene_generation.pl主要利用本地Blastp方法來分析同源基因,其主要分析過程為:批量提取所有基因組的蛋白組編碼基因的氨基酸序列,然后以P.stutzeri A501四氫嘧啶合成酶基因ectC氨基酸序列為數(shù)據(jù)庫,采用16個線程多線程進行本地Blastp分析,最后根據(jù)BlastP設定的同源蛋白默認閾值(期望值=1-e10,覆蓋度≥70%,相似度≥50%),對結(jié)果進行解析,即可獲得所有假單胞菌中所有潛在ectC基因分布情況。
基因簇可視化復篩:為了進一步排除低質(zhì)量ectC比對結(jié)果,采用Gcluster軟件對所有含有候選ectC基因的假單胞菌進行ectABCD-ask基因簇及其側(cè)翼序列進行可視化與比較分析,具體操作方法詳見該軟件使用說明(https://github. com/Xiangyang1984/Gcluster)。對獲得的結(jié)果進行手工篩選,確定含有完整ectABCD-ask基因簇的為有效攜帶四氫嘧啶合成酶基因簇的菌株。
將所有含有完整四氫嘧啶基因簇的假單胞菌基因組GenBank文件置于同一個文件夾下,并從“1.2 ectC預篩選”步驟中獲得相應基因組的ectC基因Locus tag,然后根據(jù)Gcluster默認設置參數(shù)對ectABCD-ask基因簇及其側(cè)翼序列進行基因組成圖繪制,同時開展同源基因分析。
經(jīng)以P.stutzeri A1501 ectC蛋白質(zhì)序列為數(shù)據(jù)庫進行Blastp比對分析,發(fā)現(xiàn)553株假單胞菌含有潛在ectC基因。為了排除假陽性,采用Gcluster軟件對所有553株菌的四氫嘧啶合成酶基因簇進行可視化,并進行手工核對,結(jié)果顯示541個(分布在541株假單胞菌中)為真正的四氫嘧啶合成酶基因ectC。在這些菌株中,絕大多數(shù)菌株(346株,占比為63.96%)只攜帶有單一的ectC基因,而沒有完整的ectABCD-ask基因;僅有165株假單胞菌含有完整的ectABCD-ask基因簇,占所有假單胞菌屬菌株總數(shù)的1.73%(165/9 548)。攜帶ect基因簇的菌株歸屬于29個不同的種以及一些未知種,超過一半的菌株屬于施氏假單胞菌(P.stutzeri),并且所有的施氏假單胞菌均攜帶有四氫嘧啶基因簇。
對165株假單胞菌的生物合成基因簇ectABCD-ask及側(cè)翼20個基因進行分析顯示,ect基因簇由ectA、ectB、ectC、ectD、ask共5個基因組成。在部分菌株存在個別基因缺失,如Pseudomonas sp. A3170、Pseudomonas sp. CCUG 58779、Pseudomonas sp. SD129、P.stutzeri 28a24、P. stutzeri 28a3、P. stutzeri DSM 17088、P. stutzeri MF28、P. stutzeri NT0128、P. stutzeri PM101005等菌株不存在ectA基因,并且ectB基因較長;P.oceani DSM 100277、P. aestusnigri CECT 8317和P.aestusnigri VGXO14缺失ectD基因;P.stutzeri NP 8HO、P.yangmingensis DSM 24213等7個菌株不含有ask基因。
在同一種內(nèi)菌株間,ectABCD-ask及其側(cè)翼基因高度保守,共線性水平程度高;在不同種間菌株之間,該基因簇左側(cè)基因序列保守型高,但右側(cè)基因差異較大。
本研究首次利用大量假單胞菌屬基因組序列數(shù)據(jù),系統(tǒng)地分析了四氫嘧啶基因簇的分布規(guī)律,并對其基因組成及側(cè)翼基因進行了共線性分析。研究發(fā)現(xiàn)四氫嘧啶基因簇在假單胞菌基因組中分布頻率極低,證明假單胞菌不是該基因簇的主要宿主。超過一半的四氫嘧啶基因簇分布在施氏假單胞菌中,并且所有施氏假單胞菌全部攜帶有四氫嘧啶基因簇,因此在假單胞菌中,施氏假單胞菌是攜帶四氫嘧啶基因簇的宿主。本結(jié)果對深入理解四氫嘧啶基因簇在假單胞菌屬中的分布規(guī)律具有一定價值,為生物合成四氫嘧啶篩選菌株資源提供了重要信息[11-12]。
[1]ZHAO Q,LI S,LV P,et al. High ectoine production by an engineered Halomonas hydrothermalis Y2 in a reduced salinity medium[J].Microb Cell Fact,2019,18(1):184.
[2]劉偉.四氫嘧啶類抗寄生蟲藥在獸醫(yī)臨床上的應用[J].畜牧獸醫(yī)科技信息,2018(10):158.
[3]李海碧.甘蔗根際假單胞菌的分離鑒定及其對甘蔗的促生作用[D].南寧:廣西大學,2017.
[4]劉海明.甜椒根際合成抗生素假單胞菌遺傳多樣性分析及GP72菌株生防機制研究[D].上海:上海交通大學,2007.
[5]丁燁,戴璐,俞娟.抗銅綠假單胞菌感染治療方法研究進展[J].中華醫(yī)院感染學雜志,2020(6):955-960.
[6]李向陽,張國輝,湯宏.施氏假單胞菌四氫嘧啶/羥基四氫嘧啶合成基因簇進化分析[J].凱里學院學報,2015,33(6):70-73.
[7]STOVEKEN N,PITTELKOW M,SINNER T,et al.A specialized aspartokinase enhances the biosynthesis of the osmoprotectants ectoine and hydroxyectoine in Pseudomonas stutzeri A1501[J].J Bacteriol,2011,193(17):4456-4468.
[8]LI X,GONG J,HU Y,et al.Genome sequence of the moderately halotolerant,arsenite-oxidizing bacterium Pseudomonas stutzeri TS44[J].J Bacteriol,2012,194(16):4473-4486.
[9]FIELD D,TIWARI B,BOOTH T,et al.Open software for biologists:from famine to feast[J].Nat Biotechnol, 2006,24(7):801-803.
[10]LI X,CHEN F,CHEN Y.Gcluster:a simple-to-use tool for visualizing and comparing genome contexts for numerous genomes[J].Bioinformatics,2020(28):40.
[11]高波.吉蘭泰鹽湖土壤中嗜鹽堿放線菌的分離鑒定及四氫嘧啶工程菌株的構(gòu)建[D].咸陽:西北農(nóng)林科技大學,2016.
[12]徐蕊.四氫嘧啶合成工程菌株構(gòu)建[D].大連:大連海事大學,2012.
S476
A
10.15913/j.cnki.kjycx.2020.12.058
2095-6835(2020)12-0132-02
李向陽(1984—),男,凱里學院大健康學院副教授,復旦大學環(huán)境科學與工程系在職博士后,研究方向為環(huán)境微生物學及生物信息學。
〔編輯:張思楠〕