李岱容,穆柳青,張春燕,楊 春
(1.重慶醫(yī)科大學(xué)附屬第一醫(yī)院 呼吸科, 重慶 400016;2.重慶醫(yī)科大學(xué) 病原微生物教研室, 重慶 400016)
結(jié)核分枝桿菌(mycobacteriumtuberculosis, MTB)引起的結(jié)核病是重要的傳染病,隨著耐藥和泛耐藥菌株增多,結(jié)核病仍然給人們的生命健康帶來了巨大的威脅[1]。目前結(jié)核桿菌的診斷與治療均存在很多的難點,急需新的診斷指標與治療靶點。ATP依賴的Clp蛋白酶系統(tǒng)是重要的酶系統(tǒng),參與調(diào)節(jié)體內(nèi)蛋白質(zhì)代謝,清除不可逆損傷蛋白,對外應(yīng)激耐受及維持內(nèi)環(huán)境的穩(wěn)態(tài)。MTB具有自身特殊的Clp蛋白酶系統(tǒng),含有多個Clp亞基: ClpP1、ClpP2、ClpB、ClpC1、ClpC2、ClpX[2]。目前MTB的Clp蛋白酶中除ClpP1、ClpC1外,其余亞單位的結(jié)構(gòu)功能仍然未有文獻對其詳細闡述[3-4]。由于MTB生長緩慢,具有高致病性,實驗條件苛刻,本文應(yīng)用生物信息學(xué)的方法,重點對ClpC2亞單位的保守性及其生物學(xué)作用進行分析,希望能從中得到更多的信息,為結(jié)核桿菌的診斷和治療提供新的靶點。
1.1 多重序列比對和進化樹構(gòu)建 首先在NCBI數(shù)據(jù)庫中查找MTB的標準菌株H37Rv的clpC2基因核苷酸序列,用NCBI的BLAST程序搜索其同源生物序列。使用 ClustX 2.0版軟件進行多重序列比對,序列對齊后再加以人工檢查。進化樹使用MEGA5.1軟件的鄰接歸并法(Neighbor-Joining Method, NJ)構(gòu)建,Kimura兩參數(shù)模型(Kimura′s two-parameter),自展檢驗(bootstrap analysis)重復(fù)1 000次?;诜种U菌16s rRNA基因進化樹的構(gòu)建也采用上述同樣的方法進行。
1.2 種內(nèi)及種間進化分歧 運用MEGA5.1軟件包中的Kimura′s two-parameter模式對分枝桿菌屬16s rRNA和clpC2基因序列進行分析后,計算種內(nèi)及種間進化分歧。
1.3 ClpC2保守結(jié)構(gòu)域與二級結(jié)構(gòu)的預(yù)測 從NCBI下載ClpC2的序列后,提交序列至http://swissmodel.expasy.org網(wǎng)站預(yù)測ClpC2 的保守結(jié)構(gòu)域與二級結(jié)構(gòu)[5]。
1.4 ClpC2蛋白酶的基本生物信息學(xué)分析 應(yīng)用ExPASy的ProtParam對ClpC2氨基酸序列進行氨基酸數(shù)量、分子量、等電點、氨基酸組成及親水性等基本理化性質(zhì)的分析。應(yīng)用PSORTb version 3.0.0分析蛋白質(zhì)的亞細胞定位。蛋白質(zhì)信號肽預(yù)測采用SignalP,參數(shù)選取革蘭氏陽性菌和隱馬爾可夫模型(HMM)。ProtScal分析重組蛋白質(zhì)的疏水性。應(yīng)用Gene ontology(GO)在線軟件對ClpC2蛋白酶的功能進行分析(見表1)。
表1生物信息學(xué)分析網(wǎng)址
程序 應(yīng)用網(wǎng)址ProtParam理化性質(zhì)分析http://www.expasy.ch/tools/protparam.html/PSORTb亞細胞定位預(yù)測http://www.psort.org/ProtScal疏水性分析http://www.expasy.org/tools/protscale.html/SignalP信號肽預(yù)測http://www.cbs.dtu.dk/services/SignalP/Geneontology(GO)蛋白功能預(yù)測http://www.ebi.a(chǎn)c.uk/ego/
1.5 跨膜分析 用TMHMM2.0 在線工具對ClpC2的氨基酸序列跨膜進行預(yù)測分析。
2.1 clpC2基因核苷酸序列分析及進化樹構(gòu)建 庫中所有的分枝菌屬的16s rRNA 和clpC2基因同源序列分別構(gòu)建的系統(tǒng)進化樹(見圖1)。與16s rRNA基因相比,clpC2基因在分枝桿菌不同種之間的相似性降低,進化距離明顯變大,明顯分為兩個大群。從圖1B中可見,結(jié)核分枝桿菌復(fù)合群菌株(M.africanum,M.canettii,M.tuberculosis,M.bovis等)聚為一族,然而在非典型分枝桿菌中同源性低,在麻風桿菌中該同源基因缺如,總的平均進化距離為0.59,高于16s rRNA的總的平均進化距離(0.17)。
2.2 16s rRNA和clpC2同源基因之間的基因距離 雖然,clpC2基因與16s rRNA基因相比,進化距離明顯變大,分枝桿菌不同種之間的相似性降低,但是,我們從表2中看出,clpC2在結(jié)核分枝桿菌復(fù)合群中基因距離幾乎沒有差距(0.00~0.01),顯示clpC2在結(jié)核分枝桿菌復(fù)合群中高度同源,非常保守,而在其他分枝菌屬中則呈現(xiàn)出不同的進化距離,明顯高于16s rRNA的基因距離。
2.3 保守結(jié)構(gòu)域的預(yù)測 經(jīng)由Interproscan預(yù)測,ClpC2 的結(jié)構(gòu)特征是具有兩個Clp-氨基末端結(jié)構(gòu)域(Clp-N)和一個Double Clp-N 基序(見圖2)。Clp-N結(jié)構(gòu)域序號為PF02861,分別位于第110與162、183與233位aa之間,與ClpA 和 ClpB蛋白氨基端同源,雖然這些域的功能不肯定,但是可以形成蛋白的結(jié)合位點[6]。Double Clp-N 基序序號為IPR023150,位于97與230位aa之間。Double Clp-N 基序可見于ATP依賴的Clp蛋白酶的N端,這個N端域可以與AAA(+)蛋白配體結(jié)合域D1相互作用[7]。
注:用Clustal X 軟件作多重序列比對后,進化樹采用neighbor-joining法用MEGA 5.1軟件構(gòu)建而成,評估方法為Bootstrap法。標尺的一個刻度代表0.1的進化距離,節(jié)點旁的數(shù)值表示1000 次重復(fù)中Bootstrap值的百分數(shù)。總的平均進化距離分別為0.17(見圖1A)、0.59(見圖1B)。圖1 基于16s rRNA(A)和clpC2基因(B)核苷酸序列的分枝桿菌的系統(tǒng)進化樹
圖2 預(yù)測的結(jié)核分枝桿菌ClpC2蛋白結(jié)構(gòu)域
表2 H37Rv菌中16s rRNA和clpC2基因與其他分枝桿菌屬同源基因之間的基因距離
Species16srRNAclpC2M.tuberculosis?0.000.00M.a(chǎn)fricanum?0.000.00M.bovis?0.000.00M.canettii?0.000.01M.sp.0.000.25M.ulcerans0.010.24M.marinum0.011.08M.a(chǎn)vium0.010.24M.paratuberculosis0.010.24M.vanbaalenii0.041.07M.intracellulare0.020.24M.gilvum0.040.40M.indicus0.020.25M.smegmatis0.041.06M.liflandii0.991.08
注:*為結(jié)核分枝桿菌復(fù)合群的成員。
2.4 二級結(jié)構(gòu)預(yù)測 將ClpC2序列上傳到SWISS-MODEL服務(wù)器,對其進行二級結(jié)構(gòu)預(yù)測。結(jié)果表明ClpC2具有螺旋(helix)和卷曲(coil)兩種折疊結(jié)構(gòu),在兩個Clp-N功能域部分,彼此肽鏈的折疊差異很小,預(yù)示著高度保守的二級結(jié)構(gòu)與功能的穩(wěn)定有著緊密的聯(lián)系。
2.5 ClpC2蛋白基本信息預(yù)測結(jié)果 ClpC2分子量26.6kD,理論等電點5.54,ProtParam預(yù)測ClpC2蛋白酶的總平均疏水值 (Grand Average of Hydropathy,GRAVY)為-0.122,為親水性蛋白。PSORTb version 3.0.0 亞細胞定位預(yù)測ClpC2在細胞質(zhì)表達(亞細胞定位分數(shù):cytoplasmic 9.97)。SignalP預(yù)測ClpC2不是信號肽。G O 分析表明ClpC2具有水解、參與蛋白代謝、ATP-結(jié)合、肽酶活力功能,由此推知ClpC2應(yīng)具有水解和催化功能,對細菌的代謝過程起作用,從而影響細菌的生理,在這些過程中需要消耗能量ATP。
2.6 跨膜分析 TMHMM2.0 軟件分析結(jié)果表明,對ClpC2蛋白未形成跨膜結(jié)構(gòu)域(見圖3)。
圖3 結(jié)核分枝桿菌ClpC2蛋白跨膜分析
1998年結(jié)核分支桿菌基因組測序的完成標志著人類與MTB的斗爭進入到一個新的階段[8],每個可能的藥物靶子和可用于疫苗設(shè)計的保護性抗原均可能從基因組序列中檢索。生物信息學(xué)是生物學(xué)與計算機科學(xué)及應(yīng)用數(shù)學(xué)等學(xué)科相互交叉而形成的一門新興學(xué)科,利用生物信息學(xué)方法尋找新的基因或蛋白質(zhì)已有一定的基礎(chǔ),可以大大的節(jié)約時間和精力。
蛋白酶一直被認為是致病微生物的重要毒力因子。細菌可以通過ATP依賴的蛋白酶Clp系統(tǒng)調(diào)節(jié)其蛋白質(zhì)水平及活性,以幫助細菌適應(yīng)環(huán)境,從而進行生長、繁殖、轉(zhuǎn)移等生命活動,進而引起各種感染性疾病[9]。作為一類高度保守并廣泛存在的熱休克蛋白,ATP依賴的蛋白酶Clp系統(tǒng)可幫助其他蛋白質(zhì)進行正確折疊、修復(fù)、降解、復(fù)合物形成、運輸?shù)?,從而影響細胞的生命活動,因此倍受科學(xué)家們的關(guān)注。
結(jié)核分枝桿菌Clp酶含有6個Clp亞單位:ClpB、ClpC1、ClpC2、ClpP1、ClpP2、ClpX。文獻已經(jīng)報道了ClpP1、ClpP2、ClpX、ClpC1等幾個亞單位具有重要的功能,是生物的生理調(diào)控和蛋白質(zhì)量控制所必需的,與結(jié)核分枝桿菌的致病性和在單核細胞、巨噬細胞中的持留性相關(guān)[10-12]。而對于ClpC2等亞基,到現(xiàn)在為止,蛋白的空間結(jié)構(gòu)尚未解析出來,且對其在MTB致病中的作用,相關(guān)文獻所提供的信息也很少。
clpC2基因又名clpx’,編碼ClpC2單體蛋白,在結(jié)核分枝桿菌中,每個單體都為252個aa,基因功能未知,是假想的ATP結(jié)合亞單位。本研究經(jīng)過核苷酸的多重序列分析,發(fā)現(xiàn)clpC2在結(jié)核分枝桿菌復(fù)合群中保守性非常高,而在其他非結(jié)核分枝桿菌中的同源性低,在麻風分枝桿菌中該同源基因缺如。
結(jié)構(gòu)域是蛋白質(zhì)中具有進化保守性的一段氨基酸序列,同時也是分子相互作用過程中發(fā)揮重要作用的結(jié)構(gòu)和功能的區(qū)域。本研究發(fā)現(xiàn)ClpC2 的結(jié)構(gòu)特征是具有兩個Clp-N結(jié)構(gòu)域和一個Douple Clp-N 基序。Clp-N結(jié)構(gòu)域是Clp蛋白酶和Dnak/DnaJ分子伴侶的亞單位[6],Douple Clp-N基序與AAA(+)蛋白配體結(jié)合域D1相互作用,含有ClpA/ClpB家族、ClpC超家族所有的基序特征,歸屬于ClpA/ClpB家族和ClpC超家族。因此推測ClpC2同ClpA、ClpB功能相似,應(yīng)該是Clp蛋白酶系統(tǒng)的調(diào)節(jié)亞基。
隨著人類基因組計劃的開展,在基因結(jié)構(gòu)、定位、表達和功能研究等方面都積累了大量的數(shù)據(jù),如何充分利用這些已有的數(shù)據(jù)資源,加速人類基因克隆研究,同時避免重復(fù)工作,節(jié)省開支,已成為一個急迫而富有挑戰(zhàn)性的課題擺在我們面前。本文通過生物信息學(xué)預(yù)測,獲得了ClpC2蛋白的許多基本信息:ClpC2蛋白為親水性、非跨膜蛋白、在細胞質(zhì)內(nèi)表達,推測該蛋白可能作為分子伴侶具有穩(wěn)定細胞內(nèi)蛋白質(zhì)量的作用。此外,由于具有水解和催化功能,可能還對細菌的代謝過程起作用,影響細菌的生理。由于這些過程中需要消耗能量,因而該蛋白仍然是一個依賴于ATP的Clp亞單位,可能是潛在的抗結(jié)核藥物的作用靶點。
本研究通過對clpC2基因的信息學(xué)預(yù)測,為后續(xù)深入研究ClpC2蛋白的生物學(xué)功能、驗證ClpC2作為藥靶的候選蛋白的可行性提供基礎(chǔ)資料。另外本文還發(fā)現(xiàn)clpC2基因的進化距離明顯大于16s rRNA基因,且在結(jié)核分枝桿菌復(fù)合群中高度保守,在其他分枝桿菌的種間保守性相對較差,因而該基因還可用于鑒別結(jié)核分枝桿菌和非結(jié)核分枝桿菌。
[參考文獻]
[1] World Health Organization. Global Tuberculosis Control: Surveillance P, Financing. WHO Report.(2010) http://www.who.int/tb/publications/global_report/2010/en/index.html.
[2] Ribeiro-Guimar?es M L, Pessolani M C.Comparative genomics of mycobacterial proteases[J].Microb Pathog, 2007,43(5-6):173-178.
[3] Ollinger J, O′Malley T, Kesicki EA ,et al. Validation of the essential ClpP protease in Mycobacterium tuberculosis as a novel drug target[J].J Bacteriol, 2012,194(3):663-668.
[4] Schmitt E K, Riwanto M, Sambandamurthy V, et al. The natural product cyclomarin kills Mycobacterium tuberculosis by targeting the ClpC1 subunit of the caseinolytic protease[J].Angewandte Chemim (International Ed. In English), 2011,50(26):5889-5891.
[5] Zdobnov E M,Apweiler R. InterProScan-an integration platform for the signature-recognition methods in InterPro[J].Bioinformatics,2001,17: 847-848.
[6] Barnett M E,Zolkiewska A,Zolkiewski M.Structure and activity of ClpB from Escherichia coli:Role of the amino-and carboxyl-terminal domains[J].J Biol Chem, 2000,275(48):37565-37571.
[7] Guo F, Maurizi M R , Esser L , et al. Crystal structure of ClpA, an Hsp100 chaperone and regulator of ClpAP protease[J].The Journal of biological chemistry, 2002,277(48) :46743-46752.
[8] Cole S T, Brosch R, Parkhill J, et al. Deciphering the biology of Mycobacterium tuberculosis from the complete genome sequence[J].Nature,1998, 393(6685):537-544.
[9] Kajfasz J K, Martinez A R, Rivera-Ramos I, et al. Role of Clp proteins in expression of virulence properties of Streptococcus mutans[J].J Bacteriol,2009,191(7):2060-2068.
[10] Raju R M, Unnikrishnan M, Rubin D H, et al.Mycobacterium tuberculosis ClpP1 and ClpP2 function together in protein degradation and are required for viability in vitro and during infection[J].PLoS Pathog, 2012,8(2):e1002511.
[11] Kar N P, Sikriwal D, Rath P,et al.Mycobacterium tuberculosis ClpC1: characterization and role of the N-terminal domain in its function[J].Febs J, 2008,275(24):6149-6158.
[12]Dziedzic R, Kiran M, Plocinski P, et al.MycobacteriumtuberculosisClpX interacts with FtsZ and interferes with FtsZ assembly[J].PLoS One, 2010,5(7):e11058.