郝愛平 國會艷 齊虹凌 魏繼承
摘要:利用生物信息學(xué)的方法對15種藥用植物GGPPS蛋白的理化性質(zhì)、亞細(xì)胞定位、功能結(jié)構(gòu)域、二級結(jié)構(gòu)以及三級結(jié)構(gòu)等方面進行預(yù)測和分析。結(jié)果表明,藥用植物GGPPS蛋白是一種親水性、不穩(wěn)定的非跨膜蛋白,都具有一個相同的功能結(jié)構(gòu)域polyprenyl-synt。GGPPS蛋白二級結(jié)構(gòu)與三級結(jié)構(gòu)的主要結(jié)構(gòu)元件是α-螺旋和無規(guī)則卷曲。同源性分析表明GGPPS蛋白具有很高的保守性,雷公藤(Tripterygium wilfordii)GGPPS蛋白與其余14種植物的親緣關(guān)系較遠(yuǎn)。
關(guān)鍵詞:藥用植物;GGPPS;生物信息學(xué)
中圖分類號:R284.3? ? ? ? ?文獻標(biāo)識碼:A
文章編號:0439-8114(2019)02-0131-06
DOI:10.14088/j.cnki.issn0439-8114.2019.02.029? ? ? ? ? ?開放科學(xué)(資源服務(wù))標(biāo)識碼(OSID):
萜類化合物是一類用途最廣泛、結(jié)構(gòu)最多樣的植物代謝產(chǎn)物[1]。有許多生物體可以合成萜類化合物,但它們在植物中的種類最豐富[2]。萜類化合物是一類由異戊二烯(C5)單元構(gòu)成的化合物,根據(jù)C5個數(shù)的不同,可分為單萜(C10)、倍半萜(C15)和二萜(C20)等[3,4]。萜類化合物的生物合成一般分為3個階段:中間體異戊烯基焦磷酸(Isopentenyl pyrophosphate,IPP)及其雙鍵異構(gòu)體二甲基烯丙基焦磷酸(Dimethylallyl pyrophosphate,DMAPP)的生成;直接前體物質(zhì)法尼基二磷酸(Farnesyl pyrophosphate,F(xiàn)PP)、牻牛兒基二磷酸鹽(Geranylpyrophosphate,GPP)、牻牛兒基牻牛兒基焦磷酸(Geranylgeranyl pyrophosphate,GGPP)的生成;萜類化合物的生成及其修飾[5]。一些萜類化合物具有重要的藥用價值或促進健康的功能,如抗腫瘤藥物紫杉醇、抗瘧疾特效藥物青蒿素和抗炎的雷公藤內(nèi)酯等[6]。萜類化合物及其合成產(chǎn)物在工業(yè)中作為風(fēng)味調(diào)料、芳香劑、香料被廣泛應(yīng)用,也應(yīng)用于香水制造和化妝品中[5]。
盡管類異戊二烯分子及其衍生物的結(jié)構(gòu)和功能具多樣性但所有類異戊二烯均來自共同前體——異戊酰焦磷酸(IPP)或其異構(gòu)物二甲基烯丙基焦磷酸[7]。IPP和DMAPP的合成途徑有兩條,一是位于細(xì)胞質(zhì)中的以乙酰輔酶A為原料的甲羥戊酸(Mevalonicacid,MVA)途徑;二是位于質(zhì)體中的以丙酮酸和甘油醛-3-磷酸為原料的脫氧木酮糖-5-磷酸(DXP)或甲基赤蘚醇-4-磷酸(Methylerythritolphosphate,MEP)途徑[6]。IPP和DMAPP作為反應(yīng)物在各種酶的催化下又可以合成丙烯二磷酸分子,如牻牛兒基二磷酸(GPP,C10),法尼基二磷酸(FPP,C15)和牻牛兒基牻牛兒基焦磷酸(GGPP,C20)。這些物質(zhì)都是植物中大量的各種各樣的類異戊二烯化合物的前體物質(zhì)[1]。
牻牛兒基牻牛兒基焦磷酸合成酶(Geranylgeranyl pyrophosphate synthase,GGPPS)是萜類合酶家族中的一員,又被稱為香葉基香葉基焦磷酸合成酶。三分子的IPP和一分子的DMAPP在牻牛兒基牻牛兒基焦磷酸合成酶催化下經(jīng)過三步縮合反應(yīng)形成牻牛兒基牻牛兒基焦磷酸(GGPP)[5],進而合成各種不同結(jié)構(gòu)的生物合成代謝產(chǎn)物,包括赤霉素、類胡蘿卜素、葉綠素和橡膠等[8]。在植物中,GGPP是植物生長和發(fā)育所必需化合物的基本前體[8]。目前,已經(jīng)有很多植物GGPPS基因被克隆和分析,比如毛喉鞘蕊花(Coleus forskohlii)的GGPP合酶全長359個氨基酸,共有1 077個核苷酸,分子質(zhì)量為39.3 ku,該酶被認(rèn)為參與了毛喉鞘蕊花的生物合成,它主要在葉子中合成,然后在莖和根中積累[9]。在茶樹(Camellia sinensis)中GGPPS氨基酸序列具有類異戊二烯合成酶家族的5個保守域和2個特征功能域[10];在茶樹發(fā)育過程和不同葉位CsGGDPS的表達量隨芽葉成熟度的增加呈上升趨勢,隨著做青過程的進行,CsGGDPS的表達量逐漸升高[10];在模式植物擬南芥(Arabidopsis thaliana)的基因組中有12個同源的GGPPS基因成員(GGPPS1至GGPPS12)[11];其中,GGPPS12不表現(xiàn)GGPPS活性,以及GGPPS5可能是一個假基因[12],其余10個GGPPS同功酶在體外或體內(nèi)合成GGPP,并位于不同亞細(xì)胞[13]。在這些質(zhì)體亞型中,只有GGPPS2和GGPPS11廣泛表達,但GGPPS11在組織中產(chǎn)生mRNA的水平遠(yuǎn)高于其他大多數(shù)同源基因,特別是在葉綠體中[13]。在甘薯(Ipomoea batatas)貯藏根中IbGGPS參與類胡蘿卜素的生物合成并且可能與滲透壓力差有關(guān)[14]。在芒果(Mangifera indica)中MinGGPPS1在葉片中表達量最高,推測MinGGPPS1可能主要參與了葉綠素合成,成熟芒果果肉中MinGGPPS1相對表達量約為青芒果表達量的5倍,表明MinGGPPS1在芒果果肉的成熟過程中可能發(fā)揮重要作用[15];在馬尾松(Pinus massoniana)中GGPPS基因很可能是產(chǎn)脂力相關(guān)基因之一,其表達水平很可能與產(chǎn)脂力具有相關(guān)性[16];在菘藍(Isatis indigotica)中IiGGPPS1基因在葉片中的表達量最高,莖中最低,且受蟲害顏色淺的葉片中該基因表達量顯著低于正常葉片中的表達量,推測該基因可能與二萜化合物葉綠素的合成相關(guān)[17]。以上研究表明,GGPPS參與了植物許多的生理過程,是萜類化合物合成途徑中不可或缺的一種酶。
本研究主要是利用生物信息學(xué)的方法和工具對15種藥用植物GGPPS蛋白的理化性質(zhì)、功能結(jié)構(gòu)域、信號肽、亞細(xì)胞定位、同源性、二級結(jié)構(gòu)、親疏水性以及三級結(jié)構(gòu)等方面進行預(yù)測和分析,為今后深入研究藥用植物GGPPS蛋白的生物學(xué)功能提供理論基礎(chǔ)。
1? 材料與方法
1.1? 材料
所用的氨基酸序列均來自NCBI(https://www.ncbi.nlm.nih.gov/)網(wǎng)站,如表1所示。
1.2? 方法
運用ProtParam(http://web.expasy.org/protparam/)和Psort(http://psort1.hgc.jp/form.html)預(yù)測和分析15種藥用植物GGPPS氨基酸序列的理化性質(zhì)和亞細(xì)胞定位;運用ProtScale(http://web.expasy.org/protscale/)、TMHMM(http://www.cbs.dtu.dk/services/TMHMM-2.0/)和SMART(http://smart.embl-heidelberg.de/)預(yù)測和分析15種藥用植物GGPPS氨基酸序列的親疏水性、跨膜結(jié)構(gòu)域和功能結(jié)構(gòu)域;運用Signal P(http://www.cbs.dtu.dk/services/SignalP/)、SOPMA(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_sopma.html)和WebLogo(http://weblogo. berkeley.edu/logo.cgi)預(yù)測和分析15種藥用植物GGPPS蛋白的信號肽、二級結(jié)構(gòu)和保守性;運用SWISS-MODEL(https://swissmodel.expasy.org/)、PDBSUM(http://www.ebi.ac.uk/thornton-srv/databases/pdbsum/Generate.html)和軟件Mega 5.1預(yù)測和分析15種藥用植物GGPPS的三級結(jié)構(gòu)并構(gòu)建進化樹。
2? 結(jié)果與分析
2.1? 15種藥用植物GGPPS蛋白氨基酸理化性質(zhì)和亞細(xì)胞定位分析
運用在線軟件ProtParam分析銀杏、丹參等15種藥用植物GGPPS蛋白的氨基酸序列,結(jié)果見表2。由表2可知,這幾種藥用植物GGPPS蛋白的氨基酸數(shù)目除了地黃為288外,其余都在300~400,分子量在31 143.86~42 533.84 u,理論等電點(PI)基本在5.18~7.58。除丹參、地黃、甘野菊、滇龍膽草、長春花這幾種植物GGPPS蛋白為穩(wěn)定蛋白之外,其余都為不穩(wěn)定蛋白。運用Psort進行亞細(xì)胞定位分析,表明GGPPS蛋白定位在葉綠體、質(zhì)膜、細(xì)胞質(zhì)、線粒體中。
2.2? 15種藥用植物GGPPS蛋白的親疏水性分析
以白芥子GGPPS蛋白氨基酸序列為例進行親疏水性的預(yù)測與分析,多肽第166位具有最低值-2.911,第287位具有最高值2.433??傮w上來看,白芥子GGPPS蛋白的疏水區(qū)少于親水區(qū),所以具有親水性。其余14種藥用植物GGPPS蛋白的預(yù)測結(jié)果也均為親水性。因此,推測藥用植物GGPPS蛋白為親水蛋白。
2.3? 15種藥用植物GGPPS蛋白的跨膜結(jié)構(gòu)域分析
以白芥子GGPPS蛋白氨基酸序列為例進行跨膜結(jié)構(gòu)域分析,該蛋白的所有氨基酸都在膜外,說明白芥子GGPPS蛋白不具有跨膜結(jié)構(gòu)。對其余14種藥用植物的GGPPS蛋白的跨膜結(jié)構(gòu)域分析,得出結(jié)果都與白芥子類似,所有的GGPPS蛋白都不具有跨膜結(jié)構(gòu),且氨基酸都位于膜外。由此推測,GGPPS蛋白合成后不需經(jīng)過跨膜轉(zhuǎn)運,可直接發(fā)揮作用。
2.4? 15種藥用植物GGPPS蛋白的功能結(jié)構(gòu)域分析
以白芥子GGPPS蛋白的氨基酸序列為例進行功能結(jié)構(gòu)域分析,白芥子具有polyprenyl-synt結(jié)構(gòu)域,氨基酸數(shù)目在100~358。對其余14種植物GGPPS蛋白的功能結(jié)構(gòu)域進行預(yù)測,結(jié)果都與白芥子類似,即所有植物GGPPS蛋白都具有polyprenyl-synt結(jié)構(gòu)域,且氨基酸數(shù)目在100~350。這說明GGPPS蛋白的功能結(jié)構(gòu)域很穩(wěn)定。polyprenyl-synt結(jié)構(gòu)域的功能是催化IPP和DMAPP經(jīng)過縮合反應(yīng)生成GGPP。
2.5? 15種藥用植物GGPPS蛋白的信號肽分析
以白芥子GGPPS蛋白為例進行信號肽的預(yù)測與分析,在第21個氨基酸處有最大信號肽S,為0.352,由此得出,白芥子GGPPS蛋白無信號肽存在,不是分泌性蛋白。對其余14種藥用植物GGPPS蛋白進行信號肽分析,結(jié)果表明都無信號肽存在。因此,推測GGPPS蛋白為非分泌性蛋白。
2.6? 15種藥用植物GGPPS蛋白的二級結(jié)構(gòu)分析
利用SOPMA對15種藥用植物的GGPPS蛋白氨基酸序列進行二級結(jié)構(gòu)的預(yù)測與分析,結(jié)果見表3。由表3可知,這15種藥用植物GGPPS蛋白二級結(jié)構(gòu)的主要結(jié)構(gòu)元件是α-螺旋(約50%)、無規(guī)則卷曲(約30%)、β-轉(zhuǎn)角(約12%)和延伸鏈(約8%)。這表明α-螺旋和無規(guī)則卷曲為GGPPS蛋白的主要構(gòu)件。
2.7? 15種藥用植物GGPPS蛋白三級結(jié)構(gòu)分析
利用SWISS-MODEL對15種藥用植物GGPPS蛋白氨基酸序列進行三級結(jié)構(gòu)的預(yù)測,GGPPS蛋白與模板序列的相似度在57.09%~99.00%,GGPPS蛋白的三級結(jié)構(gòu)多是α-螺旋和無規(guī)則卷曲經(jīng)過進一步盤繞、折疊所形成的。不同植物種類的GGPPS蛋白從三級結(jié)構(gòu)上來看都是大同小異,十分相似。因此,推測不同植物體內(nèi)的GGPPS蛋白的功能是相似的。
為進一步評價模型的可靠程度,以白芥子GGPPS蛋白三級結(jié)構(gòu)圖為例,利用PROCHECK軟件建立Ramachandran圖,簡稱拉氏圖,結(jié)果見圖6。其評價標(biāo)準(zhǔn)為如果有90%以上的氨基酸落在最佳區(qū)內(nèi),則模型為合理可靠。圖中白色區(qū)域為次允許區(qū),該區(qū)域為6.7%。深灰色區(qū)域為一般允許區(qū),該區(qū)域為0.8%。淺灰色的區(qū)域為不允許區(qū),該區(qū)域為1.3%。黑色區(qū)域為最佳區(qū),白芥子GGPPS蛋白有91.2%的氨基酸在該區(qū),說明白芥子GGPPS蛋白的結(jié)構(gòu)模型是合理可靠的。對其余14種藥用植物GGPPS蛋白的Ramachandran圖進行分析,得出結(jié)果與白芥子的相似,說明GGPPS蛋白的結(jié)構(gòu)模型是合理可靠的。
2.8? 15種藥用植物GGPPS蛋白的保守性序列分析
利用15種藥用植物GGPPS蛋白氨基酸序列建立WebLogo圖,第一個保守區(qū)是DDXXXXD,它是底物二甲基丙烯基二磷酸(DMAPP)的結(jié)合位點;第二個保守區(qū)是DDXXD,它是底物異戊烯基二磷酸(IPP)的結(jié)合位點。這兩個保守區(qū)富含天冬氨酸,并且是異戊二烯基焦磷酸合成酶家族的標(biāo)志[18],另外還有3個保守區(qū)GKXXR、GQ和KT的功能有待研究。由此可以看出,GGPPS蛋白氨基酸的保守性非常高。
2.9? 15種藥用植物GGPPS蛋白的同源性分析
通過對15種藥用植物GGPPS蛋白氨基酸序列的對比建立進化樹,這個進化樹分為兩支,其中雷公藤為獨立一支,另外14種植物為另一支,說明雷公藤GGPPS蛋白與其他14種植物的親緣關(guān)系較遠(yuǎn)。14種植物中裸子植物銀杏的GGPPS蛋白單為一支,同為十字花科的白芥子和擬南芥的GGPPS蛋白為一支,同為菊科的熊膽草和甘野菊的GGPPS蛋白為一支;親緣關(guān)系較近的丹參和黃龍膽的GGPPS蛋白為一支,親緣關(guān)系較近的滇龍膽草和長春花的GGPPS蛋白為一支。
3? 小結(jié)與討論
牻牛兒基牻牛兒基焦磷酸導(dǎo)向的萜類化合物雖然在植物中含量較低,但是它們廣泛參與到植物的生長發(fā)育過程中[19]。牻牛兒基牻牛兒基焦磷酸合成酶的作用是調(diào)控處于不同代謝途徑中的共同前體的代謝方向[15]。同植物體內(nèi)GGPPS基因在亞細(xì)胞中的定位不同,這也從另一方面說明了在不同植物中GGPPS蛋白參與的合成途徑不同。藥用植物中的有效成分多與GGPPS基因有關(guān),比如在丹參根中該基因與丹參酮的合成有關(guān)[20];在地黃中有效物質(zhì)是環(huán)烯醚萜苷類化合物,而GGPPS基因與該物質(zhì)的合成途徑有關(guān)[21]。因此,研究GGPPS蛋白對提高藥用植物有效物質(zhì)的產(chǎn)量和品質(zhì)有重要發(fā)展意義。
目前,呂品等[22]從西瓜果實中克隆獲得GGPPS基因CDS區(qū),成功構(gòu)建了由果實特異性啟動子AGPL1調(diào)控GGPPS基因的植物表達載體,并轉(zhuǎn)入農(nóng)桿菌EHA105,通過農(nóng)桿菌介導(dǎo)對西瓜品種“紅一號”進行轉(zhuǎn)化,為研究西瓜果實GGPPS基因的生物學(xué)功能及其類胡蘿卜素合成途徑的分子機理提供了試驗基礎(chǔ)。理論上,也可構(gòu)建一些藥用植物GGPPS的原核表達載體,通過農(nóng)桿菌介導(dǎo)到植物中表達。已有學(xué)者構(gòu)建地黃[21]、雷公藤[23]和滇龍膽草[24]等的原核表達載體在大腸桿菌中成功表達重組蛋白。原核生物具有繁殖快、周期短等特點,為下一步純化GGPPS蛋白以及進行生物功能分析奠定基礎(chǔ)[24]。但還沒有人通過農(nóng)桿菌介導(dǎo)到植物中進行基因重組,以此來改善藥用植物的品質(zhì)。也有學(xué)者猜想如果能夠充分認(rèn)識和了解內(nèi)生真菌紫杉醇生物合成途徑中的相關(guān)酶,就可以通過分子生物學(xué)手段對這些相關(guān)酶基因進行改造,構(gòu)建出高產(chǎn)紫杉醇基因工程菌株,更進一步地提高紫杉醇產(chǎn)量[25]。因此,隨著藥用植物基因資源的日趨匱乏和需求的日益增加,加快大規(guī)模發(fā)掘藥用植物的基因資源,利用生物工程和基因工程育種技術(shù)定向培育抗逆抗病性強、藥用活性成分含量高的藥用植物新品種已成為今后研究的方向。
藥用植物牻牛兒基牻牛兒基焦磷酸合成酶是一種具有親水性的非跨膜蛋白,它的氨基酸數(shù)目在300~400,分子量在30 000~40 000 u。大多數(shù)植物的GGPPS蛋白為不穩(wěn)定、非分泌性蛋白。不同植物的GGPPS蛋白在細(xì)胞中的定位也有很大的差異。GGPPS蛋白都具有一個相同的功能結(jié)構(gòu)域polyprenyl-synt。α-螺旋和無規(guī)則卷曲是GGPPS蛋白二級結(jié)構(gòu)與三級結(jié)構(gòu)的主要構(gòu)件。同源性分析表明GGPPS蛋白具有很高的保守性,雷公藤GGPPS蛋白與其余14種植物的親緣關(guān)系較遠(yuǎn)。
參考文獻:
[1] RUIZ-SOLA M,COMAN D,BECK G,et al. Arabidopsis geranylgeranyl diphosphate synthase 11 is a hub isozyme required for the production of most photosynthesis-related isoprenoids[J].New Phytol,2016,209(1):252-264.
[2] PULIDO P,PERELLO C,RODR?魱GUEZ-CONCEPCI?魷N M,et al.New insights into plant isoprenoid metabolism[J].Molecular Plant,2012,5(5):964-967.
[3] 岳躍沖,范燕萍.植物萜類合成酶及其代謝調(diào)控的研究進展[J].園藝學(xué)報,2011,38(2):379-388.
[4] 李天嬌,冷平生,楊? 凱,等.百合單萜合成酶基因的克隆與序列分析[J].北京農(nóng)學(xué)院學(xué)報,2014,29(3):6-10.
[5] 梁宗鎖,方譽民,楊東風(fēng).植物萜類化合物生物合成與調(diào)控及其代謝工程研究進展[J].浙江理工大學(xué)學(xué)報(自然科學(xué)版),2017, 37(2):255-264.
[6] 王凌健,方? 欣,楊長青,等.植物萜類次生代謝及其調(diào)控[J].中國科學(xué):生命科學(xué),2013,43(12):1030-1046.
[7] 施文鈞,王洪海.MEP途徑:一個潛在的分子藥靶[J].中國抗生素雜志,2008,33(2):65-68.
[8] TATA S K,JUNG J,KIM Y H,et al. Heterologous expression of chloroplast-localized geranylgeranyl pyrophosphate synthaseconfers fast plant growth,early flowering and increased seed yield[J].Plant Biotechnol J,2016,14(1):29-39.
[9] ENGPRASERT S,TAURA F,KAWAMUKAI M,et al. Molecular cloning and functional expression of geranylgeranyl pyrophosphate synthase from Coleus forskohlii Briq[J].BMC Plant Biol,2004,4:18.
[10] 姚雪倩,岳? 川,楊國一,等.茶樹牻牛兒基牻牛兒基焦磷酸合成酶基因CsGGDPS的克隆及表達分析[J].茶葉科學(xué),2017, 37(1):86-96.
[11] LANGE B M,GHASSEMIAN M. Genome organization in Arabidopsis thaliana:A survey for genes involved in isoprenoid and chlorophyll metabolism[J].Plant Molecular Biology,2003,51(6):925-948.
[12] COMAN D,RTIMANN P,GRUISSEM W. A flexible protocol for targeted gene co-expression network analysis[J].Plant Isoprenoids,2014,1153:285-299.
[13] BECK G,COMAN D,HERREN E,et al. Characterization of the GGPP synthase gene family in Arabidopsis thaliana[J].Plant Molecular Biology,2013,82(4-5):393-416.
[14] CHEN W,HE S Z,LIU D G,et al. A sweetpotato geranylgeranyl pyrophosphate synthase gene,IbGGPS,increases carotenoid content and enhances osmotic stress tolerance in Arabidopsis thaliana[J].PLoS One,2015,10(9):e0137623.
[15] 呂志勇,陳業(yè)淵,王? 鵬.芒果GGPPS基因的克隆與表達分析[J].分子植物育種,2017,15(1):65-70.
[16] 陳博雯,覃子海,王鵬良,等.馬尾松GGPPS基因克隆及序列分析[J].西部林業(yè)科學(xué),2016,45(2):1-6.
[17] 韓立敏.菘藍牦牛兒基牦牛兒基焦磷酸合成酶基因(IiGGPPS1)的克隆及其表達特性分析[J].基因組學(xué)與應(yīng)用生物學(xué),2015, 34(6):1172-1178.
[18] 李永梅,馮玉杰,李? 錦,等.能源植物橡膠草TkGGPPS基因的克隆及表達分析[J].植物生理學(xué)報,2016,52(3):303-311.
[19] 方? 潔,李春芳,馬春雷,等.茶樹GGPS基因家族的克隆、生物信息學(xué)和表達分析[J].茶葉科學(xué),2017,37(2):130-138.
[20] 化文平,宋雙紅,智? 媛,等.丹參SmGGPPS3基因的克隆及表達分析[J].植物科學(xué)學(xué)報,2014,32(1):50-57.
[21] 趙? 樂,史晶晶,馬利剛,等.地黃GGPPS1基因克隆及表達分析[J].西北植物學(xué)報,2016,36(5):888-895.
[22] 呂? 品,李朋偉,馬雙武,等.西瓜GGPS基因果實特異性表達載體構(gòu)建與遺傳轉(zhuǎn)化[J].生物科技,2016,26(5):432-437,455.
[23] 屠李嬋,張逸風(fēng),蘇? 平,等.雷公藤牻牛兒基焦磷酸合酶基因TwGPPS克隆與表達分析[J].中國中藥雜志,2017,42(2):220-225.
[24] 王彩云,李富生,李? 濤,等.滇龍膽GrGPPS基因的克隆及其序列分析與原核表達[J].中草藥,2014,45(14):2060-2068.
[25] 王? 歆,肖? 野,劉? 丹,等.東北紅豆杉細(xì)胞GGPPS基因cDNA的克隆[J].黑龍江大學(xué)自然科學(xué)學(xué)報,2012,29(4):536-540.