馬倩++李景濱++阮成江++李榮榮
摘要:以構(gòu)建的沙棘(Hippophae rhamnoides Linn.)不同組織轉(zhuǎn)錄組數(shù)據(jù)庫為基礎,分離得到1個沙棘WRI1轉(zhuǎn)錄因子編碼基因,命名為HrWRI1,利用生物信息學方法對其基因結(jié)構(gòu)、理化性質(zhì)、保守域、信號肽、亞細胞定位、磷酸化位點和高級結(jié)構(gòu)等進行了預測和較為全面的分析。結(jié)果表明,該成員含有1 206 bp的完整開放閱讀框,編碼401個氨基酸組成的不穩(wěn)定親水蛋白,無信號肽和跨膜結(jié)構(gòu)域,存在多個磷酸化位點,定位于細胞核中,高級結(jié)構(gòu)以無規(guī)則卷曲為主。與不同植物中已報道的同源WRI1轉(zhuǎn)錄因子進行多重序列比對后,發(fā)現(xiàn)它們在核酸與氨基酸水平均高度同源,并且具有相同的結(jié)構(gòu)域。
關鍵詞:沙棘(Hippophae rhamnoides Linn.);WRI1基因;生物信息學
中圖分類號:Q943.2 文獻標識碼:A 文章編號:0439-8114(2016)22-5972-04
DOI:10.14088/j.cnki.issn0439-8114.2016.22.061
Bioinformatics Analysis of WRI1 Gene in Hippophae rhamnoides
MA Qian,LI Jing-bin,RUAN Cheng-jiang,LI Rong-rong
(Resources and Plant Research Institute/College of Environment and Resources,Dalian Nationalities University,Dalian 116600,Liaoning,China)
Abstract: In the present study,a HrWRI1 gene firstly based on the transcriptome sequencing data from H. rhamnoides was obtained. Then,cDNA and deduced amino acid sequence, physical and chemical characterization,conserved domain,signal peptide,subcellular localization,phosphorylation site molecular modeling were predicted and analyzed. It follows that this predicted cDNA has an open reading frame of 1 206 bp in length,encoding protein of 401 amino acids. It was hydrophilic proteins,no transmembrane regions and signal peptide,contain multiple phosphorylation sites. A subcellular localization analysis predicted that they may exist in the nucleus. In addition,the secondary structure is mainly based on random coil. In comparison to the other known WRI1 from various species,the overall sequence alignment suggested that they were highly similar at the protein level,especially conserved domain. Our investigation could definitely provide a significant foundation for further research on function analysis of HrWRI1.
Key words: Hippophae rhamnoides Linn.; WRI1 gene; bioinformatics
沙棘屬(Hippophae)系林奈于1753年以沙棘(Hippophae rhamnoides Linn.)為模式建立的。沙棘又名醋柳、酸刺等,為胡頹子科沙棘屬落葉灌木或小喬木,是一種新興的小漿果類樹種[1,2]。近年來,植物油脂的需求量越來越多,利用基因工程技術提高油料作物中植物油的含量已經(jīng)成為最有發(fā)展前景的方法之一,培育高含油量的沙棘品種已成為沙棘研究的主攻方向之一[3]。WRINKLED1(WRI1)是第一次在模式植物擬南芥(Arabidopsis thaliana)中發(fā)現(xiàn)的1個AP2/EREBP類轉(zhuǎn)錄因子,WRI1基因編碼蛋白含有兩個AP2/EREBP結(jié)構(gòu)域,AP2/EREBP家族轉(zhuǎn)錄因子是植物特有的一類轉(zhuǎn)錄因子,含有由60~70個氨基酸組成的AP2/ERF結(jié)構(gòu)域,其在控制種子的蔗糖到油的積累過程中起關鍵作用[4]。研究發(fā)現(xiàn)過量表達WRI1基因則提高種子和幼苗中三酯酰甘油,而降低了WRI1基因的表達量致使發(fā)育中的種子將蔗糖轉(zhuǎn)化為三酯酰甘油的過程受阻,破壞了糖酵解過程,因而降低了種子的含油量[2]。
本研究以HrWRI1基因序列為目的基因,利用生物信息學方法以及相關軟件分析預測該基因編碼的蛋白理化性質(zhì)、結(jié)構(gòu)、功能,為今后開發(fā)和利用奠定基礎[5]。
1 生物信息學分析
1.1 編碼氨基酸的一級結(jié)構(gòu)及理化性質(zhì)分析
利用在線工具ProtParam程序(http://web.expasy.org/protparam/)分析HrWRI1基因所編碼氨基酸的組成以及其基本的理化性質(zhì)。
1.2 氨基酸保守結(jié)構(gòu)域分析
利用NCBI數(shù)據(jù)庫中的BLASTP(http://blast.ncbi.nlm.nih.gov/),進行保守結(jié)構(gòu)域的分析預測。
1.3 編碼氨基酸的親水性/疏水性以及跨膜結(jié)構(gòu)分析[6]
對該基因編碼的氨基酸序列的親水性/疏水性預測利用ProtScale程序(http://web.expasy.org/cgi-bin/protscale/protscale.pl),蛋白跨膜結(jié)構(gòu)分析的預測應用TMHMM程序(http://www.cbs.dtu.dk/services/TMHMM-2.0/)。
1.4 編碼蛋白的亞細胞定位、核定位信號及信號肽分析[6]
使用ProtComp v.9.0 Predict the sub-cellular localization for Plant proteins(http://linux1.softberry.com/berry.phtml)對該蛋白進行亞細胞定位預測。對編碼蛋白的核定位信號利用NLS mapper program(http://nls-mapper.iab.keio.ac.jp)。利用在線工具SignalP程序(http;//www.cbs.dtu.dk/services/SignalP/)對該蛋白序列進行信號肽預測。
1.5 磷酸化位點分析
利用在線工具NetPhos2.0 Serve(http://www.cbs.dtu.dk/services/NetPhos/)對序列進行潛在磷酸化位點預測分析。
1.6 HrWRI1基因的功能預測
利用ProtFun 2.2 Server程序(http://www.cbs.dtu.dk/services/ProtFun/),對HrWRI1基因進行功能的分析預測[5]。
1.7 編碼蛋白的二級結(jié)構(gòu)和三級結(jié)構(gòu)預測分析
蛋白質(zhì)二級結(jié)構(gòu)分析利用HNN Methods(https://npsa-prabi.ibcp.fr);蛋白質(zhì)的三維結(jié)構(gòu)利用ExPASy服務器的SWISS-MODEL工具進行預測(http://swissmodel.expasy.org/),通過Discovery studio viewerpro軟件進行查看[7]。
1.8 蛋白序列比對及進化樹分析
首先通過NCBI數(shù)據(jù)庫中的Blastp對HrWRI1基因編碼的氨基酸進行同源性分析。利用ClustalX、BioEdit、GeneDOC和MEGA 4軟件進行多重序列比對并構(gòu)建系統(tǒng)進化樹。
2 結(jié)果與分析
2.1 開放閱讀框的獲取及編碼的氨基酸分析
在沙棘轉(zhuǎn)錄組數(shù)據(jù)庫中獲得一個全長為1 251 bp的cDNA序列,通過BioXM 2.6軟件分析得到一個全長為1 206 bp的開放閱讀框,編碼401個氨基酸,如圖1所示。
2.2 保守結(jié)構(gòu)域的分析
通過NCBI中BLASTP分析開放閱讀框所編碼的氨基酸序列的保守結(jié)構(gòu)域。結(jié)果(圖2)表明,所編碼的氨基酸序列中共包含兩個保守結(jié)構(gòu)域,屬于AP2/EREBP家族,該序列可能是AP2/EREBP類轉(zhuǎn)錄因子家族中的一員。
2.3 HrWRI1蛋白的理化性質(zhì)分析
通過ProtParam程序?qū)rWRI1蛋白的理化性質(zhì)進行了分析,HrWRI1分子式為C1958H3038N562O661S9,分子質(zhì)量為45.315 5 ku,理論等電點為5.35,為酸性蛋白;該蛋白含Ser最多,占12.0%;總的帶正電殘基精氨酸(Arg)+賴氨酸(Lys)為46,負電殘基天冬氨酸(Asp)+谷氨酸(Glu)為58;不穩(wěn)定系數(shù)為57.74,表明HrWRI1是一個不穩(wěn)定蛋白(不穩(wěn)定系數(shù)小于40時為穩(wěn)定蛋白)。
2.4 HrWRI1基因編碼的氨基酸的親水性/疏水性和跨膜結(jié)構(gòu)分析
蛋白質(zhì)的折疊主要由氨基酸的親、疏水性驅(qū)動,是每種氨基酸固有的特性。蛋白質(zhì)在折疊時形成疏水的內(nèi)核和親水的表面,同時潛在跨膜區(qū)會出現(xiàn)高疏水性結(jié)構(gòu)域,通過對親疏水性分析可以反映蛋白質(zhì)表面氨基酸的分布和跨膜結(jié)構(gòu)域[8]。
通過ProtScale程序分析,預測HrWRI1氨基酸序列的親水性/疏水性,結(jié)果如圖3所示。多肽鏈的第195位具有最大值1.389,疏水性最強;第238位至245位存在最小值-3.589,均為親水性氨基酸。平均疏水性通過理化性質(zhì)分析顯示為-0.914,在整條肽鏈中,親水氨基酸數(shù)量較多,表明整條多肽鏈表現(xiàn)為親水性[9]。
跨膜區(qū)必須由強疏水的氨基酸組成才能使膜蛋白穿過膜的磷脂雙分子層。通過蛋白親、疏水性分析發(fā)現(xiàn),HrWRI1為親水性蛋白,推測不存在跨膜區(qū)。進一步利用TMHMM程序?qū)rWRI1蛋白跨膜區(qū)進行了分析,結(jié)果如圖4所示。表明確實不存在跨膜區(qū),這與親水性的分析的結(jié)果是一致的。
2.5 HrWRI1蛋白的亞細胞定位及信號肽分析
核定位信號是一段特殊的短肽氨基酸序列,其能引導整個蛋白質(zhì)進入細胞核。亞細胞定位和核定位信號分析發(fā)現(xiàn),HrWRI1蛋白定位于細胞核上,結(jié)果見表1,同時發(fā)現(xiàn)它在2~29位氨基酸處存在潛在的核定位信號。
信號肽是引導前體蛋白質(zhì)通過細胞膜分泌到胞外的一段序列,對其預測和分析有助于了解蛋白質(zhì)的細胞定位并區(qū)分蛋白質(zhì)的功能域。信號肽預測結(jié)果如圖5所示,HrWRI1蛋白最高原始剪切位點分值(C)、最高信號肽分值(S)以及最高綜合剪切位點分值(Y)分別為0.109、0.120、0.106。通??赡艿男盘栯募羟形稽c由最高Y值來推測,為具有最高C值的點同時又是S值由高變低是陡峭的位置。HrWRI1蛋白不存在信號肽,為非分泌蛋白。
2.6 HrWRI1蛋白的磷酸化位點分析
磷酸化是蛋白質(zhì)最常見、最重要的一種翻譯后修飾方式之一,該過程能夠參與調(diào)節(jié)細胞生長、細胞分化和信號轉(zhuǎn)導等多種生命活動。蛋白質(zhì)磷酸化位點主要在絲氨酸(Ser)、蘇氨酸(Thr)和酪氨酸(Tyr)殘基上,通?;蚬δ芘c多肽鏈中氨基酸潛在磷酸化位點的多少有很大相關性。利用NetPhos程序?qū)rWRI1蛋白磷酸化位點的數(shù)量進行預測,若Poential值大于Threshold值,那么存在磷酸化位點,相反則不存在。結(jié)果(圖6)表明,HrWRI1蛋白有29個Ser、9個Thr、1個Tyr可能成為磷酸化位點。
2.7 HrWRI1基因的功能預測
通過在線工具ProtFun 2.2 Server進行了功能的預測分析,結(jié)果如表2所示。由表2可知,HrWRI1基因的主要功能是調(diào)控。
2.8 HrWRI1蛋白的二級結(jié)構(gòu)與三級結(jié)構(gòu)預測分析
蛋白的二級結(jié)構(gòu)只要是指蛋白質(zhì)多肽鏈本身的折疊和盤繞方式,是其空間結(jié)構(gòu)預測的基礎。通過HNN Methods對沙棘WRI1蛋白二級結(jié)構(gòu)進行預測,結(jié)果如圖7所示,發(fā)現(xiàn)該蛋白中存在248個無規(guī)則卷曲(Random coil)占61.85%、97個α-螺旋(Alpha helix)占24.19%、56個伸展鏈(Extended strand)占13.97%。將氨基酸序列提交SWISS-MODEL,得到蛋白質(zhì)的三維結(jié)構(gòu),如圖8所示。
2.9 HrWRI1同源蛋白序列比對及進化樹分析
對HrWRI1進行BLASTP同源序列搜索,發(fā)現(xiàn)其與陸地棉(Gossypium hirsutum)、胡楊(Populus euphratica)、蓖麻(Ricinus communis)、麻風樹(Jatropha curcas)、山杏(Prunus sibirica)具有很高的同源性。多重序列比對結(jié)果如圖9所示,氨基酸序列存在一定范圍的相對保守的重疊區(qū),重疊區(qū)主要集中在2個保守的AP2/EREBP結(jié)構(gòu)域區(qū)域,并且兩個結(jié)構(gòu)域之間的序列也相對保守。
根據(jù)氨基酸的多序列比對,構(gòu)建系統(tǒng)發(fā)育樹(圖10)。發(fā)育樹分為兩叢,沙棘的cDNA編碼的蛋白質(zhì)與同為薔薇目的山杏(Prunus sibirica) 的親緣關系最近,說明可能具有類似的功能,而與無油樟(Amborella trichopoda)、亞麻薺(Camelina sativa)和歐洲油菜(Brassica napus)的親緣關系比較遠。同時,同為大戟科的麻風樹和蓖麻聚到了一組,這與植物分類學上的分類是一致的。
3 討論
隨著生物信息學和分子生物學不斷的深入研究,通過基因工程的方法來改變種子的代謝途徑已成為可能。目前,在擬南芥[10],油菜[11],大豆[12]等植物中已經(jīng)有關于WRI1基因的相關報道,發(fā)現(xiàn)WRI1是AP2/EREBP類轉(zhuǎn)錄因子家族中的一員,轉(zhuǎn)錄因子WRI1的靶基因主要參與脂肪酸合成和糖酵解,因而其對植物的胚胎發(fā)育、種子油脂積累及相關代謝活動具有調(diào)節(jié)作用。另外,在水稻、蓖麻、楊樹、葡萄等植物中也發(fā)現(xiàn)了WRI1類似基因,所以WRI1基因有可能成為一種新的改良種子含油量的目標基因[4],但對于沙棘來說,相關的研究報道比較少。目前對沙棘油的報道中,主要集中在對沙棘油的萃取方法、生化成分的分析以及其藥用價值等方面,所以在建立沙棘轉(zhuǎn)錄組數(shù)據(jù)庫的前提下,選取HrWRI1基因作為目標基因通過生物信息學知識進行了分析預測,這與傳統(tǒng)的實驗室生物學研究相比,具有低成本、高效率的優(yōu)點。但是為了獲取更準確的研究結(jié)果,就必須在一定程度上進行實驗室克隆驗證,因此關于HrWRI1基因的分子克隆和功能鑒定有待于進一步的試驗和研究。
參考文獻:
[1] 齊虹凌,于澤源,李興國.沙棘研究概述[J].沙棘,2005,6(2):37-41.
[2] 丁 霄,楊淑巧,許 琦,等.轉(zhuǎn)錄因子WRI1在主要作物中的研究進展[J].分子植物育種,2015,13(3):697-701.
[3] 阮成江,李代瓊.不同品種沙棘含油量及生化成份研究概況[J].陜西林業(yè)科技,1999(1):59-63.
[4] 魯亞萍,劉風珍,萬勇善.花生轉(zhuǎn)錄因子WRI1基因特征的in silico分析[J].分子植物育種,2012(3):363-370.
[5] 李旭娟,劉洪博,林秀琴,等.甘蔗KNOX基因(Sckn1)的電子克隆及生物信息學分析[J].基因組學與應用生物學,2015(1):136-142.
[6] 秦丹丹,許甫超,董 靜,等.大麥MBF1基因的電子克隆與生物信息學分析[J].湖北農(nóng)業(yè)科學,2014,53(21):5276-5281.
[7] 丁 帥,熊 勇,李正濤,等.菊花rbcL基因電子克隆及生物信息學、適應性進化分析[J].種子,2015,34(10):24-30.
[8] LI JB,LUAN YS.Molecular cloning and characterization of a pathogen-inuced WRKY transcription factor gene from late blight resistant tomato varieties Solanum pimpinellifolium L3708[J].Physiological and Molecular Plant Pathology,2014,87:25-31.
[9] 譚 琳,康由發(fā),鄭曉燕,等.香蕉MYB轉(zhuǎn)錄因子基因的電子克隆及生物信息學分析[J].廣東農(nóng)業(yè)科學,2015(4):123-128.
[10] 吳曉梅,吳雄熊,陳明訓.擬南芥WRI1基因的克隆及其植物反義載體的構(gòu)建[J].江蘇農(nóng)業(yè)科學,2010(3):68-69,79.
[11] 施春霖,劉 聰,肖旦望,等.甘藍型油菜WRI1基因cDNA的克隆與序列分析[J].湖南農(nóng)業(yè)大學學報,2013,39(3):247-252.
[12] 王志坤,常健敏,李丹丹,等.大豆GmWRI1a基因克隆及生物信息學分析[J].東北農(nóng)業(yè)大學學報,2013,44(7):11-16.