程欣
摘要:為了解番茄OFP基因家族的功能特征,通過生物信息學(xué)手段對番茄OFP基因家族成員進(jìn)行全面的生物信息學(xué)分析,包括染色體定位、基因結(jié)構(gòu)、蛋白質(zhì)理化性質(zhì)、二級結(jié)構(gòu)、三維構(gòu)象、啟動子分析、親緣關(guān)系及組織特異性分析。結(jié)果表明,番茄中的31個OFP基因在12條染色體上呈不均勻分布;除SlOFP6、SlOFP7、SlOFP12、SlOFP13基因以外,其余27個OFP基因均不含有內(nèi)含子結(jié)構(gòu)。蛋白質(zhì)理化性質(zhì)分析結(jié)果表明,大部分OFP蛋白為不穩(wěn)定性蛋白,并且54.8%的OFP蛋白分布于細(xì)胞核中。蛋白質(zhì)二級結(jié)構(gòu)和三維構(gòu)象顯示,番茄OFP蛋白以α-螺旋和無規(guī)則卷曲為主要組成成分,表明番茄OFP蛋白之間存在保守性。啟動子順式作用元件分析結(jié)果表明,番茄OFP基因啟動子上主要存在3類元件:光響應(yīng)、激素響應(yīng)應(yīng)答以及逆境脅迫響應(yīng)元件。而組織特異性分析結(jié)果表明,番茄OFP基因在各組織中的表達(dá)量差異較大,預(yù)示著番茄OFP基因生物學(xué)功能的多樣性。分析結(jié)果將為后續(xù)研究番茄OFP基因家族成員的生物學(xué)功能提供參考。
關(guān)鍵詞:番茄(Solanum lycopersicum);OFP基因家族;生物信息學(xué)分析;蛋白質(zhì)理化性質(zhì);蛋白結(jié)構(gòu)
中圖分類號:S641.201;Q78 ??文獻(xiàn)標(biāo)志碼: A
文章編號:1002-1302(2021)18-0039-09
收稿日期:2021-01-29
基金項目:重慶市科委自然科學(xué)基金(編號:cstc2018jcyjAX0458)。
作者簡介:程 欣(1996—),女,四川廣安人,碩士研究生,主要從事番茄功能基因的克隆與應(yīng)用研究。E-mail:chengxin599@163.com。
番茄(Solanum lycopersicum)原產(chǎn)于南美洲,是管狀花目茄科番茄屬的一種一年生或多年生草本植物,是兼具營養(yǎng)價值和商業(yè)價值的一種蔬菜作物,是植物分子生物研究的一種模式植物。番茄富含大量維生素C、番茄紅素和礦物質(zhì)等多種營養(yǎng)成分,具有抗癌防衰、提高人體免疫力的功效,因此受到越來越多人的青睞。番茄果實為多汁漿果,有圓球形、高圓形、扁圓形、卵圓形、方圓形、梨形等多種果形。研究表明,OVATE是第一個被鑒定為控制番茄果實形狀的主要定量性狀基因座(QTL)[1]。
OFP基因家族編碼OFP蛋白(OVATE family proteins)。OFP蛋白是僅存在植物中的一類轉(zhuǎn)錄抑制因子,其C末端包含一個約70個氨基酸殘基的保守結(jié)構(gòu)域,被稱為OVATE結(jié)構(gòu)域[2-5]。雖然OFP基因廣泛地分布于植物中,但對于它們的功能研究卻相對比較滯后,僅在擬南芥、水稻、辣椒、香蕉和番茄中開展有限的幾個方面的功能研究,包括果實形狀[1]、果實成熟與品質(zhì)[6]、胚珠發(fā)育[7]、維管束的發(fā)育[8]、次生細(xì)胞壁的形成[9]、非生物脅迫[2]以及植物表面質(zhì)積累[3]等。到目前為止,對OFP蛋白功能的研究更多的聚焦在擬南芥和水稻中,而番茄OFP蛋白的功能研究還比較少,僅對OVATE[1,10-12] 和SlOFP20[13-15] 基因的功能進(jìn)行過報道,其他29個OFP蛋白的功能還未見報道。因此,本研究旨在利用生物信息學(xué)方法對番茄OFP基因家族的染色體定位、基因結(jié)構(gòu)、保守基序、蛋白序列比對、系統(tǒng)進(jìn)化關(guān)系、蛋白理化性質(zhì)、蛋白質(zhì)結(jié)構(gòu)特征及功能、順式作用元件的組成以及在不同組織中的差異表達(dá)等進(jìn)行分析及預(yù)測,以期為進(jìn)一步開展番茄OFP基因家族的功能研究提供參考。
1 材料與方法
1.1 番茄OFP基因家族成員的鑒定與染色體定位
從茄科基因組數(shù)據(jù)庫(https://solgenomics.net/search/locus)下載其全部蛋白序列,再通過NCBI(https://www.ncbi.nlm.nih.gov/)在線數(shù)據(jù)庫BLAST下載番茄OFP基因家族全部序列信息。從茄科基因組數(shù)據(jù)庫(https://solgenomics.net/search/locus)獲得OFP基因家族成員在染色體上的位置信息。
利用在線工具M(jìn)G2C(http://mg2c.iask.in/mg2c_v2.1/)制作染色體定位圖。
1.2 番茄OFP基因家族基因結(jié)構(gòu)分析
從NCBI(https://www.ncbi.nlm.nih.gov/)在線數(shù)據(jù)庫下載番茄OFP基因家族成員的蛋白質(zhì)編碼區(qū)(CDS)和DNA序列的FASTA格式。利用GSDS在線網(wǎng)站(http://gsds.cbi.pku.edu.cn/)繪制基因內(nèi)含子和外顯子及非編碼區(qū)的分布圖。
1.3 番茄OFP基因家族蛋白保守基序分析
通過MEME網(wǎng)站(http://meme-suite.org/)在線分析蛋白的保守基序,motif設(shè)置為10,參數(shù)設(shè)置為默認(rèn)值,利用TBtools軟件繪制保守基序圖。
1.4 番茄OFP基因家族蛋白保守結(jié)構(gòu)域序列比對和系統(tǒng)進(jìn)化樹分析
通過DNAMAN 6.0軟件完成蛋白序列的氨基酸保守性分析,通過MEGA 6.0軟件完成系統(tǒng)進(jìn)化分析,隨后通過iToL(https://itol.embl.de/upload.cgi)在線網(wǎng)站對進(jìn)化樹進(jìn)行美化。
1.5 番茄OFP基因家族蛋白理化性質(zhì)和亞細(xì)胞定位進(jìn)行分析
通過ExPASy(https://web.expasy.org/protparam/)在線網(wǎng)站進(jìn)行蛋白理化性質(zhì)分析,通過GenScript(https://www.genscript.com/psort.html?src=leftbar)進(jìn)行亞細(xì)胞定位分析。
1.6 番茄OFP基因家族蛋白二級結(jié)構(gòu)分析
通過SOPMA在線網(wǎng)站(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)對蛋白序列的二級結(jié)構(gòu)進(jìn)行預(yù)測分析。
1.7 番茄OFP基因家族蛋白三維結(jié)構(gòu)模擬
通過Swiss-Modle在線網(wǎng)站(https://swissmodel.expasy.org/)完成蛋白的同源建模,以獲取三維結(jié)構(gòu)模型。
1.8 番茄OFP基因家族基因啟動子區(qū)域順式作用元件分析
通過茄科基因組數(shù)據(jù)庫(https://solgenomics.net/search/locus)下載OFP基因家族基因起始密碼子上游3 000 bp區(qū)域序列作為啟動子序列,然后通過PlantCare網(wǎng)站(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)對基因啟動子區(qū)域順式作用元件進(jìn)行預(yù)測分析,通過TBtools軟件繪制啟動子順式作用元件圖。
1.9 番茄OFP基因家族成員轉(zhuǎn)錄表達(dá)模式分析
通過NCBI PubMed 下載番茄的RNA-seq數(shù)據(jù),查找搜索31個番茄OFP基因在各組織中的表達(dá)量,利用Helml軟件繪制基因表達(dá)熱圖。
2 結(jié)果與分析
2.1 番茄OFP基因家族成員的鑒定與染色體定位
在茄科基因組數(shù)據(jù)庫中檢索OFP蛋白序列信息,再通過NCBI數(shù)據(jù)庫和FGENESH搜索分析,最終共得到31個番茄OFP基因家族成員,并依次將它們命名為OVATE-SlOFP1~OVATE-SlOFP31。為了將這31個成員進(jìn)行染色體定位分析,利用 SGN數(shù)據(jù)庫確定了番茄OFP基因位置信息,結(jié)果表明OFP基因家族在番茄12條染色體上的分布并不均勻,其中10號染色體上分布的成員最多,有9個OFP基因;其次是6號染色體上分布有4個OFP基因;1、3、9號染色體上各有3個OFP基因;其余染色體上分布著 1~2個OFP基因(圖1)。
2.2 番茄OFP基因家族基因結(jié)構(gòu)分析
對番茄OFP基因家族的編碼序列和基因序列信息進(jìn)行分析,結(jié)果表明番茄OFP基因家族的編碼序列外顯子數(shù)量在1~3個之間,此外,除SlOFP6、SlOFP7、SlOFP12、SlOFP13以外,其他基因均不含有內(nèi)含子結(jié)構(gòu)(圖2)。這體現(xiàn)出番茄OFP基因家族基因結(jié)構(gòu)簡單的特征。同時也說明番茄OFP基因家族呈現(xiàn)一定的保守性。
2.3 番茄OFP基因家族蛋白保守基序分析
對31個番茄OFP基因家族成員的蛋白序列進(jìn)行保守基序預(yù)測分析,結(jié)果(圖3)表明番茄OFP基因家族蛋白成員具有1~10個保守基序(Motif),只有SlOFP8蛋白不具有Motif1保守基序。另外,除SlOFP11蛋白以外其余所有OFP蛋白都含有Motif2和Motif3保守基序,且先后順序都相同,這說明OFP基因家族在番茄中比較保守。此外,有研究表明,保守基序圖中字母越高,表明該字母對應(yīng)的堿基出現(xiàn)的頻率越大,相對保守程度也越高。由圖3可知,保守基序Motif2保守程度最高,Motif4、Motif6和Motif9基序保守程度也較高,對保守基序進(jìn)行分析將有利于探索蛋白質(zhì)的結(jié)構(gòu)組成。
2.4 番茄OFP基因家族蛋白保守結(jié)構(gòu)域序列比對和系統(tǒng)進(jìn)化樹分析
對番茄OFP基因家族蛋白序列進(jìn)行氨基酸組成對比分析,結(jié)果表明OFP基因家族蛋白存在高度保守的氨基酸序列組成的保守結(jié)構(gòu)域(OVATE結(jié)構(gòu)域),這與其在進(jìn)化過程中的功能高度保守密切相關(guān)(圖4)。
為了進(jìn)一步明確番茄OFP基因家族不同蛋白之間的親緣進(jìn)化關(guān)系,基于番茄基因組中31條OFP蛋白序列構(gòu)建系統(tǒng)進(jìn)化樹,結(jié)果顯示,番茄中已經(jīng)被鑒定功能的OVATE和SlOFP20分別與SlOFP6、SlOFP17最同源(圖4)。
2.5 番茄OFP基因家族蛋白理化性質(zhì)和亞細(xì)胞定位分析
利用ExPASy在線軟件對番茄OFP家族編碼的蛋白質(zhì)進(jìn)行理化性質(zhì)分析。結(jié)果表明,蛋白質(zhì)的氨基酸長度在81~504 之間,其中SlOFP16蛋白氨基酸數(shù)量最多,SlOFP11蛋白氨基酸數(shù)量最少;蛋白質(zhì)的相對分子質(zhì)量在10.925 74 ~57.230 52 ku之間,最大的是SlOFP16蛋白,最小的是SlOFP11蛋白;等電點(diǎn)在4.28~10.37之間,最大的是SlOFP17蛋白,最小的是SlOFP24蛋白;脂溶指數(shù)在52.3~88.11之間,最大的是SlOFP11蛋白,最小的是SlOFP31蛋白;不穩(wěn)定系數(shù)在15.72~74.16之間,最穩(wěn)定的是SlOFP11蛋白,最不穩(wěn)定的是SlOFP15蛋白;蛋白質(zhì)的總平均疏水性數(shù)值在-1.016~-0.140之間,所有蛋白質(zhì)的疏水性數(shù)值均為負(fù)值,說明番茄OFP基因家族蛋白均屬于親水性蛋白。亞細(xì)胞定位預(yù)測結(jié)果表明,SlOFP2、SlOFP10蛋白定位于內(nèi)質(zhì)網(wǎng)上,SlOFP3、SlOFP6、SlOFP18和SlOFP21蛋白定位于線粒體內(nèi),SlOFP8、SlOFP19、SlOFP22、SlOFP27、SlOFP29和SlOFP30蛋白定位于細(xì)胞質(zhì)中,僅有SlOFP26蛋白定位于過氧化物酶體內(nèi),其余OFP蛋白皆定位在細(xì)胞核上(表1)。
2.6 番茄OFP基因家族蛋白二級結(jié)構(gòu)分析
利用SOPMA在線軟件對番茄OFP基因家族成員進(jìn)行蛋白質(zhì)二級結(jié)構(gòu)預(yù)測,結(jié)果表明,番茄OFP蛋白質(zhì)都是由α-螺旋(alpha helix)、β-轉(zhuǎn)角(extended helix)、無規(guī)卷曲(random coil)和延伸鏈(extended strand)等4種二級結(jié)構(gòu)構(gòu)成(表2)。其中,SlOFP5蛋白幾乎不含β-轉(zhuǎn)角;在SlOFP4的蛋白二級結(jié)構(gòu)中,延伸鏈占比>α-螺旋占比,其余OFP蛋白二級結(jié)構(gòu)中都是α-螺旋占比>延伸鏈占比,并且所有蛋白的二級結(jié)構(gòu)中,α-螺旋和無規(guī)則卷曲占據(jù)主體部分。因此可以判斷,α-螺旋和無規(guī)則卷曲是番茄OFP蛋白的主要組成成分,β-轉(zhuǎn)角和延伸鏈散布于整個蛋白序列中,起輔助修飾作用。
2.7 番茄OFP基因家族蛋白三維結(jié)構(gòu)模擬
為了解析番茄OFP基因家族的三維構(gòu)象,采用同源建模法,利用Swiss-Modle在線軟件進(jìn)行同源建模。結(jié)果表明,SlOFP4、SlOFP6、SlOFP10、SlOFP14、SlOFP16、SlOFP17、SlOFP20、SlOFP22和SlOFP24蛋白的三級結(jié)構(gòu)相似;SlOFP2和SlOFP21蛋白的三級結(jié)構(gòu)相似;SlOFP5和SlOFP19蛋白的三級結(jié)構(gòu)也相似(圖5)。說明番茄OFP基因家族蛋白之間既存在保守性又存在差異性。
2.8 番茄OFP基因家族基因啟動子區(qū)域順式作用元件分析
通過SGN數(shù)據(jù)庫獲取番茄OFP基因家族成員起始密碼子ATG上游3 000 bp的序列,接著利用 PlantCARE 網(wǎng)站對其進(jìn)行啟動子順式作用元件分析,結(jié)果(圖6)顯示,番茄OFP基因家族成員起始密碼子上游存在著光響應(yīng)順式元件(G-Box、ACE、GT1-motif)、激素響應(yīng)應(yīng)答元件(CGTCA-motif、P-box、ABRE、TCA-element、AuxRR-core)以及逆境脅迫響應(yīng)順式元件(ARE、TC-rich repeats、LTR、MBS、DRE)。此外,胚乳表達(dá)元件(GCN4_motif)、種子特異性調(diào)控(RY-element)以及分生組織表達(dá)元件(CAT-box)在番茄OFP基因家族成員啟動子上也很常見。僅有SlOFP27基因啟動子上存在干旱、低溫及鹽脅迫響應(yīng)元件(DRE),推測該基因可能參與多個逆境脅迫響應(yīng)過程;SlOFP23、SlOFP26、SlOFP27等 3個基因啟動子上存在黃酮類生物合成基因調(diào)控元件(MBSI),預(yù)測這3個基因可能參與黃酮類生物合成過程。
2.9 番茄OFP基因家族成員轉(zhuǎn)錄表達(dá)模式分析
為了更好地探究番茄OFP基因家族在番茄生長發(fā)育過程中的生物學(xué)功能,本研究利用3萬多差異基因表達(dá)的番茄RNA-seq數(shù)據(jù)分析了番茄OFP基因在10個番茄組織中的表達(dá)水平。結(jié)果表明,OVATE和SlOFP8 2個基因在番茄花和果實中大量表達(dá),SlOFP14和SlOFP29 2個基因主要在青果時期大量表達(dá),SlOFP20 基因則主要在番茄花和根中大量表達(dá)(圖7)。
3 討論與結(jié)論
番茄是全球消費(fèi)量最大的蔬菜作物之一,兼具豐富的營養(yǎng)價值和巨大的商業(yè)價值[1]。OFP基因家族是植物特有的轉(zhuǎn)錄因子家族之一,通過赤霉素[8,17]、油菜素內(nèi)酯[18-19]、乙烯[20]以及生長素[2]等多種激素途徑,參與調(diào)控植物生長發(fā)育和非生物脅迫響應(yīng)的多個方面。近年來,隨著高等植物基因組測序的不斷發(fā)展,研究人員在馬鈴薯、葡萄、擬南芥、水稻、玉米等13種陸地植物中檢測出OFP基因[5]。但僅有少部分OFP基因的功能已被鑒定。因此,本研究利用生物信息學(xué)方法,對番茄中31個OFP基因進(jìn)行比較全面的生物信息學(xué)分析,為探究番茄OFP基因的生物學(xué)功能提供參考價值。
本研究通過對番茄OFP蛋白的基本理化性質(zhì)進(jìn)行分析發(fā)現(xiàn),番茄OFP蛋白均為親水性蛋白,且大部分蛋白不穩(wěn)定,這表明番茄OFP蛋白成員之間存在保守性。此外,通過對番茄OFP蛋白的二級結(jié)構(gòu)進(jìn)行分析發(fā)現(xiàn),α-螺旋和無規(guī)則卷曲結(jié)構(gòu)是主要的二級結(jié)構(gòu)成分,少量延伸鏈和β-轉(zhuǎn)角散布于蛋白序列中,起一定輔助修飾的作用。番茄OFP蛋白的三維構(gòu)象則更為直觀的體現(xiàn)出α-螺旋和無規(guī)則卷曲是番茄OFP蛋白的主要組成部分。
在組織特異性表達(dá)方面,OVATE、SlOFP8、SlOFP14、SlOFP20以及SlOFP29基因在果實中大量表達(dá)。另外,OVATE、SlOFP3、SlOFP8、SlOFP10、SlOFP11、SlOFP12、SlOFP18、SlOFP19及SlOFP20基因在花中表達(dá)量比較高,這表明大部分番茄OFP基因可能參與調(diào)控番茄花和果實的生長發(fā)育。然而這些番茄OFP基因具體的功能如何還需后續(xù)研究鑒定。
綜上,本研究利用各種生物信息學(xué)分析網(wǎng)站和軟件對番茄OFP基因家族進(jìn)行了全面的生物信息學(xué)分析,包括基因結(jié)構(gòu)、染色體定位、蛋白質(zhì)基本理化性質(zhì)、親緣關(guān)系以及組織特異性分析等。預(yù)測分析結(jié)果為探索OFP基因在番茄各組織生長發(fā)育及非生物脅迫響應(yīng)方面的生物學(xué)功能提供了理論依據(jù)和數(shù)據(jù)支持。
參考文獻(xiàn):
[1]Liu J,van Eck J,Cong B,et al. A new class of regulatory genes underlying the cause of pear-shaped tomato fruit[J]. Proceedings of the National Academy of Sciences of the United States of America,2002,99(20):13302-13306.
[2]Ma Y,Yang C,He Y,et al. Rice OVATE family protein 6 regulates plant development and confers resistance to drought and cold stresses[J]. Journal of Experimental Botany,2017,68(17):4885-4898.
[3]Tang Y,Zhang W,Yin Y L,et al. Expression of ovate family protein 8 affects epicuticular waxes accumulation in Arabidopsis thaliana[J]. Botanical Studies,2018,59(1):12.
[4]Wang S,Chang Y,Guo J,et al. Arabidopsis ovate family proteins,a novel transcriptional repressor family,control multiple aspects of plant growth and development[J]. PLoS One,2011,6(8):e23896.
[5]Liu D,Sun W,Yuan Y W,et al. Phylogenetic analyses provide the first insights into the evolution of OVATE family proteins in land plants[J]. Annals of Botany,2014,113(7):1219-1233.
[6]Liu J H,Zhang J,Wang J Y,et al. MuMADS1P and MaOFP1 regulate fruit quality in a tomato ovate mutant[J]. Plant Biotechnology Journal,2017,16(5):989-1001.
[7]Pagnussat G C,Yu H J,Sundaresan V. Cell-fate Switch of synergid to egg cell in Arabidopsis eostre mutant embryo sacs arises from misexpression of the BEL1-like homeodomain gene BLH1[J]. The Plant Cell,2007,19(11):3578-3592.
[8]Schmitz A J,Begcy K,Sarath G,et al. Rice ovate family protein 2 (OFP2) alters hormonal homeostasis and vasculature development[J]. Plant Science,2015,241:177-188.
[9]Li E Y,Wang S C,Liu Y Y,et al. OVATE FAMILY PROTEIN4 (OFP4) interaction with KNAT7 regulates secondary cell wall formation in Arabidopsis thaliana[J]. The Plant Journal,2011,67(2):328-341.
[10]Liu J H,Zhang J,Miao H X,et al. Elucidating the mechanisms of the tomato ovate mutation in regulating fruit quality using proteomics analysis[J]. Journal of Agricultural and Food Chemistry,2017,65(46):10048-10057.
[11]Rodríguez G R,Kim H J,Van Der Knaap E. Mapping of two suppressors of OVATE (sov) loci in tomato[J]. Heredity,2013,111(3):256-264.
[12]Wang Y,Clevenger J P,Illa-Berenguer E,et al. A comparison of sun,ovate,fs8.1 and auxin application on tomato fruit shape and gene expression[J]. Plant & Cell Physiology,2019,60(5):1067-1081.
[13]Zhou S E,Hu Z L,Li F F,et al. Overexpression of SlOFP20 affects floral organ and pollen development[J]. Horticulture Research,2019,6(1):125.
[14]Zhou S E,Cheng X,Li F F,et al. Overexpression of SlOFP20 in tomato affects plant growth,chlorophyll accumulation,and leaf senescence[J]. Frontiers in Plant Science,2019,10:1510.
[15]Wu S,Zhang B,Keyhaninejad N,et al. A common genetic mechanism underlies morphological diversity in fruits and other plant organs[J]. Nature Communications,2018,9(1):4734.
[16]霍建勇.中國番茄產(chǎn)業(yè)現(xiàn)狀及安全防范[J]. 蔬菜,2016(6):1-4.
[17]Wang S C,Chang Y,Guo J J,et al. Arabidopsis Ovate Family Protein 1 is a transcriptional repressor that suppresses cell elongation[J]. The Plant Journal,2007,50(5):858-872.
[18]Yang C,Ma Y M,He Y,et al. OsOFP19 modulates plant architecture by integrating the cell division pattern and brassinosteroid signaling[J]. The Plant Journal,2018,93(3):489-501.
[19]Yang C,Shen W J,He Y,et al. OVATE family protein 8 positively mediates brassinosteroid signaling through interacting with the GSK3-like kinase in rice[J]. PLoS Genetics,2016,12(6):e1006118.
[20]Liu J H,Zhang J,Hu W,et al. Banana ovate family protein MaOFP1 and MADS-box protein MuMADS1 antagonistically regulated banana fruit ripening[J]. PLoS One,2015,10(4):e0123870.