榮譽磊 周志林 趙冬蘭 唐君 彭湘君 趙玉琪 宗凱 呂亞寧 姚改芳 胡康棣 張華
摘要:對甘薯、番茄、擬南芥中63個SPL基因家族進行了系統(tǒng)進化樹分析、保守蛋白基序(Motif)分析,篩選歸納出同源性較高的2個分支的12個SPL基因進行理化性質分析、核定位預測等,氨基酸序列比對結果表明這些基因的功能可能較為保守。通過對番茄中的SPL基因Solyc05g015510.2、Solyc10g078700.1進行表達量分析,發(fā)現(xiàn)這2個基因可能參與調(diào)控果實成熟衰老進程。另外,通過對非生物脅迫下的轉錄水平進行分析得知,擬南芥中的AT5G43270可能參與對鹽脅迫、熱脅迫條件下的響應,AT1G27360、AT1G27370可能參與熱脅迫條件下的響應,AT2G42200可能參與冷脅迫條件下的響應,而AT3G57920在非生物脅迫條件下表達量沒有特別明顯的變化,表明AT3G57920可能不參與非生物脅迫下的響應。
關鍵詞:SPL轉錄因子家族;番茄;甘薯;擬南芥;生物信息學
中圖分類號: S188? 文獻標志碼: A
文章編號:1002-1302(2021)20-0074-10
收稿日期:2021-03-08
基金項目:國家重點研發(fā)計劃(編號:2019YFD100070、2019YFD100071、2019YFD1001300、2019YFD1001303);現(xiàn)代農(nóng)業(yè)產(chǎn)業(yè)技術體系項目(編號:CARS-10-B1);國家自然科學基金(編號:31670278、31970200、31970312、31901993、31872078);安徽省科技重大項目(編號:16030701073);中央高校基礎研究基金(編號:JZ2018HGTB0241、JZ 20181)。
作者簡介:榮譽磊(1992—),男,安徽阜陽人,碩士,研究方向為采后生物學。E-mail:990953597@qq.com。
通信作者:胡康棣,博士,副教授,研究方向為采后生物學,E-mail:kangdihu@hfut.edu.cn;張 華,博士,教授,研究方向為植物分子生物學,E-mail:hzhanglab@hfut.edu.cn。
植物基因轉錄水平的調(diào)控發(fā)生在基因表達的初期,是許多基因表達調(diào)控的主要方式。在此調(diào)控過程中,被稱為轉錄因子的蛋白質特異結合到靶基因啟動子,控制著一系列相關基因的表達[1-2]。squamosa promoter binding protein box(簡稱SBP-box)基因別稱 squamosa promoter binding protein like(簡稱SPL)基因,可編碼一類綠色植物特有的轉錄因子,調(diào)節(jié)多個不同并且重要的生物過程,如葉片發(fā)育[3]、調(diào)節(jié)細胞數(shù)量和大小[4]、花和果實的發(fā)育[5-9]、擬南芥花粉孢子的形成[10]和響應赤霉素(GA)信號[11]等。SPL基因最初是從金魚草(Antirrhinum majus)中分離出來,人們把它命名為SBP1和SBP2,研究發(fā)現(xiàn)SPL蛋白通過結合MADS-box基因啟動子的squamosa元件,控制植物花的早期發(fā)育。已知的SPL家族成員都具有高度保守的DNA結合結構域(SBP),大約含有76個氨基酸殘基,具有2個典型的C3H(C—C—CH)和C2HC(C—C—H—C)鋅指結構特征,其 C端區(qū)域具有核定位信號[12],能介導SPL蛋白進入細胞核。SPL基因由不同數(shù)量的外顯子組成,但所有陸地植物的SBP結構域都是由第一和第二外顯子編碼的,并且這2個外顯子之間的內(nèi)含子位置也是保守的[13]。SBP鋅指遵循 CC—x—C—x—C—x—[HC]—x—C—x—C—x—H—x—C(x表示氨基酸)的一般模式,其他3種組氨酸都很保守,但不參與鋅的結合[6]。此外,核磁共振技術(NMR)被用來研究擬南芥中SBP轉錄因子SPL4 和SPL7的DNA結合結構域[14]。體外試驗表明,SBP鋅指結構域優(yōu)先結合序列-TNCGTACAA-[15],然而,除了它們與DNA結合的能力之外,人們對這些潛在的轉錄調(diào)節(jié)因子的生理功能知之甚少。
自發(fā)現(xiàn)以來,SBP-box基因家族在擬南芥(Arabidopsis thaliana)[16]、水稻(Oryza sativa)[17]、玉米(Zea mays)[18]、小麥(Triticum aestivum)[19]和番茄(Solanum lycopersicum)[20]等植物中均有報道。在擬南芥中,有11個SPL基因受 miR156 調(diào)控,已有文獻報道m(xù)iR156 通過轉錄切割以及翻譯抑制來調(diào)節(jié)SPL3表達[21],擬南芥AtSPL1基因能夠參與植物發(fā)育和對伏馬菌素B1的敏感性[22]。擬南芥SBP-box基因家族轉錄因子參與花期的轉變,有報道闡明了它們在擬南芥發(fā)育中的作用,分析了可能的同源基因SPL9和SPL15的單突變體和雙突變體表型,發(fā)現(xiàn)這些基因在控制生殖生長的轉變過程中起著冗余作用。此外,在營養(yǎng)生長過程中,它們的功能缺失導致花序結構改變和分枝增強[23]。對LeSPL-CNR的研究表明,SBP-box基因在調(diào)控番茄果實成熟過程中起著重要作用,同時也證明了番茄的大量自然變異受表觀遺傳過程控制的論點[24]。部分SPL可通過調(diào)節(jié)其他轉錄因子來發(fā)揮功能,并且也能參與葡萄糖、無機鹽和腺嘌呤核苷三磷酸(ATP)生成相關的代謝過程[25]。但是SPL基因家族在甘薯發(fā)育中的功能相關研究鮮有文獻報道,在番茄和擬南芥中的基因功能研究也不是很全面,本研究運用生物信息學方法對甘薯、擬南芥、番茄中SPL家族成員理化性質、亞細胞定位、蛋白質基因序列分析、氨基酸序列比對、蛋白結構域及轉錄水平進行分析,并對可能參與的功能進行探討,以期為進一步研究SPL基因在甘薯、番茄、擬南芥中的功能提供借鑒。
1 試驗方法
1.1 SPL基因家族系統(tǒng)進化樹分析與保守蛋白基序(motif)分析
從Phytozome(https://phytozome.jgi.doe.gov/pz/portal.html)網(wǎng)站下載擬南芥和番茄中已鑒定的33條SPL蛋白序列作為參考,其中擬南芥中16條,番茄中17條,利用甘薯網(wǎng)站(http://sweetpotato.plantbiology.msu.edu)中蛋白序列數(shù)據(jù)庫blastp 檢索甘薯蛋白數(shù)據(jù)庫獲得30條候選序列。利用MEGA 7.0軟件使用Neighbor-Joining法構建SPL家族蛋白的系統(tǒng)發(fā)育樹,利用iTOL工具網(wǎng)站(http://itol.embl.de/)對系統(tǒng)發(fā)育進化樹進行優(yōu)化。利用MEME網(wǎng)站(https://meme-suite.org/meme/tools/meme)對SPL蛋白基序(motif)進行分析。將得到的系統(tǒng)發(fā)育樹與motif分析結果進行對比,找到同源性較高且系統(tǒng)發(fā)育樹結果和motif分析結果吻合的SPL分支進行深入分析。
1.2 SPL基因家族理化性質分析與亞細胞定位預測
利用ExPASy網(wǎng)站(https://web.expasy.org/protparam/)對2個同源性較高的分支中的12個SPL基因的序列長度、蛋白質等電點、分子量等理化參數(shù)進行分析,并利用核定位信號NLS Mapper工具(http://nls-mapper.iab.keio.ac.jp/cgi-bin/NLS_Mapper_form.cgi)預測蛋白質的核定位信號,隨后通過 Cell-PLoc 2.0 預測了這12個蛋白質的亞細胞定位。
1.3 同源SPL蛋白結構域分析及氨基酸序列比對
將上述篩選得到的2個分支12個SPL基因利用SMART(http://smart.embl.de/)網(wǎng)站分別進行蛋白結構域分析,并利用ESPript 3.0(https://espript.ibcp.fr/ESPript/ESPript/)網(wǎng)站進行氨基酸序列比對分析。
1.4 番茄中SPL基因表達量分析
將篩選得到的2個分支中番茄的SPL基因利用TomExpress(http://tomexpress.toulouse.inra.fr/)網(wǎng)站,挖掘基因表達數(shù)據(jù),并進行繪圖和分析。
1.5 非生物脅迫條件下的擬南芥中SPL基因表達量分析
將上述篩選得到的2個分支中擬南芥中的SPL基因利用ePlant工具(http://bar.utoronto.ca/eplant/)獲取擬南芥中非生物脅迫條件下SPL基因的表達數(shù)據(jù),并進行繪圖和分析。
2 結果與分析
2.1 甘薯、番茄、擬南芥中SPL家族蛋白進化樹與motif分析
將BLAST同源比對獲得的63條SPL家族蛋白利用MEGA 7.0 軟件構建系統(tǒng)發(fā)育樹。如圖1所示,3個分支中,Solyc04g064470.1獨自在一個分支中,表明較其他家族成員親緣性較遠,第2個分支中包括AT5G18830、Solyc01g080670.2、itf01g13650.t1,第3個分支包括其余甘薯、番茄、擬南芥中59個SPL基因。其中甘薯itf05g01080.t1、itf08g18710.t1、itf13g017290.t1與番茄Solyc05g015510.2以及擬南芥AT5G43270、AT1G27370、AT1G27360在同一個分支,說明它們親緣性較高,可能具有相似的基因功能。甘薯itf15g02920.t1、itf01g24210.t1與擬南芥AT2G42200、AT3G57920以及番茄Solyc10g078700.1在同一個分支,說明它們親緣性較高,可能具有相似的基因功能。
隨后,利用MEME網(wǎng)站分析甘薯、番茄、擬南芥中63個SPL家族蛋白的保守蛋白基序(motif)。由圖2可以看到SBP-box 蛋白基序分布,不同顏色的方塊代表不同基序。其中,itf05g01080t1、itf08g18710.t1、itf13g017290.t1與Solyc05g015510.2以及AT5G43270、AT1G27370、AT1G27360的motif具有很大的相似性,這一點與基因家族進化樹的結果相符合,另外,itf15g02920.t1、 itf01g24210.t1與AT2G42200、AT3G57920、Solyc10g078700.1的motif結果也很相似,與進化樹結果一致。
2.2 甘薯、番茄、擬南芥中SPL蛋白家族理化性質與亞細胞定位預測
通過對圖2中保守性較高的2個分支中12個SPL基因核酸序列和氨基酸序列進行理化分析,結果(表1)表明,蛋白質編碼區(qū)(CDS)序列長度為 1 038~1 392 bp,蛋白質編碼序列為345~463個氨基酸殘基,蛋白分子量為37 017.17~50 418.90 g/mol,等電點(pI)介于7.94~9.11之間。在蛋白質序列的整個區(qū)域內(nèi),對SPL蛋白的核定位信號序列(NLS)進行分析,通過 NLS Mapper 網(wǎng)站進行預測。如表1所示,5個擬南芥SPL基因中有3個含有潛在的 NLS,2個番茄SPL基因都沒有含有潛在的NLS,5個甘薯SPL基因中只有1個含有潛在的 NLS,說明部分SPL蛋白可能在細胞核中發(fā)揮作用。
同時,利用Cell-PLoc 2.0 預測了這12個SPL家族蛋白的亞細胞定位。如表2所示,12個SPL家族蛋白均定位在細胞核內(nèi),值得注意的是其中有3個SPL家族蛋白也存在細胞質內(nèi)。
2.3 SPL家族蛋白的結構域分析及氨基酸序列比對
對上述12個同源性較高的SPL基因進行結構域分析(圖3),發(fā)現(xiàn)這12個基因都具有典型的SBP結構域,且第1個分支的SBP結構域的位置在第170~250個氨基酸,第2個分支的SBP結構域的位置在第50~160個氨基酸,說明這2個分支都具有保守的SBP轉錄因子結構域,但SBP結構域的位置明顯不同。
通過對上述SPL基因進行氨基酸序列對比分析發(fā)現(xiàn),itf05g01080.t1、itf08g18710.t1、itf13g017290.t1、Solyc05g015510.2、AT5G43270、AT1G27370、AT1G27360的序列之間具有差異性,然而均具有高度保守的SBP結構域(圖4-a),保守的SBP結構域包括2個鋅指結構和NLS,第2個鋅指結構與NLS有重疊,itf15g02920.t1、itf01g24210.t1、AT2G42200、AT3G57920、Solyc10g078700.1也具有高度保守的SBP結構域(圖4-b),也具有2個鋅指結構和1個NLS。該結構域富含半胱氨酸和組氨酸的基序,表明在分子層面這些基因也具有高度同源性。
2.4 番茄中SPL基因表達水平分析
分析番茄中2個的SPL基因表達量(圖5)可知,Solyc10g078700.1在番茄組織中大部分時間表達量是處于一個較穩(wěn)定的狀態(tài),然而在開花后4 d表達量急速增加,在開花后41 d及以后,表達量減少,這說明這個基因可能參與果實成熟過程中相關通路的途徑。Solyc05g015510.2在其他組織中的表達量在0.04左右,但是在果實破色期到紅熟期之間,基因表達量快速上升,這表明該基因可能參與果實成熟衰老的過程。
2.5 擬南芥SPL基因在非生物脅迫條件下的轉錄水平分析
篩選出來的12個SPL基因中,有5個擬南芥基因,在網(wǎng)站里檢索這5個SPL基因在冷、熱、干旱等脅迫下基因的表達量。如圖6-A所示,AT5G43270在遭受鹽脅迫、熱脅迫0.5 h后幼苗中SPL基因表達量急速下降,在這之后的24h內(nèi)呈上升趨勢,有的甚至超過對照組,說明AT5G43270可能參與擬南芥對鹽脅迫、熱脅迫條件下的反應。圖6-B 中AT1G27360在遭受熱脅迫12 h后幼苗中SPL基因表達量急速上升,超過對照組,說明AT1G27360可能參與熱脅迫條件下的響應。圖6-C中AT1G27370在遭受熱脅迫6 h后幼苗中SPL基因表達量急速上升,在8 h左右時超過對照組,說明AT1G27370可能參與熱脅迫條件下的響應。而根中基因表達量與對照組相比,沒有明顯差異。由圖6-D可知, 另外一個分支中的AT2G42200在冷脅迫條件下 12 h 后幼苗中SPL基因表達量急劇上升,說明AT2G42200可能參與冷脅迫條件下的響應,根中的SPL基因表達量在受到非生物脅迫時幾乎沒有變化。由圖6-E可知,AT3G57920在非生物脅迫條件下表達量沒有特別明顯的變化,說明AT3G57920可能不參與非生物脅迫條件下的響應,根中的基因表達量在受到非生物脅迫時也幾乎沒有變化。
3 討論
本研究利用BLAST同源比對,獲得甘薯、番茄、擬南芥中的63個SPL家族蛋白,并進行進化樹分析,結果表明甘薯itf05g01080.t1、itf08g18710.t1、itf13g017290.t1與番茄Solyc05g015510.2以及擬南芥AT5G43270、AT1G27370、AT1G27360在同一個分支,這7個SPL基因雖然不在同一物種中,但是親緣性較高。甘薯itf15g02920.t1、itf01g24210.t1與擬南芥AT2G42200、AT3G57920以及番茄Solyc10g078700.1在同一個分支,說明它們親緣性較高。motif分析結果與基因家族進化樹的結果相符合,進而歸納出2個SPL基因家族的分支,基因結構域分析發(fā)現(xiàn)這2個分支的12個SPL基因都具有典型的SBP結構域。
通過對上述12個SPL基因進行氨基酸序列的對比分析發(fā)現(xiàn),其中含有itf05g01080.t1、itf08g18710.t1、itf13g017290.t1、Solyc05g015510.2、AT5G43270、AT1G27370、AT1G27360的分支序列之間雖然具有差異性,但是均具有高度保守的SBP結構域,保守的SBP結構域包括2個鋅指結構和NLS,第2個鋅指結構與NLS有重疊,itf15g02920.t1、itf01g24210.t1、AT2G42200、AT3G57920、Solyc10g078700.1也具有2個鋅指結構和1個NLS。該結構域的相同結構表明在分子層面這些基因也具有結構同源性。
最后進行基因功能驗證,表明Solyc10g078700.1這個基因可能參與果實成熟過程中相關通路的途徑,Solyc05g015510.2這個基因可能參與果實成熟衰老的過程,擬南芥中AT5G43270可能參與擬南芥對鹽脅迫、熱脅迫條件下的反應,AT1G27360、AT1G27370可能參與熱脅迫條件下的響應。而另外一個分支中可以看到,AT2G42200在冷脅迫條件下12 h后幼苗中SPL基因表達量上升,說明AT2G42200可能參與冷脅迫條件下的響應,AT3G57920在非生物脅迫條件下表達量沒有特別明顯的變化。本研究初步篩選了甘薯、番茄、擬南芥中的SPL基因,并利用生物信息學方法對理化性質、亞細胞定位預測、蛋白基序、氨基酸序列比對、蛋白結構域及轉錄水平進行了分析,并對可能參與的功能進行了探討,為進一步研究SPL基因在番茄、擬南芥、甘薯中的功能提供了一定借鑒作用。
參考文獻:
[1]Cawley S,Bekiranov S,Ng H H,et al. Unbiased mapping of transcription factor binding sites along human chromosomes 21 and 22 points to widespread regulation of noncoding RNAs[J]. Cell,2004,116(4):499-509.
[2]楊致榮,王興春,李西朋,等. 高等植物轉錄因子的研究進展[J]. 遺傳,2004,26(3):403-408.
[3]Wu G,Poethig R S,Wu G,et al. Temporal regulation of shoot development in Arabidopsis thaliana by miR156 and its target SPL3[J]. Development,2006,133(18):3539-3547.
[4]Usami T,Horiguchi G,Yano S,et al. The more and smaller cells mutants of Arabidopsis thaliana identify novel roles for SQUAMOSA PROMOTER BINDING PROTEIN-LIKE genes in the control of heteroblasty[J]. Development,2009,136(6):955-964.
[5]Cardon G H,Hhmann S,Nettesheim K,et al. Functional analysis of the Arabidopsis thaliana SBP-box gene SPL3:a novel gene involved in the floral transition[J]. Plant Journal,1997,12(2):367-377.
[6]Klein J,Saedler H,Huijser P,et al. A new family of DNA binding proteins includes putative transcriptional regulators of the Antirrhinum majus floral meristem identity gene SQUAMOSA[J]. Molecular and General Genetics,1996,250(1):7-16.
[7]Tr M,Poole M,Hong Y G,et al. A naturally occurring epigenetic mutation in a gene encoding an SBP-box transcription factor inhibits tomato fruit ripening[J]. Nature Genetics,2006,38(8):948-952.
[8]Jiao Y Q,Wang Y H,Xue D W,et al. Regulation of OsSPL14 by OsmiR156 defines ideal plant architecture in rice[J]. Nature Genetics,2010,42(6):541-544.
[9]Wang H,Nussbaum-Wagler T,Li B,et al. The origin of the naked grains of maize[J]. Nature,2005,436(7051):714-719.
[10]Unte U S,Sorensen A,Pesaresi P,et al. SPL8,an SBP-box gene that affects pollen sac development in Arabidopsis[J]. Plant Cell,2003,15(4):1009-1019.
[11]Zhang Y,Schwarz S,Saedler H,et al. SPL8,a local regulator in a subset of gibberellin-mediated developmental processes in Arabidopsis[J]. Plant Molecular Biology,2007,63(3):429-439.
[12]Birkenbihl R P,Jach G,Saedler H,et al. Functional dissection of the plant-specific SBP-domain:overlap of the DNA binding and nuclear localization domains[J]. Journal of Molecular Biology,2005,352(3):585-596.
[13]Cuo J,Song J,Wang F,et al. Genome-wide identification and expression analysis of rice cell cycle genes[J]. Plant Molecular Biology,2007,64(4):349-360.
[14]Yamasaki K,Kigawa T,Inoue M,et al. A novel zinc-binding motif revealed by solution structures of DNA-binding domains of Arabidopsis SBP-family transcription factors[J]. Journal of Molecular Biology,2004,337(1):49-63.
[15]Cardon G,Hhmann S,Klein J,et al. Molecular characterisation of the Arabidopsis SBP-box genes[J]. Gene,1999,237(1):91-104.
[16]Cardon G H,Hhmann S,Nettesheim K,et al. Functional analysis of the Arabidopsis thaliana SBP-box gene SPL3:a novel gene involved in the floral transition[J]. Plant Journal,1997,12(2):367-377.
[17]Miura K,Ikeda M,Matsubara A,et al. OsSPL14 promotes panicle branching and higher grain productivity in rice[J]. Nature Genetics,2010,42(6):545-549.
[18]Hultquist J F,Dorweiler J E. Feminized tassels of maize mop1 and ts1 mutants exhibit altered levels of miR156 and specific SBP-box genes[J]. Planta,2008,229(1):99-113.
[19]劉 霞,張 斌,毛新國,等. 小麥tae-miR156前體基因的克隆及基靶基因TaSPL17多態(tài)性分析[J]. 遺傳,2014,36(6):592-602.
[20]Salinas M,Xing S P,Hhmann S,et al. Genomic organization,phylogenetic comparison and differential expression of the SBP-box family of transcription factors in tomato[J]. Planta,2012,235(6):1171-1184.
[21]Gandikota M,Birkenbihl R P,Hhmann S,et al. The miRNA156/157 recognition element in the 3′ UTR of the Arabidopsis SBP box gene SPL3 prevents early flowering by translational inhibition in seedlings[J]. Plant Journal,2010,49(4):683-693.
[22]Stone J M,Liang X W,Nekl E R,et al. Arabidopsis AtSPL14,a plant-specific SBP-domain transcription factor,participates in plant development and sensitivity to fumonisin B1[J]. The Plant Journal,2005,41(5):744-754.
[23]Schwarz S,Grande A V,Bujdoso N,et al. The microRNA regulated SBP-box genes SPL9 and SPL15 control shoot maturation in Arabidopsis[J]. Plant Molecular Biology,2008,67(1/2):183-195.
[24]Manning K,Tr M,Poole M,et al. A naturally occurring epigenetic mutation in a gene encoding an SBP-box transcription factor inhibits tomato fruit ripening[J]. Nature Genetics,2006,38:948-952.
[25]Wang Y,Hu Z L,Yang Y X,et al. Function annotation of an SBP-box gene in Arabidopsis based on analysis of co-expression networks and promoters[J]. International Journal of Molecular Sciences,2009,10(1):116-132.