董晨 李偉才 魏永贊 王弋 鄭雪文 胡會(huì)剛
摘 要 β-淀粉酶(beta-amylase,Bmy)是一類(lèi)關(guān)鍵的淀粉水解酶,在香蕉果實(shí)成熟淀粉降解轉(zhuǎn)化為可溶性糖的過(guò)程中發(fā)揮著重要的作用。為了全面了解Bmy基因在香蕉基因組中的特征,研究基于香蕉基因組數(shù)據(jù),通過(guò)生物信息學(xué)的方法對(duì)香蕉Bmy基本理化性質(zhì)、二級(jí)結(jié)構(gòu)預(yù)測(cè)、亞細(xì)胞定位、內(nèi)含子和外顯子結(jié)構(gòu)和保守結(jié)構(gòu)域進(jìn)行初步的預(yù)測(cè)與分析,并構(gòu)建系統(tǒng)發(fā)育樹(shù)。結(jié)果表明:編碼香蕉β-淀粉酶的基因有15個(gè),根據(jù)在染色體的位置命名為MaBmy1~15,MaBmy基因家族編碼的氨基酸范圍在68~1 453 aa,編碼的蛋白相對(duì)分子量介于7.8~162.6 ku之間,15個(gè)MaBmy蛋白中有10個(gè)偏酸性,5個(gè)偏堿性。不穩(wěn)定指數(shù)分析發(fā)現(xiàn)6個(gè)MaBmy蛋白為穩(wěn)定蛋白;疏水性分析表明,所有的MaBmy蛋白為親水性蛋白;香蕉MaBmy家族內(nèi)含子最少含有2個(gè),最多的含有10個(gè);進(jìn)化分析表明,MaBmy家族分4個(gè)亞家族,且與水稻的親緣關(guān)系較近。研究結(jié)果為深入探討MaBmy基因的功能及調(diào)控香蕉果實(shí)成熟的應(yīng)用奠定基礎(chǔ)。
關(guān)鍵詞 香蕉;β-淀粉酶;基因家族;系統(tǒng)進(jìn)化分析
中圖分類(lèi)號(hào) S668.1 文獻(xiàn)標(biāo)識(shí)碼 A
Bmy(EC3.2.1.2)是一種外切酶,作用于α-1,4-線性糖苷鏈的非還原末端,逐次以麥芽糖為單位切斷α-1,4-葡聚糖鏈,從而產(chǎn)生麥芽糖和有限糊精[1]。Bmy屬于糖苷水解酶家族14,含有一個(gè)保守結(jié)構(gòu)域Glyco_hydro_14結(jié)構(gòu)域(PF01373)。這個(gè)保守結(jié)構(gòu)域含有2個(gè)高度保守的區(qū)域,分別位于N端以及另外一個(gè)相對(duì)中心的位置[2]。研究證明,Bmy在許多植物中表現(xiàn)為多基因家族。例如,擬南芥基因組中可能含有9個(gè)Bmy基因(AtBmy1~9)[3]。水稻有10個(gè),玉米13個(gè),二穗短柄草11個(gè),高粱和谷子各10個(gè)Bmy基因[4]。其中,AtBmy1~AtBmy4為葉綠體質(zhì)類(lèi)型,在淀粉降解中發(fā)揮不同的作用;AtBmy3是夜間葉片淀粉降解主要的催化基因;而AtBmy4對(duì)AtBmy1和AtBmy3基因編碼的酶活起到調(diào)控作用。擬南芥中2個(gè)在根系生長(zhǎng)發(fā)育過(guò)程中起關(guān)鍵作用的轉(zhuǎn)錄因子AtBmy7和AtBmy8分別結(jié)合一個(gè)順式作用元件,其中都包含一個(gè)Gbox和一個(gè)類(lèi)似BR-反應(yīng)元件[5]。通過(guò)分子克隆等生物學(xué)方法已分別從水稻、大麥、黑麥、小麥、玉米中克隆出多個(gè)Bmy編碼基因[6]。
淀粉的降解是由α-淀粉酶和Bmy協(xié)同作用的結(jié)果;淀粉是香蕉果實(shí)以及其他許多肉質(zhì)果實(shí)發(fā)育過(guò)程中碳同化物的一種過(guò)渡形式,其降解代謝同果實(shí)發(fā)育過(guò)程密切相關(guān)[7-11]。汪永保研究菠蘿蜜成熟過(guò)程中Bmy基因的表達(dá)時(shí)發(fā)現(xiàn),Bmy參與調(diào)控菠蘿蜜果實(shí)成熟中淀粉粒被降解成可溶性糖的過(guò)程,但Bmy基因相對(duì)于ɑ-淀粉酶基因來(lái)說(shuō)表達(dá)量相對(duì)較低,推測(cè)二者可能共同影響著菠蘿蜜果實(shí)質(zhì)地和品質(zhì)的形成[12]。在香蕉中,未成熟的果實(shí)果肉中有大量的淀粉存在,而在成熟期的果肉中這些淀粉被Bmy催化降解為可溶性糖[13]。王永章等[14]認(rèn)為Bmy可能參與了蘋(píng)果果實(shí)內(nèi)淀粉的降解,與果實(shí)成熟有一定關(guān)系。
香蕉是熱帶亞熱帶最重要的水果之一,在果實(shí)發(fā)育過(guò)程中淀粉的合成和降解是其重要的生理過(guò)程,這個(gè)過(guò)程不僅影響香蕉的產(chǎn)量,同時(shí)也影響香蕉果實(shí)的品質(zhì)。2012年已完成并公布了香蕉全基因組測(cè)序結(jié)果,在全基因組范圍內(nèi)對(duì)家族基因進(jìn)行分析鑒定和進(jìn)化分析以及相關(guān)基因功能推測(cè)提供了數(shù)據(jù)支持[15]。迄今為止,香蕉全基因組水平上E2基因家族[16]和ARF基因家族[17]已先后被鑒定出來(lái),而關(guān)于Bmy家族的報(bào)道較少。本研究通過(guò)對(duì)香蕉全基因組的分析,鑒定出其Bmy家族的全部基因,并且對(duì)鑒定出的家族基因進(jìn)行基本理化性質(zhì)分析、基因結(jié)構(gòu)分析、序列比對(duì)分析、進(jìn)化分析及保守基序進(jìn)行分析,為更深入開(kāi)展MaBmy基因的功能及調(diào)控香蕉果實(shí)成熟的應(yīng)用奠定基礎(chǔ)。
1 材料與方法
1.1 材料
以香蕉(Musa acuminata)為研究對(duì)象,基因數(shù)據(jù)來(lái)源于Phytozome11基因組數(shù)據(jù)庫(kù)(https://phytozome.jgi.doe.gov/pz/portal.html)及The Banana Genome Hub數(shù)據(jù)庫(kù)(http://banana-genome.cirad.fr/)。
1.2 方法
1.2.1 擬南芥、水稻和玉米Bmy基因序列的獲取
利用擬南芥TAIR數(shù)據(jù)庫(kù)(http://www.arabidopsis.org/)和水稻RAP數(shù)據(jù)庫(kù)(http://rapdb.dna.affrc.go.jp/)以及Phytozome11基因組數(shù)據(jù)庫(kù)(https://phytozome.jgi.doe.gov/pz/portal.html)通過(guò)基因查找和Blast序列比對(duì),最終找出擬南芥、水稻和香蕉中所有Bmy基因序列并編號(hào)。
1.2.2 香蕉Bmy基因的氨基酸序列屬性分析
將獲得的香蕉Bmy的氨基酸序列投入ExPASy(http://www.expasy.org/)站點(diǎn),利用其中的ProtParam tool軟件分析Bmy蛋白的分子量、等電點(diǎn)、不穩(wěn)定系數(shù)、脂肪指數(shù)和疏水性等基本的理化性質(zhì)。香蕉Bmy蛋白亞細(xì)胞定位采用Plant-mPLoc Server(http://www.csbio.sjtu.edu.cn/bioinf/plant-multi/#)分析。二級(jí)結(jié)構(gòu)分析采用在線SOPMA程序(http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)分析。所有參數(shù)均為默認(rèn)值。
1.2.3 香蕉Bmy基因結(jié)構(gòu)分析 從香蕉基因組數(shù)據(jù)庫(kù)得到的香蕉Bmy的基因序列和cDNA序列,利用Gene Structure Display Server(http://gsds.cbi.pku.edu.cn/index.php)分析內(nèi)含子和外顯子組成。MaBmy保守結(jié)構(gòu)域采用PFAM(http://pfam.xfam.org/search)在線工具查找。
1.2.4 多序列比對(duì)和系統(tǒng)進(jìn)化分析 利用Clustal X1.83對(duì)香蕉、水稻和擬南芥中所有Bmy蛋白序列進(jìn)行比對(duì),結(jié)合MEGA6.0軟件構(gòu)建香蕉Bmy蛋白以及擬南芥、水稻蛋白的系統(tǒng)發(fā)育進(jìn)化樹(shù),系統(tǒng)發(fā)育進(jìn)化樹(shù)生成采用鄰接法(neighbor joining,NJ),參數(shù)設(shè)置:使用neighbor-joining法則的P-距離(P-distance)模型構(gòu)建,選擇了成對(duì)刪除(pairwise deletion)空位(gap)的選項(xiàng),Bootstrap method取值1 000。
1.2.5 香蕉Bmy蛋白的結(jié)構(gòu)和保守基序查找與注釋
香蕉Bmy蛋白家族蛋白的保守基序采用MEME4.0(http://meme.nbcr.net/meme/)分析,基序的最大數(shù)目設(shè)置為10,基序長(zhǎng)度設(shè)為6~200個(gè)氨基酸。對(duì)得到的保守基序運(yùn)用SMART(http://smart.embl-heidelberg.de/)在線工具進(jìn)行功能注釋,并且參照擬南芥和水稻的命名模式進(jìn)行命名。
2 結(jié)果與分析
2.1 β-淀粉酶全基因組鑒定及基本理化性質(zhì)分析
通過(guò)分析驗(yàn)證共獲得編碼淀粉酶的基因15個(gè),分別根據(jù)它們?cè)诿總€(gè)物種中的染色體位置命名(MaBmy1-15)。MaBmy均勻的分布在1/2/3/4/5/6/7/8/10號(hào)染色體上,其中有一條在染色體上無(wú)法定位,命名為MaBmy1。除了3號(hào)染色體上有3個(gè)MaBmy,2/5/6號(hào)染色體上有2個(gè)MaBmy,其余的染色體上均為1個(gè),詳見(jiàn)表1。對(duì)序列的分析結(jié)果顯示,香蕉MaBmy基因的編碼區(qū)域(ORF)長(zhǎng)度范圍跨度較大,在 207(MaBmy12)~4362 bp(MaBmy14) 之間,對(duì)應(yīng)編碼蛋白的氨基酸數(shù)目為68~1453個(gè),對(duì)應(yīng)的編碼蛋白分子量在7.8~162.6 ku之間。等電點(diǎn)分析發(fā)現(xiàn):5個(gè)MaBmy蛋白等電點(diǎn)大于8.0顯堿性;10個(gè)MaBmy蛋白等電點(diǎn)小于6.5顯酸性,其中MaBmy15最小,為5.08。不穩(wěn)定指數(shù)分析發(fā)現(xiàn)6個(gè)香蕉MaBmy(MaBmy-1,-4,-6,-7,-12,-15)蛋白不穩(wěn)定指數(shù)小于40,為穩(wěn)定蛋白,9個(gè)MaBmy大于40,為不穩(wěn)定蛋白。疏水性分析表明,所有的MaBmy蛋白為親水性蛋白。
對(duì)香蕉Bmy的15個(gè)蛋白二級(jí)結(jié)構(gòu)分析(表2)發(fā)現(xiàn):MaBmy蛋白二級(jí)結(jié)構(gòu)均由α-螺旋、擴(kuò)展鏈結(jié)構(gòu)、β-轉(zhuǎn)角和無(wú)規(guī)則卷曲4種形式組成,且全部氨基酸序列的二級(jí)結(jié)構(gòu)都以α-螺旋和無(wú)規(guī)則卷曲為主。在MaBmy-2,-4,-7,-8,-9,-11中各組成的百分比為無(wú)規(guī)則卷曲>α-螺旋>擴(kuò)展鏈結(jié)構(gòu)>β-轉(zhuǎn)角,其余的9個(gè)MaBmy-1,-3,-5,-6,-10,-12,-13,-14,-15蛋白組成的百分比均為α-螺旋>無(wú)規(guī)則卷曲>擴(kuò)展鏈結(jié)構(gòu)>β-轉(zhuǎn)角。用Plant-mPLoc對(duì)MaBmy基因家族的蛋白質(zhì)進(jìn)行亞細(xì)胞定位分析,不同的MaBmy蛋白定位于細(xì)胞核、細(xì)胞質(zhì)、細(xì)胞膜、細(xì)胞壁及線粒體、葉綠體、過(guò)氧化物酶體中。
2.2 香蕉Bmy家族基因結(jié)構(gòu)、結(jié)構(gòu)域及系統(tǒng)進(jìn)化分析
利用GSDS基因結(jié)構(gòu)作圖軟件對(duì)香蕉Bym家族基因成員的基因結(jié)構(gòu)進(jìn)行分析,見(jiàn)圖1所示,香蕉15個(gè)Bmy基因均由外顯子和內(nèi)含子組成。內(nèi)含子數(shù)目范圍在2~10之間,其中MaBmy-5,-6,-9,-12內(nèi)含子數(shù)目最少,含有2個(gè)內(nèi)含子;內(nèi)含子數(shù)目最多的是MaBmy2。利用Pfam工具鑒定MaBmy基因編碼的蛋白均含有保守結(jié)構(gòu)域Glycosyl hydrolase family 14 domain(PF01373),結(jié)果見(jiàn)圖2黃色方框所示。
對(duì)香蕉Bmy進(jìn)行的基因結(jié)構(gòu)分析表明,該家族基因間發(fā)生了明顯的分化。為進(jìn)一步了解香蕉Bmy各基因之間的系統(tǒng)進(jìn)化關(guān)系,本研究利用香蕉15個(gè)Bmy基因編碼的蛋白質(zhì)序列及雙子葉模式植物擬南芥、單子葉模式植物水稻的Bmy蛋白序列構(gòu)建系統(tǒng)發(fā)育樹(shù)。結(jié)果見(jiàn)圖3所示,15個(gè)MaBmy分為4個(gè)亞家族,且與水稻的親緣關(guān)系較近,聚類(lèi)聚在一起。香蕉Bmy進(jìn)化關(guān)系較近的在基因長(zhǎng)度大小,基因結(jié)構(gòu)等方面相似,例如MaBmy-5,-9均含有3個(gè)外顯子,氨基酸數(shù)目分別為-531,-547。
2.3 Bmy蛋白的結(jié)構(gòu)和保守基序分析
通過(guò)MEME軟件預(yù)測(cè)擬南芥、水稻、香蕉Bmy蛋白的保守基序, 結(jié)果見(jiàn)圖4所示;用SMART軟件對(duì)預(yù)測(cè)的保守基序進(jìn)行命名,結(jié)果見(jiàn)表3所示。結(jié)果顯示, 3個(gè)物種 Bmy蛋白家族中共有34個(gè)Bmy蛋白,其中有16個(gè)蛋白擁有9個(gè)基序(基序1,3~ 10);擬南芥中9個(gè)Bmy蛋白其中有5個(gè)(AtBmy-1,-4,-5,-6,-7)含有9個(gè)基序,AtBmy-2,-3含有5個(gè)基序,其余2個(gè)AtBmy-9,-8蛋白分別含有8和4個(gè)基序;水稻中10個(gè)Bmy蛋白有6個(gè)(OsBmy-3,-5,-6,-7,-9,-10)含有9個(gè)基序,其余4個(gè)(OsBmy-1,-4,-8,-2)分別含有-8,-6,-5,-4個(gè)基序。15個(gè)香蕉Bmy蛋白有5個(gè)(MaBmy-8,-10,-13,-14,-15)含有9個(gè)基序,4個(gè)(MaBmy-4,-5,-9,-11)含有8個(gè)基序,其余的MaBmy-1,-2,-3,-7,-6,-12分別含有-6,-5,-4,-3,-2,-1個(gè)基序。在基序分析中,通過(guò)SMART在線工具進(jìn)行基序命名,詳見(jiàn)表4,基序-1,-2,-3,-6,-7,-8均注釋為為糖苷水解酶家族14(Glyco_hydro_14)。
3 討論與結(jié)論
香蕉作為重要的熱帶亞熱帶水果,被世界糧農(nóng)組織列為第四大作物,淀粉作為采前香蕉果實(shí)的主要組成成分,后熟過(guò)程中淀粉降解為可溶性糖。淀粉水解酶在淀粉降解過(guò)程中發(fā)揮著重要的作用。然而目前為止,關(guān)于香蕉全基因鑒定Bmy基因家族尚未見(jiàn)報(bào)道。目前,植物全基因組測(cè)序的完成加速對(duì)植物基因的全面了解,由單個(gè)基因研究上升到了基因組學(xué)以及功能基因組學(xué)的水平[18]。隨著植物基因組研究的深入,利用比較基因組學(xué)研究策略,通過(guò)廣泛的基因家族分析,奠定基因功能研究的基礎(chǔ),現(xiàn)已成為基因功能研究的熱點(diǎn)。2012年香蕉的基因組已經(jīng)測(cè)序完成,為研究者深入發(fā)掘關(guān)鍵基因提供了大量的數(shù)據(jù)。本研究通過(guò)對(duì)香蕉進(jìn)行全基因組生物信息學(xué)分析,成功鑒定得到15個(gè)香蕉Bmy蛋白家族成員,該基因家族均含有糖苷水解酶家族14的保守結(jié)構(gòu)域Glycosyl hydrolase family 14 domain(PF01373),家族基因數(shù)目以及亞家族分類(lèi)與擬南芥、水稻類(lèi)似[3-4],說(shuō)明Bmy不論是在單子葉植物還是雙子葉植物中是一類(lèi)植物進(jìn)化中相對(duì)較保守的家族。
基因家族是由祖先基因在基因的復(fù)制過(guò)程中通過(guò)重復(fù)和變異產(chǎn)生,研究基因家族的系統(tǒng)進(jìn)化,分析家族基因的基因結(jié)構(gòu)組成具有重要意義。為了探索MaBmy基因家族的多樣性,筆者使用GSDS在線軟件預(yù)測(cè)MaBmy基因結(jié)構(gòu)。結(jié)果顯示,香蕉Bmy基因家族成員均由外顯子和內(nèi)含子組成。香蕉Bmy基因家族內(nèi)含子數(shù)目范圍在2~10之間,而擬南芥家族成員內(nèi)含子數(shù)目范圍在2~9之間,水稻的內(nèi)含子數(shù)目范圍在1~10之間[3-4];進(jìn)化分析表明,在4個(gè)亞家族中,進(jìn)化關(guān)系較近家族成員的聚在一起,其基因結(jié)構(gòu)和氨基酸組成相似,例如:Group I中MaBmy-11,-13,OsBmy1均含有3個(gè)內(nèi)含子,氨基酸組成分別為-542,-561,-566 aa,這類(lèi)基因在進(jìn)化過(guò)程中保守,這與楊澤峰等對(duì)禾本科Bmy基因的研究結(jié)果一致[4]。然而,還有一類(lèi)基因雖然在進(jìn)化過(guò)程中親緣關(guān)系較近,但是在基因結(jié)構(gòu)及氨基酸組成差異較大,產(chǎn)生這類(lèi)分化的原因是基因在進(jìn)化過(guò)程中產(chǎn)生了新的生物學(xué)功能。
本研究基于香蕉gene bank database在全基因水平上鑒定分析了MaBmy基因家族,并對(duì)其氨基酸序列、基因結(jié)構(gòu)、系統(tǒng)進(jìn)化、染色體定位以及保守基序進(jìn)行了全面分析,為今后進(jìn)一步研究香蕉Bmy基因家族的功能和調(diào)控機(jī)理奠定基礎(chǔ)。
參考文獻(xiàn)
[1] Scheidig A, Frohlich A, Schulze S, et al. Downregulation of a chloroplast-targeted β-amylase leads to a starch-excess phenotype in leaves[J]. The Plant Journal, 2002, 30(5): 581-591.
[2] Totsuka A, Nong H, Kadokawa H, et al. Residues essential for catalytic activity of soybean β‐amylase[J]. European Journal of Biochemistry, 1994, 221(2): 649-654.
[3] Valerio C, Costa A, Marri L, et al. Thioredoxin-regulated β-amylase(BAM1)triggers diurnal starch degradation in guard cells, and in mesophyll cells under osmotic stress[J]. Journal of experimental botany, 2011, 62(2): 545-555.
[4] 楊澤峰, 徐暑暉, 王一凡, 等. 禾本科植物 β-淀粉酶基因家族分子進(jìn)化及響應(yīng)非生物脅迫的表達(dá)模式分析[J]. 科技導(dǎo)報(bào), 2014, 32(31): 29-36.
[5] Reinhold H, Soyk S, simková K, et al. β-Amylase-like proteins function as transcription factors in Arabidopsis, controlling shoot growth and development[J]. The Plant Cell, 2011, 23(4): 1 391-1 403.
[6] Mason-Gamer R J. The β-amylase genes of grasses and a phylogenetic analysis of the Triticeae(Poaceae)[J]. American Journal of Botany, 2005, 92(6): 1 045-1 058.
[7] Sarikaya E, Higasa T, Adachi M, et al. Comparison of degradation abilities of α-and β-amylases on raw starch granules[J]. Process Biochemistry, 2000, 35(7): 711-715.
[8] Berüter J. Sugar accumulation and changes in the activities of related enzymes during development of the apple fruit[J]. Journal of plant physiology, 1985, 121(4): 331-341.
[9] Ohmiya A, Kakiuchi N. Quantitative and morphological studies on starch of apple fruit during development[J]. Journal of the Japanese Society for Horticultural Science, 1990, 59(2): 417-423.
[10] Wang F, Sanz A, Brenner M L, et al. Sucrose synthase, starch accumulation, and tomato fruit sink strength[J]. Plant Physiology, 1993, 101(1): 321-327.
[11] Berüter J, Feusi M E S. The effect of girdling on carbohydrate partitioning in the growing apple fruit[J]. Journal of plant physiology, 1997, 151(3): 277-285.
[12] 汪永保. 菠蘿蜜成熟軟化相關(guān)酶基因表達(dá)及β-半乳糖苷酶基因克隆和序列分析[Z]. 廣東海洋大學(xué), 2014.
[13] Cordenunsi B R, Lajolo F M. Starch breakdown during banana ripening: sucrose synthase and sucrose phosphate synthase[J]. Journal of agricultural and food chemistry, 1995, 43(2): 347-351.
[14] 王永章, 張大鵬. 發(fā)育過(guò)程中蘋(píng)果果實(shí)的β-淀粉酶, 活性, 數(shù)量變化和亞細(xì)胞定位[J]. 中國(guó)科學(xué): C 輯. 2002, 32(3): 201-210.
[15] D Hont A, Denoeud F, Aury J, et al. The banana(Musa acuminata)genome and the evolution of monocotyledonous plants[J]. Nature. 2012, 488(7410): 213-217.
[16] Dong C, Hu H, Jue D, et al. The banana E2 gene family: Genomic identification, characterization, expression profiling analysis[J]. Plant Science, 2016, 245: 11-24.
[17] Hu W, Zuo J, Hou X, et al. The auxin response factor gene family in banana: genome-wide identification and expression analyses during development, ripening, and abiotic stress[J]. Frontiers in plant science, 2015, 6, 742.
[18] Arabidopsis G I. Analysis of the genome sequence of the flowering plant Arabidopsis thaliana.[J]. nature, 2000, 408(6814): 796.