朱利利 慶 軍 杜慶鑫 何 鳳 杜紅巖*
(1.中國林業(yè)科學研究院經(jīng)濟林研究開發(fā)中心,鄭州 450003; 2.國家林業(yè)局杜仲工程技術研究中心,鄭州 450003)
杜仲(EucommiaulmoidesOliv.)為杜仲科(Eucommiaceae)杜仲屬(Eucommia)的單科單屬植物,是第四紀冰川期后僅留存于我國的孑遺植物,具有重要的藥用價值和經(jīng)濟價值[1]。杜仲的皮、葉、果等器官中含有豐富的杜仲膠、黃酮、多酚、綠原酸等次生代謝物質(zhì)[2~4]。杜仲通過調(diào)節(jié)一系列代謝途徑激活防御系統(tǒng)保護其在多種環(huán)境條件下正常生長發(fā)育,其中茉莉酸、愈傷激素、脂肪酸氫過氧化物、醛類揮發(fā)物在植物的生長發(fā)育和防御過程中發(fā)揮重要作用,而這些物質(zhì)的生物合成過程受到脂氧合酶(Lipoxygenases,LOX)(EC:1.13.11.12)催化[5]。脂氧合酶(LOX)是一種含有非血紅素鐵的氧合酶,廣泛存在于真核和原核生物中,參與JA,醛類、醇類等芳香物質(zhì)的生物合成[6]。LOX在植物中以亞油酸、亞麻酸為底物,其9位或13位碳原子加氧生成脂氫過氧化物,根據(jù)加氧位置分為9-LOX和13-LOX[7]。LOX定位于植物不同亞細胞器,如黃瓜(Cucumissativus)的脂溶性LOX存在于胞槳和液泡中,而以跨膜蛋白形式存在的LOX定位于脂體膜和質(zhì)膜上[8],同時LOX也定位于葉綠體、微粒體、脂體等細胞器[9]。
LOX是一個多基因家族,研究發(fā)現(xiàn)擬南芥(Arabidopsisthaliana)中有6個LOX[10],葡萄(Vitisvinifera)中有18個LOX(有5個為假基因)[11],楊樹(Populustrichocarpa)中有21個LOX[12]。LOX是一種同工酶,植物的不同發(fā)育階段和脅迫條件可誘導相應特異LOX基因的表達。水稻(Oryzasativa)[13]、擬南芥[14]、番茄[15]等植物受到機械損傷時,其13-LOX基因特異表達誘導JA生物合成;煙草(Nicotianatabacum)受到病菌感染時,9-LOX類型基因活性增加[16];土豆(Solanumtuberosum)葉片接種真菌后,POTLX-3(9-LOX類型)表達量增加,但機械損傷對9-LOX基因沒有影響[17]。
目前杜仲的基因組測序已完成,在全基因組水平上研究杜仲的LOX基因信息對探索杜仲的生長發(fā)育和抗脅迫能力提供參考。本研究利用生物信息學方法對杜仲的LOX基因家族進行鑒定和分類,同時結合杜仲的RNA-seq,分析LOX家族在杜仲不同發(fā)育時期、組織器官的表達譜,探索杜仲LOX基因家族功能。
杜仲基因組測序數(shù)據(jù)、CDS序列、蛋白質(zhì)序列及其注釋信息均來源于杜仲基因組數(shù)據(jù)(NCBI登錄號PRJNA357336、SRP095726及SRS2666014)。查閱國內(nèi)外文獻,下載已分類的5種植物的LOX氨基酸序列,水稻下載自水稻基因組(http://rice.plantbiology.msu.edu/)、擬南芥下載自TAIR(http://www.arabidopsis.org/),番茄下載自NCBI(登錄號TomLOXA(U09026)、TomLOXB(U09025)、TomLOXC(U37839)、TomLOXD(U37840)、TomLOXE(AY008278)和TomLOXF(FJ617476)),葡萄和楊樹的LOX氨基酸序列下載Phytozomev.11.0(https://phytozome.jgi.doe.gov/pz/portal.html)。
LOX基因的結構域信息(PF00305)下載自Pfam數(shù)據(jù)庫,利用Hmmer 3.0軟件建立Profile HMM模型,并利用此模型檢索下載杜仲基因組數(shù)據(jù)中的蛋白質(zhì)序列,根據(jù)已得到的杜仲LOX基因家族序列建立新的HMM模型,用新的模型再次檢索杜仲蛋白質(zhì)序列,得到的序列被認為是候選蛋白質(zhì)序列,所有蛋白結構域經(jīng)過SMART(http://smart.embl/heidelberg.de/)驗證。利用GSDS在線工具(http://gsds.cbi.pku.edu.cn/)制作基因外顯子-內(nèi)含子結構圖。利用Plant-Ploc在線工具(http://www.csbio.sjtu.edu.cn/bioinf/plant/)、WOLFPSORT(http://wolfpsort.seq.cbrc.jp/)和Softberry(http://www.softberry.com/)預測亞細胞定位,綜合3個軟件預測結果進行分析。
利用ClustalX2.0.12軟件對杜仲、擬南芥、番茄、葡萄、楊樹和水稻的LOX氨基酸序列進行多重序列比對。比對結果用軟件MEGA6.0的最大似然法(Maximum Likelihood)構建系統(tǒng)進化樹,抽樣次數(shù)為1000(bootstrap:1000 relications),其他為默認值。
使用在線工具ProtParam(http://web.expasy.org/protparam/)評估杜仲LOX蛋白的理論等電點、分子量、疏水性等理化性質(zhì),利用在線分析工具HNN Secondary StructurePrediction(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_hnn.html)預測LOX蛋白的α-螺旋、延伸鏈等二級結構。
通過下載不同發(fā)育時期的國家審定杜仲良種‘華仲6號’的葉片(4月18日、5月18日、6月17日、7月17日、8月16日及9月20日)、果實(采樣時間同葉片相同)和‘神農(nóng)架’樹皮(5月20日、7月20日及9月20日)的轉錄組數(shù)據(jù)獲得杜仲LOX基因的測序表達譜(FPKM值,fragments per kilobase of exon per million fragments mapped),數(shù)據(jù)來源于杜仲基因組RNA數(shù)據(jù),同時從NCBI網(wǎng)站SRA數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/sra)下載‘華仲6號’花后70天和160天種仁的測序表達譜(登錄號分別是SRR3203265,70d;SRR3203241,160d)。去除在不同發(fā)育時期和組織中FPKM均小于1的基因,利用EXCELL對篩選的基因FPKM值進行l(wèi)og10(FPKM+1)轉換,對數(shù)轉換后的數(shù)據(jù)利用SPSS進行標準化,利用軟件Cluster 3.0和JAVA TreeView-1.1.6對標準化的表達數(shù)據(jù)聚類分析。
通過Hmmer 3.0搜索,杜仲基因組共鑒定出23個LOX基因家族成員(表1)。23個LOX基因分布于12條scaffolds,每條scaffold上分布的基因數(shù)量為1~5個,而多基因分布的scaffolds上的基因呈聚集形式分布,形成串聯(lián)重復,推測這些基因發(fā)生過復制事件。杜仲LOX基因內(nèi)含子數(shù)量分布范圍是0~6,有9個LOX基因不含內(nèi)含子,有4個基因含5個內(nèi)含子,有5個基因含6個內(nèi)含子,其他LOX基因分別含有1~2個內(nèi)含子,其中EU05484-RA的內(nèi)含子序列長度顯然長于其它LOX基因內(nèi)含子序列,內(nèi)含子具體分布位置如圖1所示。亞細胞定位預測結果顯示杜仲23個LOX基因有15個定位于細胞質(zhì),8個定位于葉綠體。
表1 杜仲LOX基因家族信息
圖1 杜仲LOX基因內(nèi)含子外顯子結構Fig.1 The intron-exon structures of LOX genes in E.ulmoide
圖2 杜仲與其他植物LOX氨基酸序列的系統(tǒng)進化樹Fig.2 Phylogenetic tree analysis of the amino acid sequences of LOX in E.ulmoides and other plants
依據(jù)杜仲LOX家族氨基酸長度和序列結構特征差異等特點,運用ClustalX2.0.12和MEGA對杜仲LOX氨基酸序列和已進行分類和功能研究的水稻、擬南芥、番茄、楊樹、葡萄的LOX氨基酸序列構建系統(tǒng)進化樹。進化樹顯示杜仲的LOX編碼蛋白與番茄的LOX蛋白遺傳距離最近,其次與葡萄、楊樹和擬南芥的距離較近,而與水稻的LOX編碼蛋白距離最遠。杜仲23個LOX蛋白與其他5種植物的LOX蛋白分類結果相似,也可分為9-LOX蛋白和13-LOX蛋白兩個類型,其中僅有EUC05484-RA編碼蛋白屬于9-LOX,其余22個LOX蛋白均屬于13-LOX,杜仲的13-LOX蛋白家族成員數(shù)量占據(jù)明顯優(yōu)勢,說明杜仲的13-LOX家族成員在進化上產(chǎn)生了較多擴增事件。杜仲的22個13-LOX家族成員聚為2個分支,其中第一個分支由EUC09637-RA和EUC22336-RA組成,分別與葡萄的GSVIVT01010359001編碼蛋白和番茄的TomLOXD蛋白聚成一支,且較杜仲其他13-LOX家族成員與9-LOX類型聚類距離更近;杜仲其余20個13-LOX家族成員組成第二個分支,同時第二分支又繼續(xù)分為3個小支,其中有17個成員與番茄的TomLOXC和TomLOXF蛋白聚為第一個小支,而EUC19390-RA單獨與葡萄的GSVIVT01032029001編碼蛋白聚為第二小支,EUC23900-RA和EUC19389-RA與楊樹的Potri.009G022400.1蛋白聚為第三小支。杜仲的9-LOX家族唯一成員EUC05484-RA與葡萄的3個9-LOX蛋白聚在一起、遺傳距離較近。遺傳距離越近,表明蛋白結構和功能更為相似,暗示杜仲的LOX蛋白功能可能與番茄、葡萄和楊樹的特定LOX蛋白具有相似的生理作用。
利用Protparam在線工具分析杜仲LOX蛋白一級結構,表2顯示杜仲23個LOX基因家族成員中,EUC22336-RA編碼的氨基酸數(shù)量最多為968aa,EUC24023-RA編碼的氨基酸數(shù)量最少為92,同時結果表明杜仲LOX基因家族編碼氨基酸數(shù)目與其分子質(zhì)量整體呈正相關,23個LOX基因的氨基酸數(shù)量和分子質(zhì)量均具有差異。根據(jù)理論等電點氨基酸可以分為堿性氨基酸(Theoretical pI>7)和酸性氨基酸或中性氨基酸(Theoretical pI≦7);蛋白質(zhì)總平均疏水性正值表現(xiàn)疏水性、負值表現(xiàn)為親水性,且疏水值越大越疏水,值越小越親水。其中EUC05484-RA為9-LOX家族成員,編碼氨基酸數(shù)量為401,理論等電點是5.98,為酸性氨基酸,同時總平均疏水值為-0.312,為親水性氨基酸。其余13-LOX類型中包括6個堿性氨基酸和16個酸性氨基酸或中性氨基酸,22個LOX蛋白疏水值均為負值,表現(xiàn)為親水性。
表2 杜仲LOX基因家族蛋白理化性質(zhì)分析
HNN Secondary Stucture Prediction分析顯示α-螺旋、延伸鏈和無規(guī)則卷曲在杜仲整個LOX蛋白質(zhì)都有散布,其中無規(guī)則卷曲易受側鏈相互作用,經(jīng)常構成活性部位和功能部位,而α-螺旋在DNA結合基序中具有重要作用。杜仲有21個LOX蛋白以無規(guī)則卷曲所占比例較高為主要構成元件,α-螺旋所占比例次之,延伸鏈比例最低,其中以EUC19389-RA蛋白的無規(guī)則卷曲比例最高為60.31%。而EUC16930-RA和EUC24023-RA 2個LOX蛋白則以α-螺旋所占比例較高為主要構成元件,比例分別為47.29%和52.17%,其次無規(guī)則卷曲比例略低,分別為44.96%和35.87%,而延伸鏈比例最低。
杜仲LOX基因家族在3個組織中的表達模式顯示,有6個LOX基因(EUC16892-RA、EUC16893-RA、EUC16929-RA、EUC16930-RA、EUC24023-RA和EUC26492-RA)在不同發(fā)育時期及各組織中的FPKM值為0或接近0,暗示這6個基因在杜仲皮、葉、果和種仁中均不表達,其余17個LOX基因表達具有組織和時空特異性。組織特異性表達規(guī)律顯示,這17個LOX基因表達模式可以分為3類,第Ⅰ類基因包含7個,在不同發(fā)育時期的果和葉中表達相對高,而在皮和種仁中表達相對較低;第Ⅱ類包含2個基因,在種仁中表達相對較高,其次在不同發(fā)育時期杜仲的皮、果有一定的表達量,而在不同發(fā)育時期的杜仲葉中表達相對較低;第Ⅲ類有8個基因,在杜仲皮中表達相對較高,在不同發(fā)育時期葉中有一定表達,在不同生長發(fā)育時期的果和種仁中表達相對較低,且第Ⅱ類和第Ⅲ類基因的表達更為相似。時空特異性表達規(guī)律顯示,杜仲9-LOX基因(EUC05484-RA)在5月20日的皮、4月18日的果、4月18日的葉及花后70天的種仁中表達量相對其它時期較高,可能在生長發(fā)育早期階段發(fā)揮重要作用;杜仲13-LOX基因在不同發(fā)育時期的組織中表達模式多樣,一些基因在生長初期和后期表達高于中期,如EUC18779在4月份和8月份的果和葉中表達高于其他時期;同時也存在后期生長發(fā)育階段表達高于前期的基因,如EUC16932在9月份皮、8月份果、葉及花后160天種仁中表達高于其他時期;也存在一些基因在各個發(fā)育時期的組織中表達量均相似,如EUC21473在4個組織的不同時期表達無明顯差異。表達譜聚類圖結果顯示定位于一條Scaffold的基因表達模式總體相似,說明串聯(lián)重復的基因可能具有相似的生理功能。
圖4 杜仲LOX基因表達聚類分析Fig.4 Heat map of LOX gene expression obtained from RNA-seq in E.ulmoides
通過全基因組分析,從杜仲中鑒定了23個LOX基因,13-LOX型家族成員22個,9-LOX型家族成員僅一個。其中一些13-LOX成員以基因簇形式分布,可能發(fā)生了復制,形成串聯(lián)重復?;驈椭圃诨蚣易暹M化過程中具有重要作用,可產(chǎn)生新基因并發(fā)生亞功能化或新功能化,以功能互補的方式分擔祖先基因的功能[18],串聯(lián)重復基因更易發(fā)生內(nèi)含子獲得,促進外顯子重組和基因進化[19]。杜仲表達譜聚類顯示其串聯(lián)重復基因在不同發(fā)育時期的各個組織器官中表達量雖有一定差異,但總體變化趨勢是相似的,表明杜仲的串聯(lián)重復基因在生理功能更可能發(fā)生了亞功能化,以功能互補的方式作用機體。
前人研究顯示13-LOX及其衍生物更多參與茉莉酸、醛類、醇類物質(zhì)合成,在逆境脅迫防御過程中發(fā)揮作用[21],而9-LOX基因及其衍生物與植物生長發(fā)育[20]和抗菌[22]具有一定的相關性。Chauvin等發(fā)現(xiàn)擬南芥的13-LOX基因能夠促進JA的合成抵抗機械損傷脅迫[14]。孫炎鋒等發(fā)現(xiàn)13-LOX基因在擬南芥葉片衰老過程中也發(fā)揮重要生理作用[23]。此外,番茄的13-LOX類型(TomLOXC、TomLOXD和TomLOXF)與茉莉酸合成相關,其中TomLOXC和TomLOXD與機械損傷有關,具有抵抗生物和非生物脅迫作用,同時兩者也參與C6醛類揮發(fā)物合成以形成特殊風味;而番茄9-LOX基因(TomLOXA、TomLOXB和TomLOXE)則與果實成熟相關[15]。但研究發(fā)現(xiàn)擬南芥和小麥在感染病菌后其9-LOX基因通過調(diào)節(jié)水楊酸和茉莉酸信號傳導能力促進抗病[24]。
杜仲的22個13-LOX基因,其中有18個基因與番茄的13-LOX基因(TomLOXC、TomLOXF)遺傳距離比較近,表明杜仲的13-LOX基因可能參與茉莉酸、醛類、醇類物質(zhì)的合成,或許與植物衰老、機械損傷等過程相關,暗示杜仲的13-LOX具有抵抗生物和非生物脅迫的潛在能力,同時13-LOX在不同組織中和不同發(fā)育時期表達特征存在多樣性,不同類型13-LOX基因在杜仲的特定生長發(fā)育階段具有高表達,這些基因可能以功能互補的方式在杜仲整個生長發(fā)育時期發(fā)揮生理作用。表達分析結果顯示杜仲9-LOX基因EU05485表達同樣具有組織特異性,且在組織發(fā)育前期表達較高,在生長后期表達量下降,但在發(fā)育后期是否作用減弱還需要試驗驗證。目前關于杜仲LOX基因家族的具體生理功能還需進一步的試驗驗證分析。