戴曉港, 劉景勝, 李淑嫻
(南京林業(yè)大學(xué)林學(xué)院/南方楊樹(shù)工程技術(shù)研究中心/江蘇省楊樹(shù)種質(zhì)創(chuàng)新與品種改良重點(diǎn)實(shí)驗(yàn)室, 江蘇 南京 210037)
植物在整個(gè)生命活動(dòng)過(guò)程中會(huì)不斷受到各種生物脅迫(如食草動(dòng)物和害蟲(chóng)的啃食、病原體侵染)和非生物脅迫(如干旱、低溫、高溫、土壤高鹽堿等)的影響,然而植物不能自由移動(dòng)來(lái)躲避這些不利環(huán)境,因此在漫長(zhǎng)的進(jìn)化過(guò)程中,植物逐漸從形態(tài)、生理、細(xì)胞以及分子水平發(fā)生進(jìn)化以應(yīng)對(duì)這些不利環(huán)境條件。當(dāng)植物受到脅迫時(shí)會(huì)產(chǎn)生相應(yīng)的應(yīng)答反應(yīng),相關(guān)基因、蛋白質(zhì)和代謝產(chǎn)物構(gòu)成復(fù)雜調(diào)控網(wǎng)絡(luò)以應(yīng)答相應(yīng)的脅迫。轉(zhuǎn)錄因子作為反式作用因子可以與靶標(biāo)基因啟動(dòng)子區(qū)域相應(yīng)的順式作用元件特異結(jié)合,從而調(diào)控相關(guān)基因的轉(zhuǎn)錄,在植物應(yīng)答生物脅迫和非生物脅迫中具有舉足輕重的作用[1]。WRKY轉(zhuǎn)錄因子是植物中的超級(jí)轉(zhuǎn)錄因子家族之一,其典型特征是在氨基酸N-端有保守的WRKYGQK結(jié)構(gòu)域,在C-端含有C2H2或C2HC型鋅指結(jié)構(gòu)[2]。根據(jù)上述保守結(jié)構(gòu)域數(shù)量和鋅指結(jié)構(gòu)類(lèi)型可將WRKY轉(zhuǎn)錄因子分為3組:第I組包含2個(gè)WRKY結(jié)構(gòu)域和C2H2型鋅指結(jié)構(gòu);第II組含有1個(gè)WRKY結(jié)構(gòu)域和C2H2型鋅指結(jié)構(gòu);而第Ⅲ類(lèi)是由1個(gè)WRKY保守結(jié)構(gòu)域和C2HC型鋅指結(jié)構(gòu)組成[2]。大量研究表明,WRKY在調(diào)控植物生長(zhǎng)發(fā)育、生物脅迫和非生物脅迫[3-4]、次生代謝等多種生物過(guò)程中起著重要的作用[5-6]。如木本雞腳棉中GaWRKY1轉(zhuǎn)錄因子通過(guò)調(diào)控卡丁烯合酶-A的活性,從而參與棉酚等倍半萜烯類(lèi)化合物的合成[5];從黃花蒿分泌型腺毛中分離的AaWRKY1通過(guò)上調(diào)倍半萜環(huán)化酶基因ADS的表達(dá),從而提高抗瘧青蒿素的生物合成[6]。隨著基因組測(cè)序的發(fā)展,藥用植物越來(lái)越引起大家的關(guān)注,這也為鑒定更多的參與調(diào)控次生代謝的WRKY轉(zhuǎn)錄因子提供可能。
望春玉蘭(Yulaniabiondii)是木蘭科(Magnoliaceae)玉蘭屬多年生落葉喬木,是中國(guó)特有的珍稀瀕危樹(shù)種,原產(chǎn)湖北、河南、陜西、甘肅等地海拔600—1 200 m的闊葉林中[7]。望春玉蘭先花后葉,種子鮮紅,樹(shù)形優(yōu)美,被廣泛應(yīng)用于園林綠化[7],其干燥的花蕾是中藥材“辛夷”的正品,具有散風(fēng)寒、通肺竅、降壓、殺菌等作用,是一種用途廣泛的藥用植物[8]。望春玉蘭具有一定的耐寒性,喜微酸性土壤,但堿性土壤對(duì)生長(zhǎng)的影響較大。望春玉蘭全基因組測(cè)序的完成為WRKY轉(zhuǎn)錄因子家族的鑒定和分析提供了基礎(chǔ),本研究對(duì)望春玉蘭WRKY基因家族成員進(jìn)行鑒定,同時(shí)對(duì)蛋白理化性質(zhì)、亞細(xì)胞定位、系統(tǒng)進(jìn)化、保守結(jié)構(gòu)域、順式作用元件、以及在不同組織中的表達(dá)模式進(jìn)行了初步研究,以期為深入研究該基因家族在望春玉蘭中應(yīng)答非生物脅迫以及次生代謝的調(diào)控奠定基礎(chǔ)。
從國(guó)家基因庫(kù)生命大數(shù)據(jù)平臺(tái)(https://db.cngb.org/codeplot/)中下載望春玉蘭基因組和轉(zhuǎn)錄組原始數(shù)據(jù)(CNP0000884)[9],利用hmmsearch v3.3.2將WRKY隱馬爾可夫模型(Pfam: PF00847)和下載的望春玉蘭蛋白序列進(jìn)行比對(duì),保留E-value≤1e-5的蛋白序列,再采用SMART(http://smart.embl-heidelberg.de/)進(jìn)行保守結(jié)構(gòu)域鑒定[10],去除不含WRKY保守結(jié)構(gòu)域的蛋白序列。采用Expasy[11](https://web.expasy.org/protparam/)在線預(yù)測(cè)蛋白分子量、等電點(diǎn)等理化性質(zhì),并利用Cell-PLoc 2.0(http://www.csbio.sjtu.edu.cn/bioinf/Cell-PLoc-2/)對(duì)鑒定的WRKY基因進(jìn)行亞細(xì)胞定位預(yù)測(cè)。
從擬南芥基因組數(shù)據(jù)庫(kù)(https://www.arabidopsis.org/browse/genefamily/WRKY-Som.jsp)下載擬南芥WRKY轉(zhuǎn)錄因子序列。根據(jù)SMART分析結(jié)果提取擬南芥和望春玉蘭WRKY轉(zhuǎn)錄因子的保守結(jié)構(gòu)域序列,并提交到MEGA-6.0[12]軟件中利用ClustalW進(jìn)行多重比對(duì),然后用鄰接法(Neighbor Joining method)構(gòu)建進(jìn)化樹(shù),bootstrap值設(shè)置為1 000,最后采用Figtree(http://tree.bio.ed.ac.uk/software/figtree/)對(duì)構(gòu)建的進(jìn)化樹(shù)進(jìn)行可視化,根據(jù)進(jìn)化樹(shù)中擬南芥WRKY家族的分類(lèi)對(duì)望春玉蘭WRKY家族進(jìn)行類(lèi)群的劃分。
利用MEME(https://meme-suite.org/meme/tools/meme)在線預(yù)測(cè)望春玉蘭WRKY蛋白的保守基序(Motif),Motif個(gè)數(shù)設(shè)置為10個(gè),基序長(zhǎng)度為6—70,其他參數(shù)均為默認(rèn)值。根據(jù)MEME的分析結(jié)果,結(jié)合基因注釋的gff文件,利用TBtools[13]對(duì)保守基序、基因結(jié)構(gòu)和進(jìn)化樹(shù)進(jìn)行整合,繪制望春玉蘭WRKY轉(zhuǎn)錄因子保守基序和基因結(jié)構(gòu)圖。
利用perl腳本根據(jù)基因組注釋的gff文件,從基因組中提取目的基因上游2 000 bp序列,用PlantCARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)對(duì)啟動(dòng)子區(qū)域進(jìn)行順式作用元件分析,最后利用TBtools[13]結(jié)合進(jìn)化樹(shù)并繪制順式作用元件分布圖。
根據(jù)基因組注釋的gff文件,使用TBtools[13]繪制望春玉蘭WRKY轉(zhuǎn)錄因子在染色體上的分布圖。串聯(lián)重復(fù)基因的鑒定參照Lehti-Shiu對(duì)毛果楊基因組串聯(lián)重復(fù)基因的鑒定標(biāo)準(zhǔn):2個(gè)基因之間不超過(guò)350 kb且中間插入的基因不超過(guò)10個(gè),進(jìn)化樹(shù)上它們還需要同屬于1個(gè)亞家族[14]。
將從國(guó)家基因庫(kù)生命大數(shù)據(jù)平臺(tái)中下載的望春玉蘭葉片(CNX0149886)和花(CNX0149883)的轉(zhuǎn)錄組,以及實(shí)驗(yàn)室測(cè)序的根系轉(zhuǎn)錄組,使用Trimmomatic[15]過(guò)濾低質(zhì)量序列,然后利用STAR[16]默認(rèn)參數(shù)將上述過(guò)濾后的序列分別比對(duì)到望春玉蘭基因組,統(tǒng)計(jì)根、葉和花分別比對(duì)到每個(gè)WRKY基因的序列數(shù)量,采用RPKM(reads per kilobase of transcripts per million mapped reads)對(duì)每個(gè)基因表達(dá)量進(jìn)行均一化。
本研究共鑒定出望春玉蘭WRKY基因家族有56個(gè)成員,各成員蛋白長(zhǎng)度、理化性質(zhì)、理論等電點(diǎn)和亞細(xì)胞定位等信息如表1。從表1中結(jié)果可以看出,蛋白長(zhǎng)度在106—1 675個(gè)氨基酸之間,不同基因氨基酸數(shù)量存在較大差異。通過(guò)Expasy在線分析了望春玉蘭WRKY轉(zhuǎn)錄因子蛋白理化性質(zhì),該家族基因蛋白分子量在12 215.15—191 326.88 Da之間,理論等電點(diǎn)在4.9—10.06之間。亞細(xì)胞定位結(jié)果顯示,55個(gè)基因家族成員定位在細(xì)胞核,其中MBI36866_MAGBIO成員同時(shí)定位在細(xì)胞外間隙和細(xì)胞核,而MBI24213_MAGBIO還定位在細(xì)胞質(zhì)。
表1 望春玉蘭WRKY家族基因基本信息及蛋白理化性質(zhì)
以望春玉蘭和擬南芥WRKY基因蛋白保守域序列構(gòu)建進(jìn)化樹(shù),參照擬南芥WRKY基因家族的分類(lèi),根據(jù)進(jìn)化樹(shù)和保守域序列結(jié)構(gòu)特征,將望春玉蘭WRKY轉(zhuǎn)錄因子劃分為Group Ⅰ,Ⅱ和Ⅲ共3個(gè)組。Group Ⅰ具有2個(gè)WRKY保守結(jié)構(gòu)域,鋅指結(jié)構(gòu)為C2H2型,共有8個(gè)基因;Group Ⅱ只含有1個(gè)WRKY保守結(jié)構(gòu)域,鋅指結(jié)構(gòu)也是C2H2型,但根據(jù)進(jìn)化樹(shù)分析結(jié)果又可將Group II進(jìn)一步分為Ⅱa,Ⅱb,Ⅱc,Ⅱd,Ⅱe共5個(gè)亞組,其成員數(shù)量分別為9,7,10,7,4個(gè);Group Ⅲ雖然也只含有1個(gè)WRKY保守結(jié)構(gòu)域,但其鋅指結(jié)構(gòu)(C2HC)和其他2組不同,該組中共有7個(gè)基因。還有3個(gè)基因(MBI36007_MAGBIO、MBI46007_MAGBIO和MBI29696_MAGBIO)雖然含有WRKY保守結(jié)構(gòu)域,但序列與其他基因分化較大而未被分類(lèi)到現(xiàn)有的I,Ⅱ和Ⅲ組中(見(jiàn)圖1)。
圖1 望春玉蘭和擬南芥WRKY基因家族進(jìn)化樹(shù)
利用MEME在線分析望春玉蘭WRKY基因家族的Motif,利用TBTools對(duì)Motif分析結(jié)果進(jìn)行可視化(見(jiàn)圖2)。望春玉蘭WRKY蛋白共包含10個(gè)Motif,其中Motif 1,Motif 2和Motif 3是WRKY的保守結(jié)構(gòu)域,Motif 1含有保守序列WRKYGQK,望春玉蘭所有WRKY蛋白都含有這個(gè)保守結(jié)構(gòu)域;Motif 1尾端2個(gè)蛋白和Motif 2構(gòu)成了WRKY結(jié)構(gòu)域的鋅指結(jié)構(gòu)(C2H2),其中48個(gè)基因含有Motif 2結(jié)構(gòu)域;Motif 3是WRKY的完整結(jié)構(gòu)域,其中7個(gè)基因同時(shí)含有Motif 3和Motif 1,這類(lèi)基因因含有2個(gè)保守的WRKY結(jié)構(gòu)域而被劃分為Group I。Motif 4—Motif 10雖然在數(shù)據(jù)庫(kù)中暫無(wú)功能記錄,但這些Motif也為望春玉蘭WRKY基因分類(lèi)提供了重要參考,如Motif 8和Motif 10是Group I特有的,而Motif 5,Motif 6和Motif 9是Group IIa和Group IIb中特有??傮w而言,望春玉蘭WRKY基因家族不同分組中Motif是相似的,這個(gè)結(jié)果也有利地支持了進(jìn)化樹(shù)對(duì)基因家族分類(lèi)的可靠性。
圖2 望春玉蘭WRKY基因家族蛋白保守結(jié)構(gòu)域
利用PlantCARE注釋望春玉蘭56個(gè)WRKY基因上游2 000 bp啟動(dòng)子區(qū)域序列,得到WRKY基因家族順式作用元件,除最基本的TATA box,CAAT box和光響應(yīng)元件之外,還含有參與各種激素、調(diào)控生長(zhǎng)、參與次生代謝和非生物脅迫等響應(yīng)元件。在激素類(lèi)響應(yīng)元件中,分別有53個(gè)和47個(gè)基因含有脫落酸反應(yīng)元件(abscisic acid responsiveness)和茉莉酸甲酯反應(yīng)元件(MeJA-responsiveness);應(yīng)答水楊酸、赤霉素和生長(zhǎng)素響應(yīng)元件的基因相對(duì)較少,分別有32,26,18個(gè)。參與非生物脅迫相關(guān)的主要有無(wú)氧誘導(dǎo)(the anaerobic induction)、干旱誘導(dǎo)(drought-inducibility)、低溫響應(yīng)(low-temperature responsiveness)和防御脅迫(defense and stress responsiveness)等所必需的調(diào)節(jié)元件。MBI11137_MAGBIO含有多個(gè)干旱誘導(dǎo)響應(yīng)順式作用元件,推測(cè)該基因可能調(diào)控望春玉蘭響應(yīng)干旱脅迫。值得注意的是望春玉蘭WRKY基因除了參與激素響應(yīng)和非生物脅迫的順式作用元件,其中還有9個(gè)基因(MBI08947_MAGBIO,MBI10258_MAGBIO,MBI10883_MAGBIO,MBI12228_MAGBIO,MBI19961_MAGBIO,MBI36613_MAGBIO,MBI36866_MAGBIO,MBI42321_MAGBIO,MBI46335_MAGBIO)含有類(lèi)黃酮合成調(diào)節(jié)元件,參與植物的次生代謝。望春玉蘭的花蕾和根系入藥,表明了WRKY基因可能參與了次生代謝產(chǎn)物的合成調(diào)節(jié)。
望春玉蘭基因組共有19條染色體,而WRKY基因只分布在其中14條染色體上(見(jiàn)圖4),Chr08,Chr09,Chr12,Chr13和Chr17均不含有WRKY基因。在含有WRKY基因的染色體中,Chr15,Chr14和Chr04這3條染色體含有WRKY基因的數(shù)量約占總數(shù)的48.2%,分別有12,9,6個(gè);其余11條染色體WRKY基因的數(shù)量在1—3個(gè)不等。串聯(lián)重復(fù)是導(dǎo)致基因家族擴(kuò)張的主要方式之一,對(duì)望春玉蘭WRKY基因復(fù)制方式分析發(fā)現(xiàn),這個(gè)基因家族中有9個(gè)串聯(lián)復(fù)制事件,包含20個(gè)WRKY基因,其中7次串聯(lián)復(fù)制發(fā)生在Chr14和Chr15上,這也是引起WRKY基因家族成員在染色體上分布不均勻的主要原因。
圖4 望春玉蘭WRKY基因家族在染色體上的分布(串聯(lián)復(fù)制)
基因表達(dá)模式可以揭示植物不同組織的生物學(xué)功能。將望春玉蘭葉片、花和根系轉(zhuǎn)錄組測(cè)序序列分別比對(duì)到基因組,分析WRKY家族基因在不同組織中的表達(dá)模式,結(jié)果如圖5所示。從圖5中可以看出,Group I中除了MBI36007_MAGBIO在根系中不表達(dá),Group IId中除了MBI36007_MAGBIO在根系和葉片中不表達(dá)外,其余基因在所有組織中均檢測(cè)到表達(dá),且Group IId中的基因整體表達(dá)量均較高。Group IIa中只有MBI32392_MAGBIO和MBI46105_MAGBIO在3個(gè)組織中均能檢測(cè)到表達(dá),有5個(gè)基因在3個(gè)組織中均未檢測(cè)到表達(dá),而MBI37104_MAGBIO和MBI05415_MAGBIO是葉片組織特異性基因,只在葉片中有表達(dá)量。Group IIb中有1個(gè)基因MBI37844_MAGBIO在3個(gè)組織中表達(dá)量均較高,F(xiàn)PKM值均超過(guò)10,還有3個(gè)基因只在根系特異表達(dá)。Group IIc中除了MBI24029_MAGBIO在葉片中特異表達(dá)外,其余基因在不同的組織中也都能檢測(cè)到表達(dá)。
圖5 望春玉蘭不同組織WRKY基因家族表達(dá)模式
WRKY是植物中較大的基因家族,已被證實(shí)在調(diào)節(jié)植物生長(zhǎng)、發(fā)育、非生物脅迫中起到重要作用。隨著全基因組測(cè)序發(fā)展,已有幾十種雙子葉植物全基因組WRKY基因家族被鑒定和分析,而其基因家族中基因數(shù)量在45—188個(gè)不等[17]。本研究從望春玉蘭基因組中鑒定了56個(gè)WRKY基因,比較分析發(fā)現(xiàn),望春玉蘭基因組(2.20 Gb)大小約是擬南芥(125 Mb)的18倍,但望春玉蘭WRKY基因的數(shù)量(56個(gè))卻只有擬南芥(74個(gè))的3/4;同樣,望春玉蘭基因組約是木本植物毛果楊(0.55 Gb)的4倍,但WRKY基因的數(shù)量卻不足毛果楊(122個(gè))的1/2[17]。上述結(jié)果說(shuō)明了基因組中,基因家族基因的數(shù)量并不是由基因組大小決定的。
根據(jù)WRKY基因保守結(jié)構(gòu)域序列和鋅指結(jié)構(gòu)類(lèi)型,同時(shí)結(jié)合擬南芥WRKY基因家族的分類(lèi),將望春玉蘭WRKY基因家族分為3個(gè)組:Group Ⅰ,Group Ⅱ和Group Ⅲ,分別含有8,38和7個(gè)基因。然而在擬南芥和毛果楊中,Group I基因的數(shù)量占主導(dǎo)地位[18],而望春玉蘭中Group II基因數(shù)量占67.9%,說(shuō)明Group II在進(jìn)化過(guò)程中可能發(fā)生了更多的基因復(fù)制。這與對(duì)望春玉蘭WRKY基因家族串聯(lián)復(fù)制分析結(jié)果一致,在望春玉蘭WRKY基因家族中共發(fā)現(xiàn)9個(gè)串聯(lián)重復(fù),其中Group II中有5個(gè)串聯(lián)重復(fù)共產(chǎn)生了11個(gè)基因。望春玉蘭WRKY基因家族Group II可進(jìn)一步細(xì)分為IIa,IIb,IIc,IId和IIe共5個(gè)亞組,分別含有9,7,10,7,4個(gè)基因。對(duì)擬南芥、水稻、葡萄等7種植物基因組WRKY基因家族Group II基因數(shù)量分析發(fā)現(xiàn),Group IIa基因的比例為8.8%—12.2%之間[18],而望春玉蘭Group IIa基因的比例為23.7%,約是其他物種的2—3倍,說(shuō)明Group IIa在望春玉蘭中發(fā)生了大量擴(kuò)張。已有研究表明,WRKY基因家族的Group IIa基因可以提高擬南芥苗期和蘋(píng)果愈傷的滲透脅迫能力和抗鹽性[19],也是調(diào)節(jié)水稻先天免疫能力的重要轉(zhuǎn)錄因子[20],望春玉蘭Group IIa基因的大量擴(kuò)張,可能是在長(zhǎng)期進(jìn)化過(guò)程中提高非生物脅迫的表現(xiàn)。
WRKY不僅調(diào)節(jié)植物生長(zhǎng)、發(fā)育和參與非生物脅迫的調(diào)節(jié),還參與調(diào)控植物的次生代謝。Xu等在棉花中克隆的GaWRKY1轉(zhuǎn)錄因子可以調(diào)控卡丁烯合酶-A的活性,從而參與調(diào)節(jié)棉花倍半萜烯類(lèi)化合物的合成[5];Liu等研究發(fā)現(xiàn)藥用植物杜仲WRKY轉(zhuǎn)錄因子參與苯基丙胺酸和黃酮類(lèi)物質(zhì)合成代謝的調(diào)控[17]。望春玉蘭轉(zhuǎn)錄因子順式作用元件分析發(fā)現(xiàn),WRKY啟動(dòng)子區(qū)域不僅含有大量參與非生物脅迫的順式作用元件,還有9個(gè)基因含有參與黃酮類(lèi)物質(zhì)合成代謝的順式作用元件,其中MBI19961_MAGBIO和MBI08947_MAGBIO分別在根系和花中高表達(dá),而根系和花是望春玉蘭藥物合成的主要組織,因此這2個(gè)基因可能影響望春玉蘭根系和花的次生代謝。