易雨憧, 廖文海,2, 孫 進(jìn), 朱哲寧, 程 焱, 曹世江,2
(1.福建農(nóng)林大學(xué)林學(xué)院; 2.林木逆境生理生態(tài)及分子生物學(xué)福建省高校重點實驗室;3.福建農(nóng)林大學(xué)農(nóng)學(xué)院;4.福建農(nóng)林大學(xué)植物保護(hù)學(xué)院,福建 福州 350002)
轉(zhuǎn)錄因子又稱為反式作用因子,能夠在細(xì)胞核內(nèi)與靶基因的順式作用因子特異性結(jié)合,從而激活或者抑制下游基因的表達(dá)調(diào)控,在轉(zhuǎn)錄起始環(huán)節(jié)至關(guān)重要.植物生長過程中基因表達(dá)調(diào)控可影響植物的細(xì)胞分化和生長發(fā)育過程,因此,轉(zhuǎn)錄因子在植物生理代謝中發(fā)揮重要的作用[1].GATA轉(zhuǎn)錄因子在植物的光形態(tài)建成、葉綠素合成、種子萌芽、開花以及碳、氮代謝等生物學(xué)過程中發(fā)揮關(guān)鍵作用[2],因其能與靶基因啟動子上的W-GATA-R(W=T/A, R=G/A)序列結(jié)合而得名,其DNA結(jié)構(gòu)域由1個Ⅳ類鋅指結(jié)構(gòu)(C-X2-C-X17-20-C-X2-C)和其后的基本區(qū)域組成[3].
Evans et al[4]首次發(fā)現(xiàn)并報道GATA轉(zhuǎn)錄因子結(jié)合在雞的珠蛋白基因啟動子上,并且參與了雞的造血過程[5].隨后的研究表明,動物中的GATA轉(zhuǎn)錄因子參與了發(fā)育、分化和細(xì)胞增殖過程,包含2個C-X2-C-X17-20-C-X2-C鋅指結(jié)構(gòu)域[6],其中只有C端的鋅指結(jié)構(gòu)與DNA結(jié)合,N端鋅指結(jié)構(gòu)可以調(diào)節(jié)C端鋅指與DNA特異性結(jié)合[7-8].真菌中的GATA轉(zhuǎn)錄因子大部分只含有1個鋅指結(jié)構(gòu)域,分為兩類:C-X2-C-X17-C-X2-C或C-X2-C-X18-C-X2-C結(jié)構(gòu)域[9-10],在光形態(tài)建成、晝夜節(jié)律、結(jié)合型轉(zhuǎn)換和氮循環(huán)等多種生物學(xué)過程中發(fā)揮關(guān)鍵作用[11].植物中首個GATA轉(zhuǎn)錄因子NTL1[12]是在煙草中鑒定出來的,與氮循環(huán)相關(guān),隨后GATA轉(zhuǎn)錄因子在多種植物中都有深入研究,如水稻(Oryzasativa)[13]、番茄(Lycopersiconesculentum)[14]、大豆(Glycinemax)[15]、葡萄(Vitisvinifera)[16]、毛果楊(Populustrichocarpa)[17].
GATA轉(zhuǎn)錄因子家族參與植物生長發(fā)育的多種過程,并且在多個物種中已經(jīng)被驗證.例如,擬南芥(Arabidopsisthaliana)中的GATA轉(zhuǎn)錄因子BME3 (Blue Micropylar End 3)能夠?qū)ΨN子萌芽起正調(diào)控作用[18],GATA2可以通過直接調(diào)節(jié)光響應(yīng)基因與油菜素內(nèi)酯響應(yīng)基因的表達(dá),調(diào)控植物幼苗的生長發(fā)育過程[19].GATA家族成員可以參與調(diào)控植物的開花過程[20-21],并且還可以調(diào)控植物形態(tài)建成.光照條件下,過表達(dá)不同的GATA轉(zhuǎn)錄因子會影響擬南芥和水稻下胚軸延伸[22-23]、增加主花序和側(cè)花序之間的開度[24].光照和細(xì)胞分裂素對葉綠體發(fā)育及葉綠素合成的調(diào)控作用受到了GNC和GNL基因的影響[25-26].除此之外,GATA轉(zhuǎn)錄因子還能響應(yīng)植物對生境中的干旱、高鹽、溫度等各種非生物脅迫.例如,沙冬青(Ammopiptanthusmongolicus)AmZFPG基因的表達(dá)與其抵抗低溫和干旱脅迫有關(guān)[27],擬南芥的GNC和GNL基因過表達(dá)株系均顯著提高了幼苗在低溫脅迫下的成活率[28].
楊梅(Myricarubra)是楊梅科(Myricaceae)楊梅屬的植物,原產(chǎn)地中國, 品種多樣,種植歷史悠久,已有2000多年.楊梅適宜生長在酸性土壤中,是我國南方重要的經(jīng)濟(jì)種植水果,楊梅的繁殖周期較長,在種植過程中發(fā)生很多病蟲害.因此,本研究以楊梅基因組序列為參考[29],對MrGATA轉(zhuǎn)錄因子家族進(jìn)行了全基因組范圍的系統(tǒng)性鑒定和分析,并預(yù)測分析其理化特性、系統(tǒng)發(fā)育關(guān)系、染色體定位、基因結(jié)構(gòu)、蛋白保守基序列以及順式作用元件.此外,還進(jìn)一步研究了MrGATA基因與其他物種間的共線性關(guān)系,研究結(jié)果為進(jìn)一步研究該GATA轉(zhuǎn)錄因子的功能、分子育種及增強植株抗病性等方面提供依據(jù).
從NCBI數(shù)據(jù)庫中下載楊梅的全基因組序列和注釋文件,在數(shù)據(jù)庫TAIR(http://www.arabiopsis.org/)中下載擬南芥GATA蛋白序列.利用Pfam網(wǎng)站獲得MrGATA結(jié)構(gòu)域(PF00320),并使用HMMER軟件(http://hmmer.org/)對所有楊梅蛋白質(zhì)序列進(jìn)行保守序列篩選(e<10-5),然后使用NCBI—CDD(https://www.ncbi.nlm.nih.gov/cdd)和SMART在線軟件(http://smart.embl heidelberg.de/)將得到的所有蛋白質(zhì)序列進(jìn)行整合,通過人工去除錯誤序列,最終篩選出26條包含GATA結(jié)構(gòu)域的序列.
使用Protparam在線軟件(https://web.expasy.org/protparam)預(yù)測分析了MrGATA轉(zhuǎn)錄因子的等電點、分子質(zhì)量和不穩(wěn)定指數(shù)等基本理化特性.使用Psort在線軟件(https://wolfpsort.hgc.jp/)進(jìn)行MrGATA轉(zhuǎn)錄因子的亞細(xì)胞定位預(yù)測分析.使用TBtools[30]軟件分析楊梅26個GATA轉(zhuǎn)錄因子在染色體上的位置信息.
使用MrGATA基因的GFF注釋文件,根據(jù)網(wǎng)站的默認(rèn)外顯子—內(nèi)含子結(jié)構(gòu)參數(shù)將注釋信息上傳至GSDS.使用GSDS網(wǎng)站(http://gsds.cbi.pku.edu.cn/)可視化GATA基因的結(jié)構(gòu)信息,了解外顯子和內(nèi)含子的數(shù)量和分布.利用MEME(http://meme-suite.org/)[31]預(yù)測分析MrGATA轉(zhuǎn)錄因子的蛋白質(zhì)序列的保守基序.基于楊梅全基因組序列,利用TBtools獲得MrGATA啟動子上游的2 000 bp序列,再運用PlantCare (http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)在線軟件對相關(guān)的順式作用元件進(jìn)行預(yù)測和篩選.
使用Cluster 和Jalview軟件對楊梅的保守GATA鋅指結(jié)構(gòu)域及GATA蛋白保守序列進(jìn)行鑒定分析.
從EBI上(https://www.ebi.ac.uk/ena/browser/view/PRJNA398601)下載楊梅“Y2012-145”品種在5個不同組織及果實3個發(fā)育時期的轉(zhuǎn)錄組原始數(shù)據(jù),并進(jìn)行RNA-seq數(shù)據(jù)分析,研究26個MrGATA基因的差異表達(dá)情況.并利用TBtools軟件將FPKM值進(jìn)行l(wèi)og2轉(zhuǎn)變后生成熱圖.
利用MUSCLE v3.8.31軟件對楊梅、擬南芥和蘋果GATA轉(zhuǎn)錄因子的蛋白序列進(jìn)行多序列比對,并根據(jù)MEGA7.0軟件的相鄰連接法構(gòu)建楊梅、擬南芥和蘋果的系統(tǒng)發(fā)育樹,參數(shù)設(shè)定為Poission correction、pairwise deletion和bootstrap 1 000次重復(fù),再通過ITOLs進(jìn)行美化.從NCBI數(shù)據(jù)庫下載擬南芥、番茄、蘋果、毛果楊和大豆的基因注釋文件和全基因組序列,利用TBtools軟件構(gòu)建楊梅與其他6個物種GATA基因組間的共線性關(guān)系.
在楊梅全基因組中共鑒定出26個GATA轉(zhuǎn)錄因子家族成員.為了方便后續(xù)的研究與分析,按照基因在楊梅8條染色體上的分布情況,將其命名為MrGATA1~MrGATA26.分析MrGATA的基本理化特性(表1):26個GATA蛋白質(zhì)的序列長度在80~618個氨基酸之間,且每條蛋白序列的長度差異較大,分子質(zhì)量為68.121 39~90.436 20 ku.除了MrGATA24外,其余25個均為不穩(wěn)定蛋白質(zhì)(不穩(wěn)定指數(shù)>40).MrGATA的亞細(xì)胞定位預(yù)測結(jié)果顯示有20個MrGATA轉(zhuǎn)錄因子位于細(xì)胞核中,3個位于葉綠體,2個位于線粒體,剩余1個MrGATA轉(zhuǎn)錄因子定位于細(xì)胞質(zhì)中.染色體定位表明26個MrGATA不均勻地分布在楊梅的8條染色體上.除了“CM025852.3”號染色體,其余每條染色體上均有第Ⅰ亞族基因的分布;第Ⅳ亞族的成員全分布于“CM025855.1”號染色體上,且該染色體上的MrGATA基因密度最高,共包含了來自Ⅰ、Ⅱ、Ⅲ、Ⅳ亞家族的8個基因.
表1 MrGATA轉(zhuǎn)錄因子家族信息
為了進(jìn)一步揭示MrGATA轉(zhuǎn)錄因子的基序組成,利用MEME鑒定MrGATA轉(zhuǎn)錄因子的保守基序(圖1),所有的MrGATA轉(zhuǎn)錄因子都存在motif1基序,即GATA結(jié)構(gòu)域.并且各基序在4類亞族之間的分布存在著一定的規(guī)律.如第I亞族含有特定的motif 2、motif 5、motif 7、motif 8、motif 10,并且MrGATA5、MrGATA13、MrGATA14之間高度相似;第Ⅱ亞族中只存在motif 1基序;第Ⅲ亞族包含特定的motif 4和motif 6基序;第Ⅳ亞族中除了motif 1基序外,還存在motif 9基序.造成不同亞族所具有的特定功能原因可能是各類基序在不同亞族之中的差異分布,同一亞族之中相同的保守基序也暗示著基因功能的相似性.并且通過對MrGATA轉(zhuǎn)錄因子進(jìn)行保守功能結(jié)構(gòu)域分析,第Ⅲ亞族除了GATA保守功能結(jié)構(gòu)域,所有成員都存在著特異功能的CCT結(jié)構(gòu)域和Tify結(jié)構(gòu)域,證明楊梅第Ⅲ亞族的成員也具有相同的功能.
圖1 MrGATA家族的系統(tǒng)發(fā)育關(guān)系、保守基序組成、結(jié)構(gòu)域以及外顯子—內(nèi)含子基因結(jié)構(gòu)
基因結(jié)構(gòu)的多樣性可能是促進(jìn)多基因家族進(jìn)化的一種驅(qū)動機制.MrGATA轉(zhuǎn)錄因子家族成員的基因結(jié)構(gòu)如圖1所示,MrGATA基因結(jié)構(gòu)相對簡單,各亞家族成員之間基因結(jié)構(gòu)具有明顯差異,但家族內(nèi)部成員之間差異較小.第Ⅰ亞族存在2~5個外顯子,只有MrGATA26和MrGATA7存在內(nèi)含子;第Ⅱ亞族含有2~5個外顯子,只有MrGATA9不存在內(nèi)含子;第Ⅲ亞族包含6~13個外顯子,且各成員均包含內(nèi)含子;第Ⅳ亞族的3個成員包含3~4個外顯子,所有成員均不包含內(nèi)含子.
順式作用元件能夠反映基因功能和潛在的轉(zhuǎn)錄調(diào)控模式[32].MrGATA啟動子區(qū)域包含大量具有特定功能的順式作用元件,其功能與光響應(yīng)、激素以及脅迫相關(guān)(圖2).在所有MrGATA啟動子序列中發(fā)現(xiàn)了19個光響應(yīng)順式元件,其中G-Box元件出現(xiàn)頻率最高,存在于25個基因的啟動子序列中,其次出現(xiàn)頻率較高的是Box4和TCT-motif,分別出現(xiàn)在21和15個基因的啟動子序列中.并且之前有研究表明G-Box元件參與了擬南芥葉綠素合成的調(diào)控[33].在本研究中,MrGATA最主要的是能夠識別ABA的ABRE激素相應(yīng)元件,存在于25個MrGATA中.其次是能夠識別MeJA相關(guān)的激素相應(yīng)元件,在22個MrGATA啟動子序列中發(fā)現(xiàn)了該類元件.與此同時,在26個MrGATA啟動子區(qū)域中發(fā)現(xiàn)與脅迫相關(guān)的順式元件有ARE、GC-motif、LTR、MBS、TC-rich repeats和WUN-motif等.并且有研究表明[34-35],ARE為厭氧誘導(dǎo)元件,GC-motif為增強誘發(fā)厭氧反應(yīng)的順式作用元件,MBS、LTR、TC-rich repeats以及WUN-motif都參與了植物中許多基因的干旱響應(yīng)轉(zhuǎn)錄調(diào)控.綜上所述,MrGATA轉(zhuǎn)錄因子可能參與了楊梅生長發(fā)育過程中與脅迫、光和激素相關(guān)的調(diào)節(jié).
圖2 MrGATA啟動子區(qū)域發(fā)生應(yīng)激、激素和光響應(yīng)順式元件的富集分析
為了進(jìn)一步探究MrGATA轉(zhuǎn)錄因子的功能,對26個MrGATA轉(zhuǎn)錄因子的蛋白質(zhì)序列進(jìn)行了保守結(jié)構(gòu)域序列分析(圖3),并鑒定出鋅指結(jié)構(gòu)域的二級結(jié)構(gòu),包括4個β折疊和1個α螺旋,與擬南芥中報道的鋅指結(jié)構(gòu)一致.其中亞族Ⅰ和亞族Ⅱ存在完整的Ⅳ類鋅指結(jié)構(gòu),為C-X2-C-X18-C-X2-C,亞族Ⅲ成員的C-X2-C-X18-C-X2-C鋅指結(jié)構(gòu)均不完整,缺少了X2-C;亞族Ⅳ不存在C-X2-C-X18-C-X2-C,缺失了保守結(jié)構(gòu)域,可能該亞族的基因在進(jìn)化過程中發(fā)生了改變.除此之外,楊梅大多數(shù)GATA氨基酸位點的鋅指結(jié)構(gòu)域存在著一定的保守性,如Cys-10、Cys-13、Thr-18、Pro-19、Gly-24、Pro-25和第2個半胱氨酸對(LCNACG)的側(cè)翼序列.
圖3 MrGATA轉(zhuǎn)錄因子家族保守結(jié)構(gòu)域蛋白序列比對
根據(jù)楊梅“Y2012-145”品種在5個不同組織和果實4個發(fā)育時期的原始轉(zhuǎn)錄組測序數(shù)據(jù)(PRJNA398601),繪制表達(dá)熱圖,分析26個MrGATA的特異性表達(dá)情況(圖4).表達(dá)值由藍(lán)色到紅色從低到高表示,26個MrGATA在不同組織和果實發(fā)育期中的表達(dá)模式存在顯著差異,其中MrGATA5、MrGATA13、MrGATA25、MrGATA16、MrGATA20基因在已報道的轉(zhuǎn)錄組中沒有其相應(yīng)的表達(dá)量數(shù)據(jù).在第Ⅰ亞族中,MrGATA1和MrGATA10在芽和小果實中具有高表達(dá),表明其主要在芽和果實中發(fā)揮作用;MrGATA7雖然在小果實中具有較高表達(dá)量,F(xiàn)PKM值接近20,但在其余4個組織中表達(dá)量較低.第Ⅱ亞族中大多數(shù)成員的表達(dá)量差異不顯著,MrGATA11在各組織中均具有較高的表達(dá)量.第Ⅲ亞族中,MrGATA18在各組織中具有1
圖4 MrGATA在5個不同組織和果實4個發(fā)育時期的表達(dá)模式
構(gòu)建系統(tǒng)發(fā)育樹有利于更深入地了解MrGATA轉(zhuǎn)錄因子基因家族各成員的生物學(xué)功能和親緣關(guān)系.利用MEGA7.0軟件,將鑒定出的26條MrGATA轉(zhuǎn)錄因子的蛋白質(zhì)序列與30條擬南芥、35條蘋果的蛋白質(zhì)序列構(gòu)建系統(tǒng)發(fā)育樹(圖5).MrGATA基因家族成員的聚類結(jié)果與擬南芥和蘋果一致,同樣分為4個亞家族,其中第Ⅰ亞族的成員最多,從中推測MrGATA具有相對保守的進(jìn)化,楊梅基因組在長期的進(jìn)化過程中保留著較為完整的GATA基因.并且進(jìn)化關(guān)系的相似反映了基因在結(jié)構(gòu)和功能上具有相似性,因此可以推斷楊梅各亞族GATA轉(zhuǎn)錄因子的生物學(xué)功能.
目前GATA在番茄、擬南芥、葡萄、毛果楊、蘋果和大豆中都有深入研究.為了更加深入地探究MrGATA轉(zhuǎn)錄因子家族的系統(tǒng)發(fā)育機制,比較了楊梅與上述6個物種之間的共線性關(guān)系(圖6).楊梅中共有32個GATA基因與大豆同源,與番茄、擬南芥、葡萄、毛果楊、以及蘋果之間的同源基因數(shù)量分別為19、11、18、27、26個.并且部分MrGATA存在著多對同源基因相關(guān)性,特別是在楊梅和毛果楊之間存在著5對同源基因相關(guān)聯(lián),例如MrGATA11,此類基因可能是GATA基因家族進(jìn)化過程中的重要驅(qū)動力.楊梅與6個物種間存在著固定的且高度保守的共長塊上的GATA共線基因?qū)?,推測可能在祖先分化之前已經(jīng)存在這些同源配對.
灰色表示楊梅與其他物種所有基因共線塊,紅色表示GATA基因的共線關(guān)系.
隨著如今測序技術(shù)的進(jìn)步,生物信息學(xué)的發(fā)展日益加快,這有利于研究特定的轉(zhuǎn)錄因子在基因表達(dá)調(diào)控過程中所發(fā)揮的作用,從而在植物自身生長發(fā)育和栽培育種過程中更好地發(fā)揮其功能,提高植物的抗性和生態(tài)幅.楊梅作為我國南方重要的果樹,功能基因在其生長發(fā)育過程中發(fā)揮至關(guān)重要的作用.本研究在楊梅全基因組中共鑒定出26個MrGATA轉(zhuǎn)錄因子,并利用生物信息學(xué)知識進(jìn)行基本特征、順式作用元件和進(jìn)化關(guān)系的預(yù)測分析.
系統(tǒng)發(fā)育樹的聚類結(jié)果表明,MrGATA基因與擬南芥、蘋果中的相似,并且蛋白序列具有較高的同源性,功能的一致性與蛋白質(zhì)的相似性和序列的同源性相關(guān),可推斷MrGATA蛋白與擬南芥、蘋果中的GATA蛋白具有相似的功能.順式作用元件的富集分析表明,MrGATA成員具有的潛在功能,其功能與非生物脅迫、光響應(yīng)以及激素相關(guān)聯(lián).此外26個MrGATA啟動子區(qū)域內(nèi)存在多種參與基因干旱相應(yīng)轉(zhuǎn)錄調(diào)控的順式作用元件,如MBS、LTR、TC-rich repeats以及WUN-motif,這與楊梅自身抗干旱的特性相符合.楊梅自身以及楊梅與其他6個物種間的共線性分析結(jié)果表明,基因復(fù)制和片段性的重復(fù)事件可能是部分MrGATA演變的主要驅(qū)動力,并且楊梅與其他物種間的同源基因?qū)赡茉谖锓N分化之前就形成了.
MrGATA基因各亞族在各組織中和不同果實發(fā)育時期的表達(dá)情況均具有顯著差異,即使是同一亞族內(nèi)的成員,表達(dá)情況也具有差異,這說明了各基因具有不同的功能.有3個基因(MrGATA11,MrGATA17,MrGATA24)在各組織中均具有高表達(dá),尤其是在芽和葉,F(xiàn)PKM>20,并且其在果實3個發(fā)育時期也具有較高的表達(dá)量.其中MrGATA17和MrGATA24屬于第Ⅲ亞族,該亞家族還具有特殊功能結(jié)構(gòu)域CTT和Tify,結(jié)合之前擬南芥中的報道,可以推測該亞族成員參與了楊梅的光合作用、開花、根和下胚軸發(fā)育過程,并且在果實成熟過程中發(fā)揮著重要的作用.
然而,GATA轉(zhuǎn)錄因子家族在單子葉植物中的研究結(jié)果與雙子葉植物的研究結(jié)果存在著顯著區(qū)別.例如GATA轉(zhuǎn)錄因子家族在水稻中聚類成6個亞家族,并且各亞家族的內(nèi)含子和外顯子的分布與數(shù)量等基因結(jié)構(gòu)特征以及保守結(jié)構(gòu)域存在著明顯區(qū)別,例如第Ⅴ亞族中存在1個FAR1結(jié)構(gòu)域和ZnFPMZ結(jié)構(gòu)域,而在第Ⅵ亞族的成員中存在著2個GATA結(jié)構(gòu)域.保守結(jié)構(gòu)域以及基因結(jié)構(gòu)的差異表明了GATA家族在單子葉植物和雙子葉植物之間存在著不同的功能和特性,并且GATA亞家族Ⅴ和Ⅳ可能是在雙子葉植物與單子葉植物發(fā)生分化后出現(xiàn)的,但此結(jié)論還需要進(jìn)一步的研究.
GATA轉(zhuǎn)錄因子在植物的種子萌發(fā)、激素響應(yīng)、光形態(tài)建成以及開花過程都充當(dāng)著重要的角色.本研究中對楊梅GATA轉(zhuǎn)錄因子家族進(jìn)行了全面的鑒定,并且各亞家族內(nèi)成員基因和蛋白質(zhì)結(jié)構(gòu)具有較高的相似性和保守性.雖然楊梅的26個GATA轉(zhuǎn)錄因子在染色體上分布不均勻,但是其進(jìn)化相對保守,并且串聯(lián)重復(fù)事件的發(fā)生可能是GATA基因功能的巨大驅(qū)動力.此外,系統(tǒng)發(fā)育樹以及物種間共線性分析揭示了MrGATA基因的進(jìn)化情況.這些數(shù)據(jù)為探究楊梅MrGATA基因的功能以及分子育種提供了依據(jù).