楊玄松,謝雯榕,顧 鋼,宋江雨,趙云飛,林曉路,謝小芳,張炳輝*
1. 福建農(nóng)林大學(xué)生命科學(xué)學(xué)院, 福州市倉山區(qū)上下店路15 號 350002
2. 福建省煙草專賣局煙草科學(xué)研究所,福州市鼓樓區(qū)北環(huán)中路133 號 350003
3. 福建省煙草公司南平市公司,福建省南平市延平區(qū)江濱中路389 號 364200
4. 福建省煙草公司三明市公司,福建省三明市三元區(qū)崇桂新村100 幢 365000
5. 福建省煙草公司龍巖市公司,福建省龍巖市新羅區(qū)龍巖大道288 號 364000
GATA 轉(zhuǎn)錄因子是真核生物中一種含有高度保守的Ⅳ類鋅指基序的DNA結(jié)合蛋白,這類反式作用因子能夠特異性地結(jié)合含有WGATAR 的DNA 序列(其中:W對應(yīng)A或T,R對應(yīng)A或G),從而調(diào)控相關(guān)基因的表達(dá)。該轉(zhuǎn)錄因子最初在動物和真菌中被證實,之后發(fā)現(xiàn)GATA轉(zhuǎn)錄因子也大量存在于植物中[1]。
動物中GATA 轉(zhuǎn)錄因子的DNA 結(jié)合域表現(xiàn)為C-X2-C-X17-C-X2-C的形式[2],同時GATA蛋白有兩個功能不同的鋅指結(jié)構(gòu)[3-4]。目前發(fā)現(xiàn)動物GATA家族有6個成員,依次為GATA1-6,根據(jù)其結(jié)構(gòu)特征可分為兩個亞族,其中GATA1-3 為一個亞族,GATA4-6為另一亞族[5]。有研究表明,動物中GATA轉(zhuǎn)錄因子與細(xì)胞的增殖分化以及動物個體的生長發(fā)育有著密切聯(lián)系[2],其中GATA1-3與動物細(xì)胞的造血功能密切相關(guān)[6],而GATA4-6在動物心臟形成過程中發(fā)揮重要作用[7-8]。與動物的GATA轉(zhuǎn)錄因子家族不同,真菌中大多數(shù)的GATA蛋白僅包含單個鋅指結(jié)構(gòu)域,通常分為兩大類:一類GATA蛋白是帶有17個殘基的Ⅳa 型鋅指(C-X2-C-X17-C-X2-C);另一類則是帶有18 個殘基的Ⅳb 型鋅指(C-X2-C-X18-C-X 2-C)[9],此外,在極少數(shù)真菌中也發(fā)現(xiàn)帶有19個或20個殘基鋅指環(huán)的GATA蛋白。GATA轉(zhuǎn)錄因子在真菌中參與調(diào)控氮代謝、鐵載體的生物合成、光誘導(dǎo)以及晝夜節(jié)律等過程[10]。
植物中的第1個GATA 轉(zhuǎn)錄因子NTL1克隆于煙草,揭示了高等植物GATA轉(zhuǎn)錄因子的存在,該轉(zhuǎn)錄因子被證實參與了氮代謝途徑[11]。大多數(shù)植物GATA轉(zhuǎn)錄因子通常只包含1個帶有18或20個殘基的鋅指結(jié)構(gòu)域(C-X2-C-X18-C-X2-C 或C-X2-C-X20-C-X2-C),但也存在兩個鋅指結(jié)構(gòu)域的特殊情況[12]。已有研究表明,植物中GATA 轉(zhuǎn)錄因子通過與啟動子上的WGATAR序列結(jié)合,從而啟動或抑制轉(zhuǎn)錄過程而調(diào)控植物的生長發(fā)育[13],包括調(diào)控花器官、莖尖分生組織的發(fā)育以及細(xì)胞的增殖與分化[14],促進(jìn)種子萌發(fā)[15],調(diào)控葉綠體的形成[16],參與葉綠素的合成和葡萄糖信號傳導(dǎo)[17],光保護(hù)反應(yīng)[18],干旱、冷害、黑暗等非生物脅迫響應(yīng)過程[19-22]和植物激素的合成(如細(xì)胞分裂素等)[23],以及碳、氮代謝等生物學(xué)過程[11,17]。同時研究還發(fā)現(xiàn)GATA轉(zhuǎn)錄因子對葉片衰老也起著重要的調(diào)控作用[24]。
煙草收獲的主要器官為煙葉,而葉片的生長發(fā)育、葉色的轉(zhuǎn)換以及衰老成熟與煙葉品質(zhì)密切相關(guān)[25]。此外,在生產(chǎn)過程中,煙葉常常受高溫和冷害等各種逆境脅迫的影響,從而影響煙葉產(chǎn)量。已有研究表明:GATA 轉(zhuǎn)錄因子在植物葉片衰老[24]和逆境脅迫過程中起著重要的調(diào)控作用[19-22]。鑒于該家族的重要性,近年來在許多植物中開展了GATA基因家族成員的鑒定和系統(tǒng)分析,包括水稻[1]、擬南芥[1]、大豆[26]、沙冬青[22]、蘋果[23]、毛竹[27]和蓖麻[28]等。然而,目前有關(guān)煙草GATA 基因家族及其成員表達(dá)情況尚鮮見報道。為此,通過生物信息學(xué)分析在煙草全基因組范圍內(nèi)全面鑒定煙草GATA 轉(zhuǎn)錄因子家族成員,并分析GATA 家族成員在不同逆境脅迫和不同成熟時期煙葉中的表達(dá)情況,旨在為煙草GATA 轉(zhuǎn)錄因子的功能研究提供依據(jù)。
供試品種為翠碧1 號。反轉(zhuǎn)錄試劑盒由福建佰孟醫(yī)學(xué)科技有限公司生產(chǎn);多糖多酚植物總RNA快速提取試劑盒由北京百泰克生物技術(shù)有限公司生產(chǎn);引物由生工生物工程(上海)股份有限公司合成;其他常規(guī)試劑均為國產(chǎn)分析純。
ETC811型基因擴(kuò)增儀(東勝創(chuàng)新生物科技有限公司);Thermofisher ABI QuantStudio1 實時熒光定量PCR儀(QS1型,美國應(yīng)用生物系統(tǒng)公司)。
1.2.1 低溫、干旱和鹽脅迫處理
以培養(yǎng)45 d 的煙苗為材料,將幼苗移植到裝有營養(yǎng)液的托盤中,分別進(jìn)行低溫脅迫(4 ℃)、干旱脅迫(托盤營養(yǎng)液中加入260 mmol/L 甘露醇溶液)和鹽脅迫(托盤營養(yǎng)液中加入150 mmol/L NaCl 溶液)處理[29],并以常溫(25 ℃)下托盤營養(yǎng)液中未添加甘露醇和NaCl為對照。在處理6 h后采集處理和對照煙苗葉片,迅速冷凍于-80 ℃冰箱中。每個樣品3次生物學(xué)重復(fù)。
1.2.2 生物信息學(xué)分析
將前人已鑒定的30 個擬南芥GATA 家族成員的蛋白序列作為種子序列[1,9],利用植物數(shù)據(jù)庫Phytozome(http://www.phytozome.net/)下載 30 個擬南芥GATA基因的蛋白序列。利用茄科數(shù)據(jù)庫(https://solgenomics.net/)進(jìn)行 BLASTP 搜索,將滿足相似度≥30%,且 E 取值≤E-10的序列初篩為煙草GATA候選蛋白,隨后利用在線工具CDD(https://www.ncbi.nlm.nih.gov/cdd/)對候選蛋白進(jìn)行結(jié)構(gòu)域鑒定,將具有GATA 蛋白典型的鋅指結(jié)構(gòu)域(pfam00320)的序列作為最終的候選蛋白,下載對應(yīng)的基因序列并重新命名(NtGATA)。利用Protparam(http://web.expasy.org/ptotparam/)對煙草GATA蛋白的氨基酸數(shù)目、分子量、等電點和親疏水性進(jìn)行分析。
利用軟件ClustalX 以及MEGA7 采用鄰接法(Neighbor-Joining,NJ)進(jìn)行系統(tǒng)發(fā)育樹構(gòu)建,設(shè)置1 000 次自舉重復(fù)[30-31],用軟件 DNAMAN 對煙草GATA蛋白進(jìn)行多重序列比對[32]。
使用煙草品種K326 更新版本的基因組數(shù)據(jù)庫(Edwards 2017 版本)(https://solgenomics.net/organis m/Nicotiana_tabacum/genome),從數(shù)據(jù)庫中下載煙草GATA 基因結(jié)構(gòu)的文件(包含GFF、核酸和蛋白序列等),利用 GSDS(Gene Structure Display Server;http://gsds.cbi.pku.edu.cn/)軟件分析煙草 GATA 基因結(jié)構(gòu)并繪圖。利用DNAman 6.0 軟件對煙草GATA基因家族成員的GATA保守域組成進(jìn)行分析。利用MEME(http://meme-suite.org/tools/meme)工具獲取煙草GATA 蛋白的保守基序(motif),motif 個數(shù)設(shè)置為10個。
1.2.3 基因表達(dá)分析
利用不同成熟期中部葉(M1~M5)的轉(zhuǎn)錄組數(shù)據(jù)[33],獲取NtGATA 的表達(dá)值(FPKM 值)。不同成熟期煙葉(M1~M5)的判斷主要基于葉色、葉脈和絨毛等外觀特征[34]。其中:M1 葉色翠綠,茸毛多;M2葉緣泛黃,茸毛部分脫落,主脈半白;M3葉片黃多綠少,葉面出現(xiàn)黃色凸起,主脈和支脈有部分發(fā)白,茸毛脫落;M4 葉面80%以上變黃,茸毛脫落,主脈全白;M5 煙葉片黃白色,葉尖卷曲干枯。利用R 語言中g(shù)plots 包的Heatmap 功能分析不同成熟時期煙葉中NtGATA 基因表達(dá)量的變化。采用植物總RNA 提取試劑盒分別提取經(jīng)各脅迫處理樣品的總RNA。采用 SYBR Premix Ex Taq(Takara)兩 步 法 進(jìn) 行qRT-PCR 測定,qRT-PCR 引物序列和內(nèi)參基因引物見表1。設(shè)置3次重復(fù),以對照煙葉基因表達(dá)量為參照,采用 2-△△Ct方法[35]計算煙草 GATA 家族各個成員的相對表達(dá)量。
表1 煙草NtGATA 基因qRT-PCR 引物Tab.1 Primers for qRT-PCR analysis of NtGATA genes in tobacco
通過相似性搜索,在煙草基因組中共獲得64 個初步的GATA 候選蛋白(去除重復(fù)),利用CDD 工具分析這些序列的保守結(jié)構(gòu)域,發(fā)現(xiàn)其中7個蛋白不含該家族典型的鋅指結(jié)構(gòu)域(pfam00320),將這些序列剔除,最終在煙草全基因組中確定了57 個GATA 基因家族成員。對57個煙草GATA蛋白的理化性質(zhì)分析(表2)發(fā)現(xiàn),氨基酸長度從77 到681 不等,其中NtGATA51 的氨基酸長度最短為 77 aa,NtGATA28 的氨基酸長度最大為681 aa,說明各成員之間的氨基酸保守性較差。分子量從8 251.34 Da(NtGATA51)到 73 703.62 Da(NtGATA28)不等,等電點在 4.93~9.99 之間。所有成員的疏水性指數(shù)均為負(fù)值(-0.367~ -1.008),可見煙草GATA 蛋白均為不同程度的親水蛋白[28]。
表2 煙草GATA 基因信息Tab.2 Information on GATA genes in tobacco
表2(續(xù))
將57個NtGATA分成4個亞族(Ⅰ~Ⅳ)(圖1A),其中第Ⅰ亞族成員數(shù)量最多,達(dá)到29個(約50.9%);第Ⅱ亞族次之,包含14個成員(約24.6%);第Ⅲ亞族有8個成員(約占14.0%);第Ⅳ亞族成員最少,僅6個成員(約10.5%)。煙草GATA基因家族成員的外顯子個數(shù)差異較大(圖1B),變化區(qū)間在1(NtGATA16)到17(NtGATA28)之間;每個亞族具有相似的基因結(jié)構(gòu),同一亞族的外顯子數(shù)量與長度大體相似;值得注意的是,第Ⅱ亞族中的NtGATA3 的基因結(jié)構(gòu)與亞族中的其他成員差異較大,可能是進(jìn)化過程中發(fā)生了內(nèi)含子的插入;第Ⅰ亞族和第Ⅱ亞族外顯子長度較長,外顯子個數(shù)相對較少,大多在1~3個之間;第Ⅲ亞族和第Ⅳ亞族的NtGATAs 外顯子長度較短,但是外顯子個數(shù)較多,大多在8~10個之間。
圖1 煙草GATA家族基因結(jié)構(gòu)分布與進(jìn)化Fig.1 Structure and evolution of tobacco GATA gene family
利用MEME 工具獲取了煙草GATA 蛋白的10個保守基序(motif),見表3?;蚍治鼋Y(jié)果(圖2)表明:同一亞族中大部分成員具有相似的基序組成。第Ⅰ亞族成員較多,其保守基序數(shù)量在1~5個之間,其中motif 2、7、9為第Ⅰ亞族特有的保守基序。第Ⅱ亞族成員只含有motif 1,是4 個亞族中motif 種類最少的亞族。第Ⅲ亞族的8 個成員中均有motif 1 和motif 4,其中兩個成員(NtGATA4 與NtGATA47)還具備第Ⅲ亞族特有的保守基序motif 3 和motif 4。第Ⅳ亞族含有6種保守基序,是保守基序種類最豐富的亞族,其中motif 5、6、8、10 為第Ⅳ亞族特有的保守基序。
圖2 NtGATA蛋白質(zhì)保守基序分布Fig.2 Distribution of conserved motifs of NtGATA proteins
表3 煙草GATA蛋白的保守基序信息Tab.3 Conserved motifs of tobacco NtGATA proteins
通過 DNAMAN 對 57 個 GATA 蛋白序列(圖 3)的聯(lián)配分析發(fā)現(xiàn),除第Ⅱ亞族的NtGATA44 和NtGATA51以及第Ⅳ亞族的NtGATA8、NtGATA49和NtGATA56 外的52 個煙草GATA 基因均含有完整的鋅指結(jié)構(gòu)域。NtGATA44 與NtGATA51 丟失了第2個 半 胱 氨 酸 對 ,而 NtGATA8、NtGATA49 和NtGATA56丟失了第1個半胱氨酸對,可能是在進(jìn)化過程中造成了丟失。57個GATA蛋白鋅指結(jié)構(gòu)域的形式分為兩大類,分別為C-X2-C-X18-C-X2-C 和C-X2-C-X20-C-X2-C。 其 中 結(jié) 構(gòu) 域 為C-X2-C-X20-C-X2-C 的8 個成員均來自第Ⅲ亞族。其余49 個第Ⅰ、Ⅱ、Ⅳ亞族成員結(jié)構(gòu)域均為C-X2-C-X18-C-X2-C。4 個的亞族中的結(jié)構(gòu)域氨基酸組成高度保守,如鋅指結(jié)構(gòu)域的第13、14、17、19和20號位點上的氨基酸,依次為蘇氨酸、脯氨酸、精氨酸、甘氨酸和脯氨酸(圖中第1 個氨基酸作為第1個位點)。但各亞族也存在個別特異的氨基酸,如第Ⅰ亞族煙草GATA蛋白特有的保守氨基酸為鋅指結(jié)構(gòu)域第15 號位點上的谷氨酰胺以及第25 號位點上的蘇氨酸;第Ⅲ亞族特有的保守氨基酸為第16號位點上的甲硫氨酸、第18號位點上的精氨酸以及第32號位點上的亮氨酸;第Ⅳ亞族特有的保守氨基酸為第22 號位點上的谷氨酸。此外,第Ⅲ亞族NtGATA蛋白還具有一個顯著特征,即在鋅指結(jié)構(gòu)域的第11和12號位點上插入了兩個氨基酸。
圖3 煙草GATA蛋白成員保守結(jié)構(gòu)域Fig.3 Conserved domains of tobacco GATA family proteins
參照 Reyes 等[1]在擬南芥中 GATA 家族的分組,整合57 條煙草的GATA 蛋白序列和30 條擬南芥的GATA 蛋白序列構(gòu)建系統(tǒng)發(fā)育樹并進(jìn)行分類,將GATA 蛋白聚類成4 個亞族,見圖4。各個亞族成員數(shù)量分布與擬南芥基本吻合[1,29],其中第Ⅰ亞族的成員最多,擁有29個煙草的GATA家族成員和14個擬南芥的GATA 成員,約占所有GATA 成員的50%,而第Ⅳ家族的成員最少,僅含有6個煙草GATA成員和2 個擬南芥的GATA 成員。此外,4 個分支中均含有煙草和擬南芥的GATA 家族成員,說明這兩個物種的GATA家族成員并未因物種差異而進(jìn)化出單獨的分支,推測GATA 家族的基本特征在這兩個物種分化之前就已經(jīng)形成,而且在進(jìn)化上較為保守。所構(gòu)建的進(jìn)化樹中共鑒定出38對同源蛋白,其中直系同源蛋白較少,僅有1 對(NtGATA35 與AtGATA7),其余37 對均為旁系同源蛋白(煙草27 對,擬南芥10對)。煙草的旁系同源蛋白對的數(shù)量遠(yuǎn)多于擬南芥的旁系同源蛋白對的數(shù)量,推測是由于普通煙草為異源四倍體,從而產(chǎn)生大量的同源基因所致。
圖4 煙草與擬南芥GATA基因家族系統(tǒng)進(jìn)化樹Fig.4 Phylogenetic tree of GATA gene family in Nicotiana tabacum and Arabidopsis thaliana
根據(jù)成熟期(M1~M5)煙葉的轉(zhuǎn)錄組數(shù)據(jù),從中獲取NtbGATA 基因的表達(dá)量數(shù)據(jù),整合表達(dá)量較高的46 個NtGATA 基因(PFKM≥0.5)并繪制熱圖(圖5)。結(jié)果發(fā)現(xiàn):第Ⅲ組的9個基因在不同成熟時期中的表達(dá)均較高,而第Ⅱ組的10個基因的表達(dá)量較低;第Ⅰ組的家族成員表達(dá)量居中,其中有部分基因表達(dá)表現(xiàn)出明顯的時空特異性,例如NtGATA55、NtGATA52、NtGATA11 和 NtGATA1 等在 M2 和 M3 時期有較高的表達(dá)量;NtGATA32 基因在煙葉M5 時期的表達(dá)量遠(yuǎn)高于其他時期。值得注意的是,部分基因的表達(dá)與成熟度呈現(xiàn)出較高的相關(guān)性,例如第Ⅲ組中的NtGATA25和NtGATA35在葉片成熟過程中的基因表達(dá)量隨著煙葉成熟度的提高逐漸降低;第Ⅰ組中的NtGATA44 在葉片成熟過程中的表達(dá)量則呈現(xiàn) 上 升 趨 勢 ;NtGATA1、NtGATA11、NtGATA52 和NtGATA55隨著煙葉成熟度的提高,表達(dá)量先升高后下降,在M2時期表達(dá)量最高。這暗示著在煙葉衰老過程中,NtGATA 基因家族成員的功能可能存在多樣性。
圖5 NtGATA基因在不同成熟期煙葉中的表達(dá)分析Fig.5 Expression of NtGATA in tobacco leaves at different maturity stages
隨機挑選了 10 個基因(NtGATA1、NtGATA5、NtGATA6、NtGATA7、NtGATA11、NtGATA25、NtGATA27、NtGATA48、NtGATA54 和 NtGATA55),利用 qRT-PCR分析10個基因在干旱、低溫和鹽脅迫下的表達(dá)量變化。由圖 6A 可知,在干旱脅迫下,NtGATA1 表達(dá)量輕微上調(diào),其余9 個NtGATA 基因均表現(xiàn)出不同程度的下調(diào);而在低溫脅迫條件下(圖6B),NtGATA1基因表達(dá)量明顯上調(diào),暗示該基因可能在抗低溫脅迫中發(fā)揮重要作用;其余9 個基因(尤其NtGATA6、NtGATA11、NtGATA25、NtGATA54 和 NtGATA55)表現(xiàn)為明顯下調(diào);在鹽脅迫條件下(圖 6C),10 個NtGATA 基因的表達(dá)量均明顯低于對照,其中NtGATA54 的表達(dá)量幾乎下降了20 倍。推測大多數(shù)煙草GATA基因可能在干旱、低溫和鹽脅迫中起負(fù)向調(diào)控作用。
圖6 NtGATA基因在低溫、鹽和干旱脅迫條件下的表達(dá)分析Fig.6 Expressions of NtGATA genes under cold, salt and drought stresses
利用生物信息學(xué)方法,在煙草全基因組中鑒定出57個GATA基因家族成員,與擬南芥(30個)、水稻(29 個)中的GATA 家族相比,煙草中GATA 家族成員數(shù)量明顯較多。這可能與煙草是異源四倍體的性質(zhì)相關(guān),煙草異源四倍體分別來源于林煙草與絨毛狀煙草[36]。研究表明,基因在發(fā)生倍增現(xiàn)象后,往往會出現(xiàn)兩個相同的基因,即同一基因的兩個拷貝,隨后在自然選擇的作用下,由于一個拷貝就能維持基因原有的功能,因此,當(dāng)另一個基因拷貝上發(fā)生的突變時便很容易被積累,從而演變成假基因或進(jìn)化出具有新功能的同源基因[37],所以,基因組多倍化后,容易進(jìn)化出大量的新基因。煙草基因組的異源多倍化可能是煙草GATA基因家族成員擴(kuò)增的重要原因。
植物的衰老過程中,一些轉(zhuǎn)錄因子會激活或抑制逆境基因的表達(dá),其實質(zhì)是細(xì)胞的程序性死亡[38]。煙葉成熟過程中葉色的轉(zhuǎn)換是關(guān)鍵環(huán)節(jié),包含了葉綠體的降解和一系列物質(zhì)能量的轉(zhuǎn)變,實際上也是一種衰老的過程。本研究中發(fā)現(xiàn)NtGATA 基因在煙葉中廣泛表達(dá),而且大多數(shù)NtGATA基因在煙葉的不同成熟時期呈現(xiàn)出差異性表達(dá);在水稻中GATA基因家族成員的過量表達(dá)可以延緩其衰老[39];這與王志敏等[25]研究提出的GATA 轉(zhuǎn)錄因子對植物葉片衰老起調(diào)控作用的結(jié)論相符。此外,還有部分NtGATA基因隨著煙葉成熟程度的提高表達(dá)量表現(xiàn)出規(guī)律性的變化,例如NtGATA25 和 NtGATA35 基因表達(dá)量隨著煙葉成熟度的增加逐漸降低,NtGATA44隨成熟度提高呈現(xiàn)上升趨勢,我們推測這些基因可能在煙葉成熟衰老過程中發(fā)揮重要作用,可進(jìn)一步開發(fā)為煙葉成熟鑒定的標(biāo)記基因。
本研究中還發(fā)現(xiàn),在干旱、低溫和鹽脅迫條件下,NtGATA 基因家族成員表達(dá)量大多呈現(xiàn)下調(diào)趨勢,其中NtGATA54 在鹽脅迫條件下,表達(dá)量下降了近20 倍,說明煙草GATA 基因家族成員對逆境響應(yīng)敏感,這與王娟等[13]得出的GATA 轉(zhuǎn)錄因子響應(yīng)植物在非生物脅迫下的調(diào)節(jié)機制相同。在玉米的GATA基因家族研究中,玉米GATA基因家族成員在熱脅迫過程中響應(yīng)各異,有些基因呈現(xiàn)上調(diào)表達(dá),有些基因則表現(xiàn)出下調(diào)表達(dá)[40]。這說明GATA基因家族在長期進(jìn)化過程發(fā)生了功能分化,各物種中的不同成員在不同逆境脅迫環(huán)境下存在響應(yīng)程度的差異。
通過生物信息學(xué)分析的方法在煙草基因組中共鑒定出57個GATA基因,分為4個亞族。NtbZIP成員基因結(jié)構(gòu)多樣,各GATA 蛋白成員具有典型的鋅指結(jié)構(gòu)域;大多數(shù)NtGATA基因在不同成熟時期的煙葉中均有表達(dá),且不同成員的表達(dá)模式存在差異;其中大部分NtGATA基因?qū)洹Ⅺ}和干旱等非生物脅迫存在不同程度的響應(yīng)。說明煙草GATA 基因家族成員在煙葉成熟衰老及逆境脅迫響應(yīng)中可能具有重要的調(diào)控作用。