周 珂,劉乃新,于清濤,2
(1.黑龍江大學(xué)現(xiàn)代農(nóng)業(yè)與生態(tài)環(huán)境學(xué)院,哈爾濱 150080; 2.哈爾濱市農(nóng)業(yè)科學(xué)院,哈爾濱 150000)
植物的發(fā)育是一個(gè)非常復(fù)雜的過(guò)程。在這個(gè)過(guò)程中,DNA和蛋白質(zhì)起著重要的作用。通過(guò)它們之間的相互作用,實(shí)現(xiàn)對(duì)基因表達(dá)的調(diào)控。眾所周知,基因表達(dá)的調(diào)控主要發(fā)生在轉(zhuǎn)錄水平上,而在轉(zhuǎn)錄水平上與DNA相互作用的蛋白質(zhì)分子中最多樣化的是轉(zhuǎn)錄因子(TF)。轉(zhuǎn)錄因子通過(guò)激活許多與植物生長(zhǎng)和發(fā)育有關(guān)的功能基因而發(fā)揮重要作用。通過(guò)與DNA結(jié)合或調(diào)節(jié)DNA結(jié)構(gòu),TF可以調(diào)節(jié)與逆境脅迫有關(guān)的基因的表達(dá),從而控制植物的生物過(guò)程[1]。
NAC基因家族主要存在于植物中,它的名字來(lái)自于三個(gè)基因的縮寫(矮牽牛的NAM,擬南芥的ATAF和CUC2)。無(wú)根尖分生組織(NAM)是在矮牽牛中發(fā)現(xiàn)的第一個(gè)特征化的NAC蛋白[2],而擬南芥轉(zhuǎn)錄激活因子(ATAF)和杯狀子葉(CUC)是在擬南芥中發(fā)現(xiàn)的。NAC蛋白在N端有一個(gè)高度保守的NAC結(jié)構(gòu)域[3]。NAC結(jié)構(gòu)域由幾個(gè)螺旋體組成,環(huán)繞著一個(gè)反向平行的B-折疊,它可以結(jié)合DNA和其他蛋白[4],轉(zhuǎn)錄因子的C端是轉(zhuǎn)錄激活功能區(qū),其序列和功能具有多樣性[5]。
目前,在擬南芥中已發(fā)現(xiàn)110多個(gè)NAC成員,在水稻中發(fā)現(xiàn)140多個(gè)NAC成員。以前的研究表明,NAC基因家族參與了植物發(fā)育和形態(tài)發(fā)生的各種過(guò)程,包括芽尖分生組織的形成[6]胚胎發(fā)育[7]花器官的形態(tài)發(fā)生[8],側(cè)根的形成[9]葉衰老[10]和脅迫條件下的花器官誘導(dǎo)。NAC基因家族的成員還參與了細(xì)胞周期控制、激素信號(hào)轉(zhuǎn)導(dǎo)等。[11]激素信號(hào)轉(zhuǎn)導(dǎo)[12]和谷物營(yíng)養(yǎng)物質(zhì)的轉(zhuǎn)運(yùn)[13]。
此外,NAC基因家族還與植物抗性有關(guān),如干旱[14],高鹽[15]、低溫[16]、機(jī)械損傷[17]和病毒感染[18]。
甜菜(Betavulgaris)是一種兩年生草本植物,原產(chǎn)于歐洲西部和南部沿海地區(qū),是甘蔗以外的主要糖源。根據(jù)聯(lián)合國(guó)糧食及農(nóng)業(yè)組織(FAO)的數(shù)據(jù),全世界每年有30%的糖產(chǎn)量來(lái)自甜菜,它也是生物乙醇的重要來(lái)源。[19]天然色素[20]蔬菜[21]和動(dòng)物飼料的重要來(lái)源。[22]近年來(lái),越來(lái)越多的瑞士甜菜[23]栽培品種(紅莖葉甜菜、紅葉甜菜)作為觀賞植物被廣泛用于景觀配置。
甜菜在生長(zhǎng)發(fā)育過(guò)程中,容易受到各種生物和非生物脅迫的影響,嚴(yán)重影響甜菜的產(chǎn)量和觀賞價(jià)值。本研究以甜菜全基因組為基礎(chǔ),鑒定了NAC家族的成員,并分析了其基因結(jié)構(gòu)、染色體定位、亞細(xì)胞定位、蛋白質(zhì)保守結(jié)構(gòu)域和系統(tǒng)發(fā)育關(guān)系,為分析NAC轉(zhuǎn)錄因子的功能和構(gòu)建抗逆調(diào)控網(wǎng)絡(luò)奠定了基礎(chǔ)。
甜菜基因組和注釋文件數(shù)據(jù)下載自NCBI(https://www. ncbi.nlm.nih.gov/sra/?term=beta+vulgaris)。NAC基因家族保守結(jié)構(gòu)包含有PF01849、PF02365(數(shù)據(jù)來(lái)自Pfam數(shù)據(jù)庫(kù)),利用 HMMER3.0 軟件(http://www.ebi.ac.uk/Tools/hmmer/)搜索甜菜蛋白序列,鑒定甜菜的PF01849、PF02365的 NAC 候選基因。候選基因再利用保守結(jié)構(gòu)域預(yù)測(cè)網(wǎng)站Pfam (http://pfam.xfam.org/)和CDD (http://www.ncbi.nlm.nih.gov/cdd/)進(jìn)行檢測(cè),保留完整的結(jié)構(gòu)域的作為NAC基因。利用 ProtParam (http://web.expasy.org/protp-aram/)分析NAC基因的氨基酸長(zhǎng)度、分子質(zhì)量、理論等電點(diǎn)進(jìn)行分析。
引入擬南芥 NAC 基因家族對(duì)甜菜NAC基因進(jìn)行亞組分類,擬南芥 NAC 蛋白序列下載于arabidopsis網(wǎng)站 (http://www.arabidopsis.org/)。將篩選得到的甜菜 NAC 蛋白序列進(jìn)行進(jìn)化樹(shù)分析,利用 Clustalx2.0 軟件進(jìn)行多序列比對(duì),再通過(guò)進(jìn)化樹(shù)分析軟件 MEGA5.2根據(jù)NJ方法構(gòu)建系統(tǒng)進(jìn)化樹(shù)(參數(shù)設(shè)置: P-distance, pairwise deletion, bootstrap (1 000 次重復(fù)))
使用MEME程序(http://meme.nbcr.net/meme/cgi-bin/meme.cgi)對(duì)甜菜的motif進(jìn)行識(shí)別。主要參數(shù)Motif的最大數(shù)量是15。
甜菜 NAC 基因的內(nèi)含子、外顯子和基因組定位信息均下載于NCBI數(shù)據(jù)庫(kù)甜菜注釋文件。利用在線軟件 GSDS2.0(http://gsds.cbi.pku.edu.cn/) 對(duì) NAC 的內(nèi)含子和外顯子結(jié)構(gòu)進(jìn)行分析和整理;利用R包c(diǎn)hromPlot對(duì)NAC基因進(jìn)行染色體定位。利用軟件MCscanX對(duì) NAC 基因進(jìn)行片段復(fù)制和串聯(lián)復(fù)制分析。
從NCBI下載甜菜逆境的轉(zhuǎn)錄組數(shù)據(jù), ID PRJNA254489。使用軟件solexQA 對(duì)下載的數(shù)據(jù)進(jìn)行質(zhì)量控制,使用軟件Tophat2進(jìn)行比對(duì)并使用Cufflink計(jì)算表達(dá)量, 使用R包pheatmap進(jìn)行候選基因的可視化。
前人研究報(bào)道,NAC基因可能受miR164調(diào)控。根據(jù) miR164 靶序列(TGCACGTGCCCTGCTTCTCCA) ,在篩選得到的 52 個(gè)候選甜菜 NAC 轉(zhuǎn)錄因子相應(yīng)的核苷酸序列中使用 BLAST在線聯(lián)配工具,預(yù)測(cè)潛在的miR164的靶標(biāo)。
通過(guò) NCBI數(shù)據(jù)庫(kù)下載甜菜基因組及蛋白序列,根據(jù) NAC 保守域序列號(hào) PF01849、PF02365(Pfam數(shù)據(jù)庫(kù)),利用 HMMER3.0 軟件檢索甜菜的氨基酸序列。再利用保守結(jié)構(gòu)域預(yù)測(cè)網(wǎng)站 Pfam和 CDD對(duì)候選序列進(jìn)行篩選鑒定。通過(guò)以上篩選獲得 87個(gè)NAC候選基因,5個(gè)含有NAC結(jié)構(gòu)域,82個(gè)為NAM結(jié)構(gòu)域。去除掉可變剪切和位于scaffold上的NAC基因,一共獲得52個(gè)甜菜NAC基因。利用 ExPASy 提供的在線軟件 ProtParam (http://web.expasy.org/protp-aram/)對(duì)候選成員氨基酸序列進(jìn)行一級(jí)結(jié)構(gòu)預(yù)測(cè)結(jié)果見(jiàn)表1。
表1 β硫化物中NAC基因的數(shù)量和特性
續(xù)表1
引入已知類型的擬南芥 NAC 蛋白序列,構(gòu)建 BvNAC的進(jìn)化樹(shù)。通過(guò)已知擬南芥 NAC 蛋白的類型指導(dǎo) BvNAC 蛋白的分組。進(jìn)化樹(shù)結(jié)果顯示,BvNAC 蛋白序列可分為 18 個(gè)亞族(圖 2)。各亞族成員數(shù)量分布差異很大,其中Ⅻ亞族的Bv NAC 轉(zhuǎn)錄因子成員最多為 28 個(gè),而Ⅸ和Ⅹ亞族成員均只有一個(gè)。其中的Ⅻ亞族與擬南芥并沒(méi)有相聚成簇。
圖1 Beta vulgaris和擬南芥的NAC基因的系統(tǒng)發(fā)育樹(shù)
利用在線MEME軟件對(duì)甜菜 NAC 的 NAC 結(jié)構(gòu)域進(jìn)行分析,結(jié)果發(fā)現(xiàn)甜菜 NAC 轉(zhuǎn)錄因子的 NAC 保守結(jié)構(gòu)域是高度保守的(圖2)。NAC 保守結(jié)構(gòu)域中包含 15個(gè)亞結(jié)構(gòu)域,其中 A、C、D 亞結(jié)構(gòu)域保守性高,B 和 E 保守性低。由于亞族Ⅲ、Ⅵ、Ⅷ、Ⅸ、Ⅹ的成員較少無(wú)法使用 Web Logo 軟件構(gòu)建該組的全序列標(biāo)簽,所以沒(méi)有列出。甜菜 NAC 轉(zhuǎn)錄因子Ⅰ、Ⅴ、Ⅺ亞族成員的保守性最高,而Ⅻ亞族成員保守性最低(圖2)。
圖2 甜菜NAC 轉(zhuǎn)錄因子motif結(jié)構(gòu)分布
甜菜 NAC 基因的內(nèi)含子、外顯子和基因組定位信息均下載于 NCBI數(shù)據(jù)庫(kù)。利用在線軟件 GSDS2.0(http://gsds.cbi.pku.edu.cn/)對(duì) NAC 的內(nèi)含子和外顯子結(jié)構(gòu)進(jìn)行分析和整理(圖3)。甜菜 NAC 轉(zhuǎn)錄因子家族成員主要由 1~7 個(gè)外顯子組成,其中Ⅻ亞族大多數(shù)成員只含有一個(gè)外顯子,這可能與其是甜菜特有的一類 NAC 轉(zhuǎn)錄因子有關(guān)。
圖3 甜菜 NAC 轉(zhuǎn)錄因子家族染色體定位和數(shù)量分布
利用R包c(diǎn)hromPlot制作 NAC 的染色體定位分布圖,并對(duì) NAC 基因進(jìn)行片段復(fù)制和串聯(lián)復(fù)制分析。本實(shí)驗(yàn)篩選出的 52 個(gè)甜菜 NAC 基因不均勻的分布于 9 條染色體上,6 號(hào)染色體上分布最多,為11 個(gè);其次是 1 號(hào)染色體,為 10 個(gè);7 號(hào)染色體分布最少,只有 1 個(gè)(圖5B)。同時(shí),對(duì)甜菜 NAC 轉(zhuǎn)錄因子基因進(jìn)行片段復(fù)制和串聯(lián)復(fù)制檢測(cè)。多個(gè)甜菜 NAC 轉(zhuǎn)錄因子基因處于甜菜基因組復(fù)制事件區(qū)域,其中沒(méi)有基因經(jīng)歷了片段復(fù)制, 6個(gè)基因經(jīng)歷了串聯(lián)復(fù)制,占基因總數(shù)的 11.5%(圖5A)。可見(jiàn),甜菜 NAC 基因家族以串聯(lián)復(fù)制0為主要擴(kuò)增方式。
根據(jù) miR164靶序列(TGCACGTGCCCTGCTTCTCCA)與篩選得到的 52 個(gè)候選甜菜 NAC 轉(zhuǎn)錄因子相應(yīng)的核苷酸序列,利用 BLAST工具對(duì) miR164 靶序列的定位分析,選取e-value小于 0.009的序列。結(jié)果表明,在 52 個(gè)甜菜 NAC 轉(zhuǎn)錄因子中有1 個(gè) NAC 轉(zhuǎn)錄因子成員(BvNAC30)的核苷酸序列具有 miR164 靶序列識(shí)別位點(diǎn)。
本研究通過(guò)生物信息學(xué)方法篩選出了52條甜菜NAC轉(zhuǎn)錄因子,并對(duì)其構(gòu)建了進(jìn)化樹(shù)、 分析了蛋白質(zhì)保守結(jié)構(gòu)域、染色體上進(jìn)行了定位和 mi R164 靶序列定位,這些研究結(jié)果將為以后 利用基因工程技術(shù)創(chuàng)制甜菜新種質(zhì)提供優(yōu)異基因資源做準(zhǔn)備。