常 瑋,王 娟,于 洋,陳吉寶
(南陽師范學(xué)院 農(nóng)業(yè)工程學(xué)院,河南 南陽473061)
大豆(Glycinemax)是自交作物,在自然條件下天然異交率較低(約為0.5%)[1]。與玉米等作物相比,大豆群體的遺傳多樣性較為單調(diào),加之大豆為光周期敏感植物,也極大地限制了不同地域、不同類型大豆之間的基因交流[2-3]。因此,多年來以雜交為主要手段的大豆育種,在優(yōu)異大豆種質(zhì)創(chuàng)制方面進展緩慢。
目前在作物育種上主要依靠人工誘變創(chuàng)建突變體庫來獲得新變異[4]。近幾年,通過CRISPR/Cas9系統(tǒng)進行基因編輯[5],以及遠緣嫁接等方法進行突變體誘導(dǎo)[6],不僅使突變更具方向性,而且還增加了優(yōu)異變異的幾率。但在突變產(chǎn)生的同時及遺傳過程中,生物體內(nèi)會產(chǎn)生一系列有效的保護機制來修復(fù)這些變異,稱之為DNA修復(fù)系統(tǒng)(DNA repair system)。目前已知的修復(fù)機制包括:錯配修復(fù)(Mismatch repair)、AP修復(fù)(AP repair)、核苷酸切除修復(fù)(Nucleotide excision repair)、光復(fù)活(Photoreactivation)、DNA損傷旁路(DNA damage bypass)、SOS修復(fù)(SOS repair)以及模板指導(dǎo)的缺口修復(fù)(Template-directed gap repair)[7-11]。除此之外,在生物體內(nèi)還存在著一種與突變的發(fā)生和抑制相關(guān)的基因,稱為增變基因(Mutators)。MutT同源酶1(MutT homolog 1, MTH1)基因是細(xì)胞內(nèi)廣泛存在的一類增變基因。MTH1屬于Nudix(Nucleoside diphosphate linked to x)水解酶超級家族(NUDX),是一類具有不同程度底物特異性的水解酶,可以水解包括核苷二磷酸、核苷三磷酸及RNA帽等一系列有機焦磷酸鹽。該酶可將細(xì)胞核苷酸池中的氧化嘌呤核苷酸,如8-氧化鳥嘌呤核苷酸(8-oxo-GTP)、2-羥基腺嘌呤脫氧核苷酸(2-OH-dATP)等水解為核苷單磷酸酯和無機焦磷酸鹽,阻止氧化嘌呤核苷酸錯誤地編入DNA或RNA中,從而大大減少核酸損傷和突變,在維護遺傳物質(zhì)穩(wěn)定性以及核酸損傷修復(fù)機制中起著重要作用[12]。
目前,有關(guān)NUDX在DNA修復(fù)中作用機制的研究主要集中于原核生物和哺乳動物[13-14],而關(guān)于其在植物基因組DNA修復(fù)中的作用研究較少。?,|等[15]采用改進的超級集群分離分析法(Super bulked segregant analysis,Super-BSA),利用大豆HapMap數(shù)據(jù)(包含19 652份材料,52 041個位點)對與大豆基因組點突變比率相關(guān)聯(lián)的位點進行定位,結(jié)果表明,Gm16上的29 153 474-30 604 603 bp、Gm17上的12 133 293-12 147 725 bp均與目標(biāo)性狀存在極強的關(guān)聯(lián)性,上述2區(qū)間內(nèi)均存在一個Nudix水解酶同系物(Glyma16g26440.1和Glyma17g15420.1),這間接表明了大豆NUDX基因與基因組突變的關(guān)系。
近年來隨著越來越多植物基因組序列測序工作的完成,植物NUDX基因的鑒定工作也取得了較多進展。研究人員通過同源比對的方式已經(jīng)分別從擬南芥基因組(~130 Mb)、水稻基因組(~430 Mb)、毛果楊基因組(~480 Mb)及葡萄基因組(~500 Mb)獲得了32,33,53和30個推定的NUDX基因[16]。本研究擬采用全基因組掃描方式,通過對擬南芥、水稻等植物NUDX水解酶蛋白一級結(jié)構(gòu)的分析,獲取序列特征,再根據(jù)該特征在大豆全基因組范圍內(nèi)進行NUDX基因的挖掘,最后通過系統(tǒng)進化分析、表達分析來獲得大豆NUDX基因家族的進化情況及表達特征。
以擬南芥NUDXs蛋白一級結(jié)構(gòu)作為參考,通過DNAMAN (v8.0.8.789)的同源比對功能識別NUDXs蛋白一級結(jié)構(gòu),分析保守結(jié)構(gòu)域;統(tǒng)計保守結(jié)構(gòu)域內(nèi)每個位點氨基酸類型的特征;在此基礎(chǔ)上根據(jù)Perl語言正則表達式進行編碼,并利用Perl語言模式匹配函數(shù)對大豆基因組Wm82.a2.v1[17](http://phytozome.jgi.doe.gov/pz/portal.html)進行掃描。獲取候選基因后,采用TargetP1[18](http://www.cbs.dtu.dk/services/TargetP/)和WoLF-PSORT[19](http://wolfpsort.org/)對各候選基因編碼蛋白的亞細(xì)胞定位結(jié)果進行預(yù)測。
在全基因掃描的基礎(chǔ)上,采用Clustal X對獲得的大豆NUDX基因進行多序列比對,將比對結(jié)果導(dǎo)入MEGA5.1進行系統(tǒng)進化分析[20]。采用鄰接法(Neighbour-Joining)構(gòu)建系統(tǒng)進化樹,重復(fù)抽樣1 000次分析系統(tǒng)樹各分支的置信度。
為了闡明大豆NUDX基因的表達模式,以通過高通量測序技術(shù)獲得的來自大豆10個不同組織的轉(zhuǎn)錄組數(shù)據(jù)(登錄號SRX062325-SRX062334,下載地址:http://www.ncbi.nlm.nih.gov/)為基礎(chǔ),通過分析候選基因在不同組織中的表達豐度來比較不同基因的表達差異。候選基因表達豐度的比較參考Eisen等[21]的方法:數(shù)據(jù)經(jīng)歸一化處理后,首先減去歸一化后的均值,使數(shù)據(jù)集中心化;然后將中心化后的數(shù)據(jù)除以標(biāo)準(zhǔn)差,并以此來比較不同候選基因的表達差異。最終根據(jù)計算結(jié)果,采用R程序包gplots中的heatmap.2函數(shù)(http://CRAN.R-project.org/package=gplots)繪制熱量圖。
根據(jù)統(tǒng)計,NUDXs蛋白一級結(jié)構(gòu)保守結(jié)構(gòu)域為GX5EX7REUXEEXGU,其中X為任意氨基酸,U為Ile、Leu、Val,其Perl語言正則表達式為“Gw{5}Ew{7}RE[ILV]wEEwG[ILV]”。如表1所示,通過全基因組掃描,在20條大豆染色體中共鑒定出69個NUDX基因(GmNUDX1-GmNUDX69),其中56個具有單Nudix 水解酶結(jié)構(gòu)域(Nudix hydrolase domain,NHD);另外13個GmNUDXs除具有NHD外,還有其他的結(jié)構(gòu),例如GmNUDX9和GmNUDX40分別具有2個NHD;GmNUDX5、GmNUDX21及GmNUDX53分別在其C末端包含一個 NADH焦磷酸酶鋅帶結(jié)構(gòu)域(zr-NADH-PPase);GmNUDX46的C末端具有1個肽酶基序(Peptidase motif,PM);GmNUDX39、45、52、62等4個基因各包含1個mRNA脫帽結(jié)構(gòu)(Dcp2)膜結(jié)合基序。
69個NUDX基因的亞細(xì)胞定位結(jié)果(表1)表明,其中有12個基因具有葉綠體轉(zhuǎn)運肽結(jié)構(gòu),定位于葉綠體上;18個基因具有線粒體靶向肽,定位于線粒體上;8個基因具有核定位信號;6個基因具有信號肽;4個基因定位于質(zhì)膜上;剩余的21個基因定位于胞漿內(nèi);沒有定位于內(nèi)質(zhì)網(wǎng)及高爾基體上的GmNUDX基因。
表1 GmNUDX基因家族匯總信息Table 1 Information of GmNUDX gene family
表1(續(xù)) Continued table 1
注:NHD、zr-NADH-PPase、DNHD、Tr、PM和Dcp2分別表示nudix水解酶結(jié)構(gòu)域、NADH焦磷酸酶鋅帶結(jié)構(gòu)域、雙nudix水解酶結(jié)構(gòu)域、跨膜區(qū)、肽酶基序及mRNA脫帽結(jié)構(gòu)。
Note:NHD,zr-NADH-PPase,DNHD,Tr,PM and Dcp2 are the abbreviations of nudix hydrolase domain,NADH pyrophosphatase zinc ribbon,double nudix hydrolase domain,transmembrane region, and decapping mRNA 2,respectively.
為了闡明大豆NUDX基因家族在基因組上的分布規(guī)律,以大豆基因組(Wm82.a2.v1)為參考,利用BLAST比對軟件中的blastn函數(shù)對69個GmNUDXs進行了染色體定位,結(jié)果如圖1所示。由圖1可以看出,69個GmNUDXs分散于全部20條大豆染色體上,但每條染色體上分布的GmNUDXs數(shù)目有一定差異,其中2號、9號染色體上的基因數(shù)目最多,均為7個;而3號、6號、12號、19號染色體上的基因最少,均只有1個。此外,定位結(jié)果還表明,大多數(shù)的GmNUDXs分布于各條染色體的兩端,只有GmNUDX12、13、14、15和23分布于距離著絲粒較近的區(qū)域,這一結(jié)果表明大豆染色體發(fā)生加倍時,同源染色體之間發(fā)生了重排。
圖1 GmNUDXs在大豆20條染色體上的分布圖Fig.1 Genomic distribution of GmNUDXs on soybean chromosomes
為了揭示不同GmNUDXs之間的進化關(guān)系,依據(jù)69個GmNUDXs的蛋白質(zhì)一級結(jié)構(gòu)序列進行了系統(tǒng)進化分析。由圖2可以看出,與大豆中其他基因家族相似,大多數(shù)GmNUDXs具有2個拷貝,這也反映出了大豆古老的基因組復(fù)制事件。在全部69個GmNUDXs中,共有54個(27對)基因在系統(tǒng)進化樹上成對出現(xiàn)。結(jié)合之前的亞細(xì)胞定位預(yù)測結(jié)果進一步分析可知,親緣關(guān)系較近的基因通常在進化樹上位于相同的分支上,例如:4個定位于線粒體上的GmNUDXs(GmNUDX10、35、48、51),在進化樹聚為一支;4個具有信號肽結(jié)構(gòu)的基因(GmNUDX28、39、42、62)在進化樹上聚為一支。
圖2 GmNUDX基因家族系統(tǒng)進化關(guān)系Fig.2 Phylogenetic relationship of soybean NUDX family
根據(jù)NCBI公布的大豆轉(zhuǎn)錄組數(shù)據(jù),對上述挖掘到的GmNUDX基因家族的表達模式進行分析,結(jié)果如圖3所示。由圖3可以看出,大部分GmNUDX基因家族基因的表達沒有表現(xiàn)出組織差異性,但表現(xiàn)出了顯著的豐度差異:在全部69個GmNUDXs中,24個基因具有較高的表達豐度;26個基因具有中等表達豐度;10個基因具有較低表達豐度。9個GmNUDXs基因(GmNUDX14,39,40,41,59,61,63,64,65)沒有發(fā)現(xiàn)表達序列,表明其可能為假基因。
在本研究所獲得的69個GmNUDXs中,56個具有單NHD結(jié)構(gòu)單元,另外13個GmNUDXs還具有其他的結(jié)構(gòu)單元,其中3個(GmNUDX5,21,53)具有zr-NADH-PPase結(jié)構(gòu)域。對擬南芥AtNUDX2的研究表明,zr-NADH-PPase結(jié)構(gòu)域具有以ADP核糖和NADH為底物的焦磷酸酶活性[12,16],AtNUDX2過表達的擬南芥植株會表現(xiàn)出對氧化應(yīng)激的耐受性增強[22],由此推測GmNUDXs(GmNUDX5,21,53)可能在大豆中發(fā)揮相似功能。GmNUDX46含有1個PM結(jié)構(gòu)域,與AtNUDX3同源,盡管該基因的具體功能還未知,但對擬南芥的表達分析顯示,AtNUDX3可被干旱、鹽漬、冷熱脅迫等極端條件誘導(dǎo)表達,表明GmNUDX46基因可能參與多種生理功能[23-24]。GmNUDX39、45、52、62等4個基因各包含一個Dcp2膜結(jié)合基序。Dcp2能夠水解mRNA的帽子結(jié)構(gòu),這對于真核細(xì)胞mRNA的降解至關(guān)重要,而mRNA降解在細(xì)胞增殖與分化、脅迫響應(yīng),以及轉(zhuǎn)錄本質(zhì)量控制等方面都具有重要意義,這再次表明GmNUDXs在大豆各項生理活動中具有重要作用[25]。
圖3 GmNUDX基因家族在不同組織中的表達量熱量圖Fig.3 The heat map of GmNUDX family in different tissues.
與大豆中的許多其他基因相似,GmNUDXs表現(xiàn)出了易于成對出現(xiàn)的基因組分布模式,再次反映出了古老的基因組大規(guī)模復(fù)制事件[26-27]。這一復(fù)制事件使得每個基因的2個拷貝在經(jīng)歷重排后增加了基因的多樣性。如此多的成員數(shù)目及結(jié)構(gòu)域類型,使得GmNUDXs在大豆的生長發(fā)育及逆境脅迫響應(yīng)過程中具有重要作用。
通過對比GmNUDXs在染色體上的位置及其進化關(guān)系,本研究發(fā)現(xiàn):如果幾個GmNUDXs成簇出現(xiàn)在某染色體上,則它們的同源序列也會按照相應(yīng)的順序出現(xiàn)在另外的染色體上。例如:GmNUDX3和GmNUDX37位于4號染色體上的同一基因簇內(nèi),它們的同源序列GmNUDX27和GmNUDX68以相同的順序出現(xiàn)在9號染色體上,13號染色體上的GmNUDX47和GmNUDX40以及15號染色體上的GmNUDX64和GmNUDX9也表現(xiàn)出相同的模式。這一現(xiàn)象為包含GmNUDXs的大豆染色體區(qū)段重復(fù)提供了有力證據(jù)。同樣的染色體重復(fù)現(xiàn)象已經(jīng)被證實在大豆許多基因家族的進化過程中發(fā)揮著重要作用[28-29]。
在本研究中,有9個GmNUDX基因(GmNUDX14,39,40,41,59,61,63,64,65)在大豆的全部10個組織中均未發(fā)現(xiàn)表達序列。這一結(jié)果表明,這些基因可能為假基因或只在特定的環(huán)境條件或發(fā)育階段才表達。植物中存在許多假基因,包括非加工和加工假基因2種類型[30]。非加工假基因通常指在復(fù)制過程中發(fā)生功能缺失突變的基因序列,多位于其同源功能基因側(cè)翼。在本研究涉及的9個未發(fā)現(xiàn)表達序列的基因中,GmNUDX39,40,63,64,65均有1個與之同源且具有表達量的功能基因,分別為GmNUDX28,7,30,47和11,這一結(jié)果暗示這5個基因成為假基因的可能;GmNUDX7和GmNUDX11分別位于GmNUDX40和GmNUDX65的側(cè)翼,表明其可能為非加工假基因。除此之外,其余60個GmNUDXs基因在大豆的全部10個組織中均有表達,沒有表現(xiàn)出組織差異,只表現(xiàn)出了表達量的差異,表明其在大豆中可能具有多種功能。
從大豆基因組數(shù)據(jù)庫中挖掘到69個GmNUDXs,分布于大豆的20條染色體,其中60個在10個組織中均有表達,沒有表現(xiàn)出組織差異,只表現(xiàn)出了表達量的差異。大豆NUDX基因家族基因的多態(tài)性及表達量差異表明,其在大豆的多項生理活動中具有重要作用。