韓彥卿,鄭潔,武彩娟,王慧娜,韓淵懷*
(1.山西農(nóng)業(yè)大學 農(nóng)學院,山西 太谷 030801;2.山西農(nóng)業(yè)大學 農(nóng)業(yè)生物工程研究所,山西 太谷 030801)
谷子(Setariaitalica(L.)Beauv)是我國非常重要的特色雜糧,具有營養(yǎng)豐富、抗旱耐瘠薄等特點,是“節(jié)水減肥”戰(zhàn)略的理想作物。谷子因基因組較小(490 M)、生育期短、與其它主糧作物親緣關系密切等特點,已逐漸成為禾本科基因組學研究的理想模式植物[1,2]。名優(yōu)谷子品種晉谷21號是由晉汾52經(jīng)鈷60咖瑪射線輻射誘變而來,經(jīng)連續(xù)單株選擇選育而成[3]。隨著谷子產(chǎn)業(yè)的在我國的不斷發(fā)展和日益壯大,人們更注重于谷子高產(chǎn)和品質(zhì)的提升。然而,近年來在谷子上發(fā)生的病害越來越多,發(fā)病程度日趨嚴重。谷子白發(fā)病、谷子銹病、谷瘟病和紅穗病等每年均有不同程度發(fā)生,大發(fā)生年份可造成減產(chǎn)60%以上。谷子病害的嚴重發(fā)生已經(jīng)成為制約谷子產(chǎn)量和品質(zhì)提升的重要限制因素。誘變的晉谷21與親本晉汾52的相比,遺傳背景高度相似,但是最大的缺點就是極易感病[4]。無數(shù)育種實踐證明,明晰病原物與寄主之間的互作分子機理,挖掘抗病候選基因是實現(xiàn)抗病分子育種最有效的途徑[5]。
隨著測序技術的快速發(fā)展,全基因組重測序已成為物種進化分析、SNP鑒定以及突變基因鑒定的重要手段,并且應用于多種農(nóng)作物和雜糧上[6~8]。施陽[9]利用高抗和高感黃瓜白粉病的2個品種通過全基因組測序分析,發(fā)現(xiàn)在基因組中主要存在單核苷酸多態(tài)性位點(SNP)和插入缺失位點(InDel)的差異,進一步分析發(fā)現(xiàn)5個NBS-LRR類的抗病基因, 其中2個基因中的非同義突變是導致黃瓜高抗白粉病的重要原因。Zhu等[10]采用基因組重測序技術對豫谷1號和張谷中的NBS基因分析,第8條染色體包含的NBS基因數(shù)量最多最大的基因簇也位于第8條染色體上,發(fā)現(xiàn)在豫谷1號和張谷中CC-NBS-LRR類型基因較多,TIR-NBS類型基因在2個品種中的數(shù)量最少。以上研究對我們借助全基因組測序技術研究谷子品種間抗感差異提供很好的借鑒。
本研究對晉谷21和晉汾52兩個品種進行基因組重測序數(shù)據(jù)的生物信息學分析,主要針對全基因組變異位點及NBS基因家族內(nèi)的基因進行鑒定、比對以及系統(tǒng)進化關系分析,旨在從基因組水平探尋晉汾52與晉谷21抗病性差異的原因,該研究結果可為確定NBS類抗病基因差異提供理論依據(jù),并為進一步深入發(fā)掘晉谷21與其親本的NBS基因抗性位點差異及培育抗病品種提供數(shù)據(jù)參考和理論依據(jù)。
晉汾52號及其輻射誘變后的突變體品種晉谷21和豫谷1號(全基因組已測序)種子均由山西農(nóng)業(yè)大學生物工程研究所提供,不同谷子品種于5月上旬種植于山西農(nóng)業(yè)大學試驗基地,常規(guī)田間管理,及時間苗除草,在谷子拔節(jié)期分別取長勢一致的谷子新鮮葉片,迅速液氮冷凍后放入-70 ℃冰箱保存,用于基因組DNA的提取。
采用基因組DNA提取試劑盒(柱式植物DNAout,天恩澤基因科技有限公司,北京)分別提取晉汾52與晉谷21基因組DNA。隨后用1%瓊脂糖凝膠電泳檢測所提取DNA的質(zhì)量純度和完整性。隨后將DNA送至百邁客公司進行基因組重測序。
通過全基因測序獲得的晉汾52和晉谷21 兩個品種的重測序數(shù)據(jù),利用Varscan軟件對SNP和InDel突變及變異進行識別分析。接著,利用Control-freec軟件檢測晉汾52和晉谷21兩個品種之間的CNV位點進行分析,確定CNV數(shù)目;隨后利用Breakdancer軟件檢測對2個品種的SV,根據(jù)SV在參考基因組上的位置信息,比對參考基因組的基因。
通過http://phytozome.jgi.doe.gov/pz/#!info?alias=Org_Sitalica檢索下載得到谷子NBS類型基因的序列及相關信息。隨后,利用BWA軟件將NBS類型基因序列與參考基因組基因序列比對。通過PFAM鑒定NBS基因所編碼的保守結構域。最后,結合利用谷子基因組數(shù)據(jù)庫和參考基因組,利用數(shù)字化繪圖軟件AutoCAD 2010,將所有查找到的NBS類型抗病基因定位到染色體上的相應位置上。
采用ClustalX軟件對我們分別鑒定的2個品種中的NBS類型基因序列進行多序列比對,利用MEGA5.1軟件分別構建2個品種NBS類型基因的系統(tǒng)進化樹,并對其進行人工修飾,隨后進行系統(tǒng)發(fā)育分析。
晉汾52與晉谷21兩個樣品基因組重測序的測序數(shù)據(jù)見表1,所測序2個樣品中的GC含量相當,分別為45.35%和45.70%。2個樣品的測序質(zhì)量(Q20堿基數(shù)量)高,均在90%以上,均達到了測序要求。隨后將2個品種的測序數(shù)據(jù),采用BWA軟件與參考基因組進行比對分析發(fā)現(xiàn),2個品種的映射率分別92.29%和94.55%,映射率均達到90%以上, 覆蓋率分別為87.85%和90.21%,測序數(shù)據(jù)都能比到參考基因組(表2)可進一步進行后續(xù)分析。
表1 兩個品種測序數(shù)據(jù)比較Table 1 Comparison of two varieties of sequence data
利用varscan軟件對晉汾52和晉谷21基因組SNP分析發(fā)現(xiàn),其主要變異主要發(fā)生在純合突變(AA-aa),在谷子9條染色體上共發(fā)現(xiàn)530 181個純合突變,占所有突變的76.81%,其次是雜合缺失(AB-A或AB-B)、雜合突變(AA-AB),其它類型的突變占比最少。在所有染色體上純合突變>雜合缺失>雜合突變>其它類型突變(圖1);通過插入缺失位點分析(InDel)分析, 共發(fā)現(xiàn)56 707個插入缺失位點,分布在各染色體上,其中8號染色體上的InDel位點最多,其次是3號和9號染色體,4號和1號染色體的InDel位點最少;使用control-freec軟件分析拷貝數(shù)變異(CNV),共發(fā)現(xiàn)284個,其中擴增(gain)208個,缺失(loss)76個。這些變異在谷子的9條染色體上上均有發(fā)生,主要發(fā)生在1號和6號染色體上,2號和3號染色體上的發(fā)生變異數(shù)目最少;使用breakdancer軟件在2個品種中共發(fā)現(xiàn)20 358個結構變異(SV),其中插入(INS)有9 000個,刪除有(DEL)5 274個,移位有(ITX)3 260個,倒位有(INV)2 860個,易位(CTX)所占數(shù)目最少。由圖1可知,發(fā)生在染色體上的結構變異數(shù)目以第8條染色體最多,9號染色體次之,4號染色體最少。
表2 兩個品種測序數(shù)據(jù)與參考基因組比對Table 2 Comparison of two varieties of sequencing data and reference genome
圖1 各染色體上SNP、Indel、CNV和SV的數(shù)目Fig.1 The number of SNP、InDel、CNV and SV on each chromosome
將晉汾52和晉谷21與參考基因組比對后發(fā)現(xiàn)(表3),在晉汾52和晉谷21中分別有282和285個NBS類型基因(比晉汾52多3個基因:Si027 455m,Si028 382m,Si027 260m)。 各個品種除了6號和8號染色體上的NBS類型基因數(shù)目不一致外,在其他染色體上基因數(shù)目均沒有差異。通過比較這些基因在染色體上的定位發(fā)現(xiàn),多數(shù)基因都是在染色體相同的位置上,個別基因的位置是首尾相連的,如圖2所示。綜上所述,NBS類型基因主要分布在第8條染色體上,6號染色體上該類型基因最少。
表3NBS類型基因在谷子9條染色體上的分布
Table3Distribution of NBS genes on nine chromosomes in foxmail millet
染色體Chromosome參考基因ReferenceJF52JG21共有基因Common genes119191919233333333326262626425252525536363636618171717731313131859555855940404040Total287282285282
圖2 晉谷21的NBS類型基因在染色體上的分布Fig.2 Chromosomal distribution of the NBS gene for JG21注:藍色橫線為晉谷21比晉汾52多出的3個基因。Note:Gene names with blue line represent three genes that presents in JG21 but not in JF52.
把測序得到的reads利用blast與NBS類型基因的保守結構域進行比對。發(fā)現(xiàn)晉汾52的reads比對到了所有NBS類型基因的保守結構域(GGKTL、GLPLA、Kinase_2 a和MHDV),而晉谷21僅比對到一個保守結構域:GGKTL(表4)。推測其原因,可能是誘變后的晉谷21的抗病基因保守結構域的缺失,導致了晉汾52的抗病性比晉谷21強。
表4 2個品種NBS類型基因結構域Table 4 Domains of NBS genes in JG21 and JF52
通過對晉谷21的285個和晉汾52的282個NBS類型抗病基因系統(tǒng)發(fā)育分析(圖3)發(fā)現(xiàn),進化樹明顯地分為6大支,但是每一個分支中的所包含的NBS類型基因的數(shù)目是不一樣的,晉谷21的6個分支相對親本晉汾52來說顯得比較雜亂(圖3),由系統(tǒng)發(fā)育樹可知,經(jīng)輻射誘變后的晉谷21的NBS類型基因上許多位點發(fā)生突變,然而,這些突變位點的差異可能導致了2個品種抗病性差異。因此推測,抗病基因在演化過程中不是以單一的進化方式進行的,演化方式比較復雜。
圖3 JF52和JG21的NBS類型基因的系統(tǒng)樹Fig.3 NBS type gene phylogenetic tree of JF52 and JG21
通過對晉汾52和晉谷21兩個品種的中NBS家族基因進行分析,發(fā)現(xiàn)了2 229個SNP位點,包含LOH、Heter和Homo 3個主要突變類型,經(jīng)統(tǒng)計,Homo類型突變數(shù)目最多,共1 431個,其次是 LOH類型突變, Heter類型突變最少(圖4)。對3種類型的突變分析發(fā)現(xiàn),在第8條染色體上LOH、Heter和Homo均是最多的,換而言之,第8條染色體上SNP變異微點最多;對2個品種NBS家族的插入缺失位點InDel位點分析,在2個品種中確定了70個基因共181個InDel位點,除了在第1條染色體沒有發(fā)現(xiàn)外,在其他染色體上均有分布,我們發(fā)現(xiàn),無論是NBS基因數(shù)目還是InDel位點,在第8號染色體也是最多的;對CNV比較,發(fā)現(xiàn)22個基因存在CNV,包括擴增(gain)和缺失(loss)。其中第 8號染色體上的基因數(shù)量和CNV也是最多的;通過對SV的分析,SV數(shù)目同樣在第8號染色體占比最多。
全基因組重測序技術是一種基于某一物種的全基因組信息已經(jīng)公布,利用二代測序技術對某一植物病原菌的個體樣本或群體樣本進行測序,隨后與已經(jīng)公布的基因組序列比對分析,發(fā)掘樣品中的單核苷酸多態(tài)性(SNP),插入缺失(InDel),拷貝數(shù)變異(CNV),結構變異(SV)等[11],對探究物種進化和重要功能基因挖掘具有非常重要的意義。
基于基因組重測序技術,首先對晉谷21及其親本晉汾52的測序數(shù)據(jù)在全基因組水平進行了SNP,InDel,CNV 及SV分析,發(fā)現(xiàn)這4個類型的變異在谷子的第8條染色體上最多。隨后,對2個品種中的NBS類型基因的SNP、InDel、CNV 及SV也進行分析,發(fā)現(xiàn)4個類型的變異位點也是以第8條染色體上最多。有研究發(fā)現(xiàn),水稻的第11條染色體上的NBS類型基因數(shù)目比其他染色體上的都要多,該染色體與谷子的第8條染色體存在明顯的共線性,2條染色體上的NBS類型基因數(shù)目和包含的基因簇的數(shù)量均是最多的[12],同時也驗證了分析結果的可靠性。綜合分析,由于晉汾52和晉谷21在遺傳背景上高度相似,推測2個谷子品種抗病性的差異很可能與8號染色體上NBS類型基因位點差異關,其中還發(fā)現(xiàn),單核苷酸變異數(shù)目較多,推測單核苷酸變異(SNP)也可能是造成2個谷子品種抗/感差異的原因之一。
對晉汾52和晉谷21的NBS類型基因的同源性分析,2個品種的NBS基因均6個分支中,但是每個分支中所包含基因的數(shù)目明顯不同(圖3)。對該類型的基因進行保守結構域分析發(fā)現(xiàn),輻射誘變后的晉谷21 與其親本相比,缺少了GLPLA、Kinase_2 a和MHDV 3個保守的結構域,可能也是引起聚類分支不一致的原因之一(表4)。并且分析發(fā)現(xiàn)NBS類型基因主要分布在第8條染色體上,而且這些抗病基因多數(shù)以基因簇的形式存在,這與Zhu等[10]研究分析結果一致。
圖4 NBS家族基因各染色體上SNP、Indel、CNV和SV的數(shù)目Fig.4 The number of SNP、Indel、CNV and SV on each chromosome in NBS gene family
本研究通過利用全基因組重測序數(shù)據(jù),對2個谷子品種在整個基因組水平和NBS類型基因存在的差異和變異位點分析。分析發(fā)現(xiàn)SNP的突變類型以純合突變?yōu)橹?,InDel和SV突變數(shù)目在第8條染色是最多的; NBS類型基因分析,差異也主要存在于第8條染色體上。推測2個品種NBS類型基因結構的差異可能是造成抗感差異的原因,其研究結果可為我們進一步分析基因關鍵差異位點,克隆和驗證抗病基因的功能提供理論依據(jù)。