李慧峰 黃詠梅 李彥青 滑金鋒 吳翠榮 范繼征 陳天淵
摘? 要? 基于簡(jiǎn)化基因組測(cè)序技術(shù)對(duì)122份甘薯種質(zhì)資源進(jìn)行分析,開發(fā)SNP位點(diǎn)并將其應(yīng)用于種質(zhì)資源群體結(jié)構(gòu)和遺傳進(jìn)化分析。結(jié)果表明, 從122份甘薯種質(zhì)資源中共獲得563.18 Mb讀長(zhǎng),不同材料的讀長(zhǎng)數(shù)量在1 419 809~8 392 785范圍之間。測(cè)序質(zhì)量值Q30在90.61%~96.82%之間,平均Q30為92.78%。測(cè)序獲得的GC含量在36.46%~40.33%之間,平均GC含量為38.17%,對(duì)照GC含量為40.72%。根據(jù)測(cè)序結(jié)果共開發(fā)出高質(zhì)量的SLAF標(biāo)簽2 388 759個(gè),平均測(cè)序深度為17.45。其中,多態(tài)性的SLAF標(biāo)簽77 761個(gè),占SLAF標(biāo)簽總數(shù)的3.26%。根據(jù)所獲得多態(tài)性SLAF標(biāo)簽統(tǒng)計(jì)SNP位點(diǎn)信息,共計(jì)獲得129 063個(gè)群體SNP位點(diǎn)。遺傳進(jìn)化分析表明122份種質(zhì)資源可以分為3個(gè)大類,分類結(jié)果與它們的地理來(lái)源無(wú)直接關(guān)系,聚類結(jié)果可為甘薯育種親本組配和雜種優(yōu)勢(shì)利用提供科學(xué)依據(jù)。
關(guān)鍵詞? 甘薯;種質(zhì)資源;SLAF-seq;遺傳進(jìn)化分析
中圖分類號(hào)? S531? ? ?文獻(xiàn)標(biāo)識(shí)碼? A
Phylogenetic Analysis of Sweetpotato Germplasm Resources Based on SLAF-seq Technology
LI Huifeng, HUANG Yongmei, LI Yanqing, HUA Jinfeng, WU Cuirong, FAN Jizheng, CHEN Tianyuan*
Maize Research Institute, Guangxi Academy of Agricultural Sciences, Nanning, Guangxi 530007, China
Abstract? Based on SLAF-seq technology, 122 sweet potato germplasm resources were used to develop SNP sites, which were applied to the analysis of population structure and genetic evolution on all germplasm resources. Results showed that 563.18 Mb reads length was obtained by sequencing, the reads of the samples varied from 1 419 809 to 8 392 785. The sequencing quality value (Q30) changed from 90.61% to 96.82%, and the average Q30 was 92.78%. The GC content of the samples changed from 36.46%40.33%, the average value was 38.17%, and that of the control was 40.72%. A total of 2 388 759 SLAF tags were developed, with an average sequencing depth of 17.45. There were 77 761 polymorphic SLAF tags accounting for 3.26% of the total SLAF tags. Finally, 129 063 SNPs were found. The population structure and genetic evolution analysis showed that 122 germplasm resources could be divided into three groups, which was not directly related to the geographical source, and the results of clustering could provide scientific basis for parents combination and utilization of heterosis in sweetpotato breeding.
Keywords? sweetpotato; germplasm resources; SLAF-seq; phylogenetic analysis
DOI? 10.3969/j.issn.1000-2561.2019.12.011
甘薯[Ipomoea batatas (L.) Lam.]既是我國(guó)保障糧食安全的底線作物,也是重要的保健食品、工業(yè)原料和新型能源作物,其種植面積、單產(chǎn)和總產(chǎn)均居世界前列[1-2]。但由于甘薯遺傳背景復(fù)雜,基因雜合度高,且具有自交不親和性等特點(diǎn),給新品種選育工作帶來(lái)極大困難。同時(shí),甘薯的品質(zhì)、產(chǎn)量和抗性等相關(guān)性狀多表現(xiàn)為數(shù)量遺傳,采用常規(guī)育種手段難以較快實(shí)現(xiàn)符合市場(chǎng)需求的育種目標(biāo),而分子標(biāo)記輔助選擇技術(shù)為解決上述難點(diǎn)提供了新的路徑。目前甘薯中RAPD[3]、AFLP[4]、ISSR[5]、SSR[6-7]等標(biāo)記的開發(fā)和利用已取得較大進(jìn)展,但仍難滿足育種需求。特異性位點(diǎn)擴(kuò)增片段測(cè)序技術(shù)(specific length amplification fragment sequencing,SLAF-seq)是基于第二代高通量測(cè)序技術(shù)發(fā)展而來(lái),在開發(fā)大量特異分子標(biāo)記方面具有通量高、準(zhǔn)確性高、成本低、周期短的優(yōu)勢(shì)。該技術(shù)已應(yīng)用于遺傳圖譜構(gòu)建、基因組關(guān)聯(lián)分析、QTL定位和種質(zhì)資源鑒定等研究[8-9]。蘇文瑾等[10]首次將SLAF-seq技術(shù)應(yīng)用于甘薯SNP位點(diǎn)的開發(fā),共獲得795 794個(gè)SNP位點(diǎn),表明其效率遠(yuǎn)遠(yuǎn)高于SSR、AFLP、RAPD等分子標(biāo)記技術(shù)。石璇等[11]以8個(gè)甘薯品種或其近緣種為材料開發(fā)獲得了40 765個(gè)SNP位點(diǎn),利用這些位點(diǎn)構(gòu)建進(jìn)化樹,發(fā)現(xiàn)甘薯栽培種和野生種I. trifida的親緣關(guān)系比較近。為弄清122份甘薯種質(zhì)資源的親緣關(guān)系,本研究以這些種質(zhì)為實(shí)驗(yàn)材料,通過(guò)SLAF-seq技術(shù)開發(fā)大量特異性SNP位點(diǎn),并利用開發(fā)的位點(diǎn)分析材料之間的遺傳關(guān)系和群體結(jié)構(gòu),以期為甘薯新品種選育提供科學(xué)依據(jù)。
1? 材料與方法
1.1? 材料
根據(jù)前期工作基礎(chǔ)[12],從廣西農(nóng)業(yè)科學(xué)院明陽(yáng)基地甘薯種質(zhì)資源圃中選取表型差異較大的122份甘薯種質(zhì)資源作為研究材料,具體情況見表1。
1.2? 方法
1.2.1? DNA提取與質(zhì)量檢測(cè)? 2017年4月在甘薯種質(zhì)資源圃中采集每份資源的新展開頂葉,利用康維世紀(jì)新型植物基因組DNA提取試劑盒(NuClean Plant Genomic DNA Kit)提取DNA,分別采用瓊脂糖凝膠電泳和Nanodrop ND-2000超微量核酸蛋白測(cè)定儀檢測(cè)濃度、純度和完整性,確保提取的DNA符合建庫(kù)要求。
1.2.2? 酶切建庫(kù)? 本研究開展前,未見甘薯或其近緣物種作為參考基因組的報(bào)道,故參照蘇文瑾等[10]的方法以馬鈴薯基因組作為參考基因組進(jìn)行電子酶切預(yù)測(cè),選定RsaⅠ為限制性內(nèi)切酶,通過(guò)酶切片段3′端加A處理,連接雙接頭后進(jìn)行PCR擴(kuò)增,選取目的片段回收建庫(kù)。
1.2.3? 建庫(kù)及產(chǎn)出數(shù)據(jù)質(zhì)量評(píng)估? 采用Illumina HiSeqTM2500對(duì)質(zhì)檢合格的文庫(kù)進(jìn)行雙端測(cè)序,測(cè)序結(jié)束后通過(guò)去接頭、去低質(zhì)量閱讀框和去污染處理獲得干凈序列。同時(shí)設(shè)置水稻‘日本晴為對(duì)照,進(jìn)行同流程操作,從比對(duì)效率、酶切效率和讀長(zhǎng)插入片段分布情況來(lái)評(píng)估實(shí)驗(yàn)建庫(kù)的準(zhǔn)確性和有效性。最后通過(guò)計(jì)算GC含量和Q30評(píng)估數(shù)據(jù)質(zhì)量。
1.2.4? SLAF標(biāo)簽分析與SNP鑒定? 依據(jù)Sun等[9]關(guān)于SLAF標(biāo)簽和多態(tài)性SLAF標(biāo)簽定義,根據(jù)序列相似性統(tǒng)計(jì)各類標(biāo)簽的數(shù)量。同時(shí),選取每個(gè)SLAF標(biāo)簽中測(cè)序深度最高的序列為參考序列,利用BWA軟件[13]將測(cè)序讀長(zhǎng)比對(duì)到參考序列上,使用GATK[14]和SAM tools[15] 2種方法開發(fā)SNP,選取2種方法共同獲得的SNP標(biāo)記作為最終群體SNP標(biāo)記。
1.2.5? 群體的遺傳進(jìn)化分析? 根據(jù)獲得的最終SNP位點(diǎn),利用Admixture軟件[16]分析種質(zhì)資源的群體結(jié)構(gòu),并通過(guò)MEGA7軟件[17]構(gòu)建樣品的群體進(jìn)化樹。
2? 結(jié)果與分析
2.1? 基因組DNA的提取與檢測(cè)
DNA瓊脂糖凝膠電泳檢測(cè)結(jié)果如圖1所示,甘薯種質(zhì)資源DNA樣品主帶明顯,片段大小一致。
2.2? 建庫(kù)評(píng)估
根據(jù)馬鈴薯參考基因組電子酶切預(yù)測(cè)結(jié)果,選取RsaⅠ為限制性內(nèi)切酶,長(zhǎng)度在264~364 bp的酶切片段為SLAF標(biāo)簽,可預(yù)測(cè)到225 000個(gè)SLAF標(biāo)簽。
實(shí)驗(yàn)建庫(kù)評(píng)估主要根據(jù)對(duì)照水稻‘日本晴的比對(duì)效率、酶切效率和讀長(zhǎng)插入片段分布情況進(jìn)行判斷。從對(duì)照的測(cè)序數(shù)據(jù)分析結(jié)果來(lái)看,其雙端比對(duì)效率為95.88%,酶切效率為100%,讀長(zhǎng)插入片段分布在預(yù)期范圍之內(nèi)(圖2),表明本實(shí)驗(yàn)建庫(kù)比對(duì)效率正常,SLAF建庫(kù)正常以及測(cè)序質(zhì)量正常。
2.3? 測(cè)序數(shù)據(jù)統(tǒng)計(jì)與質(zhì)量評(píng)估
為保證分析質(zhì)量,本研究中均采用讀長(zhǎng)100 bp× 2作為后續(xù)的數(shù)據(jù)評(píng)估和分析數(shù)據(jù),同時(shí)用對(duì)照水稻‘日本晴的測(cè)序數(shù)據(jù)評(píng)估本實(shí)驗(yàn)庫(kù)的準(zhǔn)確性。通過(guò)Illumina HiSeqTM2500測(cè)序平臺(tái)測(cè)序,從122個(gè)甘薯種質(zhì)資源中共獲得563.18 Mb讀長(zhǎng)數(shù)據(jù),不同種質(zhì)材料的讀長(zhǎng)個(gè)數(shù)在1 419 809~
8 392 785范圍內(nèi)(圖3A)。不同材料的測(cè)序質(zhì)量值Q30在90.61%~96.82%之間,平均Q30為92.78%,對(duì)照的Q30為95.92%,表明測(cè)序堿基錯(cuò)誤率低(圖3B)。同時(shí),測(cè)序獲得的GC含量在36.46%~ 40.33%之間,平均GC含量為38.17%,對(duì)照GC含量為40.72%,則表明GC含量均較低符合測(cè)序要求(圖3B)。
2.4? SLAF標(biāo)簽和SNP標(biāo)記的開發(fā)與鑒定
根據(jù)122份甘薯種質(zhì)資源的測(cè)序結(jié)果,共開發(fā)出SLAF標(biāo)簽238 8759個(gè)。不同甘薯種質(zhì)材料獲得的SLAF標(biāo)簽數(shù)多少不一致,基本處于151 823~290 909之間(圖3C),各個(gè)材料的測(cè)序深度差異較大,其中不同種質(zhì)材料的測(cè)序總深度在1 071 660~6 833 246范圍之間,而每個(gè)材料的測(cè)序平均深度則在7.06%~24.93%之內(nèi),平均測(cè)序深度為17.45。通過(guò)對(duì)所有SLAF標(biāo)簽進(jìn)行分型,最終獲得多態(tài)性的SLAF標(biāo)簽77 761個(gè),占SLAF標(biāo)簽總數(shù)的3.26%。
此外,從多態(tài)性的SLAF標(biāo)簽中獲得SNP標(biāo)記22 4971個(gè),每個(gè)材料獲得的SNP標(biāo)記數(shù)目在61 887~163 937范圍內(nèi),這些SNP的平均完整度在27.50%~72.87%之間,SNP的雜合度在19.49 % ~33.42 %之間(圖3D)。依據(jù)完整度大于50 %和次要基因型頻率(MAF)大于5%的選擇標(biāo)準(zhǔn),對(duì)22 4971個(gè)群體SNP進(jìn)行過(guò)濾,最終得到129 063個(gè)群體SNP位點(diǎn)。
2.5? 甘薯種質(zhì)資源的群體遺傳結(jié)構(gòu)與遺傳進(jìn)化分析
利用篩選出的群體SNP位點(diǎn)對(duì)122份甘薯種質(zhì)資源進(jìn)行群體結(jié)構(gòu)分析,通常根據(jù)交叉驗(yàn)證錯(cuò)誤率來(lái)確定分群數(shù),擁有最低交叉驗(yàn)證錯(cuò)誤率的分群數(shù)為最優(yōu)分群數(shù),如圖4A和圖4B所示,當(dāng)K=3時(shí)交叉驗(yàn)證錯(cuò)誤率最低,進(jìn)而說(shuō)明所選擇的122份甘薯種質(zhì)資源群體可以分為3個(gè)類群。
從122份甘薯種質(zhì)資源的系統(tǒng)進(jìn)化樹(圖4C)來(lái)看,所有資源根據(jù)遺傳關(guān)系可以分為3大類。其中,第Ⅰ大類包括29份資源,又可分為2個(gè)亞類,第Ⅰ-1類包括3份來(lái)自福建的資源泉薯830、配26、榕薯201和1份來(lái)自廣西的資源桂菜薯1號(hào),第Ⅰ-2亞類則包括來(lái)自福建的新普六、福薯10號(hào),來(lái)自廣西的思布黃皮薯、來(lái)賓丹心薯、楊圩薯2、欽南那麗5、烏邪爪、本地菜、紫葉薯、東皇薯1號(hào)、良圻薯2、紅皮薯、黃心白薯、永樂薯2、桂薯11號(hào)、桂薯2號(hào)、南洋1號(hào)、黃心薯,來(lái)自四川的綿薯7號(hào),來(lái)自廣東的廣薯135、廣薯92-66、湛江薯、廣菜薯3號(hào)、普薯25、普薯24;第Ⅱ大類包括46份資源,第Ⅲ大類包括47份資源,這2個(gè)大類又可分為多個(gè)小類,但具體分類結(jié)果與甘薯種質(zhì)資源的地理來(lái)源無(wú)直接關(guān)系。
3? 討論
與傳統(tǒng)的分子標(biāo)記相比,SNP標(biāo)記是更加有效的遺傳標(biāo)記,因?yàn)樵诖蠖鄶?shù)基因組中它們是最豐富和穩(wěn)定的遺傳變異形式[18]。對(duì)于無(wú)參考基因組的物種而言,簡(jiǎn)化基因組測(cè)序技術(shù)因?yàn)槟苡行Э朔蚪M復(fù)雜、序列與標(biāo)記信息缺乏等難題,更適宜于SNP大規(guī)模的開發(fā)和分析。目前,已經(jīng)報(bào)道的簡(jiǎn)化基因組測(cè)序技術(shù)主要有,限制性酶切位點(diǎn)相關(guān)的DNA(RAD)測(cè)序技術(shù)[19],基于ⅡB型限制性內(nèi)切酶位點(diǎn)相關(guān)的DNA(Double Digest RAD-seq)測(cè)序技術(shù)[20],基因分型測(cè)序(GBS)[21],特異性長(zhǎng)度擴(kuò)增片段測(cè)序(SLAF-seq)技術(shù),這些技術(shù)有一個(gè)共同點(diǎn),即通過(guò)限制性內(nèi)切酶來(lái)降低基因組DNA的復(fù)雜程度。本研究運(yùn)用SLAF-seq技術(shù),從122份甘薯種質(zhì)資源中獲得563.18 Mb讀長(zhǎng)數(shù)據(jù),共開發(fā)出多態(tài)性的SLAF標(biāo)簽77 761個(gè),最終得到129 063個(gè)SNP位點(diǎn)用于遺傳進(jìn)化分析。其中,SNP的平均完整度在27.50 %~72.87 %之間,SNP的雜合度在19.49 %~33.42 %之間。這與石璇等[11]研究結(jié)果有一定的差異,這可能與本研究中平均測(cè)序深度較高,獲得的SNP位點(diǎn)數(shù)量多有一定的關(guān)系。
利用SNP技術(shù)獲得的系統(tǒng)進(jìn)化圖與育成品種的系譜作比較,發(fā)現(xiàn)部分育成品種之間有較好的吻合度。如桂粉3號(hào)和龍薯21優(yōu)先聚為一類,再與桂經(jīng)薯8號(hào)、廣薯205聚為一類,因?yàn)榍皟烧呔越鹕?7為親本,而桂粉3號(hào)與桂經(jīng)薯8號(hào)、廣薯205則均以廣薯87為母本;綿薯6號(hào)、商薯19、徐紫薯3號(hào)和徐薯18聚為一類,因?yàn)榫d薯6號(hào)的母本為徐薯18,徐紫薯3號(hào)的父本為徐薯18,而商薯19的父本中有一部分徐薯18的血緣;廣薯214和廣紫薯2號(hào)聚為一類,其中廣薯214的母本為廣紫薯2號(hào);龍薯28與廣薯95-145聚為一類,兩者均含有同一個(gè)父本血緣;廣薯79、桂薯9號(hào)和普薯32號(hào)聚為一類,均含有廣薯69的血緣;廣薯42、桂薯5號(hào)、桂紫薇薯1號(hào)和廣薯87等聚為一類,這些品種均含有廣薯88-70的血緣。因此,利用SNP標(biāo)記技術(shù)分析甘薯種質(zhì)資源的親緣關(guān)系有一定的可信度,其聚類結(jié)果與系譜的親本來(lái)源有較好的一致性。同時(shí)也表明SNP標(biāo)記技術(shù)在分析甘薯親緣關(guān)系的可行性。從聚類圖中可知,桂薯96-8、九州101、浙薯255、黃金薯優(yōu)先聚為一類,則可推測(cè)這些品種之間有一定的親緣關(guān)系,但與它們的地理來(lái)源無(wú)直接關(guān)系。由此表明,根據(jù)地理來(lái)源判斷甘薯種質(zhì)的親緣關(guān)系有一定的局限性,研究結(jié)果與聶立圓等[7]結(jié)論一致。利用SNP標(biāo)記技術(shù)獲得甘薯種質(zhì)資源的親緣關(guān)系,可為甘薯育種在親本組配、雜種優(yōu)勢(shì)利用等方面提供直觀的技術(shù)支持。
參考文獻(xiàn)
陸漱韻, 劉慶昌, 李惟基. 甘薯育種學(xué)[M]. 北京: 中國(guó)農(nóng)業(yè)出版社, 1998: 74.
馬代夫, 李? 強(qiáng), 曹清河, 等. 中國(guó)甘薯產(chǎn)業(yè)及產(chǎn)業(yè)技術(shù)的發(fā)展與展望[J]. 江蘇農(nóng)業(yè)學(xué)報(bào), 2012, 28(5): 969-973.
Gichuki S T, Berenyi M, Zhang D P, et al. Genetic diversity in sweetpotato [Ipomoea batatas (L.) Lam.] in relationship to geographic sources as assessed with RAPD markers[J]. Genetic Resources and Crop Evolution, 2003, 50(4): 429-437.
Liu D G, Zhao N, Zhai H, et al. AFLP fingerprinting and genetic diversity of main sweetpotato varieties in China[J]. Journal of Integrative Agriculture, 2012, 11(9): 1424-1433.
李? 強(qiáng), 劉慶昌, 翟? 紅, 等. 中國(guó)甘薯主要親本遺傳多樣性的ISSR分析[J]. 作物學(xué)報(bào), 2008, 34(6): 972-977.
Yang X S, Su W J, Wang L J, et al. Molecular diversity and genetic structure of 380 sweetpotato accessions as revealed by SSR markers[J]. Journal of Integrative Agriculture, 2015, 14(4): 633-641.
聶立圓, 李愛賢, 秦? 楨, 等. 基于SSR標(biāo)記的132份甘薯種質(zhì)指紋圖譜的構(gòu)建及遺傳多樣性分析[J]. 植物遺傳資源學(xué)報(bào), 2018, 19(5): 904-911.
Zhang Y X, Wang L H, Xin H G, et al. Construction of a high-density genetic map for sesame based on large scale marker development by specific length amplified fragment (SLAF) sequencing[J]. BMC Plant Biology, 2013, 13: 141.
Sun X W, Liu D Y, Zhang X F, et al. SLAF-seq: an efficient method of large-scale de novo snp discovery and genotyping using high-throughput sequencing[J]. PLoS One, 2013, 8(3): e58700.
蘇文瑾, 趙? 寧, 雷? 劍, 等. 基于SLAF-seq技術(shù)的甘薯SNP位點(diǎn)開發(fā)[J]. 中國(guó)農(nóng)業(yè)科學(xué), 2016, 49(1): 27-47.
石? 璇, 王茹媛, 唐? 君, 等. 利用簡(jiǎn)化基因組技術(shù)分析甘薯種間單核苷酸多態(tài)性[J]. 作物學(xué)報(bào), 2016, 42(5): 641-647.
李慧峰, 陳天淵, 黃詠梅, 等. 甘薯種質(zhì)資源形態(tài)標(biāo)記遺傳多樣性分析[J]. 西南農(nóng)業(yè)學(xué)報(bào), 2015, 28(6): 2401-2407.
Li H, Durbin R. Fast and accurate short read alignment with Burrows–Wheeler transform[J]. Bioinformatics, 2009, 25(14): 1754-1760.
McKenna A, Hanna M, Banks E, et al. The Genome Analysis Toolkit: a Map Reduce framework for analyzing next-generation DNA sequencing data[J]. Genome Research, 2010, 20(9): 1297-1303.
Li H, Handsaker B, Wysoker A, et al. The sequence alignment/map format and SAMtools[J]. Bioinformatics, 2009, 25(16): 2078-2079.
Alexander D H, Novembre J, Lange K. Fast model-based estimation of ancestry in unrelated individuals[J]. Genome Research, 2009, 19(9): 1655-1664.
Kumar S, Stecher G, Tamura K. MEGA7: Molecular Evolutionary Genetics Analysis Version 7.0 for Bigger Datasets[J]. Molecular Biology and Evolution, 2016, 33(7): 1870-1874.
Liu J, Huang S, Sun M, et al. An improved allele-specific PCR primer design method for SNP marker analysis and its application[J]. Plant Methods, 2012, 8(1): 34.
Miller M R, Dunham J P, Amores A, et al. Rapid and cost effective polymorphism identification and genotyping using restriction site associated DNA (RAD) markers[J]. Genome Research, 2007, 17(2): 240-248.
Peterson B K, Weber J N, Kay E H, et al. Double digest RAD seq: an inexpensive method for de novo SNP discovery and genotyping in model and non-model species[J]. PLoS One, 2012, 7(5): e37135.
Poland J A, Brown P J, Sorrells M E, et al. Development of high-density genetic maps for barley and wheat using a novel two-enzyme genotyping-by-sequencing approach[J]. PLoS One, 2012, 7(2): e32253.