孫 玥, 楊秀榮, 郭彥麗, 李軍玲, 李月嬌, 孫淑琴, 路 信, 劉燕清, 佟 卉, 孫林靜, 劉靜妍, 張融雪, 王曉靜, 蘇京平, 王勝軍, 趙習(xí)樸, 閆雙勇
(1.天津市農(nóng)業(yè)科學(xué)院農(nóng)作物研究所/天津市農(nóng)作物遺傳育種重點(diǎn)實(shí)驗(yàn)室,天津 300384;2.天津市農(nóng)業(yè)科學(xué)院植物保護(hù)研究所,天津 300384)
QTL-seq是一種選取分離群體中極端表型單株,按表型值的高、低構(gòu)建DNA混合池,然后分別對(duì)不同合混池進(jìn)行高通量測(cè)序,通過比較池間SNP的頻率差異進(jìn)行數(shù)量性狀位點(diǎn)(QTL)定位的方法。該方法利用20~50個(gè)極端表型單株混合測(cè)序,可以將QTL定位到2 Mbp以上區(qū)間。QTL-seq已經(jīng)廣泛應(yīng)用于主要的糧食作物、經(jīng)濟(jì)作物及蔬菜等植物重要性狀的QTL分析中。目前,已經(jīng)開發(fā)出專門用于QTL-seq分析的工具軟件。QTL-seq 分析后,一般需要利用傳統(tǒng)作圖方法進(jìn)行QTL的驗(yàn)證與分析,或者直接利用QTL區(qū)間的分子標(biāo)記進(jìn)行分子標(biāo)記輔助育種,以及進(jìn)一步縮小區(qū)間進(jìn)行QTL精細(xì)定位等。所以特定區(qū)間的分子標(biāo)記開發(fā)是QTL-seq后續(xù)研究中的重要環(huán)節(jié)。高通量測(cè)序后能提供QTL區(qū)間內(nèi)非常豐富的變異信息,但目前還未見把特定區(qū)間的變異信息轉(zhuǎn)化為分子標(biāo)記的相關(guān)報(bào)道。
對(duì)高通量測(cè)序數(shù)據(jù)進(jìn)行序列變異分析后會(huì)產(chǎn)生標(biāo)準(zhǔn)的序列變異格式的文件(variant call format,簡稱VCF),VCF文件記錄了序列變異信息。根據(jù)該文件提供的序列變異信息可以方便地進(jìn)行特定區(qū)間的分子標(biāo)記開發(fā)。目前,SNP和InDel是2種最常用的分子標(biāo)記。但SNP的檢測(cè)需要特殊的設(shè)備,檢測(cè)成本相對(duì)比較高,而InDel標(biāo)記是一種以PCR片段長度多態(tài)為基礎(chǔ)的分子標(biāo)記,操作簡單,結(jié)果可靠,大多數(shù)實(shí)驗(yàn)室都能進(jìn)行檢測(cè)。已經(jīng)廣泛應(yīng)用到植物基因定位、分子標(biāo)記輔助育種等研究中。因此,本研究側(cè)重于InDel標(biāo)記的開發(fā),編寫了專門用于InDel標(biāo)記開發(fā)的腳本程序,利用該程序可以根據(jù)VCF文件提供的變異信息,簡單迅速地開發(fā)出水稻基因組任意區(qū)間的InDel標(biāo)記。本研究在筆者所在課題組前期QTL-seq研究的基礎(chǔ)上,開發(fā)了7個(gè)不同作圖群體及QTL區(qū)間的708對(duì)Indel標(biāo)記,覆蓋基因組區(qū)間12.5 Mbp,平均每 17.6 kb 有1個(gè)長度差異8 bp以上的InDel標(biāo)記。選擇其中95個(gè)標(biāo)記進(jìn)行PCR和電泳驗(yàn)證,旨在提供一種有效的特定區(qū)間分子標(biāo)記開發(fā)方法,在水稻重要農(nóng)藝性狀QTL分子標(biāo)記輔助選擇及圖位克隆中發(fā)揮重要應(yīng)用價(jià)值。
2019年獲得7個(gè)用于株高及抽穗期QTL分析,來自不同組合的QTL定位群體:1542、1610、2342、2459、2791、2904、2441,并在2019年于天津市農(nóng)業(yè)科學(xué)院農(nóng)作物遺傳育種實(shí)驗(yàn)室進(jìn)行后續(xù)試驗(yàn)。
每個(gè)群體各取5個(gè)極高和極低表型值的單株葉片,按Xin等報(bào)道的簡單DNA提取方法進(jìn)行DNA提取。
PCR循環(huán)程序:94 ℃變性5 min,55 ℃退火 30 s,72 ℃延伸3 s,循環(huán)30次。PCR引物見表1。用8%聚丙烯酰胺凝膠進(jìn)行垂直電泳,銀染顯色。
表1 本研究PCR引物
表1(續(xù))
腳本程序在linux(ubantu 18.04系統(tǒng))運(yùn)行。系統(tǒng)中需要配置的軟件有vcftools,用于提取VCF文件中特定染色體區(qū)間的變異信息;blastdbcmd用于根據(jù)染色體及位置信息提取部分序列;blastn-outfmt 6用于產(chǎn)生表格格式的blastn結(jié)果,用系統(tǒng)工具awk確定部分序列的拷貝數(shù);用primer3的命令行版本進(jìn)行引物設(shè)計(jì)。數(shù)據(jù)處理過程中還需要用到sed、grep等系統(tǒng)命令。利用這些命令建立shell腳本文件,分子標(biāo)記開發(fā)時(shí),針對(duì)不同情況在shell腳本文件修改相應(yīng)的參數(shù),進(jìn)行不同材料和區(qū)間的分子標(biāo)記開發(fā)。分子標(biāo)記開發(fā)時(shí)只需要執(zhí)行1次腳本程序就能獲得特定區(qū)間的InDel標(biāo)記。
本研究的InDel標(biāo)記開發(fā)流程如圖1所示。首先利用工具vcftools從VCF文件中,根據(jù)染色體和變異位置信息提取出需要進(jìn)行標(biāo)記開發(fā)的InDel位點(diǎn);然后,根據(jù)InDel位點(diǎn)的位置信息從水稻品種日本晴參考基因組irgsp1.0中用命令blastdbcmd提取變異位點(diǎn)上、下游100 bp的部分序列(blast 2.6.0);獲得的序列進(jìn)一步用blastn和參考基因組進(jìn)行序列比對(duì),根據(jù)序列比對(duì)結(jié)果,挑選單拷貝序列,用primer3進(jìn)行引物設(shè)計(jì),獲得InDel標(biāo)記。
上述從變異位點(diǎn)的選擇到引物設(shè)計(jì)的過程,可以利用一個(gè)腳本程序一步完成。進(jìn)行不同區(qū)間的分子標(biāo)記開發(fā)時(shí),只需要修改腳本程序中幾個(gè)關(guān)鍵的參數(shù)就可以完成。需要修改的關(guān)鍵參數(shù)為VCF文件、染色體、開發(fā)標(biāo)記染色體起點(diǎn)區(qū)間、染色體終止區(qū)間、InDel大小等。程序運(yùn)行后產(chǎn)生的結(jié)果文件如表2所示。其中包含標(biāo)記的位置、引物序列、PCR片段長度等關(guān)鍵信息。
表2 通過腳本程序獲得的InDel標(biāo)記信息簡表
總共對(duì)來自7個(gè)不同群體的7個(gè)不同基因組區(qū)間進(jìn)行InDel標(biāo)記開發(fā),具體標(biāo)記開發(fā)及驗(yàn)證結(jié)果見表3??偣搏@得片段長度差異在8 bp以上的InDel標(biāo)記引物708對(duì),覆蓋區(qū)間總大小為 12.52 Mbp,平均每17.6 kb有1個(gè)符合篩選條件的InDel標(biāo)記。InDel標(biāo)記的分布和材料組合及特定的區(qū)間有關(guān)。根據(jù)后續(xù)研究的需要和InDel標(biāo)記的位置選擇95個(gè)標(biāo)記,進(jìn)行試驗(yàn)驗(yàn)證,總共獲得60個(gè)多態(tài)標(biāo)記。不同的群體多態(tài)標(biāo)記頻率從45%到90%不等,平均多態(tài)頻率為63%。
表3 分子標(biāo)記開發(fā)驗(yàn)證結(jié)果
根據(jù)本研究開發(fā)的腳本程序獲得的PCR引物大多能夠進(jìn)行較好的PCR擴(kuò)增(圖2),大多數(shù)標(biāo)記的擴(kuò)增條帶,在基因型純合的材料中表現(xiàn)為單一條帶。從電泳圖(圖2)中能夠比較清楚地確定材料的基因型,這對(duì)后續(xù)的圖位克隆、分子標(biāo)記輔助選擇等研究非常有利。進(jìn)行分子標(biāo)記開發(fā)的腳本程序中有進(jìn)行單拷貝序列篩選的步驟,所以大多數(shù)的擴(kuò)增為單拷貝擴(kuò)增。
本研究建立了一種基于高通量測(cè)序數(shù)據(jù)的簡單快速的InDel標(biāo)記開發(fā)方法。利用該方法可以快速方便地在高通量測(cè)序數(shù)據(jù)的基礎(chǔ)上開發(fā)出水稻基因組任意區(qū)間的InDel標(biāo)記。開發(fā)出的InDel標(biāo)記可以方便地應(yīng)用到分子標(biāo)記輔助選擇、圖位克隆等后續(xù)研究中。隨著高通量測(cè)序方法在研究中的應(yīng)用日益廣泛,對(duì)特定區(qū)間進(jìn)行標(biāo)記開發(fā)的需求也逐漸增加,本研究建立的方法為這方面問題的解決提供了一種較好的方案。
InDel標(biāo)記雖然有操作簡單、鑒定成本低等特點(diǎn),但在精細(xì)定位過程中可能會(huì)遇到特定區(qū)間標(biāo)記數(shù)量不足的問題,這時(shí)可能需要開發(fā)基于SNP/InDel的分子標(biāo)記,例如KASP(kompetitive allele-specific PCR)標(biāo)記。在本研究的基礎(chǔ)上通過對(duì)腳本程序中變異選擇篩選條件及PCR引物設(shè)計(jì)參數(shù)的改變,實(shí)現(xiàn)KASP的標(biāo)記開發(fā)用于SNP檢測(cè)。本研究分子標(biāo)記開發(fā)過程中引物設(shè)計(jì)的核心程序是primer3,該程序有非常多的引物設(shè)計(jì)參數(shù)可以調(diào)整,所以可以非常方便地在腳本程序中進(jìn)行參數(shù)設(shè)置。
根據(jù)NCBI網(wǎng)站提供的數(shù)據(jù)(https://www.ncbi.nlm.nih.gov/genome/annotation_euk/all/),目前有112個(gè)植物全基因組序列測(cè)定已經(jīng)完成,可以在相應(yīng)的網(wǎng)站獲得其全基因組序列。本研究建立的方法可以非常容易地由水稻基因組擴(kuò)展到其他已經(jīng)測(cè)序植物的基因組,如小麥、玉米等。其中需要調(diào)整的主要參數(shù)是參考基因組及相應(yīng)的信息。