劉 毅,余新橋,張安寧,王飛名,劉國(guó)蘭
(上海市農(nóng)業(yè)生物基因中心,上海 201106)
高通量基因組測(cè)序在農(nóng)作物基因定位與發(fā)掘中的應(yīng)用
劉 毅,余新橋,張安寧,王飛名,劉國(guó)蘭*
(上海市農(nóng)業(yè)生物基因中心,上海 201106)
隨著新一代測(cè)序技術(shù)的發(fā)展和測(cè)序成本的不斷降低,高通量測(cè)序在植物研究領(lǐng)域中得到廣泛應(yīng)用。通過(guò)簡(jiǎn)要闡述近年來(lái)高通量基因組測(cè)序在農(nóng)作物研究中的應(yīng)用進(jìn)展,重點(diǎn)介紹了基于基因組重測(cè)序的作物基因定位與發(fā)掘新方法。這些將為農(nóng)作物新品種選育和改良帶來(lái)新思路,極大地縮短育種進(jìn)程。
高通量測(cè)序;基因組;農(nóng)作物;基因定位
高通量測(cè)序(High-throughput sequencing)的特點(diǎn)是數(shù)據(jù)量大、成本低,一次可以對(duì)上百萬(wàn)條DNA分子序列進(jìn)行測(cè)定,也被稱(chēng)為第二代測(cè)序技術(shù)(Next generation sequencing),它是核酸研究的一次革命技術(shù)創(chuàng)新,為功能基因組學(xué)研究帶來(lái)了新的科研方法和解決方案。
1977年,幾乎是在同一時(shí)期Maxam等[1]和Sanger等[2]兩組科研人員分別發(fā)表了通過(guò)化學(xué)降解測(cè)定DNA序列的方法和利用末端終止反應(yīng)的DNA測(cè)序方法(Sanger測(cè)序法)。以Sanger測(cè)序法為代表的第一代測(cè)序技術(shù)極大促進(jìn)了生物科學(xué)的研究,然而也存在成本高、通量低、消耗時(shí)間長(zhǎng)等缺點(diǎn),因此以大數(shù)據(jù)、低成本為特征的高通量測(cè)序技術(shù)發(fā)展迅速,其中包括Roche公司的454測(cè)序儀,Illumina公司的Solexa基因組分析儀和ABI公司的SOLiD測(cè)序儀[3-6]等測(cè)序平臺(tái),其中Illumina測(cè)序技術(shù)具有高準(zhǔn)確性、高通量、高靈敏度和低運(yùn)行成本等優(yōu)勢(shì),在基因組測(cè)序研究中應(yīng)用最為廣泛。目前第三代測(cè)序技術(shù)已經(jīng)開(kāi)發(fā)應(yīng)用,并逐步被認(rèn)識(shí)和利用,稱(chēng)為單分子測(cè)序[7]。
在植物研究方面,由于高通量測(cè)序技術(shù)的出現(xiàn),全基因組測(cè)序所需的時(shí)間與成本均大幅下降,使對(duì)一個(gè)物種基因組進(jìn)行細(xì)致全貌的分析成為可能,從而帶動(dòng)了植物育種研究應(yīng)用開(kāi)始進(jìn)入分子水平,已成為挖掘與農(nóng)作物抗性、產(chǎn)量、品質(zhì)等優(yōu)異性狀相關(guān)候選基因的重要手段。
De novo測(cè)序可獲得任何一個(gè)物種的基因組序列圖譜,進(jìn)而構(gòu)建該物種的基因組數(shù)據(jù)庫(kù),推動(dòng)下游一系列研究工作的展開(kāi)。2000年,模式植物擬南芥(Arabidopsis thaliana)利用傳統(tǒng)的Sanger法完成全基因組測(cè)序[8],隨后水稻(Oryza sativa)全基因組序列于2002年發(fā)表[9],人類(lèi)基因組計(jì)劃與多種重要植物基因組計(jì)劃也相繼順利完成[10-16]。隨著測(cè)序技術(shù)的發(fā)展,研究人員開(kāi)始選擇第二代測(cè)序技術(shù)進(jìn)行全基因組De novo測(cè)序,熊貓(Ailuropoda melanoleura)基因組測(cè)序工作是大型物種中第一個(gè)使用新一代測(cè)序技術(shù)完成的。黃瓜(Cucumis sativus)是第一個(gè)完成全基因組測(cè)序的蔬菜作物,近年來(lái)利用高通量測(cè)序技術(shù),已經(jīng)有包括馬鈴薯(Solanum tuberosum)、小麥(Triticum aestivum)、油菜(Brassica napus)、棉花(Gossypium raimondii)等主要農(nóng)作物基因組測(cè)序完成[17-20](http://www.ncbi.nlm.nih.gov/)。和傳統(tǒng)技術(shù)比較,高通量測(cè)序所需的成本和時(shí)間都大大的降低,大規(guī)模物種全基因組De novo測(cè)序?qū)?huì)越來(lái)越多,基因組學(xué)研究也將進(jìn)入一個(gè)新的時(shí)期。
基因組重測(cè)序是指對(duì)已有參考基因組序列的物種進(jìn)行個(gè)體或群體的全基因組測(cè)序,可以獲得基因組上單核苷酸多態(tài)性位點(diǎn)(SNP,single nucleotide polymorphism)、插入缺失(InDel,insertion-deletion)和結(jié)構(gòu)變異(SV,structural variation)等遺傳特征,為遺傳學(xué)研究和分子育種提供多態(tài)性標(biāo)記信息,為該物種進(jìn)化、馴化過(guò)程以及功能基因組學(xué)的研究提供海量數(shù)據(jù)。
Lai等[21]對(duì)包括Zheng58,5003,478,178,Chang7—2和Mo17在內(nèi)的6個(gè)國(guó)內(nèi)重要的玉米雜交組合骨干親本進(jìn)行了全基因組重測(cè)序,結(jié)果得到了100多萬(wàn)個(gè)SNPs和3萬(wàn)多個(gè)InDels,建立了高密度的分子標(biāo)記遺傳圖譜,并在101個(gè)低序列多態(tài)性區(qū)段中發(fā)現(xiàn)有大量候選基因與玉米的選育改良相關(guān)。Branca等[22]對(duì)26個(gè)蒺藜苜蓿材料進(jìn)行了全基因測(cè)序,分析其序列差異和連鎖不平衡(LD,linkage disequilibrium)情況,檢測(cè)得到約300萬(wàn)個(gè)SNPs,有利于在全基因組關(guān)聯(lián)分析中定位豆科植物中共生關(guān)系和結(jié)瘤相關(guān)性狀的位點(diǎn)。Zheng等[23]通過(guò)對(duì)3個(gè)高粱品種的全基因組重測(cè)序,發(fā)現(xiàn)在籽實(shí)高粱和甜高粱間約有1 000多個(gè)基因存在序列和結(jié)構(gòu)的差異,涉及到糖與淀粉代謝、木質(zhì)素和香豆素合成、核酸代謝、脅迫響應(yīng)和DNA修復(fù)等過(guò)程。Lin等[24]對(duì)來(lái)自全世界的360份番茄進(jìn)行了重測(cè)序,發(fā)現(xiàn)了1 100多萬(wàn)個(gè)SNPs,構(gòu)建了番茄的變異圖譜,為番茄的全基因組分子育種提供了基礎(chǔ)。Lam等[25]比對(duì)野生大豆和栽培大豆重測(cè)序數(shù)據(jù)比較得到630多萬(wàn)個(gè)SNPs,發(fā)現(xiàn)了大量在栽培大豆中獲得以及丟失的野生大豆基因。Qi等[26]通過(guò)重測(cè)序構(gòu)建了黃瓜遺傳變異圖譜,發(fā)掘了2 000多個(gè)在馴化過(guò)程中受選擇的基因。Zhang等[27]利用上述數(shù)據(jù)進(jìn)行了黃瓜大片段DNA序列的結(jié)構(gòu)變異鑒定和分析,揭示了SV產(chǎn)生的主要機(jī)制。Xu等[28]通過(guò)對(duì)40個(gè)代表性水稻品種和10個(gè)野生稻資源的基因組重測(cè)序,同樣發(fā)現(xiàn)了數(shù)千個(gè)與水稻人工選擇相關(guān)的基因,并且證明秈稻和粳稻的起源是相互獨(dú)立的,而粳稻是從中國(guó)普通野生稻進(jìn)化而來(lái)。中國(guó)農(nóng)業(yè)科學(xué)院的3K水稻基因組計(jì)劃已經(jīng)收集了全世界不同遺傳背景和表型的2 859份水稻資源,并通過(guò)重測(cè)序獲得了基因組信息,平均覆蓋深度為14倍,建立了水稻基因組的SNP與InDel變異數(shù)據(jù)庫(kù)[29-30]。Huang等[31]利用446份普通野生稻和1 083個(gè)栽培稻重測(cè)序數(shù)據(jù),構(gòu)建了水稻基因組變異圖譜并確定了55個(gè)在馴化過(guò)程中發(fā)生的選擇性清除(Selective sweep),進(jìn)一步分析揭示了粳稻最先起源于中國(guó)南方,秈稻是隨后由粳稻與當(dāng)?shù)匾吧倦s交形成的。這些結(jié)果將有效指導(dǎo)和加速農(nóng)作物分子育種等研究,具有重要的科研價(jià)值和產(chǎn)業(yè)價(jià)值。
高通量測(cè)序極大地促進(jìn)了重要功能基因或者數(shù)量性狀位點(diǎn)(QTL,quantitative trait locus)和分子標(biāo)記的挖掘,在重測(cè)序獲得的大量遺傳變異基礎(chǔ)上,通過(guò)關(guān)聯(lián)分析、比較研究、連鎖分析和生物信息學(xué)分析可以開(kāi)發(fā)出高密度的分子標(biāo)記,能顯著促進(jìn)種質(zhì)資源挖掘和利用,縮短育種周期(圖1)。
4.1 重測(cè)序應(yīng)用于GWAS
全基因關(guān)聯(lián)分析(GWAS,Genome-wide association study)最早在醫(yī)學(xué)研究中被廣泛。GWAS分析無(wú)需在研究前構(gòu)建任何假設(shè),可以將目標(biāo)表型與其DNA序列變異關(guān)聯(lián),分析的信息量大,能檢測(cè)到大量與目標(biāo)性狀相關(guān)的基因?;跍y(cè)序來(lái)確定關(guān)鍵位點(diǎn)的GWAS分析方法,與傳統(tǒng)的QTL定位方法互為補(bǔ)充。
圖1 基于高通量測(cè)序技術(shù)的基因發(fā)掘研究思路Fig.1 The research approach of plant gene discovery based on high-throughput sequencing
表1 高通量基因組測(cè)序在水稻研究中的應(yīng)用Table 1 Application of high-throughput genome sequencing in rice research
Tian等[32]通過(guò)GWAS分析獲得一個(gè)玉米嵌套的關(guān)聯(lián)映射面板,利用160萬(wàn)個(gè)SNP位點(diǎn)鑒定了與莖葉夾角相關(guān)的基因。Huang[33]等通過(guò)新的基因型分類(lèi)方法,構(gòu)建了517個(gè)水稻地方品種的高密度的單體型圖譜,然后利用360萬(wàn)個(gè)SNP位點(diǎn)對(duì)373個(gè)秈稻群體的對(duì)包括株型、產(chǎn)量、米質(zhì)和生理生化等14個(gè)農(nóng)藝性狀進(jìn)行GWAS研究,發(fā)現(xiàn)有6個(gè)位點(diǎn)與前人研究結(jié)果相符。隨后,Huang等[34]在這些數(shù)據(jù)的基礎(chǔ)上,增加了430份來(lái)自世界不同地區(qū)的水稻材料的重測(cè)序數(shù)據(jù),對(duì)這些品種的抽穗期和產(chǎn)量性狀進(jìn)行了GWAS研究,定位了32個(gè)新的抽穗、產(chǎn)量性狀相關(guān)的位點(diǎn)。Jia等[35]構(gòu)建一張包含國(guó)內(nèi)外916份谷子品種的高精度單倍體型圖譜,通過(guò)GWAS分析定位到了512個(gè)與株型、產(chǎn)量、花期、抗病性等47個(gè)農(nóng)藝性狀關(guān)聯(lián)的位點(diǎn),同時(shí)還發(fā)現(xiàn)了36個(gè)在新品種選育中受選擇的特殊位點(diǎn)。
4.2 重測(cè)序應(yīng)用于突變體
突變體的表型和基因型為基因功能研究提供了直接的證據(jù),而采用全基因組重測(cè)序來(lái)鑒定突變體的變異序列已經(jīng)成為功能基因組學(xué)研究的一個(gè)發(fā)展趨勢(shì)。
主要農(nóng)藝性狀是由多基因控制的,而單個(gè)基因僅只有很小的表型效應(yīng),因此鑒定和克隆單突變位點(diǎn)非常困難。Abe[36]介紹一種快速基因定位方法——Mutmap法,用突變體與野生型雜交構(gòu)建F2分離群體的,在分離群體構(gòu)建基因池進(jìn)行全基因組重測(cè)序。Abe構(gòu)建了7個(gè)分離群體,其中一個(gè)親本是日本骨干水稻栽品種,鑒定了包括控制淡綠色葉片和半矮生性狀相關(guān)突變基因位點(diǎn)。這種方法只需在F2分離群體中選擇極端性狀構(gòu)建等基因池,利用高通量測(cè)序手段發(fā)掘與性狀相關(guān)聯(lián)的SNP位點(diǎn),得到候選基因,為農(nóng)作物基因克隆研究提供了新思路,減少了在傳統(tǒng)圖位克隆中構(gòu)建群體所耗費(fèi)的時(shí)間。
陳竹鋒等[37]利用改進(jìn)的MutMap方法成功鑒定了LOC-Os02 g40450(MER3)是控制osms55突變體雄性不育的基因。改進(jìn)的MutMap方法不需要組裝野生型基因組序列,而是分別將兩個(gè)混池的重測(cè)序數(shù)據(jù)與‘日本晴’參考基因組進(jìn)行比對(duì),通過(guò)比較突變體和野生型的差異SNP確定候選基因,節(jié)約了成本。Takagi等[38]2015年對(duì)日本當(dāng)?shù)仄贩N‘Hitomebore’進(jìn)行EMS誘變處理,產(chǎn)生耐鹽性的突變品系(hst1)。運(yùn)用MutMap方法,對(duì)20個(gè)F2子代群體極端性狀混池和測(cè)序,通過(guò)差異分析,成功找到水稻耐鹽性突變體產(chǎn)生機(jī)制,由于OsRR22基因中插入了Tos17基因,導(dǎo)致OsRR22基因部分功能缺失,產(chǎn)生耐鹽性。
4.3 重測(cè)序應(yīng)用于遺傳圖譜
傳統(tǒng)的QTL定位所用的分子標(biāo)記連鎖遺傳圖譜密度不高,定位得到的性狀相關(guān)位點(diǎn)不夠準(zhǔn)確。新一代測(cè)序技術(shù)可以提供大量的可靠數(shù)據(jù),使構(gòu)建超高密度的遺傳圖譜成為可能。
Wang等[39]構(gòu)建了一個(gè)包含2 334個(gè)SNP的水稻重組自交系遺傳圖譜,鑒定到了49個(gè)與14個(gè)農(nóng)藝性狀相關(guān)的QTL,其中分別控制分蘗角度、株高、劍葉寬度、粒長(zhǎng)、粒寬的5個(gè)主效QTL的遺傳距離均很小,直接可以分析其區(qū)間內(nèi)的候選基因。Yu等[40]為了評(píng)估所構(gòu)建的‘珍汕97’和‘明恢63’重組自交系遺傳圖譜的質(zhì)量,驗(yàn)證了包括GS3、GW5和OsC1這3個(gè)分別控制粒長(zhǎng)、粒寬和色澤的主效QTLs位點(diǎn),被選目標(biāo)位點(diǎn)都被精確地定位在基因?qū)嶋H所在的bins中,表明其獲得的遺傳圖譜準(zhǔn)確性很高。Takagi[41]提出了一種應(yīng)用重測(cè)序方法進(jìn)行QTL定位的新技術(shù)(QTL-seq法),利用目標(biāo)性狀差異較大的一對(duì)品種雜交后獲得的重組自交系或F2,在群體中選擇極端性狀的20—50個(gè)個(gè)體分別構(gòu)建高低表型DNA混池后進(jìn)行重測(cè)序,通過(guò)對(duì)比兩個(gè)混池的SNP位點(diǎn)的測(cè)序深度相關(guān)的一個(gè)參數(shù)(SNP-index)來(lái)定位QTL。文中以水稻為例對(duì)該方法用了兩種分離群體進(jìn)行了驗(yàn)證,并對(duì)此方法的運(yùn)用進(jìn)行了數(shù)據(jù)模擬,確定混池所選極端個(gè)體數(shù)目占群體總數(shù)的比例及測(cè)序深度是限制因素,發(fā)現(xiàn)當(dāng)所選個(gè)體比例為15%,測(cè)序深度在20×?xí)r,此方法可應(yīng)用于F2代群體進(jìn)行QTL的準(zhǔn)確定位,如果應(yīng)用在F7代的RILs群體,則定位效果更顯著。Yang等[42]對(duì)Nipponbare×LPBG的F3后代(10 800個(gè)體)進(jìn)行苗期耐冷性的QTL定位,分別選取430個(gè)極端敏感個(gè)體和385個(gè)極端耐冷個(gè)體構(gòu)建混池,對(duì)兩個(gè)DNA混池測(cè)序得到45萬(wàn)個(gè)SNPs,通過(guò)兩種分析方法均定位到6個(gè)主效QTLs,位于第1,2,5,8和10染色體上,和前人定位區(qū)間相近。Lu等[43]利用QTL-seq的技術(shù)思路,在黃瓜中快速定位了一個(gè)與早開(kāi)花相關(guān)的QTL。通過(guò)QTL-seq定位和遺傳圖譜QTL分析結(jié)合將性狀相關(guān)區(qū)段縮短至第1染色體上的25.42—26.31Mb,根據(jù)注釋在該區(qū)域中,包含基因Csa1G651710,與擬南芥的FT基因同源性高達(dá)74%。Illa等[44]利用6個(gè)F2群體,采用QTL-seq方法快速定位到了3個(gè)新的番茄果實(shí)重量位點(diǎn)和3個(gè)控制心室數(shù)量的位點(diǎn),進(jìn)一步通過(guò)精細(xì)定位將果重的一個(gè)主效QTL(fw11.2)縮短至750 kb范圍內(nèi),其中包含66個(gè)候選基因。
基于高通量測(cè)序技術(shù)的基因定位與傳統(tǒng)方法相比周期短、效率高;所獲標(biāo)記數(shù)量多、密度高;定位準(zhǔn)確性強(qiáng)、精度高,可經(jīng)濟(jì)高效地實(shí)現(xiàn)功能基因定位,利用快速而精確的分子標(biāo)記輔助選擇,在早世代進(jìn)行標(biāo)記選擇,還能對(duì)一些難以精確評(píng)價(jià)的抗逆性表型(如抗旱性等)進(jìn)行篩選,將顯著提高育種效率??梢灶A(yù)期的是,隨著高通量測(cè)序技術(shù)的不斷發(fā)展和完善,試驗(yàn)成本的逐步降低,基于高通量測(cè)序手段的基因分型和分子標(biāo)記開(kāi)發(fā)以及候選功能基因的挖掘,將會(huì)更加廣泛地應(yīng)用于農(nóng)作物分子育種研究中,加速農(nóng)業(yè)育種研究進(jìn)程。
[1]MAXAM A M,GILBERT W.A New Method for Sequencing DNA[J].Proceedings of the National Academy of Sciences,1977,74(2):560-564.
[2]SANGER F,NICKLEN S,COULSON A R.DNA Sequencing with Chain-Terminating Inhibitors[J].Proceedings of the National Academy of Sciences,1977,74(12):5463-5467.
[3]MARGULIES M,EGHOLM M,ALTMAN W E,et al.Genome sequencing in microfabricated high-density picolitre reactors[J].Nature,2005,437(7057):376-380.
[4]SHAFFER C.Next-generation sequencing outpaces expectations[J].Nature Biotechnology,2007,25(2):149.
[5]SHENDURE J,JI H.Next-generation DNA sequencing[J].Nature Biotechnology,2008,26(10):1135-1145.
[6]SCHUSTER S C.Next-generation sequencing transforms today's biology[J].Nature Methods,2008,5(1):16-18.
[7]EID J,F(xiàn)EHR A,GRAY J,et al.Real-Time DNA Sequencing from Single Polymerase Molecules[J].Science,2009,323(5910):133-138.
[8]TAGI.Analysis of the genome sequence of the flowering plant Arabidopsis thaliana[J].Nature,2000,408(6814):796-815.
[9]YU J,HU S,WANG J,et al.A draft sequence of the rice genome(Oryza sativa L.ssp.indica)[J].Science,2002,296(5):79-92.
[10]TUSKAN G A,DIFAZIO S,JANSSON S,et al.The genome of black cottonwood,Populus trichocarpa(Torr.&Gray)[J].Science,2006,313(5793):1596-1604.
[11]JAILLON O,AURY J M,NOEL B,et al.The grapevine genome sequence suggests ancestral hexaploidization in major angiosperm phyla[J]. Nature,2007,449(7161):463-467.
[12]MING R,HOU S,F(xiàn)ENG Y,et al.The draft genome of the transgenic tropical fruit tree papaya(Carica papaya Linnaeus)[J].Nature,2008,452(7190):991-996.
[13]ZHARKIKH A,TROGGIO M,PRUSS D,et al.Sequencing and assembly of highly heterozygous genome of Vitis vinifera L.cv Pinot Noir:Problems and solutions[J].Journal of Biotechnology,2008,136(1-2):38-43.
[14]PATERSON A H,BOWERS J E,BRUGGMANN R,et al.The Sorghum bicolor genome and the diversification of grasses[J].Nature,2009,457(7229):551-556.
[15]SCHNABLE P S,WARE D,F(xiàn)ULTON R S,et al.The B73 maize genome:Complexity,diversity,and dynamics[J].Science,2009,326(5956):1112-1115.
[16]SCHMUTZ J,CANNON S B,SCHLUETER J,et al.Genome sequence of the palaeopolyploid soybean[J].Nature,2010,463(7278):178-183.
[17]Potato Genome Sequencing Consortium.Genome sequence and analysis of the tuber crop potato[J].Nature,2011,475(7355):189-195.
[18]HUANG S,LI R,ZHANG Z,LI L,et al.The genome of the cucumber,Cucumis sativus L[J].Nature Genetics,2009,41(12):1275-1281.
[19]LING H Q,ZHAO S,LIU D,WANG J,et al.Draft genome of the wheat A-genome progenitor Triticum urartu[J].Nature,2013,496(7443):87-90.
[20]CHALHOUB B,DENOEUD F,LIU S,et al.Early allopolyploid evolution in the post-Neolithic Brassica napus oilseed genome[J].Science,2014,345(6199):950-953.
[21]LAI J,LI R,XU X,JIN W,et al.Genome-wide patterns of genetic variation among elite maize inbred lines[J].Nature Genetics,2010,42(11):1027-1030.
[22]BRANCA A,PAAPE T D,ZHOU P,et al.Whole-genome nucleotide diversity,recombination,and linkage disequilibrium in the model legume Medicago truncatula[J].Proceedings of the National Academy of Sciences,2011,108(42):E864-70.
[23]ZHENG LY,GUO X S,HE B,et al.Genome-wide patterns of genetic variation in sweet and grain sorghum(Sorghum bicolor)[J].Genome Biology,2011,12(11):R114.
[24]LIN T,ZHU G,ZHANG J,et al.Genomic analyses provide insights into the history of tomato breeding[J].Nature Genetics,2014,46(11):1220-1226.
[25]LAM H M,XU X,LIU X,et al.Resequencing of 31 wild and cultivated soybean genomes identifies patterns of genetic diversity and selection[J].Nature Genetics,2010,42(12):1053-1059.
[26]QI J,LIU X,SHEN D,et al.A genomic variation map provides insights into the genetic basis of cucumber domestication and diversity[J].Nature genetics,2013,45(12):1510-1515.
[27]ZHANG Z,MAO L,CHEN H,et al.Genome-Wide Mapping of Structural Variations Reveals a Copy Number Variant That Determines Reproductive Morphology in Cucumber[J].The Plant Cell,2015:tpc.114.135848.
[28]XU X,LIU X,GE S,et al.Resequencing 50 accessions of cultivated and wild rice yields markers for identifying agronomically important genes[J].Nature biotechnology,2012,30(1):105-111.
[29]LI J Y,WANG J,ZEIGLER R S.The 3,000 rice genomes project:new opportunities and challenges for future rice research[J].GigaScience,2014,3(1):1-3.
[30]鄭天清,余泓,張洪亮,等.水稻功能基因組育種數(shù)據(jù)庫(kù)(RFGB):3K水稻SNP與InDel子數(shù)據(jù)庫(kù)[J].科學(xué)通報(bào),2015,60(4):367-371.
[31]HUANG X,KURATA N,WEI X,et al.A map of rice genome variation reveals the origin of cultivated rice[J].Nature,2012,490(7421):497-501.
[32]TIAN F,BRADBURY P J,BROWN P J,et al.Genome-wide association study of leaf architecture in the maize nested association mapping population.Nature Genetics,2011,43(2):159-162.
[33]HUANG X,WEI X,SANG T,et al.Genome-wide association studies of 14 agronomic traits in rice landraces[J].Nature Genetics,2010,42(11):961-967.
[34]HUANG X,ZHAO Y,WEI X,et al.Genome-wide association study of flowering time and grain yield traits in a worldwide collection of rice germplasm[J].Nature genetics,2012,44(1):32-39.
[35]JIA G Q,HUANG X H,ZHI H,et al.A haplotype map of genomic variations and genome-wide association studies of agronomic traits in foxtail millet(Setaria italica)[J].Nature Genetics,2013,45(8):957-961.
[36]ABE A,KOSUGI S,YOSHIDA K,et al.Genome sequencing reveals agronomically important loci in rice using MutMap[J].Nature Biotechnology,2012,30(2):174-178.
[37]陳竹鋒,嚴(yán)維,王娜,等.利用改進(jìn)的MutMap方法克隆水稻雄性不育基因[J].遺傳,2014,36(1):85-93.
[38]TAKAGI H,TAMIRU M,ABE A,et al.MutMap accelerates breeding of a salt-tolerant rice cultivar[J].Nature biotechnology,2015,33(5):445-449.
[39]WANG L,WANG A,HUANG X,et al.Mapping 49 quantitative trait loci at high resolution through sequencing-based genotyping of rice recombinant inbred lines[J].Theoretical and applied genetics,2011,122(2):327-340.
[40]YU H,XIE W,WANG J,et al.Gains in QTL detection using an ultra-high density SNP map based on population sequencing relative to traditional RFLP/SSR markers[J].PLoS One,2011,6(3):e17595.
[41]TAKAGI H,ABE A,YOSHIDA K,et al.QTL-seq:rapid mapping of quantitative trait loci in rice by whole genome resequencing of DNA from two bulked populations[J].Plant Journal,2013,74(1):174-183.
[42]YANG Z,HUANG D,TANG W,et al.Mapping of Quantitative Trait Loci Underlying Cold Tolerance in Rice Seedlings via High-Throughput Sequencing of Pooled Extremes[J].PLoS One,2013,8(7):670-692.
[43]LU H,LIN T,KLEIN J,et al.QTL-seq identifies an early flowering QTL located near Flowering Locus T in cucumber[J].Theoretical and Applied Genetics,2014,127(7):1491-1499.
[44]ILLA BERENGUER E,VAN HOUTEN J,HUANG Z,et al.Rapid and reliable identification of tomato fruit weight and locule number loci by QTL-seq[J].Theoretical and Applied Genetics,2015,128(7):1329-1342.
(責(zé)任編輯:張睿)
Application of high-throughput genome sequencing in crop gene discovery and mapping
LIU Yi,YU Xin-qiao,ZHANG An-ning,WANG Fei-ming,LIU Guo-lan*
(Shanghai Agrobiological Gene Center,Shanghai 201106,China)
High-throughput sequencing,which has an ultra-low cost per base of sequencing and an overwhelmingly high data output,has been widely used in the field of plant research.In this paper,we review the progress in the application of high-throughput sequencing technologies to crop research,especially the new methods in crop gene discovery and mapping.These novel research methods and solutions will greatly shorten the breeding process.
High-throughput Sequencing;Genome;Crop;Gene mapping
S188.1
A
1000-3924(2016)06-171-05
2015-10-26
國(guó)家高技術(shù)研究發(fā)展計(jì)劃(863計(jì)劃)項(xiàng)目(2014AA10A604);上海市市級(jí)農(nóng)口系統(tǒng)青年人才成長(zhǎng)計(jì)劃[滬農(nóng)青字(2015)第1-6號(hào)]
劉毅(1984—),男,在職博士,助理研究員,研究方向:節(jié)水抗旱稻分子育種。E-mail:ly07@sagc.org.cn
*通信作者,E-mail:lgl@sagc.org.cn