• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基因組學(xué)進(jìn)展及其在熱帶作物領(lǐng)域中的應(yīng)用

      2020-12-09 05:37:02周新成夏志強陳新鄒枚伶盧誠王海燕王文泉
      熱帶作物學(xué)報 2020年10期
      關(guān)鍵詞:進(jìn)化基因組學(xué)遺傳多樣性

      周新成 夏志強 陳新 鄒枚伶 盧誠 王海燕 王文泉

      摘? 要:基因組學(xué)的發(fā)展,不僅能獲得物種個體水平染色體的精準(zhǔn)DNA序列,解析生命科學(xué)的基本問題,而且其超高通量技術(shù)使得在群體水平詮釋物種遺傳多樣性成為可能,從而改變了現(xiàn)代生命科學(xué)的進(jìn)程和研究方式。本文概述了基因組技術(shù)的最新進(jìn)展,以及與相關(guān)組學(xué)技術(shù)結(jié)合,在物種群體遺傳結(jié)構(gòu)多樣性、功能基因發(fā)掘、生物進(jìn)化以及精準(zhǔn)育種領(lǐng)域的廣泛應(yīng)用;同時簡述了熱帶作物的生物學(xué)特性、基因組研究進(jìn)展及其存在的問題,并對未來基因組學(xué)發(fā)展與新的應(yīng)用領(lǐng)域進(jìn)行了簡評。

      關(guān)鍵詞:基因組學(xué);第三代測序技術(shù);遺傳多樣性;進(jìn)化;精準(zhǔn)育種;熱帶作物

      中圖分類號:Q-1? ? ? 文獻(xiàn)標(biāo)識碼:A

      Abstract: Genomics not only makes the development of genetics up to the ultimate dream, to obtain precision DNA sequence in chromosome level for individual species, resolve the basic problems of life science, but also, the ultra-high throughput sequencing technology makes it easy and accuracy to interprete the population genetic diversity for a species, thus changing the way and the process of modern life science and research. Here is an overview of the latest progress of genome technology and its extensive application in the fields of genetic structure diversity of species populations, functional gene exploration, biological evolution and precision breeding in combination with relevant omics technology, so as to comprehensively analyze biological inheritance and character variation. Meanwhile, the biological characteristics, genome research progress and existing problems of tropical crops were briefly reviewed, and perspective the future development and new applications of genomics.

      Keywords: genomics; the third generation sequencing technology; genetic diversity; evolution; precision breeding; tropical crops

      DOI: 10.3969/j.issn.1000-2561.2020.10.019

      1? 基因組學(xué)的概念、內(nèi)涵與外延

      自美國進(jìn)化生物學(xué)家托馬斯·亨特·摩爾根創(chuàng)作的《基因論》(1926年)為標(biāo)志的遺傳學(xué)問世,近百年來基因概念經(jīng)歷了深度的發(fā)展,從單基因遺傳因子,到DNA雙螺旋結(jié)構(gòu)、轉(zhuǎn)座子、細(xì)胞遺傳學(xué)、群體遺傳學(xué)到表觀遺傳學(xué),分子生物學(xué)技術(shù)的進(jìn)步催生了基因組學(xué)(genomics)。美國科學(xué)家Thomas Roderick提出基因組學(xué)的概念(1986年),是指對物種所有基因進(jìn)行基因組作圖、核苷酸序列分析、基因定位和基因功能分析的一門科學(xué)?;蚪M學(xué)是現(xiàn)代遺傳學(xué)的基本形式,特別是核苷酸高通量測序技術(shù)的發(fā)展,以有限的成本測定所有經(jīng)濟(jì)物種基因組序列成為現(xiàn)實,進(jìn)而從基因組草圖升級為基因組精細(xì)圖譜,結(jié)合生物學(xué)相關(guān)技術(shù)的進(jìn)步,基因組學(xué)的內(nèi)涵發(fā)生了顯著的變化,已成為生命科學(xué)的前沿和熱點領(lǐng)域。狹義的基因組學(xué)包括結(jié)構(gòu)基因組、功能基因組和比較基因組學(xué)幾個方面,而廣義的基因組學(xué)還包括由生物學(xué)中心法則演化的生物遺傳信息流的整合研究。如測定全基因組特定時空和組織器官的基因表達(dá)譜,即轉(zhuǎn)錄組學(xué),也包括全基因組范圍mRNA指導(dǎo)完成的蛋白質(zhì)合成與調(diào)控,即蛋白質(zhì)組學(xué),還包括新興的代謝組學(xué),及由生物蛋白酶系統(tǒng)組織完成的數(shù)量更加復(fù)雜的代謝產(chǎn)物分析及其與遺傳關(guān)系的研究[1]。有的學(xué)者贊同后者是基因組學(xué)研究的外延,這種外延還包括在DNA、RNA和蛋白質(zhì)水平修飾的甲基化、泛素化、磷酸化等,及非編碼RNA介導(dǎo)的遺傳調(diào)控相關(guān)表觀遺傳學(xué)[1]?;蚪M學(xué)從個體或者細(xì)胞的單個基因研究上升到對相關(guān)基因群和全部基因的協(xié)同作用研究,構(gòu)建特定生物學(xué)過程的基因網(wǎng)絡(luò),促進(jìn)了可量化的系統(tǒng)生物學(xué)發(fā)展。尚包括針對物種群體的基因組解析,挖掘物種水平的遺傳變異及其進(jìn)化信息。

      2? 基因組學(xué)技術(shù)改變了生命科學(xué)進(jìn)程

      2.1? 基因組學(xué)技術(shù)將生命科學(xué)推進(jìn)到精準(zhǔn)研究的時代

      2007年第二代基因組測序技術(shù)取得突破,以454、Illumina測序技術(shù)為代表的高通量短片段測序與拼接技術(shù),將DNA/RNA序列分析成本大大降低,導(dǎo)致迄今主要經(jīng)濟(jì)物種基因組草圖全面問世,物種演化和遺傳多樣性等基礎(chǔ)生物學(xué)問題取得大量數(shù)據(jù)和全新的進(jìn)展,非編碼RNA和表觀遺傳學(xué)調(diào)控初見端倪;然而由于物種基因組的復(fù)雜性,特別是重復(fù)序列的大量存在,使得現(xiàn)有基因組草圖只具有參考價值,基因組大都不夠完整,全基因組測序覆蓋度一般為65%~90%[2],并且不可避免存在許多堿基序列錯誤和拼接次序的錯誤。2017年以Pac-Bio和Oxford Nanopore為代表的第三代測序儀取得顯著的改進(jìn),Pac-Bio目前允許單個片段測序讀長達(dá)到15 kb,測序通量和準(zhǔn)確率進(jìn)一步提升,這樣將可以解決基因組重復(fù)序列的障礙;Bionano單分子納米孔測序及光學(xué)物理圖譜技術(shù),則通過對大片段基因組DNA分子特定位點的標(biāo)記,建立高覆蓋度的光學(xué)物理圖譜,適度拼裝可以達(dá)到N50為5 Mb的超長序列[3]。該項技術(shù)不僅能夠為大基因組組裝提供精確的骨架,整合三代測序數(shù)據(jù)組裝染色體級別的物種基因組精細(xì)圖,而且通過基因轉(zhuǎn)錄起始區(qū)、甲基化、特定類型基因等多重標(biāo)記,能夠為物種群體提供功能性狀的染色體鏡像,解決長期以來細(xì)胞學(xué)與分子水平遺傳研究的銜接問題[4]。這些三代測序技術(shù)與二代測序技術(shù)及Hi-C技術(shù)的整合,可以有限成本將物種基因組組裝到染色體級別的精細(xì)圖譜,覆蓋度達(dá)到90%~99%,Scaffold N50達(dá)到30~50 Mb[4],標(biāo)志著基因組學(xué)研究進(jìn)入精準(zhǔn)科學(xué)時代,許多基因組草圖將被改寫為基因組精細(xì)圖譜。蛋白質(zhì)組學(xué)中iTRAQ技術(shù)發(fā)展使得單次測序獲得6000~10000個蛋白質(zhì)片段[5],這些新技術(shù)的組合和綜合應(yīng)用,建立了精準(zhǔn)生命科學(xué)研究的技術(shù)基礎(chǔ)。以精準(zhǔn)生命科學(xué)的基因組學(xué)、表觀遺傳學(xué)、蛋白質(zhì)組學(xué)和代謝組學(xué)、基因組編輯技術(shù)等為基礎(chǔ)的生命科學(xué)即將進(jìn)入一個全新的時代。揭示生命活動的精細(xì)調(diào)控,生物重構(gòu),經(jīng)濟(jì)作物產(chǎn)量與品質(zhì)調(diào)節(jié),實現(xiàn)精準(zhǔn)人類健康管理等精準(zhǔn)操作,并將衍生大量的應(yīng)用性技術(shù)乃至產(chǎn)業(yè)?;蚪M學(xué)技術(shù)在未來的應(yīng)用圖景歸納為圖1。

      2.2? 高分辨率群體基因型分析破解物種多樣性終極變異及其演化

      群體基因型分析從傳統(tǒng)的分子標(biāo)記(RAPD,SSR,AFLP等)、芯片技術(shù)逐步轉(zhuǎn)向簡化重測序和重測序,其檢測通量成等比級數(shù)上升,而分析成本則成等比級數(shù)下降。芯片雜交技術(shù)由于信號的噪聲問題,加上需要多個重復(fù)增加了成本,而逐漸被重測序取代。全基因組重測序是對基因組序列已知的個體進(jìn)行全基因組范圍的測序,并在個體或群體水平上進(jìn)行差異性分析的方法。過去10年由于重測序成本尚比較高,幾種簡化重測序技術(shù)應(yīng)運而生。最典型的是康內(nèi)爾大學(xué)推出的genotyping by sequencing(GBS)技術(shù)[6],在對物種DNA酶切基礎(chǔ)上的隨機(jī)擴(kuò)增,獲取基因組約5%~7%的序列,并采用加barcode混合樣本測序策略,測序成本大大降低;另外一種AFSM技術(shù),進(jìn)一步選擇了對甲基化敏感的酶切位點,且對基因區(qū)有一定偏置性,可同時檢測全基因組的甲基化水平[7]。簡化重測序技術(shù)主要用于解析物種大群體遺傳多樣性變異(SNPs,InDels)和性狀關(guān)聯(lián)分析,以及育種群體的標(biāo)記選擇,目前已得到廣泛的應(yīng)用。隨著基因組測序成本的進(jìn)一步降低,采用二代測序技術(shù)的完全重測序及其新型建庫技術(shù)得到更多的應(yīng)用,可以獲得幾乎完整的基因區(qū)序列信息,并可以部分檢測基因組一些結(jié)構(gòu)變異SV(小于50 bp)信息[8],在作物物種群體遺傳多樣性、育種標(biāo)記檢測、人類疾病的致病突變研究及物種演化中有越來越多的應(yīng)用,具有重大的科研和產(chǎn)業(yè)價值。現(xiàn)將若干種應(yīng)用分述如下。

      2.2.1? 全基因組重測序?qū)崿F(xiàn)目標(biāo)性狀的精細(xì)標(biāo)記? 第二(NGS)、第三代測序技術(shù)與遺傳學(xué)的結(jié)合,加快了作物農(nóng)藝性狀相關(guān)基因的識別和分離。由于標(biāo)記密度的顯著增大,提高了QTL位置的分辨率,有助于確定基因的功能性變異。通過重測序可以發(fā)現(xiàn)大量的單核苷酸多態(tài)性位點(SNPs)、拷貝數(shù)變異(copy number variation,CNV)、插入缺失(insertions/deletions,InDels)、結(jié)構(gòu)變異(structure variation,SV)等變異位點?;谝陨献儺愇稽c作為分子遺傳標(biāo)記,在人類復(fù)雜疾病、動植物經(jīng)濟(jì)性狀和育種研究及物種起源、馴化、群體歷史動態(tài)等方面具有重要的指導(dǎo)意義[9-10]。一系列在獲取物種基因組精細(xì)圖基礎(chǔ)上,對栽培及野生種大群體重測序解析育種重要性狀QTL和關(guān)聯(lián)位點的研究問世,包括對于桃樹主要品質(zhì)性狀的系統(tǒng)研究[11],這些研究在方法學(xué)上采用批量分離分析(BSA)、基因組遺傳多態(tài)數(shù)據(jù)庫的構(gòu)建,結(jié)合多年多點表型數(shù)據(jù)以精確QTL和關(guān)聯(lián)位點的檢測[12]。全基因組重測序基礎(chǔ)上的GWAS分析已經(jīng)取得顯著的成果,在生物醫(yī)學(xué)領(lǐng)域揭示了數(shù)百個復(fù)雜的疾病性狀,可以肯定未來的GWAS將以全基因組測序為基礎(chǔ)[13]。

      2.2.2? 群體重測序發(fā)現(xiàn)新基因? 通過經(jīng)濟(jì)物種自然群體基因型標(biāo)記與表型性狀的全基因組關(guān)聯(lián)分析,或者實驗群體的QTL定位獲取性狀的分子標(biāo)記,進(jìn)而通過圖位克隆是新基因發(fā)掘的重要方法。然而傳統(tǒng)意義上由于群體遺傳標(biāo)記密度過低問題,基因圖位克隆需要輔之以大片段DNA文庫篩選,以及染色體步移等復(fù)雜的技術(shù)程序,通過圖位克隆獲得動植物基因[14]。隨著群體重測序技術(shù)的廣泛應(yīng)用,一次性獲得物種超高密度的單倍型圖譜變得簡單可行,一旦有可靠的群體表型數(shù)據(jù),圖位克隆過程變得比過去更為簡單,因而更加實用。迄今在大豆、木豆、油菜、棉花及動物山羊等經(jīng)濟(jì)物種中有大量成功的范例,獲得具有重要經(jīng)濟(jì)價值的基因資源[12, 15-18]。

      高分辨率基因組分析技術(shù)為農(nóng)作物基因組的結(jié)構(gòu)多樣性提供了前所未有的視角。除了用于復(fù)雜農(nóng)藝性狀的遺傳作圖或全基因組關(guān)聯(lián)研究外,高密度基因分型陣列也非常適用于基因組選擇策略,它們還能以前所未有的染色體尺度分辨率描述作物多樣性。這些研究深入了解了作物進(jìn)化和選擇的歷史,同時發(fā)現(xiàn)了新的多樣性以提高產(chǎn)量和雜種優(yōu)勢[19]。

      2.2.3? 全基因組重測序解析生物適應(yīng)性進(jìn)化? 對于物種演化研究,到目前為止,大部分知識來自基于短片段測序的分析,而長讀測序技術(shù)正開始應(yīng)用于所有物種的基因組分析,其遺傳變異信息接近完整,也包括在染色體水平的基因組結(jié)構(gòu)變異,會在更大尺度上影響基因組功能,展示基因組進(jìn)化圖景[20]。在獲得物種參考基因組基礎(chǔ)上,對多個基因組深度重測序,特別是野生與栽培類型的比較解析,提供了栽培物種進(jìn)化、馴化和物種形成的更加完整的證據(jù)[21]。如迄今在辣椒[22]、桃樹[23]和鷹嘴豆[24]等物種所發(fā)現(xiàn)的演化途徑,揭示了選擇性刪除(selective sweeping)、轉(zhuǎn)座調(diào)控等在物種演化與形成中具有重要的作用。

      在相關(guān)研究中,首先,需要獲取物種地域分布演化過程群體的原始樣本,一般具有栽培類型的祖先種(亞種)或近緣種群體,加上農(nóng)家種和改良品種,每個類型選擇具有統(tǒng)計學(xué)意義的小群體,栽培類型適當(dāng)增加,總居群數(shù)量應(yīng)在100份以上。通過對若干代表性樣本的精細(xì)圖譜構(gòu)建,結(jié)合群體全部居群的重測序,能夠獲得百萬至千萬級別的SNPs、InDels多樣本變異標(biāo)記,以及部分SV信息(小于50 bp),從而構(gòu)建全基因組單倍型圖譜,通過栽培種內(nèi)部及與野生祖先種的比較,可以清晰構(gòu)建種群結(jié)構(gòu)圖,解析物種演化歷程,發(fā)現(xiàn)進(jìn)化中的關(guān)鍵事件[25]。如對72個牦牛野生和馴化群體的重測序研究,比較了中國26個地區(qū)野牦牛和家養(yǎng)牦牛的全基因組遺傳變異圖譜,發(fā)現(xiàn)人們早在公元7300年前新石器早期的青藏高原就已馴化了野生牦牛,而馴化數(shù)量則在公元3600年前增長了約6倍。該項研究還估算出牦牛種群大量增加和全新世晚期人類群體在此地理區(qū)域的擴(kuò)散是同時發(fā)生的;研究還發(fā)現(xiàn)家養(yǎng)牦牛的基因組中,大約有200個基因受到了人為的馴化選擇,這些選擇可能影響到了動物的行為,尤其是溫順性。而這種馴化基因與狗等其他馴化動物中發(fā)現(xiàn)的基因也十分相似[26]。

      2.3? 泛基因組測序——整合物種完全遺傳變異信息

      泛基因組(pan genome)是指涵蓋物種各種生物類型群體的整合基因組。迄今,物種的參考基因組已經(jīng)達(dá)到精細(xì)圖譜水平,但是其對于物種群體遺傳變異的代表性仍然具有局限性。過去5年大量的重測序、簡化重測序信息為在群體水平挖掘遺傳變異、發(fā)現(xiàn)育種標(biāo)記提供了巨大的機(jī)遇,在結(jié)構(gòu)基因組領(lǐng)域發(fā)揮了重要作用。然而,其主要檢測的是SNP和InDel(小于50 bp)的多樣性,對于基因組SV信息,包括大的插入/缺失、倒位、轉(zhuǎn)位和重復(fù)等,尚不足以解析。隨著第三代測序技術(shù)的進(jìn)步,以及測序成本的大幅度下降,針對物種平行性測定多個基因型序列,并獨立組裝注釋,繪制物種泛基因組結(jié)構(gòu)圖景,并挖掘其SV取得顯著進(jìn)展[27]。為此,生物信息學(xué)專家設(shè)計了專門的算法和軟件應(yīng)用于不同程度多基因組序列的整合和注釋[28]。由26個大豆品系獨立組裝的泛基因組中,每個品系平均有約16%序列是不存在的[29],而在油菜8個獨立組裝的泛基因組分析中,發(fā)現(xiàn)僅有76%~84%的共線性序列存在于參考基因組中[30]。植物中受到復(fù)雜基因組、多倍化等影響,泛基因組結(jié)構(gòu)可以涵蓋多個來源基因組序列信息,發(fā)現(xiàn)新的基因、新的大尺度SV,揭示染色體水平的基因重排和劑量效應(yīng)。

      在技術(shù)方面,泛基因組主要依賴于第三代單分子測序技術(shù),包括Pac-Bio的天然DNA鏈的單分子實時(SMRT)測序[31],牛津大學(xué)的Nanopore單分子技術(shù)[32]。它們可以克服第二代短鏈高通量測序技術(shù)的3個基本缺陷:即重復(fù)序列區(qū)排序錯誤而不能檢測大的結(jié)構(gòu)變異、組裝引入非隨機(jī)誤差阻礙了基因變異的檢測以及包括聚合酶鏈?zhǔn)椒磻?yīng)擴(kuò)增的偏倚和測序覆蓋范圍的非均勻分布[33]。當(dāng)然,已有的技術(shù)并不能夠解決所有的讀長問題,光學(xué)物理圖譜(BioNano)及基于二代測序的特有組裝策略10×Genomics等為泛基因組分析提供了補充方法。在計算層面,泛基因組數(shù)據(jù)具有“大數(shù)據(jù)”的所有標(biāo)準(zhǔn)屬性,由于所生成的測序數(shù)據(jù)的巨大規(guī)模、數(shù)據(jù)的極端異質(zhì)性和不同層次上復(fù)雜的交互作用,泛基因組學(xué)給算法和軟件開發(fā)帶來了巨大的挑戰(zhàn)。國際癌癥基因組聯(lián)合會在短短5年內(nèi)積累了一套超過2兆字節(jié)的數(shù)據(jù)集,其結(jié)論是一般以云層存儲數(shù)據(jù),提供了一種以廉價、靈活、可靠和安全的方式處理數(shù)據(jù)的彈性、動態(tài)和并行方式[34]。在基因組測序技術(shù)不斷發(fā)展的今天,獲取物種所有可能的基因組已經(jīng)成為可能,將很快在許多物種、群體和癌癥基因組中實現(xiàn)。換句話說,生命科學(xué)已經(jīng)進(jìn)入了“泛基因組學(xué)”的時代,這個時代的特征是了解一組感興趣的基因組的所有重大遺傳變異。如何挖掘和分析這些令人難以置信的知識財富,以及如何使其走向應(yīng)用是一項神圣的使命。

      2.4? 轉(zhuǎn)錄組學(xué)建立生物特定時空基因表達(dá)全景

      轉(zhuǎn)錄組學(xué)(transcriptomics),或RNA-seq測序及分析,肇始于第二代高通量測序技術(shù),理論上可以揭示生物組織、器官在特定時間基因組上所有轉(zhuǎn)錄本,進(jìn)而用于建立一定信號調(diào)節(jié)生物學(xué)過程中相關(guān)基因的共表達(dá)網(wǎng)絡(luò)(Co-expression network),從而發(fā)現(xiàn)起到交互作用的節(jié)點基因(hub genes)。在過去的10年中,轉(zhuǎn)錄組測序(RNA-seq)已經(jīng)成為分析差異基因表達(dá)和mRNAs差異剪接的不可缺少的工具[35]。轉(zhuǎn)錄組分析應(yīng)用于動植物、微生物生長發(fā)育的所有方面,主要獲取基因轉(zhuǎn)錄本類型、數(shù)量及表達(dá)豐度。轉(zhuǎn)錄組與基因組、表型組、代謝組等大數(shù)據(jù)的整合,衍生了更多具有生物學(xué)意義的基因組信息。通過試驗設(shè)計,多組學(xué)及生物學(xué)技術(shù)分析,如與表型、DNA序列及基因組甲基化的關(guān)聯(lián)分析,分別解析群體E-QTLs,甲基化偏好的基因表達(dá)信息,能夠有效獲取特定生物學(xué)過程相關(guān)關(guān)鍵基因和代謝途徑,已經(jīng)有廣泛的應(yīng)用,如在水稻產(chǎn)量品質(zhì)[36]、葡萄黃酮類代謝途徑[37]及人類遺傳病[38]等方面的高效解析。

      隨著第三代基因組測序技術(shù)的發(fā)展,RNA- seq方法可用于研究RNA生物學(xué)的許多不同方面,包括單細(xì)胞基因的表達(dá)、翻譯組(translatome)和RNA結(jié)構(gòu)。新的長讀和直接RNA-seq技術(shù),提供了無擴(kuò)增的、單分子的cDNAs測序,可以在不需要裝配步驟的情況下展示完整的轉(zhuǎn)錄本。長片段測序技術(shù)可能最終還原復(fù)雜cDNAs的全長及其豐度[39]。結(jié)合更好的數(shù)據(jù)分析計算工具,轉(zhuǎn)錄組學(xué)的創(chuàng)新有助于更全面地理解RNA生物學(xué),從轉(zhuǎn)錄發(fā)生的時間和地點等問題到控制RNA功能的折疊和分子間相互作用。

      最近,單細(xì)胞轉(zhuǎn)錄組測序成為熱點,尤其在人類醫(yī)學(xué)和動物研究領(lǐng)域。如免疫系統(tǒng)是由一個復(fù)雜層次的細(xì)胞類型組成,以保護(hù)機(jī)體免受疾病和維持動態(tài)平衡。識別免疫細(xì)胞的異質(zhì)性是了解免疫系統(tǒng)的關(guān)鍵。先進(jìn)的單細(xì)胞RNA測序(scRNA-seq)技術(shù)正在徹底改變我們研究免疫學(xué)的能力,通過在單細(xì)胞水平上測量轉(zhuǎn)錄水平,能夠比常規(guī)方法更詳細(xì)地識別細(xì)胞異質(zhì)性[40]。在植物中單細(xì)胞RNA測序同樣前景廣闊,但目前主要受到單細(xì)胞材料分離的障礙。傳統(tǒng)的原生質(zhì)體技術(shù)在許多物種中進(jìn)行了嘗試,針對維管束細(xì)胞的分離已經(jīng)具有成熟的材料與測序分析技術(shù)[41]。

      2.5? 表型組學(xué)成為精確解析遺傳效應(yīng)的新趨勢

      表型組(phenome)是指某一生物的全部性狀特征,表型組學(xué)(phenomics)是一門在基因組水平上系統(tǒng)研究某一生物或細(xì)胞在各種不同環(huán)境條件下所有表型的學(xué)科。Steven A Garan(1996)首次提出了phenomics(表型組學(xué))這一概念,比利時Crop Design公司成立并肇始研發(fā)植物性狀評價的高通量技術(shù)平臺(1998)。該公司發(fā)表了具有里程碑意義的論文,詳細(xì)闡述了稱之為“性狀工廠”(trait mill)的可大規(guī)模自動化分析全生育期植物表型的技術(shù)設(shè)施(2005)。2009年,第一屆國際植物表型組大會在澳大利亞堪培拉成功舉辦。南京農(nóng)業(yè)大學(xué)與美國科學(xué)促進(jìn)會聯(lián)合出版的《Plant Phenomics》正式發(fā)刊(2019年),標(biāo)志著表型組學(xué)學(xué)科已經(jīng)成為生物學(xué)研究的熱點領(lǐng)域,將是精準(zhǔn)植物遺傳研究的重要工具。

      基于消除遺傳學(xué)研究中不可控環(huán)境因素引起的表型數(shù)據(jù)噪聲的需要,表型組學(xué)發(fā)展出一套系統(tǒng)的研究方法。其范圍涵蓋高通量數(shù)據(jù)獲取、數(shù)據(jù)管理、數(shù)據(jù)解釋、建模和集成應(yīng)用5個方面[42]。在技術(shù)層面,除了在控制環(huán)境下進(jìn)行表型數(shù)據(jù)獲取外,更重要的是發(fā)展了新型植物生長發(fā)育及品質(zhì)性狀檢測的專門設(shè)備。高通量數(shù)據(jù)獲取目前有室內(nèi)固定平臺、室外移動監(jiān)測平臺、無人機(jī)監(jiān)測平臺、田間大型固定監(jiān)測平臺、田間全自動表型機(jī)器人等多種設(shè)備。室內(nèi)固定平臺集成了多光譜相機(jī)、RGB相機(jī)、激光雷達(dá)、熱成像儀以及高光譜相機(jī)等,采用“sensor-to-plant”的工作方式[43];室外表型監(jiān)測平臺,通常還研發(fā)有車載及背包式移動平臺、田間固定監(jiān)測平臺和無人機(jī)監(jiān)測平臺。車載移動平臺將傳感器裝載在遙控的移動智能小車或大型特制車輛上,可實現(xiàn)長距離、大范圍的樣本數(shù)據(jù)采集[44];背包式移動平臺,將傳感器裝載在簡易的背負(fù)系統(tǒng)上,可方便、靈活地完成目標(biāo)區(qū)域的數(shù)據(jù)采集;田間固定監(jiān)測平臺,可長期、固定地對有效測區(qū)作物進(jìn)行觀測[45];無人機(jī)監(jiān)測平臺,可快速獲取大面積的作物三維點云,用于廣泛、復(fù)雜的農(nóng)田冠層數(shù)據(jù)收集[46]。新型技術(shù)包括采用多種光譜技術(shù)檢測地上部光合作用、生長狀況及生物積累量。最新的3D激光掃描模塊能夠耐受全日照輻射而不影響測量,在高精度測量三維點云信息的同時,測量400~900 nm范圍內(nèi)4個波段的多光譜成像,使得我們可以得到植物在X、Y和Z軸上所有坐標(biāo)點的多光譜信息,通過對光譜信息進(jìn)行完美的校準(zhǔn),從而獲得更加精準(zhǔn)的數(shù)據(jù)[47]。紅外和近紅外熱成像技術(shù)用于對植物水分狀況及脅迫性狀的監(jiān)測[48];根系CT成像模塊,可成功實現(xiàn)原位監(jiān)測植株根系狀態(tài),并對花盆內(nèi)自然土壤中的根系進(jìn)行掃描和重建[49]。表型組數(shù)據(jù)處理依賴生物信息學(xué)技術(shù),將原始數(shù)據(jù)還原為有效性狀,涵蓋計算機(jī)視覺、信息過程、機(jī)器學(xué)習(xí)、統(tǒng)計學(xué)、生理等,然后通過對生態(tài)生理過程的詳細(xì)描述,對植物結(jié)構(gòu)及其動態(tài)和植物功能進(jìn)行建模。

      植物和作物模擬模型是預(yù)測氣候變化、創(chuàng)新的作物管理實踐以及基于性狀或基因的新育種技術(shù)對作物生產(chǎn)和農(nóng)業(yè)系統(tǒng)的影響的強大工具,部分模型已經(jīng)有實證數(shù)據(jù)的支持,用于彌合基因、基因型和表型之間的差距[42]。對闊葉果樹葡萄果穗及葉型的群體光譜檢測,與實際測量數(shù)據(jù)的擬合程度達(dá)到95%[47],然而表型組工具在作物上的應(yīng)用還剛剛開始[50],尚有大量的跨學(xué)科的技術(shù)空間需要完善,以期實現(xiàn)性狀的精確標(biāo)記和分子育種建模,從而指導(dǎo)作物遺傳改良與新品種選育進(jìn)入精準(zhǔn)設(shè)計育種時代。

      3? 熱帶作物及其基因組學(xué)研究

      3.1? 熱帶作物基因組特性

      熱帶地區(qū)是人類馴化經(jīng)濟(jì)物種的主要起源中心之一,最典型的是茄科、葫蘆科、大戟科和禾本科作物,包括起源于南美洲的玉米、木薯、橡膠樹、馬鈴薯、番茄、辣椒等,以及起源于東南亞的水稻、甘蔗等。除了人類長期馴化已經(jīng)全球分布的大宗作物外,木薯、橡膠樹、甘蔗、杧果、菠蘿等典型熱帶作物具有極其重要的經(jīng)濟(jì)、社會價值。熱帶植物適應(yīng)熱帶高光、高溫及充沛的降雨環(huán)境,形成高生物轉(zhuǎn)化能力,一般具有高生物量、高營養(yǎng)利用和環(huán)境適應(yīng)力強等共性生物學(xué)特征。它們在適應(yīng)其生存環(huán)境的長期過程中演化出多樣性的形態(tài)學(xué)、遺傳學(xué)適應(yīng)機(jī)制。在基因組結(jié)構(gòu)層面,由于其多數(shù)的開放授粉、營養(yǎng)體繁殖和生長周期長等習(xí)性,大多數(shù)熱帶植物基因組具有高雜合度,物種群體具有復(fù)雜的遺傳多樣性[21,51]。熱帶作物群體中一般連鎖不平衡(LD)相對較低,長期無性繁殖和開放授粉在不同程度上積累了遺傳冗余和不利的遺傳變異,使得育種所需求的優(yōu)良等位基因位點分散在不同的自然品系群體中。這樣通過常規(guī)育種選擇優(yōu)良變異聚合的新類型效率一般較低[52]。按照傳統(tǒng)的植物品種馴化與資源利用方式,開發(fā)新的品種和利用方式需要經(jīng)過漫長的過程。熱帶作物雜合基因位點中有利等位基因挖掘需要依賴群體的基因型和表型數(shù)據(jù)解析,充分利用現(xiàn)代基因組、蛋白質(zhì)組、代謝組學(xué)和表型組學(xué)方法,發(fā)現(xiàn)熱帶作物中高生物積累,具有人類健康、營養(yǎng)和環(huán)保價值的活性物質(zhì),挖掘代謝途徑,發(fā)掘基因資源,并通過設(shè)計育種培育新品種,將為資源利用開辟全新的途徑。

      3.2? 熱帶作物基因組學(xué)研究進(jìn)展

      3.2.1? 主要熱帶農(nóng)業(yè)生物基因組測序與精細(xì)圖譜繪制? 2008年首個熱帶水果番木瓜基因組草圖問世,此后先后繪制了油棕、椰棗、木薯、香蕉A、B基因組,以及菠蘿、橡膠樹、麻瘋樹、鐵皮石斛、甘蔗等基因組草圖;近年完成并公布了杧果、菠蘿、狼尾草等熱帶作物的基因組精細(xì)圖譜,據(jù)不完全統(tǒng)計26個重要熱帶作物完成基因組測序與注釋(表1),為相關(guān)物種的生物學(xué)研究和遺傳改良奠定了基礎(chǔ)。隨著第三代基因組技術(shù)的進(jìn)步,基因組測序成本大大降低,速度加快,基因組組裝難度下降,組裝水平提升,獲得基因組精細(xì)圖譜已經(jīng)成為新的技術(shù)標(biāo)準(zhǔn)。越來越多的熱帶農(nóng)業(yè)物種基因組圖譜將被公布,為熱帶作物的遺傳多樣性評價、基因挖掘和精準(zhǔn)育種提供了全新的基礎(chǔ)?;蚪M數(shù)據(jù)與其它多組學(xué)數(shù)據(jù)的整合,在熱帶作物中尚很少報道。目前基因組測序工作大都依賴為數(shù)不多的生物技術(shù)公司,研究機(jī)構(gòu)對于基因組學(xué)技術(shù)的認(rèn)知程度有限,從業(yè)人數(shù)較少,在基因組研究方案設(shè)計、材料選擇及所能夠解決的科學(xué)問題認(rèn)知方面均存在較多問題,特別是對于基因組學(xué)的地位和價值認(rèn)識不足,短視行為普遍,往往片面追求論文,而忽視數(shù)據(jù)價值。

      基因組學(xué)新技術(shù)的發(fā)展,允許一個基礎(chǔ)研究落后的物種,直接完成染色體級別的精細(xì)參考基因組,同時借助重測序和簡化重測序技術(shù),解析其核心種群的遺傳多樣性、物種起源與演化、關(guān)鍵經(jīng)濟(jì)農(nóng)藝性狀的遺傳結(jié)構(gòu),開展原創(chuàng)性研究。從熱帶作物育種研究的頂層設(shè)計,組織相關(guān)研究計劃對于從根本上改變其遺傳改良的技術(shù)水平,提升育種效率,可以起到事半功倍的效應(yīng)。

      3.2.2? 熱帶作物基因組數(shù)據(jù)庫建設(shè)? 基因組測序的真正價值不是一篇文章,而是大數(shù)據(jù)庫。美國生物技術(shù)中心(NCBI Genbank數(shù)據(jù)庫)成為全球農(nóng)業(yè)與生物學(xué)研究者無可替代的信息源,此外歐洲生物技術(shù)研究所數(shù)據(jù)庫,日本生物技術(shù)數(shù)據(jù)庫,美國能源部的基因組數(shù)據(jù)庫等確立了在全球?qū)W術(shù)領(lǐng)域的地位。所有一流期刊發(fā)表文章均要求提供原始數(shù)據(jù)到三大數(shù)據(jù)庫。我國北京基因組研究所,華大基因及相關(guān)大學(xué)也建立了不同程度的基因組數(shù)據(jù)庫,但與基因組學(xué)技術(shù)發(fā)展相匹配的更加專業(yè)化數(shù)據(jù)庫仍然欠缺。上述數(shù)據(jù)庫更多為基礎(chǔ)數(shù)據(jù)庫,承擔(dān)數(shù)據(jù)淀積、基因序列檢索、文獻(xiàn)查詢等功能。而針對物種從基因組完全序列,到轉(zhuǎn)錄組、蛋白組、代謝組到性狀的全景信息,及整合育種需求的指導(dǎo)性方案,鮮有報道。在熱帶作物領(lǐng)域,重要國際研究機(jī)構(gòu)、相關(guān)大學(xué)擁有分散的、相對簡單的數(shù)據(jù)庫,如康內(nèi)爾大學(xué)建立的木薯育種數(shù)據(jù)庫(Cassavabase. org)[81]。中國熱帶農(nóng)業(yè)科學(xué)院建立了木薯的基因組數(shù)據(jù)庫(Cassava-genome. cn),并通過國家重點研發(fā)計劃項目與北京基因組研究所合作建立熱帶作物的整合基因組數(shù)據(jù)庫。建立一個熱帶作物的專業(yè)數(shù)據(jù)庫和分子育種服務(wù)平臺極為重要,其必要性在于:(1)基因組數(shù)據(jù)是極為重要的資源和知識產(chǎn)權(quán),需要搜集和整合針對重要熱帶經(jīng)濟(jì)作物的基因組和多組學(xué)數(shù)據(jù),并不斷豐富完善,提供更加有價值的服務(wù);(2)大數(shù)據(jù)的服務(wù)功能,隨著數(shù)據(jù)庫的進(jìn)一步完善,現(xiàn)代基礎(chǔ)生物學(xué)研究和遺傳改良將更加依賴數(shù)據(jù)庫,成為必不可少的工具;(3)基因組數(shù)據(jù)庫是新型科學(xué)形式,機(jī)器學(xué)習(xí)和系統(tǒng)化將讓數(shù)據(jù)庫自我完善,具有智能特征,衍生多元化功能。

      3.2.3? 熱帶作物基因組研究中存在的問題? 盡管高通量、低成本的基因組測序技術(shù)已經(jīng)為全面解析物種遺傳特性和遺傳育種提供了全新的工具,但是新技術(shù)應(yīng)用的廣泛性和效率仍然存在許多不確定因素。主要包括:(1)研究者特別是應(yīng)用研究專家對基因組技術(shù)的認(rèn)知度不夠。由于技術(shù)更新很快,且高通量測序技術(shù)依賴于生物信息學(xué)專家的大數(shù)據(jù)處理,海量數(shù)據(jù)與常規(guī)研究方法的契合點常常不能夠被有效認(rèn)知;(2)新技術(shù)的規(guī)?;瘧?yīng)用還未達(dá)到成熟的階段,數(shù)據(jù)迅速積累,理論需要不斷完善。針對大多數(shù)經(jīng)濟(jì)物種,在群體水平精準(zhǔn)解析性狀遺傳位點需要花費大量的人力和物力,特別是表型性狀易受到環(huán)境因素影響,需要在多個環(huán)境下或者不同群體中加以驗證。因此基因組選擇育種還沒有在多數(shù)物種中應(yīng)用;(3)大群體重測序和表型數(shù)據(jù)獲取的成本仍然較高。盡管相關(guān)測定與數(shù)據(jù)分析的成本已經(jīng)大幅度下降,但是若要完成數(shù)百份種質(zhì)的群體重測序和所有育種表型性狀,從單個實驗室來看,確實難以承受,但是國家針對物種的研究計劃若能夠從源頭系統(tǒng)進(jìn)行,則成本就在可控范圍;(4)缺乏高效、完整的數(shù)據(jù)庫服務(wù)系統(tǒng)?;蚪M及多組學(xué)數(shù)據(jù)除了那些典型的性狀關(guān)聯(lián)區(qū)域外,其全基因組變異特征及其與多種表型特征的對應(yīng)關(guān)系需要信賴生物信息學(xué)專家的數(shù)據(jù)處理與圖形化等一系列的數(shù)據(jù)管理工作?,F(xiàn)有全球性基因組數(shù)據(jù)庫一般均比較綜合,尚未達(dá)到針對物種的全景式數(shù)據(jù)服務(wù)水平。因此,針對特定作物的基因組數(shù)據(jù)庫是未來作物育種的必然條件。

      4? 基因組學(xué)技術(shù)的應(yīng)用前景

      4.1? 結(jié)構(gòu)基因組學(xué)將成為傳統(tǒng)線性遺傳學(xué)的終結(jié),走向三維空間遺傳學(xué)

      物種全基因組精細(xì)圖譜構(gòu)建,不僅可以闡明控制物種性狀的基因位點在全套染色體上的分布,構(gòu)建染色體DNA序列圖譜,而且能夠提供物種群體在染色體上所有位點堿基序列的變異譜;同時,注釋在不同生育環(huán)境下基因位點甲基化、泛素化和磷酸化等修飾導(dǎo)致基因“閉合”與開放表達(dá)的信息。然而,真核生物的細(xì)胞核是一個復(fù)雜的三維環(huán)境,基因組的功能不僅依賴于調(diào)控序列元件的線性排列,還依賴于它們的空間組織來有效控制基因表達(dá)。轉(zhuǎn)錄調(diào)控部分是通過調(diào)控元件和基因啟動子的空間鄰近發(fā)生的,這些相互作用對于真核生物的機(jī)體發(fā)育和對環(huán)境刺激的反應(yīng)至關(guān)重要。全基因組染色質(zhì)接觸圖為基因組的三維組織與基因表達(dá)之間的關(guān)系提供了重要的見解[82]。出于對生物細(xì)胞核整體染色體組織的興趣,科學(xué)家提出3D基因組的觀點,借助物理學(xué)技術(shù),審查沿染色體和染色體之間的通信[83]。相關(guān)研究開始受到重視,并在轉(zhuǎn)錄因子蛋白與DNA結(jié)合算法等方面取得了可喜的進(jìn)展[84]。

      4.2? 多組學(xué)數(shù)據(jù)整合構(gòu)建生物物種遺傳調(diào)控的信號網(wǎng)絡(luò)

      植物生長、發(fā)育、繁殖和適應(yīng),反應(yīng)到分子層面是一個極為復(fù)雜的網(wǎng)絡(luò)系統(tǒng)。如果說傳統(tǒng)遺傳學(xué)只是在挖掘單個的遺傳調(diào)控點,迄今的結(jié)構(gòu)基因組成果構(gòu)建了一個線性的多基因結(jié)構(gòu),而多組學(xué)可能提供不同的平面遺傳結(jié)構(gòu)。如何建立復(fù)雜遺傳系統(tǒng)中多基因的互作關(guān)系?實驗生物學(xué)經(jīng)過漫長的積累,根據(jù)生物產(chǎn)物化學(xué)結(jié)構(gòu)的邏輯關(guān)系建立主要生物學(xué)過程如光合作用、呼吸作用、免疫應(yīng)答等的代謝通路。借助人工誘導(dǎo)和遺傳轉(zhuǎn)化突變體庫及蛋白互作等正向遺傳學(xué)分析,發(fā)現(xiàn)許多代謝途徑的調(diào)控相關(guān)蛋白基因,初步形成單個過程與相關(guān)環(huán)境信號因子、內(nèi)源激素基因的互作網(wǎng)絡(luò),但是這些網(wǎng)絡(luò)還遠(yuǎn)不夠完善。多組學(xué)數(shù)據(jù)可以大大加快多基因互作網(wǎng)絡(luò)的構(gòu)建。轉(zhuǎn)錄組學(xué)數(shù)據(jù)真實反應(yīng)物種在特定環(huán)境和生育時期哪些基因表達(dá)和不表達(dá),以及控制生物過程的大量基因之間是如何協(xié)同表達(dá)。共同表達(dá)網(wǎng)絡(luò)(gene co-expression network,GCN)分析是解釋大型轉(zhuǎn)錄數(shù)據(jù)集的最強大的方法之一,它能夠映射功能相關(guān)基因的共同表達(dá)基因模塊的特性。一個針對擬南芥和玉米葉片發(fā)育的全轉(zhuǎn)錄組比較分析,在近1000個同源基因群中鑒定出19個轉(zhuǎn)錄因子家族,提供了雙子葉和單子葉植物間葉片發(fā)育的共性功能基因網(wǎng)絡(luò)[85]?;蚬脖磉_(dá)網(wǎng)絡(luò)(GCN)分析被廣泛應(yīng)用于生物醫(yī)學(xué)鑒定特定疾病的特異性生物標(biāo)志物。針對前列腺癌的單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù),采用加權(quán)相關(guān)網(wǎng)絡(luò)分析(WGCNA)鑒定出29個基因模塊,結(jié)合雄性激素受體(AR)基因篩選發(fā)現(xiàn)兩個新基因具有AR結(jié)合位點,并用雄激素治療試驗證明其可以作為前列腺癌的早期靶標(biāo),具有重要的醫(yī)學(xué)價值[86]。

      蛋白質(zhì)、代謝組學(xué)數(shù)據(jù)的積累,同樣可為生物學(xué)過程中多基因關(guān)系提供豐富的互作信息[87]。蛋白質(zhì)-蛋白質(zhì)相互作用網(wǎng)絡(luò)(PIN)是系統(tǒng)研究細(xì)胞內(nèi)復(fù)雜生物活性的有用工具。隨著測序、晶體學(xué)、光譜分析和雙雜交篩選等領(lǐng)域的發(fā)展,包括病毒、細(xì)菌、植物、動物和人類,大量的蛋白質(zhì)-蛋白質(zhì)相互作用(PPIs)被發(fā)現(xiàn)?;谛蛄泻突诮Y(jié)構(gòu)的PPI預(yù)測工具發(fā)揮重要的作用,而真實豐富的數(shù)據(jù)庫資源是基礎(chǔ)[88]。

      建立在實驗生物學(xué)基礎(chǔ)上的植物環(huán)境信號感知以及多基因調(diào)控的信號網(wǎng)絡(luò)是了解生命過程的前沿。植物對環(huán)境信號反應(yīng)的最新研究表明,非生物脅迫作用于單個葉片時,植物會產(chǎn)生一種全面的應(yīng)激特異性系統(tǒng)反應(yīng),包括許多不同的應(yīng)激特異性轉(zhuǎn)錄產(chǎn)物和代謝物的積累,且植物可以整合不同的局部和系統(tǒng)組合信號高效地適應(yīng)環(huán)境[89]。根毛發(fā)育相關(guān)基因調(diào)節(jié)網(wǎng)絡(luò)描述了控制細(xì)胞命運和(或)根毛細(xì)胞生長的關(guān)鍵轉(zhuǎn)錄調(diào)節(jié)因子[90]。同時,非編碼小分子RNA在過程調(diào)節(jié)中的作用也會耦合其間。這樣從基因組、轉(zhuǎn)錄組、蛋白質(zhì)組及表觀組,就構(gòu)建了生命過程的立體結(jié)構(gòu),闡釋了物種特異性及其過程的復(fù)雜性,在組學(xué)水平建立物種的遺傳調(diào)控網(wǎng)絡(luò),這些均需要體現(xiàn)在專門的基因組數(shù)據(jù)庫中,為生物基礎(chǔ)研究及應(yīng)用服務(wù)。

      4.3? 基因組學(xué)技術(shù)與實驗生物學(xué)的結(jié)合驅(qū)動生物功能模塊解析

      實驗生物學(xué)在建立基因的精確功能及生物遺傳修飾走向應(yīng)用等方面具有不可替代性。基因組學(xué)的發(fā)展不僅加速了功能基因的發(fā)現(xiàn),而且可以規(guī)模化建立基因之間的互作關(guān)系,結(jié)合多組學(xué)及其整合技術(shù)為生物功能研究提供愈益直接而強有力的支持?;蚪M學(xué)除了解析物種精細(xì)遺傳結(jié)構(gòu)外,在功能基因挖掘方面也有顯著的進(jìn)展。在大量物種基因組注釋信息不斷積累基礎(chǔ)上,人們開發(fā)了專門富集DNA結(jié)合蛋白、轉(zhuǎn)錄因子等調(diào)節(jié)蛋白的實驗流程,并采用深度學(xué)習(xí)方法建?;蚪M調(diào)控景觀中的復(fù)雜依賴關(guān)系,并為遺傳變異的調(diào)用和解釋提供預(yù)測因子[91]。深度學(xué)習(xí)主要應(yīng)用是在功能基因組學(xué)中預(yù)測DNA和RNA結(jié)合蛋白以及增強子和順式調(diào)控蛋白的序列特異性區(qū)域,甲基化狀態(tài)和剪接的控制。人類基因組中已經(jīng)可以通過高通量功能分析鑒定功能性遺傳變異和預(yù)測性狀(如有害變異和疾病)[92]。由于實驗生物學(xué)研究受到材料、單基因突變、環(huán)境均一性等諸多限制因素,實證基因功能及其互作關(guān)系進(jìn)展緩慢;事實上,植物整合廣泛的細(xì)胞、發(fā)育和環(huán)境信號來調(diào)節(jié)復(fù)雜的基因表達(dá)模式,進(jìn)而形成多樣化的蛋白體和代謝產(chǎn)物,因而在特定實驗設(shè)計下,基因表達(dá)譜、蛋白譜集合代謝產(chǎn)物變異譜,就可以用于對基因間調(diào)控相互作用網(wǎng)絡(luò)進(jìn)行推斷,這些基因調(diào)控網(wǎng)絡(luò)用于可視化調(diào)控因子與其下游靶基因之間的因果調(diào)控關(guān)系,而對于相關(guān)結(jié)果的實驗驗證是必不可少的[93]。生物定向遺傳改良是傳統(tǒng)育種家的夢想,而不斷改進(jìn)的基因組編輯系統(tǒng)提供了一種以精確和可預(yù)測的方式快速修改基因組的方法,使直接改進(jìn)優(yōu)良品種成為可能[94]。

      4.4? 精準(zhǔn)育種,群體結(jié)構(gòu)單倍型分析建立設(shè)計育種及全基因組選擇育種基礎(chǔ)

      建立在物種精細(xì)參考基因組及種質(zhì)資源群體大規(guī)模重測序基因型分析基礎(chǔ)上,作物遺傳改良即將進(jìn)入精準(zhǔn)設(shè)計和快速選擇的時代[95]。而基因組編輯技術(shù)(genome editing)將為單個基因或者寡基因控制性狀改良提供精確的手術(shù)刀[96]。無論作物類型、染色體遺傳結(jié)構(gòu)和雜合程度,擁有多樣化的遺傳資源始終為遺傳改良的第一步。綜合傳統(tǒng)遺傳學(xué)、現(xiàn)代分子遺傳和表觀遺傳學(xué)的知識,所有育種目標(biāo)性狀的調(diào)控基因均存在于物種遺傳群體,而且大多數(shù)性狀會受到系列多基因調(diào)控,作物在生長周期的不同階段均對環(huán)境因子做出響應(yīng),并通過復(fù)雜的內(nèi)源激素直接或間接作用于多個生物學(xué)過程,形成產(chǎn)量、品質(zhì)和抗逆的表型。過去對于生物基因型的檢測有如大海撈針掛一漏萬,所以育種家依賴直覺和抓主要矛盾培育新品種,而今,基因型分析技術(shù)已經(jīng)可以達(dá)到無遺漏的監(jiān)測,只是我們對于生物基因功能的認(rèn)知尚沒有達(dá)到完全的水平,一般物種中尚有約20%~30%的注釋基因功能未知,需要整體的知識積累;而表型分析成為育種瓶頸,這就是為什么代謝組學(xué)和表型組學(xué)會成為生物育種的熱點技術(shù)。借助于物理學(xué)和材料科學(xué)的進(jìn)步,基因組和育種學(xué)者希望通過過程解析將育種目標(biāo)性狀進(jìn)行分解,獲取更有價值的中間性狀基因調(diào)控基因,支持最終產(chǎn)量、品質(zhì)和抗逆表型。這里對如何通過群體的重測序和多年多點表型分析、結(jié)合控制環(huán)境下的表型解析,構(gòu)建針對特定物種的育種指標(biāo)體系,進(jìn)而篩選親本群、多重雜交、標(biāo)記選擇、品系鑒定再結(jié)合基因組編輯實現(xiàn)精準(zhǔn)育種繪制一個策略圖(圖2),為基因組和育種專家提供參考。

      參考文獻(xiàn)

      詹姆森, 魏? 瑪, 維斯特霍夫. 系統(tǒng)生物學(xué)方法(導(dǎo)讀版)[M]. 1版. 北京: 科學(xué)出版社, 2013.

      Bolger M E, Weisshaar B, Scholz U, et al. Plant genome sequencing - applications for crop improvement[J]. Current Opinion in Biotechnology, 2014, 26: 31-37.

      Sedlazeck F J, Rescheneder P, Smolka M, et al. Accurate detection of complex structural variations using single- molecule sequencing[J]. Nature Methods, 2018, 15(6): 461-468.

      Bocklandt S, Hastie A, Cao H. Bionano genome mapping: High-throughput, ultra-long molecule genome analysis system for precision genome assembly and haploid-resolved structural variation discovery[J]. Advances in Experimental Medicine and Biology, 2019(1129): 97-118.

      Castey T M, Khan J M, Bringans S D, et al. Analysis of reproducibility of proteome coverage and quantitation using isobaric mass tags (iTRAQ and TMT)[J]. Journal of Proteome Research, 2017, 16(2): 384-392.

      Elshire R J, Glaubitz J C, Sun Q, et al. A robust, simple genotyping-by-sequencing (GBS) approach for high diversity species[J]. PLoS One, 2011, 6(5): e19379.

      Xia Z Q, Zou M L, Zhang S K, et al. AFSM sequencing approach: a simple and rapid method for genome-wide SNP and methylation site discovery and genetic mapping[J]. Scientific Reports, 2014(4): 7300.

      Iqbal N, Liu X, Yang T, et al. Genomic variants identified from whole-genome resequencing of indicine cattle breeds from Pakistan[J]. PLoS One, 2019, 14(4): e0215065.

      Bentley D R. Whole-genome re-sequencing[J]. Current Opinion in Genetics & Development, 2006, 16(6): 545-552.

      Sònia Casillas, Antonio Barbadilla. Molecular population genetics[J]. Genetics, 2017, 205(3): 1003-1035.

      Li Y, Cao K, Zhu G, et al. Genomic analyses of an extensive collection of wild and cultivated accessions provide new insights into peach breeding history[J]. Genome Biology, 2019, 20: 36.

      Nguyen K L, Grondin A, Courtois B, et al. Next-generation sequencing accelerates crop gene discovery[J]. Trends in Plant Science, 2019, 24(3): 263-274.

      Visscher P M, Wray N R, Zhang Q, et al. 10 years of GWAS discovery: Biology, function and translation[J]. American Journal of Human Genetics, 2017, 101(1): 5-22.

      Remington D L, Ungerer M C, Purugganan M D. Map-based cloning of quantitative trait loci: progress and prospects[J]. Genetical Research, 2001, 78(3): 213-218.

      Zhou Z, Jiang Y, Wang Z, et al. Resequencing 302 wild and cultivated accessions identifies genes related to domestication and improvement in soybean[J]. Nature Biotechnology, 2015, 4(33): 408-414.

      Fang L, Wang Q, Hu Y, et al. Genomic analyses in cotton identify signatures of selection and loci associated with fiber quality and yield traits[J]. Nature Genetics, 2017, 49(7): 1089-1098.

      Varshney R K, Saxena R K, Upadhyaya H D, et al. Whole- genome resequencing of 292 pigeonpea accessions identifies genomic regions associated with domestication and agronomic traits[J]. Nature Genetics, 2017, 49(7): 1082-1088.

      Li X, Yang J, Shen M, et al. Whole-genome resequencing of wild and domestic sheep identifies genes associated with morphological and agronomic traits[J]. Nature Communications , 2020, 11(1): 2815.

      Voss-Fels K, Snowdon R J. Understanding and utilizing crop genome diversity via high-resolution genotyping[J]. Plant Biotechnology Journal, 2016, 14(4): 1086-1094.

      Guirao-Rico S, González J. Evolutionary insights from large scale resequencing datasets in Drosophila melanogaster[J]. Current Opinion in Insect Science, 2019, 31: 70-76.

      Silva-Junior, Orzenil B, Grattapaglia D. Genome-wide patterns of recombination, linkage disequilibrium and nucleotide diversity from pooled resequencing and single nucleotide polymorphism genotyping unlock the evolutionary history of Eucalyptus grandis[J]. New Phytologist, 2015, 208(3): 830-845.

      Qin C, Yu C, Shen Y, et al. Whole-genome sequencing of cultivated and wild peppers provides insights into Capsicum domestication and specialization[J]. Proceedings of the National Academy of Sciences of the United States of America, 2014, 111(14): 5135-5140.

      Yu Y, Fu J, Xu Y, et al. Genome re-sequencing reveals the evolutionary history of peach fruit edibility[J]. Nature Communications, 2018, 9: 5404.

      Varshney R K, Thudi M, Roorkiwal M, et al. Resequencing of 429 chickpea accessions from 45 countries provides insights into genome diversity, domestication and agronomic traits[J]. Nature Genetics, 2019, 51(5): 857-864.

      Guo S, Zhao S, Sun H, et al. Resequencing of 414 cultivated and wild watermelon accessions identifies selection for fruit quality traits[J]. Nature Genetics, 2019, 51(11): 1616-1623.

      Qiu Q, Wang L, Wang K, et al. Yak whole-genome resequencing reveals domestication signatures and prehistoric population expansions[J]. Nature Communications, 2015(6): 10283.

      Yang Z, Ge X, Yang Z, et al. Extensive intraspecific gene order and gene structural variations in upland cotton cultivars[J]. Nature Communications, 2019(10): 2989.

      The computational pan-genomics consortium. Computational pan-genomics: Status, promises and challenges[J]. Briefings in Bioinformatics, 2018, 19(1): 118-135.

      Liu Y, Du H, Li P, et al. Pan-genome of wild and cultivated soybeans[J]. Cell, 2020, 182(1): 162-176.

      Song J M, Guan Z, Hu J, et al. Eight high-quality genomes reveal pan-genome architecture and ecotype differentiation of Brassica napus[J]. Nature Plants, 2020, 6(1): 34-45.

      Chaisson M J P, Huddleston J, Dennis M Y, et al. Resolving the complexity of the human genome using single-molecule sequencing[J]. Nature, 2015, 517: 608-611.

      Schneider G F, Dekker C. DNA sequencing with nanopores[J]. Nature Biotechnology, 2012, 30(4): 326-328.

      Snyder M W, Adey A, Kitzman J O, et al. Haplotype- resolved genome sequencing: experimental methods and app lications[J]. Nature Reviews Genetics, 2015, 16(6): 344-358.

      Stein L D, Knoppers B M, Campbell P, et al. Data analysis: Create a cloud commons[J]. Nature, 2015, 523(7559): 149- 151.

      Stark R, Grzelak M, Hadfield J. RNA sequencing: the teenage years[J]. Nature Reviews, Genetics, 2019, 20(11): 631-656.

      Wang J, Yu H, Weng X, et al. An expression quantitative trait loci-guided co-expression analysis for constructing regulatory network using a rice recombinant inbred line population[J]. Journal of Experimental Botany, 2014, 65(4): 1069-1079.

      Huang Y F, Vialet S, Guiraud J L, et al. A negative MYB regulator of proanthocyanidin accumulation, identified through expression quantitative locus mapping in the grape berry[J]. The New Phytologist, 2014, 201(3): 795-809.

      Westra H J, Peters M J, Esko T, et al. Systematic identification of trans eQTLs as putative drivers of known disease associations[J]. Nature Genetics, 2013, 45(10): 1238-1243.

      SEQC/MAQC-III Consortium. A comprehensive assessment of RNA-seq accuracy, reproducibility and information content by the sequencing quality control consortium[J]. Nature Biotechnology, 2014, 32(9): 903-914.

      Chen H, Ye F, Guo G. Revolutionizing immunology with single-cell RNA sequencing[J]. Cell & Molecular Immunology, 2019, 16(3): 242-249.

      Rodriguez-Villalon A, Brady S M. Single cell RNA sequencing and its promise in reconstructing plant vascular cell lineages[J]. Current Opinion in Plant Biology, 2019, 48: 47-56.

      Muller B, Martre P. Plant and crop simulation models: Powerful tools to link physiology, genetics, and phenomics[J]. Journal of Experimental Botany, 2019, 70(9): 2339-2344.

      Kuchen E E, Fox S, de Reuille P B, et al. Generation of leaf shape through early patterns of growth and tissue polarity[J]. Science, 2012, 335: 1092-1096.

      Rebetzke G J, Jimenez-Berni J A, Bovill W D, et al. High-throughput phenotyping technologies allow accurate selection of stay-green[J]. Journal of Experimental Botany, 2016, 67: 4919-4924.

      Virlet N, Sabermanesh K, Sadeghi-Tehran P, et al. Field scanalyzer: An automated robotic field phenotyping platform for detailed crop monitoring[J]. Funct Plant Biol, 2016, 44: 143-153.

      Liebisch F, Kirchgessner N, Schneider D, et al. Remote, aerial phenotyping of maize traits with a mobile multi-sensor approach[J]. Plant Methods, 2015, 11: 9.

      Rist F, Herzog K, Mack J, et al. High-precision phenotyping of grape bunch architecture using fast 3D sensor and automation[J]. Sensors (Basel), 2018, 18(3): 763.

      Gennaro S F D, Rizza F, Badeck F W, et al. UAV-based high-throughput phenotyping to discriminate barley vigour with visible and near-infrared vegetation indices[J]. Int J Remote Sens, 2018, 39: 5330-5344.

      Jeudy C, Adrian M, Baussard C, et al. Rhizotubes as a new tool for high throughput imaging of plant root development and architecture: test, comparison with pot grown plants and validation[J]. Plant Methods, 2016, 12: 31.

      Tardieu F, Cabrera-Bosquet L, Pridmore T, et al. Plant phenomics, from sensors to knowledge[J]. Current Biology, 2017, 27(15): R770-R783.

      Wang W, Feng B, Xiao J, et al. Cassava genome from a wild ancestor to cultivated varieties[J]. Nature Communications, 2014(5): 5110.

      Zhang J, Zhang X, Tang H, et al. Allele-defined genome of the autopolyploid sugarcane Saccharum spontaneum L.[J]. Nature Genetics, 2018, 50(11): 1565-1573.

      Ming R, Hou S, Feng Y, et al. The draft genome of the transgenic tropical fruit tree papaya (Carica papaya Linnaeus)[J]. Nature, 2008, 452(7190): 991-996.

      Motamayor J C, Mockaitis K, Schmutz J, et al. The genome sequence of the most widely cultivated cacao type and its use to identify candidate genes regulating pod color[J]. Genome Biology, 2013, 14(6): r53.

      Bredeson J V, Lyons J B, Prochnik S E, et al. Sequencing wild and cultivated cassava and related species reveals extensive interspecific hybridization and genetic diversity[J]. Nature Biotechnology, 2016, 34(5): 562-570.

      Wu G A, Prochnik S, Jenkins J, et al. Sequencing of diverse mandarin, pummelo and orange genomes reveals complex history of admixture during citrus domestication[J]. Nature Biotechnology, 2014, 32(7): 656-662.

      Xu Q, Chen L L, Ruan X, et al. The draft genome of sweet orange (Citrus sinensis)[J]. Nature Genetics, 2013, 45(1): 59-66.

      Denoeud F, Carretero-Paulet L, Dereeper A, et al. The coffee genome provides insight into the convergent evolution of caffeine biosynthesis[J]. Science, 2014, 345(6201): 1181- 1184.

      Myburg A A, Grattapaglia D, Tuskan G A, et al. The genome of Eucalyptus grandis[J]. Nature, 2014, 510(7505): 356-362.

      Jain M, Misra G, Patel R K, et al. A draft genome sequence of the pulse crop chickpea (Cicer arietinum L.)[J]. The Plant Journal, 2013, 74(5): 715-729.

      Wu P, Zhou C, Cheng S, et al. Integrated genome sequence and linkage map of physic nut (Jatropha curcas L.), a biodiesel plant[J]. The Plant Journal, 2015, 81(5): 810-821.

      Ha J, Shim S, Lee T, et al. Genome sequence of Jatropha curcas L., a non-edible biodiesel plant, provides a resource to improve seed-related traits[J]. Plant Biotechnology Journal, 2019, 17(2): 517-530.

      Kim S, Park M, Yeom S I, et al. Genome sequence of the hot pepper provides insights into the evolution of pungency in Capsicum species[J]. Nature Genetcs, 2014, 46(3): 270-278.

      Hu L, Xu Z, Wang M, et al. The chromosome-scale reference genome of black pepper provides insight into piperine biosynthesis[J]. Nature Communications, 2019, 10(1): 4702.

      Lin Y, Min J, Lai R, et al. Genome-wide sequencing of longan (Dimocarpus longan Lour.) provides insights into molecular basis of its polyphenol-rich characteristics[J]. GigaScience, 2017, 6(5): 1-14.

      Rahman A Y, Usharraj A O, Misra B B, et al. Draft genome sequence of the rubber tree Hevea brasiliensis[J]. BMC Genomics, 2013, 14: 75.

      Tang C, Yang M, Fang Y, et al. The rubber tree genome reveals new insights into rubber production and species adaptation[J]. Nature Plants, 2016, 2(6): 16073.

      D Hont A, Denoeud F, Aury J M, et al. The banana (Musa acuminata) genome and the evolution of monocotyledonous plants[J]. Nature, 2012, 488(7410): 213-217.

      Wang Z, Miao H X, Liu J H, et al. Musa balbisiana genome reveals subgenome evolution and functional divergence[J]. Nature Plants, 2019, 5(8): 810-821.

      Wang P, Luo Y, Huang J, et al. The genome evolution and domestication of tropical fruit mango[J]. Genome Biology, 2020, 21(1): 60

      Singh R, Ong-Abdullah M, Low E T, et al. Oil palm genome sequence reveals divergence of interfertile species in old and New worlds[J]. Nature, 2013, 500(7462): 335-339.

      Xiao Y, Xu P, Fan H, et al. The genome draft of coconut (Cocos nucifera)[J]. GigaScience, 2017, 6(11): 1-11.

      Ming R, VanBuren R, Wai C M, et al. The pineapple genome and the evolution of CAM photosynthesis[J]. Nature Genetics, 2015, 47(12): 1435-1442.

      Chen L Y, VanBuren R, Pairs M, et al. The bracteatus pineapple genome and domestication of clonally propagated crops[J]. Nature Genetics, 2019, 51(10): 1549-1558.

      Garsmeur O, Droc G, Antonise R, et al. A mosaic monoploid reference sequence for the highly complex genome of sugarcane[J]. Nature Communications, 2018(9): 2638.

      Rendón-Anaya M, Ibarra-Laclette E, Méndez-Bravo A, et al. The avocado genome informs deep angiosperm phylogeny, highlights introgressive hybridization, and reveals pathogen- influenced gene space adaptation[J]. Proceedings of the National Academy of Sciences of the United States of America, 2019, 116(34): 17 081-17 089.

      Tian Y, Zeng Y, Zhang J, et al. High quality reference genome of drumstick tree (Moringa oleifera Lam.), a potential perennial crop[J]. Science China, Life Sciences, 2015, 58(7): 627-638.

      Yan L, Wang X, Liu H, et al. The genome of Dendrobium officinale illuminates the biology of the important traditional Chinese Orchid Herb[J]. Molecular Plant, 2015, 8(6): 922-934.

      Varshney R K, Shi C, Thudi M, et al. Pearl millet genome sequence provides a resource to improve agronomic traits in arid environments[J]. Nature Biotechnology, 2017, 35(10): 969-976.

      Zhang S, Xia Z, Zhang W, et al. Chromosome-scale genome assembly provides insights into speciation of allotetraploid and massive biomass accumulation of elephant grass (Pennisetum purpureum Schum.)[J]. BioRxiv Online, 2020, doi: https://doi.org/10.1101/2020.02.28.970749.

      Tecle I Y, Edwards J D, Menda N, et al. solGS: a web-based tool for genomic selection[J]. BMC Bioinformatics, 2014, 15(1): 398.

      Rowley M J, Corces V G. The three-dimensional genome: Principles and roles of long-distance interactions[J]. Current Opinion in Cell Biology, 2016, 40: 8-14.

      Dekker J, Mirny L. The 3D genome as moderator of chromosomal communication[J]. Cell, 2016, 164(6): 1110- 1121.

      Xu H, Zhang S, Yi X, et al. Exploring 3D chromatin contacts in gene regulation: The evolution of approaches for the identification of functional enhancer-promoter interaction[J]. Computational and Structural Biotechnology Journal, 2020, 18: 558-570.

      Vercruysse J, Van Bel M, Osuna-Cruz C M, et al. Comparative transcriptomics enables the identification of functional orthologous genes involved in early leaf growth[J]. Plant Biotechnology Journal, 2020, 18(2): 553-567.

      Chen X, Hu L, Wang Y, et al. Single cell gene co-expression network reveals fech/crot signature as a prognostic marker[J]. Cells, 2019, 8(7): 698.

      Yilmaz L S, Walhout A J. Metabolic network modeling with model organisms[J]. Current Opinion in Chemical Biology, 2017, 36: 32-39.

      Gemovic B, Sumonja N, Davidovic R, et al. Mapping of protein-protein interactions: Web-based resources for revea ling interactomes[J]. Current Medicinal Chemistry, 2019, 26(21): 3890-3910.

      Zandalinas S I, Fichman Y, Devireddy A R, et al. Systemic signaling during abiotic stress combination in plants[J]. Proceedings of the National Academy of Sciences of the United States of America, 2020, 117(24): 13 810-13 820.

      Shibata M, Sugimoto K. A gene regulatory network for root hair development[J]. Journal of Plant Research, 2019, 132(3): 301-309.

      Telenti A, Lippert C, Chang P C, et al. Deep learning of genomic variation and regulatory network data[J]. Human Molecular Genetics, 2018, 27(R1): R63-R71.

      Zou J, Huss M, Abid A, et al. A primer on deep learning in genomics[J]. Nature Genetics, 2019, 51(1): 12-18.

      Haque S, Ahmad J S, Clark N M, et al. Computational prediction of gene regulatory networks in plant growth and development[J]. Current Opinion in Plant Biology, 2019, 47: 96-105.

      Hua K, Zhang J, Botella J R, et al. Perspectives on the application of genome-editing technologies in crop breeding[J]. Molecular Plant, 2019, 12(8): 1047-1059.

      Varshney R K, Pandey M K, Bohra A, et al. Toward the sequence-based breeding in legumes in the post-genome sequencing era[J]. Theoretical and Applied Genetics, 2019, 132(3): 797-816.

      Chen K, Wang Y, Zhang R, et al. CRISPR/Cas genome editing and precision plant breeding in agriculture[J]. Annual Review of Plant Biology, 2019, 70: 667-697.

      猜你喜歡
      進(jìn)化基因組學(xué)遺傳多樣性
      基于基因組學(xué)數(shù)據(jù)分析構(gòu)建腎上腺皮質(zhì)癌預(yù)后模型
      系統(tǒng)基因組學(xué)解碼反芻動物的演化
      科學(xué)(2020年2期)2020-08-24 07:56:44
      茄子種質(zhì)資源農(nóng)藝性狀遺傳多樣性分析
      淺析田間水稻紋枯病抗性鑒定體系的確立與完善
      西藏野核桃的表型特征及其保育措施
      紀(jì)錄片理論進(jìn)化的黃金時代
      出版廣角(2016年14期)2016-12-13 02:16:10
      進(jìn)化倫理學(xué)與道德規(guī)范性
      道德與文明(2016年5期)2016-12-07 00:53:48
      水稻紋枯病抗性鑒定體系的確立與遺傳多樣性研究
      營養(yǎng)基因組學(xué)——我們可以吃得更健康
      從中西醫(yī)學(xué)的異同探討中醫(yī)證候基因組學(xué)
      年辖:市辖区| 十堰市| 溧水县| 抚顺市| 饶河县| 德钦县| 泾源县| 封丘县| 抚松县| 新龙县| 依安县| 康乐县| 顺昌县| 柳州市| 凤翔县| 齐齐哈尔市| 盐山县| 金坛市| 简阳市| 肥西县| 东台市| 安丘市| 三原县| 米泉市| 长海县| 井冈山市| 柳河县| 桃源县| 屏山县| 杭州市| 利辛县| 博罗县| 乐山市| 龙口市| 台南市| 宜昌市| 正镶白旗| 永清县| 泸西县| 新郑市| 夏津县|