潘佳穎
(東北農(nóng)業(yè)大學,黑龍江 哈爾濱 150030)
植物育種核心物質(zhì)基礎是控制農(nóng)藝性狀遺傳變異,如何從廣泛種質(zhì)資源中利用優(yōu)異遺傳變異是植物育種研究的重要課題?,F(xiàn)代基因組學技術(shù)發(fā)展是植物功能基因組學研究的核心動力,高質(zhì)量參考基因組為遺傳變異發(fā)掘提供統(tǒng)一標準框架。最高通量基因組學,轉(zhuǎn)錄組測序等技術(shù)為遺傳變異發(fā)掘提供高效技術(shù)手段。隨著對多樣性植物資源研究,單一參基因組不能代表資源所有遺傳變異,對多樣性資源基因組研究易出現(xiàn)錯誤,難以有效鑒定基因中結(jié)構(gòu)變異??截悢?shù)變異等結(jié)構(gòu)變異在作物品種間普遍存在,基因組結(jié)構(gòu)變異導致物種個體間基因結(jié)構(gòu)等發(fā)生實質(zhì)性變化。為完整描述群體遺傳變異,科學家提出泛基因組概念,為功能基因組學研究提供參考框架。植物泛基因組研究成為植物基因組學研究熱點。
泛基因組概念源于微生物基因組學研究,通過研究細菌基因組發(fā)現(xiàn)不同菌株存在大量基因缺失變異,Tetelin 等首次提出泛基因組概念,迅速用于動植物等生物基因組學研究中。目前構(gòu)建包括大豆等20 多種真核生物泛基因組。泛基因組功能型定義以功能為核心研究對象,指群體所有功能基因總和。通過泛基因組研究群體功能基因分布,呈現(xiàn)群體功能基因,可以從基因拓展至基因家族。
結(jié)構(gòu)性定義為對群體基因組序列比較分析,微生物組研究以基因為核心泛基因組定義應用較多,序列為基礎泛基因組定義適合真核生物研究。泛基因組包括核心與非必需基因組,核心基因組指存在所有個體基因,核心基因組基因包括維持物種存活所需基本生理功能基因,如維持DNA 復制等功能[1];非必需基因包含群體全部可變基因,很多物種存在大量非必需基因組,擁有本文少的外顯,如非必需基因非同義比例高于核心基因組,大部分非必需基因組與微生物多樣性有關,基因功能主要富集于生物脅迫、植物發(fā)育等生物學功能。
基因組學是20 世紀90 年代興趣的研究領域,功能基因組是利用結(jié)構(gòu)基因組學提供信息,通過基因全面分析功能,使生物學研究轉(zhuǎn)向?qū)Χ鄠€基因系統(tǒng)研究。泛基因組最早應用于轉(zhuǎn)座子研究,目前超過16 個植物物種建立泛基因組,包括小麥等重要農(nóng)作物。植物群體中非必需基因數(shù)量龐大,如油菜泛基因組中38%為非必需。木豆泛基因組組裝1900 多個參考基因組不存在新基因,功能富集于生物學功能中。非必需基因是控制植物重要農(nóng)藝性狀的功能基因,有利于功能基因鑒定。
目前泛基因組以新測序數(shù)據(jù)為基礎進行組裝構(gòu)建。策略分為對所有材料進行基因從頭組裝;以已有參考基因組為基礎,通過對比—組裝迭代進行構(gòu)建;基于變異圖組裝。不同組裝策略具有不同優(yōu)缺點,植物泛基因組構(gòu)建面臨挑戰(zhàn)是結(jié)構(gòu)變異序列正確組裝。對每個材料進行基因組從頭組裝方法,可以解決重復序列組裝問題,有利于結(jié)構(gòu)變異發(fā)掘鑒定。缺點是基因組從頭組裝費用高,難以大規(guī)模實施[2],不能解決大結(jié)構(gòu)變異解析問題。
以參考基因組為基礎迭代組裝策略,對不能比對測序數(shù)據(jù)組裝,如不能采用迭代法,可以運用類似宏基因組組裝策略,組裝得到泛基因組,實現(xiàn)基因PAV 分析。策略優(yōu)點是技術(shù)相對簡單,缺點是難以解決重復序列組裝,不能很好地對大結(jié)構(gòu)變異解析?;趫D論組裝法把基因組分為若干部分,可以通過變異圖譜進行分析。泛基因組圖提供新的概念,應用理論技術(shù)尚不成熟。相對線性基因組概念,泛基因組圖適用于變異數(shù)據(jù)組織,具有廣闊應用前景。目前多數(shù)植物泛基因組構(gòu)建基于二代測序技術(shù)組裝,應用基于參考基因組策略難以解決重復序列造成組裝錯誤[3]。碎片化問題影響在結(jié)構(gòu)變異鑒定中的應用效果。
PacBiO 等長讀長基于單分子測序三代測序技術(shù)得到廣泛應用,三代測序具有長讀長優(yōu)點,可以解決序列組裝問題。在光學圖譜等技術(shù)下實現(xiàn)高質(zhì)量基因組組裝,可以組裝質(zhì)量更好的泛基因組。基于三代測序進行泛基因組組裝法成功用于大豆等植物范基因組構(gòu)建中,組裝策略選擇是泛基因組組裝重要問題。從頭組裝策略費用較高,導致構(gòu)建泛基因組多樣性不足等問題。迭代組裝利用二代測序數(shù)據(jù)組裝,可通過分析個體提高泛基因組多樣性。但泛基因組完整性較低,選擇群體中少數(shù)代表性材料從頭組裝,結(jié)合大規(guī)模多樣性材料二代測序數(shù)據(jù)對比,是構(gòu)建高質(zhì)量泛基因組的可行策略。
植物進化是植物基因組學研究的重點,解析植物進化基因組結(jié)構(gòu)變異,有助于為植物育種提供線索。泛基因組結(jié)構(gòu)變異捕獲具有獨特優(yōu)勢,可以為植物進化提供寬泛基礎數(shù)據(jù)。如大豆種皮顏色為馴化重要性狀,由于查爾酮合成酶基因結(jié)構(gòu)變異導致野生大豆黑皮演變?yōu)辄S皮。研究通過大豆野生資源構(gòu)建泛基因組發(fā)現(xiàn)基因結(jié)構(gòu)變異,分析泛基因組單倍體型剖析大豆種皮顏色馴化歷史。
Sariel 等構(gòu)件向日葵泛基因組,通過泛基因組進行同源基因比較分析,印證現(xiàn)代向日葵品種抗病性改良基因來源。利用控制主要農(nóng)藝性狀是植物遺傳改良的基礎,常規(guī)方法通過比較典型材料基因組結(jié)構(gòu),新測序技術(shù)為遺傳變異分析提供高效技術(shù)手段,目前多以單一參考基因組為基礎,不適用于基因組結(jié)構(gòu)變異引起表型遺傳分析。泛基因組可通過完整捕獲群體全部遺傳變異,提供完整的基因組參考消息。為GWAS 等技術(shù)應用遺傳變異分析提供數(shù)據(jù)。泛基因組矯正單一參考基因組分析導致偏差,多樣性測序數(shù)據(jù)對比單一參考基因組出現(xiàn)系統(tǒng)性偏差,參考基因組缺失序列讀序數(shù)被丟棄。由于泛基因組包絡群體完整基因組多樣性,避免高度多態(tài)性讀數(shù)丟失問題。
目前開發(fā)多個新測序數(shù)據(jù)對比方法,基于范基因組測序數(shù)據(jù)分析成為基因組學研究重要方法。泛基因組可以提高GWAS 準確向,GWAS 分析參考基因組不存在功能基因表型,出席縣實際功能基因偏差較大情況,如GWAS 鑒定玉米米抗甘蔗花葉病毒功能基建營,以B73 參考引資加納定SPN 關聯(lián)分析檢測功能相差8.5Mb,泛基因組以結(jié)構(gòu)變異與SNP 為基因型數(shù)據(jù),解決單一參考組導致GWAS 結(jié)果偏差問題。非必須基因組與很多農(nóng)藝性狀關聯(lián),通過泛基因組分析非必需基因,對鑒定抗功能性基因應用具有重要價值。
功能基因組學研究是利用結(jié)構(gòu)基因組學提供信息,使生物學研究轉(zhuǎn)向?qū)Χ鄠€基因同時系統(tǒng)研究。主要采用比較基因序列方法,植物功能基因組是植物后代基因研究核心內(nèi)容,特點是采用高通量實驗方法進行研究。目前功能基因組學研究包括高通量遺傳轉(zhuǎn)化鑒定系統(tǒng)、獲得DNA 芯片基因轉(zhuǎn)錄圖譜等。人們建立系列有效的技術(shù)方法對功能基因組學深入研究,包括表達序列標簽、插入突變等。
基因表達分析系列是快速研究基因表達的新技術(shù),鑒定基因組中95%的基因,通常為9~10bp 寡核苷酸序列,通過連接酶將多個標簽隨機串聯(lián),可以顯示各SAGE 標簽代表基因特定組織表達,可保留基因表達數(shù)據(jù),研究細胞轉(zhuǎn)錄變化引起生物現(xiàn)象。日本科學家Matsumura 等人首次利用SAGE 技術(shù)研究高等植物全基因表達定量,F(xiàn)izames 等人用SAGE 技術(shù)分析擬南芥根基劃分基因表達,通過獲得SAGE 標簽與已知基因?qū)Ρ确治?,通過對不同狀態(tài)下表達圖譜比較發(fā)現(xiàn)基因表達差異。
現(xiàn)有轉(zhuǎn)基因食品分析檢測技術(shù)適用范圍不同,需要進行相關分析檢測技術(shù)研究。研究對異源四倍體野生花生進行基因組組裝,對基因組進行區(qū)分得到亞基因組。異源四倍體植物具有兩個亞基因組,Bertioli 等發(fā)現(xiàn)基因組與栽培花生AB 基因組序列相近,可以對鑒定抗病基因等問題提供幫助,為選育適應性強花生品種奠定基礎,對花生樹進化提供科學參考價值。
目前泛基因組領域需要解決更好地把最新測序技術(shù)及數(shù)據(jù)技術(shù)用于泛基因組組裝,構(gòu)建高質(zhì)量泛基因組等問題。泛基因組組裝廣泛應用三代測序技術(shù),解決大規(guī)模群體稀有遺傳變異捕獲問題需要開發(fā)相應技術(shù)流程。人工智能技術(shù)在泛基因組組裝應用,有助于解決組裝功能研究的挑戰(zhàn)。如何更好地解析泛基因組變異數(shù)據(jù)是應用研究面臨的挑戰(zhàn)。
泛基因組應用研究核心是構(gòu)建合適的數(shù)據(jù)框架,通過泛基因組呈現(xiàn)群體內(nèi)結(jié)構(gòu)變異?;趫D論泛基因組數(shù)據(jù)結(jié)構(gòu)化是目前研究熱點。大豆泛基因組構(gòu)建利用相關技術(shù)構(gòu)建基于圖泛基因組,目前相應技術(shù)算法不成熟,利用泛基因組圖用于生物信息學分析,需要復雜的計算,開發(fā)完整的泛基因組數(shù)據(jù)分析流程,是未來泛基因組應用研究重點。隨著基因組學技術(shù)的發(fā)展,單一參考基因組不能適應現(xiàn)代功能基因?qū)W研究需要,泛基因組可以為功能基因組學研究提供基礎變異數(shù)據(jù),構(gòu)建泛基因組推動功能基因組學研究發(fā)展。
目前植物功能基因組學研究取得一定進展,反向遺傳學處于大量突變?nèi)后w建立初級階段。林木功能基因組研究主要研究對林木響應逆境脅迫研究較少,林木功能基因組學研究需要開展廣泛國際合作。隨著水稻基因組研究深入,可提供植物基因序列信息、基因功能信息等更多,為植物分子改良提供有效的技術(shù)支撐。