沈秀芬,章?tīng)t軍,張美彥,尚曉冬,李 玉,于海龍*
(1上海市農(nóng)業(yè)科學(xué)院食用菌研究所,農(nóng)業(yè)部南方食用菌資源利用重點(diǎn)實(shí)驗(yàn)室,國(guó)家食用菌工程技術(shù)研究中心,國(guó)家食用菌加工技術(shù)研發(fā)分中心,上海市農(nóng)業(yè)遺傳育種重點(diǎn)開(kāi)放實(shí)驗(yàn)室,上海 201403;2吉林農(nóng)業(yè)大學(xué)食藥用菌教育部工程研究中心,長(zhǎng)春130118)
綜觀世界食用菌產(chǎn)量發(fā)展趨勢(shì),食用菌產(chǎn)量快速增長(zhǎng),近年來(lái)我國(guó)食用菌的生產(chǎn)廠家更是如雨后春筍般應(yīng)運(yùn)而生[1]。根據(jù)中國(guó)食用菌協(xié)會(huì)統(tǒng)計(jì),截至2018年底,我國(guó)食用菌產(chǎn)量達(dá)到3 842.04萬(wàn)t[2],食用菌已成為我國(guó)農(nóng)業(yè)種植業(yè)中繼糧食作物、蔬菜作物、果樹(shù)作物、油料作物之后的第五大農(nóng)作物[3]。我國(guó)食用菌資源豐富,是與我們生活密切相關(guān)的生物資源。近年來(lái),隨著人們對(duì)食用菌營(yíng)養(yǎng)價(jià)值、藥用價(jià)值的開(kāi)發(fā)利用不斷提高,基于分子標(biāo)記QTL定位的食用菌遺傳育種已成為研究熱點(diǎn)之一[4]?,F(xiàn)代作物分子育種方法主要有:分子標(biāo)記輔助育種(Molecule marker associated selection)、分子設(shè)計(jì)育種(Molecule design breeding)、轉(zhuǎn)基因育種(Genetically modified breeding)。隨著生物信息學(xué)的快速發(fā)展,分子標(biāo)記輔助育種逐漸成為全世界動(dòng)植物育種的重要手段[5]。
目前,分子標(biāo)記技術(shù)主要經(jīng)歷了三次技術(shù)革新。作為最早發(fā)展起來(lái)的以DNA-DNA雜交為基礎(chǔ)的第一代分子標(biāo)記——限制性內(nèi)切酶片段長(zhǎng)度多態(tài)性(Restriction Fragment Length Polymorphism,RFLP),在食用菌中主要應(yīng)用于遺傳多樣性和親緣關(guān)系的鑒定[6-9]。在此基礎(chǔ)上研發(fā)出一系列以PCR擴(kuò)增技術(shù)為基礎(chǔ)的第二代分子標(biāo)記。食用菌中,簡(jiǎn)單序列重復(fù)(Simple Sequence Repeat,SSR)標(biāo)記主要應(yīng)用于遺傳育種[10-13];簡(jiǎn)單序列重復(fù)間區(qū)(Inter-simple sequence repeat,ISSR)主要運(yùn)用在品種鑒定、遺傳多樣性、雜交育種等方面[14-15];隨機(jī)擴(kuò)增多態(tài)性 DNA 標(biāo)記(Random Amplified Polymorphic DNA,RAPD)主要應(yīng)用于系統(tǒng)發(fā)育、種質(zhì)資源多樣性、基因鑒別等研究中[16-17]?;贒NA芯片技術(shù)的單苷酸多態(tài)性(Single Nucleotide Polymorphisms,SNP)被稱為第三代分子標(biāo)記,具有多態(tài)性好,分辨率高等特點(diǎn),有效克服了第一代和第二代分子標(biāo)記在開(kāi)發(fā)中面臨的因DNA序列長(zhǎng)度影響的缺點(diǎn)[18-20]。InDel(Insertion-Deletion)分子標(biāo)記作為一種新型分子標(biāo)記,含量豐富度僅次于SNP標(biāo)記,相對(duì)于SNP標(biāo)記的單堿基多態(tài)性突變,InDel標(biāo)記可排除單堿基的無(wú)義突變[21]。InDel分子標(biāo)記是一種基于高通量測(cè)序技術(shù)的應(yīng)用,開(kāi)發(fā)成本較低[22],適用于食用菌全基因組測(cè)序分子標(biāo)記的開(kāi)發(fā)[23],能有效地鑒定出樣品間的親緣關(guān)系。
在同一物種不同個(gè)體或親緣關(guān)系較近物種的同源序列或基因組相同位點(diǎn)的序列中存在不同數(shù)量堿基的插入或缺失標(biāo)記被稱為InDel分子標(biāo)記[24]。InDel產(chǎn)生主要與基因組序列本身特征和DNA復(fù)制錯(cuò)誤有關(guān)[25]。通過(guò)對(duì)19個(gè)人類基因座編碼外顯子序列進(jìn)行研究,發(fā)現(xiàn)當(dāng)序列中含有GTAAGT序列以及嘌呤嘧啶在樣本DNA兩條鏈上的含量不平衡時(shí),會(huì)增加缺失突變的發(fā)生概率,因此InDel的產(chǎn)生類型與所在序列的堿基種類有一定關(guān)系;當(dāng)突變熱點(diǎn)前后含有TACCRC序列和AT(A/C)(AC)GCC序列時(shí)會(huì)增加插入的發(fā)生率,而TATCGC序列會(huì)減少缺失率,GCGG序列會(huì)減少插入率也被確定[26]。有2/3的刪除會(huì)刪除重復(fù)序列,超過(guò)4/5的插入會(huì)創(chuàng)建重復(fù)序列,即它們是序列的復(fù)制品?;蛐蛄兄蠵oly(A/T)結(jié)構(gòu)熱穩(wěn)定性較低,在DNA復(fù)制過(guò)程中聚合酶容易發(fā)生復(fù)制滑移,復(fù)制滑移會(huì)導(dǎo)致序列發(fā)生插入/缺失突變,復(fù)制滑移幾率與序列GC堿基的含量成正相關(guān);InDel分子標(biāo)記的長(zhǎng)度與其形成機(jī)制也有一定關(guān)系,一般來(lái)說(shuō),較長(zhǎng)的InDel是由轉(zhuǎn)座因子復(fù)制多拷貝或者非常規(guī)重組造成的,而較短的InDel位點(diǎn)是由于復(fù)制滑移導(dǎo)致[27]。
Mills等[28]于2006年通過(guò)InDel分子標(biāo)記創(chuàng)建了第一個(gè)人類基因組的InDel圖譜。通過(guò)對(duì)InDel位點(diǎn)序列分析發(fā)現(xiàn),InDel分子標(biāo)記可分為5種類型:(1)單個(gè)堿基插入/缺失;(2)單堿基對(duì)插入;(3)2—15 bp重復(fù)單元多堿基對(duì)插入;(4)隨機(jī)DNA片段插入;(5)轉(zhuǎn)座子插入。InDel長(zhǎng)度變化范圍很大,插入/缺失堿基數(shù)目在1—1 000bp,但99%以上的InDel長(zhǎng)度小于50bp,平均長(zhǎng)度為36bp[29]。
InDel在基因組中數(shù)目眾多、分布廣泛、密度大。 InDel分布和密度僅次于SNP[30-31],遠(yuǎn)高于SSR。馮芳君等[32]選用‘日本晴’和‘9311’篩選得到均勻分布在染色體上的20對(duì)InDel標(biāo)記和53對(duì)SSR標(biāo)記,分析91份樣品的遺傳多樣性。結(jié)果表明,InDel標(biāo)記相對(duì)于SSR標(biāo)記具有數(shù)量多,擴(kuò)增產(chǎn)物穩(wěn)定,多態(tài)性高,易于檢測(cè)等優(yōu)點(diǎn)。InDel標(biāo)記更準(zhǔn)確、高效,可避免由基因序列復(fù)雜性和特異性導(dǎo)致的分型模糊,進(jìn)而縮短育種周期。與SNP標(biāo)記相比,InDel標(biāo)記利用瓊脂糖凝膠或者聚丙烯酰胺凝膠電泳即可進(jìn)行分型檢測(cè),方法簡(jiǎn)便,對(duì)檢測(cè)技術(shù)和設(shè)備要求較低[33]。
InDel標(biāo)記作為高通量分子標(biāo)記仍具有以PCR(聚合酶鏈?zhǔn)椒磻?yīng))擴(kuò)增技術(shù)為基礎(chǔ)的其他分子標(biāo)記的優(yōu)點(diǎn)。InDel標(biāo)記的開(kāi)發(fā)通?;谝阎幕蚪M序列,利用 Blast比對(duì)同一物種不同個(gè)體的重測(cè)序數(shù)據(jù),尋找該物種之間的堿基序列差異,挑選InDel序列長(zhǎng)度在5—20 bp的位點(diǎn),最后在InDel位點(diǎn)兩側(cè)搜索合適位置設(shè)計(jì)20 bp左右長(zhǎng)度的序列作為擴(kuò)增引物[32]。大量研究表明,InDel標(biāo)記具有操作簡(jiǎn)單,重演性好,亞種間多態(tài)性高,結(jié)果準(zhǔn)確,以及開(kāi)發(fā)成本低等優(yōu)點(diǎn)[34-35],適用于動(dòng)植物分子輔助育種、遺傳研究[36-41]等方面。因此,開(kāi)發(fā)動(dòng)植物中的 InDel 標(biāo)記越來(lái)越受到研究者的關(guān)注,目前在醫(yī)學(xué)診斷、人類遺傳學(xué)[42-44]等領(lǐng)域應(yīng)用廣泛。
遺傳圖譜是進(jìn)行分子標(biāo)記輔助育種、基因定位、圖位克隆的重要工具,為食用菌分子生物學(xué)的深入研究提供了依據(jù)[45]。周雁等[46]利用毛木耳雜交子 APM2—16 菌絲體和成熟子實(shí)體的轉(zhuǎn)錄組為基礎(chǔ),以 APM2—16 的 123 個(gè)擔(dān)孢子單核體后代為作圖群體,開(kāi)發(fā)了包括 SSR、SCAR、CAPs、InDel 等一系列基因內(nèi)分子標(biāo)記,其中選用373 對(duì)InDel 引物進(jìn)行親本單核體間的群體基因型分型和多態(tài)性分析,經(jīng)遺傳連鎖分析獲得了一張由14個(gè)連鎖群組成、含有160個(gè)基因內(nèi)標(biāo)記的毛木耳遺傳圖譜。
Gong等[47]利用SRAP、TRAP、InDel等共524個(gè)分子標(biāo)記以146株孢子單核體菌株為構(gòu)圖群體,構(gòu)建了一張包含13個(gè)連鎖群的高密度香菇遺傳圖譜,連鎖圖全長(zhǎng)1 006.1 cM,標(biāo)記之間的平均遺傳距離為2.0 cM,是迄今為止標(biāo)記密度最飽和的香菇連鎖圖譜。在香菇遺傳作圖中,首次引入基于基因組設(shè)計(jì)的InDel標(biāo)記,利用新増的InDel標(biāo)記技術(shù)進(jìn)行比較作圖后,發(fā)現(xiàn)圖譜的12個(gè)連鎖群中有2個(gè)屬于同一個(gè)連鎖群,即圖譜共包含11個(gè)連鎖群。龔文兵[48]引入基于基因組開(kāi)發(fā)的InDel分子標(biāo)記技術(shù),對(duì)前期構(gòu)建的香菇遺傳圖譜進(jìn)行改良。根據(jù)146個(gè)F1孢子單核體菌株為作圖群體(M群體)進(jìn)行連鎖作圖和基因型分析,獲得了一張高密度的香菇單核體遺傳圖譜。這表明InDel分子標(biāo)記可為遺傳圖譜與基因組序列的整合提供重要依據(jù)。
功能性分子標(biāo)記是建立在等位基因功能性基序中單核苷酸多態(tài)性位點(diǎn)功能性序列基礎(chǔ)上的一類新型分子標(biāo)記,根據(jù)近等基因系中等位基因或關(guān)聯(lián)分析對(duì)數(shù)量性狀進(jìn)行標(biāo)記,利用該標(biāo)記可有效提高分子標(biāo)記輔助選擇育種的效率。髙質(zhì)量的遺傳連鎖圖譜是解析農(nóng)藝性狀遺傳的準(zhǔn)確標(biāo)尺,在食用菌研究中獲得與目的基因緊密連鎖的分子標(biāo)記是分子標(biāo)記輔助育種技術(shù)快速發(fā)展和高效應(yīng)用的基礎(chǔ)。
培育出根據(jù)標(biāo)記輔助選擇(MAS)加速改良性狀的新品種,是蘑菇育種家的長(zhǎng)期以來(lái)的育種目標(biāo),但在食用菌領(lǐng)域尚未應(yīng)用。Im等[49]利用28個(gè)InDel標(biāo)記、226個(gè)SSR標(biāo)記和2個(gè)交配因子,構(gòu)建了白靈菇的遺傳連鎖圖譜。該圖譜由12個(gè)連鎖群組成,全長(zhǎng)1 047.8 cM,標(biāo)記之間平均相距4.09 cM?;贙NR2312減數(shù)分裂后單核細(xì)胞標(biāo)記物的分離分析,共256個(gè)位點(diǎn)被映射。以KNR2532的4個(gè)單核細(xì)胞作為試驗(yàn)菌株,與來(lái)自KNR2532的98個(gè)單核細(xì)胞雜交采用KNR2312對(duì)產(chǎn)量、品質(zhì)、菌蓋顏色、菌齡等9個(gè)性狀進(jìn)行了數(shù)量性狀定位(QTL),為白靈菇遺傳育種奠定了基礎(chǔ)。利用分子標(biāo)記對(duì)食用菌農(nóng)藝性狀和生理特性進(jìn)行標(biāo)記,為F2代進(jìn)行遺傳改造提供了數(shù)據(jù)資源,使育種目標(biāo)更加明確。Gong等[50]基于香菇基因組重測(cè)序篩選出572個(gè)標(biāo)記(包含82個(gè)InDel分子標(biāo)記),這些標(biāo)記定位在12個(gè)連鎖群上,構(gòu)建了長(zhǎng)度為 983.7 cM的香菇高密度遺傳連鎖圖譜,并在此基礎(chǔ)上,在兩個(gè)測(cè)交群體中利用QTLs定位了62個(gè)與7項(xiàng)香菇子實(shí)體表型相關(guān)性狀。LI等[51]通過(guò)對(duì)89個(gè)香菇全基因組測(cè)序,使用297個(gè)分子標(biāo)記(其中249個(gè)InDel標(biāo)記)進(jìn)行了基因分型,結(jié)果表明我國(guó)香菇品種具有豐富的遺傳多樣性、遺傳位點(diǎn)和種群結(jié)構(gòu);對(duì)11個(gè)農(nóng)藝性狀的進(jìn)一步關(guān)聯(lián)分析,為香菇分子標(biāo)記輔助育種提供了有利線索。
迄今為止,利用InDel分子標(biāo)記技術(shù)分析食用菌的遺傳進(jìn)化關(guān)系未曾被報(bào)道,遺傳多樣性研究也僅于香菇。Xiang 等[52]從全國(guó)香菇主產(chǎn)區(qū)收集89個(gè)香菇野生菌株并構(gòu)建了關(guān)聯(lián)分析群體,篩選252對(duì)InDel引物對(duì)香菇栽培群體進(jìn)行遺傳多樣性分析,共檢測(cè)到800多個(gè)等位基因,其中82%具有多態(tài)性,通過(guò)InDel標(biāo)記,把68株香菇劃分為四個(gè)類群。Shannon信息指數(shù)和基因多樣性的總體值分別為0.836和0.435,這表明所選香菇群體遺傳多樣性較為豐富,同時(shí)也說(shuō)明InDel分子標(biāo)記多態(tài)性較高,適用于食用菌遺傳多樣性研究。
由于科學(xué)和經(jīng)濟(jì)等多方面原因,分子育種在不同作物間還存在很大的差異。作為一種基因特異性分子標(biāo)記,在作物育種中已開(kāi)始應(yīng)用于鑒定水稻[53-54]和小麥[55]特異性和偏離分析、大白菜[56]育種材料身份證的構(gòu)建、基于基因組重測(cè)序的棉花[57]、黃瓜[58]、辣椒[59-60]InDel 標(biāo)記開(kāi)發(fā)。由于InDel位點(diǎn)是通過(guò)基因組同源序列比對(duì)分析獲得,但全基因組序列已知的生物物種有限,大多為模式物種或經(jīng)濟(jì)作物,對(duì)于食用菌而言,僅有香菇[61]、金針菇[62]、雙孢菇[63]等30余種食用菌全基因組序列已測(cè)出[64],大量食用菌基因組序列未知,導(dǎo)致在食用菌領(lǐng)域大規(guī)模開(kāi)發(fā)與應(yīng)用InDel標(biāo)記存在一定的難度。
隨著基因組時(shí)代的到來(lái),高通量測(cè)序技術(shù)的快速發(fā)展以及測(cè)序成本逐漸降低,國(guó)際公共基因序列數(shù)據(jù)庫(kù)(GenBank、EMBL、DDBJl等)序列信息將越來(lái)越豐富,為食用菌基于全基因組開(kāi)發(fā)功能性分子標(biāo)記提供了前所未有的機(jī)遇。為了使 InDel標(biāo)記在食用菌中發(fā)揮重要作用,應(yīng)結(jié)合全基因組測(cè)序、擴(kuò)增子重測(cè)序等技術(shù),根據(jù)已挖掘的調(diào)控食用菌重要農(nóng)藝性狀的功能基因,開(kāi)發(fā)出快速鑒定育種材料的InDel分子標(biāo)記,為食用菌定向育種奠定基礎(chǔ)。
在已知食用菌序列中對(duì)InDel標(biāo)記方法研究較少,在食用菌遺傳進(jìn)化和分子輔助育種中尚未被報(bào)道,應(yīng)拓展InDel標(biāo)記在食用菌領(lǐng)域應(yīng)用范圍。InDel標(biāo)記能更全面地揭示MAS群體的遺傳結(jié)構(gòu),如QTL在MAS群體中的離散程度,加速遺傳進(jìn)化關(guān)系研究。另外,運(yùn)用自動(dòng)化基因檢測(cè)手段,通過(guò)定向誘變、RNA干擾等提高基因的功能鑒定,加速食用菌分子育種產(chǎn)業(yè)化進(jìn)程。
近年來(lái),隨著基因組學(xué)、分子生物學(xué)、生物信息學(xué)等多組學(xué)聯(lián)合并與分子標(biāo)記相結(jié)合,食用菌生理和育種方面已取得一些新的突破,相信未來(lái)會(huì)有越來(lái)越多的功能基因被挖掘,這為食用菌遺傳規(guī)律實(shí)質(zhì)的解讀、開(kāi)展現(xiàn)代分子標(biāo)記輔助育種工作和生產(chǎn)應(yīng)用等方面提供了極其廣闊的利用價(jià)值和應(yīng)用前景??梢灶A(yù)見(jiàn),今后在食用菌的遺傳育種研究中,InDel標(biāo)記開(kāi)發(fā)的可利用資源不斷增加,InDel標(biāo)記在食用菌研究領(lǐng)域中將會(huì)發(fā)揮更大的作用。