石慧敏,蘇飛燕,侯建華
(內(nèi)蒙古農(nóng)業(yè)大學(xué)農(nóng)學(xué)院,內(nèi)蒙古 呼和浩特,010019)
我國(guó)常見的油料作物包括大豆、油菜、花生、芝麻、向日葵、油茶、蓖麻、胡麻等[1]。我國(guó)目前食用植物油自給率嚴(yán)重不足,且接近一半以上依賴進(jìn)口,其中葵花籽、芝麻、胡麻產(chǎn)量更是僅占世界總產(chǎn)的5.8%、10.6%、12.4%,這嚴(yán)重威脅到國(guó)家食用油安全[2]。有研究報(bào)道,國(guó)產(chǎn)大豆不能滿足自給,對(duì)外進(jìn)口依賴程度居高不下,2019年大豆進(jìn)口接近9000萬噸[3]。此外,中國(guó)還是第一大芝麻進(jìn)口國(guó)、第二大胡麻進(jìn)口國(guó)[2]。國(guó)內(nèi)特色油料品種抗病抗逆性相對(duì)較差,導(dǎo)致病害多發(fā)難控,使得產(chǎn)量和品質(zhì)降低[4],育種是提高作物產(chǎn)量和品質(zhì)的有效手段,挖掘品質(zhì)性狀相關(guān)基因,從分子水平改良油料作物品質(zhì)是近年來研究的熱點(diǎn)。
油料作物的品質(zhì)性狀是由多基因(主效基因和微效基因)共同控制的數(shù)量性狀。近年來,由Risch于1996 年提出的全基因組關(guān)聯(lián)分析(genome-wide association study,GWAS),基于群體內(nèi)基因位點(diǎn)間的連鎖不平衡來分析目標(biāo)性狀和標(biāo)記或候選基因之間的關(guān)聯(lián)性,為挖掘數(shù)量性狀位點(diǎn)提供了新的研究策略[5],由于能夠同時(shí)檢測(cè)自然群體中的多個(gè)等位基因(適合數(shù)量性狀的定位),具有定位精度高,實(shí)用性強(qiáng),成本低等優(yōu)勢(shì)[6],已廣泛應(yīng)用于多種作物復(fù)雜數(shù)量性狀的遺傳分析中,例如玉米、小麥、水稻、油菜等[7~10]。隨著基因組技術(shù)的快速發(fā)展,新型測(cè)序技術(shù)層出不窮,越來越多動(dòng)植物的全基因組信息被報(bào)道,使得GWAS 分析技術(shù)成為了研究復(fù)雜性狀的重要方法。本文對(duì)GWAS 分析在幾種油料作物品質(zhì)性狀相關(guān)基因挖掘中的應(yīng)用進(jìn)行了綜述,為今后通過分子途徑改善油料作物品質(zhì)提供參考借鑒。
大豆(Glycine mɑxL.Merrill)是世界第一大油料作物,占世界植物油消費(fèi)量的29%,數(shù)量相當(dāng)于5.39×107噸(http://soystats. com/international worldvegetable-oil-consumption/,2016)。其中蛋白質(zhì)含量和油脂含量在大豆組分中分別占40%和20%,是人類食品、食用植物油和牲畜飼料的重要來源,并應(yīng)用于生物柴油、工業(yè)和制藥等方面[11]。近幾十年來,人們利用GWAS 對(duì)大豆中蛋白質(zhì)和油脂含量相關(guān)基因的鑒定和挖掘也做了大量的工作。
王自力于2015 年利用573 份材料建立江淮地區(qū)大豆種質(zhì)群體,對(duì)3個(gè)質(zhì)量性狀(花色、茸毛顏色、葉形)和8個(gè)農(nóng)藝品質(zhì)性狀進(jìn)行GWAS 研究,定位到控制蛋白質(zhì)含量和油脂含量的QTL 位點(diǎn)分別為3個(gè)和8 個(gè)[12]。隨后,Liu 等利用137 份大豆將不同種植密度下大豆產(chǎn)量和品質(zhì)相關(guān)性狀進(jìn)行了GWAS分析。總共檢測(cè)到40 個(gè)顯著的SNP 位點(diǎn)分布在18條染色體上,并發(fā)現(xiàn)一些穩(wěn)定且多效的基因位點(diǎn)[13]。接著,Dias等評(píng)估了169個(gè)巴西大豆品種,并用6000個(gè)SNP 標(biāo)記進(jìn)行了基因分型,發(fā)現(xiàn)6個(gè)染色體(2、6、11、12、13 和16)上7 個(gè)與蛋白質(zhì)含量相關(guān)的QTL。對(duì)于含油量,在6 個(gè)染色體(1、4、5、6、17 和19)上鑒定出8 個(gè)QTL[14]。Zhang 等利用高密度SNP 陣列對(duì)313 份大豆種質(zhì)資源進(jìn)行基因分型,并對(duì)大豆種子蛋白質(zhì)、油脂、脂肪酸和氨基酸組成進(jìn)行了全基因組水平的關(guān)聯(lián)分析,共鑒定到87個(gè)染色體區(qū)域與種子組成有關(guān),在主效應(yīng)位點(diǎn)發(fā)現(xiàn)了功能已知的候選基因GmSAT1、AK-HSDH、SACPD-C和FAD3A,并推測(cè)了參與固氮、氨基酸生物合成和脂肪酸代謝的根瘤蛋白MtN21、脂肪b 和甾體-5-α-還原酶[15]。沈甲誠(chéng)等利用1514 個(gè)高質(zhì)量的SNP 分子標(biāo)記對(duì)224 份大豆材料的水溶性蛋白質(zhì)含量進(jìn)行GWAS 分析,共檢測(cè)到18 個(gè)顯著關(guān)聯(lián)的SNP 標(biāo)記,位點(diǎn)qWSPC7和qWSPC8-1對(duì)表型變異的解釋率較高且穩(wěn)定關(guān)聯(lián),預(yù)測(cè)兩個(gè)位點(diǎn)的候選區(qū)間內(nèi)基因,發(fā)現(xiàn)了25個(gè)候選基因,其中有7 個(gè)基因(Glymɑ. 07g195000、Glymɑ.08g103100、Glymɑ. 08g108900、Glymɑ. 08g105100、Glymɑ. 08g107800、Glymɑ. 08g107700和Glymɑ.08G115800)在大豆籽粒、根或根瘤中具有較高的表達(dá)水平[16]。同樣的,Zhang 等也將qWSPC8-1定位到Glymɑ. 08G107800,可能參與油酯和水溶性蛋白合成;另發(fā)現(xiàn)qPC-15-1中的Glymɑ.15G049200影響蛋白 合 成[17]。Sui 等 利 用GWAS 通 過33 149 個(gè)SNP 標(biāo)記鑒定到178 個(gè)優(yōu)良種質(zhì)組成的大豆群體的WSPC(水溶性蛋白質(zhì)濃度)3個(gè)關(guān)聯(lián)信號(hào),其中1個(gè)為新發(fā)現(xiàn)的;同時(shí)檢測(cè)到30 個(gè)候選基因,并未定位到與沈甲誠(chéng)等[16]研究中相同的基因,但其中4 個(gè)基因(Glymɑ. 06G207900、Glymɑ. 06G208200、Glymɑ. 06G2083 00和Glymɑ. 08G223300)值得進(jìn)一步研究[18]。Miao等通過關(guān)聯(lián)分析,通過功能研究和群體遺傳學(xué),了解了GmSWEET39基因編碼的糖轉(zhuǎn)運(yùn)外排蛋白在大豆種子中高度表達(dá),其表達(dá)水平與大豆籽油含量呈正相關(guān)。GmSWEET39中的序列變異會(huì)影響在大豆種子中的相對(duì)表達(dá)和種子油含量[19]。
近年來,由于SNP 分子標(biāo)記在一個(gè)標(biāo)記位點(diǎn)上僅有2 個(gè)等位變異,因此傳統(tǒng)的GWAS 不能檢測(cè)自然群體中廣泛存在的復(fù)等位變異,不僅一定程度限制了其應(yīng)用,同時(shí)也可能降低檢測(cè)效率。此外,以往GWAS 通常使用非常嚴(yán)格的顯著水平來控制假陽性,從而導(dǎo)致較高的假陰性,以至于不能全面解析全基因組遺傳位點(diǎn),使得檢測(cè)到的主要QTL 較少[20]。2017 年,He 等針對(duì)GWAS 存在的一些局限性,將多個(gè)相鄰且連鎖不平衡程度高的SNP 標(biāo)記組成具有復(fù)等位變異的SNP LDB(SNP 連鎖不平衡模塊)標(biāo)記,并基于多位點(diǎn)復(fù)等位變異模型進(jìn)行全基因組QTL 檢測(cè),提出了限制性兩階段多位點(diǎn)GWAS分析方法(restricted two-stage multi-locus genomewide association analysis,RTM-GWAS)[21]。Zhang 等利用RTM-GWAS,使用29 119 個(gè)SNP LDB 鑒定了多個(gè)環(huán)境下366份種質(zhì)材料組成的中國(guó)大豆地方種群(CSLRP)種子油份的QTL 位點(diǎn),檢測(cè)到種子油分含量、油酸含量及亞麻酸含量的50、98 和50 個(gè)QTL位點(diǎn),分別具有136、283 和154 個(gè)等位基因(每個(gè)位點(diǎn)2~9 個(gè)),其中有38、27 和25 個(gè)候選基因得到了功能注釋[22]。Li 等同樣利用RTM-GWAS 程序,對(duì)279 個(gè)大豆種質(zhì)的蛋白質(zhì)和含油量進(jìn)行遺傳結(jié)構(gòu)的分析,發(fā)現(xiàn)了8 個(gè)可能改善大豆?fàn)I養(yǎng)品質(zhì)的候選基因[23]。
這些結(jié)果將有助于發(fā)現(xiàn)大豆控制蛋白質(zhì)及油脂生物合成的多基因網(wǎng)絡(luò),育種者可明確具體的育種目標(biāo),有針對(duì)性的選擇,同時(shí)也要兼顧其它的性狀,這些新發(fā)現(xiàn)的遺傳位點(diǎn)及候選基因可以顯著改善大豆分子育種程序。
脂肪酸比例對(duì)大豆油的油脂品質(zhì)具有重要影響,大豆脂肪酸的遺傳研究具有重要意義。早在2013 年,韓世鳳利用285 份來自于不同生態(tài)區(qū)的大豆材料與84 443個(gè)SNP標(biāo)記的GWAS識(shí)別了與油脂組分相關(guān)的基因座,兩年共檢測(cè)到1212個(gè)與脂肪酸相關(guān)的QTL 位點(diǎn),并于關(guān)聯(lián)標(biāo)記附近發(fā)現(xiàn)1269個(gè)基因,其中有94 個(gè)與擬南芥脂質(zhì)代謝同源[24]。Li 等使用1536個(gè)SNP(主要是非同義的)芯片對(duì)421份大豆種質(zhì)資源進(jìn)行了基因分型,通過關(guān)聯(lián)映射分析確定了與脂肪酸相關(guān)的總共37個(gè)顯著位點(diǎn),這些關(guān)聯(lián)由33 個(gè)SNP(在32 個(gè)帶注釋的基因中發(fā)生)表示;此外,發(fā)現(xiàn)另外4 個(gè)SNP 與兩個(gè)不同的脂肪酸具有顯著的關(guān)聯(lián),可能是由多效性作用導(dǎo)致[25]。Zhou 等對(duì)302 份大豆材料的種子大小、種皮顏色、生長(zhǎng)習(xí)性、含油量等性狀進(jìn)行了GWAS 研究,最終鑒定到21個(gè)與脂肪酸合成相關(guān)的基因[26]。戴亞楠以284 份大豆組成的自然群體為材料,利用高通量測(cè)序技術(shù)對(duì)關(guān)聯(lián)群體進(jìn)行全基因組重測(cè)序,共關(guān)聯(lián)到油脂、油酸、亞油酸、亞麻酸、硬脂酸、棕櫚酸和蛋白質(zhì)含量7 個(gè)品質(zhì)性狀358個(gè)位點(diǎn),與參考基因組比對(duì),共得到42個(gè)與擬南芥高度同源的基因[27]。這些結(jié)果對(duì)研究大豆脂肪酸含量的遺傳變異規(guī)律,以及對(duì)大豆?fàn)I養(yǎng)品質(zhì)改良具有重要意義。
籽粒大小、籽粒硬度是大豆重要的品質(zhì)性狀,與納豆加工品質(zhì)和菜用大豆食味品質(zhì)密切相關(guān)[28],此外這些性狀,還影響了大豆籽粒的吸水速率、種皮透性、蒸煮特性及整個(gè)籽粒的結(jié)構(gòu)特性[29]。Hu 等利用219 份栽培大豆通過GWAS 分析得到20 個(gè)與籽粒大小性狀顯著關(guān)聯(lián)的SNP 位點(diǎn),7 個(gè)與粒型性狀顯著關(guān)聯(lián)SNP 位點(diǎn)[30]。Niu 等對(duì)257 份栽培大豆組成的群體進(jìn)行了與籽粒大小的關(guān)聯(lián)分析,得到59個(gè)主效QTL[31]。張星利用1514 個(gè)SNP 對(duì)216 份中國(guó)栽培大豆微核心種質(zhì)資源的籽粒硬度進(jìn)行GWAS分析,依據(jù)候選區(qū)段內(nèi)的基因功能注釋初步篩選到24 個(gè)候選基因,并在具有極端差異的材料中,分析與Q-15-0087770距離較近的5個(gè)候選基因在大豆3個(gè)生育期(R5、R6 和R7)的相對(duì)表達(dá)量變化,得到Q-15-0087770 落點(diǎn)基因Glymɑ. 15G147800以及基因Glymɑ. 15G149800可能與大豆成熟籽粒硬度相關(guān)[32]。這些研究為大豆的外觀及加工品質(zhì)方面的選育提供了新的參考。
甘藍(lán)型油菜(Brɑssicɑ nɑpusL., AACC,2n= 38)是僅次于大豆的世界第二大產(chǎn)油作物,在世界許多國(guó)家的溫帶地區(qū)種植,占食用植物油生產(chǎn)的14%[33]。油菜營(yíng)養(yǎng)價(jià)值和品質(zhì)的高低主要是由脂肪酸組分決定,其中亞麻酸等組份是關(guān)注的重點(diǎn)[34]。隨著油菜基因組的公布,近年來利用GWAS 分析對(duì)油菜品質(zhì)相關(guān)性狀進(jìn)行遺傳分析的研究也層出不窮。早在2010 年,F(xiàn)rancki 等利用684 個(gè)AFLP 標(biāo)記對(duì)84 個(gè)優(yōu)質(zhì)冬油菜品種的14個(gè)性狀進(jìn)行了關(guān)聯(lián)分析,其中10 個(gè)性狀關(guān)聯(lián)1 到34 標(biāo)記不等??紤]到顯著標(biāo)記之間的連鎖不平衡,這些標(biāo)記代表了1~22 個(gè)不同性狀的QTL,說明這些標(biāo)記在表型間共享,使得各性狀呈極顯著關(guān)聯(lián)。因此認(rèn)為在油菜群體利用關(guān)聯(lián)分析進(jìn)行QTL定位是一種可行的方法[35]。
為了挖掘與油菜含油量相關(guān)的基因位點(diǎn),段繼鳳將來自全球油菜主要生產(chǎn)國(guó)的189份自交系材料構(gòu)建的自然群體為研究對(duì)象,結(jié)合21 348 個(gè)SNP 標(biāo)記及兩年含油量表型數(shù)據(jù),分析了該群體的群體結(jié)構(gòu)、親緣關(guān)系、連鎖不平衡及含油量性狀表型變異,雙向方差分析表明含油量性狀變異主要受基因型控制,且遺傳比較穩(wěn)定[36]。魏大勇等結(jié)合60K SNP芯片數(shù)據(jù)對(duì)308 份油菜含油量進(jìn)行了GWAS 分析,并將所鑒定的顯著位點(diǎn)與先前2 個(gè)自然群體及10個(gè)分離群體鑒定到的位點(diǎn)進(jìn)行全基因組比較與整合。共獲得193 個(gè)油菜含油量整合位點(diǎn),分布于油菜的19 條染色體,對(duì)不同群體鑒定結(jié)果的比較發(fā)現(xiàn),其中有7 個(gè)整合區(qū)間能在至少3 個(gè)群體中被檢測(cè)到,均位于A 亞基因組染色體(A01、A02、A03、A06、A08、A09 和A10)上,其中有3 個(gè)與C 亞基因組上的區(qū)間存在同源性,在這3 個(gè)區(qū)間中共鑒定到26個(gè)已知的油脂代謝相關(guān)基因[37]。Liu 等也利用基因芯片技術(shù)對(duì)521 份油菜資源進(jìn)行種子含油量的GWAS 研究,新發(fā)現(xiàn)了29 個(gè)顯著關(guān)聯(lián)的位點(diǎn),此外,還發(fā)現(xiàn)一個(gè)位于染色體A5 上可提高油菜種子含油量1.5%~1.7%的新位點(diǎn),并進(jìn)行了雙親本的連鎖分析驗(yàn)證[38]。
這些新發(fā)現(xiàn)的遺傳位點(diǎn)可以顯著改善油菜分子育種程序,所鑒定到的候選基因有助于闡明油菜油脂生物合成的機(jī)制,為選育含油量高的材料提供了新的依據(jù)。
為了更好地了解油菜籽中種子脂肪成分和生物合成的遺傳機(jī)制,Gajardo 等采用GWAS 和候選數(shù)量性狀基因座(cQTL)方法鑒定了89 個(gè)冬季甘藍(lán)型油菜種質(zhì);分別發(fā)現(xiàn)種子芥子油苷含量和種子半纖維素含量的17 個(gè)和5 個(gè)顯著關(guān)聯(lián)位點(diǎn);用cQTL 發(fā)現(xiàn)種子芥子油苷含量的4個(gè)顯著關(guān)聯(lián)和種子半纖維素含量的6 個(gè)顯著關(guān)聯(lián)[39]。吳志坤利用GWAS 分析189 個(gè)自交系的油菜的開花期、含油量、芥酸和硫苷含量,共檢測(cè)到與4 個(gè)性狀顯著關(guān)聯(lián)的109 個(gè)位點(diǎn)[40]。李施蒙利用60K SNP 芯片對(duì)520 份甘藍(lán)型油菜的硫苷、芥酸、油酸、亞油酸、亞麻酸和棕櫚酸共6個(gè)品質(zhì)相關(guān)性狀進(jìn)行了GWAS 分析,最終定位到3個(gè)與硫苷代謝途徑相關(guān)基因,15 個(gè)與脂質(zhì)代謝相關(guān)基因[41]。Qu 等也做了類似的研究,確定了62 個(gè)與7個(gè)脂肪酸組成呈顯著相關(guān)的基因組區(qū)域,以及5 個(gè)分別映射到A2、A8、A9、C1 和C3 染色體的共有區(qū)域。發(fā)現(xiàn)了與脂肪酸生物合成有關(guān)的功能候選基因的24 個(gè)直系同源基因,但不包括A8 和C3 同源基因組模塊上的BnɑA.FAE1和BnɑC.FAE1,它們已知在脂肪酸生物合成途徑中具有關(guān)鍵作用,并有潛在的 直 系 同 源 基 因,例 如,LACS9、KCR1、FAB1、LPAT4、KCS17、CER4、TT16和ACBP5)[42]。Zhu 等基于從SLAF-seq(特定基因座擴(kuò)增片段測(cè)序)開發(fā)的201 187個(gè)SNP標(biāo)記,對(duì)芥酸、油酸、亞油酸和亞麻酸進(jìn)行了GWAS 研究,發(fā)現(xiàn)了20個(gè)與脂肪酸生物合成相關(guān)的功能候選基因的直系同源基因,但包括已知的位于A08和C03染色體上的脂肪酸生物合成基因BnɑA. FAE1和BnɑC.FAE1。同時(shí)在芥酸含量,油酸含量和亞油酸含量3 個(gè)性狀中分別檢測(cè)到A08 和C03 染色體上的30 個(gè)SNP 基因座,并發(fā)現(xiàn)108 個(gè)十分有利的等位基因,可增加油酸和亞油酸含量,同時(shí)還可降低芥酸含量[43]。陳聰?shù)壤没旌暇€性模型對(duì)104 份甘藍(lán)型油菜種子中的芥酸、油酸與硫代葡萄糖苷含量進(jìn)行GWAS 分析,結(jié)果發(fā)現(xiàn),與芥酸、油酸含量顯著關(guān)聯(lián)的SNP 標(biāo)記主要也分布在A08 與C03 染色體上,與硫代葡萄糖苷含量顯著關(guān)聯(lián)的標(biāo)記分布在A05、A02 與C09 染色體上[44]。Li等對(duì)芥酸和油酸的研究也得到相同結(jié)果[45],因此認(rèn)為A08、C03含有油菜籽品質(zhì)改良的重要區(qū)段。
這些結(jié)果對(duì)于改良油菜油分品質(zhì)具有十分重要的意義,為揭示甘藍(lán)型油菜的遺傳變異及脂肪酸組成的改善奠定了基礎(chǔ)。
花生(Arɑchis hypogɑeɑ)是十分重要的油料作物之一,因其良好的脂肪酸組分分布和富含高水平的抗氧化成分被公認(rèn)為功能食品[46]。雖然目前種植的花生品種中的油脂含量一般較高,但種質(zhì)之間仍存在明顯差異,即介于31.7%至57.0%之間[47],栽培花生是具有復(fù)雜基因組結(jié)構(gòu)的四倍體植物,有A、B兩個(gè)基因組,且這兩個(gè)基因組間高度同源,并且同源和非同源交換較為普遍[48]。這種基因組的復(fù)雜性使得在關(guān)聯(lián)分析中,檢測(cè)發(fā)現(xiàn)高質(zhì)量的分子標(biāo)記成為難題。但是,目前多位學(xué)者已經(jīng)利用GWAS 分析對(duì)其它同種多倍體物種進(jìn)行了多項(xiàng)研究,表明該技術(shù)在花生中應(yīng)用也是可行的[49]。Wang 等最先利用81 個(gè)SSR 標(biāo)記和2 個(gè)來自脂肪酸去飽和酶2(FAD2)功能性SNP 標(biāo)記對(duì)94 份材料組成的微核心種質(zhì)進(jìn)行了基因分型,分析了這些材料的群體結(jié)構(gòu)及其對(duì)關(guān)聯(lián)分析的影響[50]。Wang 等對(duì)49 個(gè)花生品種利用轉(zhuǎn)錄組分析確定了5458 個(gè)差異表達(dá)基因(DEG),包括2243個(gè)陽性DEG和3215個(gè)陰性DEG參與了油分合成過程。GWAS 研究確定了在5 個(gè)環(huán)境中與種子油含量相關(guān)的48 個(gè)重要的插入/缺失(InDel)標(biāo)記。比較基因組學(xué)和轉(zhuǎn)錄組學(xué)分析檢測(cè)到位于17 條染色體上的147 個(gè)共有基因簇。有趣的是,在3 個(gè)不同的環(huán)境中檢測(cè)到了與A03染色體上的種子油含量相關(guān)的InDel 簇。在A03 上鑒定的候選基因形成一個(gè)單倍型,其中在獨(dú)立群體中發(fā)現(xiàn)可變等位基因的油含量不同。該基因座值得下一步深入研究[49]。Zhang 等 進(jìn) 行 了 涉 及13 382 個(gè)SNP 標(biāo) 記 的GWAS 研究,使用120份不同的花生材料研究了油、蛋白質(zhì)、8個(gè)脂肪酸含量和O/L 比(油酸和亞油酸之比)的遺傳基礎(chǔ),共鑒定到178 個(gè)重要QTL 位點(diǎn),并利用RNASeq分析確定了282個(gè)差異表達(dá)基因,最終根據(jù)基因功能注釋篩選出16 個(gè)與種子脂肪酸代謝和蛋白質(zhì)合成的相關(guān)的候選基因[51]。
這些研究結(jié)果為剖析花生品質(zhì)性狀的遺傳基礎(chǔ)及探究類似于花生這種基因組復(fù)雜、利用傳統(tǒng)育種改良比較困難的作物提供了新的啟發(fā)。
胡麻是我國(guó)北方十分重要的特色油料作物之一,它是油用亞麻和油纖兼用亞麻的俗稱,屬于亞麻科(Linaceae)亞麻屬(Linum)普通亞麻種群(Linum usitɑtissimum)自花授粉二倍體植物[52]。目前,利用GWAS 分析研究胡麻品質(zhì)性狀的案例并不是很多。Soto-Cerda 等最先利用390 個(gè)胡麻資源材料組成的核心種質(zhì)庫,采用2 個(gè)GLM 和3 個(gè)MLM 模型,在158 個(gè)SSR 標(biāo)記和7 個(gè)種子品質(zhì)性狀之間進(jìn)行了關(guān)聯(lián)分析,檢測(cè)出9 個(gè)QTL,其中,與亞油酸和亞麻酸關(guān)聯(lián)的QTL 3個(gè),與硬脂酸、粗脂肪和碘價(jià)關(guān)聯(lián)的QTL 各1 個(gè)[53]。伊六喜利用全基因組重測(cè)序技術(shù)對(duì)269 份胡麻關(guān)聯(lián)群體進(jìn)行GWAS 分析,并通過KEGG、GO、NR、Swiss-port 等數(shù)據(jù)庫進(jìn)行基因功能注釋,獲得胡麻品質(zhì)相關(guān)性狀的19個(gè)顯著SNP 位點(diǎn)及43個(gè)候選基因,其中亞麻酸相關(guān)SNP 位點(diǎn)和候選基因最多[54]。隨后,伊六喜等又用該群體的基因型數(shù)據(jù)和木酚素含量數(shù)據(jù)進(jìn)行GWAS 分析,獲得了13個(gè)顯著關(guān)聯(lián)SNP位點(diǎn)和21個(gè)候選基因[55]。
這些研究結(jié)果為解析胡麻脂肪酸、木酚素等品質(zhì)性狀合成過程中的功能提供了新思路,為提高胡麻營(yíng)養(yǎng)價(jià)值、培育高品質(zhì)胡麻新品種奠定重要基礎(chǔ)。
芝麻(Sesɑmum indicumL.,2n=26)為胡麻科胡麻屬植物,是我國(guó)具有較高經(jīng)濟(jì)價(jià)值的主要油料作物之一[56,57]。早期,岳文娣利用自行開發(fā)的42 對(duì)SSR 分子標(biāo)記從545 份資源中選擇出的371 份核心資源,進(jìn)行遺傳多樣性分析和群體結(jié)構(gòu)分析。結(jié)果顯示這些芝麻材料可劃分成兩大亞群,并檢測(cè)到其中有11個(gè)SSR標(biāo)記與10個(gè)芝麻農(nóng)藝性狀及產(chǎn)量、品質(zhì)相關(guān)性狀穩(wěn)定關(guān)聯(lián)[58]。王肖淑利用112 對(duì)具有明顯多態(tài)的SSR 引物對(duì)國(guó)內(nèi)外369 份芝麻種質(zhì)材料進(jìn)行 基 因 型 鑒 定,Hs1036、Hs485、Hs586、Hs4061、Hs4381、Hs4325 等6 個(gè)標(biāo)記能夠同時(shí)與兩個(gè)或多個(gè)性狀相關(guān)聯(lián),分析原因可能是由性狀間的相關(guān)性或一因多效的遺傳基礎(chǔ)所導(dǎo)致[59]。
由于上述關(guān)聯(lián)分析涉及到的標(biāo)記數(shù)量少,多態(tài)性差,因此并不算真正意義上的GWAS 分析。2014年中國(guó)農(nóng)業(yè)科學(xué)院油料作物研究所張秀榮研究員領(lǐng)銜的芝麻與特色油料遺傳育種創(chuàng)新團(tuán)隊(duì),與中國(guó)科學(xué)院國(guó)家基因研究中心等單位合作,在國(guó)際上率先對(duì)來自29 個(gè)國(guó)家705 份芝麻資源完成了全基因組測(cè)序[60]。隨后,Wei 等構(gòu)建了單倍型圖譜,利用GWAS 分析鑒定獲得6 個(gè)與含油量相關(guān)候選基因,分 別 是SIN_1003248(CXE17)、SIN_1013005、SIN_1019167、SIN_1009923、SIN_1005755(SiNST1)和SIN_1016759(SiPPO),另有一些編碼含油量的酶所關(guān)聯(lián)的候選基因參與了油的代謝[61]。崔承齊利用44 109 個(gè)SNP 標(biāo)記對(duì)363 份芝麻樣本的主要農(nóng)藝性狀和耐漬性狀進(jìn)行GWAS,共檢測(cè)到79 個(gè)關(guān)聯(lián)位點(diǎn),其中28 個(gè)SNP 位點(diǎn)與含油量關(guān)聯(lián),27 個(gè)位點(diǎn)與蛋白含量關(guān)聯(lián),共鑒定到480個(gè)候選基因,其中,6個(gè)為品質(zhì)相關(guān)性狀的重要候選基因,SIN_1006022和SIN_1016759分別屬于細(xì)胞色素P450家族基因和多酚氧化酶基因,SIN_1010914為4-香豆酰輔酶A連接酶基因;SIN_1010859為單甘油酯脂肪酶(monoglyceride lipase);SIN_1003867注釋為乙酰輔酶Aa-轉(zhuǎn)羧酶亞基;SIN_1005755注釋信息為NAC 結(jié)構(gòu)域蛋白(NAC domain-containing protein,43),主要參與調(diào)節(jié)次生細(xì)胞壁的生物合成[62]。
通過對(duì)芝麻種子含油量、脂肪酸成分等品質(zhì)性狀的關(guān)聯(lián)分析,發(fā)現(xiàn)了多個(gè)油脂代謝關(guān)鍵基因,初步解析了芝麻油脂代謝調(diào)控網(wǎng)絡(luò),為芝麻遺傳改良和分子育種提供了新的依據(jù)。
向日葵(Heliɑnthus ɑnnuusL.)為菊科向日葵屬植物。其中油用向日葵是我國(guó)北方食用油的重要來源之一??ㄗ阎兄舅峤M成和含量與大豆、花生等主要油料作物基本相似,但不飽和脂肪酸含量要比其它油料作物高[63]。雖然向日葵的基因組已于2017 公布[64],但是目前利用GWAS 分析進(jìn)行向日葵品質(zhì)相關(guān)性狀的研究還未見報(bào)道,只有少數(shù)研究者進(jìn)行了脂肪酸組分的QTL 定位研究。Kusterer 等在向日葵連鎖群A 上發(fā)現(xiàn)了2 個(gè)油酸和亞油酸含量相關(guān)QTL[65]。Perez-Vich 等以向日葵F2分離群體為材料,在利用80 個(gè)RFLP 和19 個(gè)SSR 標(biāo)記構(gòu)建的遺傳連鎖圖譜上進(jìn)行定位,在LG3、LG11、LG13的連鎖群上發(fā)現(xiàn)3 個(gè)控制硬脂酸(C18:0)含量的QTL,同時(shí)將兩個(gè)硬脂酸脫氫酶基因SAD6、SAD17及兩個(gè)硫脂酶基因FɑtA和FɑtB定位在QTL 圖譜上,并發(fā)現(xiàn)第11 連鎖群上的QTL 為SAD6位點(diǎn)[66]。之后,Premnath等在向日葵連鎖群上定位到3個(gè)與油酸含量相關(guān)的QTL,最終將控制油酸基因定位在第14連鎖群上,發(fā)現(xiàn)該基因和標(biāo)記HO_Fsp_b 緊密連鎖。此外,還定位到了2 個(gè)脂肪和2 個(gè)亞油酸相關(guān)QTL[67]。周菲基于構(gòu)建的向日葵高密度遺傳圖譜,定位到3 個(gè)控制油酸QTL,分別位于第9 連鎖群和第6 連鎖群上。并利用轉(zhuǎn)錄組數(shù)據(jù)篩選出兩個(gè)控制油酸合成的基因FAD2和FAB2[63]。
目前,利用GWAS 揭示向日葵遺傳基礎(chǔ)的研究報(bào)道少之又少,僅馬宇[68]利用GWAS 分析于干旱脅迫下對(duì)122 份油葵資源材料進(jìn)行研究,發(fā)現(xiàn)了20 個(gè)可能與抗旱性相關(guān)的上調(diào)表達(dá)候選基因,說明向日葵群體利用GWAS 進(jìn)行數(shù)量性狀位點(diǎn)的發(fā)掘是可行的,這也為向日葵品質(zhì)性狀相關(guān)基因位點(diǎn)的發(fā)掘提供了參考借鑒。
利用GWAS 對(duì)油料作物品質(zhì)性狀開展研究取得了不少成果,說明GWAS 在油料作物品質(zhì)性狀相關(guān)遺傳位點(diǎn)的挖掘中具有很大的應(yīng)用潛力,GWAS分析在今后分子標(biāo)記輔助選擇育種中的應(yīng)用將更加廣泛。首先,優(yōu)良豐富的種質(zhì)資源是育種的基礎(chǔ)材料,收集和挖掘更多種質(zhì)資源仍然是今后科研工作的重點(diǎn)之一;其次,盡管利用GWAS 分析發(fā)現(xiàn)了大量與控制油料作物品質(zhì)性狀相關(guān)的位點(diǎn),為品質(zhì)性狀分子機(jī)制的解析和分子育種的應(yīng)用提供了理論依據(jù),但是許多位點(diǎn)仍缺乏候選基因的鑒定和驗(yàn)證[69],所以后續(xù)研究中應(yīng)該著重候選基因的鑒定和功能研究;最后,多組學(xué)聯(lián)合分析(基因組、轉(zhuǎn)錄組、蛋白組、代謝組)及轉(zhuǎn)基因技術(shù)的結(jié)合為闡明油料作物品質(zhì)相關(guān)性狀的分子和生理遺傳機(jī)制提供了可能,今后在這方面的科學(xué)探索也將為保證我國(guó)糧油安全,提高國(guó)際市場(chǎng)競(jìng)爭(zhēng)力做出巨大的貢獻(xiàn)。