陶愛芬 游梓翊 徐建堂 林荔輝 張立武 祁建民,* 方平平,*
1 福建農(nóng)林大學(xué)金山學(xué)院, 福建福州 350002; 2 福建農(nóng)林大學(xué)教育部作物遺傳育種與綜合利用重點實驗室 / 福建省分子設(shè)計育種實驗室, 福建福州 350002
黃麻屬于椴樹科(Tiliaceae)黃麻屬(CorchorusL.)一年生草本植物, 其韌皮纖維具有易降解、透氣性強、吸水性好等優(yōu)點。近年來, 黃麻纖維被廣泛應(yīng)用于建材和可降解地膜等產(chǎn)業(yè)[1]。但與苧麻、亞麻等相比, 黃麻韌皮纖維細胞壁木質(zhì)化程度較高、纖維素含量較低, 導(dǎo)致纖維粗、硬, 品質(zhì)不佳, 使其只適合加工繩索和包裝用麻袋等, 限制了黃麻在紡織業(yè)等工業(yè)領(lǐng)域的應(yīng)用[2]。目前, 國內(nèi)外研究人員已克隆了包括4CL 和COMT 在內(nèi)的多個木質(zhì)素生物合成途徑中的關(guān)鍵酶基因[3]。而 MYB (V-myb avian myeloblastosis viral oncogene homolog)轉(zhuǎn)錄因子是植物轉(zhuǎn)錄因子家族中最大的成員之一, 它參與并對植物生長和發(fā)育的各個方面產(chǎn)生重大影響, 在植物次生代謝調(diào)節(jié)、激素和環(huán)境因子反應(yīng)、細胞分化、器官形態(tài)發(fā)生和細胞周期調(diào)節(jié)中均有重要作用[4]。若能開發(fā)出與黃麻木質(zhì)素合成和MYB 轉(zhuǎn)錄因子相關(guān)的標記, 則將為黃麻種質(zhì)資源鑒定、育種親本選配和遺傳學(xué)研究等提供重要方法。
生物的遺傳因子受到多個因素的影響, 并在基因組水平上產(chǎn)生一定的波動。而分子標記技術(shù)是直接反映DNA 分子水平多態(tài)性的技術(shù), 與其他標記相比, 具有無表型效應(yīng)、分布廣、多態(tài)性高等優(yōu)點, 并且不受環(huán)境的影響[5-6]。近年來取得長足發(fā)展的轉(zhuǎn)錄組測序技術(shù), 具有通量高、分辨率高、不受限制等優(yōu)點[7-8]。利用該技術(shù)可以獲得大量潛在的 SNP(Single Nucleotide Polymorphism)和 SSR (Simple Sequence Repeat)標記, 并用于各種分子生物學(xué)研究[9-10]。與其他標記方法相比, SNP 標記遺傳穩(wěn)定性高、位點分布廣泛且富有代表性, 因此已成為當前研究最多的分子標記之一[11-12]。雖然SNP 的檢測方法眾多, 但大部分方法均有其不足, 例如操作繁瑣或者成本過高, 從而限制了其在植物遺傳育種領(lǐng)域的應(yīng)用[13-14]。其中較經(jīng)濟并且適合常規(guī)分子生物學(xué)實驗的方法, 是把SNP 多態(tài)轉(zhuǎn)化成酶切擴增多態(tài)性(Cleaved Amplified Polymorphic Sequences, CAPS)標記或衍生CAPS (Derived Cleaved Amplified Polymorphic Sequences, dCAPS)標記[15]。王彩芬等[16]和司文潔等[17]研究表明, CAPS 標記技術(shù)具有多態(tài)性高、共顯性、所需DNA 量少、操作簡便、結(jié)果穩(wěn)定可靠等優(yōu)點。CAPS 分子標記技術(shù)建立以來, 已經(jīng)在水稻、小麥、玉米、大豆、番茄、馬鈴薯等作物中得到廣泛應(yīng)用[18-21]。
目前, 分子標記技術(shù)已廣泛應(yīng)用于黃麻遺傳多樣性分析、起源與演化、遺傳連鎖圖譜構(gòu)建等研究上[22-26]。關(guān)于黃麻分子標記的開發(fā)已取得一些進展,例如SSR 標記[27-29]、SNP 標記[30-31]都已被開發(fā)利用,但是關(guān)于黃麻CAPS 標記的開發(fā), 未見有相關(guān)文獻報道, 而與黃麻木質(zhì)素合成基因和MYB 轉(zhuǎn)錄因子相關(guān)的CAPS 標記的開發(fā)與驗證, 更是未見報道。鑒于CAPS 分子標記的優(yōu)點及其在黃麻上開發(fā)應(yīng)用的滯后性, 開展該研究是十分必要的。
表1 用于CAPS 引物多態(tài)性驗證的黃麻品種名稱和類型Table 1 Name and type of jute accessions used in the validation of CAPS markers
1.1.1 植物材料 用于轉(zhuǎn)錄組測序的黃麻材料為黃麻179 和愛店野生種。2017年4月種植于福建農(nóng)林大學(xué)田間科技園, 采用盆栽栽培, 每盆10 株, 3 次重復(fù), 出苗后30 d, 真葉長到7~8 片時, 取莖和葉混合進行轉(zhuǎn)錄組測序。用于CAPS 多態(tài)性引物篩選驗證的12 份黃麻種質(zhì)資源的名稱和類型見表1。所有材料均為盆栽, 于2017年8月份播種, 每盆10 株,置自然條件下生長, 長至5~6 片真葉時, 取幼嫩葉片混合后提取DNA。
1.1.2 試劑及儀器 DNA 提取試劑盒、限制性內(nèi)切酶等購自北京百泰克生物技術(shù)有限公司, 其他常用試劑為實驗室分析純常規(guī)試劑; PCR 儀為德國Eppendorf 公司的MC-gradient; 電泳儀購自六一儀器廠(北京), 型號為DYY-6。
1.2.1 黃麻轉(zhuǎn)錄組測序和SNP 位點鑒別 基于Illumina HiSeq 4000 測序技術(shù)平臺, 構(gòu)建黃麻轉(zhuǎn)錄組文庫并進行建庫測序, 獲得黃麻轉(zhuǎn)錄組數(shù)據(jù)。在轉(zhuǎn)錄組測序的基礎(chǔ)上, 采用GATK 針對RNA-Seq的SNP 識別流程, 進行SNP 多態(tài)性位點識別[32], 識別標準是, (1) 35 bp 范圍內(nèi)連續(xù)出現(xiàn)的單堿基錯配不超過3 個; (2)經(jīng)過序列深度標準化的SNP 質(zhì)量值大于2.0。
1.2.2 與4CL、COMT 和MYB 轉(zhuǎn)錄因子相關(guān)的黃麻SNP 引物設(shè)計 在黃麻轉(zhuǎn)錄組序列中, 尋找與木質(zhì)素合成酶基因4CL 和COMT 以及MYB 轉(zhuǎn)錄因子相關(guān)的unigene, 并采用Oligo 8 設(shè)計SNP 引物, 主要參數(shù)為: (1)引物長度在18~25 bp 之間; (2) PCR 預(yù)期擴增產(chǎn)物大小在100~500 bp 之間; (3)退火溫度(Tm)在53~58℃之間, 上、下游引物的Tm值相差不大于4℃; (4)GC 含量在40%~60%之間。
1.2.3 CAPS 標記開發(fā)及內(nèi)切酶的選擇 采用dCAPS Finder 2.0 進行CAPS 引物開發(fā)和內(nèi)切酶的選擇, 主要步驟為, (1)在黃麻unigene 序列中尋找與CAPS 標記的PCR 擴增體系中SNP 引物相對應(yīng)的unigene 片段; (2)選取其SNP 位點前后各30 bp 長度的堿基序列; (3)將SNP 位點原序列和突變序列分別輸入 dCAPS Finder 2.0 的對話框中, 尋找可以對位點進行切割的限制酶, 其對應(yīng)的標記即為基于SNP的CAPS 標記。
1.2.4 黃麻DNA 的提取 采用北京百泰克生物公司的BioTeke 試劑盒, 按說明書提取DNA。
1.2.5 CAPS 標記的PCR 擴增體系構(gòu)建 采用束永俊等[14]的CAPS 標記的PCR 擴增程序, 反應(yīng)體系為20 μL, 包含DNA 2 μL、上下游引物各1 μL、PRR MIX 10 μL、無菌水6 μL。PCR 程序為95℃預(yù)變性3 min; 95℃變性30 s, 53℃退火30 s, 74℃延伸45 s,共9 個循環(huán); 95℃變性30 s, 53℃退火45 s, 72℃延伸45 s, 共14 個循環(huán); 最后72℃延伸10 min, 4℃保存。
1.2.6 限制性核酸內(nèi)切酶的酶切反應(yīng) 按照內(nèi)切酶的使用說明書構(gòu)建限制性酶切反應(yīng)體系, 反應(yīng)體系可分為省時酶和非省時酶2 種。
1.2.7 瓊脂糖凝膠電泳 用1.2%的瓊脂糖凝膠檢測擴增和酶切產(chǎn)物, 電泳電壓為100 V, 電流為100 mA, 電泳時間為40 min, 電泳完成后用培清600 型凝膠成像儀觀察條帶并拍照記錄。
1.2.8 數(shù)據(jù)統(tǒng)計分析 按照擴增和酶切條帶的有無計數(shù), 當某一條帶出現(xiàn)時賦值為“1”, 不存在時賦值為“0”, 從而把圖形資料轉(zhuǎn)換成數(shù)據(jù)資料。參照Nei 等[33]的方法求得品種之間的遺傳距離, 然后用DPS 軟件中的類平均聚類法(UPGMA)對12 份黃麻種質(zhì)進行聚類分析。
黃麻轉(zhuǎn)錄組經(jīng)組裝后共獲得72,674 條unigene序列, 檢測到的SNP 位點總數(shù)為67,567 個, 序列總長度為29,705,997 bp。在黃麻unigene 序列中, 平均每440 bp 會有一個SNP 位點。SNP 位點分布密度如表2 和圖1 所示。由表2 可知, 含0~1 個SNP 位點的unigene 序列最多, 有66,525 條, 占總數(shù)的91.53%;含2 個以上SNP 位點的unigene 序列數(shù)目急劇下降,其中含1~2 個SNP 位點的unigene 序列有2092 條,比例為2.88%; 含2~3 個SNP 位點的unigene 序列有1277 條, 占1.76%; 含3 個以上SNP 位點的unigene序列總數(shù)亦較少, 有2780 條, 比例為3.81%。表明絕大多數(shù)黃麻unigene 上含有單個SNP 位點, 含有2個及以上SNP 位點的unigene 數(shù)量不多, 總計約8%左右, 其中含5~8 個SNP 位點的unigene 數(shù)量尤其少, 比例非常低。
在對與黃麻木質(zhì)素合成基因4CL、COMT 及MYB 轉(zhuǎn)錄因子相關(guān)的unigene 分析的基礎(chǔ)上, 共獲得39 對與上述基因及轉(zhuǎn)錄因子相關(guān)的SNP 引物(表3)。其中和4CL 相關(guān)的SNP 引物最少, 僅有6 對, 和COMT 相關(guān)的有15 對, 數(shù)量居中, 而與MYB 轉(zhuǎn)錄因子相關(guān)的最多, 有 18 對。在此基礎(chǔ)上, 采用dCAPS Finder 2.0 軟件開發(fā)基于SNP 位點的CAPS標記, 共獲得26 對有酶切位點的CAPS 標記(表4),開發(fā)比率為66.7%, 這26 對CAPS 標記分別具有能被SspI、ClaI 和MseI 等17 種內(nèi)切酶識別的位點。
表2 黃麻unigene 中SNP 位點的分布密度表Table 2 Distribution density of SNP loci in the unigenes of jute
圖1 黃麻unigene 中SNP 位點分布的趨勢圖Fig. 1 Trend of SNP loci distribution in the unigenes of jute
由表4 可知, 在26 對CAPS 引物中, 僅有3 對與黃麻木質(zhì)素合成基因4CL 相關(guān), 比例為11.5%,其對應(yīng)的unigene 序列僅有一條, 即unigene_17597,能識別位點的內(nèi)切酶種類也僅有一種, 為SspI; 有9 對CAPS 引物與COMT 相關(guān), 占34.6%, 數(shù)量居中,它們分別與 unigene_04800、unigene_09002 和unigene_08713 等3 條unigene 序列相對應(yīng), 能識別變異位點的內(nèi)切酶也分別有3 種, 即ClaI、BsiYI和AvaIII; 而與MYB 轉(zhuǎn)錄因子相關(guān)的CAPS 標記最多, 有14 對, 占總數(shù)的53.8%, 其對應(yīng)的unigene 序列有 14 條, 各不相同, 除 MYBCAPS8 和MYBCAPS13 對應(yīng)的內(nèi)切酶均為SecI 之外, 其他內(nèi)切酶種類也均有所不同。表明在3 種CAPS 標記中,與MYB 轉(zhuǎn)錄因子相關(guān)的CAPS 標記具有多樣化的、可以被多種內(nèi)切酶識別的SNP 變異位點。
表3 39 對SNP 引物的編號、名稱及序列Table 3 Name and sequence of 39 pairs of SNP primers
(續(xù)表3)
表4 CAPS 引物名稱、對應(yīng)的unigene 編號及內(nèi)切酶名稱Table 4 Name, corresponding unigene code, and endonuclease name of CAPS primers
(續(xù)表4)
對上述26 對CAPS 引物進行PCR 擴增和酶切處理表明, 有11 對CAPS 引物的PCR 產(chǎn)物可以被酶切開來, 得到多態(tài)性條帶(表4 中黑體字標注, 擴增結(jié)果見圖2), 占總數(shù)的42.31%, 而另外15 對引物的PCR 產(chǎn)物無法被酶切開, 雖然有清晰的條帶但沒有多態(tài)性。在多態(tài)性CAPS 引物中, 與木質(zhì)素合成酶基因COMT 相關(guān)的引物有6 對(54.5%), 與MYB 轉(zhuǎn)錄因子相關(guān)的引物有5 對(45.5%), 二者數(shù)量相當, 而未獲得和4CL 相關(guān)的多態(tài)性CAPS 標記引物。
以12 個黃麻品種為材料, 對所篩選的11 對CAPS 標記的有效性進行驗證。聚類分析表明(圖3),在遺傳相似系數(shù)為0.5 處畫線時, 12 個黃麻品種被區(qū)分為2 個不同的類群, 第I 個類群包括7 個品種, 除“日本5 號”外, 其他6 個品種均為圓果種黃麻; 第II個類群包括5 個黃麻品種, 均為長果種黃麻。由此可見, 所用的黃麻材料大致有按2 個不同栽培類型,即長果種和圓果種黃麻區(qū)分的趨勢。來自日本的圓果種黃麻“日本大分青皮”和長果種黃麻“日本5 號”被聚在一起, 推測這2 個品種雖然屬于不同的栽培類型, 但其木質(zhì)素合成相關(guān)的基因以及MYB 轉(zhuǎn)錄因子均可能有很高的相似性, 因而聚在同一個小類群中。同時進一步細分發(fā)現(xiàn), 在第I 個類群中, “臺灣加利麻”和“龍溪長果”又各自成一類, 沒有和其他品種的黃麻聚在一起, 推測這2 個品種的木質(zhì)素合成相關(guān)的基因以及MYB 轉(zhuǎn)錄因子較為特殊, 與其他品種有所區(qū)別。綜上所述, 所篩選出來的11 對CAPS多態(tài)性標記, 可以將12 份不同類型的黃麻品種較好地區(qū)別開來, 驗證了所開發(fā)的CAPS 標記的有效性和可行性。
圖2 COMT CAPS1-3 引物擴增和酶切結(jié)果Fig. 2 Amplified and enzyme digestion result of CAPS primer COMT CAPS1-3
圖3 12 份黃麻品種基于CAPS 標記的聚類圖Fig. 3 Dendrogram of 12 jute accessions based on CAPS markers
SNP 是由單堿基突變引起的DNA 序列多態(tài)性,具有數(shù)量豐富、分布廣泛、覆蓋度高等特點[34]。黃麻轉(zhuǎn)錄組序列中共檢測到67,567 個SNP 位點, 平均每440 bp 出現(xiàn)一個SNP 位點, 與其他作物相比較,出現(xiàn)的頻率較低。前人研究表明, 水稻基因組中約268 bp 存在1 個SNP[35], 玉米基因組中每60~120 bp就存在1 個SNP[36], 大豆基因組中每185~266 bp 有1 個SNP[37], 而茶樹基因組中平均每172 bp 有1 個SNP[38]。SNP 出現(xiàn)的頻率, 第一, 與物種本身基因組的差異有關(guān), 不同物種不同。第二, 存在于非編碼序列中的SNP 會提高SNP 出現(xiàn)的頻率[39], 而黃麻中存在于非編碼序列的SNP 位點較少, 導(dǎo)致其出現(xiàn)的頻率降低。第三, 試驗樣本大小及測序長度也會影響SNP 的頻率[40], 今后應(yīng)進一步增加黃麻轉(zhuǎn)錄組的測序長度, 以提高SNP 的頻率。
本試驗的CAPS 標記是在前期黃麻轉(zhuǎn)錄組序列中SNP 位點的基礎(chǔ)上開發(fā)的。SNP 標記因為在基因組中分布廣泛、遺傳穩(wěn)定等特點, 在植物遺傳育種研究方面有巨大的優(yōu)勢, 但是由于檢測手段的限制,阻礙了SNP 標記的廣泛應(yīng)用。而CAPS 方法無需昂貴的設(shè)備、操作簡單, 可以實現(xiàn)中通量的 SNP 檢測,因而可以大大促進SNP 標記在植物遺傳育種中的應(yīng)用[38]。本研究以39 對SNP 引物為基礎(chǔ), 獲得了26對CAPS 標記, 開發(fā)成功的比率為66.7%, 與柑橘(65%)和水稻(67.8%)的成功率相似[17,41], 但低于茶樹和大豆SNP 快速轉(zhuǎn)化為CAPS 方法的比例(81.8%和 86.21%), 高于大豆傳統(tǒng)方法轉(zhuǎn)化的比例(52.51%)[14]。造成這種差異的原因, 首先與酶切位點選擇和分析的標準有關(guān), 嚴格的酶切位點選擇和分析標準, 可以提高轉(zhuǎn)化的成功率[38]; 其次, 由于某些SNP 并未引起限制性內(nèi)切酶識別位點的改變, 不能直接使用內(nèi)切酶進行檢測; 再次, 若在同一擴增產(chǎn)物中存在多個與SNP 所在酶切識別位點相同的酶切位點, 直接使用內(nèi)切酶檢測難以分辨[19]。另外, 多態(tài)性CAPS 引物所占的比率為42.3%, 也比較低。原因可能是本研究開發(fā)的CAPS 引物是和4CL、COMT等木質(zhì)素合成酶基因及MYB 轉(zhuǎn)錄因子相關(guān)的, 針對性和目的性較強, 而所用的供試材料在這些位點僅有部分多態(tài)性, 從而導(dǎo)致多態(tài)性引物的比率降低。也有可能是物種本身的特異性引起的, 潛宗偉等研究亦表明, 分子標記引物的多態(tài)性比率因物種不同而有所差異[42]。
所開發(fā)的CAPS 標記引物可以將供試的12 份黃麻種質(zhì)較好地區(qū)別開來, 供試材料有大致按栽培類型, 即長果種黃麻和圓果種黃麻聚類的趨勢。同時,來自日本的2 個品種聚在一起, 體現(xiàn)了按種質(zhì)地理來源聚類的特點。另外, 基于CAPS 標記的聚類分析也能鑒別出個別特異的種質(zhì)類型, 如臺灣加利麻。以上結(jié)果均表明, 所開發(fā)的CAPS 標記在黃麻遺傳多樣性分析上是有效和可行的, 且可用于黃麻種質(zhì)資源鑒定等研究, 為黃麻雜交育種親本選配提供理論依據(jù)。綜上所述, 本試驗所開發(fā)的黃麻CAPS標記是黃麻遺傳育種研究中的一項理想的分子標記方法, 可為黃麻分子標記輔助育種和性狀改良提供有效方法。
對黃麻轉(zhuǎn)錄組序列中的SNP 位點進行了分析,發(fā)現(xiàn)平均每440 bp 出現(xiàn)一個SNP 位點, 其分布頻率低于其他作物, 推測與物種之間的基因組差異性有關(guān), 而黃麻中存在于非編碼序列的SNP 位點較少也是影響因素之一。同時, 設(shè)計了與黃麻木質(zhì)素合成基因4CL、COMT 及轉(zhuǎn)錄因子MYB 相關(guān)的39 對SNP引物, 并以此為基礎(chǔ)開發(fā)了26 對CAPS 標記, 開發(fā)成功率為66.7%, 其中11 對CAPS 標記具有多態(tài)性,多態(tài)性比例為43.2%。開發(fā)的CAPS 標記能較好地將12 份不同類型的黃麻種質(zhì)按栽培類型區(qū)分開來,同時亦能鑒別出特異種質(zhì), 表明所開發(fā)的CAPS 是適用于黃麻種質(zhì)資源鑒定的較理想的分子標記方法,可為黃麻雜交育種親本選配提供理論依據(jù), 同時也為黃麻分子標記輔助選擇育種提供了有效方法。