李樹戰(zhàn),王藝儒,孫 鵬,李華威,傅建敏
(1.中南林業(yè)科技大學(xué) 林學(xué)院,湖南 長沙 410004;2.中國林業(yè)科學(xué)研究院 經(jīng)濟(jì)林研究所,河南 鄭州 450003;3.經(jīng)濟(jì)林種質(zhì)創(chuàng)新與利用國家林草局重點(diǎn)實(shí)驗(yàn)室,河南 鄭州 450003)
柿Diospyros kakiThunb.為柿科Ebenaceae柿屬Diospyros多年生植物,是我國重要的木本糧食樹種,綜合利用價(jià)值高[1]。柿樹起源我國,歷史悠久,分布廣泛,主要產(chǎn)區(qū)為陜西、河南和廣西等地[2]。柿花性復(fù)雜,絕大多數(shù)柿品種為完全雌株,少數(shù)品種為雌雄同株和三全同株,僅有野生資源中含有少量的完全雄株[3]。自然界的缺乏,加上生產(chǎn)上對(duì)雄株不斷改接,使得優(yōu)良授粉父本嚴(yán)重缺乏,限制了雜交育種的開展,目前在日本甜柿中已出現(xiàn)近交衰退現(xiàn)象[4-5]。通常性別類型的進(jìn)化過程是由兩性花株開始,經(jīng)雌全同株或雌雄同株階段分化為雌雄異株,進(jìn)而分化出三全同株或雄全同株[6]。
目前報(bào)道的柿雄全同株性別類型的資源僅有中國林科院經(jīng)濟(jì)林所柿屬植物創(chuàng)新團(tuán)隊(duì)從實(shí)生后代中選育出的‘龍巖野柿1號(hào)’,經(jīng)連年觀測(cè),‘龍巖野柿1號(hào)’花序?yàn)槿浜仙蹅阈危行幕閮尚曰ǖ母怕蚀笥?0%,側(cè)花為兩朵雄花[7]。Li等[8]對(duì)‘龍巖野柿1號(hào)’進(jìn)行組織及形態(tài)學(xué)觀察,確定了雄全同株樣品雄花花芽和兩性花花芽的發(fā)育關(guān)鍵階段,并通過激素含量的測(cè)定和基因表達(dá)量的檢測(cè),確定了花芽分化過程中的關(guān)鍵基因。雄全同株材料的發(fā)現(xiàn)對(duì)闡明柿性別分化機(jī)理和人工培育產(chǎn)生可育花粉的優(yōu)良種質(zhì)具有重要意義,因此,有必要開發(fā)可早期鑒定雄全同株類型的分子標(biāo)記,加快柿分子標(biāo)記輔助育種及良種選育進(jìn)程。
簡(jiǎn)單重復(fù)序列(simple sequence repeat,SSR)一般由1~6個(gè)堿基作為基元重復(fù)串聯(lián)而成的DNA序列,在基因組中具有分布廣泛、多態(tài)性高和結(jié)果穩(wěn)定等優(yōu)點(diǎn)[9-10]。柿屬植物早期通過NCBI上的EST序列等開發(fā)SSR引物,獲得的SSR引物數(shù)量少[11]。隨著高通量測(cè)序技術(shù)的發(fā)展,利用轉(zhuǎn)錄組數(shù)據(jù)可快速、大量鑒定SSR位點(diǎn)的序列信息和分布情況,為尚無參考基因組的物種提供了極大的便利。
目前柿屬植物中利用轉(zhuǎn)錄組開發(fā)SSR引物的報(bào)道較少,僅有杜改改等[12]對(duì)雌雄同株的‘禪寺丸’柿雌雄花芽轉(zhuǎn)錄組和張曉娜等[12]對(duì)君遷子Diospyros lotus葉片轉(zhuǎn)錄組的SSR位點(diǎn)進(jìn)行分析。本研究基于‘龍巖野柿1號(hào)’兩個(gè)發(fā)育關(guān)鍵時(shí)期的雄花花芽和兩性花花芽的轉(zhuǎn)錄組信息,對(duì)雄花或兩性花發(fā)育過程中的基因進(jìn)行SSR位點(diǎn)的序列特征及分布情況分析,不僅可以豐富柿屬植物SSR位點(diǎn)的信息,并且可用于開發(fā)柿性別類型相關(guān)的SSR分子標(biāo)記,以期為雜交后代性別類型早期鑒定的分子輔助育種、親緣關(guān)系分析和遺傳圖譜構(gòu)建等提供基礎(chǔ)數(shù)據(jù)。
試驗(yàn)材料為6年生雄全同株的‘龍巖野柿1號(hào)’,種植于河南省原陽縣中國林業(yè)科學(xué)研究院經(jīng)濟(jì)林研究所原陽基地(34°55′18″~34°56′27″N,113°46′14″~113°47′35″E)。根據(jù)Li等[10]對(duì)‘龍巖野柿1號(hào)’雄花和完全花不同發(fā)育階段的細(xì)胞學(xué)觀察,選取三朵合生花序完全顯現(xiàn)和雄花雌蕊原基敗育2個(gè)階段進(jìn)行轉(zhuǎn)錄組測(cè)序。
使用TRIzol試劑(Invitrogen,Carlsbad,CA,USA)提取花芽總RNA,質(zhì)量檢測(cè)合格后,用Illumina TruSeq RNA樣品制備的試劑盒(Illumina,San Diego,CA,USA)構(gòu)建mRNA測(cè)序文庫。cDNA文庫質(zhì)檢合格后,委托深圳華大基因生物科技有限公司進(jìn)行轉(zhuǎn)錄組測(cè)序,測(cè)序平臺(tái)為BGIseq500平臺(tái)。使用Trinity對(duì)過濾后的clean reads進(jìn)行de novo組裝,在此基礎(chǔ)上對(duì)組裝的轉(zhuǎn)錄本聚類和去冗余,得到unigenes作為參考序列,用于后續(xù)分析[14-15]。轉(zhuǎn)錄組測(cè)序原始數(shù)據(jù)已上傳至NCBI SRA數(shù)據(jù)庫(PRJNA647029)。
采用默認(rèn)參數(shù)運(yùn)行MISA軟件(https://webblast.ipk-gatersleben.de/misa/)[16],搜索的單堿基類型SSR重復(fù)數(shù)≥10、雙堿基類型重復(fù)數(shù)≥6和三、四、五、六堿基類型重復(fù)數(shù)≥5的SSR位點(diǎn),并對(duì)SSR位點(diǎn)的數(shù)量和分布等相關(guān)特征進(jìn)行分析。
‘龍巖野柿1號(hào)’的雄花和兩性花花芽經(jīng)高通量測(cè)序,共獲得了82 910條unigenes,序列總長度為114 119 802,平均長度為1 376 bp。運(yùn)用MISA軟件,在默認(rèn)參數(shù)條件下對(duì)全部unigenes進(jìn)行SSR位點(diǎn)搜索,共獲得38 751個(gè)SSR位點(diǎn),出現(xiàn)頻率為46.74%,SSR位點(diǎn)的平均分布密度為0.34個(gè)/kb,即平均每2.94 kb會(huì)出現(xiàn)1個(gè)SSR。這些SSR位點(diǎn)分布在25 349條unigenes上,發(fā)生頻率為30.57%。其中含有1個(gè)以上SSR位點(diǎn)的unigenes序列有8 481條,占總unigenes序列數(shù)的10.23%;含有復(fù)合型SSR位點(diǎn)的unigenes序列有4 799條,占總unigenes序列數(shù)的5.79%。可以認(rèn)為‘龍巖野柿1號(hào)’雄花及兩性花花芽轉(zhuǎn)錄組中的SSR位點(diǎn)比較豐富。
表1 ‘龍巖野柿1號(hào)’轉(zhuǎn)錄組信息及SSR分析結(jié)果Table 1 Analysis of SSR and information of the D.kaki ‘Longyanyeshi 1’ transcriptome data
對(duì)‘龍巖野柿1號(hào)’轉(zhuǎn)錄組的SSR位點(diǎn)進(jìn)行各重復(fù)類型的數(shù)目、占比及出現(xiàn)頻率等進(jìn)行分析,結(jié)果如表2所示。SSR重復(fù)類型豐富,單堿基重復(fù)類型至六堿基重復(fù)類型均存在,但重復(fù)類型間的SSR位點(diǎn)數(shù)目有較大差異,雙堿基重復(fù)類型SSR位點(diǎn)數(shù)目最多,占總SSR位點(diǎn)數(shù)的50.59%,在unigenes上的出現(xiàn)頻率為50.59%,平均分布距離最近,每5.82 kb就會(huì)出現(xiàn)一個(gè)雙堿基重復(fù)類型SSR位點(diǎn)。五堿基重復(fù)類型SSR位點(diǎn)數(shù)目最少,占總SSR位點(diǎn)數(shù)的0.36%,出現(xiàn)頻率為0.17%,平均分布距離最遠(yuǎn),為815.14 kb。
表2 ‘龍巖野柿1號(hào)’轉(zhuǎn)錄組SSR重復(fù)基元類型數(shù)量和分布Table 2 Number and distribution characteristics of SSR repeat types in the transcriptome of D.kaki ‘Longyanyeshi 1’
‘龍巖野柿1號(hào)’轉(zhuǎn)錄組的38 751條SSR位點(diǎn)共由148種重復(fù)基元構(gòu)成,單堿基重復(fù)至六堿基重復(fù)分別有2、4、10、28、34和70種基元。以AG/CT為重復(fù)基元的SSR數(shù)目最多(13 622個(gè),占比35.15%)),其次為A/T(8 834,22.8%)、
AT/AT(4183,10.79%)、AAG/CTT(3 011,7.77%)和AC/GT(1 737,4.48%)。單堿基重復(fù)以A/T為優(yōu)勢(shì)重復(fù)基元,出現(xiàn)頻率為10.65%;雙堿基重復(fù)的優(yōu)勢(shì)重復(fù)基元為AG/CT,出現(xiàn)頻率為16.43%;三堿基重復(fù)的優(yōu)勢(shì)基元為AAG/CTT,出現(xiàn)頻率為3.63%;四堿基重復(fù)的優(yōu)勢(shì)基元為AAAG/CTTT(174,0.45%),出現(xiàn)頻率為0.21%;五堿基重復(fù)和六堿基重復(fù)的重復(fù)基元類型豐富,但數(shù)量較少,優(yōu)勢(shì)基元分別為AAAAG/CTTTT(35,0.09%)和AGGGCG/CCCTCG(19,0.05%),出現(xiàn)頻率均不足0.1%。另外,在‘龍巖野柿1號(hào)’轉(zhuǎn)錄組中還發(fā)現(xiàn)了以CG/CG(63,0.16%)和CCG/CGG(696,1.80%)為重復(fù)基元的SSR位點(diǎn),出現(xiàn)頻率分別為0.08%和0.84%。
表3 ‘龍巖野柿1號(hào)’轉(zhuǎn)錄組SSR重復(fù)基元序列特征Table 3 Characteristics of SSR motifs in the transcriptome of D.kaki ‘Longyanyeshi 1’
由表4可知,‘龍巖野柿1號(hào)’轉(zhuǎn)錄組SSR位點(diǎn)的基元重復(fù)次數(shù)以5~20為主,占SSR位點(diǎn)總數(shù)的98.47%,且重復(fù)基元的數(shù)量隨重復(fù)次數(shù)的增加呈現(xiàn)降低的趨勢(shì)。單堿基重復(fù)的重復(fù)次數(shù)集中在10~16次,占單堿基重復(fù)類型SSR位點(diǎn)數(shù)的89.34%;雙堿基重復(fù)的重復(fù)次數(shù)集中于6~16次,占雙堿基重復(fù)類型SSR位點(diǎn)數(shù)的93.62%;三堿基重復(fù)至六堿基重復(fù)的重復(fù)次數(shù)均集中于5~8次。低重復(fù)(1~5次)的SSR位點(diǎn)數(shù)有4 779個(gè),占SSR位點(diǎn)總數(shù)的12.33%;較低重復(fù)(6~15次)的SSR位點(diǎn)數(shù)有30 618個(gè),占SSR位點(diǎn)總數(shù)的79.01%;中度重復(fù)(16~20次)和高度重復(fù)(20次以上)的SSR位點(diǎn)數(shù)分別有2 763和591個(gè),占SSR位點(diǎn)總數(shù)的7.13%和1.53%。
表4 ‘龍巖野柿1號(hào)’轉(zhuǎn)錄組SSR不同重復(fù)類型的重復(fù)次數(shù)Table 4 Repeat times of different SSR repeat types in the transcriptome of D.kaki ‘Longyanyeshi 1’
對(duì)‘龍巖野柿1號(hào)’轉(zhuǎn)錄組SSR長度進(jìn)行分析,發(fā)現(xiàn)序列長度變化范圍較大,為10~94 bp(圖1),平均長度為17.78 bp,主要集中于10~30 bp。共有4 406個(gè)SSR序列長度<12 bp,占SSR總數(shù)的11.37%;序列長度介于12~20 bp之間的SSR數(shù)目最多,為22 614個(gè),占比58.36%;11 731個(gè)SSR序列長度≥20 bp,占比30.27%。單堿基重復(fù)類型SSR長度范圍最大,為12~94 bp,平均長度為12.78 bp;雙堿基重復(fù)SSR長度范圍為12~84 bp,平均長度為19.26 bp;三堿基重復(fù)、四堿基重復(fù)和五堿基重復(fù)的SSR序列長度為15~78、20~48和25~40 bp,平均長度分別為19.12、21.93和25.97 bp;六堿基重復(fù)類型SSR長度范圍最小,為30~48 bp,平均長度最長為31.47 bp。
圖1 ‘龍巖野柿1號(hào)’轉(zhuǎn)錄組中的SSR長度分布Fig.1 SSR length distribution in the transcriptome of D.kaki ‘Longyanyeshi 1’
隨著高通量轉(zhuǎn)錄組測(cè)序的發(fā)展,可快速、高效地研究基因的表達(dá)水平、定位功能基因并開發(fā)分子標(biāo)記[17]。本研究對(duì)‘龍巖野柿1號(hào)’雄花花芽和兩性花花芽在兩個(gè)關(guān)鍵發(fā)育期的轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行了SSR序列特征分析,共計(jì)獲得了38 751個(gè)SSR位點(diǎn),分布于25 349條unigenes上,SSR位點(diǎn)在unigenes上的發(fā)生頻率為30.57%,遠(yuǎn)大于同為柿屬植物的君遷子(10.71%)[13]?!垘r野柿1號(hào)’花芽轉(zhuǎn)錄組中的SSR位點(diǎn)平均分布距離為2.94 kb,與‘禪寺丸’柿花芽轉(zhuǎn)錄組中的SSR位點(diǎn)較為接近(2.3 kb)[12],小于柿近緣種君遷子葉片的SSR位點(diǎn)(5.52 kb)[13],平均分布距離的差異可能與柿屬植物間的親緣關(guān)系、采樣組織的測(cè)序深度和拼接質(zhì)量及MISA軟件設(shè)置的參數(shù)等原因相關(guān)[18]?!垘r野柿1號(hào)’轉(zhuǎn)錄組的SSR位點(diǎn)豐富,對(duì)性別分化研究、親緣關(guān)系分析及分子標(biāo)記開發(fā)等具有重要意義。
SSR堿基重復(fù)類型共有6種,且在不同物種中的出現(xiàn)頻率存在明顯差異[19]?!U寺丸’柿以單堿基重復(fù)類型SSR位點(diǎn)數(shù)量最多,占比47.63%[12];君遷子以單堿基重復(fù)和雙堿基重復(fù)類型SSR位點(diǎn)為主,分別占比39.87%和37.22%[13];而‘龍巖野柿1號(hào)’雙堿基重復(fù)類型SSR位點(diǎn)數(shù)目最多,占比23.65%,這與花椰菜[20]、黨參[21]、茶樹[22]和中國櫻桃[23]一致。單堿基重復(fù)和雙堿基重復(fù)類型是柿屬植物主導(dǎo)堿基重復(fù)類型,這與植物轉(zhuǎn)錄組SSR位點(diǎn)常以單堿基、雙堿基和三堿基重復(fù)為優(yōu)勢(shì)重復(fù)類型的規(guī)律相一致[24]。在搜索到的全部SSR位點(diǎn)中,單堿基、雙堿基和三堿基重復(fù)類型分別以A/T、AG/CT和AAG/CTT為優(yōu)勢(shì)重復(fù)基元,與柿屬植物君遷子和柿‘禪寺丸’一致,與茶樹[25]和楠木[26]完全一致,但在雙堿基和三堿基重復(fù)上分別與苦楝[27]和草原1號(hào)雜花苜蓿[19]有所區(qū)別,可能與不同物種間編碼蛋白的使用差異有關(guān)[28]。另外,在‘龍巖野柿1號(hào)’轉(zhuǎn)錄組數(shù)據(jù)中還檢索到了63個(gè)高等植物中不常見的以CG/CG為重復(fù)基元的SSR位點(diǎn),遠(yuǎn)高于臘梅[29](6個(gè))、杜仲[30](1個(gè))和甘藍(lán)[31](1個(gè)),還檢索到了696個(gè)雙子葉植物不常出現(xiàn)的以CCG/CGG為重復(fù)基元的SSR位點(diǎn),這些SSR位點(diǎn)的出現(xiàn)可能與抗逆和代謝等特定的生理功能有關(guān),也表明‘龍巖野柿1號(hào)’SSR位點(diǎn)較為豐富,可據(jù)此開發(fā)更多特異的SSR分子標(biāo)記。
SSR位點(diǎn)的多態(tài)性是對(duì)其應(yīng)用價(jià)值進(jìn)行評(píng)價(jià)的重要指標(biāo),影響SSR序列多態(tài)性的主要因素包括基元長度和基元重復(fù)次數(shù)。對(duì)‘龍巖野柿1號(hào)’轉(zhuǎn)錄組中SSR重復(fù)次數(shù)進(jìn)行分析,發(fā)現(xiàn)重復(fù)次數(shù)范圍較大,但以5~20為主,且SSR位點(diǎn)的數(shù)目隨著重復(fù)次數(shù)的增加呈現(xiàn)降低的趨勢(shì)。高級(jí)重復(fù)類型SSR位點(diǎn)(四、五和六堿基重復(fù))的多態(tài)性普遍低于低級(jí)重復(fù)類型(單、二和三堿基重復(fù))[32]。‘龍巖野柿1號(hào)’轉(zhuǎn)錄組中雙堿基重復(fù)類型SSR的基元重復(fù)次數(shù)跨度較大并且重復(fù)次數(shù)相對(duì)較多,這一類型的SSR位點(diǎn)可能具有較高的多態(tài)性。另外,SSR序列長度<12 bp多態(tài)性較低,序列長度12~20 bp多態(tài)性中等,序列長度≥20 bp多態(tài)性較高[32]。‘龍巖野柿1號(hào)’轉(zhuǎn)錄組中序列長度≥20 bp的SSR位點(diǎn)占比30.27%,遠(yuǎn)高于‘禪寺丸’柿[12](13.15%)、美國紅楓[33](11.27%)、大花序桉[34](16.12%)和銀杏[35](11.44%)?!垘r野柿1號(hào)’轉(zhuǎn)錄組中的這些多態(tài)性較高的SSR位點(diǎn)具有較高的應(yīng)用價(jià)值,在柿屬植物的分子標(biāo)記開發(fā)過程中具有較大的潛能。
綜上所述,雄全同株柿‘龍巖野柿1號(hào)’轉(zhuǎn)錄組SSR位點(diǎn)堿基重復(fù)類型以單堿基重復(fù)、雙堿基重復(fù)和三堿基重復(fù)為主,較為豐富,且30.27%的SSR序列長度≥20 bp,多態(tài)性強(qiáng),說明利用價(jià)值較高。但目前本項(xiàng)研究?jī)H對(duì)轉(zhuǎn)錄組獲得的序列進(jìn)行SSR位點(diǎn)搜索和特征分析,并未根據(jù)SSR位點(diǎn)信息進(jìn)行引物開發(fā)和驗(yàn)證,這也是后續(xù)擬開展的研究?jī)?nèi)容,即根據(jù)該研究獲得的SSR位點(diǎn),針對(duì)不同性別類型,設(shè)計(jì)對(duì)應(yīng)的SSR分子標(biāo)記,用于雜交后代性別類型早期鑒定及遺傳多樣性分析。
本項(xiàng)研究基于‘龍巖野柿1號(hào)’2個(gè)發(fā)育關(guān)鍵時(shí)期的雄花和兩性花花芽轉(zhuǎn)錄組的測(cè)序數(shù)據(jù),檢索轉(zhuǎn)錄水平上的SSR位點(diǎn),并進(jìn)行序列特征和分布情況的分析,在25 349條unigenes上獲得了38 751條SSR序列,發(fā)生頻率高(30.57%),共有11 731個(gè)SSR位點(diǎn)的序列長度≥20 bp(30.27%)。重復(fù)基元類型豐富,單至六堿基重復(fù)基元類型均有分布,以單、雙和三堿基重復(fù)為主,序列長度≥20 bp的SSR位點(diǎn)占比30.27%,有較高多態(tài)性潛能的SSR位點(diǎn)。據(jù)此可以認(rèn)為‘龍巖野柿1號(hào)’雄花和兩性花花芽轉(zhuǎn)錄組獲得的SSR位點(diǎn)具有較大的應(yīng)用潛力,對(duì)后期種質(zhì)資源遺傳多樣性分析、性別類型相關(guān)分子標(biāo)記的開發(fā)、雜交后代早期鑒定及分子標(biāo)記輔助育種具有重要意義。
中南林業(yè)科技大學(xué)學(xué)報(bào)2022年9期