葉新如,張前榮,陳敏氡,王 彬,劉建汀,朱海生,溫慶放
(福建省農(nóng)業(yè)科學(xué)院 作物研究所,福建 福州 350013)
冬瓜(BenincasahispidaCogn.)原產(chǎn)于中國(guó)南部、東南亞以及印度等地,分布于亞洲的熱帶、亞熱帶及溫帶地區(qū)[1],在中國(guó)有1 500多年的栽培歷史。其作為我國(guó)重要的蔬菜品種,對(duì)調(diào)節(jié)蔬菜淡季品種稀少、保證蔬菜周年供應(yīng)有著非常重要的作用。冬瓜產(chǎn)量高,花、葉、果皮、果肉、種子等都具有很好的藥食兼用價(jià)值[2],能夠用于治療咳嗽[3]、消化性潰瘍[4]、高血壓、炎癥[3]等。前人對(duì)冬瓜的研究局限在栽培技術(shù)[4-5]、藥用開(kāi)發(fā)[6-9]、營(yíng)養(yǎng)價(jià)值[10-11]、遺傳育種[12-14]等方面,而關(guān)于冬瓜基因組學(xué)的研究極少,有關(guān)冬瓜重要經(jīng)濟(jì)性狀分子機(jī)制的研究進(jìn)展緩慢。
轉(zhuǎn)錄組是特定的細(xì)胞或組織在某一發(fā)育階段或功能狀態(tài)下轉(zhuǎn)錄出的所有RNA總和[15]。目前,基于高通量測(cè)序的轉(zhuǎn)錄組分析成為功能基因研究的主要方法[16-17]。該技術(shù)也被廣泛應(yīng)用于植物上,如擬南芥[18]、玉米[19]、香椿[20]、紫色黃秋葵[21],但在冬瓜上鮮有關(guān)于轉(zhuǎn)錄組測(cè)序的報(bào)道。
本研究以冬瓜嫩葉為材料,利用Illumina HiSeqTM2000技術(shù)對(duì)其進(jìn)行轉(zhuǎn)錄組測(cè)序,獲得冬瓜轉(zhuǎn)錄組序列、遺傳變異等信息,從中挖掘冬瓜的基因數(shù)據(jù)和SSR分子標(biāo)記,以期為后續(xù)研究提供數(shù)據(jù)支撐。
試驗(yàn)材料為“黑皮冬瓜”,統(tǒng)一播種于福建省農(nóng)業(yè)科學(xué)院作物研究所福清市東張鎮(zhèn)蔬菜科研基地。采用穴盤(pán)育苗,待植株長(zhǎng)至三葉一心時(shí),取成型的嫩葉3片,等量混樣進(jìn)行轉(zhuǎn)錄組測(cè)序,測(cè)序由廣州基迪奧生物有限公司完成。
冬瓜總RNA提取采用Trizol Reagent法,并對(duì)RNA純度、品質(zhì)進(jìn)行檢測(cè)。若提取的RNA序列滿足如下條件: OD260/OD280在1.8~2.2,OD260/OD230≥2,28S/18S≥1,RNA完整值(RIN)≥7.5,則認(rèn)為RNA符合建庫(kù)測(cè)序標(biāo)準(zhǔn)。
提取冬瓜總RNA后,用帶有Oligo(dT)的磁珠富集冬瓜mRNA。以mRNA為模板,用六堿基隨機(jī)引物(random hexamers)合成第一條cDNA鏈;然后加入緩沖液、dNTPs、RNase H和DNA polymerase Ⅰ合成第二條cDNA鏈;經(jīng)QiaQuick PCR試劑盒純化及EB緩沖液洗脫后做末端修復(fù),加poly(A)并連接測(cè)序接頭;最后進(jìn)行PCR擴(kuò)增,建好的測(cè)序文庫(kù)用Illumina HiSeqTM2000進(jìn)行測(cè)序。
利用Illumina HiSeqTM2000測(cè)序平臺(tái)對(duì)建立好的冬瓜轉(zhuǎn)錄組文庫(kù)進(jìn)行測(cè)序,得到原始序列(raw reads),其中含有低品質(zhì)、重復(fù)測(cè)序以及接頭污染的序列,因此必須進(jìn)行嚴(yán)格過(guò)濾,去除低品質(zhì)序列,獲得干凈序列(clean reads);統(tǒng)計(jì)干凈序列的長(zhǎng)度、數(shù)量、GC含量等。使用組裝軟件Trinity進(jìn)行拼接,將有重疊信息(overlap)的序列連接成長(zhǎng)片段(conting),通過(guò)不斷地延伸,拼接組裝成轉(zhuǎn)錄本(Transcript),然后使用Tgicl軟件對(duì)轉(zhuǎn)錄本進(jìn)行去冗余聚類,最終獲得單基因簇(Unigene)。利用RPKM法對(duì)單基因簇表達(dá)量進(jìn)行計(jì)算分析,其計(jì)算公式為:
RPKM=C×106/(NL/103)。
式中:C為比對(duì)到基因的reads數(shù),N為比對(duì)到所有基因的總reads數(shù),L為基因的堿基數(shù)。
通過(guò)Blastx[22]將冬瓜的單基因簇序列與公共數(shù)據(jù)庫(kù)(E值<1×10-5,E值為單基因簇與數(shù)據(jù)庫(kù)中匹配序列為同源序列的假陽(yáng)性概率)進(jìn)行比對(duì),得到與給定單基因簇具有最高序列相似性的蛋白,從而獲得該單基因簇的蛋白功能注釋信息。公共數(shù)據(jù)庫(kù)包括非冗余蛋白數(shù)據(jù)庫(kù)(nonredundant protein database,Nr)、蛋白質(zhì)序列數(shù)據(jù)庫(kù)(Swiss Prot protein database,Swiss Prot)、基因本體論數(shù)據(jù)庫(kù)(gene ontology,GO)、蛋白質(zhì)真核同源數(shù)據(jù)庫(kù)(eukaryotic orthologous groups,KOG)、東京基因與基金組百科全書(shū)(Kyoto encyclopedia of genes and genomes,KEGG)、蛋白質(zhì)家族域數(shù)據(jù)庫(kù)(protein families database,Pfam)。
通過(guò)Blastx軟件將冬瓜單基因簇序列比對(duì)至Nr數(shù)據(jù)庫(kù),可獲得冬瓜單基因簇對(duì)應(yīng)的蛋白編碼序列。將冬瓜單基因簇與Swiss Prot數(shù)據(jù)庫(kù)比對(duì),可確定冬瓜基因簇的功能。利用Blast2 GO和WE GO軟件對(duì)冬瓜單基因簇序列進(jìn)行GO注釋及功能分類統(tǒng)計(jì),同時(shí)與KOG數(shù)據(jù)庫(kù)比對(duì)注釋,可統(tǒng)計(jì)冬瓜基因功能和分類信息。在KEGG數(shù)據(jù)庫(kù)中對(duì)冬瓜單基因簇進(jìn)行相似性分析,可獲得冬瓜單基因簇代謝通路的注釋和預(yù)測(cè)。利用Hmmer 3.0將冬瓜單基因簇與Pfam蛋白結(jié)構(gòu)數(shù)據(jù)庫(kù)進(jìn)行比對(duì),可獲得冬瓜單基因簇的注釋信息。
將冬瓜蛋白序列與TF 數(shù)據(jù)庫(kù)(plant TFdb/animal TFdb)進(jìn)行 hmmscan 比對(duì),可獲得相應(yīng)轉(zhuǎn)錄因子家族,以進(jìn)一步進(jìn)行轉(zhuǎn)錄因子分析。使用軟件 MISA對(duì)轉(zhuǎn)錄組所有單基因簇中的SSR進(jìn)行搜索,并對(duì)SSR重復(fù)基序進(jìn)行特征分析,為獲得合適的引物序列提供數(shù)據(jù)支撐。
2.1.1 轉(zhuǎn)錄組測(cè)序及組裝后不同長(zhǎng)度單基因簇的分布 用高通量測(cè)序平臺(tái)對(duì)冬瓜嫩葉測(cè)序,共獲得63 525 954條原始序列,堿基數(shù)據(jù)量9 528 893 100 bp(9.5 Gb)。去除低品質(zhì)的原始序列后,獲得62 021 032條高品質(zhì)干凈序列,占原始序列的97.63%。堿基數(shù)據(jù)量9 154 299 990 bp(9.1 Gb),G+C含量為46.88%,堿基Q20(即測(cè)序錯(cuò)誤率小于1%的比例)和Q30(即測(cè)序錯(cuò)誤率小于0.1%的比例)分別為98.31%及94.96%。測(cè)序結(jié)果表明數(shù)據(jù)合格,可以用于后續(xù)分析。
利用Trinity軟件對(duì)干凈序列進(jìn)行組裝,獲得40 611條單基因簇,刪除7條比對(duì)到核糖體的基因后,對(duì)剩余的40 604條單基因簇進(jìn)行統(tǒng)計(jì)及注釋,G+C含量為41.64%,覆蓋50%核苷酸的最大單基因簇長(zhǎng)度(N50)為1 591 bp,最短和最長(zhǎng)單基因簇分別為201及13 773 bp,平均長(zhǎng)955 bp,不同長(zhǎng)度單基因簇的分布情況見(jiàn)圖1。由表1可知,長(zhǎng)200~999 bp的單基因簇占總數(shù)(40 604條)的66.96%,長(zhǎng) 1 000~1 999 bp的單基因簇占比為20.93%,長(zhǎng)2 000~2 999 bp的單基因簇占比為7.95%,長(zhǎng)度≥3 000 bp的單基因簇占比為4.16%??傮w而言,隨著長(zhǎng)度增加,單基因簇?cái)?shù)量減少。
圖1 冬瓜單基因簇的長(zhǎng)度分布Fig.1 Length distribution of Benincasa hispida unigenes
2.1.2 單基因簇的總體表達(dá)量 測(cè)序得62 021 032條干凈序列,能比對(duì)到單基因簇序列的 reads有56 708 038條,占干凈序列總數(shù)的91.43%,其中比對(duì)到唯一指定單基因簇序列的 reads有 49 628 128條,占80.01%。利用RPKM 法計(jì)算單基因簇的表達(dá)量,結(jié)果表明,冬瓜40 611條單基因簇序列RPKM平均值為16.27,最大值51 049.34(Unigene-0022103),最小值0.011 4(不包含0,RPKM值為0的單基因簇共300條)。
通過(guò)Blastx將測(cè)序獲得的40 604條冬瓜單基因簇與相關(guān)數(shù)據(jù)庫(kù)進(jìn)行比對(duì),結(jié)果(表1)顯示,Nr數(shù)據(jù)庫(kù)注釋到最多的單基因簇,共27 474條,占總單基因簇的67.66%;GO數(shù)據(jù)庫(kù)注釋到的單基因簇最少,共10 659條,占26.25%;Swiss Prot、KOG、KEGG、Pfam分別注釋到19 572,16 452,10 799和17 990條單基因簇。
表1 冬瓜單基因簇在6大數(shù)據(jù)庫(kù)中的注釋結(jié)果Table 1 Statistics of database annotations of Benincasa hispida unigenes
冬瓜40 604條單基因簇在Nr數(shù)據(jù)庫(kù)中的比對(duì)結(jié)果(圖2-A)顯示,其中27 474條單基因簇在Nr數(shù)據(jù)庫(kù)中比對(duì)到相似序列, 0≤E≤10-150的數(shù)量最多,有10 367條,占27 474條單基因簇的37.73%,其中E值為0的單基因簇有8 752條(占31.85%),10-150 圖2 冬瓜單基因簇在Nr數(shù)據(jù)庫(kù)中的E值分布(A)和物種分布(B)Fig.2 E-value (A) and species distribution (B) of Benincasa hispida unigenes in Nr database 在Swiss Prot數(shù)據(jù)庫(kù)中,共有19 572條單基因簇成功注釋到,占40 604條單基因簇總數(shù)的48.20%,匹配序列相似度(identity)≥80%的單基因簇有14 456條,匹配序列相似度在30%~80%的單基因簇有222 482條,匹配序列相似度≤30%的單基因簇有37 282條。 GO功能注釋是根據(jù)Nr注釋信息得到的,是對(duì)基因功能進(jìn)行分類的體系。冬瓜單基因簇的GO功能分類結(jié)果見(jiàn)表2。 表2 冬瓜單基因簇GO功能分類Table 2 GO functional categories of Benincasa hispida unigenes 從表2可以看出,冬瓜40 604條單基因簇中有10 659條單基因簇被注釋到GO數(shù)據(jù)庫(kù)內(nèi),分別匹配到生物功能、分子功能和細(xì)胞組分3個(gè)本體的47個(gè)功能組中。根據(jù)GO功能分類,注釋到生物功能的有25 093條單基因簇(占3個(gè)本體總數(shù)(52 211條單基因簇)的48.06%),注釋到分子功能的有11 319條單基因簇(占21.68%),注釋到細(xì)胞組分的有15 799條單基因簇(占30.26%)。其中生物功能包含19個(gè)功能組,以代謝進(jìn)程(6 156條)、細(xì)胞進(jìn)程(5 711條)和單一有機(jī)體進(jìn)程(4 344條)占比較大,分別占25 093條生物功能單基因簇的24.53%,22.76%和17.31%,而節(jié)律進(jìn)程(12條)、脫毒(11條)、細(xì)胞定位(3條)注釋到的單基因簇較少;分子功能包含12個(gè)功能組,催化活性(6 029條)和結(jié)合活性(4 314條)占比較大,分別占11 319條單基因簇的53.26%和38.11%,電子載體活性(12條)、轉(zhuǎn)錄因子活性(11條)、翻譯調(diào)控活性(1條)比例較??;細(xì)胞組分包含16個(gè)功能組,細(xì)胞、細(xì)胞部分和細(xì)胞器占比較大,細(xì)胞、細(xì)胞部分各注釋到3 541條單基因簇,細(xì)胞器注釋到2 655條單基因簇,胞外基質(zhì)、胞外區(qū)域部分和超分子纖維注釋的單基因簇較少,均僅為2條。 將冬瓜單基因簇比對(duì)到KOG數(shù)據(jù)庫(kù)中發(fā)現(xiàn),共有16 452條單基因簇注釋到KOG數(shù)據(jù)庫(kù),共獲得27 944條單基因簇,被注釋到25種KOG分類中,功能區(qū)中單基因簇?cái)?shù)量分布有所差異(表3),其中一般功能基因注釋到的單基因簇?cái)?shù)量最多,包含5 975條單基因簇,占27 944條單基因簇的21.38%;其次是翻譯后修飾、蛋白質(zhì)折疊和分子伴侶共包含3 112條單基因簇,占11.14%;信號(hào)傳導(dǎo)機(jī)制(2 773條)、RNA加工和修飾(1 605條)、轉(zhuǎn)錄(1 469條)、膜泡運(yùn)輸和胞內(nèi)分泌(1 460條)注釋到的單基因簇也較多,最少的是細(xì)胞活性,僅有11條單基因簇(占0.04%)。 表3 冬瓜單基因簇KOG功能分類Table 3 KOG functional categories of Benincasa hispida Cogn unigenes 將測(cè)序得到的40 604條冬瓜單基因簇比對(duì)到KEGG數(shù)據(jù)庫(kù),得到單基因簇的Pathway注釋(表略)。結(jié)果表明,注釋匹配到的10 799條冬瓜單基因簇,可分為5個(gè)大類、19個(gè)亞類、125條代謝途徑。5個(gè)大類中代謝注釋到的單基因簇最多,共5 868條,占帶有通路注釋的9 623條單基因簇的60.98%;遺傳信息處理次之,注釋匹配到2 572條單基因簇;生物系統(tǒng)最少,僅211條。進(jìn)一步分析冬瓜125條代謝途徑發(fā)現(xiàn),核糖體的單基因簇?cái)?shù)量最多(363條),碳代謝和植物激素信號(hào)轉(zhuǎn)導(dǎo)居次,分別有337條和311條單基因簇。在KEGG數(shù)據(jù)庫(kù)功能注釋中預(yù)測(cè)到的125條代謝途徑中,含有氨基酸合成、不飽和脂肪酸的生物合成、維生素B6代謝、類黃酮生物合成等相關(guān)的代謝途徑分別有295,47,20和18條單基因簇,其中部分單基因簇涉及不飽和脂肪酸、類黃酮、維生素等生理活性物質(zhì)合成,這些物質(zhì)可能與冬瓜的營(yíng)養(yǎng)保健功效有關(guān)。 利用Pfam數(shù)據(jù)庫(kù)對(duì)冬瓜蛋白結(jié)構(gòu)域進(jìn)行預(yù)測(cè),對(duì)蛋白家族進(jìn)行分析。將冬瓜40 604條單基因簇與Pfam數(shù)據(jù)庫(kù)比對(duì),其中有17 990條單基因簇成功注釋,所有注釋到的單基因簇編碼蛋白序列在數(shù)據(jù)庫(kù)中匹配結(jié)構(gòu)的數(shù)目均為1個(gè),分成369個(gè)類群,三角狀五肽重復(fù)結(jié)構(gòu)域(1 096條)、三角狀五肽蛋白家族(907條)、富亮氨酸重復(fù)(769條)、WD重復(fù)域的G-beta蛋白(641條)、蛋白激酶結(jié)構(gòu)域(568條)在整體中占比較大。 對(duì)冬瓜的單基因簇進(jìn)行轉(zhuǎn)錄因子分析(表4),在40 604條單基因簇中,具有轉(zhuǎn)錄因子序列特征的有1 099條,分為55個(gè)轉(zhuǎn)錄因子家族。家族中所占比例最大的是bHLH(81條,占1 099條單基因簇的7.37%),然后依次是ERF(74條,占6.73%)、C2H2(73條,占6.64%)、MYB_related(70條,占6.37%)。轉(zhuǎn)錄因子是讀取并解釋DNA中遺傳“藍(lán)圖”的蛋白質(zhì)組之一,其與DNA結(jié)合,可以幫助啟動(dòng)一個(gè)增加或減少基因轉(zhuǎn)錄的程序,因此轉(zhuǎn)錄因子對(duì)于許多細(xì)胞過(guò)程是至關(guān)重要的。前人研究表明,bHLH、ERF在植物抗逆境脅迫和生長(zhǎng)發(fā)育、生物合成及信號(hào)轉(zhuǎn)導(dǎo)方面均有作用[23-26]。 表4 冬瓜轉(zhuǎn)錄因子家族的單基因簇?cái)?shù)量及種類Table 4 Number and species of unigenes in the transcription factor family of Benincasa hispida Cogn 對(duì)冬瓜轉(zhuǎn)錄組進(jìn)行測(cè)序分析,共獲得40 604條單基因簇,其中5 086條單基因簇獲得5 474個(gè)SSR位點(diǎn)(表5)。SSR的發(fā)生頻率為12.53%,出現(xiàn)頻率13.48%,平均7.08 kb出現(xiàn)一個(gè)SSR。冬瓜轉(zhuǎn)錄組SSR重復(fù)單元次數(shù)在4~30次,類型豐富,其中4~10次重復(fù)的SSR有5 127個(gè),占5 474個(gè)位點(diǎn)的93.66%;11~30次重復(fù)的SSR有347個(gè),占6.34%。 由表6可以看出,本研究中SSR有二、三、四、五、六核苷酸5種重復(fù)類型,共含170種重復(fù)基序,二、三、四、五、六核苷酸重復(fù)基序數(shù)量分別為4,10,24,42和90個(gè)。二核苷酸重復(fù)基序中AG/CT發(fā)生頻率最高,占5 474個(gè)位點(diǎn)的26.21%,占二核苷酸重復(fù)總數(shù)(2 047個(gè))的70.10%;三核苷酸重復(fù)基序中AAG/CTT占比較大,在重復(fù)基序中占24.08%;而五核苷酸和六核苷酸重復(fù)基序數(shù)量較少,總體占比也較小。 表5 冬瓜葉轉(zhuǎn)錄組的SSR類型與數(shù)量Table 5 Number of SSR types in the transcription group of Benincasa hispida 表6 冬瓜轉(zhuǎn)錄組的SSR分類重復(fù)類型頻率Table 6 Frequency of SSR categories repetition in the transcription group of Benincasa hispida 冬瓜營(yíng)養(yǎng)豐富,含有多種生理活性成分。近年來(lái)有研究表明,冬瓜的多種提取物具有抗氧化[27]、治療蕁麻疹[28]、降壓利尿[29]、降糖[30]等功效。冬瓜優(yōu)良的藥用價(jià)值和食療保健價(jià)值使其市場(chǎng)需求量旺盛。然而,目前關(guān)于冬瓜相關(guān)代謝途徑的機(jī)理研究還未見(jiàn)報(bào)道,本研究利用Illumina HiSeqTM2000技術(shù)進(jìn)行轉(zhuǎn)錄組測(cè)序,通過(guò)拼接獲得了大量冬瓜單基因簇,為冬瓜后續(xù)相關(guān)功能基因研究奠定了基礎(chǔ)。 本研究通過(guò)高通量測(cè)序平臺(tái)對(duì)冬瓜轉(zhuǎn)錄組進(jìn)行測(cè)序及分析發(fā)現(xiàn),覆蓋50%核苷酸的最大單基因簇長(zhǎng)度為1 591 bp,表明組裝質(zhì)量較好,適合進(jìn)行下一步分析。組裝后獲得40 611條單基因簇,平均長(zhǎng)955 bp,對(duì)其中40 604條單基因簇進(jìn)行注釋,仍有13 004條單基因簇未成功注釋,占總數(shù)的32.03%,這可能與序列片段過(guò)短、注釋信息缺乏以及初次從冬瓜中獲得新基因等有關(guān)[31]。用GO數(shù)據(jù)庫(kù)對(duì)冬瓜單基因簇進(jìn)行功能分類,匹配到3個(gè)本體的47個(gè)功能組中,其中生物功能中代謝過(guò)程注釋到的單基因簇?cái)?shù)量最多,共6 156條。從功能注釋結(jié)果可以看出,冬瓜在基因表達(dá)水平上與代謝過(guò)程相關(guān)的表達(dá)較多,表明植物存在著不同代謝途徑,且不同的代謝途徑同時(shí)在植物體內(nèi)與相應(yīng)的生理過(guò)程聯(lián)系密切。KEGG代謝通路分析得到單基因簇的Pathway注釋,顯示成功注釋了10 799條冬瓜的單基因簇,其中代謝途徑占5 868條,代謝途徑中次生代謝途徑有268條。同時(shí),KEGG數(shù)據(jù)庫(kù)注釋將冬瓜單基因簇分為125條代謝途徑。用Pfam數(shù)據(jù)庫(kù)對(duì)冬瓜蛋白結(jié)構(gòu)域進(jìn)行預(yù)測(cè)、對(duì)蛋白家族進(jìn)行分析,結(jié)果顯示注釋到的17 990條單基因簇可分成369個(gè)類群,匹配結(jié)構(gòu)數(shù)目均為1個(gè)。 轉(zhuǎn)錄因子能夠調(diào)控基因的表達(dá)水平及調(diào)控網(wǎng)絡(luò)。本研究與TF數(shù)據(jù)庫(kù)進(jìn)行hmmscan比對(duì),注釋到1 099條單基因簇分為55個(gè)轉(zhuǎn)錄因子家族,占比最大的是bHLH家族,其次是ERF、C2H2、MYB_related、NAC、MYB家族。bHLH是真核生物中存在最廣泛的一大類轉(zhuǎn)錄因子,Cui等[23]發(fā)現(xiàn)其在花藥發(fā)育調(diào)控方面具有重要作用,何潔等[24]認(rèn)為其在西瓜抵御低溫、ABA和鹽脅迫中有可能發(fā)揮作用,Gonzalez等[32]認(rèn)為T(mén)TG1/bHLH/Myb轉(zhuǎn)錄因子對(duì)擬南芥幼苗花青素生物合成途徑具有調(diào)控作用。另外,Jung等[33]研究表明,bHLH轉(zhuǎn)錄因子可能與水稻雄性不育有關(guān)。轉(zhuǎn)錄因子在植物的生長(zhǎng)發(fā)育[34]、進(jìn)化[35]、抗逆境[36]等方面具有重要的調(diào)控作用,這為冬瓜后續(xù)在生長(zhǎng)和抗逆性的研究上提供了有力的依據(jù)。 冬瓜資源較為豐富,利用表型觀察雖然能夠直觀地確定作物的產(chǎn)量、品質(zhì)以及相關(guān)的性狀特征表現(xiàn),但同時(shí)也受到很多條件的影響與限制,因而需要進(jìn)一步結(jié)合分子標(biāo)記進(jìn)行親緣關(guān)系鑒定。本研究通過(guò)轉(zhuǎn)錄組測(cè)序得到冬瓜5 474個(gè)SSR位點(diǎn),SSR發(fā)生頻率為12.53%,出現(xiàn)頻率13.48%,低于絲瓜[37]和蓮霧[38],但高于南瓜[39]和黃秋葵[40],這可能與物種、單基因簇總量及長(zhǎng)度、篩選條件等因素不同有關(guān)[41]。冬瓜SSR有二、三、四、五、六核苷酸5種重復(fù)類型,其中二核苷酸重復(fù)類型和三核苷酸重復(fù)類型占比較大,而五核苷酸和六核苷酸重復(fù)占比較小。這與絲瓜[37]、蓮霧[38]、南瓜[39]和黃秋葵[40]的結(jié)果相似,可能與SSR搜索標(biāo)準(zhǔn)有關(guān)。冬瓜中AG/CT和AAG/CTT為主要重復(fù)基序,AG/CT為主要基序,這與前人對(duì)平歐雜交榛[42]和菜薹[43]的研究結(jié)果一致;AAG/CTT在雙子葉植物中是常見(jiàn)基序,與Morgante等[44]的研究結(jié)論相似。本研究結(jié)果可為后續(xù)的冬瓜研究提供參考數(shù)據(jù)。2.4 冬瓜單基因簇的Swiss Prot統(tǒng)計(jì)分析
2.5 冬瓜單基因簇的GO功能分類
2.6 冬瓜單基因簇的KOG功能分類
2.7 冬瓜單基因簇的KEGG代謝通路分析
2.8 冬瓜單基因簇的Pfam統(tǒng)計(jì)分析
2.9 冬瓜單基因簇的轉(zhuǎn)錄因子分析
2.10 冬瓜轉(zhuǎn)錄組的SSR位點(diǎn)分析
3 討 論