魏世平,李 靜,解振強(qiáng)
(江蘇農(nóng)林職業(yè)技術(shù)學(xué)院/江蘇現(xiàn)代園藝工程技術(shù)中心,江蘇鎮(zhèn)江,212400)
歐亞種或歐洲葡萄(Vitisvinifera)是中國主要栽培的葡萄種類。其中,“魏可”(Wink)品種具有樹勢強(qiáng)、果肉脆、汁多微甜且抗病性強(qiáng)等優(yōu)勢,為優(yōu)良晚熟品種,被廣泛栽培種植[1]。葡萄在成熟過程中沒有明顯的呼吸躍變期,但其漿果大小、硬度、色澤以及內(nèi)部生理生化在轉(zhuǎn)色期均發(fā)生劇烈變化。例如:表皮葉綠素降解、花青素累積、漿果軟化、可溶性糖含量增加、有機(jī)酸含量下降等[2-3]。分子生物學(xué)技術(shù)的發(fā)展帶來諸多基因?qū)用娴奶剿?并用在葡萄研究中得到廣泛應(yīng)用[4-7]。有研究者發(fā)現(xiàn),山葡萄轉(zhuǎn)色前、50%著色期以及完熟期之間均存在差異表達(dá)基因,COG注釋表明這些差異表達(dá)基因涉及山葡萄生長發(fā)育過程中絕大部分生命活動,其中包含碳水化合物、氨基酸、次生代謝物等合成、運(yùn)輸和代謝[8]。也有研究者發(fā)現(xiàn),葡萄轉(zhuǎn)色期花青素合成的上游調(diào)節(jié)與光合作用代謝途徑相關(guān),且56個候選基因(30個結(jié)構(gòu)基因和26個調(diào)控基因)被鑒定出可能參與歐亞葡萄“染色葡萄”品種(teinturier grape,花青素在果皮和果肉組織中積累的紅肉品種,用于與其他葡萄品種混釀,為葡萄酒液帶來更深的顏色)花青素的生物合成途徑[9]。上述研究均基于RNA-Seq測序和生物信息學(xué)分析得到。目前,針對“魏可”葡萄轉(zhuǎn)色期前后轉(zhuǎn)錄組水平變化的研究仍缺乏。筆者以“魏可”葡萄為研究對象,采集轉(zhuǎn)色前后及完熟期果實(shí),利用高通量測序技術(shù)進(jìn)行分析,探討“魏可”轉(zhuǎn)色前后及完熟期之間差異表達(dá)基因的種類及變化規(guī)律,為后續(xù)轉(zhuǎn)色相關(guān)功能基因的深入研究以及新品種的培育奠定基礎(chǔ)。
以歐亞種葡萄品種“魏可”(Vitisvinifera‘Wink’)為研究對象,栽培于江蘇農(nóng)林職業(yè)技術(shù)學(xué)院葡萄基地。2021年,在轉(zhuǎn)色前、轉(zhuǎn)色15 d后及完熟期分別采集新鮮飽滿果實(shí)樣品,經(jīng)液氮速凍后置于-80 ℃保存。使用手術(shù)刀將果皮、果肉及種子分開,將果皮在液氮下研磨成粉狀[10]。
1.2.1 RNA樣品提取和檢測 果皮樣品RNA提取以及轉(zhuǎn)錄組測序委托北京諾禾致源科技股份有限公司完成[11]。對RNA樣品,采用瓊脂糖凝膠電泳檢測其降解程度及污染情況,采用Nanodrop檢測RNA純度(OD260/280比值),采用Qubit精確定量RNA濃度,采用Agilent 2100精確檢測RNA完整性。
1.2.2 cDNA 文庫構(gòu)建和庫檢 RNA樣品經(jīng)檢測合格后,用含有Oligo(dT)的磁珠,運(yùn)用A-T互補(bǔ)配對與mRNA的ployA尾結(jié)合的方式富集真核生物mRNA。隨后加入fragmentation buffer將mRNA打斷,以mRNA為模板,用六堿基隨機(jī)引物(random hexamers)合成單鏈cDNA,再加入DNA polymerase I、dNTPs和緩沖液合成雙鏈cDNA,隨后利用AMPure XP beads純化雙鏈cDNA。純化的雙鏈cDNA經(jīng)末端修復(fù)、加A尾并連接測序接頭后,再次利用AMPure XP beads進(jìn)行片段大小選擇,最后進(jìn)行PCR富集,得到最終的cDNA文庫[12]。
文庫構(gòu)建完成后,用Qubit 2.0進(jìn)行初步定量,稀釋文庫至1 ng/uL,隨后使用Agilent 2100對文庫的插入片段長度進(jìn)行檢測,插入片段長度符合預(yù)期后,使用Q-PCR方法對文庫有效濃度進(jìn)行準(zhǔn)確定量(文庫有效濃度設(shè)定為>2 nmol/L),以保證文庫質(zhì)量。
1.2.3 上機(jī)測序 對于庫檢合格的樣品,將不同文庫按照有效濃度及目標(biāo)下機(jī)數(shù)據(jù)量的需求合并(pooling)后進(jìn)行Illumina HiSeqTM高通量測序。
1.2.4 數(shù)據(jù)質(zhì)量評估 Illumina HiSeqTM高通量測序得到的原始圖像數(shù)據(jù)文件經(jīng)CASAVA堿基識別(Base Calling)分析轉(zhuǎn)化為原始測序序列(Sequenced Reads),即Raw Data或Raw Reads。Raw Data經(jīng)錯誤率分布檢查和A/T/G/C含量分布檢查后進(jìn)行質(zhì)控。質(zhì)控步驟包含:1)去除帶接頭(adapter)的Reads;2)去除N(N表示無法確定堿基信息)的比例大于10%的reads;3)去除低質(zhì)量Reads(Qphred≤ 20 的堿基數(shù)占整個Read 長度的 50%以上的 Reads)。
1.2.5 數(shù)據(jù)比對 選取HISAT軟件將過濾后的測序序列比對參考基因組進(jìn)行基因組定位分析。HISAT的算法主要分為3個部分:(1)將測序序列整段比對到基因組單外顯子;(2)將測序序列分段比對到基因組的兩個外顯子上;(3)將測序序列分段比對到基因組3個及以上外顯子。
1.2.6 生物信息學(xué)分析 樣品間基因表達(dá)水平相關(guān)性,是通過計算兩兩間皮爾遜(Pearson)相關(guān)系數(shù)進(jìn)行衡量。采用有生物學(xué)重復(fù)的DESeq標(biāo)準(zhǔn)化方法進(jìn)行差異基因表達(dá)分析。差異基因篩選標(biāo)準(zhǔn)為padj<0.05,并用火山圖進(jìn)行展示。采用GOseq軟件,基于Wallenius non-central hyper-geometric distribution方法進(jìn)行基因本體(Gene Ontology,GO)注釋分析[13]。經(jīng)KEGG(Kyoto Encyclopedia of Genes and Genomes,京都基因與基因組百科全書)比對,找出與整個基因組背景相比,在差異表達(dá)基因中顯著性富集的通路(Pathway)[14]。采用iTAK 軟件進(jìn)行轉(zhuǎn)錄因子分析[15]。
Illumina測序的raw reads經(jīng)質(zhì)控后,得到轉(zhuǎn)色期、轉(zhuǎn)色后15 d和完熟期的Clean reads分別為24 912 603、24 979 749和24 833 203條;Q30均大于92.52%,Q20均大于96.97%;GC含量分別為46.80%,46.50%和46.33%??梢?測序質(zhì)量較好。將測序結(jié)果與參考基因組進(jìn)行比對,3個時期樣品的比對效率分別為89.41%,89.42%和88.96%,且唯一比對位置百分比為86.80%、86.86%和86.32%(見表1)。3個時期均是比對到外顯子(Exon)的reads含量最高,范圍為95.4%~96.9%;比對到內(nèi)含子(Intron)的reads含量范圍為1.7%~3.1%;比對到基因間區(qū)(Intergenic)的reads含量均為1.5%(見圖1)。
圖1 “魏可”葡萄不同著色期果皮基因組不同區(qū)域reads分布
表1 “魏可”葡萄不同著色期果皮轉(zhuǎn)錄組測序質(zhì)控及比對結(jié)果
樣品間的Pearson相關(guān)系數(shù)均大于0.90,表示樣本間重復(fù)性較好(見圖2)。依據(jù)FPKM基因表達(dá)量的計算結(jié)果,得到存在不同時期間的顯著差異表達(dá)的基因,轉(zhuǎn)色后15 d與轉(zhuǎn)色期相比的顯著差異基因數(shù)為3 096個,其中,顯著上調(diào)基因數(shù)為1 328個,顯著下調(diào)的基因數(shù)為1 768個(見圖3A);完熟期與轉(zhuǎn)色期相比的顯著差異表達(dá)基因數(shù)為4 444個,1 883個顯著上調(diào),2 561個顯著下調(diào)(見圖3B);完熟期與轉(zhuǎn)色后15 d相比的顯著差異表達(dá)基因數(shù)為1 156個,395個顯著上調(diào),761個顯著下調(diào)(見圖3C)。
注:T1代表轉(zhuǎn)色期,T2代表轉(zhuǎn)色后15 d,T3代表完熟期。T1_1、T1_2和T1_3分別為T1的3個生物學(xué)重復(fù),T2和T3以此類推。
注:T1代表轉(zhuǎn)色期,T2代表轉(zhuǎn)色后15 d,T3代表完熟期,同圖2。
轉(zhuǎn)色后15 d與轉(zhuǎn)色期之間、完熟期與轉(zhuǎn)色后15 d之間以及完熟期與轉(zhuǎn)色期之間差異表達(dá)基因的GO注釋和富集分析結(jié)果表明,差異表達(dá)基因在分子功能(Molecular Function)、生物過程(Biological Process)和細(xì)胞組成(Cellular Component)三個分類水平上差異較大(見表2至表4)。
表2 “魏可”葡萄轉(zhuǎn)色后15 d與轉(zhuǎn)色期相比果皮差異表達(dá)基因GO顯著富集條目
與轉(zhuǎn)色期相比,轉(zhuǎn)色后15 d的差異表達(dá)基因從整體分析來看,在GO中顯著富集的有7個,主要涉及木葡聚糖-木糖基轉(zhuǎn)移酶活性功能、質(zhì)外體細(xì)胞組分以及糖類和碳水化合物代謝過程。下調(diào)差異表達(dá)基因顯著富集的有17個,主要涉及分子功能中木葡聚糖-木糖基轉(zhuǎn)移酶活性、氧化還原酶活性、鐵-硫簇結(jié)合,細(xì)胞組分中質(zhì)外體、膜、類囊體等,生物過程中碳水化合物、類固醇、有機(jī)氮代謝過程(見表2)。
與轉(zhuǎn)色期相比,完熟期差異表達(dá)基因從整體分析看顯著富集的有11個,主要涉及分子功能中的核糖體結(jié)構(gòu)成分及結(jié)構(gòu)分子活性,細(xì)胞組分中的核糖核蛋白復(fù)合物、核糖體、脂質(zhì)粒、脂質(zhì)貯存體,生物過程中的有機(jī)物生物合成過程及細(xì)胞生物合成過程。下調(diào)差異表達(dá)基因顯著富集的有27個,主要涉及分子功能中的核糖體結(jié)構(gòu)成分及結(jié)構(gòu)分子活性、輔酶結(jié)合、氧化還原酶活性,細(xì)胞組分中的核糖體、膜、非膜結(jié)合細(xì)胞器,生物過程中的碳水化合物、酰胺、有機(jī)氮化合物、肽、類固醇等的代謝和合成過程、以及氨基酸、陰離子、有機(jī)酸的跨膜轉(zhuǎn)運(yùn)。上調(diào)差異表達(dá)基因顯著富集的有28個,主要涉及分子功能中的核酸、DNA結(jié)合,細(xì)胞組分中的核,生物過程中核酸和RNA的合成及代謝過程、以及有機(jī)環(huán)狀化合物、芳香族化合物、氮化合物、大分子生物、含堿基化合物等的合成及代謝過程(見表3)。
表3 “魏可”葡萄完熟期與轉(zhuǎn)色期相比果皮差異表達(dá)基因GO顯著富集條目
與轉(zhuǎn)色后15 d相比,完熟期整體分析和下調(diào)差異表達(dá)基因均未達(dá)到顯著富集水平,上調(diào)差異表達(dá)基因顯著富集有3個,分別為木葡聚糖-木糖基轉(zhuǎn)移酶活性、質(zhì)外體和細(xì)胞壁(見表4)。
表4 “魏可”葡萄完熟期與轉(zhuǎn)色后15 d相比果皮差異表達(dá)基因GO顯著富集條目
差異表達(dá)基因在KEGG注釋中達(dá)到顯著富集水平的共計有10條代謝通路(見圖4)。其中,與轉(zhuǎn)色期相比,轉(zhuǎn)色后15 d下調(diào)表達(dá)基因中顯著富集3條代謝通路,分別為光合作用-觸角蛋白(Photosynthesis-antenna proteins)、抗壞血酸和醛酸代謝(Ascorbate and aldarate metabolism)及光合生物的固碳作用(Carbon fixation in photosynthetic organisms)(見圖4A)。與轉(zhuǎn)色期相比,完熟期下調(diào)差異表達(dá)基因中顯著富集4條代謝通路,分別為核糖體(Ribosome)、光合作用-觸角蛋白、半乳糖代謝(Galactose metabolism)和光合作用(Photosynthesis)(見圖4B);上調(diào)差異表達(dá)基因中顯著富集2條,分別為剪接體(Spliceosome)和mRNA監(jiān)測路徑(mRNA surveillance pathway)(見圖4C)。與轉(zhuǎn)色后15 d相比,完熟期下調(diào)差異表達(dá)基因中顯著富集1條代謝通路,即半乳糖代謝(見圖4D)。
注:T1代表轉(zhuǎn)色期,T2代表轉(zhuǎn)色后15 d,T3代表完熟期,同圖2。Up代表上調(diào),Down代表下調(diào)。
通過采用hmmscan搜索植物中的轉(zhuǎn)錄因子特征結(jié)構(gòu)域的方法,對轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行轉(zhuǎn)錄因子編碼基因的預(yù)測,結(jié)果得到共計62個轉(zhuǎn)錄因子基因家族的446個轉(zhuǎn)錄因子。其中,包含38個MYB,34個AP2-EREBP,27個C2H2,23個NAC,20個bZIP,20個HB,19個Orphans,17個C3H,16個bHLH,13個PHD,12個C2C2-Dof,12個GRAS,12個WRKY,11個MADS,11個SNF2,10個LOB等轉(zhuǎn)錄因子家族。
從差異表達(dá)基因的GO富集分析結(jié)果來看,“魏可”葡萄完熟期果皮與轉(zhuǎn)色期果皮相比在整體分析上的差異表達(dá)基因數(shù)以及上下調(diào)差異表達(dá)基因數(shù)均為最多,且涉及生長發(fā)育過程中多數(shù)生命活動。這在山葡萄不同著色時期果皮差異表達(dá)基因的COG注釋中也得到類似結(jié)果[8]。分子功能類別中木葡聚糖-木糖基轉(zhuǎn)移酶活性(GO:0016762)以及細(xì)胞組分中質(zhì)外體(GO:0048046)基因,“魏可”葡萄轉(zhuǎn)色后15 d果皮與轉(zhuǎn)色期果皮相比為顯著下調(diào),完熟期果皮與轉(zhuǎn)色后15 d果皮相比則為顯著上調(diào)。木葡聚糖為長鏈多糖,可與纖維素的微纖絲形成氫鍵構(gòu)成交聯(lián)網(wǎng)絡(luò),進(jìn)而影響細(xì)胞壁結(jié)構(gòu)[16]。質(zhì)外體由細(xì)胞壁、胞間隙和導(dǎo)管組成[17],故與木葡聚糖-木糖基轉(zhuǎn)移酶活性變化規(guī)律一致。木葡聚糖-木糖基轉(zhuǎn)移酶,即木葡聚糖內(nèi)轉(zhuǎn)糖苷酶,是細(xì)胞壁重組的關(guān)鍵酶[18-19],可催化木葡聚糖分子轉(zhuǎn)移或水解,在植物生長過程中可參與細(xì)胞壁的降解和合成,與果實(shí)生長與成熟軟化有密切的關(guān)聯(lián)[20]。
從差異表達(dá)基因的KEGG富集分析結(jié)果來看,在“魏可”葡萄果實(shí)轉(zhuǎn)色過程中,與光合作用相關(guān)途徑下調(diào)。Wang等[9]利用轉(zhuǎn)錄組學(xué)分析歐亞葡萄“染色葡萄”品種(紅肉品種)漿果發(fā)育及花青素生物合成時,得到光合作用-觸角蛋白和光合作用在KEGG注釋中顯著富集,并由此推斷光調(diào)節(jié)是紅肉品種花青素生成的主要原因。果實(shí)中半乳糖是初生細(xì)胞壁的成分之一,其含量與果實(shí)軟化程度有關(guān)?!拔嚎伞逼咸淹晔炱诠ぐ肴樘谴x與轉(zhuǎn)色期和轉(zhuǎn)色15 d相比較均顯著富集下調(diào)。這與歐亞葡萄品種“Shiraz”果實(shí)成熟期半乳糖含量會略有下降[21]的研究結(jié)果相匹配。
轉(zhuǎn)錄因子是一類響應(yīng)植物生長發(fā)育和激素信號不可缺少的調(diào)控因子。本研究對不同著色期“魏可”葡萄果皮進(jìn)行差異基因轉(zhuǎn)錄因子分析,檢測到部分常規(guī)轉(zhuǎn)錄因子(如MYB和bHLH等)和新型轉(zhuǎn)錄因子(如NAC,bZIP、WRKY、MADs等)[22]。MYB轉(zhuǎn)錄因子是高等植物中一類重要的轉(zhuǎn)錄因子,R2R3-MYB在花青素合成過程中起重要作用[23-24]。轉(zhuǎn)錄因子MYB和bHLH之間存在組合調(diào)控現(xiàn)象,有研究證實(shí)bHLH轉(zhuǎn)錄因子和R2R3-MYB共同調(diào)節(jié)花色苷的合成[25]。編碼NAC新型轉(zhuǎn)錄因子的基因VvNAC26,在葡萄中被鑒定出來,其與葡萄漿果早期發(fā)育有關(guān),且參與葡萄果粒大小的決定過程[26]。轉(zhuǎn)錄因子bZIP、WRKY和MADs均是植物生長發(fā)育過程中較為重要的家族,在果實(shí)成熟、種子成熟、花形態(tài)建成和發(fā)育、抗逆響應(yīng)等過程中發(fā)揮調(diào)節(jié)作用[27-29]。此外,本研究還鑒定出AP2-EREBP和C2H2轉(zhuǎn)錄家族的34個和27個轉(zhuǎn)錄因子,僅次于MYB家族。AP2-EREBP家族主要參與植物激素信號轉(zhuǎn)導(dǎo)以及植物對病原體、各種環(huán)境脅迫(如低溫、干旱、高鹽等)分子應(yīng)答反應(yīng)[30-31]。C2H2轉(zhuǎn)錄因子是一類在真核生物基因組分布最為廣泛的鋅指蛋白,在植物生長發(fā)育(如葡萄花粉發(fā)育)及非生物脅迫響應(yīng)等方面發(fā)揮重要作用,且參與脫落酸(ABA)、赤霉素(GA)等激素信號傳導(dǎo)、低溫信號轉(zhuǎn)導(dǎo)等途徑[32-33]。對于鑒定出的轉(zhuǎn)錄因子其相關(guān)基因功能的挖掘還需更深入的研究確定。