萬(wàn) 柔,胡亞平,景文軒,胡 博,郭起榮
(南京林業(yè)大學(xué) a.林學(xué)院;b.南方現(xiàn)代林業(yè)協(xié)同創(chuàng)新中心,江蘇 南京 210037)
單倍體(Haploid)是指體細(xì)胞染色體數(shù)為本物種配子染色體數(shù)的生物個(gè)體。相較于多倍體,單倍體因?yàn)閱渭兊倪z傳特性、獨(dú)特的表型特性以及材料難獲得而長(zhǎng)期受到研究工作者的特殊重視。自1922年在曼陀羅Daturastramonium中首次發(fā)現(xiàn)天然單倍體植物以來(lái)[1],單倍體的研究一直是研究的熱點(diǎn)。在自然界中,特別是裸子植物由于受到內(nèi)、外刺激而形成單倍體植株的頻率極低,很不易見(jiàn)[2]。應(yīng)用于人工誘導(dǎo)單倍體的方法主要有花藥培養(yǎng)、孤雌生殖等[3]。單倍體一則可以顯著地縮短育種年限,加快育種進(jìn)程[4-5],二則對(duì)純系的單倍體種質(zhì)材料的遺傳改造更具實(shí)踐意義,更是解密高度雜合的植物基因組的理想材料[6-9],吸引著越來(lái)越多的研究人員致力于單倍體的工作。
隨著倍性的改變,植物基因組的結(jié)構(gòu)和基因的表達(dá)會(huì)發(fā)生一系列的變化,如DNA序列消除、染色體重組、基因的非加性表達(dá)、表觀遺傳修飾等?,F(xiàn)有研究表明,植物中不同物種的倍性效應(yīng)都不一樣,倍性材料間的生物效應(yīng)并非簡(jiǎn)單地表現(xiàn)為倍數(shù)關(guān)系,而是表現(xiàn)出復(fù)雜的劑量效應(yīng)關(guān)系[10]。與高倍性的植物相比,一些物種的低倍性植物往往表現(xiàn)出較弱的生長(zhǎng)活力,這種活力的降低反映在較小的體型,較慢的生長(zhǎng)速度和較少的次級(jí)代謝物方面。在作物方面,多倍體技術(shù)已被用于開(kāi)發(fā)更多的優(yōu)勢(shì)品種,如新型四倍體水稻(Neotetraploid rice)、十倍體草莓Fragariaananassa等。但是四倍體蘋(píng)果(Malus×homea)和四倍體黎檬Citruslimonia的體型都比二倍體小[11-12]。
銀杏Ginkgobiloba是第四紀(jì)冰川運(yùn)動(dòng)后遺留下來(lái)的裸子植物中最古老的孑遺植物,被稱為“活化石”。從18世紀(jì)開(kāi)始,銀杏從中國(guó)經(jīng)過(guò)日本和韓國(guó)傳到歐洲[13],作為重要的經(jīng)濟(jì)樹(shù)種廣泛應(yīng)用于日常生產(chǎn)和生活中,在觀賞、食用、生態(tài)、經(jīng)濟(jì)、醫(yī)療等方面都具有很高的應(yīng)用價(jià)值[14-15]。2016年,通過(guò)大規(guī)模流式細(xì)胞儀篩查,銀杏的不同倍性在2016年由薩里克大學(xué)Petr教授等[16-17]發(fā)現(xiàn),隨后與其合作,多份倍性材料在中國(guó)被發(fā)現(xiàn),也引進(jìn)了多份資源。其中,銀杏單倍體表現(xiàn)為葉片面積較小,光合作用、糖酵解/糖異生和類黃酮生物合成途徑等的基因集顯著下調(diào)表達(dá),表現(xiàn)為凈光合速率、類黃酮含量也顯著低于二倍體,PAL、PAM和OTM1可能是其類黃酮調(diào)控的樞紐基因[18-19]。
本研究采用DIA定量蛋白質(zhì)組學(xué)技術(shù),開(kāi)展銀杏天然單倍體和二倍體的蛋白質(zhì)組學(xué)差異分析,以揭示單倍體銀杏種質(zhì)性狀變異的內(nèi)在機(jī)制。這是繼銀杏倍性發(fā)現(xiàn)之后,首次對(duì)銀杏單倍體進(jìn)行蛋白質(zhì)組學(xué)探索。
2019年底,從馬薩里克大學(xué)植物園獲得銀杏單倍體‘Rocky’和二倍體‘Maronia’的穗條,接穗長(zhǎng)度一致,保留兩芽,于2020年3月在南京林業(yè)大學(xué)銀杏種質(zhì)資源圃中的同一批實(shí)生苗砧木上進(jìn)行嫁接。2021年8月底,此時(shí)銀杏功能葉生長(zhǎng)成熟,生物量、類黃酮含量等經(jīng)濟(jì)性狀表現(xiàn)最旺盛,采集嫁接成活后的單倍體、二倍體的接穗成熟葉片,重復(fù)采樣3次,立即投入液氮中冷凍保存?zhèn)錁印?/p>
選取經(jīng)過(guò)iST樣本前處理試劑盒(PreOmics,德國(guó))處理好的樣品,液氮研磨,取適量磨樣,加入50 μL裂解液,在95 ℃、1 000 rpm轉(zhuǎn)速下加熱10 min。待樣品冷卻至室溫,加入胰蛋白酶消化緩沖液,于37 ℃、500 rpm轉(zhuǎn)速下振蕩孵育2 h后,加入終止緩沖液結(jié)束酶解反應(yīng)。再用試劑盒中的iST cartridge進(jìn)行肽段除鹽,2×100 μL緩沖液洗脫,洗脫后的肽段真空抽干,-80 ℃下保存。
肽段物用緩沖液A(20 mM甲酸銨水溶液,用氨水調(diào)節(jié)pH至10.0)重新溶解后,用Ultimate 300系統(tǒng)(ThermoFisher scientific,MA,USA)連接反向柱(XBridge C18 column,4.6 mm×250 mm,5 μm,(Waters Corporation,MA,USA)進(jìn)行高pH分離,分離使用的緩沖液B線性梯度為40 min內(nèi)5%升至45%(緩沖液B由80%ACN中加入20 mM甲酸銨,用氨水調(diào)節(jié)pH至10.0)。柱流速維持在1 mL/min,柱溫維持在30 ℃。收集fractio 6個(gè),在真空濃縮儀中干燥,待用。
將除鹽凍干后的肽段重溶于solvent A(0.1%甲酸水溶液)后,經(jīng)由配備在線納噴離子源的LC-MS/MS分析。Orbitrap Lumos質(zhì)譜儀在數(shù)據(jù)依賴采集模式下運(yùn)行,采集自動(dòng)在MS和MS/MS間切換。原始數(shù)據(jù)通過(guò)Spectronaut X(Biognosys AG)合并,用Uniprot進(jìn)行搜庫(kù)分析。同時(shí),設(shè)置母離子、肽段水平的假陽(yáng)性率(FDR)都為1%,搜索污染序列庫(kù),判斷樣本是否存在污染,設(shè)置Trypsin酶解。
各樣品加入30 μL solvent A(0.1%甲酸水溶液),制成懸浮液。取出9 μL,加入1 μL 10×iRT肽段,混合,用nano-LC分離,經(jīng)串聯(lián)EASYnLC 1200系統(tǒng)的Orbitrap Lumos質(zhì)譜儀(Thermo Fisher Scientific,MA,USA)分析??偣采蠘? μL(分析柱Acclaim PepMap C18,75 μm×25 cm),在5%~35%的緩沖液B(0.1%甲酸ACN溶液)中梯度分離2 h。柱流量控制在200 nL/min,電噴霧電壓2 kV。質(zhì)譜參數(shù):1)MS掃描范圍350~1 500 m/z,分辨率120 000,AGC target 4e6,最大注入時(shí)間50 ms;2)HCD-MS/MS分辨率30 000,AGCtarget 1e6,碰撞能量32,能量增加5%;3)可變窗口采集設(shè)置60個(gè),每窗口串口重疊1 m/z。
采用Biognosys的QuiC軟件對(duì)原始質(zhì)譜數(shù)據(jù)進(jìn)行質(zhì)控;采用Pulsar軟件對(duì)DDA采集模式得到的數(shù)據(jù)進(jìn)行建庫(kù)[20]。根據(jù)DDA參考數(shù)據(jù)庫(kù),對(duì)得到的DIA數(shù)據(jù)進(jìn)行蛋白鑒定,差異蛋白GO注釋在http://www.geneontology.org網(wǎng)站,KEGG分析在http://www.kegg.jp網(wǎng)站進(jìn)行。亞細(xì)胞定位使用Wolfpsort(https://www.genscript.com/wolf-psort.html)系統(tǒng),采用String構(gòu)建蛋白質(zhì)互作網(wǎng)絡(luò)[21],使用Cytoscape進(jìn)行可視化[22],使用GSEA V2.2.4軟件進(jìn)行蛋白富集分析。
在“1% FDR”過(guò)濾標(biāo)準(zhǔn)下,統(tǒng)計(jì)蛋白及肽段數(shù)量,一共鑒定到27 250條肽段和6 036個(gè)蛋白。鑒定到的蛋白質(zhì)所含肽段的數(shù)量分布情況如圖1。從圖1可見(jiàn),肽段的數(shù)目與蛋白質(zhì)的匹配數(shù)量呈反向關(guān)系,肽段1~10匹配的蛋白質(zhì)數(shù)量依次減少,最多的是1肽段的1 311個(gè),占總鑒定蛋白質(zhì)數(shù)量的22.69%;大于10個(gè)肽段的蛋白質(zhì)數(shù)量有571個(gè)。
圖1 肽段數(shù)量分布Fig.1 Distribution of number of peptide segments
對(duì)6個(gè)試驗(yàn)樣品的蛋白質(zhì)豐度值進(jìn)行皮爾森(Pearson)相關(guān)性分析,結(jié)果表明重復(fù)樣本之間的皮爾森相關(guān)系數(shù)較高,說(shuō)明生物學(xué)重復(fù)中存在高度的相關(guān)性,保證了試驗(yàn)結(jié)果的可靠性(圖2)。
圖2 Pearson相關(guān)系數(shù)熱圖Fig.2 Heat map of Pearson correlation coefficient
本次試驗(yàn)從單倍體銀杏中鑒定到6 012個(gè)蛋白,二倍體銀杏鑒定到6 005個(gè)蛋白。其中,有5 981個(gè)共有蛋白,31個(gè)蛋白是單倍體所特有的,24個(gè)蛋白是二倍體所特有的。
以二倍體為對(duì)照,選取|log2FC|≥1,F(xiàn)DR<0.05的蛋白作為差異表達(dá)蛋白(DEPs),可見(jiàn)在單倍體銀杏中共鑒定出686個(gè)差異表達(dá)蛋白,其中的397個(gè)(占57.87%)蛋白的表達(dá)上調(diào),289個(gè)(占42.13%)蛋白的表達(dá)下調(diào)(圖3)。GO富集分析結(jié)果表明,DEPs富集在137個(gè)生物過(guò)程(Biological process,BP),38個(gè)細(xì)胞成分(Cellular component,CC)和78個(gè)分子功能(Molecular function,MF)中。進(jìn)一步分析發(fā)現(xiàn)主要富集于DNA模板的轉(zhuǎn)錄和起始(DNAtemplated transcription,initiation)、葉綠素代謝過(guò)程(Chlorophyll metabolic process)、含卟啉化合物的代謝過(guò)程(Porphyrin-containing compound metabolic process)(圖4)。
圖3 差異蛋白分析Fig.3 Differential proteins analysis
圖4 差異蛋白GO富集Fig.4 Differential protein GO enrichment
通過(guò)KEGG Pathway顯著性富集分析,可了解DEPs參與的最主要生化代謝通路和信號(hào)轉(zhuǎn)導(dǎo)途徑。分析顯示,有通路注釋的263個(gè)候選蛋白富集在97個(gè)KEGG通路中,注釋蛋白數(shù)目最多的通路是代謝途徑(Metabolic pathways),蛋白顯著富集在核糖體(Ribosome),有25個(gè)下調(diào)和3個(gè)上調(diào)蛋白,其次是單萜生物合成(Monoterpenoid biosynthesis)、角質(zhì)栓質(zhì)和蠟質(zhì)合成(Cutin,suberine and wax biosynthesis)和卟啉與葉綠素代謝(Porphyrin and chlorophyll metabolism)(圖5)。
圖5 差異蛋白KEGG富集Fig.5 Differential protein KEGG enrichment
將篩選出來(lái)的差異表達(dá)蛋白通過(guò)細(xì)胞定位來(lái)預(yù)測(cè)蛋白質(zhì)發(fā)揮功能的運(yùn)作環(huán)境。由圖6可知,差異蛋白亞細(xì)胞定位主要在10個(gè)亞細(xì)胞區(qū)室中:葉綠體、細(xì)胞質(zhì)、細(xì)胞核、線粒體、細(xì)胞質(zhì)膜、細(xì)胞外、液泡膜、細(xì)胞骨架、內(nèi)質(zhì)網(wǎng)、過(guò)氧物酶。其中,葉綠體和細(xì)胞質(zhì)所占的比例大,分別為37%和29%,為差異表達(dá)蛋白主要的亞細(xì)胞定位分布點(diǎn);其次是細(xì)胞核,線粒體等亞細(xì)胞結(jié)構(gòu),這些細(xì)胞結(jié)構(gòu)的蛋白表達(dá)水平也容易受倍性變化的影響,而這些場(chǎng)所是光合作用、蛋白質(zhì)合成、細(xì)胞復(fù)制、活性氧產(chǎn)生的主要場(chǎng)所。
圖6 差異蛋白亞細(xì)胞定位Fig.6 Subcellular localization of differential proteins
為進(jìn)一步揭示銀杏單倍體與二倍體差異蛋白質(zhì)的調(diào)控功能,探究其分子機(jī)制,根據(jù)差異富集結(jié)果繪制了蛋白互作網(wǎng)絡(luò)圖(圖7)。由圖7可知,差異蛋白的互作網(wǎng)絡(luò)涉及26個(gè)蛋白的226條相互作用關(guān)系,分布在3個(gè)代謝通路上。其中,大部分蛋白屬于核糖體(Ribosome)通路,F(xiàn)AR5與CYP86B1屬于角質(zhì)、栓質(zhì)和蠟質(zhì)合成(Cutin,suberine and wax biosynthesis)通路,CBR3與MNR1屬于單萜生物(Monoterpenoid biosynthesis)合成通路。角質(zhì)、栓質(zhì)和蠟質(zhì)合成通路與單萜生物合成通路通過(guò)CYP86B1互作。核糖體通路中3個(gè)蛋白質(zhì)上調(diào),其余19個(gè)蛋白質(zhì)均下調(diào),說(shuō)明核糖體代謝通路互作的蛋白質(zhì)表達(dá)量下降。
圖7 差異蛋白互作網(wǎng)絡(luò)Fig.7 Interaction network diagram of differential proteins
GSEA富集分析能彌補(bǔ)傳統(tǒng)富集分析對(duì)微效蛋白的有效信息挖掘不足等問(wèn)題,可以更全面地解釋功能通路的調(diào)節(jié)作用。為此,本研究對(duì)單倍體銀杏中上調(diào)表達(dá)的蛋白質(zhì)進(jìn)行了GSEA-KEGG富集分析,發(fā)現(xiàn)氨基酸的生物合成(Biosynthesis of amino acids)、代謝途徑(Metabolic pathways)和次生代謝物合成(Biosynthesis of secondary metabolites)3條代謝通路被富集,且均顯示出上調(diào)表達(dá)的趨勢(shì)(圖8);此外,還發(fā)現(xiàn)代謝途徑、碳素代謝(Carbon metabolism)、次生代謝物合成和內(nèi)質(zhì)網(wǎng)蛋白加工(Protein processing in endoplasmic reticulum)4條在單倍體銀杏中下調(diào)表達(dá)的富集蛋白質(zhì)(圖9)。
圖8 上調(diào)蛋白GSEA分析Fig.8 GSEA of up-regulated DEPs
圖9 下調(diào)蛋白GSEA分析Fig.9 GSEA of down-regulated DEPs
代謝途徑、次級(jí)代謝產(chǎn)物的生物合成途徑的富集差異蛋白在上調(diào)、下調(diào)表中均有富集,是銀杏單倍體蛋白組的重要調(diào)控特征。
蛋白質(zhì)組是基因表達(dá)的直接產(chǎn)物,執(zhí)行細(xì)胞的生物功能并體現(xiàn)蛋白質(zhì)的表達(dá)規(guī)律[23],蛋白質(zhì)組學(xué)的研究有助于揭示研究對(duì)象的特殊形態(tài)和性狀的相應(yīng)機(jī)制。最近,將蛋白質(zhì)組學(xué)技術(shù)應(yīng)用于白花泡桐Paulowniafortunei四倍體、青楊‘哲引3號(hào)楊’(P.pseudosimonii×nigra)ב北京楊’(P.×beijingensis)雜種三倍體、橡膠樹(shù)Hevea brasiliensis四倍體等[24-26],林木單倍體的研究少,數(shù)據(jù)庫(kù)不完整,對(duì)銀杏單倍體進(jìn)行蛋白質(zhì)表達(dá)特性研究具有重要的科學(xué)意義。
植物倍性變化后往往能引起生理代謝物質(zhì)含量和成分的改變[27],已有轉(zhuǎn)錄組研究發(fā)現(xiàn),單倍體銀杏的類黃酮含量較二倍體低,差異基因在類黃酮生物合成通路中下調(diào)表達(dá)[18]。蛋白質(zhì)組研究結(jié)果表明,銀杏單倍體差異蛋白主要富集于代謝途徑、次級(jí)代謝產(chǎn)物的生物合成中。本研究發(fā)現(xiàn)的蛋白質(zhì)組變化趨勢(shì)與生理指標(biāo)與轉(zhuǎn)錄水平表達(dá)的變化趨勢(shì)是一致的,從蛋白組學(xué)角度闡明了銀杏單倍體的類黃酮含量低的機(jī)理。
單倍體一般表現(xiàn)為葉片窄薄、色淺等[28],冬棗Ziziphusjujube單倍體與其二倍體對(duì)比就表現(xiàn)為葉片窄薄,葉色淺且生長(zhǎng)緩慢[28]。葉綠體的發(fā)育是影響葉色的最主要因素之一,葉綠體中葉綠素改變會(huì)導(dǎo)致葉色發(fā)生變化,從而影響到光合作用。已有研究發(fā)現(xiàn),單倍體銀杏的葉面積(7.9±0.5 cm2)顯著小于二倍體(17.6±1.1 cm2),單倍體銀杏光合作用的凈光合速率顯著低于二倍體[18]。本研究進(jìn)一步發(fā)現(xiàn),差異蛋白定位主要集中在葉綠體中,而蛋白質(zhì)的功能與其在細(xì)胞中的亞細(xì)胞定位密切相關(guān)[30],認(rèn)為是銀杏單倍體葉片葉綠體中的蛋白質(zhì)影響了葉色。
核糖體由核糖體蛋白與核糖體RNA共同組成,負(fù)責(zé)蛋白質(zhì)的合成,與DNA修復(fù)和調(diào)控細(xì)胞分裂、增殖、分化有關(guān)。單倍體銀杏核糖體途徑在差異蛋白質(zhì)互作網(wǎng)絡(luò)表達(dá)中下調(diào),表明單倍體銀杏的核糖體途徑受到抑制,可能與單倍體生長(zhǎng)勢(shì)弱的性狀相關(guān)。在玉米H99、B73單倍體葉片的可溶性糖含量和可溶性蛋白含量的研究中,也表現(xiàn)出這樣的核糖體途徑差異基因表達(dá)結(jié)果。
在本試驗(yàn)的蛋白組學(xué)分析中,獲得了大量的銀杏單倍體差異蛋白質(zhì)信息,但只是對(duì)單倍體銀杏最終呈現(xiàn)的蛋白表達(dá)量進(jìn)行定性定量研究,分析了銀杏單倍體的表型及生理差異的調(diào)控機(jī)制。事實(shí)上,植物倍體差異的生物學(xué)過(guò)程受到很多因素影響,如染色質(zhì)重塑、組蛋白變異、翻譯后修飾等[31]。蛋白質(zhì)組學(xué)研究的深入對(duì)揭示蛋白質(zhì)的磷酸化、糖基化和甲基化等修飾調(diào)控植物生長(zhǎng)發(fā)育至關(guān)重要,都需要在下一步的研究中予以關(guān)注。
利用表觀基因組學(xué)、表型組學(xué)和基因組編輯等方法可以對(duì)銀杏單倍體特征進(jìn)行系統(tǒng)深入研究。選取重要的功能或者通路相關(guān)的蛋白進(jìn)行研究,探究重要蛋白質(zhì)表達(dá)量與植物生長(zhǎng)表型、代謝物含量之間的變化關(guān)系以及這些變化關(guān)系在植物體內(nèi)的作用機(jī)制,對(duì)候選蛋白進(jìn)行基因克隆和功能驗(yàn)證,以確定調(diào)控單倍體銀杏的關(guān)鍵蛋白,為基因工程育種提供分子基礎(chǔ)。
單倍體種質(zhì)資源的基因組學(xué)研究正在大力開(kāi)展,單倍體是基因組測(cè)序、序列拼接、演化分析等遺傳學(xué)研究和基因組學(xué)研究的優(yōu)良材料。使用單倍體植物材料破譯復(fù)雜的參考基因組已經(jīng)在馬鈴薯、杜仲和甘蔗等上實(shí)現(xiàn),特別是在高度復(fù)雜的基因組樹(shù)種中,利用單倍型基因組解析復(fù)雜的性狀調(diào)控機(jī)制和調(diào)控位點(diǎn)的精細(xì)定位已經(jīng)取得了成功,為銀杏單倍體基因組的破解和應(yīng)用提供了重要參考[6,32]。單倍體是完善銀杏高度雜合、超大巨型基因組的完美材料,通過(guò)破譯銀杏單倍體材料的T2T基因組,可以進(jìn)一步提高銀杏現(xiàn)有的參考基因組的質(zhì)量,有助于研究銀杏的長(zhǎng)壽命、高材質(zhì)、優(yōu)景觀,以及珍貴藥用功能成分如黃酮類、萜類、聚戊烯類等的生物代謝與合成機(jī)制。
本研究從蛋白質(zhì)組水平分析了銀杏單倍體的蛋白質(zhì)差異表達(dá)情況,在銀杏單倍體中鑒定到6 012個(gè)蛋白,31個(gè)蛋白是單倍體所特有的;獲得686個(gè)表達(dá)差異蛋白,其中57.87%的蛋白表達(dá)上調(diào),42.13%的蛋白表達(dá)下調(diào),主要富集在參與代謝途徑、葉綠素代謝過(guò)程和核糖體途徑;37%的差異蛋白定位在葉綠體和細(xì)胞質(zhì)亞細(xì)胞區(qū)域,差異蛋白的互作網(wǎng)絡(luò)涉及26個(gè)蛋白的226條相互作用關(guān)系,分布在3個(gè)代謝通路上;發(fā)現(xiàn)了核糖體途徑的差異蛋白質(zhì)網(wǎng)絡(luò)作用,GSEA富集表明差異蛋白參與代謝途徑、次級(jí)代謝產(chǎn)物的生物合成途徑;單倍體銀杏葉小、類黃酮低等性狀的關(guān)鍵原因是調(diào)控通路如代謝途徑、葉綠素代謝過(guò)程和核糖體途徑發(fā)揮作用。