陳星州 周國英 陳行鋼 江玲玉 包安華 劉君昂
(中南林業(yè)科技大學 南方人工林病蟲害防治國家林業(yè)局重點實驗室 森林有害生物防控湖南省重點實驗室經(jīng)濟林培育與保護教育部重點實驗室 長沙 410004)
油茶(Camelliaoleifera)作為農(nóng)村興林富民的主導產(chǎn)業(yè)和脫貧攻堅的民生產(chǎn)業(yè),在我國種植面積不斷擴大。炭疽病是油茶栽培區(qū)主要病害之一,引起油茶落果、落蕾,甚至整株衰亡,在湖南省油茶種植區(qū)引起的落果率平均為20%,有時可高達40%~50%(喻錦秀等, 2014)。前期調查研究發(fā)現(xiàn),中國油茶炭疽病的病原菌種類復雜多樣,果生刺盤孢(Colletotrichumfructicola)是目前各產(chǎn)區(qū)油茶炭疽病的優(yōu)勢病原菌(李河, 2018)。
自然條件下,植物體會受到多種病原體的攻擊,因此植物形成了復雜的免疫系統(tǒng),植物和病原體之間的相互作用現(xiàn)在被描述為一種共同進化的軍備競賽,被稱之為之字形模型(Jonesetal.,2006)。當病原體攻擊植物細胞時首先會促發(fā)植物一般防御機制,這個過程被指定為PAMP(pathogen-associated molecular pattern)觸發(fā)免疫模式或者觸發(fā)免疫(PAMP-triggered immunity,PTI)(Kushalappaetal.,2016)。另外,病原體也會通過將效應子分泌到宿主細胞中來干擾PTI,植物通過直接或間接識別病原體效應物的抗性(R)蛋白激活第二層免疫系統(tǒng),這被稱為效應物觸發(fā)免疫(effector-triggered immunity,ETI)。病原體通常會進化出新的效應子,并轉移到宿主細胞中干擾植物的免疫系統(tǒng),從而促進病原體定殖(Dangletal., 2013; Yanetal., 2018)。例如果生刺盤孢在早期侵染蘋果(Maluspumila)樹時分泌的效應子CfEC96,缺失該基因的果生刺盤孢突變體的營養(yǎng)生長、附著胞的形成均不受影響,但是突變體對蘋果葉和果實的毒力減弱(Shangetal., 2020)。真菌效應子都具有相似的分子特征:無糖基磷脂酰肌醇(Glycosylphosphatidyl inositol, GPI)的錨定位點,無跨膜結構域,沒有將蛋白輸送到線粒體或其他胞內細胞器的預測定位信號,含有N-端信號肽,富含半胱氨酸,氨基酸殘基<300個,序列高度特異(Ramachandranetal., 2017)。對于真菌效應子的研究目前主要集中于稻瘟菌(Magnaportheoryzea)、番茄葉霉菌(Cladosporiumfulvum)、尖孢鐮刀菌(Fusariumoxysporum)等,但對于炭疽菌效應子的研究報道較少。隨著計算機技術的高速發(fā)展以及測序技術的不斷更新,利用生物信息學手段對效應子進行預測與分析逐漸成為篩選真菌候選效應子的重要方法,并且有證據(jù)證明轉錄組學的數(shù)據(jù)可以預測毒力因子(Jonesetal., 2018)。
本研究綜合利用BUSCA、Target P、big-PI Predictor、GO、KEGG功能富集和PHI等生物信息分析軟件和數(shù)據(jù)庫,對果生刺盤孢分泌蛋白和候選效應子進行預測和分析,并通過煙草(Nicotianabenthamiana)瞬時表達系統(tǒng)驗證候選效應子的功能,擬為果生刺盤孢致病相關基因研究提供理論依據(jù),同時為油茶種植的病害管理提供參考。
野生型本氏煙草(Nicotianabenthamia)種子、果生刺盤孢菌、質粒pEGAD載體由中南林業(yè)科技大學森林保護重點實驗室保存。大腸桿菌(Escherichiacoli)DH5α、農(nóng)桿菌(Agrobacteriumtumefaciens)GV3101由南京諾唯贊生物科技股份有限公司提供。
轉錄組測序由廣州基迪奧生物科技有限公司完成,測序樣品包括果生刺盤孢分生孢子組織以及由分生孢子侵染油茶葉片96 h后的病斑組織,每組樣品設置3個生物學重復。參考基因組為ColletotrichumfructicolaNara gc5基因組(BioProject Accession: PRJNA225509)。差異表達基因的篩選閾值為相對表達量|log2(fc)|≥1且FDR≤0.05,最終得到7 850個侵染前后差異表達的基于蛋白氨基酸序列用于后續(xù)分析。
將同時含有N端信號肽、亞細胞定位為胞外分泌類型、無跨膜結構域、無GPI錨定位點4個特征的蛋白質定義為果生刺盤孢經(jīng)典分泌蛋白。
BUSCA(http∥busca.biocomp.unibo.it)(Castrenseetal., 2018)可同時對果生刺盤孢轉錄組中編碼的全部蛋白序列的信號肽、跨膜結構域、亞細胞定位、GPI錨定位點進行分析。利用TargetP 1.1 Server(http:∥www.cbs.dtu.dk/services/TargetP/)對上述定位到胞外的蛋白進行驗證分析(Emanuelssonetal., 2007)。利用LipoP 1.0 Server(www.cbs.dtu.dk/services/LipoP/)對經(jīng)典分泌蛋白信號肽切割位點的氨基酸組成進行分析(Junckeretal., 2003)。
利用GO(http:∥www.geneontology.org)、KEGG(http:∥www.genome.jp/kegg/)(Kanehisaetal., 2019)、PHI(http:∥www.phi-base.org/)(Martinetal., 2019)多個數(shù)據(jù)庫對經(jīng)典分泌蛋白序列進行BLASTP比對,對其功能進行注釋。
對果生刺盤孢經(jīng)典分泌蛋白進一步分析篩選,其篩選標準為氨基酸長度<300且?guī)в?個或多個半胱氨酸殘基(Jonesetal., 2018),并利用Effector P(http:∥effectorp.csiro.au/)在線分析軟件對上述蛋白質序列進行分析(Pengetal.,1999)。
隨機選取9個候選效應子,利用qRT-PCR技術驗證候選效應子的基因表達情況(表1)。按照RNAprep Pure多糖多酚植物總RNA提取試劑盒(天根生化科技(北京)有限公司)說明,分別提取分生孢子和葉片中的菌絲RNA。按照FastKing一步法除基因組cDNA試劑盒(天根生化科技(北京)有限公司)操作步驟,進行反轉錄; 以反轉錄產(chǎn)物cDNA 作為模板,按照SuperRealPreMix Plus(SYBR Green)(天根生化科技(北京)有限公司)試劑盒說明書進行qRT-PCR 分析。將分生孢子中目的基因表達量定為1,通過擴增獲得Ct值來計算目的基因在侵染時期的相對表達量,Actin為內參基因(李司政等, 2020)。每個基因設置4個重復。
表1 9個候選效應子基因qRT-PCR的特異性引物序列Tab.1 9 candidate effectors gene-specific primer sequences designed for qRT-PCR
以cDNA作為模板,從上述9個候選效應子中隨機選取4個,擴增其全長基因片段。構建pEGAD-CfEP(Colletotrichumfructicolaeffector protein)表達載體(表2)。將表達載體轉化進大腸桿菌感受態(tài)DH5α中,選取測序正確的菌落提取質粒,將質粒轉化進農(nóng)桿菌感受態(tài)內。
攜帶重組載體的農(nóng)桿菌加入LB液體培養(yǎng)基中,搖床28 ℃、200 r·min培養(yǎng)24~48 h。6 000 r·min-1離心2 min收集菌液,棄上清液,加入適量煙草注射液[MES(10 mmol·L-1,pH5.6)、MgCl2(10 mmol·L-1)、AS(10 mmol·L-1)]懸浮農(nóng)桿菌,稀釋菌液至OD600值為0.5~1.0; 將懸浮液置于28 ℃,避光孵育2~3 h。使用1 mL的無菌注射器(去除針頭),吸取適量懸浮菌液,利用滲入法將其注射到條件至適宜的本氏煙草葉片的背面。注射完成后,將煙草置于25 ℃繼續(xù)培養(yǎng),2~3天后觀察煙草葉片表型,觀察葉片壞死情況。
剪下煙草葉片,利用3,3-二氨基聯(lián)苯胺(3,3-diaminobenzidine,DAB)對煙草葉片進行組織染色,具體參照何燕華等(2014)的方法。
表2 4個候選效應子基因全長克隆引物序列Tab.2 4 candidate effector gene-primer sequences designed for full-length cloning
2.1.1 經(jīng)典分泌蛋白的預測分析 本研究利用BUSCA軟件同時對果生刺盤孢轉錄組中編碼的7 850條蛋白質氨基酸序列的信號肽、跨膜結構域、亞細胞定位、GPI錨定位點進行預測分析,結果表明,分析的7 850條序列中有436個氨基酸序列含有N端信號肽,所占比例為5.55%; 其中含有分泌型信號肽的蛋白質中有390個蛋白不具有跨膜結構域; 在沒有跨膜結構螺旋的蛋白質中有354個蛋白序列不具有GPI錨定位點; 具有以上3個特征的354個蛋白質亞細胞定位均為胞外分泌類型。進一步用TargetP 1.1 Server對分泌到胞外的蛋白質進行驗證分析可知,含有信號肽的蛋白質345個,所占比例為97.46%。綜合上述分析,在果生刺盤孢侵染階段的轉錄組所編碼的7 850條蛋白質氨基酸序列中,有345個符合經(jīng)典分泌蛋白特征,所占比例為4.39%。
2.1.2 經(jīng)典分泌蛋白的特征分析 1) 氨基酸長度 經(jīng)典分泌蛋白氨基酸長度在各區(qū)間段分布較為均勻,而符合效應子篩選條件(<300 aa)的蛋白約占蛋白總數(shù)的36%,數(shù)量相對較少(圖1A)。
2) 信號肽長度 在345個經(jīng)典分泌蛋白中,信號肽長度(氨基酸殘基數(shù))最大為33個氨基酸,最小的為15個氨基酸; 其中,有64個蛋白含有長度為18個氨基酸的信號肽,為數(shù)量最多(圖1B)。
圖1 經(jīng)典分泌蛋白的特征分析Fig.1 Characteristic analysis of classic secreted proteinsA: 氨基酸長度分析; B: 信號肽長度分析。A: Amino acid length analysis; B: Signal peptide length analysis.
3) 信號肽切割位點氨基酸出現(xiàn)頻率及分布 根據(jù)信號肽酶識別位點的不同,可將信號肽分為信號肽酶Ⅰ型(SPⅠ)和信號肽酶Ⅱ型(SPⅡ)。SPⅠ分泌型信號肽的典型結構特征是C端切割位點(-3~-1位置)為A-X-A; SPⅡ為脂蛋白信號肽,典型結構是C端切割位點(-3~-1位置)為L-(A/S)-(A/G)。305個經(jīng)典分泌蛋白含有SPⅠ型信號肽識別位點,40個含有SPⅡ型信號肽識別位點。
信號肽中氨基酸殘基的分布統(tǒng)計結果表明,20種氨基酸的出現(xiàn)頻率從高到低依次為ASPVLTGQIDNREFKCHYMW。其中,非極性氨基酸G、A、V、L、P的出現(xiàn)頻率相對較頻繁,A所占比例最大,為22.88%。此外,分泌蛋白在-1位的氨基酸種類較為保守,以非極性疏水氨基酸為主(A最多,所占比例高達66.09%); 其次為-3位(P最多,所占比例為44.93%)(圖2)。
圖2 果生刺盤孢經(jīng)典分泌蛋白中氨基酸的比例Fig.2 The ratio of amino acids in C. fructicola classic secreted proteins
2.2.1 GO功能注釋 利用GO數(shù)據(jù)庫對345個經(jīng)典分泌蛋白進行功能注釋分析,共得到465條GO術語信息; 其中分子功能(molecular function)>生物途徑(biological process)>細胞組分(cellular component)。在分子功能中最多的是催化活性(catalytic activity),占22.18%(圖3A); 在生物途徑中,最多的是初級代謝過程(primary metabolic process),占25.0%(圖3B); 在細胞組分中,最多的是細胞內膜結合細胞器(intracellular membrane-bounded organelle),占37.93%(圖3C)。各組分中占比較多的蛋白質功能均與真菌的致病力以及生長發(fā)育有著直接或間接的聯(lián)系。
2.2.2 KEGG功能富集 利用KEGG對經(jīng)典分泌蛋白345條氨基酸序列進行分析,最終得到164條Pathway信息。其中最多的是代謝途徑(metabolic pathways)占26.2%,其次是次生代謝產(chǎn)物(biosynthesis of secondary metabolites)及淀粉和蔗糖代謝(starch and sucrose metabolism)分別占10.98%和6.10%(圖4)。在經(jīng)典分泌蛋白中,碳水化合物代謝、抗氧化通路及水解酶基因等明顯富集。有研究表明侵染過程中果生刺盤孢行使包括“增長”“細胞”“對刺激的響應”“代謝過程”和“信號傳遞”功能的蛋白明顯增多(Keetal.,2014),這與本研究結果相似。
2.2.3 PHI功能注釋 通過利用PHI(pathogen-host interaction data-base)致病菌數(shù)據(jù)庫,對已經(jīng)獲得的345條經(jīng)典分泌蛋白進行功能注釋,試找出經(jīng)典分泌蛋白在致病菌中多行使何種功能。最終檢索得到80條結果,其中31個比對序列通過反向遺傳技術驗證了其與致病的相關性,包括缺失后致死相關的基因1個,缺失后喪失致病力的基因4個,缺失后降低毒力的基因25個,還包含了1個已知效應子(表3),該效應子發(fā)現(xiàn)于稻瘟病菌中,但在本研究檢索中未發(fā)現(xiàn)已知的炭疽病效應子的信息,大多數(shù)已知致病基因同時在多個不同宿主致病菌中被發(fā)現(xiàn),其中有一些蛋白在宿主為其他哺乳動物、魚類和昆蟲的致病菌中也有發(fā)現(xiàn),但數(shù)量較少(3.75%),例如鼠類的念珠菌(Candidaalbicans)病。
真菌效應子由于缺乏保守的氨基酸序列特征,預測一般采用相對寬泛的標準(Sperschneideretal., 2015)。大多數(shù)已知的真菌效應子應具有信號肽、分子量小以及富含半胱氨酸殘基等特點。本文在已預測了果生刺盤孢經(jīng)典分泌蛋白的基礎上,以氨基酸長度<300且半胱氨酸殘基的數(shù)量≥4為篩選條件,進一步對效應子進行篩選。123個分泌蛋白氨基酸長度符合篩選條件; 進一步分析發(fā)現(xiàn),有65個分泌蛋白同時滿足半胱氨酸殘基≥4的條件; 即果生刺盤孢在侵染階段有65個候選效應子差異表達,占轉錄本蛋白總數(shù)的0.8%,占經(jīng)典分泌蛋白總數(shù)的18.84%。對效應子氨基酸長度分析發(fā)現(xiàn),有64個效應子氨基酸長度小于200 aa,59個長度在200~300 aa之間。對效應子半胱氨酸殘基數(shù)進行統(tǒng)計,發(fā)現(xiàn)其主要集中在4~8之間,其中以4個和6個較多,分別占27.7%和24.61%。對候選效應子進行功能分析,有36個候選效應子在ColletotrichumfructicolaNara gc5參考基因組中具有注釋,其中包括幾丁質結合蛋白、短鏈脫氫酶、酪氨酸酶以及含有CFEM結構域的蛋白(含有該結構域的蛋白質僅存在于真菌中)等。除此之外,另有29個為假定蛋白(hypothetical protein)。
此外,前人報道Effector P作為一類真菌效應子的在線預測軟件,綜合考慮了所預測蛋白的序列長度、分子量、蛋白電荷、半胱氨酸絲氨酸和色氨酸含量外,同時將真菌蛋白質在植物中的表達特征作為效應子預測的優(yōu)選項,從而大幅度提高了效應子預測的準確性。利用Effector P在線預測軟件對65個候選效應子分析發(fā)現(xiàn),有31個符合Effector P效應子標準,而其中除了14個獲得注釋外,其他17個均為假定蛋白。
采用隨機抽樣的方法選取9個候選效應子基因進行qRT-PCR分析(圖5)。9個基因的表達趨勢與在RNA-seq數(shù)據(jù)中發(fā)現(xiàn)的趨勢相似。侵染時期9個候選蛋白基因,與轉錄組數(shù)據(jù)結果相符,說明轉錄組的數(shù)據(jù)是可靠的。同時也符合效應子一般在侵染階段會大量表達的情況。
圖5 果生刺盤孢中9個候選效應子的定量分析Fig.5 Quantitative analysis of nine candidate effectors from C. fructicola transcriptomeRNA-Seq和qRT-PCR比較驗證結果。誤差條表示平均值的誤差值。Comparison of RNA-Seq and qRT-PCR validation results.Error bars represent the standard error of the mean.
圖6 果生刺盤孢中4個候選效應子的功能驗證Fig.6 Functional verification of 4 candidate effectors in C. fructicola
利用煙草瞬時表達系統(tǒng)驗證選取的4個候選效應子均能誘使煙草葉片發(fā)黃或皺縮(圖6),且與陽性對照Bax蛋白造成的結果一致,而注射空載體的區(qū)域未發(fā)生相應變化。DAB染色實驗注射候選效應子區(qū)域和Bax蛋白區(qū)域均有深褐色沉淀,注射空載體區(qū)域未發(fā)生變化,這一結果也表明注射區(qū)域煙草細胞出現(xiàn)損傷,有大量H2O2沉積。以上結果均表明,果生刺盤孢候選效應子基因成功導入煙草中,并激活煙草細胞的防御反應,誘使煙草細胞凋亡,與其他研究人員驗證的大多數(shù)效應子功能相符。
分泌蛋白作為一類重要的致病因子,與植物病原真菌的致病性密切關聯(lián),隨著越來越多病原真菌基因組測序的完成,應用生物信息手段對其分泌蛋白進行預測分析,有利于全面了解其致病機制。而隨著生物信息學分析軟件的不斷更新,蛋白質數(shù)據(jù)庫中數(shù)據(jù)的日益豐富,對于蛋白基本特征的預測手段也越來越多,越來越準確。通過分析草莓(Fragariaananassa)與果生刺盤孢的轉錄組數(shù)據(jù)(包括24、48、96 h 3個時間段),并利用Signal P、TMHMM、TargetP和big-PI predictor預測工具分別對蛋白質信號肽、跨膜結構域、GPI錨定位和亞細胞定位分析最后得到52個候選效應子(Emanuelssonetal., 2000),在分析過程中還含有多個來自其他植物病原體的已知效應子,如基因CGGC5_2199(Cmu1的同源物),可抵消水楊酸(SA)宿主的依賴性免疫,降低SA前體分支糖酸鹽的水平(Zhangetal., 2018),基因CGGC5_10914(Ecp6的同源物)可以螯合幾丁質寡糖以防止引起植物免疫力(Djameietal., 2011),其結果與本文的分析結果相似。綜上所述,本文利用BUSCA分析軟件可以同時分析多種結構,在一定程度上減輕了預測工作的難度,同時預測結果可靠性較高。
真菌在侵染寄主植物時會分泌大量的毒力因子,如效應子、植物細胞降解酶和次生代謝物生成酶等。多數(shù)情況下,并不是單一的毒力因子起作用而是多種酶類共同作用,致使真菌成功侵染寄主植物,此外除了毒力因子之外,真菌會產(chǎn)生許多幫助其生長增殖的酶類,以致于更好地完成侵染。為研究候選效應子在侵染階段中的作用,本文利用GO、KEGG、PHI 3個數(shù)據(jù)庫對果生刺盤孢侵染階段轉錄組中345個分泌蛋白進行功能注釋分析分別獲得465條GO術語信息、164條Pathway信息和80條致病相關基因,與前人分析獲得的轉錄組數(shù)據(jù)中富含小分泌蛋白、碳水化合物活性酶和次生代謝產(chǎn)物合成酶的結果相符(Jongeetal., 2010); 就KEGG功能富集結果表明,大多數(shù)蛋白與真菌代謝途徑有關,其次真菌的次生代謝產(chǎn)物的合成、內質網(wǎng)中的蛋白質的合成、淀粉和蔗糖代謝和酪氨酸代謝功能有明顯的富集。因此,推測大多數(shù)蛋白的代謝途徑都與真菌致病能力和維持真菌自身的生長發(fā)育相關,如酪氨酸酶就與部分真菌孢子形成以及穩(wěn)定性、毒力和黑色素形成有密切的關系(Liangetal., 2018); Halaouli等(2006)對膠孢炭疽菌轉錄組信息進行GO和KEGG功能富集分析時發(fā)現(xiàn),碳水化合物代謝、抗氧化通路及水解酶基因等明顯富集,這與本文結果相似。
在345個經(jīng)典分泌蛋白中篩選得到17個未被注釋的候選效應子,隨機選取9個候選效應子在侵染階段都有明顯的表達,與轉錄組結果相似都上調表達,這與Zhang等(2016)研究結果相似。選取的4個候選效應子在煙草瞬時表達試驗中也表現(xiàn)出具有誘使細胞壞死的功能,這進一步證實了本文所獲得的候選效應子的可靠性?;诂F(xiàn)有的研究基礎,今后可深入研究候選效應子的功能和作用機制,包括利用亞細胞定位技術探究其作用位點、候選效應子的信號肽功能、篩選與候選效應子相匹配的靶標蛋白等。
果生刺盤孢侵染油茶葉片的轉錄組數(shù)據(jù)中分析篩選得到17個候選效應子,qRT-PCR驗證了其中9個候選效應子的表達情況同時驗證了轉錄組數(shù)據(jù)的可靠性,通過煙草瞬時表達試驗,鑒定出其中4個候選效應子具有誘導煙草葉片細胞壞死的功能。利用生物信息的手段設置合理的篩選條件對病原真菌侵染植物階段的轉錄組數(shù)據(jù)進行預測分析,能有效篩選得到病原真菌效應子,這為植物與病原真菌的互作提供研究思路。