李明洋,SAIDU Kamara,汪琪,郭艷茹,李青峰,朱珊麗,陳俊,蔣朋飛,張麗芳
溫州醫(yī)科大學(xué) 分子病毒與免疫研究所 病原生物與免疫學(xué)系,浙江 溫州 325035
新型冠狀病毒?。╟orona virus disease 2019,COVID-19)暴發(fā),嚴(yán)重影響了公眾的生活秩序和生命安全。目前認(rèn)為新型冠狀病毒(severe acute respiratory syndrome coronavirus 2,SARS-CoV-2)為COVID-19的病原體,與SARS-CoV是姊妹病毒[1]。SARS-CoV-2是目前已知第7種可以感染人的冠狀病毒(coronavirus,CoV),其基因組為線性單股正鏈RNA,可編碼刺突蛋白(S)、膜蛋白(M)、包膜蛋白(E)、核衣殼蛋白(N)等結(jié)構(gòu)蛋白[2]。其中,E蛋白結(jié)構(gòu)最小,僅由約80個氨基酸殘基組成,分布于CoV的包膜表面,可與M蛋白共同誘導(dǎo)CoV的病毒樣顆粒形成,在病毒裝配、出芽、包膜形成中發(fā)揮著重要作用,若CoV E蛋白缺失,則影響病毒的成熟、增殖,導(dǎo)致子代病毒毒力下降[3]。因此,E蛋白也成為CoV疫苗研究的候選靶抗原之一。本研究基于SARS-COV-2 E蛋白的氨基酸序列,運(yùn)用生物信息學(xué)軟件預(yù)測和分析E蛋白結(jié)構(gòu)及免疫優(yōu)勢表位,為SARS-CoV-2藥物篩選和疫苗研制提供理論依據(jù)。
1.1 SARS-CoV-2 E蛋白氨基酸序列及理化性質(zhì) 從美國國家生物技術(shù)信息中心(https://www.ncbi.nlm.nih.gov/)GenBank數(shù)據(jù)庫中獲取SARS-CoV-2 E蛋白的氨基酸序列(QHD43418.1),并通過EXPASY服務(wù)器(https://www.expasy.org/tools)上的ProtParam軟件分析預(yù)測其理化性質(zhì)。
1.2 SARS-CoV-2 E蛋白二級結(jié)構(gòu)預(yù)測 分別應(yīng)用EXPASY服務(wù)器上的SOPMA、GOR等方法,分析預(yù)測SARS-CoV-2 E蛋白的二級結(jié)構(gòu)。
1.3 SARS-CoV-2 E蛋白跨膜區(qū)域預(yù)測 分別應(yīng)用EXPASY服務(wù)器上預(yù)測跨膜結(jié)構(gòu)的TMHMM、Phobius軟件,同時預(yù)測SARS-CoV-2 E蛋白跨膜區(qū)域。
1.4 SARS-CoV-2 E蛋白B細(xì)胞表位綜合分析 應(yīng)用EXPASY服務(wù)器上的ProtScale(https://web.expasy.org/protscale/)軟件對SARS-CoV-2 E蛋白的Hopp & Woods親水性系數(shù)、Emini表面可及參數(shù)、Jameson-Wolf抗原性、Zimmerman極性參數(shù)、柔韌性參數(shù)和線性表位預(yù)測。結(jié)合各預(yù)測參數(shù)并用吳玉章等[4]建立的抗原性指數(shù)(antigenicity index,AI)綜合分析其B細(xì)胞優(yōu)勢表位。
1.5 SARS-CoV-2 E蛋白CTL表位綜合分析 應(yīng)用Net CTL(http://www.cbs.dtu.dk/services/NetCTL/)、SYFPEITHI、 (http://www.syfp-eithi.de/bin/MHCServer.dll/EpitopePrediction.htm)、IEDB(http://tools.immuneepitope.org/main/)軟件針對HLA-A*02:01、HLA-A*24:02(human leukocyte antigen,HLA,是由HLA基因復(fù)合體所編碼的產(chǎn)物,存在于所有有核細(xì)胞的膜上,是組織排斥反應(yīng)的主要抗原)及H2-Kd(histocompatibility-2,H2,H-2I類相當(dāng)于人類HLA的A基因,與移植物排斥反應(yīng)同樣相關(guān))類分子預(yù)測E蛋白的CTL限制性表位。結(jié)合3個預(yù)測軟件對CTL表位結(jié)果做進(jìn)一步分析。
1.6 SARS-CoV-2 E蛋白免疫優(yōu)勢表位和同源性分析 綜合上述預(yù)測的B細(xì)胞抗原表位和T細(xì)胞抗原表位,選出同時含有多個T或B細(xì)胞表位的肽段作為免疫優(yōu)勢表位。應(yīng)用Vector NTI對已知感染人類的CoV屬E蛋白序列及其免疫優(yōu)勢表位進(jìn)行同源性比對。
1.7 SARS-CoV-2 E蛋白三級結(jié)構(gòu)和功能結(jié)構(gòu)域分析 運(yùn)用蛋白質(zhì)分析系統(tǒng)EXPASY網(wǎng)站上Swiss Model工具在線分析SARS-CoV-2 E蛋白三級結(jié)構(gòu)并建模,并對該蛋白功能結(jié)構(gòu)進(jìn)行分析。
2.1 SARS-CoV-2 E蛋白的氨基酸序列和理化性質(zhì)SARS-CoV-2 E蛋白由75個氨基酸組成,其氨基酸序列為:MYSFVSEETGTLIVNSVLLFLAFVVFLLVTLAILTA LRLCAYCCNIVNVSLVKPSFYVYSRVKNLNSSRVPDLLV。ProtParam分析顯示該蛋白質(zhì)相對分子質(zhì)量約為8.37 kDa,理論等電點(diǎn)(pI)為8.57,可推測分子式為C390H625N91O103S4,不穩(wěn)定性指數(shù)(instability index,II,II>40 為不穩(wěn)定蛋白質(zhì))為38.68,結(jié)果表明該蛋白性質(zhì)穩(wěn)定。親水性平均值(grand average of hydropathicity,GRAVY)為1.128,通常GRAVY分布在-2~2,正值越大表示疏水性越強(qiáng),負(fù)值越大表示親水性越強(qiáng),而兩性氨基酸多處于-0.5~0.5;該蛋白質(zhì)包含較高占比的疏水氨基酸,包括18.7%的亮氨酸(Leu)和17.3%的纈氨酸(Val),綜合預(yù)測結(jié)果表明該蛋白質(zhì)為疏水性蛋白。
2.2 SARS-CoV-2 E蛋白二級結(jié)構(gòu)分析 應(yīng)用EXPASY服務(wù)器上的GOR、SOMPA預(yù)測SARS-CoV-2 E蛋白的二級結(jié)構(gòu)。GOR顯示其二級結(jié)構(gòu)由33.33% α螺旋(Alpha helix,Hh)、13.33% β片層(Extended strand,Ee)、53.33%無規(guī)卷曲(Random coil,Cc)構(gòu)成;SOPMA顯示其二級結(jié)構(gòu)由44% α螺旋、26.67%β片層、20%無規(guī)卷曲、9.33% β轉(zhuǎn)角(Beta turn,Tt)構(gòu)成。綜合預(yù)測E蛋白主要由α螺旋為主,共同序列出現(xiàn)在15-39,少見β轉(zhuǎn)角。無規(guī)卷曲序列為:52-54,63-66,69-71,見圖1。
2.3 SARS-CoV-2 E蛋白跨膜區(qū)域的預(yù)測 應(yīng)用EXPASY服務(wù)器上預(yù)測跨膜結(jié)構(gòu)的TMHMM、Phobius預(yù)測SARS-CoV-2 E蛋白,結(jié)果顯示SARS-CoV-2 E蛋白為跨膜蛋白。TMHMM軟件預(yù)測氨基酸序列1-11為膜外區(qū)域,12-34為跨膜區(qū)域,35-75為膜內(nèi)區(qū)域,見圖2A;Phobius軟件預(yù)測氨基酸序列1-11為膜內(nèi)區(qū)域,12-37為跨膜區(qū)域,38-75為膜外區(qū)域,見圖2B。綜合跨膜預(yù)測軟件,預(yù)測E蛋白跨膜區(qū)域?yàn)?2-34,且為α螺旋,其序列為LIVNSVLLFLAFVVFLLVTLAIL,N端位于膜內(nèi),C端位于膜外,見圖2C。
圖1 SARS CoV-2 E蛋白二級結(jié)構(gòu)預(yù)測
2.4 SARS-CoV-2 E蛋白B細(xì)胞表位的預(yù)測分析 應(yīng)用EXPASY服務(wù)器上的ProtScale軟件對Hopp &Woods親水性系數(shù)、Emini表面可及參數(shù)、Jameson-Wolf抗原性參數(shù)、Zimmerman極性參數(shù)、柔韌性參數(shù)和線性表位預(yù)測。提示其B細(xì)胞表位區(qū)域最可能為SEETGT(6-11),平均AI為0.018;KNLNSSRV(63-70),平均AI為0.036,見圖3和表1。
圖3 SARS-CoV-2 E蛋白不同參數(shù)預(yù)測結(jié)果
表1 應(yīng)用不同方法預(yù)測SARS-CoV-2 E蛋白表位的肽段位置
2.5 SARS-CoV-2 E蛋白限制性CTL表位預(yù)測結(jié)果NetCTL 1.2 Server預(yù)測數(shù)值中包括HLA-I分子的親和力分值(affinity,aff)、親和力分值重置值(affinity rescale,aff-rescale)、羧基端酶切效率(C-terminal cleavage,cle)、抗原處理相關(guān)蛋白轉(zhuǎn)運(yùn)效率(transporter-associated antigen processing,tap)和綜合分?jǐn)?shù)(combined score,COMB)。根據(jù)COMB值越大,特異性越高的特性,選擇閾值為COMB>1.0且aff>0.5的九肽作為候選表位。HLA-A2限制性CTL表位5個,HLA-A24限制性CTL表位1個,見表2。其中人源HLA-A24限制性CTL表位與鼠源H2-Kd限制性CTL表位序列一致,對Net CTL的初步預(yù)測結(jié)果再用SYFPEITHI、IEDB做進(jìn)一步的分析。篩選出的HLA-A2和HLA-A24限制性CTL表位均具有較高的親和力(SYFPEITHI分值>20);IEDB采用人工神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測,IC50<50 nmol/L被認(rèn)為是高親和力,且數(shù)值越低親和力越高[5]。因HLA-A24型/H2-Kd型限制性CTL表位的IEDB預(yù)測結(jié)果為低親和肽段,僅能參考SYFPEITHI分?jǐn)?shù),故放在最后。選擇SYFPEITHI/IEDB值分?jǐn)?shù)較高的限制性表位肽用于下一步研究。
表2 SYFPEITHI、IEDB軟件預(yù)測SARS-CoV-2 E蛋白CTL天然表位得分表
2.6 SARS-CoV-2 E蛋白的免疫優(yōu)勢表位和同源性分析 根據(jù)上述預(yù)測結(jié)果最終選擇具有多個CTL表位的氨基酸區(qū)域P1(16-34aa)和同時具有B細(xì)胞表位和CTL表位的氨基酸區(qū)域P2(50-70aa)作為免疫優(yōu)勢表位,見圖4A。通過Vector NTI軟件對α、β、γ和δ屬冠狀病毒E蛋白與SARS-CoV-2 E蛋白序列進(jìn)行同源性比對,SARS-CoV-2 P1免疫優(yōu)勢表位與Bat-SARS-like-CoV和SARS-CoV序列完全一致(100%);P2免疫優(yōu)勢表位與Bat-SARS-like-CoV的序列仍然完全一致(100%),與SARS-CoV序列也表現(xiàn)出高相似度(86%);而與其他種屬冠狀蛋白的相似性較低(10%~38%),見圖4B。系統(tǒng)進(jìn)化樹的結(jié)果顯示,SARS-CoV-2、SARS-CoV和Bat-SARS-like-CoV位于同一分支,表明其具有更接近的同源關(guān)系,而其他CoV如MERS與SARS-CoV-2雖具有平行關(guān)系,但分支相隔較遠(yuǎn),物種進(jìn)化分歧時間更長,親緣關(guān)系更差,見圖4C。
2.7 SARS-CoV-2 E蛋白三維結(jié)構(gòu)及功能結(jié)構(gòu)域 運(yùn)用蛋白質(zhì)分析系統(tǒng)網(wǎng)站Swiss Model在線分析E蛋白三級結(jié)構(gòu)和功能區(qū)域,免疫優(yōu)勢表位P1和P2標(biāo)記三維結(jié)構(gòu)和功能區(qū)域圖中,見圖5A。紅色為P1區(qū)段(16-34)SVLLFLAFVVFLLVTLAIL;藍(lán)色為P2區(qū)段(50-70)SLVKPSFYVYSRVKNLNSSRV。此外,經(jīng)NCBI中(conserved domain database,CCD)預(yù)測該蛋白中N端(12-34)為跨膜結(jié)構(gòu)域(transmembranedomains,TMD),介導(dǎo)物質(zhì)運(yùn)輸及信號轉(zhuǎn)導(dǎo)等功能;C端(72-75)為PDZ結(jié)合序列(PDZ-bing motif,PBM),與病毒穩(wěn)定性有關(guān),見圖5B。
圖4 SARS CoV-2 E蛋白的免疫優(yōu)勢表位和同源性分析
圖5 SARS-CoV-2 E蛋白三維結(jié)構(gòu)及功能區(qū)域
E蛋白對CoV的感染與致病具有重要意義,作為其孔蛋白(viroporin),可在宿主細(xì)胞膜上形成選擇性離子通道,介導(dǎo)特殊離子(如Na+、K+、Ca2+、Cl-、H+)運(yùn)輸,從而對病毒的感染復(fù)制和增殖等功能產(chǎn)生影響;這不僅有助于闡明SARS-CoV-2高致病性的機(jī)制,同時離子通道還可作為一個藥物作用的潛在靶點(diǎn),是抗病毒藥物設(shè)計的靶點(diǎn)之一[3]。本研究通過信息學(xué)分析發(fā)現(xiàn)SARS-CoV-2(Wuhan-Hu-1株)與SARS-CoV(BJ01株)兩個原型株E蛋白僅有4個氨基酸殘基的差別,相似性為94.74%。因此,基于SARS-CoV E蛋白的藥物研發(fā)可能適用于SARS-CoV-2。
SARS-CoV E蛋白是由76 個氨基酸組成的II型膜蛋白,其功能結(jié)構(gòu)域主要分布于氨基酸的N端和C端。其N端12-34aa區(qū)段為疏水性跨膜結(jié)構(gòu)域TMD,該區(qū)段主要由亮氨酸和纈氨酸組成,可提供強(qiáng)大的疏水特性,以保證蛋白質(zhì)結(jié)構(gòu)的穩(wěn)定性;同時E蛋白同源寡聚化可形成離子通道,其氨基酸序列的Asn 15和Val 25是決定該離子通道活性的關(guān)鍵氨基酸殘基,當(dāng)離子通道轉(zhuǎn)運(yùn)Ca2+時,可觸發(fā)并激活炎癥小體,進(jìn)一步誘發(fā)炎性肺損傷[6-7]。而E蛋白的C末端包含一個以β-coil-β為基元的保守脯氨酸殘基,該基序可能起高爾基體復(fù)合物靶向信號的作用,有助于E蛋白的定位并影響病毒的增殖周期[8];C端的最后四個氨基酸殘基(DLLV)為PBM,影響著病毒穩(wěn)定性和毒力[9-10]。本研究結(jié)果顯示,SARS-CoV-2和SARS-CoV E蛋白空間結(jié)構(gòu)幾乎一致,且TMD和PBM區(qū)域序列完全一致(100%)。表明SARS-CoV-2 E蛋白與SARS-CoV具有同樣的功能。
研究表明,缺失E蛋白可抑制MERS-CoV病毒顆粒的成熟和轉(zhuǎn)運(yùn)能力,降低SARS-CoV病毒顆粒的滴度,而以缺失E蛋白和突變羧基端制造的減毒活疫苗,在動物實(shí)驗(yàn)中已初步取得療效。SARS-CoV-ΔE(缺失E蛋白)感染的小鼠肺部,與其相關(guān)的大量促炎細(xì)胞因子的表達(dá)水平降低,而在mRNA和蛋白質(zhì)水平上,抗炎細(xì)胞因子的水平均升高[11],表明減毒病毒可以導(dǎo)致肺部炎癥的減輕以及更強(qiáng)的抗病毒T細(xì)胞反應(yīng),保護(hù)小鼠免受致命病毒的攻擊。然而,也有研究發(fā)現(xiàn)E蛋白缺失,SARS-CoV輔助蛋白3a和8a表現(xiàn)出相對補(bǔ)償功能,存在毒力恢復(fù)的可能[3]。因此,減毒活疫苗仍然存在不足,提示疫苗研究需要從新的角度考慮。免疫優(yōu)勢表位研究一直是疫苗的前沿研究。由多個B細(xì)胞表位或CTL表位組成的免疫優(yōu)勢表位,既可以通過產(chǎn)生的特異性細(xì)胞免疫,達(dá)到清除病毒的目的,又可以通過產(chǎn)生的特異性抗體,預(yù)防病毒感染和復(fù)發(fā)。本研究通過生物信息學(xué)分析預(yù)獲得2個SARS-CoV-2 E蛋白的免疫優(yōu)勢表位,位于其N端16-34aa和C端50-70aa區(qū)段,與α、β、γ和δ屬冠狀病毒序列比對,發(fā)現(xiàn)具有較高的同源性,表明免疫優(yōu)勢表位在一定程度上可同時識別其他CoV感染的細(xì)胞,如SARS-CoV。本研究可為基于SARS-CoV-2 E蛋白的發(fā)病機(jī)制及特異性預(yù)治療疫苗研究提供理論基礎(chǔ)。