黃轉(zhuǎn)青 孫 琦 楊 森 李淵源 石浩源 張 瑩 龔 輝 徐風(fēng)華
1.解放軍總醫(yī)院醫(yī)療保障中心藥劑科藥學(xué)基礎(chǔ)研究室,北京 100853;2.解放軍醫(yī)學(xué)院,北京 100853
截至2019 年底,全球27 個(gè)國家共報(bào)道中東呼吸綜合征(middle east respiratory syndrome,MERS)患者2 260 例,其中803 例死亡,死亡率高達(dá)35.5%[1]。MERS 冠狀病毒(middle east respiratory syndrome coro navirus,MERS-CoV)是一種單股正鏈RNA 病毒,其4種主要結(jié)構(gòu)蛋白分別是刺突蛋白(spike glycoprotein,S)、膜蛋白(membrane glycoprotein,M)、包膜蛋白(envelope protein,E)與核衣殼蛋白(nucleocapsid phospho-protein,N)。其中N、E、M 蛋白參與組裝病毒粒子,S蛋白是參與病毒附著和進(jìn)入宿主細(xì)胞的主要免疫性抗原[2]。MERS 具有流行潛力大、病死率高等特點(diǎn),但暫時(shí)沒有特異性治療方法[3],因此迫切需要相應(yīng)的疫苗和抗病毒策略來應(yīng)對(duì)MERS-CoV 的感染和流行。國內(nèi)外關(guān)于MERS-CoV 的表位預(yù)測(cè),大部分針對(duì)S蛋白,但缺少對(duì)候選表位致敏性或毒性評(píng)估[4-5]。為了更深入地對(duì)MERS-CoV 致病的S 蛋白進(jìn)行分析,本研究采用多種生物信息學(xué)方法來篩選T/B 細(xì)胞抗原表位,以期對(duì)設(shè)計(jì)安全有效的多肽疫苗提供參考。
從美國國家生物技術(shù)信息中心以FASTA 序列格式下載首例輸入中國的MERS 患者分離株S 蛋白(AKL59401.1)氨基酸序列[6],并使用從不同國家鑒定的各種MERS-CoV 分離株獲得的所有S 蛋白序列在MEGA11 中進(jìn)行多序列比對(duì)并構(gòu)建了系統(tǒng)發(fā)育樹[7]。
使用Expasy Protparam 預(yù)測(cè)S 蛋白理化性質(zhì)[8]。S蛋白二級(jí)結(jié)構(gòu)特征預(yù)測(cè)使用SOPMA[9]。
通過trRosetta 對(duì)S 蛋白進(jìn)行三維結(jié)構(gòu)建模,并對(duì)所建模型采用PROCHECK[10]驗(yàn)證其合理性。
1.4.1 細(xì)胞毒性T 淋巴細(xì)胞(cytotoxic T lymphocyte,CTL)表位預(yù)測(cè) CTL 表位預(yù)測(cè)采用NetCTL-1.2 和NetMHC pan EL 4.1 進(jìn)行分析。本研究選取世界人口中主要存在的6 種HLA Ⅰ超型(HLA-A×0101、A×0201、A×0301、A×2402、B×0702、B×4403)進(jìn)行預(yù)測(cè)[11]。NetCTL-1.2 選擇閾值0.75[12]。NetMHC pan EL 4.1 網(wǎng)站默認(rèn)與MHC Ⅰ類分子強(qiáng)、弱結(jié)合肽序列的閾值為0.5%和2.0%[13],本次預(yù)測(cè)保留排名前1%的預(yù)測(cè)表位。綜合以上兩個(gè)數(shù)據(jù)庫預(yù)測(cè)的表位,使用IEDB 的Class ⅠImmunogenicity 分析工具進(jìn)行免疫原性預(yù)測(cè),設(shè)置肽段長(zhǎng)度為9aa、閾值0.2 來進(jìn)行免疫原性篩選[14-15]。最后用VaxiJen v2.0[16]、AllerTOP v.2.0[17]和ToxinPred[18]對(duì)篩選出來的CTL 表位進(jìn)行抗原性、致敏性和毒性評(píng)估,服務(wù)器均選用默認(rèn)閾值,得到最終的CTL表位。
1.4.2 輔助性T 淋巴細(xì)胞(helper T lymphocyte,HTL)表位預(yù)測(cè) 為準(zhǔn)確嚴(yán)謹(jǐn)?shù)仡A(yù)測(cè)出HTL 表位,本研究預(yù)測(cè)結(jié)合使用NetMHCⅡpan-4.0、IFNepitope[19]和IL-4pred[20]3 種工具,綜合預(yù)測(cè)到的表位進(jìn)入后續(xù)檢驗(yàn)。NetMHCⅡpan-4.0 中最終篩選出排名前2%的強(qiáng)結(jié)合肽用于后續(xù)檢驗(yàn)[13]。等位基因選取世界人口中主要存在的7 種HLA Ⅱ超型(HLA-DRB1×0101、×0301、×0401、×0701、×1101、×1301、×1501)進(jìn)行預(yù)測(cè)[11]。最后對(duì)篩選出來的HTL 表位進(jìn)行抗原性、過敏性和毒性評(píng)估,此部分方法同“1.2”,得到最終的HTL 表位。
本研究中線性B 細(xì)胞(linear B lymphocyte,LBL)表位采用ABCpred[21]和BepiPred-2.0 網(wǎng)站[22]預(yù)測(cè),其中ABCpred 預(yù)測(cè)肽長(zhǎng)度選擇14aa、16aa、18aa;Bepipred中均選擇默認(rèn)值。選取兩個(gè)網(wǎng)站中重疊的表位進(jìn)行抗原性、致敏性和毒性預(yù)測(cè),預(yù)測(cè)方法同“1.2”。構(gòu)象B細(xì)胞(conformation B Lymphocyte,CBL)表位預(yù)測(cè)使用IEDB 中ElliPro 工具[23],預(yù)測(cè)閾值選擇0.5。
所選的等位基因超群覆蓋率由IEDB 中人口覆蓋工具分析[15]。整體預(yù)測(cè)流程概要見圖1。
圖1 抗原表位預(yù)測(cè)流程
多序列比較結(jié)果顯示,S 蛋白序列保守性較高,在突變位點(diǎn)中大部分的突變頻率僅為1。本研究中獲取的所有S 蛋白都可組裝成一個(gè)系統(tǒng)進(jìn)化枝,彼此密切相關(guān)。見圖2。
圖2 不同國家的中東呼吸綜合征冠狀病毒蛋白及其系統(tǒng)發(fā)育樹
理化性質(zhì)預(yù)測(cè)結(jié)果顯示,S 蛋白具有1 353 個(gè)氨基酸,重量為149 479.23 ku,理論P(yáng)I 值為5.80,消光系數(shù)為170 865/(M·cm),不穩(wěn)定性指數(shù)為36.81(為穩(wěn)定蛋白),脂肪指數(shù)為82.79,親水性總平均值為-0.078(具有親水性)。其在哺乳動(dòng)物網(wǎng)織紅細(xì)胞中估計(jì)半衰期為30 h。SOPMA 網(wǎng)站對(duì)S 蛋白二級(jí)結(jié)構(gòu)預(yù)測(cè)發(fā)現(xiàn)其具有α-螺旋413 個(gè),占比30.52%;延伸鏈294個(gè),占比21.73%;β-轉(zhuǎn)角53 個(gè),占比3.92%;無規(guī)卷曲593 個(gè),占比43.83%。見圖3。
圖3 S 蛋白二級(jí)結(jié)構(gòu)在SOPMA 中的預(yù)測(cè)結(jié)果
trRosetta 對(duì)S 蛋白建模結(jié)果見圖4A。該模型經(jīng)PROCHECK 驗(yàn)證結(jié)果見圖4B,其中最合理區(qū)殘基占比85.9%,其他合理區(qū)占12.3%,一般合理區(qū)占1.1%,不合理區(qū)占0.8%。
圖4 S 蛋白的建模結(jié)果及驗(yàn)證
2.4.1 CTL 表位預(yù)測(cè)結(jié)果NetCTL-1.2 和NetMHC pan EL 4.1 的重疊表位136 個(gè),其中具有免疫原性的表位14 個(gè)。經(jīng)抗原性、致敏性和毒性評(píng)估后最終得到2個(gè)候選CTL 表位,分別為S567-575 和S42-50。
2.4.2 HTL 表位預(yù)測(cè)結(jié)果 NetMHCⅡpan-4.0 預(yù)測(cè)得到表位46 個(gè);上述表位中IFN-γ 表位共有13 個(gè);其中IL-4 表位7 個(gè),經(jīng)抗原性、致敏性和毒性評(píng)估后最終得到2 個(gè)抗原性較強(qiáng)的HTL 表位,分別為S300-314和S1058-1072。
ABCpred 和BepiPred-2.0 中重疊的LBL 表位38個(gè),經(jīng)抗原性、致敏性和毒性評(píng)分后最終得到15 個(gè)LBL表位,分別是S19-32、S66-83、S259-272、S355-370、S412-427、S413-426、S450-463、S581-596、S623-638、S657-667、S685-709、S738-777、S1108-1117、S1198-1213、S1222-1239。ElliPro 預(yù)測(cè)結(jié)果顯示共有641 個(gè)殘基分別位于5 個(gè)CBL 表位中,各CBL 具體位置見圖5。
圖5 五個(gè)CBL 表位(黃色)在S 蛋白中的相對(duì)空間位置
IEDB 人口覆蓋率計(jì)算工具顯示,本研究中選擇用于T 細(xì)胞表位預(yù)測(cè)的HLA 等位基因預(yù)計(jì)能覆蓋世界95.19%的人口。
與傳統(tǒng)技術(shù)路線比較,多肽疫苗具有安全性高、特異性強(qiáng)、成分簡(jiǎn)單,可將多個(gè)不同抗原表位結(jié)合到一起構(gòu)建合成等優(yōu)點(diǎn)。生物信息學(xué)的發(fā)展可以實(shí)現(xiàn)在不需要體外培養(yǎng)病原體的情況下,預(yù)測(cè)各種病毒不同肽段表位的抗原性、免疫原性及免疫相關(guān)的其他理化性質(zhì),為多肽疫苗設(shè)計(jì)表位選擇提供可靠的指導(dǎo)和參考。
由于MERS-CoV 的致死率高,故其被認(rèn)為是威脅人類健康最關(guān)鍵的新興病原體之一。但關(guān)于MERS-CoV 流行病學(xué)、發(fā)病機(jī)制和演變方面仍存在很多未知,并且目前還沒有任何抗MERS-CoV 治療藥物被批準(zhǔn)用于人類[24],亦無保護(hù)率高的特異預(yù)防性疫苗,因此選擇預(yù)測(cè)MERS-CoV 致病關(guān)鍵蛋白的優(yōu)選抗原性肽段,對(duì)MERS-CoV 多肽疫苗的設(shè)計(jì)和開發(fā)具有重要作用。本研究通過對(duì)所選S 蛋白理化性質(zhì)和二級(jí)結(jié)構(gòu)分析發(fā)現(xiàn)其為親水性穩(wěn)定蛋白。對(duì)其三級(jí)結(jié)構(gòu)模型驗(yàn)證發(fā)現(xiàn)該模型中最合理區(qū)域殘基占比很高,提示預(yù)測(cè)模型較為準(zhǔn)確。免疫信息學(xué)方法預(yù)測(cè)S 蛋白序列與MHC Ⅰ類分子結(jié)合力較強(qiáng)的CTL 表位,進(jìn)而通過對(duì)這些序列進(jìn)行免疫原性分析;同時(shí)還預(yù)測(cè)了S蛋白與MHC Ⅱ類分子強(qiáng)結(jié)合且能分泌IFN-γ 和IL-4 的HTL 表位。由于安全性和有效性是多肽疫苗的基本要求,且只有抗原性強(qiáng)的表位才能刺激產(chǎn)生有效的免疫反應(yīng),只有無致敏性和毒性的表位才能用于設(shè)計(jì)安全的人用疫苗。因此,對(duì)上述得到的表位進(jìn)行抗原性分析、過敏性和毒性評(píng)估,最終得到抗原性強(qiáng)、無致敏性和無毒性的CTL 表位2 個(gè),HTL 表位2 個(gè),LBL 表位15 個(gè)。此外,大部分B 細(xì)胞表位是不連續(xù)的,即其由病原體蛋白質(zhì)序列中分離較遠(yuǎn)的片段組成,這些片段由于蛋白質(zhì)的折疊而接近[25],故本研究中采用ElliPro 預(yù)測(cè)不連續(xù)B 細(xì)胞表位,得到CBL 表位5 個(gè)。人口覆蓋率預(yù)測(cè)結(jié)果顯示所選等位基因預(yù)計(jì)能覆蓋世界95.19%的人口,提示基于本研究得到的抗原表位設(shè)計(jì)的表位疫苗具有廣譜性。
本研究綜合利用多種生物信息學(xué)工具,整理出一套適用于MERS-CoV 多肽疫苗候選表位預(yù)測(cè)分析的流程,這在新型冠狀病毒感染等流行病蔓延的當(dāng)下,具有較大的參考價(jià)值和借鑒意義。盡管本研究預(yù)測(cè)出了MERS-CoV 的優(yōu)勢(shì)抗原表位,但所預(yù)測(cè)的優(yōu)勢(shì)表位是否能誘導(dǎo)機(jī)體發(fā)生先天免疫和特異性免疫反應(yīng),還需進(jìn)一步實(shí)驗(yàn)驗(yàn)證。