高珂星,魯 非,高競(jìng)溪,胡志剛,紀(jì) 鋒,郭志剛
(南京師范大學(xué) 生命科學(xué)學(xué)院,南京 210046)
基于系統(tǒng)學(xué)、分類(lèi)學(xué)等的研究,SARS-CoV-2被歸為冠狀病毒中的Beta屬,遺傳物質(zhì)為單股正鏈RNA,顆粒多為球狀,直徑一般在60 ~140 nm,通常具有多形性[1],病毒衣殼外由刺突樣結(jié)構(gòu)包裹,顯微結(jié)構(gòu)呈皇冠樣。2020年1月7日,該病毒被初次檢出且已被證明是截至目前第7種可以侵染人的冠狀病毒,該病毒入侵機(jī)體可引發(fā)COVID-19。2019年12月,SARS-CoV-2的首例感染患者出現(xiàn)在湖北省武漢市,之后疫情迅速傳播到中國(guó)眾多省份及其他169個(gè)國(guó)家和地區(qū)[2]。COVID-19的初期臨床病征通常與普通感冒相似,以渾身發(fā)熱、乏力為主,部分嚴(yán)重個(gè)體可發(fā)展為膿毒癥、凝血功能障礙等[3],有時(shí)甚至?xí)<吧窠?jīng)系統(tǒng)。
與其他侵染人的冠狀病毒相比,SARS-CoV-2的基因特征存在顯著差別。據(jù)研究顯示,生活于云南省的一種蝙蝠(Rhinolophusaffinis)可能為SARS-CoV-2的自然宿主,其體內(nèi)檢測(cè)到的冠狀病毒(BatCovRaTG13)在基因水平上與SARS-CoV-2極其相似,兩者相似率高達(dá)96.2 %[4]。
棘突蛋白(Spike protein,S)、核衣殼蛋白(Nucleocapsid phosphoprotein,Np)、小包膜蛋白(Envelope protein,E)、囊膜蛋白(Membrane protein,M)為SARS-CoV-2編碼的四種結(jié)構(gòu)蛋白[5]。其中,Np相較其它三種蛋白(S、E、M)表達(dá)量更高,其為多功能堿性磷酸化蛋白,具有RNA伴侶活性,于細(xì)胞質(zhì)中與RNA結(jié)合組成核糖核蛋白顆粒,從而保護(hù)病毒自身的遺傳物質(zhì)[6]。同時(shí),它在病毒自身的復(fù)制、轉(zhuǎn)錄、組裝等方面也占據(jù)了重要地位[7-8]。因具有免疫原性強(qiáng)和保守性高的特征,Np不僅能夠診斷冠狀病毒,而且可以作為抗病毒治療的理想靶標(biāo)[9-10]。
本研究通過(guò)對(duì)Wuhan-Hu-1株Np的堿基序列進(jìn)行進(jìn)化分析,并通過(guò)對(duì)Np氨基酸序列的空間結(jié)構(gòu)及其B細(xì)胞優(yōu)勢(shì)抗原表位的分析預(yù)測(cè),結(jié)合多種因素綜合剖析以篩選合適的B細(xì)胞優(yōu)勢(shì)抗原表位,為研制SARS-CoV-2表位疫苗、快速診斷試劑和制備其單克隆抗體奠定基礎(chǔ),從而進(jìn)一步解決COVID-19迫切的防控及治療問(wèn)題。
從NCBI數(shù)據(jù)庫(kù)(https://www.ncbi.nlm.nih.gov/)中獲取Wuhan-Hu-1株Np氨基酸序列(Protein ID:YP_009724397.2)。
1.2.1 不同地區(qū)SARS-CoV-2 N蛋白基因進(jìn)化分析
以NCBI數(shù)據(jù)庫(kù)中不同國(guó)家地區(qū)多株SARS-CoV-2 N蛋白基因?yàn)檠芯繉?duì)象,采用MEGA5.05軟件中的Neighbor-joining法進(jìn)行分析,構(gòu)建SARS-CoV-2 N蛋白堿基序列的系統(tǒng)發(fā)生樹(shù),并應(yīng)用MegAlign軟件分析不同毒株間的遺傳距離。
1.2.2 Wuhan-Hu-1株Np三維結(jié)構(gòu)的預(yù)測(cè)
以Wuhan-Hu-1株Np氨基酸序列為研究對(duì)象,應(yīng)用Phyre2在線工具(http://www.sbg.bio.ic.ac.uk/phyre2/html/page.cgi?id=index)預(yù)測(cè)其三維空間結(jié)構(gòu),并應(yīng)用Chimera軟件模擬其立體結(jié)構(gòu)。
1.2.3 Wuhan-Hu-1株Np的二級(jí)結(jié)構(gòu)和抗原表位分析
以DNAStar軟件中的Protean模塊下的方法剖析Wuhan-Hu-1株Np,步驟如下:首先對(duì)Np的二級(jí)結(jié)構(gòu)(Garnier-Robson 法和Chou-Fasman 法)、柔性區(qū)段(Karplus-Schulz法)、表面可能性(Emini法)進(jìn)行預(yù)測(cè);然后分析Np的親水性(Kyte-Doolittle法),再預(yù)測(cè)其抗原指數(shù)和抗原表位指數(shù)(分別用Jameson-Wolf法和Kolaskar-Tongaonkar法(http://tools.immuneepitope.org/tools/bcell/iedb_input));最后,參考Np的三維結(jié)構(gòu),對(duì)Wuhan-Hu-1株Np的B細(xì)胞優(yōu)勢(shì)抗原表位進(jìn)行綜合預(yù)測(cè)。
以Wuhan-Hu-1株(WHU01)N蛋白和其他不同國(guó)家地區(qū)的SARS-CoV-2毒株N蛋白的堿基序列為分析對(duì)象,采用Neighbor-joining法(步長(zhǎng)1 000,boot-strap值>20 %)構(gòu)建系統(tǒng)發(fā)生樹(shù)(見(jiàn)圖1)。MegAlign軟件分析結(jié)果顯示:不同國(guó)家地區(qū)分離的SARS-CoV-2毒株N蛋白堿基序列存在極高相似性(99.6 %~100 %)。結(jié)果表明,不同國(guó)家地區(qū)間的SARS-CoV-2毒株N蛋白堿基序列差異性很小,指示SARS-CoV-2毒株N蛋白基因高度保守。
圖1 不同國(guó)家地區(qū)SARS-CoV-2 N蛋白堿基序列系統(tǒng)發(fā)生樹(shù)Fig.1 Phylogenetic tree of SARS-CoV-2 N protein base sequence isolated from different countries and regions
應(yīng)用Chimera軟件模擬得到的Wuhan-Hu-1株Np的3D結(jié)構(gòu)如圖所示:蛋白中央存在一定數(shù)量的β-折疊,指示其內(nèi)部可能含有大量疏水性殘基;蛋白外圍分布有一定數(shù)量的β-轉(zhuǎn)角和無(wú)規(guī)則卷曲結(jié)構(gòu),且含少量的α-螺旋(見(jiàn)圖2)。
注: (a)中亮綠色區(qū)域代表β-折疊結(jié)構(gòu),白色區(qū)域代表α-螺旋、β-轉(zhuǎn)角及無(wú)規(guī)則卷曲結(jié)構(gòu).
以?xún)煞N不同的方法分別剖析Np的二級(jí)結(jié)構(gòu),最終結(jié)果可相互佐證。Garnier-Robson法預(yù)測(cè)的α-螺旋主要分布在氨基酸序列的中后段,且366~385區(qū)段跨區(qū)最大(20 aa),存在單個(gè)氨基酸組成的α-螺旋;有較多數(shù)量的β-折疊,其分布較均勻,最大的一個(gè)區(qū)段為262~274(13 aa);β-轉(zhuǎn)角分布也較均勻,其中189~196區(qū)段最大(8 aa),存在單個(gè)氨基酸。Chou-Fasman法與Garnier-Robson法預(yù)測(cè)結(jié)果有部分區(qū)域重疊:α-螺旋呈分散分布,其中368~382區(qū)段存在跨最大區(qū)域的α-螺旋(15 aa),β-折疊呈分散分布,其預(yù)測(cè)數(shù)量相對(duì)較少;β-轉(zhuǎn)角區(qū)域分布均勻,最大的一個(gè)區(qū)段為182~209(28 aa)(見(jiàn)圖3、表1、表2)。以Karplus-Schulz法預(yù)測(cè)出的Wuhan-Hu-1株Np柔性區(qū)段分布在5~15,17~50,57~83,89~106,114~119,125~128,136~153,161~169,174~208,211~216,225~250,254~266,275~299,309~310,325~329,339~348,361~392,401~416,可見(jiàn)Np存在多個(gè)柔性區(qū)段,有可能形成多個(gè)優(yōu)勢(shì)表位(見(jiàn)圖4)。
圖3 不同方法預(yù)測(cè)Wuhan-Hu-1株Np的二級(jí)結(jié)構(gòu)Fig.3 Secondary structure of Np in Wuhan-Hu-1 strain predicted by different methods
圖4 Karplus-Schulz法預(yù)測(cè)Wuhan-Hu-1株Np的柔性區(qū)段Fig.4 Flexible regions of Np in Wuhan-Hu-1 strain predicted by Karplus-Schulz method
表1 Garnier-Robson法預(yù)測(cè)的Wuhan-Hu-1株Np的二級(jí)結(jié)構(gòu)Table 1 Secondary structure of Np in Wuhan-Hu-1 strain predicted by Garnier-Robson method
表2 Chou-Fasman 法預(yù)測(cè)的Wuhan-Hu-1株Np的二級(jí)結(jié)構(gòu)Table 2 Secondary structure of Np in Wuhan-Hu-1 strain predicted by Chou-Fasman method
親水性(Kyte-Doolittle法)分析顯示(見(jiàn)圖5),Np親水區(qū)段占比較高,幾乎覆蓋大多數(shù)區(qū)域,進(jìn)一步證明該蛋白親水性較強(qiáng)。表面可能性(Emini法)分析顯示(見(jiàn)圖6),1~13,20~49,58~68,75~97,182~207,226~270,276~283,294~301,339~347,356~390,401~410,414~419區(qū)域的表面可能性較大。分析結(jié)果指示,兩種方法預(yù)測(cè)的重復(fù)部分,極有可能位于Np表面,具備作為病毒抗原表位的特性。
圖5 Wuhan-Hu-1株Np的親水性Fig.5 Hydrophilicity of Np in Wuhan-Hu-1 strain
圖6 Wuhan-Hu-1株Np的表面可能性Fig. 6 Surface probability of Np in Wuhan-Hu-1 strain
Jameson-Wolf法預(yù)測(cè)結(jié)果顯示(見(jiàn)圖7),有多個(gè)抗原指數(shù)較高的區(qū)域分布于Wuhan-Hu-1株Np中,如2~12,17~48,58~71,75~85,88~108,113~130,137~153,171~216,226~267,274~300,337~349,355~390區(qū)域,其中171~216為抗原指數(shù)最高的區(qū)段,最有可能作為優(yōu)勢(shì)表位。
圖7 Wuhan-Hu-1株Np的抗原指數(shù)Fig. 7 Antigenic index of Np in Wuhan-Hu-1 strain
Kolaskar-Tongaonkar法預(yù)測(cè)結(jié)果顯示(見(jiàn)圖8),Wuhan-Hu-1株Np的抗原指數(shù)在0.874~1.197之間波動(dòng),均值為0.988。
圖8 Wuhan-Hu-1 株Np的抗原表位指數(shù)Fig. 8 Antigenic epitope index of Np in Wuhan-Hu-1 strain
先對(duì)Wuhan-Hu-1株Np序列的柔性區(qū)段、親水性指數(shù)、抗原指數(shù)、蛋白質(zhì)表面可能性等抗原表位參數(shù)進(jìn)行分析,再參考抗原表位指數(shù)結(jié)果,預(yù)測(cè):如果某一區(qū)段滿足抗原指數(shù)≥ 0.988(均值)、表面可能性≥ 1、親水性≥ 0,至少包含6個(gè)氨基酸殘基,且內(nèi)部或鄰近區(qū)存在柔性區(qū)段,則推測(cè)該區(qū)段很大概率可以作為Np的B細(xì)胞抗原表位。結(jié)合空間預(yù)測(cè)結(jié)果,共篩選出符合上述條件的16個(gè)優(yōu)勢(shì)表位(見(jiàn)表3)。
表3 Wuhan-Hu-1株Np B細(xì)胞抗原表位的氨基酸序列Table 3 Amino acid sequence of B-cell antigenic epitope of Np in Wuhan-Hu-1 strain
抗原表位(Epitope)是指決定抗原特異性且位于分子表面的氨基酸序列及其組成的空間結(jié)構(gòu)[11]??贵w或淋巴細(xì)胞表面與抗原相結(jié)合部位的形狀、大小需與抗原表位相適合才能發(fā)揮其免疫學(xué)效應(yīng)[12]。表位的分子量一般很小(5~7 aa),所在區(qū)段結(jié)構(gòu)多數(shù)比較松散、具有可移動(dòng)性。作為病毒抗原性的物質(zhì)基礎(chǔ),表位預(yù)測(cè)可為疾病的診斷、藥物的篩選與合成及表位疫苗的制備等奠定理論基礎(chǔ)[13]。本研究從NCBI獲取了Wuhan-Hu-1株Np氨基酸序列(419 aa),空間結(jié)構(gòu)預(yù)測(cè)結(jié)果指示,Wuhan-Hu-1株Np空間構(gòu)象形似錘狀,中央的疏水核心聚集了一定數(shù)量的β-折疊且有較多的β-轉(zhuǎn)角和無(wú)規(guī)則卷曲分布于蛋白表面,同時(shí)存在少量的α-螺旋。近期有報(bào)道稱(chēng)歐洲SARS-CoV-2基因發(fā)生突變并傳入中國(guó)[14-16],鑒于該病毒中Np較強(qiáng)的抗原性和保守性,準(zhǔn)確預(yù)測(cè)Wuhan-Hu-1株Np抗原表位可以為未來(lái)進(jìn)一步的工作提供方向。
SARS-CoV-2粒子多呈皇冠狀[17],Np是其主要編碼的四種結(jié)構(gòu)蛋白(Np、M、E、S)之一,在復(fù)制初期產(chǎn)生并與病毒遺傳物質(zhì)組成核殼體結(jié)構(gòu)[6, 18]。Np通常大量表達(dá)于病毒侵染的初期[19-20],具有很強(qiáng)的抗原性。因此,常作為其他Beta冠狀病毒如SARS-CoV、MERS-CoV等的快速診斷抗原和相關(guān)疫苗設(shè)計(jì)的靶標(biāo)[21-24],具有特異、敏感、重復(fù)性好的優(yōu)勢(shì)。值得一提的是,廣譜抗病毒藥物和疫苗可對(duì)后續(xù)由病毒變異引起的新型傳染病起到關(guān)鍵性作用,而Np在種屬間的高度保守性[25],正使其占領(lǐng)了獨(dú)特的優(yōu)勢(shì)。目前京天成生物、Bioss等科研機(jī)構(gòu)已研制出針對(duì)Wuhan-Hu-1株Np的抗體,雖然還未進(jìn)入臨床使用,但為靶向Np抗體的設(shè)計(jì)開(kāi)創(chuàng)了先例,而可識(shí)別Np的表位疫苗研制卻存在較大空白。對(duì)于疫苗的制備,小分子蛋白更易做到快速、大量地表達(dá),表位疫苗相對(duì)于減毒活疫苗和死疫苗又能達(dá)到更高的安全性[26]。所以,準(zhǔn)確推斷B細(xì)胞抗原表位的特定氨基酸序列,并通過(guò)表達(dá)相應(yīng)基因以實(shí)現(xiàn)工廠化生產(chǎn)具有免疫原性的低毒多肽,可以成為制備診斷試劑、表位疫苗、單抗的新手段。為提高準(zhǔn)確度,本研究采用新興的多參數(shù)綜合預(yù)測(cè)法。分析結(jié)果指示,Np抗原指數(shù)均值為0.988,抗原表位指數(shù)較高的區(qū)域分布均勻,最大值為1.197,其中52~59、69~75、83~89、106~115、119~124、130~136、154~166、217~227、243~249、267~273、299~315、333~339、347~363、379~385、389~401、403~411氨基酸區(qū)段覆蓋了大部分抗原指數(shù)較高的區(qū)域,指示這些區(qū)段可能具有作為表位的潛能。本研究基于同源建模(TBM)參數(shù)預(yù)測(cè)結(jié)果,通過(guò)與同一毒株的小角X射線散射(SAXS)獲得的低分辨率三維結(jié)構(gòu)(pdb id: 6yun)[27]進(jìn)行比較,發(fā)現(xiàn)二者內(nèi)部均由若干近乎平行的β-折疊形成的領(lǐng)結(jié)形狀偏離了中心的菱形瓦片結(jié)構(gòu)組成,這與已報(bào)道的基于saxs的兩個(gè)浮動(dòng)NTD模型是相容的[28-29],但二者結(jié)果仍然存在一定的結(jié)構(gòu)差異。這也許是由不同預(yù)測(cè)方法造成的,同時(shí)也體現(xiàn)了多參數(shù)預(yù)測(cè)以及后期驗(yàn)證的重要性。
Hopp-Woods開(kāi)創(chuàng)的親水性參數(shù)預(yù)測(cè)法[30-31]為抗原表位的預(yù)測(cè)奠定了基礎(chǔ),但與單一參數(shù)分析法相比,多參數(shù)預(yù)測(cè)的準(zhǔn)確率明顯更高[26, 32]??梢?jiàn),由于抗原表位的多態(tài)性,表位抗原性取決于多種因素的互作而非任意單一條件決定。B細(xì)胞抗原表位應(yīng)位于蛋白質(zhì)表面且具有一定程度的靈活性,為更準(zhǔn)確地與抗體或淋巴細(xì)胞表面配體相結(jié)合,抗原構(gòu)象通常需要產(chǎn)生一定程度的改變,即其多具有柔韌性;此外,抗原表位生物學(xué)特性與其二級(jí)結(jié)構(gòu)和三級(jí)結(jié)構(gòu)也有較高相關(guān)性。準(zhǔn)確剖析Np的抗原表位不但有助于進(jìn)一步認(rèn)識(shí)其表現(xiàn)出抗原性的結(jié)構(gòu)基礎(chǔ),而且能夠?yàn)橹笇?dǎo)藥物的合成篩選、快速診斷試劑的研發(fā)制備和表位疫苗的設(shè)計(jì)生產(chǎn)等提供理論基礎(chǔ)[33]。
通過(guò)對(duì)Wuhan-Hu-1株Np的堿基序列進(jìn)行進(jìn)化分析,并通過(guò)單獨(dú)分析Np的二級(jí)結(jié)構(gòu)、柔韌性、親水性、表面可能性、抗原指數(shù)等多種參數(shù),再利用三級(jí)結(jié)構(gòu)預(yù)測(cè)結(jié)果篩選表位,最終綜合以上所有參數(shù)多維篩選確定Np的B細(xì)胞優(yōu)勢(shì)抗原表位。研究結(jié)果為進(jìn)一步闡明Np的結(jié)構(gòu)特征及深入探究SARS-CoV-2入侵和致病機(jī)制提供了參考,以期助力解決SARS-CoV-2感染引發(fā)的肺炎疫情及迫切的防控問(wèn)題。