惠子夜 于漢杰 舒 健 任夏萌 陳聞天
(西北大學(xué)生命科學(xué)學(xué)院,功能糖組學(xué)實(shí)驗(yàn)室,西安710069)
冠狀病毒(coronaviruses,CoVs)對(duì)人類社會(huì)造成嚴(yán)重威脅,在哺乳動(dòng)物和禽類中可引起多種疾?。?]。冠狀病毒來源于網(wǎng)巢病毒目(Nidovirales)的冠狀病毒科(Coronaviridae),是一類具有囊膜結(jié)構(gòu)、單股正鏈的RNA 病毒,其形態(tài)較大,呈圓或橢圓形,直徑約為80~120 nm,因其在電鏡下呈日冕或皇冠狀而得名[2]。冠狀病毒基因組為27~32 kb,是目前已知基因組最大的RNA病毒[3]。根據(jù)血清學(xué)特性和分子進(jìn)化特點(diǎn),可將近百種冠狀病毒分為4 個(gè)屬,即α-、β-、γ-和δ-CoV 屬[4]。其中造成小范圍人群感染的HCoV-229E (Human coronavirus-229E) 、 HCoV-NL63 (Human coronavirus-Netherlands 63)、HCoV-OC43(Human coronavirus-organculture 43) 和 HCoV-HKU1(Human coronavirus-Hong Kong University 1)均屬于α-CoV屬;β-CoV屬成員眾多,可進(jìn)一步劃分為5個(gè)亞屬[5]。嚴(yán)重急性呼吸綜合征冠狀病毒,或稱非 典 病 毒 (Severe acute respiratory syndrome coronavirus,SARS-CoV)和中東呼吸綜合征冠狀病 毒 (Middle East respiratory syndrome coronavirus,MERS-CoV)及導(dǎo)致全球肆虐新型冠狀病毒肺炎(coronavirus disease 2019,COVⅠD-19) 的新型冠狀病毒(Severe acute respiratorysyndrome coronavirus-2,SARS-CoV-2)均來源于β-CoV屬[2,6-9];γ-與δ-CoV屬包含較多以禽類為宿主的病毒,如雞傳染性支氣管炎病毒(Infectious bronchitis virus,ⅠBV)、鵝口瘡冠狀病毒(Thrush coronavirus HKU12) 和夜鶯冠狀病毒(Bulbul coronavirus HKU11)等[10]。冠狀病毒基因組編碼多種結(jié)構(gòu)蛋白,包括刺突蛋白(spike protein,S蛋白)、膜蛋白(membrane protein,M 蛋白)、核衣殼蛋白(nucleocapsid protein,N 蛋白)和囊膜蛋白(envelope protein,E 蛋白)等,部分β-CoV 屬成員存在血凝素脂酶(haemaglutinin-esterase,HE) 蛋白。此外還可編碼16 種非結(jié)構(gòu)蛋白(nonstructural proteins,nsp)。如SARS-CoV-2 的nsp1~nsp16,但來源于γ-或δ-CoV屬部分冠狀病毒含15種nsp,即nsp2~nsp16[11-12]。
糖基化(glycosylation)是最常見的生物大分子修飾方式,包括N-糖基化修飾、O-糖基化修飾和糖脂修飾等[13-14]。糖基化修飾在人體中參與多種生命活動(dòng),例如蛋白質(zhì)的折疊、運(yùn)輸和定位、細(xì)胞分化和發(fā)育、細(xì)胞識(shí)別、信號(hào)轉(zhuǎn)導(dǎo)、免疫應(yīng)答等[15-20]。在含有囊膜結(jié)構(gòu)的病毒中,糖基化修飾對(duì)于識(shí)別宿主細(xì)胞受體與入侵宿主、免疫逃逸、適應(yīng)溫度酸堿等理化因素與子代病毒擴(kuò)散等過程中發(fā)揮著重要的作用[21]。
冠狀病毒中存在極為復(fù)雜的糖基化修飾特性,本文希望通過全局性總結(jié)冠狀病毒糖蛋白的糖基化位點(diǎn)分布、糖鏈結(jié)構(gòu)與生物學(xué)功能及糖生物學(xué)研究技術(shù)等,有助于對(duì)冠狀病毒相關(guān)的診斷、治療和疫苗開發(fā)等工作。
冠狀病毒同源三聚體S 蛋白是Ⅰ型膜蛋白,其氨基酸數(shù)目從1 150到1 450個(gè)不等,序列相似性在屬間和種間差異較大,但被描述為倒錐狀或丁香狀(clove)三維結(jié)構(gòu)單元組成相同[22-23]。S 蛋白由S1和S2 亞 基 組 成[24]。S1 亞 基 包 含N 端 結(jié) 構(gòu) 域(N-terminal domain,NTD) 和受體結(jié)合結(jié)構(gòu)域(receptor binding domain,RBD)等,其功能是結(jié)合宿主細(xì)胞受體[25]。在SARS-CoV和SARS-CoV-2病毒中,RBD 結(jié)合人體內(nèi)糖蛋白血管緊張素轉(zhuǎn)換酶2(angiotensin converting enzyme 2,ACE2)被認(rèn)為是入侵宿主的第一步[11];類似的結(jié)合機(jī)制也存在于鼠肝炎病毒(Mouse hepatitis virus,MHV)與鼠癌胚抗原相關(guān)細(xì)胞黏附分子1(mouse carcino embryonic antigen-related cell adhesion molecule 1,mCEACAM1a)[26]和MERS-CoV 與T 細(xì)胞表面抗原CD26(DPP4)[27]等之間。S2 亞基富含α 螺旋結(jié)構(gòu),包含兩段七肽重復(fù)域、跨膜區(qū)和C端胞內(nèi)域等[24]。當(dāng)S 蛋白被宿主細(xì)胞蛋白酶裂解引發(fā)S2 亞基暴露,兩段三聚體的七肽重復(fù)域構(gòu)象變化折疊成發(fā)夾狀內(nèi)螺旋的六聚體結(jié)構(gòu),從而介導(dǎo)病毒和宿主細(xì)胞膜的融合及進(jìn)一步的遺傳物質(zhì)釋放[25]。不同屬或?qū)匍gS1 亞基結(jié)構(gòu)差異較大,例如MHV 的NTD 具有相對(duì)較大的空間結(jié)構(gòu)域[28]。在高度選擇壓力作用下,S1亞基是冠狀病毒中最易變異區(qū)域,而S2亞基相對(duì)保守[29]。
蛋白糖基化修飾現(xiàn)象非常普遍,大多數(shù)以N-糖基化修飾為主。N-糖基化發(fā)生在內(nèi)質(zhì)網(wǎng)和高爾基體中,其修飾位點(diǎn)以N-X-S/T(X不能為脯氨酸)為特征,在所有物種中高度保守[30]。囊膜病毒表面的糖蛋白布滿豐富的N-糖基化修飾位點(diǎn),例如甲型流感病毒囊膜上兩種糖蛋白,血凝素(hemagglutinin, HA) 和 神 經(jīng) 氨 酸 苷 酶(neuraminidase,NA),通常含有6~12 個(gè)N 糖基化位點(diǎn)[31];在人類免疫缺陷病毒表面的gp160 含多達(dá)31個(gè)N-糖基化位點(diǎn)[32];冠狀病毒的N-糖基化修飾更加復(fù)雜多樣。
通過對(duì)S 蛋白進(jìn)行生物信息學(xué)分析可見18~39個(gè)N-糖基化位點(diǎn)分布在4 個(gè)屬中,其中HCoVNL63中多達(dá)39個(gè)N-糖基化位點(diǎn),這意味其三聚體的N-糖 基 化 位 點(diǎn) 數(shù) 目 可 達(dá)117 個(gè)(圖1)[33];SARS-CoV-2和SARS-CoV的S蛋白相似性為80%,均含22 個(gè)N-糖基化位點(diǎn),但SARS-CoV-2 的RBD區(qū)域缺失一個(gè)N-糖基化位點(diǎn)(對(duì)應(yīng)SARS-CoV 中的N370),會(huì)暴露更多的受體結(jié)合區(qū)域[2,22]。值得注意的是,在與SARS-CoV-2密切相關(guān)的蝙蝠來源(RaTG13)和穿山甲來源(PCoV_GX)的冠狀病毒S 蛋白序列更加相似(96.2%),但多兩個(gè)N-糖基化位點(diǎn)(N30 和N370)[34]。從三維結(jié)構(gòu)角度看,這些N-糖基化位點(diǎn)分散于S1亞基外表面上,但S2的C端處6~8個(gè)保守N-糖基化位點(diǎn)均位于蛋白質(zhì)與膜連接處,可能涉及入侵宿主的膜融合行為[35]??傊跔畈《?個(gè)屬之間糖基化位點(diǎn)數(shù)目和位置存在較大差異,這種差異也見于亞屬與種間(圖1)[36-39]。
由于含有至少54 個(gè)N-糖基化位點(diǎn),故S 蛋白分布著高度致密的N-糖鏈結(jié)構(gòu),這些糖鏈對(duì)蛋白質(zhì)折疊、宿主結(jié)合以及逃避宿主免疫系統(tǒng)均起到了重要的影響作用。但這些位點(diǎn)是否都會(huì)發(fā)生糖基化修飾?由于病毒不編碼糖鏈修飾相關(guān)酶,因此其糖鏈結(jié)構(gòu)來源于宿主系統(tǒng):絕大多數(shù)物種的新生肽鏈位于內(nèi)質(zhì)網(wǎng)時(shí),會(huì)在N-糖基化位點(diǎn)添加14糖前體,隨后伴隨著肽鏈的折疊與運(yùn)輸,受到宿主糖基轉(zhuǎn)移酶和糖苷酶對(duì)糖鏈結(jié)構(gòu)的加工與修飾[40]。而病毒中滯留信號(hào)肽(retrieval signal)的存在會(huì)引導(dǎo)S蛋白等在內(nèi)質(zhì)網(wǎng)、 內(nèi)質(zhì)網(wǎng)高爾基體中間體(endoplasmic reticulum-golgi intermediate compartment,ERGⅠC)或高爾基體中積累并形成出芽體,這也導(dǎo)致了以高甘露糖型糖鏈為代表的未完全加工N-糖鏈結(jié)構(gòu)在病毒膜蛋白中較為豐富[41]。而Nal等[42]利用C端標(biāo)記蛋白分析SARS病毒S蛋白的細(xì)胞定位,通過糖苷酶酶切與電泳分析等發(fā)現(xiàn),S蛋白的高甘露糖糖鏈在進(jìn)入高爾基體后成為復(fù)雜型的N-糖鏈。
因?yàn)椴《静槐磉_(dá)參與糖鏈合成與修飾相關(guān)蛋白酶,所以冠狀病毒培養(yǎng)或蛋白質(zhì)表達(dá)體系不同會(huì)造成較大的糖鏈譜差異。Wang 等[43]通過特征離子觸發(fā)電子轉(zhuǎn)移/高能碰撞解離質(zhì)譜(signature ionstriggered electron-transfer/higher-energy collisional dissociation (EThcD) mass spectrometry) 發(fā) 現(xiàn),相比人源HEK 細(xì)胞系表達(dá)SARS-CoV-2、SARSCoV、MERS-CoV的S蛋白富含唾液酸等雜合型糖鏈結(jié)構(gòu),昆蟲SF9 細(xì)胞系表達(dá)的SARS-CoV-2、SARS-CoV 的S 蛋白含有大量寡甘露糖(paucimannosidic) 或 截 斷 的 糖 鏈(truncated glycans)。Shajahan 等[44]通過高分辨率質(zhì)譜(LCMS/MS),檢測(cè)表達(dá)于HEK293 細(xì)胞系的SARSCoV-2 中S 蛋白并鑒定出17 個(gè)位點(diǎn)的N-糖鏈結(jié)構(gòu),而其余5 個(gè)位點(diǎn)未檢測(cè)出(N17、N603、N1134、N1158 和N1173)。這些N-糖鏈包括高甘露糖型、雜合型和復(fù)雜型共3種類型,其中高甘露糖型和復(fù)雜型糖鏈占比較高;末端唾液酸基團(tuán)見于大多數(shù)糖鏈結(jié)構(gòu),尤其是位于NTD 附近的N234 和N282 的糖鏈上,推測(cè)這些位點(diǎn)的糖鏈調(diào)節(jié)對(duì)受體蛋白或抗體的結(jié)合[45-46];相比RBD 的N331 和N343 中以高甘露糖型和少量復(fù)雜型糖鏈,Antonopoulos 等[47]對(duì)同樣來源的這兩個(gè)位點(diǎn)則鑒定到富含巖藻糖修飾和少見的乳糖二胺(LacdiNAc,即GalNAcβ(1-4)GlcNAc)結(jié)構(gòu)的復(fù)雜型N-糖鏈,這可能與僅表達(dá)RBD 片段等因素有關(guān);但Tian 等[48]通過LC-MS對(duì)HEK293T來源的S蛋白N-糖鏈鑒定出19個(gè)位點(diǎn)的N-糖鏈位點(diǎn)(除N74、N1158 和N1173),其中N17和N1134糖鏈末端存在唾液酸結(jié)構(gòu),而N149、N165、N657、N709、N1134 與N1194 含巖藻糖結(jié)構(gòu);Watanabe等[49]研究表達(dá)于293F細(xì)胞系SARSCoV-2的S蛋白,他們發(fā)現(xiàn)22個(gè)N-糖基化位點(diǎn)均發(fā)生N-糖基化修飾。這些位點(diǎn)上16%的糖鏈含至少一個(gè)唾液酸殘基,48%的糖鏈發(fā)生了巖藻糖基化。
Fig.1 The N-J phylogenetic tree and the distribution of N-glycosylation sites in spike proteins of CoVs圖1 冠狀病毒S蛋白的N-J進(jìn)化樹與N-糖基化位點(diǎn)分布
由于天然病毒的N-糖鏈結(jié)構(gòu)與重組表達(dá)系統(tǒng)來源具有較大的差異[50],此外S 蛋白的每個(gè)N-糖基化位點(diǎn)呈現(xiàn)出微不均一性的特點(diǎn),而非確定性的糖鏈結(jié)構(gòu)[51]。因此宿主環(huán)境與表達(dá)系統(tǒng)影響病毒糖鏈結(jié)構(gòu),值得疫苗開發(fā)工作的注意。在世衛(wèi)組織列出180 余種應(yīng)對(duì)COVⅠD-19 疫情的在研疫苗中,有3 種基于植物細(xì)胞表達(dá)[52],然而在植物中特有的N-糖鏈五糖核心木糖修飾可能會(huì)對(duì)人群產(chǎn)生免疫反應(yīng)[53]。在結(jié)構(gòu)免疫原病毒蛋白疫苗、減毒或滅活病毒疫苗、重組載體疫苗和核酸疫苗等應(yīng)對(duì)COVⅠD-19的4類疫苗中[54],前兩種疫苗中糖鏈來源于多種培養(yǎng)體系,因此N-糖鏈不同形成的空間位阻差異會(huì)影響抗原位點(diǎn)的遮蔽效果[55],也會(huì)影響對(duì)細(xì)胞攝取、蛋白水解過程、MHC 提呈以及隨后的T細(xì)胞啟動(dòng)等[56-57]。
O-糖基化是另一種常見于病毒蛋白上的糖基化修飾,其核心結(jié)構(gòu)多樣。O-糖基化修飾多發(fā)于絲氨酸或蘇氨酸上,但無固定基序。通過生物信息學(xué)方法可進(jìn)行O-糖基化位點(diǎn)預(yù)測(cè),但準(zhǔn)確率相比N-糖基化位點(diǎn)較低[58]。例如,有學(xué)者在COVⅠD-19大流行初期針對(duì)SARS-CoV-2的S蛋白進(jìn)行O-糖基化位點(diǎn)預(yù)測(cè),認(rèn)為673S、678T和686S極具有修飾潛力,而19T、22T、29T、250T 和349S 的潛力較高[59]。但是Hajahan等[44]僅鑒定出S1亞基的T323和S325 發(fā)生了O-糖基化修飾,這些糖鏈結(jié)構(gòu)以Core-1 和Core-2 類型的O-糖鏈為主。這兩個(gè)位點(diǎn)位于RBD,因此該位置的O-糖基化可能在與ACE2受體結(jié)合中發(fā)揮作用。隨后越來越多工作指出S蛋白存在豐富的O-糖基化修飾,例如Dong 等[60]通過LC-MS/MS 鑒定出26 個(gè)O-糖基化位點(diǎn)和33 種O-糖鏈結(jié)構(gòu)。目前O-糖基化修飾對(duì)冠狀病毒中生物學(xué)功能尚不明確,有研究指出,抑制O-糖鏈結(jié)構(gòu)修飾對(duì)結(jié)合ACE2影響較小,但可顯著降低病毒入侵細(xì)胞能力[61]。
O-糖基化修飾的發(fā)生也與宿主系統(tǒng)有關(guān),Bagdonaite 等[62]通過建立的O-糖鏈分析技術(shù)比較了來源于昆蟲細(xì)胞系(S2) 與人源細(xì)胞系(HEK293T)表達(dá)SARS-CoV-2 的S 蛋白,發(fā)現(xiàn)共25個(gè)O-糖基化位點(diǎn)。這些位點(diǎn)分布除在RBD上略有差異外基本相同,例如僅人源細(xì)胞系來源的T478 發(fā)生了O-糖基化修飾。有意思的是,其中16個(gè)發(fā)生于已知N-糖基化位點(diǎn)中。他們解釋這些O-糖基化發(fā)生率較低,但可能會(huì)形成黏蛋白樣結(jié)構(gòu)域以保護(hù)抗原表位或關(guān)鍵位點(diǎn)。Tian 等[48]同樣驗(yàn)證HEK293T 來源SARS-CoV-2 的S 蛋白中17 個(gè)O-糖基化位點(diǎn)有11個(gè)發(fā)生在N-糖基化位點(diǎn)1至3個(gè)氨基酸附近(“N±1-3”),其中的4 個(gè)位點(diǎn)發(fā)生了唾液酸修飾(T236、S659、T1076 和T1077)。他們通過定點(diǎn)突變驗(yàn)證N 糖基化位點(diǎn)是這些O-糖基化位點(diǎn)出現(xiàn)的先決條件,并將此現(xiàn)象稱之為“OFollow-N”[48]。這些結(jié)論對(duì)拓展病毒的O-糖基化研究有重要意義。
M 蛋白是形成冠狀病毒蛋白外殼的重要成分,其長度為200~250 個(gè)氨基酸,如SARS-CoV-2 的M蛋白有222 個(gè)氨基酸[63]。M 蛋白氨基酸相似性在屬間極低,屬內(nèi)相對(duì)較高。盡管在生物大分子蛋白質(zhì)數(shù)據(jù)庫(protein data bank,PDB)中缺少M(fèi)蛋白相關(guān)完整的晶體結(jié)構(gòu),但生物學(xué)信息學(xué)分析指出其包含N 端胞外域、3 次跨膜區(qū)及較長的C 端胞內(nèi)域[64-65]。M 蛋白招募其他結(jié)構(gòu)蛋白進(jìn)入ERGⅠC,并進(jìn)一步控制子代顆粒組裝和出芽[66]。M 蛋白也可能參與結(jié)合宿主細(xì)胞,例如HCoV-NL63 的M 蛋白協(xié)同S蛋白參與結(jié)合含硫酸類肝素的蛋白多糖實(shí)現(xiàn)宿主入侵[67]。
目前發(fā)現(xiàn)0~4個(gè)潛在N-糖基化位點(diǎn)存在于各種冠狀病毒的M蛋白中。通常大多數(shù)M蛋白包含1個(gè)N-糖基化位點(diǎn)(圖2);但δ屬的HKU15-CoV未發(fā)現(xiàn) 相 應(yīng) 位 點(diǎn)[68];HKU4-2-CoV 含 有 兩 個(gè),N4 和N20[69];γ 屬 中 部 分ⅠBV 也 含 有 兩 個(gè),N3 和N6[70];3個(gè)位點(diǎn)多見于α屬,例如PEDV(Porcine epidemic diarrhea virus)的N3、N19 和N189[71],HCoV-NL63 的N3、N19 和N188[72],HCoV-229E的N5、N190 和N207[73];部分HKU2-CoV 還含有4 個(gè)N-糖 基 化 位 點(diǎn),如N6、N22、N192 和N235[74]。
SARS-CoV-2 的M 蛋白N5 是唯一的N-糖基化位點(diǎn)[59],SARS-CoV中類似位置糖基化位點(diǎn)是N4,多項(xiàng)研究結(jié)果顯示該位點(diǎn)出現(xiàn)了復(fù)雜型N-糖鏈類型。Voss 等[75]通過對(duì)該位點(diǎn)進(jìn)行缺失突變,發(fā)現(xiàn)M 蛋白的N-糖基化對(duì)于病毒的組裝和感染是必不可少的,若該位點(diǎn)缺失則影響子代顆粒的組裝;然而,Liang 等[76]通過定點(diǎn)突變與反向遺傳學(xué)技術(shù)發(fā)現(xiàn),ⅠBV中N3和N6糖基化位點(diǎn)缺失突變并不影響病毒復(fù)制與子代顆粒組裝,但會(huì)對(duì)病毒毒力產(chǎn)生一定影響。
Fig.2 The glycosylation sites in S-protein of SARS-CoV-2圖2 SARS-CoV-2結(jié)構(gòu)蛋白中N-糖基化位點(diǎn)分布
除N-糖基化修飾,MHV為代表的部分冠狀病毒也發(fā)現(xiàn)數(shù)目可變的O-糖基化修飾[77]。De Haan等[78-79]通過定點(diǎn)突變技術(shù)并觀察表達(dá)產(chǎn)物的電泳條帶,分析發(fā)現(xiàn)T5可能是M蛋白中發(fā)生O-糖基化修飾的位點(diǎn),該糖鏈中包含N-乙酰半乳糖胺、半乳糖和唾液酸等;而如果MHV中O-糖基化位點(diǎn)被N-糖基化取代,會(huì)造成病毒顆粒重組的效率下降。
冠狀病毒N蛋白的結(jié)構(gòu)保守且表達(dá)量豐富,通過與RNA 基因組形成螺旋狀結(jié)構(gòu)在病毒的感染、復(fù)制和包裝等過程中發(fā)揮作用。早期對(duì)冠狀病毒N蛋白研究表明,N蛋白是一種磷酸化蛋白[80-82]。近來在SARS-CoV-2 的N 蛋白上發(fā)現(xiàn)5 個(gè)潛在的N-糖基化位點(diǎn)(N47、 N77、N192、N196 和N269),但利用O18同位素標(biāo)記實(shí)驗(yàn)證實(shí)只有N47和N269出現(xiàn)糖基化,而這兩個(gè)位點(diǎn)分別以復(fù)雜型和高甘露糖型N-糖鏈占優(yōu)勢(shì)[83-84];也有學(xué)者利用LC-MS/MS分析并證明N 蛋白上發(fā)生O-糖基化修飾的T148、T165、T166、T205、S206、T391 和S404[85]。作為參與組裝和釋放病毒顆粒的多功能E 蛋白[36],也可通過生物信息學(xué)預(yù)測(cè)出來N-糖基化位點(diǎn)的存在,例如SARS-CoV-2 的E 蛋白中N48 和N66 都是潛在的N-糖基化位點(diǎn)。然而多種跡象表面,E蛋白未發(fā)生N-糖基化修飾[42]。Lo Presti 等[59]還針對(duì)SARS-CoV-2的3A蛋白進(jìn)行O-糖基化分析預(yù)測(cè)出4個(gè)潛在的O-糖基化位點(diǎn),但未獲得實(shí)驗(yàn)驗(yàn)證。
部分冠狀病毒中還存在著HE 蛋白,它與丙型流感病毒等的HE 蛋白功能相似。在包括HCoVOC43、 HCoV-HKU1、 BCoVs (Bovine coronaviruse)和MHV等的β冠狀病毒屬中,HE蛋白也可通過與S 蛋白相互作用結(jié)合含唾液酸(N-acetyl-9-O-acetylneuraminic acid)的糖鏈實(shí)現(xiàn)入侵宿主[86-88]。HE 蛋白長度為420~440 個(gè)氨基酸,生物信息學(xué)預(yù)測(cè)發(fā)現(xiàn)在多種冠狀病毒中含6~9 個(gè)N-糖基化位點(diǎn),例如MHV 病毒的HE 蛋白中N54、N89、N104、N153、N236、N301、N316、N358和N417 均為潛在N-糖基化位點(diǎn),而HE 發(fā)生N-糖基化修飾也可通過糖鏈切割前后的凝膠電泳證明[89]。SARS-CoV和SARS-CoV-2的基因組中不含HE基因,因此并無此蛋白質(zhì)見諸報(bào)道[90]。
生物信息學(xué)在針對(duì)冠狀病毒所產(chǎn)生大數(shù)據(jù)的分析和挖掘中發(fā)揮著重要作用。糖生物信息學(xué)(glycobioinformatics)用于冠狀病毒糖基化研究主要包括:蛋白質(zhì)序列比對(duì)與進(jìn)化分析、糖基化位點(diǎn)預(yù)測(cè)、結(jié)構(gòu)生物信息學(xué)分析及質(zhì)譜數(shù)據(jù)解析等,具有快速、安全與前瞻性的特點(diǎn),但對(duì)于預(yù)測(cè)分析結(jié)果通常需要實(shí)驗(yàn)驗(yàn)證[91]。
針對(duì)糖基化位點(diǎn)在冠狀病毒各糖蛋白的分布與協(xié)同進(jìn)化有助于了解糖基化修飾在病毒的生物學(xué)功能。N-糖基化位點(diǎn)出現(xiàn)高度保守,因此預(yù)測(cè)軟件眾多,而NetOGlyc-4.0在線服務(wù)等則可用于不保守的O-糖基化位點(diǎn)預(yù)測(cè)[92]。近些年更是出現(xiàn)了通過人工神經(jīng)網(wǎng)絡(luò)或人工智能對(duì)糖基化位點(diǎn)的預(yù)測(cè)[93-94]。本文有關(guān)冠狀病毒糖基化位點(diǎn)分析均涉及上述糖生物信息學(xué)方法(圖3)。
Fig.3 The research methods in the glycosylation of Coronaviruses圖3 冠狀病毒糖基化研究方法
由于糖蛋白純化結(jié)晶用于X射線晶體衍射的技術(shù)限制,PDB 收錄的生物大分子晶體結(jié)構(gòu)中不含完整糖鏈結(jié)構(gòu)。利用Glycosciences 網(wǎng)站Glyprot 在線程序能夠選擇將不同類型N-糖鏈添加到N-糖基化位點(diǎn),從而揭示糖鏈對(duì)相關(guān)功能區(qū)的影響[95];GlyCAM 網(wǎng)站的Glycoprotein Builder 在線程序也具有相同的功能,并且進(jìn)一步實(shí)現(xiàn)了O-糖鏈添加,因此最早發(fā)布了糖基化修飾SARS-CoV-2 的S 蛋白三維結(jié)構(gòu)并用于與其他分子相互作用研究[96]。
質(zhì)譜分析方法具有高靈敏度和分辨率,成為分析冠狀病毒糖蛋白糖鏈結(jié)構(gòu)的常規(guī)操作工具[99-100]。針對(duì)病毒糖基化分析,核心的問題就是糖基化位點(diǎn)鑒定與糖鏈結(jié)構(gòu)解析?;诨|(zhì)輔助激光解吸電離(matrix assisted laser desorption ionization,MALDⅠ)和電噴霧電離(electrospray ionization,ESⅠ)等質(zhì)譜分析是現(xiàn)代糖組學(xué)中最常用工具之一。
4.2.1 質(zhì)譜分析N-糖基化
糖苷酶PNGase F 被用于釋放糖蛋白/糖肽上的N-糖鏈,并使肽段產(chǎn)生0.98 u分子質(zhì)量的增加;另外Endo D/F/H三種內(nèi)切糖苷酶均可將N-五糖核心兩個(gè)GlcNAc之間的糖苷鍵斷開,使肽段上增加了203 u或349 u的質(zhì)量標(biāo)簽,因此可作為質(zhì)譜鑒定糖基化位點(diǎn)的標(biāo)志[101]。使用肼解法以釋放N-糖鏈也是一種化學(xué)法去糖鏈策略[102]。
針對(duì)冠狀病毒S蛋白、M蛋白或HE蛋白N-糖鏈鑒定大多采用類似的操作流程:蛋白質(zhì)分離純化、酶切成糖肽片段、糖苷酶切除N-糖鏈、糖鏈富集與純化和MALDⅠ-MS等質(zhì)譜鑒定[103]。這些操作策略早在多種冠狀病毒N-糖基化中展開,例如ⅠBV[104]、 MERS-CoV[35]、 HCoV-HKU1[105]和SARS-CoV-2等[106-108]。
4.2.2 質(zhì)譜分析O-糖基化
由于O-糖鏈的結(jié)構(gòu)簡(jiǎn)單多變、缺乏保守序列模式且沒有合適的酶切方法,所以大多數(shù)病毒缺失O-糖基化報(bào)道。O-糖鏈的切除通常采用以高碘酸氧化-β 消除法等為主的化學(xué)法[109]。針對(duì)糖蛋白O-糖基化分析依然采取蛋白質(zhì)分離、酶解、糖肽富集和質(zhì)譜鑒定等操作思路?;诓糠帜貙?duì)O-糖鏈的親和力進(jìn)行分離是最新出現(xiàn)的O-糖蛋白分離/糖肽富集方法,其中VVA、PNA 和Jacalin 等都是可選凝集素[110-111]。對(duì)于O-糖鏈的富集與處理一直在改進(jìn)之中,例如Zhang 等[112-113]報(bào)道了基于PVDF 膜在96 孔板平臺(tái)的細(xì)胞樣本糖鏈處理方法,釋放的糖鏈無須染色或衍生便可用多孔石墨化碳納米液相色譜(porous graphitized carbon nano-liquid chromatography)串聯(lián)質(zhì)譜法分析糖鏈結(jié)構(gòu)。他們針對(duì)CHO 和HEK293 細(xì)胞系表達(dá)SARS-CoV-2 的RBD 進(jìn)行O-糖鏈分析,同樣發(fā)現(xiàn)T323 和S325 中以O(shè)-糖基化多以Core-1 和Core-2 型為主。還有學(xué)者將O-糖鏈末端通過ST3GAL1糖基轉(zhuǎn)移酶標(biāo)記帶熒光的唾液酸,隨后采用胰蛋白酶水解等方法研究糖鏈指紋圖譜。他們發(fā)現(xiàn)SF2和HEK293細(xì)胞系表達(dá)RBD分別以Core-1和Core-2糖鏈結(jié)構(gòu)為主[114]。
以凝集素和糖芯片為代表的生物芯片被廣泛應(yīng)用于病毒糖生物學(xué)研究。利用凝集素(或稱糖結(jié)合蛋白)對(duì)糖鏈結(jié)構(gòu)具有不同特異性和親和力結(jié)合差異的特性,可聯(lián)合數(shù)種凝集素推斷SARS-CoV-2的S 蛋白糖鏈基本特征[115],也可將幾十種凝集素點(diǎn)制在一張片基,以實(shí)現(xiàn)高通量快速地分析樣本糖鏈譜(圖3)[116]。由于凝集素芯片可以分析糖苷鍵的連接方式,具備質(zhì)譜技術(shù)暫時(shí)無法達(dá)到優(yōu)點(diǎn),因此經(jīng)常用于聯(lián)合質(zhì)譜技術(shù)分析糖鏈結(jié)構(gòu)[117-118]。
糖鏈分子作為病毒膜蛋白的結(jié)合靶標(biāo)已在多種病毒中獲得報(bào)道,而特異性糖鏈分布往往與病毒感染宿主的范圍密切相關(guān),因此糖芯片技術(shù)通過將各種糖鏈點(diǎn)制在片基上用于快速篩選病毒蛋白潛在的糖鏈結(jié)合特異性。例如,針對(duì)流感病毒HA的糖芯片分析,通過比較對(duì)α-2,6唾液酸結(jié)構(gòu)與α-2,3唾液酸結(jié)構(gòu)的結(jié)合差異評(píng)估其宿主特異性[119],類似的工作也在BCoV 的研究中進(jìn)行[120]。針對(duì)MERSCoV的S蛋白進(jìn)行糖芯片分析,發(fā)現(xiàn)其具有較強(qiáng)唾液酸結(jié)合能力,尤其是對(duì)α-2,3 唾液酸糖鏈[121]。Hao等[122]則制備了包含有多種在糖胺聚糖中常見的糖鏈結(jié)構(gòu),證實(shí)SARS-CoV-2 的S 蛋白也存在著對(duì)硫酸肝素的高度親和能力。Heidepriem等[123]則通過糖芯片分析愈后血清中SARS-CoV-2產(chǎn)生抗體的糖鏈結(jié)合能力,反向推斷出SARS-CoV-2中存在大量高甘露糖的N-糖鏈。此外糖組學(xué)研究的門戶網(wǎng) 站CFG (Consortium for Functional Glycomics)也提供了商品化的糖芯片并在γ 屬的火雞冠狀病毒、珍珠雞冠狀病毒及鵪鶉冠狀病毒得到應(yīng)用[124]。
定點(diǎn)突變?cè)诓《镜鞍滋腔δ苎芯糠矫娉洚?dāng)著重要角色,將核苷酸序列進(jìn)行突變,從而造成糖基化 位 點(diǎn)的 缺 失 或 添加[125]。Han 等[126]針 對(duì)SARS-CoV-2 的S 蛋白N-糖基化位點(diǎn)進(jìn)行突變?nèi)笔Вl(fā)現(xiàn)其中7 個(gè)位點(diǎn)(N109、N118、N119、N158、N227、N589和N699)對(duì)于與ACE2相互作用有重要影響,其中N227和N699增強(qiáng)了病毒的傳播能力。Bouwman 等[127-128]通過對(duì)ⅠBV 的S 蛋白R(shí)BD 區(qū)域附近N-糖基化位點(diǎn)進(jìn)行突變、反向遺傳學(xué)操作和ELⅠSA法測(cè)定,最后發(fā)現(xiàn)5個(gè)N-糖基化位點(diǎn)缺失會(huì)造成對(duì)α-2,3 唾液酸結(jié)合能力的喪失,部分位點(diǎn)變化還會(huì)導(dǎo)致結(jié)合其他糖鏈的能力。假病毒包裝技術(shù)也應(yīng)用于膜蛋白的定點(diǎn)突變研究,Li等[129]利用假病毒技術(shù)構(gòu)建了一系列SARS-CoV-2病毒S蛋白糖基化位點(diǎn)缺失突變體,用以研究一組中和抗體和恢復(fù)期病人血清。他們發(fā)現(xiàn)N331 和N343糖基化位點(diǎn)缺失顯著降低了感染性,N234缺失對(duì)顯著提高病毒對(duì)中和抗體的拮抗能力而N165缺失增強(qiáng)了對(duì)抗體的敏感性??傊c(diǎn)突變技術(shù)在病毒糖基化的應(yīng)用較為成熟,在疫苗和抗體的開發(fā)中已得到廣泛應(yīng)用。
當(dāng)下肆虐的新冠病毒引起了全球?qū)跔畈《镜年P(guān)注,針對(duì)病毒相關(guān)研究和探討也在不斷展開和深入。糖基化修飾在病毒入侵與離開宿主細(xì)胞、引發(fā)免疫反應(yīng)以及針對(duì)病毒的檢測(cè)與治療等幾乎所有環(huán)節(jié)均發(fā)揮不同作用。本文通過歸納冠狀病毒中S蛋白和M 蛋白等糖蛋白中糖基化修飾位點(diǎn)的分布、糖鏈結(jié)構(gòu)和相關(guān)功能等,促進(jìn)了對(duì)糖基化修飾在病毒的認(rèn)知;對(duì)諸如糖生物信息學(xué)、生物芯片、質(zhì)譜解析等糖生物學(xué)相關(guān)技術(shù)進(jìn)行的總結(jié)提供了從糖生物學(xué)角度研究冠狀病毒的方法。這些內(nèi)容將提高糖基化在冠狀病毒的病原學(xué)、流行病學(xué)和傳染機(jī)制等領(lǐng)域的重視程度,推動(dòng)冠狀病毒相關(guān)的感染、傳播、診斷、治療和預(yù)防等研究工作,為盡早結(jié)束新冠大流行提供支持。