周 雍,魏 磊,景炳年,馬艷妮,王 偉
(河南省科學(xué)院 生物技術(shù)開發(fā)中心,河南 鄭州 450003)
豬細(xì)小病毒 (Porcine parvovirus,PPV)是以母豬繁殖障礙為主要致病特征,引起不孕、流產(chǎn)、畸胎、死胎、木乃伊胎等的單股DNA病毒,給養(yǎng)豬業(yè)帶來巨大經(jīng)濟(jì)損失[1-5]。PPV按照對組織的致病力以及侵嗜性的不同,大致可以分為4類[6]。第1類以NADL-2毒株為代表,此類病毒屬于弱毒株,具有良好的免疫原性,對機(jī)體的致病力較低,可以作為疫苗用于臨床上預(yù)防該病的發(fā)生。第2類是以能夠感染胎兒,且會引起死亡的NADL-8株為代表的強(qiáng)毒株[7]。第3類是較NADL-8株毒力更強(qiáng)的Kresse株,該毒株不僅能造成母豬的流產(chǎn),產(chǎn)生木乃伊胎和死胎外,還能引起仔豬的皮炎[8]。第4類是以引起腸道病變的腸炎型毒株為代表的PPV。
PPV基因組全長大約5 000 bp,其中5′端的NS1基因編碼的蛋白質(zhì)在病毒合成過程中起著重要的作用[9-11]。NS1蛋白是病毒重要的調(diào)控蛋白[12],是病毒感染期間重要的毒力因子,并且通過多種機(jī)制抵抗宿主抗病毒應(yīng)答[13]。據(jù)報道,坦布蘇病毒[14]、流感病毒[15]、水貂腸炎病毒[16]、豬日本乙型腦炎病毒[17]等病毒的非結(jié)構(gòu)蛋白NS1能刺激機(jī)體產(chǎn)生非中和性的保護(hù)性抗體來抵抗病毒的感染。研究發(fā)現(xiàn),NS1蛋白影響宿主免疫系統(tǒng)的功能與其特定氨基酸位點密切相關(guān)[18]。但現(xiàn)在對PPV NS1多種功能的作用機(jī)制還不甚清楚,非常有必要對其做進(jìn)一步的研究。
蛋白質(zhì)的生物學(xué)功能在很大程度上取決于蛋白質(zhì)的空間構(gòu)象,而蛋白質(zhì)的三級結(jié)構(gòu)是蛋白質(zhì)空間結(jié)構(gòu)的最終形態(tài)特征。因此,研究蛋白質(zhì)空間結(jié)構(gòu)的構(gòu)象,對了解蛋白質(zhì)的結(jié)構(gòu)和功能有著重要的意義[19-22]。目前通過Χ射線衍射晶體技術(shù)、NMR核磁共振等物理方法了解蛋白質(zhì)的空間結(jié)構(gòu)費時費力、成本較高,已無法滿足研究需求[23-25]。生物信息學(xué)的發(fā)展為蛋白質(zhì)的空間結(jié)構(gòu)預(yù)測提供了新的方法,并能夠得到較為準(zhǔn)確的三維結(jié)構(gòu)預(yù)測模型。因此,利用一系列軟件對不同致病性PPV毒株非結(jié)構(gòu)蛋白NS1進(jìn)行蛋白質(zhì)三級結(jié)構(gòu)預(yù)測分析,從其一級結(jié)構(gòu)比較其相同位點氨基酸的差異,進(jìn)而分析這些差異位點在二級結(jié)構(gòu)及三級結(jié)構(gòu)上的不同,并分析建模得到蛋白質(zhì)三級結(jié)構(gòu),從而推測PPV不同毒株在致病性上存在差異的原因。
從NCBI數(shù)據(jù)庫中已注冊的核苷酸序列及對應(yīng)的氨基酸序列下載PPV NADL-2株及Kresse株的非結(jié)構(gòu)蛋白NS1的氨基酸序列,登錄號分別為P18547.2和P52502.1。
1.2.1 NADL-2株及Kresse株NS1蛋白氨基酸序列差異性比較 利用NCBI BLAST進(jìn)行2種毒株氨基酸序列的比對,從而確定2種毒株不同位點的氨基酸差異。
1.2.2 NADL-2株及Kresse株NS1蛋白理化性質(zhì)分析 運用ExPASy-ProtParam工具分析PPV NS1蛋白的理化性質(zhì),如理論等電點、氨基酸數(shù)目以及組分、正負(fù)電荷殘基數(shù)、分子式、消光系數(shù)、不穩(wěn)定系數(shù)、脂肪指數(shù)等。
1.2.3 NADL-2株及Kresse株NS1蛋白疏水性分析 運用ExPASy-ProtScale程序在線分析PPV NS1蛋白的親水性和疏水性。
1.2.4 NADL-2株及Kresse株NS1蛋白跨膜區(qū)分析 使用TMHMM Server v.2.0 (http://www.cbs.dtu.dk/services/TMHMM/)和COILServer (http://embnet.vital-it.ch/software/COILS_form.html)對PPV NS1蛋白分別進(jìn)行跨膜區(qū)分析和卷曲螺旋分析。記錄試驗結(jié)果,并分析該蛋白質(zhì)為跨膜蛋白的可能性。
1.2.5 NADL-2株及Kresse株NS1蛋白信號肽預(yù)測 運用SingalP程序預(yù)測 NADL-2株及Kresse株非結(jié)構(gòu)蛋白NS1的信號肽。
1.2.6 NADL-2株及Kresse株NS1蛋白結(jié)構(gòu)域分析 使用簡單模塊構(gòu)架搜索工具(Simple modular architecture research tool,SMART)(http://smart.embl-heidelberg.de/) 分析PPV NS1蛋白的結(jié)構(gòu)功能域。
1.2.7 NADL-2株及Kresse株NS1蛋白二級結(jié)構(gòu)預(yù)測 運用ExPASY-SOPMA工具,對PPV非結(jié)構(gòu)蛋白NS1的氨基酸序列進(jìn)行二級結(jié)構(gòu)預(yù)測。
1.2.8 NADL-2株及Kresse株NS1蛋白三級結(jié)構(gòu)預(yù)測 通過在線軟件SWISS-MODEL同源模建PPV 非結(jié)構(gòu)蛋白NS1的三級結(jié)構(gòu),并顯示所得到的三級結(jié)構(gòu)及其動態(tài)圖。
1.2.9 NADL-2株及Kresse株NS1蛋白三級結(jié)構(gòu)分析 通過SPDBV 4.10軟件添加已下載的pdb格式的NADL-2株及Kresse株NS1蛋白。
通過NCBI BLAST結(jié)果可知,PPV NADL-2株和Kresse株的NS1氨基酸序列相似度達(dá)到98%(圖1),但在86位、274位、376位及621—636位的氨基酸差異較大(表1)。
采用ProtParam和ProtScale軟件對豬PPV NADL-2株及Kresse株非結(jié)構(gòu)蛋白NS1的各種理化性質(zhì)進(jìn)行分析。圖2中NADL-2株NS1蛋白由660個氨基酸組成,該蛋白質(zhì)分子式為C3 344H5 223N915O1 014S35,分子質(zhì)量為75 300.4 u,理論等電點pI為6.52,為弱酸性蛋白;不穩(wěn)定系數(shù)(Instability index)為42.90,屬于不穩(wěn)定蛋白;脂肪指數(shù)(Aliphatic index)為72.66,含有過半的脂肪族氨基酸;序列中含有20種基本氨基酸,優(yōu)勢氨基酸為Thr(69個,10.5%);序列中含有帶負(fù)電的殘基(Asp+Glu)77個,含帶正電的殘基(Arg+Lys)74個;疏水系數(shù)(Grand and average of hydropathicity,GRAVY)為-0.562,為可溶性蛋白。圖3中Kresse株NS1蛋白由662個氨基酸組成,該蛋白質(zhì)分子式為C3 344H5 223N915O1 014S35,分子質(zhì)量為75590.8 u,理論等電點pI為6.64,為弱酸性蛋白;不穩(wěn)定系數(shù)為42.90,屬于不穩(wěn)定蛋白;脂肪指數(shù)為72.66;序列中含有20種基本氨基酸,優(yōu)勢氨基酸為Thr(68個,10.3%),序列中含有帶負(fù)電的殘基77個,含有帶正電的殘基74個;疏水系數(shù)為-0.562。
毒株Strain86274376621622623626627628629630632633634636NADL-2株NADL-2 strainGKCTA_QHARFNTD_Kresse株Kresse strainRRVNLHPTPPDAIRP
從圖4可以看出,預(yù)測結(jié)果中正值越大,表示疏水性越強(qiáng);負(fù)值越大,表示親水性越強(qiáng)。整體來看,NADL-2株和Kresse株非結(jié)構(gòu)蛋白NS1親水性氨基酸均勻分布于整個多肽鏈中,沒有明顯的疏水區(qū)域。由此推測,NADL-2株和Kresse株非結(jié)構(gòu)蛋白NS1為親水性蛋白。但圖4(A)和圖4(B)在621—636位有很大不同,圖4(A)中圖形峰值明顯處于0~1,而圖4(B)圖形峰值明顯介于-1~0。與NADL-2株相比較,Kresse株376位疏水性較強(qiáng),86位和621—636位親水性較強(qiáng)。
Ala:丙氨酸;Arg:精氨酸;Asn:天冬酰胺;Asp:天冬氨酸;Cys:半胱氨酸;Gln:谷氨酰胺;Glu:谷氨酸;Gly:甘氨酸;His:組氨酸;Ile:異亮氨酸;Leu:亮氨酸;Lys:賴氨酸;Met:蛋氨酸;Phe:苯丙氨酸;Pro:脯氨酸;Ser:絲氨酸;Thr:蘇氨酸;Trp:色氨酸;Tyr:酪氨酸;Val:纈氨酸;Pyl:吡咯賴氨酸;Sec:硒半胱氨酸。下同Ala:Alanine;Arg:Arginine;Asn:Asparagine;Asp:Aspartic acid;Cys:Cysteine;Gln:Glutamine;Glu:Glutamic acid;Gly:Glycine;
圖3 Kresse株NS1氨基酸組成
圖4 NADL-2株和Kresse株NS1疏水性分析
TMHMM Server v.2.0的預(yù)測結(jié)果顯示,NADL-2株和Kresse株的非結(jié)構(gòu)蛋白NS1的跨膜螺旋數(shù)量均為0;在預(yù)測的跨膜螺旋區(qū)所含的氨基酸數(shù)量為0;NADL-2株的1—660位氨基酸和Kresse株1—662位氨基酸全部為膜外蛋白,非膜內(nèi)蛋白,均不含跨膜區(qū)(圖5)。
由圖6可知,C、Y、S 最大值分別為0.112、0.109、0.132,均大于分界值0.102。同時,整條序列所有分值均較低,無明顯較高的C 值,無較大的S、Y 值。結(jié)果表明,2種毒株編碼的NS1蛋白均不含信號肽。
由圖7可知,NADL-2株NS1蛋白第186—265位是個高度保守的結(jié)構(gòu)功能域——PV_NSP1;第265—549位是個高度保守的結(jié)構(gòu)功能域——Parvo_NS1;第359—493位是個高度保守的結(jié)構(gòu)功能域——PPV_E1_C;第551—660位是個高度保守的結(jié)構(gòu)功能域——DUF3580 (Domain of unknown function)。Kresse株NSI蛋白第186—265位是個高度保守的結(jié)構(gòu)功能域——PV_NSP1;第265—549位是個高度保守的結(jié)構(gòu)功能域——Parvo_NS1;第358—493位是個高度保守的結(jié)構(gòu)功能域——PPV_E1_C;第551—662位是個高度保守的結(jié)構(gòu)功能域——DUF3580。對比發(fā)現(xiàn),2種毒株的NS1蛋白家族成員均有4個典型的功能結(jié)構(gòu)域。PV_NSP1、Parvo_NS1和PPV_E1_C是2種毒株非結(jié)構(gòu)蛋白NS1高度保守的功能域,發(fā)揮相同的功能;而551—662位的DUF3580雖然名稱相同,但代表著未知功能區(qū)域。可見,2種毒株致病性差異可能源于這個結(jié)構(gòu)域的未知功能。
圖5 NADL-2株和Kresse株 NS1跨膜區(qū)分析
C值:原始剪切位點的分值;S值:信號肽的分值;Y值:綜合剪切位點的分值
2株P(guān)PV非結(jié)構(gòu)蛋白NS1的二級結(jié)構(gòu)預(yù)測結(jié)果如圖8所示。圖8中豎線由長到短依次表示:α螺旋、延伸鏈、β轉(zhuǎn)角、無規(guī)則卷曲。結(jié)果表明,NADL-2株非結(jié)構(gòu)蛋白NS1的氨基酸序列由36.21%的α螺旋、18.64%的β轉(zhuǎn)角、33.94%的無規(guī)則卷曲、11.21%的β轉(zhuǎn)角構(gòu)成。Kresse株非結(jié)構(gòu)蛋白NS1的氨基酸序列由35.65% 的α螺旋、19.18%的β折疊、34.59%的無規(guī)則卷曲、10.57%的β轉(zhuǎn)角構(gòu)成??梢?,2種毒株都是以α螺旋、無規(guī)則卷曲作為其二級結(jié)構(gòu)的主要元件。但Kresse株621—636位的無規(guī)則卷曲明顯多于NADL-2株。
圖7 NADL-2株和Kresse株NS1結(jié)構(gòu)域分析
應(yīng)用在線軟件SWISS-MODEL對PPV NS1蛋白三級結(jié)構(gòu)進(jìn)行預(yù)測,NS1蛋白的α螺旋和β轉(zhuǎn)角占50%以上(圖9)。PPVNS1基因的編碼區(qū)不長(僅編碼600多個氨基酸),這對進(jìn)一步形成復(fù)雜的高級結(jié)構(gòu)并沒有太大的影響。NS1基因在進(jìn)化過程中相對保守的原因很可能與此有關(guān)。圖9(A)和圖9(B)中顯示的分別是NADL-2株和Kresse株非結(jié)構(gòu)蛋白NS1的三級結(jié)構(gòu)模型。
將pdb格式的三級結(jié)構(gòu)模型添加到SPDBV4.10軟件中,經(jīng)過多個角度比對發(fā)現(xiàn),NADL-2株及Kresse株非結(jié)構(gòu)蛋白NS1的結(jié)構(gòu)域及氨基酸位點中86位、621—636位差異氨基酸的間距、鍵角不同(圖10)。
隨著生物信息學(xué)的快速發(fā)展,生物信息學(xué)技術(shù)已經(jīng)廣泛運用于病原生物學(xué)研究的諸多領(lǐng)域[26]。疫苗是醫(yī)學(xué)史上最重大的發(fā)現(xiàn)之一,疫苗的研究對疾病的預(yù)防極為關(guān)鍵,而生物信息學(xué)在新型疫苗的研究中意義頗深[27]。近年來,我國PPV的免疫預(yù)防主要使用滅活疫苗,而現(xiàn)有的血清中和試驗、補(bǔ)體結(jié)合試驗等常規(guī)血清學(xué)方法多以全病毒作為抗原,不能區(qū)分滅活疫苗免疫豬與野毒感染豬[28-29]。滅活疫苗免疫不產(chǎn)生抗非結(jié)構(gòu)蛋白抗體。因此,可通過檢測不同毒株的PPV非結(jié)構(gòu)蛋白NS1在一級、二級、三級結(jié)構(gòu)上的差異,分析其致病性差異的分子層次的原因,由此進(jìn)一步研究針對PPV的特異性藥物。
NS1蛋白參與病毒復(fù)制、基因啟動子調(diào)控及細(xì)胞毒性等多種生理過程,這些生理過程能有序展開與NS1蛋白翻譯后修飾,尤其是磷酸化修飾作用密切相關(guān),且主要受蛋白激酶C磷酸化修飾調(diào)控[30-31]。對NADL-2株和Kresse株非結(jié)構(gòu)蛋白NS1進(jìn)行氨基酸組成、氨基酸理化性質(zhì)、疏水性、跨膜蛋白、信號肽、二級結(jié)構(gòu)和三級結(jié)構(gòu)進(jìn)行了預(yù)測分析。使用同源建模方法進(jìn)行三級結(jié)構(gòu)預(yù)測并分析其三級結(jié)構(gòu)動態(tài)圖,比對2種毒株的結(jié)構(gòu)差異。
氨基酸序列比對發(fā)現(xiàn),NADL-2株和Kresse株NS1在86位、274位、376位及621—636位的氨基酸大有不同。進(jìn)而分析發(fā)現(xiàn),兩者的氨基酸理化性質(zhì)、跨膜區(qū)和信號肽相差不大。對NADL-2株和Kresse株的NS1蛋白進(jìn)行疏水性分析發(fā)現(xiàn),最大值、最小值位點雖然相同,但621—636位Kresse株的值明顯處于-1~0,而NADL-2株的值在0~1,可見,621—636位Kresse株的親水性更強(qiáng)。對NADL-2株和Kresse株的NS1蛋白進(jìn)行結(jié)構(gòu)域分析發(fā)現(xiàn),兩者除了含有3個典型的保守結(jié)構(gòu)域(PV_NSP1、PPV_E1_C、Parvo_NS1),都含有1個未知功能域(DUF3580),這個功能域在PPV NS1蛋白中長約120個氨基酸,緊挨著C-末端的解旋酶功能域,但其功能未知。結(jié)合二級結(jié)構(gòu)分析,Kresse株621—636位的無規(guī)則卷曲含量明顯高于NADL-2株。無規(guī)則卷曲是明確而穩(wěn)定的結(jié)構(gòu),而這類有序的非重復(fù)性結(jié)構(gòu)常構(gòu)成酶活性部位和其他蛋白質(zhì)特異的功能部位。將NADL-2株和Kresse株的NS1氨基酸序列進(jìn)行三級結(jié)構(gòu)建模,發(fā)現(xiàn)氨基酸差異位點的空間結(jié)構(gòu)有很大不同,疏水性和二級結(jié)構(gòu)差異較大的86位及621—636位的氨基酸鍵角及間距不同。由此進(jìn)一步推測,621—636位功能未知部分是導(dǎo)致不同毒株致病性存在差異的原因。未來將對這一區(qū)域進(jìn)行特異性突變,進(jìn)一步研究確定其功能和致病性差異之間的關(guān)系。