李潔瓊,李小萬(wàn)
(新疆農(nóng)業(yè)職業(yè)技術(shù)學(xué)院,新疆 昌吉 831100)
昆蟲(chóng)產(chǎn)生大量的抗菌肽作為防御細(xì)菌、病毒、真菌或寄生蟲(chóng)的第一道防線[1,2]。在鞘翅目昆蟲(chóng)中,攻擊素(Attacin)、天蠶素(Cecropin)、防御素(Defensin)以及鞘翅殺菌肽(Coleoptericin)等共同構(gòu)成昆蟲(chóng)先天免疫防御體系[3]。Attacin家族廣泛分布于昆蟲(chóng)不同種類(lèi),最初從天蠶中分離獲得[4],在柞蠶[5]中Attacin可作為菌株鑒定的靶向蛋白,在橘小實(shí)蠅[6]成蟲(chóng)脂肪體中Attacin對(duì)細(xì)菌攻擊的轉(zhuǎn)錄調(diào)節(jié)已得到證實(shí),蟲(chóng)草蝠蛾的高通量RNA-Seq分析顯示,Attacin與Cecropin,Gloverin和Defensin一起被鑒定為顯著表達(dá)的抗菌肽[7]。
Attacin是一類(lèi)富含甘氨酸的抗菌肽,按其等電點(diǎn)的不同劃分為兩大類(lèi):堿性攻擊素(Attacin A,Attacin B、Attacin C、Attacin D)和酸性攻擊素(Attacin E、Attacin F),大小范圍為20~23 ku[4,8]。一般由5部分組成,包括信號(hào)肽、前肽、P域(富含脯氨酸的結(jié)構(gòu)域)、N-末端Attacin域以及2個(gè)富含甘氨酸的結(jié)構(gòu)域(G1域和G2域)[8]。Attacin溶解時(shí)呈無(wú)規(guī)則卷曲狀態(tài),由于水溶液中的無(wú)規(guī)卷曲結(jié)構(gòu)不穩(wěn)定且對(duì)蛋白酶敏感,Attacin的抗菌活性取決于其螺旋構(gòu)象[9,10]。大部分Attacin可抵御大腸桿菌和一些特定的 革 蘭 氏 陰 性 細(xì) 菌[4,8],其 通 過(guò) 直 接 靶 向 細(xì) 菌 外膜[11],或者通過(guò)與脂多糖結(jié)合而不穿過(guò)內(nèi)膜或細(xì)胞質(zhì),阻止細(xì)菌外膜蛋白的合成,從而增加外膜的滲透性,抑制細(xì)菌的生長(zhǎng)[12]。
新疆荒漠昆蟲(chóng)小胸鱉甲(Microderapunctipennis)是古爾班通古特沙漠的一種鞘翅目擬步甲科特有種[13]。它以成蟲(chóng)過(guò)冬,在早春季節(jié)冰雪尚未完全融化時(shí)就可交配產(chǎn)卵,具有很高的耐寒性以適應(yīng)惡劣的沙漠環(huán)境[14],其潛在的分子基礎(chǔ)仍然是未知的。在對(duì)小胸鱉甲經(jīng)過(guò)4℃處理3 h所建立的低溫轉(zhuǎn)錄組數(shù)據(jù)中[14],一些免疫相關(guān)轉(zhuǎn)錄物上調(diào)表達(dá),其中MpAtt1和MpAtt2基因(GenBank登錄號(hào):KF825556和KF825557)顯著上調(diào)表達(dá)[15]。果蠅中也發(fā)現(xiàn)Attacin基因響應(yīng)低溫上調(diào)表達(dá)[16-18]。這些免疫基因的差異表達(dá)是在無(wú)病原體誘導(dǎo)的情況下由冷脅迫引起的,這表明低溫脅迫可能激活了昆蟲(chóng)體內(nèi)的免疫防御體系,具體機(jī)制需要進(jìn)一步研究。MpAtt1的推導(dǎo)氨基酸序列與MpAtt2有28.14%的同一性[15],本研究利用生物信息學(xué)方法,從理化性質(zhì)、二級(jí)結(jié)構(gòu)、疏水性、信號(hào)肽、跨膜區(qū)域、亞細(xì)胞定位、三級(jí)結(jié)構(gòu)及結(jié)構(gòu)域等多個(gè)方面對(duì)Mpattacin進(jìn)行預(yù)測(cè)及分析,并與其他同源Attacin蛋白比對(duì)分析,為進(jìn)一步研究小胸鱉甲Mpattacin基因功能奠定基礎(chǔ)。
MpAtt1和MpAtt2核酸序列來(lái)自NCBI的Gen-Bank數(shù)據(jù)庫(kù),經(jīng)DNAman軟件翻譯成氨基酸序列進(jìn)行后續(xù)的生物信息學(xué)分析。
生物信息學(xué)相關(guān)分析利用在線分析軟件完成(表1)。
表1 生物信息學(xué)在線分析軟件
通過(guò)ExPASy-ProtParam預(yù)測(cè)Mpattacin基因編碼的氨基酸的理化性質(zhì)(表2),MpAtt1編碼151個(gè)氨基酸,分子質(zhì)量為16.611 65 ku。MpAtt2編碼166個(gè)氨基酸,分子質(zhì)量為18.162 06 ku。由預(yù)測(cè)結(jié)果可看出,Mpattacin為穩(wěn)定的堿性蛋白。
表2 Mpattacin的理化性質(zhì)預(yù)測(cè)
利用ProtScale分析蛋白質(zhì)的親水性/疏水性,負(fù)值越小表示親水性越強(qiáng),正值越大表示疏水性越強(qiáng),介于-0.5~0.5的為兩性氨基酸。從疏水性預(yù)測(cè)結(jié)果(圖1a)可以看出,MpAtt1序列前有疏水性的信號(hào)肽序列,其余部分為親水性序列,與ProtParam分析結(jié)果一致(表2)。經(jīng)SignalP 4.1分析顯示(圖1b),預(yù)測(cè)的剪切位點(diǎn)位于17~18位氨基酸,表明MpAtt1蛋白的1~17位氨基酸可能為該蛋白的信號(hào)肽,屬于分泌蛋白。MpAtt2序列也存在信號(hào)肽序列(圖1c),信號(hào)肽的位置是1~17位氨基酸(圖1d),其余部分為親水性序列,與ProtParam分析結(jié)果一致(表2)。這2個(gè)Mpattacin抗菌蛋白多肽鏈親水氨基酸分布比較均勻,且數(shù)量大于疏水性氨基酸,蛋白表現(xiàn)出親水性,因此可推斷這2個(gè)蛋白屬于可溶性蛋白。
圖1 Mpattacin蛋白信號(hào)肽、親疏水性預(yù)測(cè)
利用TMpred分析蛋白質(zhì)的跨膜區(qū)(圖2),通常認(rèn)為Score值大于500是可信的,MpAtt1序列第1~21位和MpAtt2序列第5~21位存在強(qiáng)烈信號(hào),可能存在跨膜結(jié)構(gòu)域,與信號(hào)肽分析和疏水性分析結(jié)果一致,且在蛋白序列的其他區(qū)域不存在高評(píng)分區(qū)域,表明上述2個(gè)蛋白質(zhì)不存在跨膜區(qū)。
Porter分析結(jié)果顯示(圖3a),MpAtt1蛋白含有9個(gè)α-螺旋,80個(gè)延伸鏈和62個(gè)無(wú)規(guī)則卷曲;SOPMA分析結(jié)果顯示,MpAtt1蛋白含有20個(gè)α-螺旋,46個(gè)延伸鏈和85個(gè)無(wú)規(guī)則卷曲。MpAtt2蛋白(圖2b)經(jīng)Porter分析含有16個(gè)α-螺旋,81個(gè)延伸鏈和69個(gè)無(wú)規(guī)則卷曲;SOPMA分析結(jié)果顯示,MpAtt2蛋白含有17個(gè)α-螺旋,52個(gè)延伸鏈和97個(gè)無(wú)規(guī)則卷曲。這2個(gè)蛋白的二級(jí)結(jié)構(gòu)由α-螺旋、無(wú)規(guī)則卷曲和延伸鏈(β-折疊)3種結(jié)構(gòu)元件組成,其中,無(wú)規(guī)則卷曲和延伸鏈(β-折疊)所占比例較高,α-螺旋主要存在于信號(hào)肽處。
圖2 Mpattacin蛋白跨膜結(jié)構(gòu)域預(yù)測(cè)
圖3 Mpattacin蛋白二級(jí)結(jié)構(gòu)預(yù)測(cè)
同時(shí)利用YLoc、Tagert P、Cell-PLoc和ProtComp 9.0預(yù)測(cè)蛋白質(zhì)亞細(xì)胞定位(表3),結(jié)果顯示,MpAtt1和MpAtt2蛋白存在于細(xì)胞外的可能性較大,為細(xì)胞外的分泌蛋白。
表3 亞細(xì)胞定位分析
1)Mpattacin蛋白三級(jí)結(jié)構(gòu)。通過(guò)Swiss-Model和CPHmodels3.2預(yù)測(cè)Mpattacin三級(jí)結(jié)構(gòu),并采用Swiss-Pdbviewer進(jìn)行模型展示。結(jié)果表明,MpAtt1(圖4a)和MpAtt2(圖4b)蛋白主要由延伸鏈(β-折疊)和無(wú)規(guī)則卷曲這2種元件構(gòu)成,與二級(jí)結(jié)構(gòu)預(yù)測(cè)結(jié)果對(duì)應(yīng)。
圖4 Mpattacin三級(jí)結(jié)構(gòu)模型
2)Mpattacin蛋白保守結(jié)構(gòu)域。利用SMART分析Mpattacin蛋白保守結(jié)構(gòu)域的結(jié)果表明,MpAtt1氨基酸序列38~151位點(diǎn)為Pfam domain—Attacin_C(ID:PF03769),E值為3.4×10-12,且32~145位點(diǎn)為Gloverin domain(ID:PF10793),E值為2.3×10-3;同時(shí),MpAtt2蛋白同樣含有Attacin_C功能域(43~166位點(diǎn))以及葛佬素功能域(38~165位點(diǎn))。利用NCBI的Conserved domain database數(shù)據(jù)庫(kù)分析顯示,MpAtt1和MpAtt2氨基酸序列46~147位點(diǎn)和51~166位點(diǎn)為Attacin、C-terminal region(ID:cl04253/pfam 03769),E值分別為5.97×10-08和3.79×10-29,這表明Mpattacin蛋白具有典型的昆蟲(chóng)抗菌肽Attacin_C保守結(jié)構(gòu)域,隸屬于Attacin_C超家族,同時(shí)又具有抗菌蛋白葛佬素Gloverin保守結(jié)構(gòu)域。
3)Mpattacin蛋白基序分析。利用PROSITE分析Mpattacin的MOTIF,結(jié)果如表4所示,MpAtt1和MpAtt2的蛋白質(zhì)均具有相似的MOTIF:蛋白激酶C磷酸化位點(diǎn)、酪蛋白激酶II磷酸化位點(diǎn)和N-肉豆蔻?;稽c(diǎn)。
表4 Mpattacin的基序預(yù)測(cè)分析
4)Mpattacin蛋白糖基化和磷酸化位點(diǎn)。利用在線工具NetOGlyc4.0 Server預(yù)測(cè)Mpattacin潛在糖基化位點(diǎn),MpAtt2在氨基酸41(0.528)和42(0.543)處可能存在O-糖基化位點(diǎn),MpAtt1不存在糖基化位點(diǎn)的概率較高。利用NetPhos 3.1 Server分析Mpattacin潛在磷酸化位點(diǎn),磷酸化位點(diǎn)預(yù)測(cè)閾值選擇分值大于0.5,MpAtt1(圖5a)和MpAtt2(圖5b)序列可能存在較多的磷酸化修飾,特別是C端,且分別位于絲氨酸(Ser)、蘇氨酸(Thr)和酪氨酸(Tyr)3種氨基酸上,其中,絲氨酸(Ser)上潛在的磷酸化位點(diǎn)數(shù)最多,這與功能域和MOTIF預(yù)測(cè)結(jié)果一致。
圖5 Mpattacin磷酸化位點(diǎn)分析
從NCBI數(shù)據(jù)庫(kù)下載已經(jīng)報(bào)道的部分物種Attacin蛋白序列,同源性分析表明,與鞘翅目光滑鱉甲抗菌肽Attacin1(登錄號(hào):APX53001.1)一致性最高,為84.77%(表5)。
表5 與Mpattacin比對(duì)的其他同源Attacin蛋白的序列信息
小胸鱉甲MpAtt1和MpAtt2在氨基酸水平與鱗翅目、雙翅目和鞘翅目昆蟲(chóng)的Attacins具有35.05%~84.77%的一致性,可知鞘翅目昆蟲(chóng)的Attacin與來(lái)自其他2個(gè)目的昆蟲(chóng)Attacin序列之間具有較大差別。系統(tǒng)發(fā)育樹(shù)分析也表明,鞘翅目昆蟲(chóng)小胸鱉甲的Mpattacin和赤擬谷盜的Attacin,與鱗翅目和雙翅目的Attacin相比分枝較早[15],與這些昆蟲(chóng)之間的分類(lèi)進(jìn)化關(guān)系一致。Attacin溶解時(shí)呈無(wú)規(guī)則卷曲狀態(tài)[9],由于缺乏半胱氨酸所形成的二硫鍵,其構(gòu)成的三維結(jié)構(gòu)是松散和不穩(wěn)定的,這種對(duì)結(jié)構(gòu)無(wú)嚴(yán)格的限制可能會(huì)導(dǎo)致氨基酸替換的增加,這可能是導(dǎo)致遠(yuǎn)源物種的Attacin氨基酸序列相似性低的原因之一。
Mpattacin的氨基酸序列與其他昆蟲(chóng)Attacin不同,富含脯氨酸的P域幾乎丟失;N末端結(jié)構(gòu)域大大縮短;G1結(jié)構(gòu)域比其他Attacin的短;其中MpAtt1的堿性氨基酸蛋白酶(furin-like enzyme)RXXR酶切位點(diǎn)變化非常大[15],因此難以通過(guò)序列的同源性分析Mpattacin蛋白的生物活性。而影響抗菌肽生物學(xué)特性的因素有很多,其中,肽鏈長(zhǎng)度、電荷數(shù)與分布、氨基酸空間結(jié)構(gòu)及組成、疏水性及親水性特點(diǎn)等是主要的自身決定因素[19]。MpAtt1和MpAtt2的等電點(diǎn)(pI)分別為9.57和8.71,屬于基礎(chǔ)Attacin類(lèi)[4]。大多數(shù)昆蟲(chóng)抗菌肽AMP是帶有陽(yáng)離子的蛋白質(zhì),具有抗細(xì)菌活性的堿性殘基,因此可以通過(guò)電荷間相互作用促進(jìn)AMP與帶負(fù)電荷的微生物表面的結(jié)合[10,20]??咕耐ǔ@砘再|(zhì)穩(wěn)定,具有較好的耐熱性和耐酸堿性[21]。借助相關(guān)生物信息學(xué)在線軟件分析表明,Mpattacin也具有上述特性,這也意味著這些特性是Mpattacin具有活性的基礎(chǔ)。
蛋白質(zhì)中氨基酸的疏水性和親水性的分布情況決定了該蛋白質(zhì)如何折疊。分析預(yù)測(cè)Mpattacin蛋白質(zhì)具有高疏水值的信號(hào)肽序列區(qū)域,并出現(xiàn)在潛在的跨膜區(qū),其余部分為親水性序列,無(wú)跨膜結(jié)構(gòu),表明Mpattacin在折疊的過(guò)程中形成了親水的表面以及疏水的內(nèi)核,是親水性蛋白。亞細(xì)胞定位結(jié)果也顯示,MpAtt1和MpAtt2蛋白為細(xì)胞外的分泌蛋白,表明該蛋白符合昆蟲(chóng)抗菌肽Attacin的特性[4,8]。有報(bào)道表明,抗菌肽在插入到菌體細(xì)胞膜的過(guò)程中,其疏水特性起了關(guān)鍵作用[22],即改善疏水性可提高抗菌肽的抗菌活性。盡管Mpattacin在總體上是親水性的,但在其序列中也包含一些疏水性的殘基位點(diǎn),這也可以提高M(jìn)pattacin的抗菌活性。
蛋白質(zhì)主要的生化特征及功能是由多肽鏈進(jìn)一步螺旋、折疊和卷曲而形成的高級(jí)空間結(jié)構(gòu)來(lái)決定的。二級(jí)結(jié)構(gòu)和三級(jí)結(jié)構(gòu)預(yù)測(cè)結(jié)果顯示,Mpattacin蛋白存在較多的β-折疊和無(wú)規(guī)則卷曲,少量的α-螺旋結(jié)構(gòu)。β-折疊位于蛋白質(zhì)內(nèi)部,能夠牢固地維持該蛋白的高級(jí)結(jié)構(gòu)。無(wú)規(guī)則卷曲則常展示在蛋白質(zhì)表面,有利于抗原抗體的相互作用[23]。有研究表明,抗菌肽的α-螺旋結(jié)構(gòu)有助于透過(guò)和破壞細(xì)菌的細(xì)胞膜[24]。通過(guò)保守結(jié)構(gòu)域的分析可知,MpAtt1和MpAtt2都具有Attacin_C結(jié)構(gòu)域和Gloverin域,這2個(gè)結(jié)構(gòu)序列均與抗菌活性有關(guān)[3]。且Mpattacin存在較多的磷酸化潛在位點(diǎn),特別是在C端,從而有利于該蛋白質(zhì)與昆蟲(chóng)體內(nèi)其他分子或蛋白相互作用而調(diào)控細(xì)胞的應(yīng)答功能。一般來(lái)說(shuō)多肽鏈中的氨基酸潛在的磷酸化位點(diǎn)越多,發(fā)揮更多功能的可能性就越大。已經(jīng)從許多昆蟲(chóng)中鑒定出具有抗微生物活性的Attacin[4,11,25,26],此外果蠅的研究表明,反復(fù)冷暴露后抗菌肽Attacin(AttacinA、AttacinB和AttacinC)上調(diào)表達(dá)[16];冷馴化的果蠅中也發(fā)現(xiàn)編碼抗微生物肽的Dro、Dipt、AttA和AttC上調(diào)[17];低溫下果蠅中編碼抗菌肽的AttA、AttB、DptA、DptB、CecA1和CecA2轉(zhuǎn)錄上調(diào)以響應(yīng)過(guò)冷卻現(xiàn)象,AttD下調(diào)以響應(yīng)體液結(jié)冰[18]。起初是在分析小胸鱉甲低溫轉(zhuǎn)錄組數(shù)據(jù)時(shí)發(fā)現(xiàn)低溫誘導(dǎo)表達(dá)Mpattacin基因,并在4℃和-4℃低溫下檢測(cè)MpAtt1和MpAtt2的表達(dá)譜,在一段時(shí)間長(zhǎng)度(0~11 h)內(nèi)得到證實(shí)[15]。本研究通過(guò)多個(gè)方面預(yù)測(cè)結(jié)果相互驗(yàn)證,分析得出Mpattacin蛋白可能具有較好的抗菌活性,參與到昆蟲(chóng)的體液防御系統(tǒng)。在低溫下免疫通路的激活及其調(diào)控抗菌肽基因的表達(dá),一定程度上增強(qiáng)了昆蟲(chóng)脅迫耐受性和免疫防御能力[18]。對(duì)于越冬期的小胸鱉甲來(lái)說(shuō),在沒(méi)有病原體脅迫的情況下,Attacin基因的表達(dá)對(duì)寒冷產(chǎn)生響應(yīng),表明低溫誘導(dǎo)表達(dá)Attacin蛋白可能是昆蟲(chóng)進(jìn)化出的一種低溫保護(hù)機(jī)制[27]。本研究對(duì)Mpattacin基因生物信息學(xué)分析有助于進(jìn)一步開(kāi)展克隆表達(dá)及功能分析方面提供理論參考。