周輝 宋莉 趙德剛
摘要:本研究應(yīng)用相關(guān)生物學(xué)軟件和在線數(shù)據(jù)庫(kù)對(duì)大腸桿菌的HspQ基因進(jìn)行生物信息學(xué)分析。結(jié)果表明其編碼了105個(gè)氨基酸,推測(cè)其可能是一種親水性蛋白,而通過(guò)蛋白磷酸化位點(diǎn)的預(yù)測(cè)表明其含有17個(gè)絲氨酸位點(diǎn)、7個(gè)蘇氨酸位點(diǎn)、4個(gè)酪氨酸位點(diǎn),通過(guò)對(duì)其跨膜結(jié)構(gòu)域和信號(hào)肽預(yù)測(cè)顯示其不存在信號(hào)肽也沒(méi)有跨膜結(jié)構(gòu)域。而我們對(duì)其編碼蛋白的二、三級(jí)結(jié)構(gòu)進(jìn)行預(yù)測(cè)表明其主要由α螺旋和無(wú)規(guī)則卷曲兩種結(jié)構(gòu)組成。本研究預(yù)測(cè)結(jié)果為進(jìn)一步研究熱休克蛋白基因奠定了基礎(chǔ)。
關(guān)鍵詞:大腸桿菌;HspQ基因;生物信息學(xué)
Bioinformatics Analysis of HspQ Gene in Escherichia coli
ZHOU Hui1,SONG Li1*,ZHAO De?gang2*
(1.Guizhou Key Lab of Agro-Bioengineering, Institute of Agro-Bioengineering and College of Life Sciences, Guizhou University, Guiyang, Guizhou 550025,China;2.Guizhou Academy of Agricultural Science, Guiyang, Guizhou 550006,China)
Abstract: Bioinformatics analysis of the Escherichia coli HspQ gene was performed using biological software and related databasesin in this study. The results showed that it encodes 105 amino acids and it is speculated that it may be a hydrophilic protein. The prediction of protein phosphorylation sites shows that it contains 17 serine sites, seven threonine sites and four tyrosine acid sites.It is shown by the prediction of its transmembrane domain that this gene may have signal peptide but no transmembrane domain.The prediction of the second and third order structure of its encoded protein indicates that it mainly contains two kinds of structures: α-helix and random-curl. This study laid the foundation for the further study of the heat shock protein gene.
Key words:Escherichia coli; HspQ gene; bioinformatics
熱休克蛋白(Heat shock proteins,HSPs)是在應(yīng)激脅迫條件下生物體所產(chǎn)生的一類(lèi)具有保護(hù)功能的蛋白[1],是細(xì)胞啟動(dòng)自我保護(hù)機(jī)制的生物標(biāo)志[2],在微生物、植物、動(dòng)物體內(nèi)都廣泛存在[3]。HSPs與逆境脅迫響應(yīng)密切相關(guān),主要是通過(guò)分子伴侶機(jī)制保護(hù)細(xì)胞而提高植物對(duì)逆境的耐受性[4]。HSPs根據(jù)其序列同源性和分子質(zhì)量大小,將其分為HSP100、HSP90、HSP70、HSP60、HSP40、小分子HSP等6個(gè)家族[5]。
本課題組前期通過(guò)對(duì)大腸桿菌應(yīng)激誘導(dǎo)基因表達(dá)譜芯片分析,篩選出差異倍數(shù)較高的熱休克蛋白基因,本文對(duì)課題組前期篩選出的高表達(dá)且功能未知的HspQ基因進(jìn)行生物信息學(xué)分析,為進(jìn)一步深入研究該基因的生物學(xué)功能奠定基礎(chǔ)。
1材料與方法
1.1材料
通過(guò)NCBI (https://www.ncbi.nlm.nih.gov/)數(shù)據(jù)庫(kù)以及uniprot(http://www.uniprot.org/)蛋白數(shù)據(jù)庫(kù)下載得到大腸桿菌HspQ基因的mRNA序列和蛋白序列。
1.2方法
在對(duì)大腸桿菌HspQ基因進(jìn)行生物信息學(xué)分析的過(guò)程中,使用MEGA6生物學(xué)軟件來(lái)進(jìn)行氨基酸序列的同源比對(duì),并且構(gòu)建了HspQ蛋白的系統(tǒng)進(jìn)化樹(shù),使用在線數(shù)據(jù)庫(kù) ProParam進(jìn)行蛋白質(zhì)的理化性質(zhì)的預(yù)測(cè),通過(guò)在線數(shù)據(jù)庫(kù)NetPhos 2.0 Server預(yù)測(cè)磷酸化位點(diǎn),在線數(shù)據(jù)庫(kù) SignalP4.0 Server可以用來(lái)進(jìn)行信號(hào)肽和跨膜結(jié)構(gòu)預(yù)測(cè),用TargerP 1.1 server 進(jìn)行亞細(xì)胞定位和導(dǎo)肽預(yù)測(cè)分析,用在線數(shù)據(jù)庫(kù)PSIPRE和SWISS-MOLD預(yù)測(cè)蛋白質(zhì)二、三級(jí)結(jié)構(gòu),利用STRING對(duì)HspQ蛋白進(jìn)行蛋白-蛋白相互作用進(jìn)行分析。
2結(jié)果與分析
2.1HspQ基因進(jìn)化樹(shù)分析
大腸桿菌HspQ基因的DNA序列共有318 bp,其編碼的蛋白含有105個(gè)氨基酸。選擇目標(biāo)蛋白序列65條,與大腸桿菌HspQ基因的蛋白序列在ClustalX上進(jìn)行序列比對(duì),然后利用MEGA6生物學(xué)軟件構(gòu)建系統(tǒng)進(jìn)化樹(shù)(圖1)。結(jié)果如圖所示,進(jìn)化樹(shù)分為9個(gè)大分支和許多小分支,每個(gè)分支上相鄰的位置親緣關(guān)系較近,結(jié)果表明在微生物HspQ基因進(jìn)化過(guò)程中,大腸桿菌與沙門(mén)氏細(xì)菌、發(fā)光細(xì)菌等親緣關(guān)系較近。
2.2蛋白質(zhì)理化性質(zhì)分析
通過(guò)在線數(shù)據(jù)庫(kù)ProParam(http://web.expasy.org/protparam/)[6]預(yù)測(cè)大腸桿菌HspQ基因編碼蛋白質(zhì)的理化性質(zhì),結(jié)果表明,HspQ編碼蛋白的化學(xué)方程式為C519H814N142O165S3,預(yù)測(cè)的分子量為11779.20Da,理論等電點(diǎn)為4.53,為酸性,總平均親水性為-0.397,脂肪系數(shù)95.62,不穩(wěn)定參數(shù)52.07;負(fù)電荷殘基(Asp+Glu)有17個(gè),正電荷殘基(Arg+Lys)有7個(gè)。
2.3親疏水性分析
用在線數(shù)據(jù)庫(kù)ProtScale(http://web.expasy.org/ProtScale/)[6]分析蛋白質(zhì)親疏水性,各個(gè)氨基酸打分分值見(jiàn)表2,分值小于 0表示親水,大于 0表示疏水,推測(cè)此蛋白為親水性蛋白,即蛋白可溶于水。
2.4跨膜區(qū)預(yù)結(jié)構(gòu)預(yù)測(cè)與信號(hào)肽分析
通過(guò)在線數(shù)據(jù)庫(kù)TMHMM(http://www.cbs.dtu.dk/services/TMHMM/)[7]預(yù)測(cè)大腸桿菌HspQ編碼蛋白是否含有跨膜結(jié)構(gòu)域,結(jié)果表明該蛋白全部在膜外,沒(méi)有跨膜區(qū)域。
通過(guò)在線數(shù)據(jù)庫(kù)SignalP(http://www.cbs.dtu.dk/services/SignalP)[8]預(yù)測(cè)大腸桿菌HspQ基因編碼蛋白信號(hào)肽,結(jié)果表明此蛋白沒(méi)有信號(hào)肽 。
2.5PSIPRE預(yù)測(cè)蛋白二級(jí)結(jié)構(gòu)
AA代表了目標(biāo)蛋白質(zhì)的氨基酸序列。Pred代表了二級(jí)結(jié)構(gòu)以及相應(yīng)的圖例(H:Helix; C:Coil;E:Strand)。Conf數(shù)值越高,置信度越高。由PSIPRED預(yù)測(cè)結(jié)果可知:HspQ二級(jí)結(jié)構(gòu)主要由折疊和卷曲結(jié)構(gòu)構(gòu)成。
2.6磷酸化位點(diǎn)
通過(guò)在線數(shù)據(jù)庫(kù)NetPhos 2.0 Server(http://www.cbs.dtu.dk/services/NetPhos/)進(jìn)行磷酸化位點(diǎn)預(yù)測(cè)。結(jié)果表明其總共含有28個(gè)蛋白磷酸化位點(diǎn),其中絲氨酸位點(diǎn)最多有17個(gè),其次是蘇氨酸位點(diǎn)有7個(gè),最少的是酪氨酸位點(diǎn)只有4個(gè)。
2.7亞細(xì)胞定位及導(dǎo)肽預(yù)測(cè)分析
通過(guò)在線數(shù)據(jù)庫(kù)TargerP 1.1 (http://www.cbs.dtu.dk/services/TargetP/)[9]對(duì)HspQ基因進(jìn)行預(yù)測(cè),結(jié)果如表3,即編碼105個(gè)氨基酸,并且存在線粒體目標(biāo)肽(mTP)的可能性為14.8%,存在信號(hào)肽(SP)的可能性為46.1%,其他導(dǎo)肽或無(wú)導(dǎo)肽的可能性為26.8%,這與前面信號(hào)肽預(yù)測(cè)結(jié)果相匹配。
2.8同源建模
通過(guò)在線工具SWISS-MODEL[10]對(duì)大腸桿菌HsPQ基因編碼的蛋白進(jìn)行建模,得到其蛋白的三維結(jié)構(gòu)如圖所示。通過(guò)分析可知,HspQ基因編碼的蛋白的三維結(jié)構(gòu)主要以α螺旋和無(wú)規(guī)則卷曲為主,這與二級(jí)結(jié)構(gòu)分析一致。
2.9蛋白相互作用分析
利用STRING數(shù)據(jù)庫(kù)對(duì)HspQ構(gòu)建蛋白-蛋白相互作用網(wǎng)絡(luò),如圖8所示。通過(guò)分析,可知HspQ與rlml、msbA、tus、ftsL、lptC、hha之間相互作用。
3結(jié)論與討論
HspQ基因編碼區(qū)318bp,由105個(gè)氨基酸組成,蛋白的化學(xué)方程式為C519H814N142O165S3,預(yù)測(cè)的分子量為11779.20Da,結(jié)構(gòu)穩(wěn)定,呈酸性,帶負(fù)電荷,預(yù)測(cè)為親水性蛋白即是一種可溶性蛋白。無(wú)明顯的信號(hào)肽和跨膜結(jié)構(gòu),說(shuō)明HspQ基因不參與物質(zhì)的跨膜運(yùn)輸。在非生物脅迫下,有些蛋白質(zhì)可以作為保護(hù)分子來(lái)保護(hù)植物細(xì)胞的穩(wěn)定,從而提高植物的抗逆性[11],本研究預(yù)測(cè)大腸桿菌HspQ蛋白屬于親水性蛋白質(zhì),表明HspQ有利于提高植物抵御非生物脅迫的能力。
二級(jí)結(jié)構(gòu)預(yù)測(cè)表明其主要以α螺旋和無(wú)規(guī)則卷曲為主,無(wú)規(guī)則卷曲柔性大,經(jīng)常出現(xiàn)在活躍點(diǎn)和對(duì)接點(diǎn),但是它們受側(cè)鏈相互作用的影響很大,能不斷的運(yùn)動(dòng)。無(wú)規(guī)則卷曲經(jīng)常是酶的活性位點(diǎn)和其他蛋白質(zhì)特異的功能部位,并且可用于分子識(shí)別,在蛋白質(zhì)特征和功能中起關(guān)鍵作用[12]。運(yùn)用SWISS-MODEL構(gòu)建 HspQ蛋白三級(jí)結(jié)構(gòu),一般同源性超過(guò)30%蛋白質(zhì)序列均可建立精確結(jié)構(gòu)模型,序列同源性越高則建立模型結(jié)構(gòu)準(zhǔn)確性越高[13],通過(guò)分析HspQ三級(jí)結(jié)構(gòu)發(fā)現(xiàn)主要以無(wú)規(guī)則卷曲為主,這與二級(jí)結(jié)構(gòu)分析一致??缒そY(jié)構(gòu)預(yù)測(cè)表明HspQ蛋白主要在胞外起作用,這與余瑛等[14]研究表明熱激蛋白主要是通過(guò)分子伴侶機(jī)制保護(hù)細(xì)胞而提高植物對(duì)逆境的耐受性相吻合。
參考文獻(xiàn):
[1]陳育慶,熊琛,閻國(guó)珍,等.急性熱暴露大白鼠肝臟熱休克蛋白形成的研究[J].生物化學(xué)與生物物理進(jìn)展,1990(01):50-53,49.
[2]肖衛(wèi)民,蔣碧梅,石永忠,等.從凋亡信號(hào)通路探討熱休克蛋白保護(hù)過(guò)氧化氫所致心肌細(xì)胞凋亡的機(jī)制[J].中國(guó)動(dòng)脈硬化雜志,2003(04):283-286.
[3]曲凌云,孫修勤,相建海等.熱休克蛋白研究進(jìn)展[J].海洋科學(xué)進(jìn)展,2004(3):385-391.
[4]Ballinger D.G.,and Par due M.L.The control of pro- tein-synthesis during heat-shock in drosophila cells involves altered polypeptide elongation rates[J]. Cell,1983,33(1): 103-113
[5]張永亮,吳家馼,吳梅筠.熱休克蛋白的分類(lèi),基因調(diào)控及其功能[J].法醫(yī)學(xué)雜志,1999,V0(4):239-242.
[6]Gasteiger E,Hoogland C,Gattiker A,Duvaud S,et al.??Protein Identification and Analysis Tools on the ExPASy Server [J].Proteomics Protocols Handbook,2005,112(112): 571-607
[7]熊偉,楊勇琴,張海洋,等.人線粒體轉(zhuǎn)錄終止因子1(hMTERF1)蛋白的生物信息學(xué)分析[J].生物信息學(xué),2015,13(1):23-30.
[8]Petersen T N,Brunak S,Von H G,et al.??SignalP 4.0: discriminating signal peptides from transmembrane regions.[J].Nature Methods,2011,8(10):785-786.
[9]周雅,高貝,張道遠(yuǎn).齒肋赤蘚早期光誘導(dǎo)蛋白ELIPs的生物信息學(xué)分析[J].生物信息學(xué),2014,12(4):233-241.
[10]Arnold K,Bordoli L,Kopp J,et al.??The SWISS-MODEL workspace: a web-based environment for protein structure homology modelling[J].Bioinformatics,2006,22(2):195-201.
[11]趙琳琳,徐啟江,姜勇,等. 生物和非生物脅迫下的植物細(xì)胞中絲裂原活化蛋白激酶(MAPK)信號(hào)轉(zhuǎn)導(dǎo)[J].植物生理學(xué)報(bào),2008,44(1):169-174.
[12]Gibson D T,Parales R E.Aromatic hydrocarbon dioxygenases in environmental biotechnology[J].Current Opinion Biotechnology,2000;11(3):236-243.
[13]諶容,陳敏,楊春賢,等.基于SWISS-MODEL的蛋白質(zhì)三維結(jié)構(gòu)建模[J].生命的化學(xué),2006(01):54-56.
[14]余瑛,夏玉先,蔡紹皙.植物小分子熱休克蛋白[J].中國(guó)生物工程雜志,2003(7):38-41.