黃明捷,張 勇,陳 祥,陳 偉,莫先艇,郭 勇,王天松
(1.貴州大學 高原山地動物遺傳育種與繁殖教育部重點實驗室,貴州 貴陽 550025;2.貴州大學 貴州省動物遺傳育種與繁殖重點實驗室,貴州 貴陽 550025;3.貴州大學 動物科學學院,貴州 貴陽 550025)
檸檬酸循環(huán)的中間體如檸檬酸鹽、琥珀酸鹽和α-酮戊二酸鹽等是重要的能源和生物合成前體,同時還具有信號傳導作用,如檸檬酸鹽能作為大腦中用于感知能量和營養(yǎng)物的調(diào)節(jié)信號[1]。檸檬酸循環(huán)中間體從質(zhì)膜轉(zhuǎn)運到細胞中是通過溶質(zhì)載體13(Solute carrier 13,SLC13)家族轉(zhuǎn)運蛋白介導。SLC13蛋白家族是在原核生物和真核生物中均被發(fā)現(xiàn)的超級轉(zhuǎn)運蛋白家族[2],它屬于SLC家族中的一個亞族,對調(diào)節(jié)動物機體組織、血漿以及尿液中代謝物含量極其重要。脊椎動物SLC13家族由5個基因構(gòu)成,根據(jù)其作用底物的特性可分為Na-羧酸鹽協(xié)同轉(zhuǎn)運蛋白(Na+-carboxylate cotransporters,NaC)和Na-硫酸鹽協(xié)同轉(zhuǎn)運蛋白(Na+-sulfate cotransporters,NaS)[3]。NaC包括SLC13A2、SLC13A3和SLC13A5蛋白,它們在腎皮質(zhì)、小腸、肝臟、大腸有一定分布[4-6]。SLC13A2基因敲除小鼠會表現(xiàn)出腎臟再吸收缺陷[7],NaC參與檸檬酸循環(huán)中間體的介導轉(zhuǎn)運,還可以直接影響代謝酶。NaS包括SLC13A1和SLC13A4蛋白,SLC13A1蛋白存在于腎臟近端小管和腸上皮細胞[8],SLC13A4蛋白存在于胎盤和睪丸中[9]。NaS介導轉(zhuǎn)運陰離子如硫酸鹽、硒酸鹽和硫代硫酸鹽,它對維持機體硫酸鹽穩(wěn)態(tài)具有重要意義[10],SLC13A1基因敲除小鼠表現(xiàn)出硫酸鹽血癥,其生長遲緩、生育能力降低[11]。
鑒于SLC13蛋白家族具有調(diào)節(jié)機體檸檬酸循環(huán)中間體以及代謝物穩(wěn)態(tài)的功能,其對牛生長發(fā)育狀況以及代謝疾病的產(chǎn)生有不可忽視的作用,但目前關(guān)于牛SLC13蛋白的生物信息學方面的研究尚未見報道。為此,應(yīng)用生物信息學方法分析牛SLC13蛋白,初步探究其理化性質(zhì)、疏水性、二級結(jié)構(gòu)及三級結(jié)構(gòu)、保守基序、亞細胞定位、跨膜區(qū)、蛋白質(zhì)互作情況和系統(tǒng)進化,以期為揭示牛SLC13蛋白的生物學功能、提高牛生長性能和代謝疾病防控提供參考。
本研究所用數(shù)據(jù)均來源于NCBI數(shù)據(jù)庫,各物種SLC13蛋白信息見表1。
表1 各物種SLC13蛋白信息Tab.1 Information of SLC13 protein of each species
通過在線軟件ExPASy中的ProtParam(https://web.expasy.org/protparam)分析牛SLC13基因家族蛋白的氨基酸序列組成和理化性質(zhì);應(yīng)用Pepwheel(http://www.bioinformatics.nl/cgi-bin/emboss/pepwheel)和ProtScale(https://web.expasy.org/cgi-bin/protscale/protscale.pl),構(gòu)建蛋白質(zhì)的螺旋輪,并分析氨基酸殘基的親疏水性;通過在線軟件SOPMA(https://npsa-prabi.ibcp.fr/cgi-bin/secpred_sopma.pl)和SWISS-MODEL(http://swissmodel.expasy.org/interactive)預(yù)測牛SLC13家族蛋白的二級結(jié)構(gòu)及三級結(jié)構(gòu);利用CSDS(http://gsds.cbi.pku.edu.cn)繪制蛋白質(zhì)結(jié)構(gòu)圖,使用MEME(http://meme-suite.org/index.html)對牛SLC13蛋白序列基序進行分析;利用在線軟件PsortⅡ(https://psort.hgc.jp/form2.html)對牛SLC13蛋白的亞細胞定位進行預(yù)測;利用TMHMM Server.2.0(http://www.cbs.dtu.dk/services/TMHMM)進行跨膜區(qū)分析;應(yīng)用STRING(https://string-db.org)分析SLC13蛋白的互作網(wǎng)絡(luò);利用MEGA 6.05軟件中的最大似然法(Maximum likelihood,ML)構(gòu)建各物種間SLC13蛋白的系統(tǒng)進化樹。
使用在線軟件ExPASy中的ProtParam分析牛SLC13蛋白的氨基酸序列組成和理化性質(zhì),結(jié)果見表2。從表2和圖1可以看出,牛SLC13基因家族成員編碼的氨基酸數(shù)目在520~626個,氨基酸組分中亮氨酸(Leu)含量最高,組氨酸含量最低(His);SLC13蛋白氨基酸分子質(zhì)量從57.80~68.96 ku不等,等電點介于7.01~8.67,親水性總平均值(Grand average of hydropathicity,GRAVY)均大于0;SLC13A2為不穩(wěn)定蛋白,SLC13A1、SLC13A3、SLC13A4、SLC13A5均為穩(wěn)定蛋白(不穩(wěn)定系數(shù)小于40,為穩(wěn)定蛋白)[12-13]。
表2 牛SLC13蛋白理化性質(zhì)分析Tab.2 Physicochemical properties of bovine SLC13 protein
圖1 牛SLC13蛋白的氨基酸組成Fig.1 Amino acid content of bovine SLC13 protein
構(gòu)成蛋白質(zhì)的多聚氨基酸能組成復(fù)雜的結(jié)構(gòu)并產(chǎn)生特定功能,這些氨基酸總體的疏水性起著重要作用。構(gòu)成蛋白質(zhì)的多肽鏈中親水性氨基酸與疏水性氨基酸的比例,表明該蛋白質(zhì)的親水或疏水性[14-15]。利用Pepwheel構(gòu)建牛SLC13蛋白的螺旋輪(圖2),以識別疏水性和親水性殘基的分布情況,脂肪族殘基用正方形標記,親水性殘基用菱形標記,帶正電荷的殘基用八邊形標記。應(yīng)用ProtScale對牛SLC13蛋白進行預(yù)測分析(表3、圖3),根據(jù)親水性氨基酸與疏水性氨基酸的比例可知,牛SLC13蛋白均為疏水性蛋白,與ProtParam預(yù)測結(jié)果一致。
圖2 牛SLC13蛋白的螺旋輪Fig.2 Spiral wheel of bovine SLC13 protein
表3 牛SLC13蛋白疏水性分析Tab.3 Hydrophobicity analysis of bovine SLC13 protein
注:親/疏水性氨基酸值小于1,表示多肽鏈親水性總氨基酸數(shù)小于疏水性總氨基酸數(shù),則為疏水性蛋白。
Note:The pro-/hydrophobic amino acid value is less than 1,indicating that the total hydrophilic amino acid number of the polypeptide chain is less than the total number of hydrophobic amino acids,and the protein is a hydrophobic protein.
圖3 牛SLC13蛋白親水性/疏水性預(yù)測結(jié)果Fig.3 Prediction results of hydrophilicity/hydrophobicity of bovine SLC13 protein
通過SOPMA在線軟件預(yù)測牛SLC13蛋白的二級結(jié)構(gòu),構(gòu)成不同SLC13蛋白二級結(jié)構(gòu)的α-螺旋、伸展鏈、β-轉(zhuǎn)角以及無規(guī)卷曲均由數(shù)量相近的氨基酸組成(表4)。應(yīng)用SWISS-MODEL在線軟件預(yù)測牛SLC13蛋白的三級結(jié)構(gòu)(圖4),發(fā)現(xiàn)牛SLC13蛋白有較多α-螺旋結(jié)構(gòu)富集域,以β-轉(zhuǎn)角和無規(guī)卷曲連接形成其特定結(jié)構(gòu)。
表4 牛SLC13蛋白二級結(jié)構(gòu)組成Tab.4 Secondary structure of bovine SLC13 protein
圖4 牛SLC13蛋白三級結(jié)構(gòu)預(yù)測Fig.4 Tertiary structure prediction of boivine SLC13 protein
利用CSDS繪制蛋白質(zhì)結(jié)構(gòu)圖,并使用MEME(參數(shù):Motif最大值為10)對牛SLC13蛋白序列保守基序進行分析(圖5)。SLC13A2、SLC13A3和SLC13A5基因均有5′UTR和3′UTR,SLC13A1和SLC13A4基因僅有3′UTR,牛SLC13基因家族均含有11段以上的外顯子;除SLC13A3蛋白無Motif 10、SLC13A5蛋白無Motif 8外,SLC13A1、SLC13A2、SLC13A4蛋白均存在Motif 1—10。
圖5 牛SLC13基因家族的系統(tǒng)進化樹(A)、結(jié)構(gòu)(B)及蛋白質(zhì)基序分析(C)Fig.5 Phylogenetic tree(A),gene structure(B) and protein motif structure(C) of bovine SLC13 gene family
蛋白質(zhì)只有處于特定亞細胞區(qū)間才能發(fā)揮其功能,利用在線軟件預(yù)測蛋白質(zhì)亞細胞區(qū)間位置,可以了解蛋白質(zhì)的功能和性質(zhì)、認識蛋白質(zhì)間的相互作用[16]。使用在線軟件Psort Ⅱ 對牛SLC13基因家族編碼蛋白進行預(yù)測分析(表5),發(fā)現(xiàn)牛SLC13蛋白在細胞內(nèi)主要分布在質(zhì)膜、內(nèi)質(zhì)網(wǎng)和線粒體,僅有SLC13A3蛋白在高爾基體中有一定分布。
表5 牛SLC13蛋白的亞細胞定位 Tab.5 Subcellular localization of bovine SLC13 protein %
鑲嵌在生物膜上蛋白質(zhì)的功能和性質(zhì)決定其生物膜的絕大部分功效,膜蛋白是在各種細胞中普遍存在并具有獨特結(jié)構(gòu)的蛋白質(zhì),對維持生命活動有極其重要的作用。使用在線軟件TMHMM Server.2.0對牛SLC13蛋白進行跨膜區(qū)分析(圖6)可知,牛SLC13蛋白均為多次跨膜螺旋的內(nèi)在膜蛋白(Integral protein)。構(gòu)成跨膜區(qū)蛋白的氨基酸大部分是疏水性氨基酸,與牛SLC13蛋白的疏水性區(qū)域分析結(jié)果基本一致。
圖6 牛SLC13蛋白跨膜區(qū)域預(yù)測Fig.6 Transmembrane region analysis of bovine SLC13 protein
利用STRING構(gòu)建牛SLC13蛋白的互作網(wǎng)絡(luò)并進行GO功能注釋。選擇15個直接或間接互作節(jié)點、25條互作關(guān)系構(gòu)建牛SLC13蛋白的互作網(wǎng)絡(luò)(圖7)。牛SLC13蛋白GO通路富集結(jié)果顯示,其在生物學層面上主要參與羧酸跨膜運輸(Carboxylic acid transmembrane transport);在分子功能層面主要富集于羧酸跨膜轉(zhuǎn)運蛋白活性(Carboxylic acid transmembrane transporter activity)和次級活性跨膜轉(zhuǎn)運蛋白活性(Secondary active transmembrane transporter activity)。
圖7 牛SLC13蛋白互作網(wǎng)絡(luò)Fig.7 Interaction network of bovine SLC13 protein
用MEGA 6.05軟件對14個物種的SLC13氨基酸序列共計69條進行分析,采用最大似然法比對后構(gòu)建進化樹,結(jié)果如圖8所示。14個物種的SLC13A1蛋白與SLC13A4蛋白處于同一個較大分支,SLC13A2、SLC13A3和SLC13A5蛋白處于另一個較大分支,SLC13A2、SLC13A3、SLC13A5分支中SLC13A2和SLC13A5在14個物種中的進化上親緣關(guān)系較近。普通牛均與瘤牛、水牛、牦牛聚為一類,具有較高的同源性,與雞的距離最遠。
在人和小鼠中,硫酸鹽在回腸中被吸收,然后通過腎臟維持其穩(wěn)態(tài)。妊娠期母體對高循環(huán)硫酸鹽水平的生理需求在物種間是保守的[17],SLC13A1蛋白能維持母體正常血漿硫酸鹽生理水平,而SLC13A4蛋白能將胎盤外的硫酸鹽轉(zhuǎn)運供給胎兒,并且SLC13A1和SLC13A4敲除小鼠會表現(xiàn)蛋白的出妊娠中晚期胎兒死亡現(xiàn)象[18-19]。因而,SLC13A1和SLC13A4的正常表達對胎兒發(fā)育至關(guān)重要。檸檬酸鹽是鈣的重要螯合劑,SLC13A2蛋白能調(diào)節(jié)尿液中檸檬酸鹽的濃度,而許多腎結(jié)石患者表現(xiàn)出低檸檬酸鹽,這表明SLC13A2蛋白與腎結(jié)石的發(fā)生有關(guān)[20]。SLC13A5蛋白抑制肝臟細胞外檸檬酸鹽攝取,被認為是治療代謝性疾病一種方法[21-22]。檸檬酸鹽作為一種關(guān)鍵的調(diào)節(jié)代謝中間體,對整合糖酵解和脂質(zhì)合成過程極其重要,利用SLC13A5特異性抑制劑可以減少進入肝臟的檸檬酸鹽流量,進而治療代謝紊亂[23]。
圖8 不同物種SLC13蛋白系統(tǒng)發(fā)育樹Fig.8 SLC13 protein phylogenetic tree of different species
本研究利用生物信息學技術(shù)對牛SLC13家族蛋白的理化性質(zhì)、疏水性、二級結(jié)構(gòu)及三級結(jié)構(gòu)、保守基序、亞細胞定位、跨膜區(qū)、互作網(wǎng)絡(luò)以及進化關(guān)系進行預(yù)測和分析,結(jié)果表明:牛SLC13基因家族編碼的氨基酸數(shù)介于520~626個,亮氨酸含量最高,組氨酸含量最低,分子質(zhì)量介于57.80~68.96 ku,除SLC13A2外的4個蛋白質(zhì)均為穩(wěn)定蛋白,其編碼蛋白均為疏水性蛋白;牛SLC13蛋白的二級結(jié)構(gòu)主要由α-螺旋、β-轉(zhuǎn)角以及無規(guī)卷曲組成。組成蛋白質(zhì)的氨基酸的數(shù)量和性質(zhì)、蛋白質(zhì)二級以及更高級結(jié)構(gòu)決定其特性和功能,通過對蛋白質(zhì)理化性質(zhì)、二級和三級結(jié)構(gòu)進行預(yù)測分析利于對其結(jié)構(gòu)功能有更深了解[24]。檸檬酸鈉能有效抑制內(nèi)質(zhì)網(wǎng)應(yīng)激(Endoplasmic reticulum stress,ERS)[25],持續(xù)而強烈的ERS對內(nèi)質(zhì)網(wǎng)穩(wěn)態(tài)(Endoplasmic reticulum homoeostasis)有害,會導致細胞凋亡[26]。牛SLC13蛋白能調(diào)控檸檬酸鹽水平,該蛋白質(zhì)亞細胞定位于內(nèi)質(zhì)網(wǎng)。可見,牛SLC13蛋白對維持胞內(nèi)內(nèi)質(zhì)網(wǎng)穩(wěn)態(tài)、保持細胞正常生命活動具有一定作用。利用最大似然法對14個物種的SLC13蛋白進行聚類分析,發(fā)現(xiàn)普通牛與瘤牛、水牛、牦牛親緣關(guān)系相近,與雞親緣關(guān)系最遠。家牛屬(普通牛、瘤牛)、牦牛屬和水牛屬與野豬親緣關(guān)系相對較近,這與王玲玉[27]的研究結(jié)果一致。NaC與NaS是作用底物特性不同的2種蛋白質(zhì),14個物種的SLC13A1、SLC13A4蛋白處于同一個較大分支,而SLC13A2、SLC13A3和SLC13A5蛋白處于另一個較大分支。由此推測,NaC和NaS有著各自的進化機制,這一現(xiàn)象值得進一步探究。本研究綜合各種生物信息學軟件,使用生物信息學方法對牛SLC13蛋白分析的理化性質(zhì)、結(jié)構(gòu)和生物學特性進行分析,同時對其系統(tǒng)進化情況展開探討,可以為后續(xù)深入研究中SLC13基因家族參與的代謝疾病、胚胎發(fā)育等方面提供理論依據(jù)。