田新民 宋雅祺
摘 ?要:基于NCBI數(shù)據(jù)庫獲取馬鹿(Cervus elaphus)Cyt b基因序列,應(yīng)用生物信息學(xué)方法對馬鹿Cyt b基因編碼的蛋白質(zhì)進(jìn)行理化性質(zhì)、結(jié)構(gòu)和相關(guān)功能的預(yù)測分析,了解馬鹿mtDNA Cyt b基因的結(jié)構(gòu)、功能和表達(dá)特性.結(jié)果表明:馬鹿Cyt b編碼的蛋白質(zhì)為疏水性蛋白質(zhì),推測相互作用的蛋白質(zhì)包括LOC100524873,UQCRC1,UQCRQ,ND1,MT-ND2,COX1,COX2,COX3,ND4H和CYC,功能與電子運(yùn)輸、耦合質(zhì)子運(yùn)輸以及泛醌-細(xì)胞色素c還原酶活性有關(guān);二級(jí)結(jié)構(gòu)主要為無規(guī)則卷曲,有2個(gè)潛在的N-糖基化位點(diǎn)和34個(gè)磷酸化位點(diǎn),9個(gè)跨膜螺旋結(jié)構(gòu)域,定位于內(nèi)質(zhì)網(wǎng)和細(xì)胞質(zhì)膜;馬鹿與梅花鹿(Cervus nippon)的親緣關(guān)系較近.這對于馬鹿種質(zhì)鑒定分子標(biāo)記的篩選及其與梅花鹿的漸滲雜交具有理論意義.
關(guān)鍵詞:馬鹿;mtDNA Cyt b基因;生物信息學(xué)
[ ? 中圖分類號(hào) ? ?]Q332 [ ? ?文獻(xiàn)標(biāo)志碼 ? ] ?A
Bioinformatic Analysis of the mtDNA Cyt b Genes in Red Deer
TIAN Xinmin, SONG Yaqi
(College of Life Science and Technology, Mudanjiang Normal University, Mudanjiang 157011, China)
Abstract: Based on the NCBI database, the Cyt b gene sequence of red deer(Cervus elaphus) was obtained, and the physical and chemical properties, structure and related functions of the protein encoded by the Cyt b gene of red deer were predicted and analyzed using bioinformatics methods to understand the structure, function and expression characteristics of mtDNA Cyt b gene of red deer . The results showed that the proteins encoded by Cyt b in wapiti were hydrophobic proteins. It was speculated that the interacting proteins included LOC100524873, UQCRC1, UQCRQ, ND1, MT-ND2, COX1, COX2, COX3, ND4H and CYC. Their functions were related to electron transport, coupled proton transport and ubiquinone cytochrome c reductase activity; The secondary structure is mainly irregular curly, with 2 potential N-glycosylation sites, 34 phosphorylation sites, 9 transmembrane helical domains, located in the endoplasmic reticulum and the plasma membrane; Red deer and sika deer (Cervus nippon) are closely related. This is of theoretical significance for the screening of molecular markers for wapiti germplasm identification and its introgressive hybridization with sika deer.
Key words:Cervus elaphus; mtDNA Cyt b gene; bioinformatics
馬鹿(Cervus elaphus)屬于偶蹄目(Cetartiodactyla)、鹿科(Ceridae)、鹿屬(Cervus),在我國有8個(gè)亞種,主要分布于東北、西北、華北和西南等地區(qū),為國家II級(jí)重點(diǎn)保護(hù)野生動(dòng)物.[1]近年來,人類活動(dòng)的干擾使馬鹿棲息地破碎化加劇,種群數(shù)量下降,加劇了該物種的瀕危程度.[2-5]mtDNA中的Cyt b基因進(jìn)化速度比較適中,較小的基因片段包含很多遺傳進(jìn)化信息,保守區(qū)域和突變區(qū)域的存在使得Cyt b基因可以應(yīng)用于遺傳多樣性的研究.目前對Cyt b基因的研究集中于系統(tǒng)學(xué)和分類學(xué)等方面[6-8],對馬鹿Cyt b基因的研究很少.
本研究通過生物信息學(xué)方法,對馬鹿Cyt b基因編碼蛋白質(zhì)的理化性質(zhì)、二級(jí)結(jié)構(gòu)、三級(jí)結(jié)構(gòu)、信號(hào)肽的有無、跨膜結(jié)構(gòu)域、磷酸化位點(diǎn)、N-糖基化位點(diǎn)和亞細(xì)胞定位進(jìn)行預(yù)測,比對其與其他17個(gè)物種的序列同源性,判斷親緣關(guān)系.通過野豬Cyt b基因編碼蛋白質(zhì)推測其可能相互作用的蛋白質(zhì),以此研究馬鹿Cyt b基因編碼的蛋白質(zhì)的生物學(xué)功能,這對于更好地了解馬鹿Cyt b基因的功能和應(yīng)用方向、恢復(fù)馬鹿種群數(shù)量、維持馬鹿的遺傳多樣性以及馬鹿保護(hù)策略的制定等方面具有重要意義.
1 材料與方法
1.1 基因序列的獲取
在NCBI數(shù)據(jù)庫中查找并下載馬鹿Cyt b基因序列以及CDS編碼序列(Gene ID:1972167777).查找其他不同物種的Cyt b基因序列作為對照,最終下載以下18種動(dòng)物的mtDNA Cyt b基因序列,如表1所示.
1.2 分析方法
馬鹿Cyt b基因編碼蛋白質(zhì)的理化性質(zhì)分析 ?利用Protparam程序?qū)︸R鹿Cyt b基因編碼的蛋白質(zhì)的理化特性進(jìn)行預(yù)測和分析,包括氨基酸組成及個(gè)數(shù)、分子量、原子總數(shù)、分子式、正/負(fù)電荷殘基總數(shù)、理論等電點(diǎn)、消光系數(shù)、不穩(wěn)定指數(shù)、脂肪指數(shù)、親水性平均系數(shù)和酸堿性等.
馬鹿Cyt b基因編碼的蛋白質(zhì)的親/疏水性分析 ?基于Protscale軟件的Hphob./Kyte&Doolittle算法對馬鹿Cyt b基因編碼的蛋白質(zhì)每個(gè)位點(diǎn)的親/疏水性進(jìn)行計(jì)算和分析,推斷蛋白質(zhì)的親/疏水性.
馬鹿Cyt b基因編碼蛋白質(zhì)的二級(jí)結(jié)構(gòu)和三級(jí)結(jié)構(gòu)預(yù)測分析 ?基于SOPMA程序?qū)︸R鹿Cyt b基因編碼的蛋白質(zhì)的二級(jí)結(jié)構(gòu)進(jìn)行預(yù)測分析,預(yù)測其二級(jí)結(jié)構(gòu)的主要形式;基于SOPMA-MODEL程序?qū)︸R鹿Cyt b基因編碼的蛋白質(zhì)三級(jí)結(jié)構(gòu)進(jìn)行預(yù)測分析、建模、質(zhì)量評(píng)估.
馬鹿Cyt b基因編碼蛋白質(zhì)的N-糖基化位點(diǎn)預(yù)測分析 ?基于NetNGlyc-1.0程序?qū)︸R鹿Cyt b基因編碼蛋白質(zhì)的N-糖基化位點(diǎn)進(jìn)行預(yù)測分析.
馬鹿Cyt b基因編碼蛋白質(zhì)的信號(hào)肽和跨膜結(jié)構(gòu)域預(yù)測分析 ?基于SignalP-5.0程序?qū)︸R鹿Cyt b基因編碼蛋白質(zhì)的信號(hào)肽進(jìn)行預(yù)測分析,并基于TMHMM-2.0程序?qū)︸R鹿Cyt b基因編碼蛋白質(zhì)的跨膜結(jié)構(gòu)域進(jìn)行進(jìn)一步預(yù)測分析,推測其蛋白類型.
馬鹿Cyt b基因編碼蛋白質(zhì)的磷酸化位點(diǎn)預(yù)測分析 ?基于NetPhos-3.1程序?qū)︸R鹿Cyt b基因編碼蛋白質(zhì)的磷酸化位點(diǎn)進(jìn)行預(yù)測分析,并計(jì)算絲氨酸、蘇氨酸和酪氨酸的磷酸化位點(diǎn)個(gè)數(shù).
馬鹿Cyt b基因序列同源性分析 ?將馬鹿Cyt b基因序列與其他17個(gè)物種進(jìn)行系統(tǒng)發(fā)育分析,利用軟件MEGA7.0對數(shù)據(jù)進(jìn)行分析,并采用鄰接法(Neighbor Joining,NJ)構(gòu)建系統(tǒng)發(fā)育樹.
馬鹿Cyt b基因編碼蛋白質(zhì)的相互作用蛋白質(zhì)的預(yù)測分析 ?基于STRING程序?qū)σ柏iCyt b基因編碼蛋白質(zhì)的相互作用的蛋白質(zhì)進(jìn)行預(yù)測分析,推測與馬鹿Cyt b基因編碼蛋白質(zhì)的相互作用蛋白質(zhì).
馬鹿Cyt b基因編碼蛋白質(zhì)的亞細(xì)胞定位分析 ?基于SPOST II程序?qū)︸R鹿Cyt b基因編碼蛋白質(zhì)的亞細(xì)胞定位進(jìn)行預(yù)測分析,預(yù)測該蛋白發(fā)揮作用的位置.
馬鹿Cyt b基因編碼蛋白質(zhì)的生物信息學(xué)分析軟件及網(wǎng)站見表2.
2 結(jié)果與分析
2.1 馬鹿Cyt b基因編碼蛋白質(zhì)的理化性質(zhì)分析
馬鹿Cyt b基因編碼蛋白質(zhì)為堿性蛋白質(zhì),不穩(wěn)定指數(shù)(instability index,Ⅱ)小于40,表明馬鹿Cyt b基因編碼的蛋白質(zhì)屬于穩(wěn)定蛋白,該蛋白不容易降解或變性.該蛋白中異亮氨酸(Ile)占比最高,為15%,其次為亮氨酸(Leu),為9.8%(圖1).親水性平均系數(shù)大于0,表明其為疏水性蛋白.結(jié)果見表3.
2.2 馬鹿Cyt b基因編碼蛋白質(zhì)的親/疏水性分析
在第236位氨基酸位點(diǎn)處存在最大親水性值3.600,在第205位氨基酸位點(diǎn)存在最小親水性值-1.989.如圖2所示,橫坐標(biāo)代表氨基酸的序列,縱坐標(biāo)代表親疏水系數(shù),大于零部分多于50%為疏水性蛋白質(zhì),小于零部分多于50%為親水性蛋白質(zhì).結(jié)果表明,該蛋白質(zhì)中親水性氨基酸的總分低于疏水性氨基酸,該蛋白質(zhì)為疏水性蛋白質(zhì),與親水性平均系數(shù)結(jié)果相同.
2.3 馬鹿Cyt b基因編碼蛋白質(zhì)的二級(jí)結(jié)構(gòu)和三級(jí)結(jié)構(gòu)預(yù)測分析
馬鹿Cyt b基因編碼蛋白質(zhì)的二級(jí)結(jié)構(gòu)預(yù)測分析結(jié)果見圖3.圖中c代表無規(guī)則卷曲,h代表α-螺旋,e指的是延伸.該蛋白質(zhì)中98個(gè)氨基酸可能參與形成α-螺旋(Hh),占比25.86%,109個(gè)氨基酸可能參與形成延伸鏈(Ee),占比28.76%;172個(gè)氨基酸可能參與形成無規(guī)則卷曲(Cc),占比45.38%,沒有β-轉(zhuǎn)角(Tt)結(jié)構(gòu).表明該蛋白質(zhì)二級(jí)結(jié)構(gòu)有序,能夠正常發(fā)揮其功能.
通過SWISS-MODEL程序,預(yù)測馬鹿mtDNA Cyt b基因編碼蛋白質(zhì)的三級(jí)結(jié)構(gòu).結(jié)果如圖4所示,馬鹿Cyt b基因編碼蛋白質(zhì)的序列與數(shù)據(jù)庫中6haw.1.C模板的序列一致性為92.06%,GMQE值為0.86,QMEAN值為-2.55,建模結(jié)果可靠,表明蛋白質(zhì)的主要構(gòu)件無規(guī)則卷曲、延伸鏈和螺旋,與預(yù)測的二級(jí)結(jié)構(gòu)結(jié)果一致.
2.4 N-糖基化位點(diǎn)預(yù)測分析
應(yīng)用NetNGlyc 1.0 Server程序預(yù)測馬鹿Cyt b基因編碼蛋白質(zhì)的N-糖基化位點(diǎn),結(jié)果如圖5所示.該蛋白質(zhì)中有兩個(gè)N-糖基化位點(diǎn),分別為26NISS和255NYTP.
2.5 馬鹿Cyt b基因編碼蛋白質(zhì)的信號(hào)肽和跨膜結(jié)構(gòu)域預(yù)測分析
利用SignalP-5.0預(yù)測分析馬鹿Cyt b基因編碼的蛋白質(zhì)的信號(hào)肽,信號(hào)肽對于定位到特定的細(xì)胞器上起著重要作用.結(jié)果如圖6所示,顯示該蛋白質(zhì)有信號(hào)肽的概率為0.000 4,推測該蛋白質(zhì)沒有信號(hào)肽,為其他類型蛋白質(zhì).為了進(jìn)一步驗(yàn)證馬鹿Cyt b基因編碼蛋白質(zhì)的類型,應(yīng)用TMHMM程序預(yù)測分析其跨膜結(jié)構(gòu)域.馬鹿Cyt b蛋白質(zhì)跨膜區(qū)域結(jié)構(gòu)的預(yù)測結(jié)果如圖7所示,存在9個(gè)跨膜螺旋結(jié)構(gòu).由此推測,馬鹿Cyt b基因編碼蛋白質(zhì)為跨膜蛋白,表明其可能是定位于膜上的錨定蛋白質(zhì)或離子通道蛋白質(zhì),也可能作為膜受體起作用.
2.6 馬鹿Cyt b基因編碼蛋白質(zhì)的磷酸化位點(diǎn)預(yù)測分析
磷酸化多數(shù)情況下是發(fā)生在絲氨酸(Serine,Ser)、蘇氨酸(Threonine,Thr)和酪氨酸(Tyrosine,Tyr)等氨基酸的殘基上.馬鹿Cyt b基因編碼蛋白質(zhì)的磷酸化位點(diǎn)預(yù)測結(jié)果顯示,該基因的編碼蛋白質(zhì)可能存在34個(gè)磷酸化位點(diǎn),其中包括絲氨酸(S)14個(gè)、蘇氨酸(T)14個(gè)和酪氨酸(Y)6個(gè).表明該蛋白質(zhì)可以被激酶磷酸化,從而對其功能進(jìn)行調(diào)控.
2.7 馬鹿Cyt b基因序列的同源性
軟件MEGA7.0對基因序列數(shù)據(jù)進(jìn)行比對,與這17個(gè)物種的對比中,馬鹿與梅花鹿的親緣關(guān)系最近,與坡鹿的親緣關(guān)系次之,與東北刺猬和駝背海馬的親緣關(guān)系較遠(yuǎn).如圖8所示,說明馬鹿與梅花鹿的Cyt b基因可能具有相同的功能,可為馬鹿與梅花鹿的漸滲雜交提供理論基礎(chǔ).
2.8 與Cyt b基因編碼蛋白質(zhì)相互作用蛋白質(zhì)預(yù)測
細(xì)胞中的蛋白質(zhì)通過與其他蛋白質(zhì)的相互作用完成生理功能,不同物種蛋白質(zhì)的空間結(jié)構(gòu)會(huì)略有差異,但其功能相似.[9, 10]通過STRING數(shù)據(jù)庫,使用野豬的Cyt b基因編碼的蛋白質(zhì)推測與馬鹿Cyt b蛋白相互作用的蛋白質(zhì),并計(jì)算相互作用綜合得分.Cyt b蛋白質(zhì)與LOC100524873,UQCRC1,UQCRQ,ND1,MT-ND2,COX1,COX2,COX3,ND4,CYC的相互作用較強(qiáng),相互作用得分均為0.999.由此推測,馬鹿Cyt b蛋白與電子傳輸、耦合質(zhì)子傳輸、泛醇-細(xì)胞色素c還原酶活性、線粒體呼吸鏈復(fù)合物III等功能相關(guān).
2.9 亞細(xì)胞定位
亞細(xì)胞定位是查找某種蛋白質(zhì)或某個(gè)基因表達(dá)產(chǎn)物在細(xì)胞內(nèi)的具體存在部位,對蛋白質(zhì)的亞細(xì)胞定位分析有助于蛋白質(zhì)功能的初步判斷,基于PSORT II預(yù)測馬鹿Cyt b基因編碼的蛋白質(zhì)在亞細(xì)胞中的定位.結(jié)果顯示,定位于內(nèi)質(zhì)網(wǎng)中的比例為55.6%,定位于細(xì)胞質(zhì)膜的比例為44.4%.
3 小結(jié)與討論
Cyt b位于mtDNA中,是編碼線粒體內(nèi)膜上Cyt b氧化酶基因的一個(gè)亞基,也是組成電子傳遞鏈的重要媒介.[11, 12]Cyt b由于其結(jié)構(gòu)保守、進(jìn)化速度快、擴(kuò)增難度小等諸多特點(diǎn),被廣泛應(yīng)用于評(píng)價(jià)物種遺傳多樣性、遺傳變異和系統(tǒng)發(fā)育分析等方面.[13]在對不同物種的系統(tǒng)發(fā)育分析中,馬鹿與梅花鹿的親緣關(guān)系較近,與駝背海馬的親緣關(guān)系較遠(yuǎn),對于馬鹿和梅花鹿的漸滲雜交提供了理論基礎(chǔ).
本次選用了馬鹿Cyt b基因進(jìn)行分析,研究結(jié)果表明,馬鹿的Cyt b基因長1 140 bp,共編碼氨基酸379個(gè),理論等電點(diǎn)為7.17,含量最多的氨基酸是異亮氨酸,屬于穩(wěn)定的疏水蛋白,這提示其是一類具有強(qiáng)表面活性的分泌型小分子量蛋白質(zhì).筆者發(fā)現(xiàn),馬鹿Cyt b蛋白質(zhì)有2個(gè)潛在的N-糖基化位點(diǎn),具有32個(gè)磷酸化位點(diǎn),磷酸化是蛋白質(zhì)翻譯后修飾中最為廣泛的共價(jià)修飾,對蛋白質(zhì)功能的正常發(fā)揮起著調(diào)節(jié)作用.馬鹿Cyt b基因編碼蛋白質(zhì)沒有信號(hào)肽,有9個(gè)跨膜結(jié)構(gòu),表明馬鹿Cyt b基因編碼蛋白質(zhì)是跨膜蛋白質(zhì),可以傳遞離子,并通過細(xì)胞膜來維持化學(xué)環(huán)境.馬鹿Cyt b基因編碼蛋白質(zhì)的二級(jí)結(jié)構(gòu)主要是不規(guī)則卷曲,亞細(xì)胞定位顯示在內(nèi)質(zhì)網(wǎng)和細(xì)胞質(zhì)膜發(fā)揮生物學(xué)功能.馬鹿Cyt b基因編碼蛋白質(zhì)的絲氨酸和蘇氨酸磷酸化位點(diǎn)較多,表明此蛋白質(zhì)的酶活力較強(qiáng).通過預(yù)測野豬Cyt b蛋白質(zhì)的相互作用蛋白質(zhì),發(fā)現(xiàn)與LOC100524873,UQCRC1,UQCRQ,ND1,MT-ND2,COX1,COX2,COX3,ND4,CYC的相互作用較強(qiáng),由此推測馬鹿Cyt b蛋白質(zhì)與電子傳輸、耦合質(zhì)子傳輸、泛醇-細(xì)胞色素c還原酶活性、線粒體呼吸鏈復(fù)合物III等功能相關(guān).本文初步預(yù)測分析了馬鹿Cyt b的結(jié)構(gòu)和功能,為馬鹿Cyt b基因功能深入研究、基因的相對表達(dá)和應(yīng)用方向的挖掘提供了理論基礎(chǔ),對恢復(fù)馬鹿種群數(shù)量以及保護(hù)策略的制定具有重要意義.
參考文獻(xiàn)
[1]秦瑜, 張明海. 中國馬鹿的研究現(xiàn)狀及展望[J]. 野生動(dòng)物, 2009,30(2): 100-104.
[2]艾尼瓦爾·吐米爾, 董曉宇, 馬合木提·哈力克. 中國馬鹿(Cervus elaphus)新疆三個(gè)亞種的研究現(xiàn)狀及展望[J]. 新疆農(nóng)業(yè)科學(xué), 2008, 45(3): 504-510.
[3]張書理, 王志玲, 張鵬, 等. 內(nèi)蒙古赤峰市野生馬鹿種群資源現(xiàn)狀研究[J]. 四川動(dòng)物, 2009, 28(5): 772-776.
[4]姚丹陽. 河北塞罕壩保護(hù)區(qū)馬鹿初步調(diào)查及保護(hù)對策[J]. 安徽農(nóng)學(xué)通報(bào), 2016, 22(24): 34+39.
[5]Shokri S, Jafari A, Rabei K, et al. Conserving populations at the edge of their geographic range: the endangered Caspian red deer (Cervus elaphus maral) across protected areas of Iran[J]. Biodiversity and Conservation, 2021, 30(1): 85-105.
[6]Liu Y H, Zhang M H, Ma J Z. Phylogeography of red deer (Cervus elaphus) in China based on mtDNA Cytochrome b gene[J]. Research Journal of Biotechnology, 2013, 8(10): 34-41.
[7]張麗, 滾雙寶, 雷天云, 等. 應(yīng)用mtDNA Cyt b基因全序列分析中國5個(gè)馬鹿群體的遺傳多樣性和系統(tǒng)發(fā)育[J]. 華北農(nóng)學(xué)報(bào), 2010, 25(4): 12-16.
[8]Borowski Z, Swisocka M S, Matosiuk M, et al. Purifying selection, density blocking and unnoticed mitochondrial DNA diversity in the red deer, Cervus elaphus[J]. PLoS One, 2016, 11(9): e0163191.
[9]宋寶興, 桑青, 王芬, 等. 基于蛋白質(zhì)相互作用網(wǎng)絡(luò)挖掘物種內(nèi)的功能相似蛋白質(zhì)[J]. 生物物理學(xué)報(bào), 2011, 27(9): 789-800.
[10]劉淑娟. 根據(jù)細(xì)胞色素b基因的序列變異分析脊椎動(dòng)物的進(jìn)化關(guān)系[J]. 山東農(nóng)業(yè)大學(xué)學(xué)報(bào): 自然科學(xué)版, 2006, 37(3): 392-396.
[11]辛翠娜, 彭建軍, 王瑩, 等. Cyt b分子標(biāo)記技術(shù)在物種鑒定中的應(yīng)用[J]. 野生動(dòng)物, 2009, 30(4): 217-221.
[12]于瀅. 對線粒體的再認(rèn)識(shí)[J]. 牡丹江師范學(xué)院學(xué)報(bào): 自然科學(xué)版, 2016(1): 63-66.
[13]孫玉友. 利用SRAP分子標(biāo)記分析栽培稻的遺傳多樣性[J]. 牡丹江師范學(xué)院學(xué)報(bào): 自然科學(xué)版, 2012(1): 24-26.
編輯:琳莉