劉小輝,李祥龍,2* ,周榮艷,李蘭會(huì),張 天,王建濤
(1.河北農(nóng)業(yè)大學(xué) 動(dòng)物科技學(xué)院,河北 保定 071001;2. 河北科技師范學(xué)院 動(dòng)物科技學(xué)院,河北 秦皇島 066000;3.唐山市畜牧工作站,河北 唐山 063004)
Dock7是毛色相關(guān)基因,已經(jīng)被克隆,具有色素減退作用且對(duì)發(fā)育具有重要作用,在小鼠的腹部、爪子、尾部缺少色素而使局部出現(xiàn)白色,但是在體外培養(yǎng)的黑色素細(xì)胞出現(xiàn)色素沉著過(guò)度[1]。Dock7基因在多種組織中表達(dá),作為一種鳥苷酸交換因子,通過(guò)催化結(jié)合GDP與自由GTP之間的交換特異激活Rac1和Rac3,鳥嘌呤核苷酸交換因子參與將跨膜受體和細(xì)胞內(nèi)GTPase家族成員聯(lián)系起來(lái)的信號(hào)通路,從而調(diào)控許多細(xì)胞作用,如細(xì)胞增殖分化黏附凋亡等[2],研究證實(shí),Rac1在細(xì)胞的遷移黏附等方面發(fā)揮重要作用[3]。由于替換與剪切使得Dock基因存在多種亞型,本文利用比較基因組學(xué)和生物信息學(xué)方法研究了Dock7 基因編碼區(qū)種間和種內(nèi)變異,從而探明該基因在不同種間及種內(nèi)的遺傳分化,進(jìn)而為相關(guān)黑色素基因的遺傳學(xué)和進(jìn)化分析奠定基礎(chǔ)。
從NCBI 網(wǎng)站http://www.ncbi.nlm.nih.gov/的GenBank 中下載人、倭黑猩猩、大猩猩、毛猩猩、東非狒狒、玻利維亞的灰鼠猴子、虎鯨、家馬、白犀牛、雪貂、家牛、大熊貓、佛羅里達(dá)海牛、海象、歐洲兔、家貓、家綿羊、星鼻鼴鼠、北美鼠兔、裸鼢鼠、非洲跳鼠、八齒鼠、褐家鼠、小家鼠、袋獾、原雞、爪蟾27個(gè)物種68條Dock7 基因的CDS序列,68個(gè)基因序列的登錄號(hào)見表1。
將序列下載后,首先利用BioEdit軟件對(duì)下載的27個(gè)物種的68條Dock7 基因CDS 序列進(jìn)行比對(duì)分析,選取所有序列共有片段(長(zhǎng)度為4 551 bp )進(jìn)行比較,然后利用DnaSP 5.10軟件對(duì)其進(jìn)行遺傳多態(tài)性分析,生成單倍型,得出平均核苷酸差異數(shù)(k)、核苷酸歧異度(Dxy)、遺傳分化指數(shù)(Gst)、凈遺傳距離(Da)、密碼子偏愛性和同義替換位點(diǎn)數(shù)(SS)、非同義替換位點(diǎn)數(shù)(NSS)、G+C含量。利用MEGA4.0軟件的UPGMA方法構(gòu)建聚類圖,進(jìn)行聚類分析。再利用SignalP 4.1 Server, TMHMM 2.0 Server, ProtScale,ProtParam在線工具對(duì) Dock7 氨基酸序列進(jìn)行預(yù)測(cè)與分析。
表1 不同物種的Dock7 基因序列來(lái)源Table 1 The source of sequences for Dock7 gene in different species
2.1.1 多態(tài)位點(diǎn)、單倍型及核苷酸多樣性分析 所研究的27個(gè)物種中,人包含6條序列,虎鯨7條,白犀牛4條,雪貂6條,佛羅里達(dá)海牛7條,星鼻鼴鼠5條,裸鼢鼠3條,非洲跳鼠3條,八齒鼠2條,原雞2條,爪蟾7條,其他各為一條,共68條序列。
所分析片段長(zhǎng)度為4 551 bp,發(fā)現(xiàn)1855個(gè)多態(tài)位點(diǎn),百分率為40.76% ,其中單一多態(tài)位點(diǎn)163個(gè),百分率為3.58%,簡(jiǎn)約多態(tài)位點(diǎn)1692 個(gè), 百分率為37.18%,27個(gè)物種平均核苷酸差異數(shù)(k)為472.076,核苷酸多樣性為0.10373。27個(gè)物種中共發(fā)現(xiàn)28種單倍型,單倍型的多樣性為0.949,說(shuō)明Dock7基因種間變異程度較大。Dock7基因在種內(nèi)變異很小,只在原雞中發(fā)現(xiàn)一個(gè)多態(tài)位點(diǎn)。
2.1.2 核苷酸歧異度、遺傳分化和凈遺傳距離 27個(gè)物種Dock7基因遺傳分化(Gst)在0.333~1.000之間(表2),核苷酸歧異度(Dxy)和凈遺傳距離(Da)都在0.042~0.223之間。不同物種間核苷酸歧異度和凈遺傳距離的變化范圍均很大,原雞、爪蟾與其他26個(gè)物種間遺傳分化明顯?;ⅥL和白犀牛、雪貂、人的核苷酸歧異度、凈遺傳距離最小,爪蟾與其它物種間的核苷酸歧異度、凈遺傳距離最大,根據(jù)不同物種間的核苷酸歧異度(Dxy),用MEGA4.0軟件的UPGMA方法進(jìn)行聚類分析,構(gòu)建不同物種分子聚類圖(圖1),由聚類圖與表中數(shù)據(jù)(表2)說(shuō)明,虎鯨和白犀牛、雪貂、人之間Dock7基因遺傳分化較小,爪蟾與本研究中其他物種間遺傳分化較大。
2.2.1 密碼子偏愛性 有效密碼子數(shù)(Effective Number of Codon, ENC)是一個(gè)基因密碼子的使用頻率與同義密碼子的平均使用頻率偏差的量化值,其范圍在20(每個(gè)氨基酸只使用一個(gè)密碼子的極端情況)到61(各個(gè)密碼子均被平均使用)之間, 該數(shù)值越靠近20表明偏好性越強(qiáng),表達(dá)水平也越高,越靠近61表示偏好性越弱,表達(dá)程度越低[4]。密碼子偏好性指數(shù)CBI 值反映了基因中高表達(dá)偏好密碼子的組成情況, 也能反映偏好性和表達(dá)水平的程度[5]。Bennetzen等[6]和Comeron等[7]報(bào)道,密碼子偏愛指數(shù)的值在0~1間變動(dòng), 如果密碼子偏愛指數(shù)的值為0 ,則說(shuō)明同義密碼子被均勻使用, 這個(gè)值越大, 則說(shuō)明密碼子使用偏愛情況越嚴(yán)重。所選不同物種Dock7 基因序列編碼區(qū)中密碼子有效值(ENC)為50.496,靠近各個(gè)密碼子均被平均使用的最大值61,偏愛指標(biāo)(CBI)為0.220,表明Dock7基因密碼子偏愛性較均一, 各密碼子在編碼氨基酸時(shí)出現(xiàn)的頻率較一致。
圖1 根據(jù)物種間的核苷酸歧異度構(gòu)建的聚類圖Fig.1 Phylogenetic tree based on genetic differentiation of species
表2 不同物種核苷酸歧異度和遺傳分化Table 2 Nucleotides diversity and genetic differentiation in different species
注:上三角為遺傳分化(Gst);下三角為核苷酸歧異度(Dxy)和凈遺傳距離(Da) (括號(hào)內(nèi))。
Note: Upper triangular is genetic differentiation(Gst); Lower triangular is nucleotide divergence(Dxy)and net genetic distance(Da) (in brackets).
2.2.2 同義替換和非同義替換 27個(gè)物種68條Dock7基因序列編碼區(qū)中同義替換平均位點(diǎn)數(shù)為963.73個(gè),非同義替換平均位點(diǎn)數(shù)為3584.27個(gè)。不同物種同義替換位點(diǎn)數(shù)(SS)為945.17~1013.83 (表3),同義替換核苷酸多樣性均值(π(s))為0.02612;非同義替換位點(diǎn)數(shù)(NSS)為3534.17~3602.83,非同義替換核苷酸多樣性均值(π(a))為0.12473。本研究中發(fā)現(xiàn),27個(gè)物種Dock7基因的非同義替換位點(diǎn)數(shù)均明顯高于同義替換位點(diǎn)數(shù),佛羅里達(dá)海牛的非同義替換位點(diǎn)數(shù)較其它物種多,其次是星鼻鼴鼠、虎鯨,說(shuō)明佛羅里達(dá)海牛Dock7基因編碼區(qū)的非同義替換較其它物種高,星鼻鼴鼠、虎鯨分別為第二、第三。由于達(dá)爾文的正向選擇有些基因中非同義替代速率遠(yuǎn)遠(yuǎn)高于同義替代[8],因此推測(cè)本研究27個(gè)物種Dock7基因在進(jìn)化過(guò)程中可能受到了正向選擇的影響。
表3 不同物種Dock7基因同義替換和非同義替換Table 3 Synonymous and nonsynonymous substitution of Dock7 gene in different species
2.2.3 氨基酸序列的組成成分及理化性質(zhì)分析 用ProtParam在線工具分析27個(gè)物種Dock7基因編碼的氨基酸序列,對(duì)蛋白質(zhì)的各種理化性質(zhì)進(jìn)行預(yù)測(cè),結(jié)果表明,大約含有2100個(gè)氨基酸殘基,分子量約為238 kD,理論等電點(diǎn)均低于7.00,說(shuō)明該蛋白呈酸性,27個(gè)物種Dock7蛋白的不穩(wěn)定系數(shù)在49.73~54.17之間,表明這種蛋白質(zhì)不穩(wěn)定[9],脂肪系數(shù)在84.23~87.32之間,疏水性評(píng)估系數(shù)在-0.383 ~-0.305之間,在所有分析的物種中相對(duì)含量較多的氨基酸為L(zhǎng)eu,含量在10.7%~11.3%之間;其次是Ser,含量在8.8%~10.0%之間;再次是Glu,含量在6.8%~7.3%之間,其中27個(gè)物種總氨基酸中負(fù)電荷殘基總數(shù)約為262和正電荷殘基總數(shù)約為244。
2.2.4 信號(hào)肽的預(yù)測(cè)與分析 一般認(rèn)為,每一個(gè)需要運(yùn)輸?shù)亩嚯亩己幸欢伟被嵝蛄?稱為信號(hào)肽序列(signal peptide,SP),引導(dǎo)多肽至不同的轉(zhuǎn)運(yùn)系統(tǒng)[10]。信號(hào)肽幫助蛋白質(zhì)穿膜,與蛋白質(zhì)的細(xì)胞定位有關(guān),通過(guò)分析蛋白序列N端信號(hào)肽的有無(wú),可以初步判斷某個(gè)蛋白是否為分泌蛋白[11,16]。利用蛋白分析專家EXPASY工具里的SignalP 4.1 Server[12]對(duì)27個(gè)物種Dock7氨基酸序列進(jìn)行預(yù)測(cè),結(jié)果只在原雞Dock7氨基酸序列中發(fā)現(xiàn)一段信號(hào)肽信號(hào),位于原雞氨基酸序列第1~23位氨基酸位置,其存在的可能性為0.475,在第23和24位氨基酸之間存在一個(gè)信號(hào)肽切割位點(diǎn)(圖2),剪切位點(diǎn)(C-score)最高在第24個(gè)氨基酸位置,分值為0.206,綜合剪切點(diǎn)分值(Y-score)在第24個(gè)氨基酸處最大,分值為0.344,信號(hào)肽分值(S-score)最大在第1個(gè)氨基酸位置,為0.808,第1~23個(gè)氨基酸的平均S-score為0.585,其他26個(gè)物種的Dock7基因的氨基酸序列均無(wú)信號(hào)肽。
家雞是人類馴化較早的家禽,人類重要的食物來(lái)源,與人類文化生活密切相關(guān),原雞與家雞有一定的親緣關(guān)系,有學(xué)者認(rèn)為家雞極有可能起源于紅色原雞中的部分亞種[13],王文等人[14]和Liu等人[15]對(duì)原雞和家雞線粒體DNA部分序列進(jìn)行多態(tài)分析, 認(rèn)為家雞可能起源于不同的原雞亞群體,原雞的Dock7基因的氨基酸序列有信號(hào)肽,因此通過(guò)對(duì)家雞的氨基酸是否具有信號(hào)肽及信號(hào)肽的具體功能的進(jìn)一步研究,為家雞的遺傳育種和開發(fā)利用提供參考。
圖2 原雞Dock7蛋白信號(hào)肽分析Fig.2 Signal peptide analysis of Dock7 protein in Gallus
2.2.5 跨膜結(jié)構(gòu)域的預(yù)測(cè)和分析 跨膜結(jié)構(gòu)域常常是由跨膜蛋白的效應(yīng)區(qū)域所展現(xiàn),一般由20個(gè)左右的疏水性氨基酸殘基組成,主要形成α-螺旋[16]。分泌蛋白和膜蛋白都含有信號(hào)肽序列, 所不同的是分泌蛋白在信號(hào)肽之外不再有疏水的跨膜區(qū),而膜蛋白在信號(hào)肽之外還有一個(gè)以上的疏水跨膜區(qū)[17]。利用在線工具TMHMM 2.0 Server[18]對(duì)27個(gè)物種Dock7 氨基酸序列的跨膜結(jié)構(gòu)域進(jìn)行預(yù)測(cè),結(jié)果顯示本研究中27個(gè)物種的 Dock7 氨基酸序列均不存在跨膜結(jié)構(gòu)域,整條肽鏈位于細(xì)胞外,結(jié)合信號(hào)肽的預(yù)測(cè),說(shuō)明原雞的Dock7蛋白屬于分泌蛋白,其他26個(gè)物種的Dock7蛋白不屬于膜蛋白或分泌蛋白,可以推測(cè)出,原雞的Dock7蛋白可能存在轉(zhuǎn)運(yùn),其他26個(gè)物種的Dock7基因在游離核糖體上起始合成后可能不存在轉(zhuǎn)運(yùn),而是繼續(xù)留在細(xì)胞質(zhì)中行使功能。
2.2.6 疏水性/親水性的預(yù)測(cè)和分析 疏水性和親水性分析對(duì)于預(yù)測(cè)蛋白質(zhì)的二級(jí)結(jié)構(gòu)和功能域具有重要的生物學(xué)意義。疏水性的氨基酸傾向于遠(yuǎn)離周圍水分子,親水氨基酸通常處于蛋白質(zhì)分子的表面[19]。利用在線工具 ProtScale[20]對(duì)27個(gè)物種Dock7 氨基酸序列的疏水性/親水性進(jìn)行預(yù)測(cè),結(jié)果顯示本研究27個(gè)物種的Dock7氨基酸序列最低分值為-4.500,親水性最強(qiáng);最高分值為4.500,疏水性最強(qiáng)??傮w上看,親水區(qū)域大于疏水區(qū)域,故整條多肽鏈表現(xiàn)為親水性,因此認(rèn)為Dock7蛋白是親水性蛋白,處于蛋白質(zhì)分子的表面。
2.2.7 二級(jí)結(jié)構(gòu)的預(yù)測(cè)和分析 蛋白質(zhì)二級(jí)結(jié)構(gòu)是指蛋白質(zhì)分子中多肽鏈本身的折疊方式,蛋白質(zhì)分子的多肽鏈一般是部分卷曲盤旋成螺旋狀(α-螺旋結(jié)構(gòu)),或折疊成片層狀(β-折疊結(jié)構(gòu)),或以不規(guī)則卷曲結(jié)構(gòu)存在于生物體內(nèi)[21]。用 PBIL LYON-GERLAND 信息庫(kù)對(duì)27個(gè)物種Dock7 氨基酸序列的二級(jí)結(jié)構(gòu)進(jìn)行預(yù)測(cè),結(jié)果顯示本研究中27個(gè)物種的Dock7 蛋白質(zhì)二級(jí)結(jié)構(gòu)的主要結(jié)構(gòu)元件是自由卷曲(42.16%~46.50%),其次是α-螺旋(41.35%~45.37%)、伸展片段(11.26%~13.17%)。
對(duì)27個(gè)物種Dock7基因核苷酸分析,說(shuō)明Dock7基因種間變異程度較大,種內(nèi)變異很小,只在原雞中發(fā)現(xiàn)一個(gè)多態(tài)位點(diǎn);對(duì)27個(gè)物種Dock7基因氨基酸分析,結(jié)果只在原雞Dock7基因的氨基酸序列中發(fā)現(xiàn)一段信號(hào)肽信號(hào),其他26個(gè)物種的Dock7基因的氨基酸序列無(wú)信號(hào)肽。27個(gè)物種均無(wú)跨膜結(jié)構(gòu)域,整條肽鏈位于細(xì)胞外,說(shuō)明原雞的Dock7蛋白屬于分泌蛋白,其他26個(gè)物種的Dock7蛋白不屬于膜蛋白或分泌蛋白。
參考文獻(xiàn):
[1] Montoliu L, Oetting W S, Bennett D C. European Society for Pigment Cell Research[J]. World Wide Web,2012,25(1):37-46.
[2] 高一萌, 張 瑜, 李文燕,等.C3G/Rap1和Dock180/Rac1信號(hào)通路在卵巢癌浸潤(rùn)中的作用[J].第三軍醫(yī)大學(xué)學(xué)報(bào),2012,34(11):1 031-1 034.
[3] Wittchen E S, van-Buul J D, Burridge K, et al. Trading spaces: Rap, Rac, and Rho as architects of transendothelial migration[J].Curr Opin Hematol ,2005,12(1):14-21.
[4] Wright F. The effective number of codon s' used in a gene[J].Gene,1990,87: 23-29.
[5] Morton B R. Chloroplast DNA codon use: evidence for selection at the psb A locus based on tRNA availability[J].J Mol Evol,1993, 37: 273-280.
[6] Bennetzen J L , Hall B D . Codon selection in yeast [J].J Biol Chem,1982,257(6): 3 026-3 031.
[7] Comeron J M, Aguadm. An evaluation of measures of synonymous codon usage bias[J].J Mol Evol,1998, 47(3): 268-274.
[8] 李 易.基因進(jìn)化的同義與非同義替代計(jì)算及統(tǒng)計(jì)檢驗(yàn)的比較分析[J].曲靖師范學(xué)院學(xué)報(bào),2006,25(6):1-8.
[9] 張雨良,張智俊,楊峰山,等.新疆鹽生植物車前PmNHXl 基因的克隆及生物信息學(xué)分析[J].中國(guó)生物工程,2009,29(1):27-33.
[10] 彭佳師, 龔繼明. 信號(hào)肽與蛋白質(zhì)的分選轉(zhuǎn)運(yùn)[J].植物生理學(xué)報(bào),2011, 47 (1): 9-17.
[11] 孫翰昌,楊 帆,徐敬明,等.草魚含信號(hào)肽分泌蛋白的預(yù)測(cè)分析[J].水產(chǎn)科學(xué),2001,30(3):164-167.
[12] Bendtsen J D,Nielsen H, Heijne G V, et al. Improved prediction of signal peptides: SingalP 3.0[J].Mol Biol, 2004,340(4):783-795.
[13] 劉長(zhǎng)國(guó), 張先福,陳良青,等.家雞起源研究進(jìn)展[J].中國(guó)家禽,2008,30(3):31-34.
[14] Liu Y P, Wu G S, Yao Y G, et al. Multiple maternal origins of chickens: out of the Asian jungles[J]. Mol Phylogenet Evol, 2006, 38:12-19.
[15] 王 文,蘭 宏, 劉愛華,等. 家雞和原雞的線粒體 DNA 多態(tài)性比較[J].動(dòng)物學(xué)研究, 1994, 15(4): 45-61.
[16] 董 嬌,周 軍,辛培堯,等.不同植物L(fēng)DOX/ANS基因的生物信息學(xué)分析[J].基因組學(xué)與應(yīng)用生物學(xué),2010,29(5):815-822.
[17] 王 亮,胡建平. 結(jié)核分枝桿菌(H37Rv)分泌性蛋白的生物信息學(xué)預(yù)測(cè)方法[J].第四軍醫(yī)大學(xué)學(xué)報(bào),2006,27(1):86-89.
[18] Ikeda M, Arai M, Lao D M, et al. Transmembrane prediction methods: a reassessment and improvement by a consensus method using a dataset of experimentally-characterized transmembrane topologies[J].In Silico Biol,2002, 2(1):19-33.
[19] 胡秀珍.蛋白質(zhì)規(guī)則二級(jí)結(jié)構(gòu)中親疏水氨基酸緊鄰關(guān)聯(lián)特性[J].內(nèi)蒙古大學(xué)學(xué)報(bào),2002,4(33):395-400.
[20] Kyce J, Doolittle R F. A simple method for displaying the hydropathic character of a protein [J].Mol Biol,1982,157(6):105-132.
[21] 王菲露,宋 楊. 基于廣義回歸神經(jīng)網(wǎng)絡(luò)的蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)[J].計(jì)算機(jī)仿真,2012,29(2):184-187.