耿榮慶,王蘭萍,洪 鍵,范忠軍,常 洪,冀德君
(1.鹽城師范學院 生命科學與技術學院,江蘇 鹽城 224051;2.揚州大學 動物科學與技術學院,江蘇 揚州 225009)
EGLN1(Egl nine homolog 1)又稱脯氨酰羥化酶2蛋白(Prolyl hydroxylase domain protein 2,PHD2),是一個關鍵的氧傳感基因[1]。EGLN1基因能夠負調(diào)控低氧誘導因子1α(hypoxia-inducible factor-1α,HIF-1α),對低氧特別敏感,可調(diào)節(jié)低氧狀態(tài)下HIF-1α蛋白的表達,是HIF-1α蛋白降解的關鍵[2-5]。EGLN1的降低則引起HIF-1α降解的減少,即HIF-1α在組織內(nèi)的蓄積,使得HIF-1α誘導一系列低氧反應基因的轉(zhuǎn)錄對缺氧反應的細胞進行調(diào)控,如促紅細胞生成素、血管內(nèi)皮生長因子、血紅素氧化酶-1、誘導型一氧化氮合酶、葡萄糖轉(zhuǎn)運因子-1和糖酵解酶類等,提高細胞和組織對缺氧和缺血環(huán)境的耐受,使細胞得以適應缺氧環(huán)境而生存,從而達到低氧適應對細胞的保護作用。
近年來,在高原人群高海拔低氧適應性機制方面的研究進一步證實,EGLN1基因是低氧適應的重要調(diào)控基因之一[6-13]。鑒于EGLN1基因在低氧適應性方面的重要作用,本研究針對哺乳動物的EGLN1基因進行適應性進化和共進化分析,探討EGLN1基因是否受到正選擇作用以及哪些位點受到了正選擇,揭示EGLN1基因內(nèi)部發(fā)生的共進化特征,為深入理解EGLN1基因適應低氧環(huán)境的分子機制提供資料。
登錄NCBI Blast網(wǎng)站(http://blast.ncbi.nlm.nih.gov/),選擇Nucleotide Blast程序,采用默認參數(shù),以家牛EGLN1基因序列(NM_001206046)對數(shù)據(jù)庫進行序列同源性比對搜索。對搜索到的EGLN1基因同源序列數(shù)據(jù)結果進行手工編輯和分析,剔除重復序列和基因編碼區(qū)含有終止密碼子的無效序列,共獲得牛(NM_001206046)、兔(XM_002717333)、犬(XM_546089)、野豬(XM_003133025)、人(NM_022051)、蘇門答臘猩猩(XM_002809301)、綠狒狒(XM_003893765)、獼猴(XM_001104870)、黑猩猩(XM_525092)、白頰長臂猿(XM_003267372)、小耳大嬰猴(XM_003797426)、短尾負鼠(XM_001378950)、小鼠(NM_053207)、非洲象(XM_003410995)、大熊貓(XM_002917103)等15種哺乳動物的EGLN1基因編碼區(qū)全長序列。
采用Clustalx1.83[14]軟件對EGLN1基因編碼區(qū)序列進行多序列比對。在序列比對的基礎上運用MEGA5.1[15]軟件以鄰接法(Neighbor joining,NJ)構建基因進化樹,進化樹各分支的置信度采用1000次自展分析(Bootstrap analysis)進行重復檢驗。
在核苷酸水平上的正選擇通常使用ω來估測[16]。ω是同源編碼蛋白序列之間非同義核苷酸替換(dN)和同義核苷酸替換(dS)的比值。正選擇位點通過ω(即dN/dS)來確定:ω>1表示非同義突變被固定的速率大于同義突變,即位點受到正選擇;ω<1表示同義突變被固定的速率大于非同義突變,即位點受到負選擇;ω=1非同義突變被固定的速率與同義突變相同,即位點為中性選擇。
不同物種EGLN1基因編碼區(qū)序列的比對結果運用Datamonkey程序[17],核苷酸替換模型采用由程序自動選擇的能最優(yōu)擬合數(shù)據(jù)集的分析模型。Datamonkey程序提供單一似然祖先計數(shù)法(Single-Likelihood Ancestor Counting,SLAC)、隨機效應似然法(Random effects likelihood,REL)以及固定效應似然法(Fixed effects likelihood,F(xiàn)EL),通過3種不同的方法分別對位點選擇壓力進行分析。
蛋白質(zhì)位點的共進化特征采用CAPS軟件包[18]分析,程序中的閾值設定為0.001,隨機抽樣值設置為1 000 000,盡量減少假陽性產(chǎn)生的影響。CAPS程序通過檢測氨基酸位點的變異是否存在關聯(lián)來揭示位點間在結構和功能上的相關性。
基于EGLN1基因編碼區(qū)全序列的進化關系如圖1所示。15個物種的基因進化樹顯示,大熊貓、小鼠的EGLN1基因聚為一類,其余物種的EGLN1基因聚為另一類。由此可見,EGLN1基因的進化關系明顯不同于動物分類學中的系統(tǒng)進化關系,表明EGLN1基因的進化可能與功能的進化存在著更為密切的關系。
根據(jù)SLAC、FEL和REL 3種不同方法分另篩選出EGLN1基因的正選擇位點。在P<0.1的水平上,SLAC方法檢測到10個正選擇位點,分別為9,55,170,185,194,198,202,228,240和270;FEL方法檢測到49個正選擇位點,分別為9,87,113,134,152,155,159,162,163,168,169,170,172,174,185,188,190,191,193,197,198,202,203,225,228,266,303,307,314,317,319,321,322,330,335,348,357,375,379,380,387,397,398,401,402,403,408和409;REL方法檢測到5個正選擇位點,分別為193,317,321,348和379。由SLAC法和FEL法共同鑒定出的正選擇位點有9,170,185,198,202和228;由FEL法和REL法共同鑒定出的正選擇位點有193,317,321,348和379。在氨基酸水平,這些位點都發(fā)生了至少2次以上的替換,排除了假陽性的可能性。
在EGLN1基因上共識別出303組共進化位點,涉及到219個氨基酸位點,這些位點組成具有共進化關系的氨基酸殘基,共進化位點的空間位置關系如圖2所示。CAPS軟件在識別位點間共進化關系時,通常將氨基酸位點的共進化方式設置為4類,即與蛋白質(zhì)的疏水性和分子量都相關、只與蛋白質(zhì)的疏水性相關、只與蛋白質(zhì)的分子量相關以及和二者都不相關。本研究中,196組氨基酸位點的共進化方式與蛋白質(zhì)的疏水性顯著相關(P<0.05);150組氨基酸位點的共進化方式與分子量顯著相關(P<0.05);55組氨基酸位點的共進化方式與蛋白質(zhì)的疏水性和分子量均顯著相關(P<0.05)。絕大多數(shù)是兩兩位點間發(fā)生共進化,少數(shù)是3位點或4位點間的共進化。
圖1 基于NJ 法構建的EGLN1基因進化樹Fig.1 Gene evolutionary tree of the EGLN1 gene constructed based on the NJ method
圖2 EGLN1基因位點間的共進化網(wǎng)絡圖Fig.2 Coevolution network diagram of EGLN1 gene sites
進化生物學研究的重要內(nèi)容之一是解析基因在進化過程中受到的選擇作用。通常認為,基因在進化過程中往往會同時受到中性選擇、凈化選擇(負選擇)和正選擇(適應性進化)的共同作用[19-21]。非同義替代能直接影響蛋白質(zhì)的功能,比同義替代更可能改變生物的適應性。在正選擇的作用下,適合度較高的非同義替代比同義替代累積得更快。非同義替代率比同義替代率統(tǒng)計上顯著偏高被當作蛋白質(zhì)發(fā)生適應性進化的證據(jù)。因此,正選擇是分子進化的重要動力,它能夠加速同源蛋白的分化,是衡量分子適應性進化的重要標準。
在DNA水平上檢測正選擇作用的方法主要包括距離法、簡約法和最大似然法等[21-22]。最大似然法模型允許蛋白質(zhì)上位點間存在不同的ω比率,相對于早期在所有世系和位點平均兩兩比較分類單元間dN和dS而言,最大似然法模型具有更多優(yōu)勢,成為適應性進化研究中使用較為廣泛、具有較高檢測效力的模型[23]。本研究中,運用基于最大似然算法模型的SLAC、FEL和REL方法,通過不同方法檢測到的正選擇位點數(shù)目雖然存在差異,但在EGLN1基因中都檢測到正選擇位點,而且部分位點可同時由兩種方法檢測到正選擇,表明EGLN1基因在進化過程中受到了正選擇作用。由此推斷,哺乳動物EGLN1基因編碼區(qū)部分氨基酸位點承受著較弱的蛋白質(zhì)結構和功能限制,在進化過程中受到正選擇作用,產(chǎn)生適應性進化(例如,低氧環(huán)境的適應性等)。
共進化是揭示分子進化機制的重要內(nèi)容之一。在蛋白質(zhì)進化過程中,自然選擇的約束體現(xiàn)在結構和功能上。為了實現(xiàn)特定功能,蛋白質(zhì)結構具有一定的保守性,并由一系列氨基酸間的相互作用來維持。當一個位點上發(fā)生的氨基酸殘基置換可能會影響到與該位點存在相互作用的其他位點上發(fā)生殘基置換時,引起相關位點間的共進化,蛋白質(zhì)從結構和功能上仍維持穩(wěn)定,即某個功能位點的變異可能被另一位點的變異所補償,經(jīng)過自然選擇被保留下來[18]。本研究中,在EGLN1基因編碼區(qū)識別出一定數(shù)量的共進化位點,這些預測的位點間可能存在直接或間接的相互作用,從而對維持蛋白質(zhì)的結構和功能有著重要作用。
參考文獻:
[1] Kiss J, Kirchberg J, Schneider M. Molecular oxygen sensing: implications for visceral surgery[J]. Langenbecks Arch Surg, 2012,397(4):603-610.
[2] Semenza G L.HIF-1, O(2), and the 3 PHDs: how animal cells signal hypoxia to the nucleus[J]. Cell, 2001, 107(1):1-3.
[3] Appelhoff R J, Tian Y M, Raval R R,et al. Differential function of the prolyl hydroxylases PHD1, PHD2, and PHD3 in the regulation of hypoxia-inducible factor[J]. J Biol Chem,2004,279(37):38 458-38 465.
[4] Hirota K, Semenza G L. Regulation of angiogenesis by hypoxia-inducible factor 1[J].Crit Rev Oncol Hematol,2006,59:15-26.
[5] Semenza G L. Hypoxia-inducible factor 1 (HIF-1) pathway[J]. Sci STKE, 2007, 407:8.
[6] Fong G H, Takeda K. Role and regulation of prolyl hydroxylase domain proteins[J]. Cell Death Differ,2008,15(4):635-641.
[7] Yi X, Liang Y, Huerta-Sanchez E,et al. Sequencing of 50 human exomes reveals adaptation to high altitude[J]. Science, 2010,329:75-78.
[8] Bigham A, Bauchet M, Pinto D,et al. Identifying signatures of natural selection in Tibetan and Andean populations using dense genome scan data[J]. PLOS Genet, 2010,10:6.
[9] Buroker N E, Ning X H, Zhou Z N,et al. Genetic associations with mountain sickness in Han and Tibetan residents at the Qinghau-Tibetan Plateau[J]. Clin Chim Acta, Int J Clin Chem, 2010,411:1 466-1 473.
[10] Simonson T S, Yang Y, Huff C D,et al. Genetic evidence for high-altitude adaptation in Tibet[J]. Science, 2010, 329:72-75.
[11] Aggarwal S, Negi S, Jha P,et al. EGLN1 involvement in high-altitude adaptation revealed through genetic analysis of extreme constitution types defined in Ayurveda[J]. Proc Natl Acad Sci USA, 2010, 107:18 961-18 966.
[12] Peng Y, Yang Z, Zhang H,et al. Genetic variations in Tibetan populations and high-altitude adaptation at the Himalayas[J]. Mol Biol Evol, 2011, 28:1 075-1 081.
[13] Xu S, Li S, Yang Y,et al. A genome-wide search for signals of high-altitude adaptation in Tibetans[J]. Mol Biol Evol, 2011, 28:1 003-1 011.
[14] Thompson J D, Gibson T J, Plewniak F,et al. The CLUSTAL-X windows interface: Flexible strategies for multiple sequence alignment aided by quality analysis tools[J]. Nucleic Acids Res, 1997, 25(24): 4 876-4 882.
[15] Tamura K, Peterson D, Peterson N,et al. MEGA5: Molecular Evolutionary Genetics Analysis using Maximum Likelihood, Evolutionary Distance, and Maximum Parsimony Methods[J]. Molecular Biology and Evolution, 2011, 28:2 731-2 739.
[16] Yang Z, Nielsen R, Goldman N,et al. Codon-substitution models for heterogeneous selection pressure at amino acid sites[J]. Genetics, 2000,155(1):431-449.
[17] Pond S K, Frost S D W. Datamonkey: rapid detection of selective pressure on individual sites of codon alignments[J]. Bioinformatics, 2005, 21:2 531-2 533.
[18] Fares M A, McNally D. CAPS: coevolution analysis using protein sequences[J]. Bioinformatics,2006,22(22):2 821-2 822.
[19] Yang Z H, Swanson W J, Vacquier V D. Maximum-likelihood analysis of molecular adaptation in abalone sperm lysin reveals variable selective pressures among lineages and sites[J]. Mol Biol Evol,2000,17(10):1 446-1 455.
[20] Swanson W J, Yang Z, Wolfner M F,et al. Positive darwinian selection in the evolution of mammalian female reproductive proteins[J]. Proc Natl Acad Sci USA,2001,98:2 509-2 514.
[21] Nei M. Selectionism and neutralism in molecular evolution[J]. Mol Biol Evol,2005,22(12):2 318-2 342.
[22] Suzuki Y, Nei M. Reliabilities of parsimony-based and likelihood-based methods for detecting positive selection at single amino acid sites[J]. Mol Biol Evol, 2001, 18 (12):2 179-2 185.
[23] Li H, Stephan W. Maximum-Likelihood methods for detecting recent positive selection and localizing the selected site in the genome[J]. Genetics, 2005, 171(1):377-384.