韓雨昕, 南芳茹, 鞏超彥, 馮佳, 呂俊平, 劉琪, 謝樹蓮
?
彎枝藻屬L基因的適應(yīng)性進化分析
韓雨昕, 南芳茹, 鞏超彥, 馮佳, 呂俊平, 劉琪, 謝樹蓮*
(山西大學(xué)生命科學(xué)學(xué)院,太原 030006)
為探討淡水紅藻的葉綠體基因及其適應(yīng)性進化特征,選取彎枝藻屬()及相近外類群的L基因共17條,利用PAML 4.9軟件,對彎枝藻屬L基因編碼蛋白進行生物信息學(xué)分析,并分別采用分支模型、位點模型以及分支-位點模型對基因的選擇位點進行檢測。結(jié)果表明,彎枝藻屬L基因編碼蛋白的二級結(jié)構(gòu)主要由螺旋和折疊構(gòu)成,結(jié)構(gòu)穩(wěn)定。采用最大似然法構(gòu)建的系統(tǒng)發(fā)育樹表明,內(nèi)類群為單一物種,分為3個小分支,具有一定地理分布規(guī)律。在3種進化模型中均未檢測到統(tǒng)計上顯著的正選擇位點,表明絕大多數(shù)位點處于負(fù)選擇壓力下。因此,彎枝藻屬L基因未發(fā)生適應(yīng)性進化。
彎枝藻屬;L基因;蛋白質(zhì)結(jié)構(gòu)預(yù)測;適應(yīng)性進化
紅藻主要分布于海洋中,淡水分布的紅藻只占一小部分,有研究表明, 淡水紅藻是海洋紅藻在海陸變遷過程中遺留于淡水中,并在封閉環(huán)境中經(jīng)過長時間演化而產(chǎn)生的一個重要類群[1]。淡水紅藻大部分以固著方式生活在溫度較低的清潔水體中的巖石或其他物體上,生存環(huán)境相對穩(wěn)定和封閉[2–3]。彎枝藻屬()是淡水紅藻中的典型類群之一,早在190多年前就有記載,在世界上分布廣泛,北美、加勒比群島、西大西洋、亞洲、澳大利亞和夏威夷群島等均有分布[4]。Necchi等[5]認(rèn)為該屬不同種樣本間的遺傳多樣性較低,為一全球單種屬。
1,5-二磷酸核酮糖羧化/加氧酶(Rubisco, E.C.4.1.1.39)存在于植物的葉綠體基質(zhì)中,是參與植物光合作用的關(guān)鍵酶,約占可溶性蛋白質(zhì)總量的50%[6]。它是一個雙功能酶,既能催化RuBP與CO2反應(yīng)生成3-磷酸甘油酸的羧化反應(yīng),又能在光呼吸中催化RuBP與O2反應(yīng)氧化裂解形成 3-磷酸甘油酸、磷酸和磷酸乙醇酸,因此Rubisco對凈光合率具有決定性的影響[7–8]。Rubisco固定CO2的活性位點位于大亞基,是由來自葉綠體基因組的L基因編碼[9]。不同種類的綠色植物中Rubisco活性有較大差異,環(huán)境壓力的限制可導(dǎo)致編碼Rubisco大亞基的L基因發(fā)生適應(yīng)性進化。在很多陸生植物L(fēng)基因中檢測出正選擇位點,在藻類植物如串珠藻目L基因中也檢測出有少數(shù)正選擇位點[10]。
對具有重要功能的蛋白質(zhì)進行適應(yīng)性進化分析,有助于我們更加深入地了解當(dāng)面對環(huán)境壓力時,一些氨基酸的結(jié)構(gòu)和功能會發(fā)生哪些改變[11]。目前對高等植物的適應(yīng)性進化研究較多。周媛等[12]對鳳尾蕨科(Pteridaceae)旱生蕨類的L基因進行了適應(yīng)性進化研究,檢測出多個正選擇位點,其中有3個位點對維持Rubisco功能起重要作用。張麗君等[13]對蕨類植物的4基因進行了適應(yīng)性進化研究,但未檢測出正選擇位點,表明該基因結(jié)構(gòu)與功能已趨于穩(wěn)定。此外還對黃花蒿()植物L(fēng)基因[14]、麻黃科(Ephedraceae)植物L(fēng)基因[15]和稻屬() AA型物種葉綠體基因組[16]等進行了適應(yīng)性進化研究。然而目前對藻類植物的適應(yīng)性進化研究仍然很少。
作為全球分布的淡水紅藻中的一個重要類群,彎枝藻屬是如何適應(yīng)不同的環(huán)境壓力,在這些環(huán)境壓力下,重要蛋白Rubisco大亞基是否發(fā)生了適應(yīng)性進化?本研究分析了該屬L基因的適應(yīng)性進化,以期為探究其在海陸變遷過程對淡水環(huán)境的適應(yīng)研究提供參考。
從GenBank數(shù)據(jù)庫中下載彎枝藻屬以及外類群的L基因序列,共獲得17條序列(表1)。以Clustal X軟件[17]對序列進行對位排列,并進行人工校對,每條序列均包含350個密碼子,以此作為構(gòu)建系統(tǒng)發(fā)育樹的基礎(chǔ)。
采用MEGA 7.0軟件[18]對序列特征進行分析, 應(yīng)用Modeltest 3.7軟件[19]對聯(lián)配結(jié)果進行模型選擇,選取的最佳核苷酸進化模型為TIM+I+G,其中I為進化速率恒定位點的比率,G為Gamma密度函數(shù),K為估算參數(shù)的數(shù)目(表2)。運行PhyML 3.0軟件[20],采用最大似然法(ML)[21]構(gòu)建系統(tǒng)發(fā)育樹。
選取登陸號為JX028169的L基因序列作為參考序列,以氨基酸序列的形式上傳Prot Param (http://web.expasy.org/protparam/),對所選彎枝藻屬L基因編碼蛋白質(zhì)的理化性質(zhì)進行分析,并利用ProtScale (http://web.expasy.org/protscale/)預(yù)測該蛋白質(zhì)的親水性/疏水性[14]。
利用NetPhos 3.1 Server (http://www.cbs.dtu.dk/ services/NetPhos/)對蛋白質(zhì)進行磷酸化位點預(yù)測。
表1 用于本研究的rbcL基因GenBank登錄號
表2 Modeltest 3.7檢驗得到的rbcL基因優(yōu)化模型參數(shù)
利用軟件包DNASTAR.Lasergene. V 7.1中Protean模塊對該蛋白質(zhì)的二級結(jié)構(gòu)進行分析[22–23]。
在適應(yīng)性進化研究中,可以用核苷酸的非同義替換率(dN)與同義替換率(dS)的比值()來度量蛋白質(zhì)水平上的選擇壓力,并進一步判斷選擇壓力在非同義替換的固定過程中起阻礙或推動作用。一些核苷酸的替換不會引起氨基酸改變,稱為同義替換;而更多情況下密碼子的替換會引起氨基酸改變,稱為非同義替換[24]。=1,即dNdS,表明選擇對適合度無影響;<1,即dN
以最大似然法(ML)構(gòu)建的系統(tǒng)發(fā)育樹為基礎(chǔ)數(shù)據(jù),通過PAML 4.9軟件包[27]中的codeml模塊, 分別采用分支模型、位點模型和分支-位點模型進行適應(yīng)性進化分析。
分支模型[28]中,允許非同義替換率和同義替換率的比值在不同分支上有變化。其中單一比率模型最為簡單,該模型假定在所有進化支上值均相同;自由比率則設(shè)定各分支的值各不同。此外, 本研究也采用了二比率模型來進行檢測。
位點模型[29]中,假定不同位點存在不同的選擇壓力,即值不同,但在系統(tǒng)發(fā)育樹的不同分支中無差異。這一模型主要用于檢測L基因是否存在正選擇(>1)和負(fù)選擇(<1)位點。本研究中采用的三對比較模型分別為:M1a (近中性)和M2a (選擇)、M0 (單一比值)和M3 (離散)、M7 (beta)和M8 (beta &),前者為零假設(shè),后者為備擇假設(shè)。M0 (單一比值)對M3 (離散)模型檢測各位點是否存在不同的值,并不檢測正選擇位點。對3對模型進行LRT檢驗(likelihood ratio test),通過比較模型間差異的顯著性來檢驗正選擇位點,在相對自由度(兩模型參數(shù)數(shù)目之差)下,運用2分布進行顯著性檢驗。
分支-位點模型[30]中,將系統(tǒng)發(fā)育樹分為前景支和背景支,僅允許前景支中出現(xiàn)正選擇位點及分支,對其進行LRT檢驗,在test1中將MA和M1a進行似然比檢驗,在test2中將MA和無效模型(設(shè)置為1)進行比較。經(jīng)研究比較,選擇test2算法更為可靠。
從利用最大似然法(ML)構(gòu)建的系統(tǒng)發(fā)育樹(圖1)可見,內(nèi)類群由單一物種彎枝藻()組成,并分為3個小分支,分支間存在明顯的地域分布特點,A分支樣本產(chǎn)地主要為中國和澳大利亞,B分支為北美(后驗概率達81.1%),C分支為馬來西亞、印尼及太平洋島群等(后驗概率為65.6%)。據(jù)此選取A、B、C共3個分支進行后續(xù)分析。
Rubisco大亞基的疏水/親水性預(yù)測 衡量蛋白質(zhì)親水性/疏水性是根據(jù)GRAVY值,正值為疏水性蛋白質(zhì),負(fù)值為親水性蛋白質(zhì)。利用Prot Param測得Rubisco大亞基的GRAVY值為-0.099,表明具有親水性,推斷為水溶性蛋白質(zhì)。從圖2可知,彎枝藻Rubisco大亞基氨基酸序列在第190位異亮氨酸的GRAVY最高(3.211),表明該位點具有極強疏水性;第224位的GRAVY最小(-2.500),表明該位點具有極強親水性[14]。
Rubisco大亞基磷酸化位點預(yù)測 用NetPhos3.1 Server對Rubisco大亞基磷酸化位點進行預(yù)測(圖3), 結(jié)果表明,絲氨酸(Ser)磷酸化位點有9個,分別位于37、106、133、154、156、203、223、226和294位點,蘇氨酸(Thr)磷酸化位點有6個,分別位于98、157、171、224、254和272位點,酪氨酸(Tyr)磷酸化位點有3個,分別位于5、164和176。
Rubisco大亞基的二級結(jié)構(gòu)及保守結(jié)構(gòu)域預(yù)測采用DNAStar軟件包中Protean模塊,對Rubisco大亞基的二級結(jié)構(gòu)進行預(yù)測(圖4), 采用Garnier-Robson方法計算特定氨基酸殘基在特定結(jié)構(gòu)內(nèi)部的可能性,Chou-Fasman方法通過序列氨基酸殘基的晶體結(jié)構(gòu)預(yù)測蛋白質(zhì)的二級結(jié)構(gòu),兩種方法預(yù)測的蛋白質(zhì)二級結(jié)構(gòu)存在差異。Garnier-Robson方法預(yù)測彎枝藻Rubisco大亞基有19個螺旋,24個折疊,12個轉(zhuǎn)角以及一些小片段的無規(guī)則卷曲。Chou- Fasman方法則預(yù)測有15個螺旋,10個折疊, 19個轉(zhuǎn)角。兩種方法預(yù)測的螺旋分別位于第1~6位、第26~38位和第49~67位,折疊分別位于第17~ 25位、第41~49位和第78~82位,轉(zhuǎn)角結(jié)構(gòu)位于第13~15位、第73~75位和第85~88位,Garnier- Robson方法預(yù)測的無規(guī)則卷曲分別位于第12~13位、第71~72位和第76~77位。
表3和4為各模型選擇位點的鑒定結(jié)果。分支模型中,二比率模型指定分支A、B、C為前景支,其他為背景支。各前景支的估計值均小于1,表明各分支均處于負(fù)選擇壓力下。自由比率模型檢測大多數(shù)分支值遠小于1,僅有兩個小分支(序列登錄號為JX028153、KR706528)的值為999.0,因此對這兩個分支進行了分支-位點模型檢測。對分支模型中二比率模型A、B、C以及自由比率模型進行LRT檢驗(表4),其中分支B的結(jié)果較為可靠(< 0.05),其余分支后驗概率表明均不具有可靠性。
位點模型中,模型M3 (離散)、M2a (選擇)和M8 (beta &)允許>1,與其對應(yīng)的零假設(shè)模型為M1a (近中性)模型、M0 (單一比值)模型和M7 (beta)模型。M3模型顯著優(yōu)于M0零假設(shè)模型(<0.01),表明各位點間承受的選擇壓力具有差異性。M2a (選擇)模型中檢測到1個正選擇位點170Q (后驗概率為51.3%),M8 (beta &)模型中檢測到170Q (后驗概率為61.1%)和180I (后驗概率為60.3%)為正選擇位點,但經(jīng)LRT檢驗,拒絕存在正選擇位點的假設(shè)(表4)。
分支-位點模型中,指定5個分支為前景支,其中分支D的序列登陸號為JX028153,分支E的序列登錄號為KR706528。分支C和分支E沒有檢測到正選擇位點。在分支A檢測出98L (后驗概率為68.6%)和327Q (后驗概率為69.8%),分支B檢測出217R (后驗概率為89.3%)、225F (后驗概率為89.4%)和309D (后驗概率為89.8%),分支D檢測出327Q (后驗概率為94.0%)等為正選擇位點,但似然比檢驗拒絕存在正選擇位點的假設(shè)(表4),因此分支A、B和D的檢驗不能作為可靠的正選擇位點證據(jù)。
研究表明,彎枝藻屬L基因中未檢測到正選擇位點,說明其在進化過程中經(jīng)受了嚴(yán)重的負(fù)選擇。L是一個十分古老的基因,廣泛存在于幾乎所有高等和低等植物葉綠體中。因此在漫長的進化過程中,L基因很可能在結(jié)構(gòu)和功能上已經(jīng)趨于穩(wěn)定,其適應(yīng)性進化有可能在早期(數(shù)百萬年前)已被固定,后來正選擇位點被大量積累的中性替換位點或凈化作用所掩蓋,最終使正選擇位點難以檢測到。此外,彎枝藻屬僅含在全球分布的單一物種,其分子多樣性水平較低。據(jù)李強等的研究,淡水紅藻物種爆發(fā)的時間大約在450~600 Mya間,大部分淡水紅藻類群均在這段時期內(nèi)形成[31]。因此可推測彎枝藻屬的基因已在早期發(fā)生進化后被固定,因此現(xiàn)在未能檢測到正選擇位點。
表3 各模型參數(shù)估計值和對數(shù)似然值
當(dāng)一個基因經(jīng)受正選擇時,表明該類群需要產(chǎn)生新的功能來應(yīng)對環(huán)境的巨變,而當(dāng)基因處于強烈負(fù)選擇時,則說明該基因保持原有的重要功能且趨于穩(wěn)定[13]。通過對彎枝藻屬L基因編碼蛋白的生物信息學(xué)分析,表明Rubisco大亞基二級結(jié)構(gòu)主要由螺旋和折疊構(gòu)成,結(jié)構(gòu)穩(wěn)定且結(jié)構(gòu)域十分保守。以往對Rubisco結(jié)構(gòu)的研究表明,Rubisco大亞基的羧基端均有1個由8個螺旋和8個折疊組成的/桶結(jié)構(gòu)域,與相鄰的氨基端功能結(jié)構(gòu)域(由2個螺旋和5個折疊組成的小亞基)共同構(gòu)成酶的活性中心[32]。Rubisco大亞基在植物光合作用中起十分重要的作用,這些結(jié)構(gòu)保證了Rubisco大亞基的重要功能位點保持穩(wěn)定狀態(tài)。
表4 LRT檢驗統(tǒng)計
*:<0.05; **:<0.01.
在本研究中,位點模型和分支-位點模型中均檢測出可能的正選擇位點,但經(jīng)過似然比檢驗,備擇假設(shè)不可靠,拒絕存在正選擇位點的假設(shè)。在過去的幾十年里對基因進化中正選擇位點的研究成為熱點,其中的主要原因是在各模型中正選擇/負(fù)選擇位點判斷的統(tǒng)計方法有了很大進步[11,28]。但據(jù)報 道[33–34],似然比檢驗的結(jié)果依賴于模型使用的初始參數(shù)值,有時很難得到給定模型參數(shù)的最大似然估計值,得到的結(jié)果可能出現(xiàn)假陽性。Zhang[35]就通過計算機模擬的方法檢驗出分支-位點模型的似然比檢驗可能存在假陽性。這種不可靠性可能是由于它對實驗中所作假設(shè)的違背過于敏感,例如在不同位點分布有不同選擇壓力,以及在同義替換和非同義替換中的轉(zhuǎn)換、顛換率存在差異所造成的。之后,又對分支-位點模型進行了改進,并使用它構(gòu)建了兩個LRT檢驗,分別為test1和test2,經(jīng)驗證test2應(yīng)用于實際數(shù)據(jù)分析較可靠,很好地解決了假陽性問題[30]?;谝延醒芯浚覀兺茰y可能由于系統(tǒng)發(fā)育樹分支長度較短,序列數(shù)量不夠龐大導(dǎo)致假陽性存在,此外,選擇壓力放松也有可能造成這一結(jié)果。
分支模型中各分支的值均小于1,說明整體的彎枝藻屬類群處于較強的負(fù)選擇壓力下,但分支A、B、C的進化速率存在一定差異,分支C的值極低(0.000 10),甚至低于單比率模型值(0.027 85), 而分支B的進化速率(0.571 50)則遠高于其他分支, LRT檢驗也證實此觀點可靠。這可能是彎枝藻作為全球范圍分布的單一物種,從系統(tǒng)發(fā)育樹分支可以看出其分布具有明顯的地域特點,A分支分布于中國、澳大利亞及巴西,B分支分布于美國,C分支分布于馬來西亞、印尼、西太平洋島群等。由于彎枝藻生存的環(huán)境通常較為封閉,水體的溫度、清潔度、溶氧量以及其他因素均有較大區(qū)別,所以長期處于不同的水體環(huán)境中可能導(dǎo)致不同分支的進化速率產(chǎn)生差異。
本研究對彎枝藻屬L基因的研究支持其未發(fā)生適應(yīng)性進化的觀點。在高等植物中,L基因正選擇位點的存在十分普遍[12–15]。但目前對藻類的適應(yīng)性進化研究較少。鞏超彥等在淡水紅藻串珠藻目(Batrachospermales)植物適應(yīng)性進化研究中,檢測到3個正選擇位點,其余位點則普遍處于負(fù)選擇壓力下[10]。因此,今后有必要進一步對淡水紅藻其它類群葉綠體L基因的適應(yīng)性進化進行深入研究,以探究其在海陸變遷過程中如何適應(yīng)環(huán)境的巨變。
[1] SKUJA H. Comments on fresh-water rhodophyceae [J]. Bot Rev, 1938, 4(12): 665–676. doi: 10.1007/BF02869845.
[2] KUMANO S.Freshwater red Algae of the World [M]. Bristol, England: Biopress Limited, 2002: 223–228.
[3] SHI Z X. Flora Slgarum Sinicarum Aquae Dulcis, Vol. 13, Rhodophyta Phaeophyta [M]. Beijing: Science Press, 2006: 1–34. 施之新. 中國淡水藻志, 第13卷, 紅藻門, 褐藻門[M]. 北京: 科學(xué)出版社, 2006: 1–34.
[4] GAO Y F, NAN F R, FENG J, et al. Review of systematics of Compso- pogonales (Rhodophyta) [J]. World Sci-Technol Res Devel, 2015, 37(3): 314–318. doi: 10.16507/j.issn.1006-6055.2015.03.021.高一帆, 南芳茹, 馮佳, 等. 彎枝藻目Compsopogonales系統(tǒng)分類研究進展[J]. 世界科技研究與發(fā)展, 2015, 37(3): 314–318. doi: 10. 16507/j.issn.1006-6055.2015.03.021.
[5] NECCHI O Jr, FO A S G, SALOMAKI E D, et al. Global sampling reveals low genetic diversity within(Compsopogonales, Rhodophyta) [J]. Eur J Phycol, 2013, 48(2): 152–162. doi: 10.1080/ 09670262.2013.783626.
[6] KAPRALOV M V, FILATOV D A. Widespread positive selection in the photosynthetic Rubisco enzyme [J]. BMC Evol Biol, 2007, 7: 73. doi: 10.1186/1471-2148-7-73.
[7] SAGE R F, SEEMANN J R. Regulation of ribulose-1,5-bisphosphate carboxylase/oxygenase activity in response to reduced light intensity in C4plants [J]. Plant Physiol, 1993, 102(1): 21–28. doi: 10.1104/pp.102. 1.21.
[8] SIQUEIRA A S, LIMA A R J, DALL’AGNOL L T, et al. Comparative modeling and molecular dynamics suggest high carboxylase activity of thesp. CACIAM14L protein [J]. J Mol Model, 2016, 22: 68. doi: 10.1007/s00894-016-2943-y.
[9] HARTMAN F C, HARPEL M R. Structure, function, regulation, and assembly of d-ribulose-1,5-bisphosphate carboxylase/oxygenase [J]. Annu Rev Biochem, 1994, 63: 197–234. doi: 10.1146/annurev.bi.63. 070194.001213.
[10] GONG C Y, NAN F R, FENG J, et al. Adaptive evolutionary analysis onL gene of Batrachospermales [J]. Oceanol Limnol Sin, 2017, 48 (3): 527–535. doi: 10.11693/hyhz20161200277.鞏超彥, 南芳茹, 馮佳, 等. 串珠藻目植物L(fēng)基因的適應(yīng)性進化分析[J]. 海洋與湖沼, 2017, 48(3): 527–535. doi: 10.11693/hyhz201 61200277.
[11] NEI M, KUMAR S. Molecular Evolution and Phylogenetics [M]. New York: Oxford University Press, 2000: 238–273.
[12] ZHOU Y, WANG B, GAO L, et al. Adaptive evolution and coevolution of theL gene in xeric Pteridaceae ferns [J]. Plant Sci J, 2011, 29(4): 409–416. doi: 10.3724/SP.J.1142.2011.40409.周媛, 王博, 高磊, 等. 鳳尾蕨科旱生蕨類L基因的適應(yīng)性進化和共進化分析[J]. 植物科學(xué)學(xué)報, 2011, 29(4): 409–416. doi: 10. 3724/SP.J.1142.2011.40409.
[13] ZHANG L J, CHEN J, WANG T. Adaptive evolution in the chloroplast gene4 in ferns [J]. Bull Bot Res, 2010, 30(1): 42–50. 張麗君, 陳潔, 王艇. 蕨類植物葉綠體4基因的適應(yīng)性進化分析[J]. 植物研究, 2010, 30(1): 42–50.
[14] XIONG Y, ZHAO C Y, YANG Q S, et al. In silico cloning, bioinfor- matics and adaptive evolution analysis ofL gene in[J]. Biotechnology, 2014, 24(6): 50–56. doi: 10.3969/j.issn. 1004-311X.2014.06.0137-7.熊勇, 趙春艷, 楊青松, 等. 黃花蒿L(fēng)基因電子克隆、生物信息學(xué)及適應(yīng)性進化分析[J]. 生物技術(shù), 2014, 24(6): 50–56. doi: 10. 3969/j.issn.1004-311X.2014.06.0137-7.
[15] LIU N, WANG Q B, CHEN J, et al. Adaptive evolution and structure modeling ofL gene in[J]. Chin Sci Bull, 2010, 55(22): 2341–2346. doi: 10.1007/s11434-010-3023-9.劉念, 王慶彪, 陳婕, 等. 麻黃屬L基因的適應(yīng)性進化檢測與結(jié)構(gòu)模建[J]. 科學(xué)通報, 2010, 55(14): 1341–1346. doi: 10.1007/s 11434-010-3023-9.
[16] JIANG B, GAO L, LI J, et al. Adaptive evolution of the chloroplast genome in AA-genomespecies [J]. Chin Sci Bull, 2014, 59(20): 1975–1983. doi: 10.1360/N972014-00127.姜斌, 高磊, 李佳, 等. 稻屬AA型物種葉綠體基因組的適應(yīng)性進化[J]. 科學(xué)通報, 2014, 59(20): 1975–1983. doi: 10.1360/N972014- 00127.
[17] THOMPSON J D, GIBSON T J, PLEWNIAK F, et al. The CLUSTAL_X windows interface: Flexible strategies for multiple sequence alignment aided by quality analysis tools [J]. Nucl Acids Res, 1997, 25(24): 4876–4882. doi: 10.1093/nar/25.24.4876.
[18] KUMAR S, STECHER G, TAMURA K. MEGA7: Molecular evolu- tionary genetics analysis version 7.0 for bigger datasets [J]. Mol Biol Evol, 2016, 33(7): 1870–1874. doi: 10.1093/molbev/msw054.
[19] POSADA D, CRANDALL K A. MODELTEST: Testing the model of DNA substitution [J]. Bioinformatics, 1998, 14(9): 817–818. doi: 10. 1093/bioinformatics/14.9.817.
[20] GUINDON S, DUFAYARD J F, LEFORT V, et al. New algorithms and methods to estimate maximum-likelihood phylogenies: Assessing the performance of PhyML 3.0 [J]. Syst Biol, 2010, 59(3): 307–321. doi: 10.1093/sysbio/syq010.
[21] RANNALA B, YANG Z. Probability distribution of molecular evolu- tionary trees: A new method of phylogenetic inference [J]. J Mol Evol, 1996, 43(3): 304–311. doi: 10.1007/BF02338839.
[22] BURLAND T G. DNASTAR’s Lasergene sequence analysis software [M]// MISENER S, KRAWETZ S A. Bioinformatics Methods and Protocols: Methods in Molecular Biology?, Vol. 132. Totowa, NJ: Humana Press, 2000: 71–91. doi: 10.1385/1-59259-192-2:71.
[23] XIONG Y, ZHAO C Y, YANG Q S, et al. Molecular cloning, bioinfor- matics analysis ofL gene in[J]. N Hort, 2015, 39(4): 89–95. doi: 10.11937/bfyy.201504021.熊勇, 趙春艷, 楊青松, 等. 雛菊L基因的克隆及其生物信息學(xué)分析[J]. 北方園藝, 2015, 39(4): 89–95. doi: 10.11937/bfyy.201504 021.
[24] YANG Z. Computational Molecular Evolution [M]. Oxford: Oxford University Press, 2006: 56–167.
[25] YANG Z H, SWANSON W J, VACQUIER V D. Maximum-likelihood analysis of molecular adaptation in abalone sperm lysin reveals variable selective pressures among lineages and sites [J]. Mol Biol Evol, 2000, 17(10): 1446–1455. doi: 10.1093/oxfordjournals.molbev. a026245.
[26] WONG W S, YANG Z H, GOLDMAN N, et al. Accuracy and power of statistical methods for detecting adaptive evolution in protein coding sequences and for identifying positively selected sites [J]. Genetics, 2004, 168(2): 1041–1051. doi: 10.1534/genetics.104.031153.
[27] YANG Z. PAML: A program package for phylogenetic analysis by maximum likelihood [J]. Comput Appl Biosci, 1997, 13(5): 555–556.
[28] YANG Z. Likelihood ratio tests for detecting positive selection and application to primate lysozyme evolution [J]. Mol Biol Evol, 1998, 15(5): 568–573. doi: 10.1093/oxfordjournals.molbev.a025957.
[29] YANG Z H, BIELAWSKI J P. Statistical methods for detecting mole- cular adaptation [J]. Trends Ecol Evol, 2000, 15(12): 496–503. doi: 10. 1016/S0169-5347(00)01994-7.
[30] ZHANG J Z, NIELSEN R, YANG Z H. Evaluation of an improved branch-site likelihood method for detecting positive selection at the molecular level [J]. Mol Biol Evol, 2005, 22(12): 2472–2479. doi: 10. 1093/molbev/msi237.
[31] LI Q, JI L, XIE S L. Phylogenetic analysis of Batrachospemales (Florideophyceae, Rhodophyta) based on chloroplastL sequences [J]. Acta Hydrobiol Sin, 2010, 34(1): 20–28. doi: 10.3724/SP.J.1035. 2010.00020.李強, 吉莉, 謝樹蓮. 串珠藻目植物的系統(tǒng)發(fā)育: 基于L序列的證據(jù)[J]. 水生生物學(xué)報, 2010, 34(1): 20–28. doi: 10.3724/SP.J.1035. 2010.00020.
[32] KNIGHT S, ANDERSSON I, BR?NDéN C I. Crystallographic analysis of ribulose 1,5-bisphosphate carboxylase from spinach at 2·4 ? resolution: Subunit interactions and active site [J]. J Mol Biol, 1990, 215(1): 113–160. doi: 10.1016/S0022-2836(05)80100-7.
[33] SUZUKI Y, NEI M. Reliabilities of parsimony-based and likelihood- based methods for detecting positive selection at single amino acid sites [J]. Mol Biol Evol, 2001, 18(12): 2179–2185. doi: 10.1093/ oxfordjournals.molbev.a003764.
[34] SUZUKI Y, NEI M. Simulation study of the reliability and robustness of the statistical methods for detecting positive selection at single amino acid sites [J]. Mol Biol Evol, 2002, 19(11): 1865–1869. doi: 10. 1093/oxfordjournals.molbev.a004010.
[35] ZHANG J. Frequent false detection of positive selection by the likelihood method with branch-site models [J]. Mol Biol Evol, 2004, 21(7): 1332–1339. doi: 10.1093/molbev/msh117.
Adaptive Evolutionary Analysis of theL Gene from(Rhodophyta)
HAN Yu-xin, NAN Fang-ru, GONG Chao-yan, FENG Jia, Lü Jun-ping, LIU Qi, XIE Shu-lian*
(School of Life Science, Shanxi University, Taiyuan 030006, China)
In order to reveal the chloroplast gene and adaptive evolution characters of Rhodophyta, the 17L genes ofand the similar group of freshwater red algae were selected, the bioinformatics ofproteins encoded byL genes ofwere analyzed by using software PAML4.9, and the selection sites ofgenes were detected by using branch model, site model and branch-site models. The results showed that the secondary structure of protein encoded byL ofwas mainly composed of α helix and β folding, so its structure was very stable.The phylogenetic tree with the maximum likelihood method showed that the inner group had only one species, could be divided into three small branches, and they had obvious geographical distribution. No significant positively selected sites were detected under all three evolutionary models, indicating that most of the sites were under negative selection pressure. Therefore, there is no adaptive evolution ofL gene in.
;L gene; Protein structure prediction; Adaptive evolution
10.11926/jtsb.3909
2018-03-19
2018-04-29
國家自然科學(xué)基金項目(31670208, 31370239)資助
This work was supported by the National Natural Science Foundation of China (Grant No. 31670208, 31370239).
韓雨昕(1993~ ),女,碩士研究生,主要從事藻類學(xué)研究。E-mail: 15835107990@163.com
E-mail: xiesl@sxu.edu.cn