雷鳴任海龍
(1.西藏大學理學院;2.西藏大學醫(yī)學院,西藏 拉薩 850000)
菊葉香藜是藜科刺藜屬植物[1],其具有刺激性氣味,具有抑菌、昆蟲活力抑制等作用[2,3],中藥用于治療哮喘、支氣管炎和偏頭痛[4],據(jù)藏藥志記載有抗腫瘤活性[5]。菊葉香藜也為中等飼用植物[6],通常情況下為亞優(yōu)勢種或伴生種[7]。研究發(fā)現(xiàn)在群落演替中重要值在明顯增加,同時也可作為固定沙地的指示植物[8]。許新勇等[9]研究發(fā)現(xiàn),在西藏“一江兩河”流域地區(qū),伴隨著植被發(fā)育和群落演替的進程,在半固定沙丘和固定沙丘,菊葉香藜逐漸成為優(yōu)勢種,說明菊葉香藜本身生理生態(tài)特征非常適應“一江兩河”流域氣候環(huán)境。2003年,朱格鱗等在Flora of China中,基于形態(tài)學特征將菊葉香藜等植物歸類到刺藜屬植物[1],并未對菊葉香藜的進行分子方面的鑒定。另外,psbA基因是葉綠體基因,序列相對保守,編碼產(chǎn)物D1蛋白,是PSⅡ反應中心2個核心蛋白之一,介導光合作用過程中的電子傳遞[10],在植物屬以上水平的分子系統(tǒng)發(fā)育的比較中具有顯著作用[11]。因此,在本研究中,通過菊葉香藜psbA序列生物信息學分析和系統(tǒng)發(fā)生樹構(gòu)建,為菊葉香藜的分類學提供分子依據(jù)。
通過轉(zhuǎn)錄組測序,將注釋到psbA基因的unigenes在NCBI進行比對,然后再進行拼接。
通過NCBI在線分析軟件ORF Finder對核苷酸序列進行分析,預測出可能的氨基酸序列;通過蛋白質(zhì)二級結(jié)構(gòu)在線預測軟件PredictProtein,預測出氨基酸序列的二級結(jié)構(gòu)、相對親水表面、氨基酸組分和核苷酸組分;用CondonW和CUSP對菊葉香藜psba基因編碼序列進行密碼子偏好性分析,基于中性繪圖和ENC-plot探索影響psba基因密碼子偏好性的因素;psba基因編碼蛋白的理化性質(zhì)采用ExPasy-ProtParam分析軟件及BioEdit軟件預測;疏水性/親水性采用Ex-Pasy-ProtScale預測;跨膜區(qū)域通過軟件TMHMM進行分析;結(jié)構(gòu)功能域及功能分類采用ProtFun預測;通過Swiss-Model在線預測軟件預測出三級結(jié)構(gòu);通過BioEdit進行序列差異分析;用MEGA6.05計算菊葉香藜與其近緣物種的遺傳距離,并構(gòu)建系統(tǒng)進化樹。
從NCBI數(shù)據(jù)庫中下載其它物種psbA基因完整序列,共9個物種(表1)。
表1 NCBI數(shù)據(jù)庫中下載9個物種psbA基因完整序列
2.1.1 菊葉香藜psbA基因編碼蛋白理化性質(zhì)?;谵D(zhuǎn)錄組測序,將注釋到psbA基因的unigenes(c1846_g1、c19645_g1、c24547_g1)在NCBI數(shù)據(jù)庫中進行比對,然后拼接在一起,最終的序列長度為1059bp,GC含量為41%,序列已上傳到NCBI數(shù)據(jù)庫,序列號為:KY942083。
通過NCBI在線分析軟件ORF Finder對核苷酸序列進行分析,預測出氨基酸序列,共353個氨基酸,如下所示:MTAILERRESESLWGRFCNWITSTENRLYIGWFGVL MIPTLLTATSVFIIAFIAAPPVDIDGIREPVSGSLLYGN NIISGAIIPTSAAIGLHFYPIWEAASVDEWLYNGGPYE LIVLHFLLGVACYMGREWELSFRLGMRPWIAVAYSA PVAAATAVFLIYPIGQGSFSDGMPLGISGTFNFMIVFQ AEHNILMHPFHMLGVAGVFGGSLFSAMHGSLVTSSLI RETTENESANEGYRFGQEEETYNIVAAHGYFGRLIFQ YASFNNSRSLHFFLAAWPVVGIWFTALGISTMAFNLN GFNFNQSVVDSQGRVINTWADIINRANLGMEVMHER NAHNFPLDLAAIEAPSING
負電荷殘基總數(shù)為28,正電荷殘基總數(shù)為15,其理論分子量為38962.62Da,理論等電點為5.12,不穩(wěn)定指數(shù)是36.33。分子式為C1793H2682N456O493S14,原子總數(shù)為5438,脂肪系數(shù)為96.77。
2.1.2 菊葉香藜psbA基因編碼蛋白氨基酸組分分析。氨基酸組分中最多的為A 35(9.9%),最少的為C 2(0.6%),其中,沒有氨基酸K;相對親水表面為71.67%在0-16%之間,28.33%在16%-100%之間。(如圖1所示)
圖1 菊葉香藜psbA基因編碼蛋白氨基酸組分
2.1.3 菊葉香藜psbA基因編碼蛋白二級結(jié)構(gòu)。通過蛋白質(zhì)二級結(jié)構(gòu)在線預測軟件PredictProtein,預測出氨基酸序列的二級結(jié)構(gòu)為α-螺旋57.51%,β-折疊4.82%,β-轉(zhuǎn)角37.68%.
2.1.4 菊葉香藜psbA基因編碼蛋白親疏水性分析。用ProtParam分析軟件對菊葉香藜psbA基因編碼蛋白的疏水性/親水性進行預測,其疏水性平均系數(shù)為0.350。參照ExpASy的Protscale程序計算菊葉香藜psbA基因編碼蛋白的疏水性/親水性圖譜(圖2)分析氨基酸殘基的得分可知,多肽鏈的第51號的丙氨酸(Ala)具有最高分值3.189,疏水性最強。第234號天冬酰胺(Asn)具有最低分值-2.133,親水性最強。
圖2 菊葉香藜psbA基因編碼蛋白親疏水性分析
2.1.5 菊葉香藜psbA基因編碼蛋白跨膜區(qū)域。由圖3可知,菊葉香藜psbA基因編碼蛋白存在7個跨膜區(qū)域,分別位于29~51、71~93、105~127、142~164、171~193、197~219和273~295氨基酸之間,跨膜區(qū)分析結(jié)果與該蛋白的親/疏水性分析結(jié)果基本一致。
圖3 菊葉香藜psbA基因編碼蛋白跨膜區(qū)域
2.1.6 菊葉香藜psbA基因編碼蛋白結(jié)構(gòu)功能域及功能分類。通過Protfun分析軟件預測菊葉香藜psbA基因編碼蛋白結(jié)構(gòu)功能域及功能分類從分析結(jié)果可知(表2),菊葉香藜psbA基因編碼蛋白為非酶類(Prob=0.805,odds=1.128)和轉(zhuǎn)運相關(guān)蛋白(Prob=0.191,odds=1.749),該蛋白具有翻譯、脂肪酸代謝、輔酶因子的生物合成和能量代謝作用的可能性分別為4.760、4.477、3.423和2.195。因此,推測該蛋白的主要作用與轉(zhuǎn)運有關(guān)。
表2 psbA基因編碼的蛋白質(zhì)的功能預測
2.1.7 菊葉香藜psbA基因編碼蛋白三級結(jié)構(gòu)預測。通過Swiss-Model在線預測軟件預測出三級結(jié)構(gòu),選取Template>30%、GQME值接近1、|QMEAN|<4的模型,預測出的菊葉香藜psbA基因編碼蛋白三級結(jié)構(gòu)(圖4)。
圖4 菊葉香藜psbA基因編碼蛋白三級結(jié)構(gòu)預測模型
2.1.8 菊葉香藜psbA基因密碼子偏好性。通過CUSP和CondoW程序分析菊葉香藜及其近緣種psbA基因的密碼子偏好性基本指標。從表3中可以看出,各物種psbA基因在密碼子偏好性方面差異較小,其中CBI、GC含量、GC3和GC3s,莧科植物均大于藜科植物,而ENC值,莧科植物均小于藜科植物。GC1、GC2、GC3和GC含量均小于0.5,說明psbA基因密碼子各位點均偏好使用含A/T的密碼子,而GC3s均小于0.3,說明在同義密碼子中,psbA編碼序列更偏好使用以A/T結(jié)尾的密碼子,其中,NNT>NNA>NNC>NNG,NNT遠大于NNC。ENC值均位于35-50之間,說明psbA基因密碼子偏好性一般,基因表達水平一般。
通過CUSP和CondoW程序分析菊葉香藜psbA基因的密碼子偏好性可知,菊葉香藜psbA基因總共使用了49個密碼子,23個密碼子為偏好性密碼子(RSCU>1),其中 GCU、GAU、GAA、GGU、AUU、CUA、UUA、CCU、CAA、CGU、AGU、UCU、ACU和GUA為高頻密碼子(RSCU>1.5),以GU和CU結(jié)尾的密碼子全部為高頻密碼子。在偏好性密碼子中,有18個密碼子以A/T結(jié)尾,這18個密碼子Fraction和使用頻率(Frequency)都相對較高(表4)。
為探索影響psbA基因密碼子偏好性的因素,通過中性繪圖和ENC-plot繪圖進行分析。中性繪圖結(jié)果顯示(圖5所示),GC12與GC3相關(guān)性不顯著(R2=0.1,P=0.251),說明psbA基因密碼子第1、2位和第3位堿基相關(guān)性不顯著,psbA基因GC含量高度保守,密碼子偏好性主要受選擇作用影響。
ENC繪圖結(jié)果顯示(圖6),所有物種的psbA基因均落在標準曲線下方相對較遠的位置,說明密碼子的偏好性只受到選擇作用的影響。進一步探究影響選擇作用的因素,本研究主要分析CAI值和蛋白長度對ENC值的影響,發(fā)現(xiàn)CAI值與ENC值表現(xiàn)為極顯著的負相關(guān)(R2=0.6817,P<0.01,回歸方程為:y=-37.053x+51.522),蛋白長度與ENC值表現(xiàn)為完全線性相關(guān)(x=353)。因此,選擇作用主要受到表達水平和蛋白質(zhì)長度的影響,psbA基因密碼子偏好性受到表達水平和蛋白質(zhì)長度的的影響。
表3 菊葉香藜及其近緣種psbA基因的密碼子偏好性基本指標
表4 CUSP和CondoW程序分析菊葉香藜psbA基因的密碼子偏好性
圖5 GC3和GC12中性繪圖結(jié)果
圖6 GC3s和ENC繪圖結(jié)果
2.1.9 菊葉香藜psbA基因系統(tǒng)發(fā)生樹結(jié)果。由菊葉香藜及其近緣物種的psba完整序列生成的系統(tǒng)進化樹可知(圖7),系統(tǒng)樹上聚為兩大支,藜科和莧科各聚為一大支,說明在藜科和莧科中,psbA基因存在差異。而對于藜科這一支來說,psbA基因在藜科各屬之間差異相對較大;各進化支部分種間自展值為100%,說明psbA序列對于種的鑒定存在一定的局限性。菊葉香藜原為藜科藜屬植物,但在近年來的藜屬與刺藜屬的爭議中,被劃為藜科刺藜屬中,從圖7中我們可知,菊葉香藜與藜屬植物分別聚為一支,正好與形態(tài)學分類上的觀點一致。
圖7 菊葉香藜psbA基因系統(tǒng)發(fā)生樹結(jié)果(“●”為菊葉香藜)
菊葉香藜psbA基因編碼序列長度為1059bp,GC含量為41%,共編碼353個氨基酸,最多的為丙氨酸(A),為35個(9.9%),不含有賴氨酸,符合psbA基因的特征。二級結(jié)構(gòu)包含α-螺旋(57.51%),β-折疊(4.82%),β-轉(zhuǎn)角(37.68%)。psbA 基因編碼蛋白為疏水性蛋白,包含7個跨膜區(qū)域,是非酶類轉(zhuǎn)運蛋白。psbA基因密碼子偏好性水平相對較弱,主要受到選擇作用、表達水平和蛋白質(zhì)長度的影響,該結(jié)果與尚明照等[12]研究結(jié)果一致,為進一步研究影響psbA基因密碼子偏好性的因素提供依據(jù)。在同義密碼子中,psbA編碼序列更偏好使用以 A/T 結(jié)尾的密碼子,其中,NNT>NNA>NNC>NNG,NNT遠大于NNC,與侯惠靜[13]研究結(jié)果不一致,與侯士昌等[14]研究結(jié)果一致。系統(tǒng)發(fā)生樹的結(jié)果證明菊葉香藜與藜屬植物存在差異,支持將其劃歸到刺藜屬中。