張家琪,徐 悅,李曉冰,李思遠(yuǎn),尹哲寧,周嘉裕,廖 海
(西南交通大學(xué) 生命科學(xué)與工程學(xué)院,四川 成都 610031)
豆科植物查爾酮合成酶基因密碼子偏好性分析
張家琪,徐 悅,李曉冰,李思遠(yuǎn),尹哲寧,周嘉裕,廖 海
(西南交通大學(xué) 生命科學(xué)與工程學(xué)院,四川 成都 610031)
查爾酮合成酶(Chalcone synthase,CHS)是參與合成植物苯丙烷類物質(zhì)的主要酶類之一。研究豆科植物CHS基因密碼子的偏好性,對提高豆科植物CHS基因的表達(dá)水平具有重要意義。為此,運(yùn)用CHIPS、CUSP和CodonW程序分析豆科植物CHS基因密碼子的偏好性,并用決明CHS基因?qū)Ψ治鼋Y(jié)果的可信度進(jìn)行驗證。結(jié)果表明,在豆科植物CHS基因的密碼子中,以A或U結(jié)尾的密碼子偏好性較強(qiáng)?;贑HS基因RSCU值的聚類結(jié)果顯示,豆科植物與茄科植物(包括煙草)聚為一類,表明煙草作為研究豆科植物CHS基因功能的模式植物較為合適。通過對決明CHS基因密碼子偏好性與大腸桿菌和酵母基因組密碼子偏好性的比較,發(fā)現(xiàn)兩者均存在差異,但酵母的差異低于大腸桿菌,表明酵母表達(dá)系統(tǒng)更加適合作為決明CHS基因的外源表達(dá)系統(tǒng)。然而,若要使決明CHS基因能夠在酵母表達(dá)系統(tǒng)中高效表達(dá),仍需對其密碼子進(jìn)行優(yōu)化。
豆科植物;查爾酮合成酶;密碼子偏好性;聚類分析
查爾酮合成酶(Chalcone synthase,CHS)是合成植物苯丙烷類物質(zhì)的關(guān)鍵酶,能夠催化丙二酰輔酶A和香豆酰輔酶A結(jié)合生成黃酮類化合物-查爾酮[1]。查爾酮是類黃酮物質(zhì)的基本碳架結(jié)構(gòu),與類黃酮、異黃酮、花色素苷等物質(zhì)的合成有關(guān),參與植物多種生理活動,比如色素合成[2]、防紫外輻射[3]、花粉的正常發(fā)育[4]、抗病[5]等。豆科植物是類黃酮、異黃酮、花色素苷的重要來源,目前,已從苜蓿、大豆等多種豆科植物中克隆獲得了CHS基因,這為以CHS基因為靶點的代謝調(diào)控研究奠定了基礎(chǔ)。
自然界中所有的蛋白質(zhì)都由氨基酸組成,而密碼子的種類又直接影響到氨基酸的種類。在所有的密碼子中用來編碼氨基酸的有61種,但氨基酸的種類卻只有20種,所以存在同義密碼子(Synonymous codon),即不同密碼子編碼同一種氨基酸的現(xiàn)象[6-7]?;?qū)νx密碼子的使用并不隨機(jī),而是具有偏好性[8]。研究外源基因密碼子的偏好性,有利于外源基因?qū)λ拗鞅磉_(dá)系統(tǒng)的選擇。如果外源基因密碼子使用頻率同宿主表達(dá)系統(tǒng)基因組密碼子使用頻率存在較大差異,會影響外源基因在宿主中的表達(dá)和翻譯[9]。因此,研究密碼子的偏好性對探究基因的表達(dá)有重要意義。
本試驗以14種豆科植物的CHS基因編碼序列為試材,借助CodonW和EMBOSS在線分析程序,分析其密碼子的偏好性。利用SPSS 19.0軟件進(jìn)行聚類分析,以確定研究該基因的最佳模式植物,并比較豆科植物CHS基因密碼子同大腸桿菌、酵母基因組密碼子的偏好性,確定其最適宿主表達(dá)系統(tǒng)。
1.1 材料及分析軟件
本試驗所采用的15種豆科植物、3種茄科植物和4種十字花科植物的CHS基因序列(表1,2)均來自NCBI數(shù)據(jù)庫(http://www.ncbi.nlm.nih.gov/)。大腸桿菌與酵母基因組的密碼子偏好性數(shù)據(jù)來源于Codon Usage Database(http://www.kazusa.or.jp/codon/)。采用EMBOSS在線程序(http://emboss.toulouse.inra.fr/)中的CUSP(Create a codon usage table)和CHIPS(Codon heterozygosity in a protein coding sequence)以及CodonW程序分析密碼子的偏好性,并通過SPSS 19.0軟件對CHS基因密碼子使用偏好性進(jìn)行聚類分析。
表1 15種豆科植物CHS基因序列Tab.1 The CHS gene sequence from 15 species of leguminous plants
表2 茄科和十字花科植物的CHS基因序列Tab.2 The CHS gene sequence of solanacous and cruciferous plants
1.2 試驗方法
1.2.1CHS基因同義密碼子偏好性分析 首先,通過CodonW程序分析CHS基因的相對密碼子使用度(Relative synonymous codon usage,RSCU)、密碼子適應(yīng)指數(shù)(Codon adapation index,CAI)、同義密碼子第3位堿基的GC含量(GC3s)以及同義密碼子GC含量。其次,根據(jù)所得到的CHS基因編碼序列,利用CUSP和CHIPS在線分析程序,計算決明CHS基因密碼子出現(xiàn)頻率(以1/1000表示)以及有效密碼子數(shù)(Effective number of codons,ENc)。
1.2.2 基于密碼子偏好性的聚類分析 為確定研究豆科植物CHS基因的最佳模式植物,利用SPSS 19.0分析軟件并基于密碼子使用偏好性對21種植物(14種豆科植物、3種茄科、4種十字花科)的CHS基因進(jìn)行聚類分析。在聚類過程中,將每一個被分析的物種作為聚類的對象,59種密碼子(不考慮密碼子AUG、UGG以及3個終止密碼子)的RSCU值作為聚類的變量[10-11]。
1.2.3 決明CHS基因密碼子偏好性分析 選取豆科植物決明CHS基因全長序列,利用CodonW和CUSP程序分析RSCU和密碼子使用頻率。并將上述結(jié)果同大腸桿菌和酵母基因組密碼子的偏好性進(jìn)行比較,以確定能使決明CHS基因高效表達(dá)的宿主表達(dá)系統(tǒng)。
2.1CHS基因的密碼子偏好性分析
相對同義密碼子使用度(RSCU)可作為判定密碼子使用偏好性程度的標(biāo)準(zhǔn),代表著編碼對應(yīng)氨基酸的同義密碼子中某一密碼子的相對使用概率[12]。若某一密碼子的RSCU值為1,則表明該密碼子的使用沒有偏好性。當(dāng)RSCU值大于1,則表明該密碼子的使用頻率相對較高。反之,當(dāng)RSCU值小于1時,表示該密碼子的使用頻率相對較低[13]。
14種豆科植物CHS基因RSCU計算結(jié)果(表3)表明,有10個密碼子偏好性較強(qiáng),包括GCA、AGU、AUU、CUU、CCU、GUU(除臺灣相思樹外)、ACU(除苜蓿外)、CGU、UUG、GUG,其中有7個密碼子以U結(jié)尾。可見豆科植物CHS基因密碼子偏好于U結(jié)尾。除此之外,CGG、ACG、CCG等8個密碼子的偏好性極低,RSCU均小于1。AUG和UGG的RSCU值均等于1,不具有偏好性。其中,CGU、UUG、GUG密碼子的RSCU值均大于1,可推斷這3個密碼子是其最優(yōu)密碼子。
表3 14種豆科植物CHS基因的RSCUTab.3 The RSCU of CHS gene of 14 leguminous plant species
表3(續(xù))
注:1.烏豆;2.大豆;3.脹果甘草;4.黃芪;5.臺灣相思樹;6.苜蓿;7.綠豆;8.紅豆草;9.白羽扇豆;10.翅果鐵刀木;11.白葛根;12.三野葛;13.烏拉甘草;14.蝶豆。大于1的RSCU值用下劃線表示。表5同。
Note:1.Glycinesoja;2.Glycinemax;3.Glycyrrhizainflata;4.Astragalusmembranaceus;5.Acaciaconfuse;6.Medicagosativa;7.Vignaradiate;8.Onobrychisviciifolia;9.Lupinesalbus;10.Sennaalata;11.Puerariacandollei;12.Puerariamontana;13.Glycyrrhizauralensis;14.Clitoriaternatea.The data with underline mean that the value of RSCU>1.The same as Tab.5.
2.2 ENc、CAI、GC3s及GC含量分析
有效密碼子數(shù)(Effective number of codons,ENc)能有效衡量密碼子家族中同義密碼子非均衡使用的偏好性程度。其值為20~61,值越接近20,表明密碼子偏好性越強(qiáng)[14]。GC3s 則表示密碼子的第3位堿基中G+C的含量與第3位堿基總量的比值。 CAI則指實際編碼該蛋白的所有密碼子對于完全使用最優(yōu)密碼子編碼該蛋白情況下的適應(yīng)性指數(shù),常用來衡量基因表達(dá)水平的高低[15]。其取值為0~1,CAI值越接近0,表示密碼子偏好程度越低[16]。
表4結(jié)果表明,14種豆科植物CHS基因的ENc值為42.76~54.52,平均值為49.97,標(biāo)準(zhǔn)偏差為2.809。根據(jù)Jiang等[17]得出的密碼子偏好性強(qiáng)弱區(qū)分標(biāo)準(zhǔn)(ENC 取值35),可判定大部分豆科植物CHS基因密碼子偏好性較低。14種豆科植物CHS基因的GC3s值為0.346~0.760,平均值為0.449,標(biāo)準(zhǔn)偏差為0.104,進(jìn)一步表明同義密碼子使用方式的均一性。從14種豆科植物CHS基因GC含量可看出,臺灣相思樹GC含量為0.584,表明其CHS基因編碼區(qū)序列G+C含量多于A+T,并且密碼子偏好于G/C結(jié)尾。其余13種豆科植物的GC含量均小于0.5,表明在CHS基因編碼區(qū)序列中A+T含量大于G+C,且其密碼子偏好以A/U結(jié)尾。
一般認(rèn)為基因的表達(dá)水平與偏好性呈正相關(guān),因而基因的密碼子偏好程度常作為該基因表達(dá)水平的標(biāo)志[18]。從表4的結(jié)果來看,CAI的變動為0.215~0.263,平均值為0.240,標(biāo)準(zhǔn)偏差為0.016,CAI值明顯偏低,豆科植物CHS基因的密碼子偏好性較低。由此,可以判定在豆科植物中CHS基因表達(dá)水平較低,查爾酮合成酶含量低,在一定程度上影響類黃酮等次生代謝產(chǎn)物的累積。
2.3 密碼子偏好性聚類分析
在植物基因的表達(dá)與功能研究中,擬南芥和煙草是最為常見的模式植物。為確定CHS基因能夠在何種模式植物中高效表達(dá),有必要進(jìn)行CHS基因密碼子偏好性的聚類分析。選取14種豆科植物、3種茄科植物(包括煙草)和4種十字花科植物(包括擬南芥)進(jìn)行聚類分析。從聚類結(jié)果可看出(圖1),除烏拉甘草外,其他物種整體分為兩大類。豆科植物除臺灣相思樹外,其余12種和茄科植物聚為1類。在一定意義上說明豆科植物CHS基因和茄科植物CHS基因的密碼子使用偏好性相近。也就是說,煙草作為受體模式生物研究豆科植物CHS基因更具有優(yōu)勢。
表4 九個物種CHS基因的ENc、CAI、GC3s和GCTab.4 ENc values and CAI and GC3s and contents of GC for CHS gene in nine species
圖1 21種植物CHS基因的聚類樹狀圖Fig.1 Cluster dendrogram of CHS gene from 21 plant species
2.4 決明CHS基因密碼子偏好性分析
決明CHS基因全長序列由西南交通大學(xué)中藥資源與生物技術(shù)實驗室克隆獲得,分析其RSCU和密碼子使用頻率,從而驗證密碼子偏好性分析結(jié)果的可信度。
程序分析結(jié)果顯示(表5),在決明CHS基因密碼子中,有30個密碼子的RSCU值大于1。其中,GCA、GCU、UGU、GAU、UUU、GGA、GGU、AUU、CUU、CCA、CCU、CAA、AGA、CGU、UCA、ACA、ACU共17個密碼子以A/U結(jié)尾,且比例值也比較大,可認(rèn)為是決明CHS基因的偏好性密碼子。同時,應(yīng)用CHIPS和CodonW分別計算決明CHS基因的ENc值、CAI值、GC含量和GC3s值,其結(jié)果分別為52.550,0.202,0.473和0.437,可見ENc值偏大,CAI值較小,GC含量和GC3s值都偏低,表明決明CHS基因密碼子偏好以A/U結(jié)尾,但在總體上密碼子偏好性較弱。此結(jié)果說明決明CHS基因表達(dá)水平低,需進(jìn)行密碼子的改造以提高基因表達(dá)水平。當(dāng)然,這一結(jié)果也與密碼子偏好性分析結(jié)果相一致,證明豆科植物CHS基因密碼子偏好性分析具有一定的可信度。
表5 CUSP和CodonW程序分析決明CHS基因的密碼子偏好性Tab.5 Codon bias of CHS gene of Senna tora analyzed by CUSP and CodonW program
表5(續(xù))
注:*.終止密碼子。表6同。
Note:*.Terminate codons.The same as Tab.6.
2.5 決明CHS基因組與酵母、大腸桿菌的基因組密碼子偏好性比較
在基因的表達(dá)研究中,具有代表性的原核表達(dá)系統(tǒng)和真核表達(dá)系統(tǒng)分別是大腸桿菌和酵母。為確定決明CHS基因最適表達(dá)系統(tǒng),實現(xiàn)CHS基因的高效表達(dá),有必要將決明CHS基因密碼子的偏好性與目標(biāo)宿主基因組密碼子偏好性進(jìn)行比較。若密碼子使用頻率的比值為0.5~2.0表示密碼子的偏好性接近,反之則意味密碼子偏好性差別偏大[19]。如表6所示,決明CHS基因中分別有25,23個密碼子的使用頻率與大腸桿菌及酵母菌基因組密碼子存在差異,表明酵母表達(dá)系統(tǒng)更加適合作為決明CHS基因的外源表達(dá)系統(tǒng)。但決明CHS基因密碼子使用頻率與酵母基因組仍有較大差別,若要使決明CHS基因能夠高效表達(dá),需要對其密碼子進(jìn)行優(yōu)化。
表6 決明CHS基因與大腸桿菌基因組和酵母基因組的密碼子出現(xiàn)頻率Tab.6 Codon frequency of Senna tora CHS gene,and E.coli genome and yeast genome f/‰
表6(續(xù))
注:下劃線表示2個物種密碼子比較具有明顯偏差(≤0.5,≥2)的分值。
Note:The data underlined meant there are obvious differences of values(≤0.5,≥2) between the codons of two species.
本試驗使用相關(guān)在線分析軟件和程序?qū)Χ箍浦参顲HS基因密碼子偏好性進(jìn)行分析,分析結(jié)果顯示,14種豆科植物CHS基因的ENc值、CAI和GC3s的平均值分別是49.97,0.240,0.449。從上述結(jié)果可看出,豆科植物CHS基因ENc值偏大,可判定其密碼子偏好性較低;CAI值明顯偏低,表明豆科植物CHS基因表達(dá)水平較低;GC3s小于0.5,表明了豆科植物CHS基因同義密碼子使用方式的均一性;從GC含量來看除臺灣相思外,其余豆科植物GC含量均小于0.5,說明大部分豆科植物CHS基因CDS序列中,A+T含量大于G+C含量。CondonW計算結(jié)果顯示,14種豆科植物CHS基因中有10個密碼子偏好性較強(qiáng),其中有8個密碼子以A/U結(jié)尾。可見豆科植物CHS基因密碼子偏好以A/U結(jié)尾,特別是以U結(jié)尾。有研究表明,雙子葉植物和單子葉植物在密碼子偏好性方面差異明顯[20]。一般認(rèn)為,單子葉植物偏好以G/C結(jié)尾,而雙子葉植物偏好以A/U結(jié)尾。豆科植物CHS基因密碼子偏好以A/U結(jié)尾,表明該基因更適合導(dǎo)入雙子葉植物。
為確定研究豆科植物CHS基因的最佳模式植物,依據(jù)CHS基因的RSCU值對豆科、茄科、十字花科植物進(jìn)行聚類分析,結(jié)果表明,豆科植物和茄科植物的CHS基因密碼子偏好性相近,可確定煙草是研究CHS基因表達(dá)和功能的最佳受體模式植物。這對以后CHS基因結(jié)構(gòu)和功能的研究具有重要意義。除此之外,單獨對決明CHS基因密碼子偏好性進(jìn)行分析,其結(jié)果與豆科植物CHS基因密碼子偏好性相一致,表明對豆科植物CHS基因密碼子偏好性的分析是可信的。
在基因表達(dá)與功能研究中,外源基因?qū)λ拗鞅磉_(dá)系統(tǒng)的選擇至關(guān)重要。通常選擇大腸桿菌為原核表達(dá)系統(tǒng),而酵母則一般作為真核表達(dá)系統(tǒng)。宿主表達(dá)系統(tǒng)確定后,要實現(xiàn)目的基因的高效表達(dá),對目的基因密碼子進(jìn)行優(yōu)化是行之有效的方法。本試驗發(fā)現(xiàn)對于決明CHS基因來說,其密碼子偏好性同酵母基因組較為接近。這就表明相較于大腸桿菌,酵母更加適合作為決明CHS基因的表達(dá)系統(tǒng)。但決明CHS基因密碼子與酵母基因組密碼子的使用頻率仍存在差異,若要使決明CHS基因能夠在酵母表達(dá)系統(tǒng)中高效表達(dá),需要對其密碼子進(jìn)行優(yōu)化。
[1] Yu H N,Wang L,Sun B,et al.Functional characterization of a chalcone synthase from the liverwortPlagiochasmaappendiculatum[J].Plant Cell Reports,2015,34(2):233-245.
[2] Sun W,Meng X,Liang L,et al.Molecular and biochemical analysis of chalcone synthase from freesia hybrid in flavonoid biosynthetic pathway[J].PLoS One,2015,10(3):e0119054.
[3] Dao T,Linthorst H,Verpoorte R.Chalcone synthase and its functions in plant resistance[J].Phytochemistry Reviews,2011,10(3):397-412.
[4] 蔣 明,曹家樹.查爾酮合成酶基因[J].細(xì)胞生物學(xué)雜志,2007,29(4):525-529.
[5] 王 燕,許 鋒,程水源.植物查爾酮合成酶分子生物學(xué)研究進(jìn)展[J].河南農(nóng)業(yè)科學(xué),2007(8):5-9.
[6] 蘇 惠,李永光,譚文雍,等.大腸桿菌gdhA基因的密碼子偏好性分析及優(yōu)化[J].基因組學(xué)與應(yīng)用生物學(xué),2015,34(3):521-529.
[7] Grantham R,Gautier C,Gouy M.Codon frequencies in 119 individual genes confirm consistent choices of degenerate bases according to genome type[J].Nucleic Acids Research,1980,8(9):1893-1912.
[8] Yang X,Ma X,Luo X,et al.Codon usage bias and determining forces inTaeniasoliumgenome[J].The Korean Journal of Parasitology,2015,53(6):689-697.
[9] 楊春亮,王 良,武 斌,等.大豆GmRAV基因的密碼子偏好性分析[J].東北農(nóng)業(yè)大學(xué)學(xué)報,2012,43(7):34-41.
[10] 李娟娟,黃 宇,劉祖碧,等.Kunitz蛋白酶抑制劑基因的密碼子偏好性分析[J].生物技術(shù),2014,24(5):39-44.
[11] 孫 晶,何 濤,萬閏蘭,等.鐵皮石斛尿苷二磷酸葡萄糖焦磷酸化酶基因(UGP)的密碼子偏好性分析[J].應(yīng)用與環(huán)境生物學(xué)報,2014,20(5):759-766.
[12] Xu Y,Jia R,Zhang Z,et al.Analysis of synonymous codon usage pattern inDuckcircovirus[J].Gene,2015,557(2):138-145.
[13] You E,Wang Y,Ding Z T,et al.Codon usage bias analysis for the spermidine synthase gene fromCamelliasinensis(L.) O.Kuntze[J].Genetics and Molecular Research,2015,14(3):7368-7376.
[14] 李 平,白云鳳,馮瑞云,等.籽粒莧蘋果酸酶(NAD-ME)基因密碼子偏好性分析[J].應(yīng)用與環(huán)境生物學(xué)報,2011,17(1):12-17.
[15] Sharp P M,Li W H.The codon adaptation Index-a measure of directional synonymous codon usage bias,and its potential applications[J].Nucleic Acids Research,1987,15(3):1281-1295.
[16] Ma Q P,Li C,Wang J,et al.Analysis of synonymous codon usage inFAD7 genes from different plant species[J].Genetics and Molecular Research,2015,14(1):1414-1422.
[17] Jiang Y,Deng F,Wang H,et al.An extensive analysis on the global codon usage pattern ofBaculoviruses[J].Archives of Virology,2008,153(12):2273-2282.
[18] 趙 薇,陳必鏈,王明茲,等.藻類△6脂肪酸脫飽和酶基因密碼子偏好性分析[J].熱帶海洋學(xué)報,2010,29(3):126-134.
[19] 趙 耀,劉漢梅,顧 勇,等.玉米Waxy基因密碼子偏好性分析[J].玉米科學(xué),2008,16(2):16-21.
[20] Murray E E,Lotzer J,Eberle M.Codon usage in plant genes[J].Nucleic Acids Research,1989,17(2):477-498.
Analysis of Codon Bias of CHS Gene in Leguminous Plant
ZHANG Jiaqi,XU Yue,LI Xiaobing,LI Siyuan,YIN Zhening,ZHOU Jiayu,LIAO Hai
(School of Life Science and Engineering,Southwest Jiaotong University,Chengdu 610031,China)
Chalcone synthase(CHS) is one of the key enzymes in the phenylaprapanoid metabolism pathways.The research about codon bias fromCHSgenes of leguminous plants has great significance to increase the expression level ofCHSgene.Therefore,codon bias ofCHSgene from leguminous plants was analyzed by CodonW,CHIPS and CUSP.Furthermore,CHSgene fromSennatorawas used to verify the reliability of analysis results.According to the results,CHSgene of leguminous plants preferred to use the synonymous codons ended with A or U.The phylogenic analysis showed that Legumes and Solanaceae were attributed to one class,indicating tobacco was the optimum model plants forCHSgenes functional study.Compared withE.coliand yeast genome,the codon usage difference betweenCHSgene ofSennatoraandE.coligenome was more apparently than that betweenCHSgene ofSennatoraand yeast genome.Hence,the yeast may be more suitable for the expression ofCHSgene ofSennatora.In order to improve the expression level ofCHSgene in the yeast expression system,CHSgene codons should be optimized.
Leguminosae;Chalcone synthase;Codon bias;Phylogenic analysis
2016-07-16
國家自然科學(xué)基金項目(31371232;31500276);成都市科技技術(shù)研發(fā)項目(2015-HM01-00051-SF);西南交通大學(xué)校級大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計劃資助項目(151607)
張家琪(1994-),男,甘肅定西人,主要從事生物學(xué)研究。
廖 海(1974-),男,四川遂寧人,副教授,博士,主要從事生物技術(shù)研究。 周嘉裕(1976-),女,四川宜賓人,副教授,博士,主要從事生物技術(shù)研究。
Q78
A
1000-7091(2016)06-0012-09
10.7668/hbnxb.2016.06.003