龔意輝 唐詩眙 周桂花 陳磊 張斌 李鵬
摘要:為了解黃荊坪竹根椒(Capsicum annuum L. cv Huang Jingping)葉綠體基因組密碼子使用模式,以其51條蛋白編碼序列(coding sequence,CDS)為研究對象,采用Codon W 1.4.2、CUSP、 Excel 2010、SPSS 16.0等軟件對黃荊坪竹根椒密碼子的GC含量、有效密碼子值(ENC)、RSCU、中性繪圖、ENC-plot、PR2-plot、最優(yōu)密碼子及其影響因素進行詳細的分析。結果表明,黃荊坪竹根椒密碼子第1位(GC1)、第2位(GC2)、第3位(GC3)中的GC含量分別為42.68%、36.25%、27.89%,其中 GC1>GC2>GC3,表明密碼子第3位堿基以A/U結尾為主;ENC值介于34.10%~54.31%之間,平均值為46.55%,表明黃荊坪竹根椒密碼子偏好性較弱。相關性分析結果表明:(1)GC1 與 GC2 呈極顯著正相關,GCall與 GC1、GC2、GC3 均為極顯著正相關;(2)ENC 與 GC1、GC2均不存在顯著相關關系,但與 GC3 存在極顯著相關關系。RSCU分析結果顯示:在黃荊坪竹根椒葉綠體基因組中共有30個高頻密碼子的RSCU>1,其中以U、A、G結尾的高頻密碼子數(shù)分別為16、13、1個,表明黃荊坪竹根椒密碼子第3位偏好以A或U結尾。ENC-plot繪圖分析結果表明,黃荊坪竹根椒基因組中大多數(shù)基因位于標準曲線下方,有13個基因的ENC 比值介于-0.05~0.05 之間,說明選擇壓力主要影響黃荊坪竹根椒密碼子的偏好性;PR2-plot 分析結果表明,黃荊坪竹根椒葉綠體基因組中大部分基因位于平面圖的右下方,即 T>A、G>C,表明堿基突變、自然選擇壓力等多種因素共同影響黃荊坪竹根椒密碼子的偏好性。在黃荊坪竹根椒葉綠體基因組中共篩選出GCA、GCU、AGA等19個最優(yōu)密碼子并全部以A/U結尾。本研究結果可為進一步開展黃荊坪竹根椒性狀改良、遺傳進化及葉綠體基因工程的應用提供分子理論支撐。
關鍵詞:黃荊坪竹根椒;葉綠體基因組;密碼子偏好性;最優(yōu)密碼子
中圖分類號:S641.301文獻標志碼:A
文章編號:1002-1302(2023)20-0028-06
密碼子是構成原核生物與真核生物遺傳信息的基本單元,在生物體轉(zhuǎn)錄、翻譯過程中起著非常重要的作用。自然界中64種密碼子編碼20種氨基酸和3種終止密碼子(TGA、TAA和TAG),除甲硫氨酸(Met)和酪氨酸(Trp)外,其余18種氨基酸均有多個同義密碼子與之對應。同義密碼子在不同物種葉綠體基因組中,甚至在同種物種同樣基因中的使用頻率也不是均等的[1]。同義密碼子使用頻率的差異性稱之為密碼子偏好性(synonymous codon usage bias,SCUB)。越來越多的研究表明,不同植物中密碼子的偏好性不同,例如天山雪蓮(Saussurea involucrata)[2]、云南樟(Cinnamomum glanduliferum)[3]、橄欖(Canarium album)[4]。因此,對植物密碼子的偏好性進行深入探究,不僅有利于明確植物的分類與鑒定[5],而且還可根據(jù)最優(yōu)密碼子設計植物的外源基因,進一步提高外源基因的表達豐度及轉(zhuǎn)化效率,從分子角度全面解析植物的進化過程[6]。
葉綠體是植物進行光合作用的重要場所,為植物的正常生長提供源源不斷的營養(yǎng)物質(zhì)。葉綠體擁有一套完整的遺傳信息,能進行母系遺傳,長度大小一般為120~160 kb,具有高度保守的特征[7]。因此,葉綠體基因組學在物種遺傳分類、鑒定、進化規(guī)律、基因工程等方面有重要的研究意義[8-9]。植物葉綠體全基因組伴隨著現(xiàn)代高通量測序技術的快速發(fā)展而不斷被美國國家生物技術信息中心(NCBI)數(shù)據(jù)庫收錄,已有越來越多的學者在植物中開展葉綠體基因組密碼子的偏好性研究,例如,蘿卜(Raphanus sativus L.)[10]、莧菜(Amaranthus tricolor L.)[11]、蓮藕(Nelumbo nucifera Gaertn)[12]。因此,分析植物密碼子的偏好性及其影響因素不僅可以確定該物種的最優(yōu)密碼子,然后根據(jù)最優(yōu)密碼子設計基因表達載體,進一步提高外源基因的表達水平,從而有利于闡明植物適應外界環(huán)境的分子機制。
黃荊坪竹根椒(Capsicum annuum L. cv Huang Jingping)是茄科(Solanaceae)辣椒屬(Capsicum)一年或有限多年生草本植物,主要分布在湘潭市黃荊坪排頭鄉(xiāng)。黃荊坪竹根椒因個體細長、色澤鮮艷、皮薄肉多、味道鮮美而深受廣大消費者的青睞。近年來,黃荊坪竹根椒規(guī)模及產(chǎn)業(yè)發(fā)展迅速,現(xiàn)已成為湘潭市黃荊坪排頭鄉(xiāng)實現(xiàn)鄉(xiāng)村振興、農(nóng)民致富的重要支柱產(chǎn)業(yè)。目前有關辣椒的研究主要集中在高產(chǎn)高效技術栽培[13]、遺傳育種[14]、品質(zhì)評價[15]等方面,隨著黃荊坪竹根椒全基因組測序和拼接組裝工作的完成,目前國內(nèi)外有關黃荊坪竹根椒密碼子偏好性的研究還尚未見報道。本研究對黃荊坪竹根椒密碼子的堿基組成及其各相關參數(shù)進行分析,首次闡明黃荊坪竹根椒密碼子偏好性使用的特征,從而在黃荊坪竹根椒葉綠體基因組中遴選出最優(yōu)密碼子,并明確影響黃荊坪竹根椒密碼子偏好性的主要因素,以期為今后進一步開展黃荊坪竹根椒性狀改良、進化規(guī)律及葉綠體基因工程的應用提供分子理論支撐。
1 材料與方法
1.1 黃荊坪竹根椒葉綠體全基因序列的獲得
2022年5月15日采集湘潭市農(nóng)業(yè)科學研究所種苗中心的黃荊坪竹根椒幼嫩葉片,經(jīng)液氮速凍后送華智生物技術有限公司進行葉綠體基因組測序,采用Illumina/MGI測序平臺完成了黃荊坪竹根椒葉綠體基因組的測序,全長為 156 817 bp,包括82個蛋白編碼基因(CDS),GenBank 登錄號為OP919650.1。在篩選黃荊坪竹根椒蛋白編碼基因時,首先刪除重復序列,然后選擇ATG 作為起始密碼子,TGA、TAA和TAG為終止密碼子,且以編碼序列大于 300 bp 的葉綠體基因用于密碼子偏好性分析,最后共得到51個滿足條件的CDS序列。
1.2 中性繪圖分析
參照Liu等的方法[16],計算黃荊坪竹根椒葉綠體密碼子第3位中的 GC 含量(GC3),以GC3 為橫坐標,密碼子第1、第2位中的平均 GC 含量(GC12)為縱坐標,制作散點圖進行相關性分析。
1.3 相對同義密碼子使用度分析
參照原曉龍等的方法[17],使用 CodonW 軟件分別統(tǒng)計黃荊坪竹根椒各密碼子的相對同義密碼子使用度(relative synonymous codon usage,RSCU),將黃荊坪竹根椒密碼子的RSCU>1定義為高頻密碼子。
1.4 ENC-plot 繪圖分析
參照Fuglsang 的方法[18],分別以黃荊坪竹根椒的GC3s、有效密碼子 ENC(effective number of condon)為橫坐標和縱坐標,繪制散點圖,其ENC的計算公式為ENC=2+GC3s+29/[GC23s+(1-GC3s)2]。結合黃荊坪竹根椒的ENC比值頻數(shù)分布對其差異進行定量分析,以ENC值為-0.05~0.05 區(qū)間作為具體的判斷標準。
1.5 PR2-plot 繪圖分析
參照Sueoka的方法[19],分別統(tǒng)計黃荊坪竹根椒密碼子第3位中堿基組成(G3、C3、A3、T3)比例,分別以G3/(G3+C3)、A3/(A3+T3)為橫坐標和縱坐標進行黃荊坪竹根椒的PR2 偏倚分析。
1.6 最優(yōu)密碼子分析
參照原曉龍等的方法[17],最優(yōu)密碼子以黃荊坪竹根椒的ENC 值作為衡量密碼子偏性標準,分別在兩端挑選最高和最低的10%基因構建黃荊坪竹根椒高低基因表達庫,分別計算黃荊坪竹根椒各高低基因的RSCU 和ΔRSCU值,將同時符合高頻率密碼子(RSCU>1)和高表達密碼子(ΔRSCU≥0.08)2個條件的密碼子定義為最優(yōu)密碼子。
2 結果與分析
2.1 黃荊坪竹根椒相關偏性指數(shù)分析
利用在線軟件Codon W 1.4.2和CUSP軟件對黃荊坪竹根椒葉綠體中的51條CDS序列進行分析,其各基因不同位置的GC含量和ENC值如表1所示,51條CDS密碼子中的總GC含量介于 30.73%~45.32%之間,平均GC 含量(GCall)為35.61%,GC1含量介于34.39%~58.88%之間,平均GC含量為42.68%,GC2含量介于29.13%~56.83%之間,平均GC 含量為36.25%,GC3含量介于18.52%~37.39%之間,平均GC 含量為27.89%,其結果說明黃荊坪竹根椒密碼子不同位置的GC含量存在差異,GC1>GC2>GC3,表明在黃荊坪竹根椒密碼子第3位多為A/T 堿基;ENC值介于34.10%~54.31%之間,平均值為46.55%,其中35條 CDS 的 ENC 值高于45.00%,占總編碼基因數(shù)的68.63%;可判斷出黃荊坪竹根椒密碼子的使用偏好性較弱。
對黃荊坪竹根椒葉綠體密碼子各項系數(shù)進行相關性分析(表2),GCall與GC1、GC2、GC3均呈極顯著相關(P<0.01);GC1與GC2呈極顯著相關,但與GC3相關性不顯著,說明黃荊坪竹根椒密碼子第1位和第2位堿基組成存在相似性;ENC與GC3呈極顯著相關,其相關系數(shù)為 0.448,但與GC1和GC2并不存在顯著相關性,說明GC3堿基組成主要影響黃荊坪竹根椒密碼子的偏好性。
根據(jù)黃荊坪竹根椒的RSCU分析可知,在黃荊坪竹根椒葉綠體基因組中共有30個高頻密碼子的RSCU>1,其中以U、A、G結尾的高頻密碼子數(shù)分別為16、13、1個(表3),表明黃荊坪竹根椒密碼子第3位偏好以A或U結尾。
2.2 中性繪圖分析
中性繪圖分析結果(圖 1)表明,GC3取值介于18.52%~37.39%之間,GC12 取值介于31.76%~57.86%之間,黃荊坪竹根椒全部基因分布在對角線之上,回歸系數(shù)為0.022 1,r2為0.02,說明黃荊坪竹根椒葉綠體基因組中GC12 和 GC3的相關性顯著,說明黃荊坪竹根椒密碼子第1位和第2位與第3位的堿基組成不同但不存在顯著性相關,說明自然選擇主要影響黃荊坪竹根椒偏好性的形成。
2.3 ENC-plot 繪圖分析
黃荊坪竹根椒葉綠體基因組密碼子的 ENC-plot 分析結果(圖2)表明,黃荊坪竹根椒少數(shù)基因沿著標準曲線周圍分布,說明黃荊坪竹根椒密碼子的實際 ENC 值與期望 ENC 值接近,大部分基因則分布在標準曲線下方,并且與標準曲線相距較遠,表明自然選擇主要影響黃荊坪竹根椒葉綠體基因組密碼子的偏好性。通過計算黃荊坪竹根椒密碼子的ENC 比值(表4),ENC 比值介于-0.05~0.05 區(qū)間的基因共有13個,而ENC 比值位于這個范圍之外的基因共有38個,且距期望 ENC 值較遠,說明這些基因與標準曲線相距較遠,說明選擇壓力主要影響黃荊坪竹根椒密碼子的偏好性。
2.4 PR2-plot 分析
采用 PR2-plot 繪圖對黃荊坪竹根椒葉綠體基因氨基酸 A、G 和 T、C 之間的關系進行分析(圖3),在黃荊坪竹根椒葉綠體基因組中大多數(shù)基因位于平面圖的下半部分,說明A、G、T、C 4種堿基的使用頻率存在差異,即T>A,G>C;這表明堿基突變、自然選擇壓力等多種因素共同影響黃荊坪竹根椒密碼子的偏好性。
2.5 最優(yōu)密碼子的確定
對黃荊坪竹根椒 51條 CDS 的 ENC 值進行排序,從兩極分別挑選 10%的基因建立高低表達庫,計算各密碼子的 RSCU值、ΔRSCU 值,將同時符合RSCU>1且ΔRSCU≥0.08這2個條件的密碼子確定為黃荊坪竹根椒的最優(yōu)密碼子(表5),結合表3統(tǒng)計的30個RSCU>1 的高頻密碼子,有26個密碼子的ΔRSCU≥0.08,最終在黃荊坪竹根椒葉綠體基因組中篩選出19個最優(yōu)密碼子,分別為GCA、GCU、AGA、CGA、UGU、CAA、GAA、GGU、AUU、CUA、CUU、AAA、CCA、CCU、UCU、ACA、ACU、GUA、GUU,其中10個最優(yōu)密碼子以A 結尾,9個最優(yōu)密碼子以U結尾,說明黃荊坪竹根椒密碼子偏好使用A/U。
3 結論與討論
密碼子偏好性是有效分析原核生物和真核生物進化特征的一個重要手段[20]。大量研究結果表明,密碼子偏好性受多種生物因素的影響,例如基因表達豐度、基因片段大小、tRNA豐度、堿基組成及突變等因素均可以影響物種密碼子的使用模式[21]。然而,已有研究報道堿基突變和自然選擇是決定物種密碼子使用偏性的重要原因,已被廣泛用于闡明物種基因組密碼子使用的特異性[17]。據(jù)報道,在植物中,核苷酸組成在核基因組密碼子偏性形成中發(fā)揮重要作用,但自然選擇則在植物線粒體基因組和葉綠體基因組密碼子偏好性形成中發(fā)揮重要作用[22-23]。本研究系統(tǒng)分析了影響黃荊坪竹根椒密碼子偏好性的主要因素,中性分析表明,黃荊坪竹根椒基因組中GC12和GC3不存在顯著相關性,且回歸方程斜率較低,說明自然選擇可能比突變更能影響黃荊坪竹根椒密碼子偏好性的形成。
本研究發(fā)現(xiàn)黃荊坪竹根椒密碼子 GC1(42.68%)>GC2(36.25%)>GC3(27.89%),GC3與GC1、GC2均不存在顯著相關性,但GC1與GC2呈極顯著相關(P<0.01),說明黃荊坪竹根椒密碼子第3位偏好使用A或U結尾,使用模式為NNA或NNU,其偏好性主要受自然選擇因素的影響。這與茄科同屬植物番茄(Solanum lycopersicum)[24]、枸杞(Lycium? barbarum)[25]等研究結果相似,表明黃荊坪竹根椒與番茄和枸杞的密碼子使用模式相似。
本研究發(fā)現(xiàn)黃荊坪竹根椒密碼子ENC平均值為46.55>45,其中35條 CDS 的 ENC 值高于45,可推測這些基因密碼子的使用偏性較弱。對黃荊坪竹根椒密碼子的中性繪圖分析表明,密碼子第3位(GC3)與密碼子第1、2位(GC12)中的A、T、C、G組成存在較大差異,GC3含量明顯低于GC12,進一步闡明自然選擇對黃荊坪竹根椒密碼子偏好性的影響較大,這與秋茄(Kandelia obovata)[26]的研究結果一致。利用ENC-plot分析了影響黃荊坪竹根椒密碼子偏性因素,自然選擇相比于突變因素更加能影響黃荊坪竹根椒密碼子偏好性的形成。黃荊坪竹根椒與迎春櫻桃(Prunus discoidea)[27]、酸棗(Ziziphus jujuba var. spinosa)[28]等植物密碼子偏好性研究結果相似,而突變是影響籽粒莧(Amaranthus hypochondriacus)[29]密碼子偏好性形成的主要原因,突變和選擇在芒果(Mangifera indicate L.)[30]密碼子偏好性形成中起同等重要作用??梢?,不同植物在自然進化過程中影響密碼子偏好性的因素可能存在一定的差異,但具體影響密碼子偏好性的機制還有待深入研究。
在黃荊坪竹根椒葉綠體基因組中共篩選出GCA、GCU、AGA等19個最優(yōu)密碼子,且全部以 A/U 結尾,再次證明了黃荊坪竹根椒密碼子使用模式為NNA或NNU,其密碼子的使用模式與菠蘿(Ananas comosus)[31]、金花茶(Camellia nitidissima)[32]等植物的最優(yōu)密碼子 NNA、NNU 的模式相同。黃荊坪竹根椒、菠蘿和金花茶等植物密碼子偏好使用NNA或NNU模式,可能是由于這些植物中密碼子第3位A、U含量偏高所造成的。最優(yōu)密碼子分析表明,在利用黃荊坪竹根椒進行基因工程研究設計外源基因時,優(yōu)先選擇A或U結尾的密碼子,在一定程度上可提高其外源基因的表達轉(zhuǎn)化效果,為今后開展其性狀改良、種質(zhì)資源保存和進化機制研究提供理論支撐。
參考文獻:
[1]Wei L,He J,Jia X,et al. Analysis of codon usage bias of mitochondrial genome in Bombyx mori and its relation to evolution[J]. BMC Evolutionary Biology,2014,14(1):262.
[2]何亞玲,彭業(yè)軍,李 錦,等. 天山雪蓮葉綠體基因組密碼子偏好性分析[J]. 石河子大學學報(自然科學版),2022,40(1):84-92.
[3]肖明昆,嚴 煒,熊賢坤,等. 云南樟葉綠體基因組密碼子偏好性分析[J]. 中南林業(yè)科技大學學報,2022,42(6):127-134.
[4]賴瑞聯(lián),陳 瑾,馮 新,等. 橄欖葉綠體基因組密碼子偏好性特征[J]. 福建農(nóng)林大學學報(自然科學版),2022,51(4):502-509.
[5]Leffler E M,Bullaughey K,Matute D R,et al. Revisiting an old riddle:what determines genetic diversity levels within species?[J]. PLoS Biology,2012,10(9):e1001388.
[6]Christofi M,Pavlou A,Lantzouraki D Z,et al. Profiling carotenoid and phenolic compounds in fresh and canned fruit of peach cultivars:impact of genotype and canning on their concentration[J]. Journal of Food Composition and Analysis,2022,114:104734.
[7]Niu Y F,Gao C W,Liu J.Complete mitochondrial genomes of three Mangifera species,their genomic structure and gene transfer from chloroplast genomes[J]. BMC Genomics,2022,23(1):147.
[8]Han C Y,Ding R,Zong X Y,et al. Structural characterization of Platanthera ussuriensis chloroplast genome and comparative analyses with other species of Orchidaceae[J]. BMC Genomics,2022,23(1):84.
[9]Lian C L,Yang H,Lan J X,et al. Comparative analysis of chloroplast genomes reveals phylogenetic relationships and intraspecific variation in the medicinal plant Isodon rubescens[J]. PLoS One,2022,17(4):e0266546.
[10]孫繼峰,韓太利,徐立功,等. 蘿卜ICE1密碼子使用偏性分析[J]. 核農(nóng)學報,2018,32(3):477-485.
[11]肖 昉,陳 何,陳家蘭,等. 莧菜AtrADH2基因密碼子偏好性與進化分析[J]. 分子植物育種,2022,20(9):2821-2830.
[12]惠小涵,程婷婷,柯衛(wèi)東,等. 蓮藕PPO基因密碼子偏好性特征分析[J]. 江蘇農(nóng)業(yè)學報,2020,36(2):438-446.
[13]閆文濤,張建金,張 婧,等. 生物有機肥用量對日光溫室辣椒生長、產(chǎn)量及品質(zhì)的影響[J]. 中國瓜菜,2022,35(8):86-91.
[14]Barik S,Ponnam N,Reddy A C,et al. Breeding peppers for industrial uses:progress and prospects[J]. Industrial Crops and Products,2022,178:114626.
[15]Chatterjee D,Dutta S K,Kikon Z J,et al. Recycling of agricultural wastes to vermicomposts:characterization and application for clean and quality production of green bell pepper (Capsicum annuum L.)[J]. Journal of Cleaner Production,2021,315(4):128115.
[16]Liu H B,Lu Y Z,Lan B L,et al. Codon usage by chloroplast gene is bias in Hemiptelea davidii[J]. Journal of Genetics,2020,99(1):8.
[17]原曉龍,劉 音,康洪梅,等. 蒜頭果葉綠體基因組密碼子偏好性分析[J]. 西南林業(yè)大學學報(自然科學),2021,41(3):15-22.
[18]Fuglsang A. Impact of bias discrepancy and amino acid usage on estimates of the effective number of codons used in a gene,and a test for selection on codon usage[J]. Gene,2008,410(1):82-88.
[19]Sueoka N. Near homogeneity of PR2-bias fingerprints in the human genome and their implications in phylogenetic analyses[J]. Journal of Molecular Evolution,2001,53(4):469-476.
[20]Wang B,Yuan J,Liu J,et al. Codon usage bias and determining forces in green plant mitochondrial genomes[J]. Journal of Integrative Plant Biology,2011,53(4):324-334.
[21]Song Y F,Yang Q H,Yi X G,et al. Comparative analysis of Codon usage patterns in chloroplast genomes of cherries[J]. Forests,2022,13(11):1891.
[22]Morton B R,Wright S I. Selective constraints on Codon usage of nuclear genes from Arabidopsis thaliana[J]. Molecular Biology and Evolution,2007,24(1):122-129.
[23]Liu Q P,Xue Q Z. Comparative studies on codon usage pattern of chloroplasts and their host nuclear genes in four plant species[J]. Journal of Genetics,2005,84(1):55-62.
[24]陸奇豐,黃至歡,駱文華. 番茄WRKY轉(zhuǎn)錄因子密碼子偏性分析[J]. 分子植物育種,2020,18(18):5908-5916.
[25]段淋淵,戴國禮,焦恩寧,等. 枸杞自交不親和基因S-RNase密碼子偏性分析[J]. 西南林業(yè)大學學報(自然科學),2020,40(2):44-52.
[26]趙 森,鄧力華,陳 芬. 秋茄葉綠體基因組密碼子使用偏好性分析[J]. 森林與環(huán)境學報,2020,40(5):534-541.
[27]葉 琦,宋炎峰,李 蒙,等. 迎春櫻桃葉綠體基因組特征及其密碼子使用偏好性分析[J]. 分子植物育種,2022,20(14):4576-4585.
[28]胡曉艷,許艷秋,韓有志,等. 酸棗葉綠體基因組密碼子使用偏性分析[J]. 森林與環(huán)境學報,2019,39(6):621-628.
[29]喻 鳳,韓 明. 紫花苜蓿葉綠體基因組密碼子偏好性分析[J]. 廣西植物,2021,41(12):2069-2076.
[30]唐玉娟,趙 英,黃國弟,等. 芒果葉綠體基因組密碼子使用偏好性分析[J]. 熱帶作物學報,2021,42(8):2143-2150.
[31]楊祥燕,蔡元保,譚秦亮,等. 菠蘿葉綠體基因組密碼子偏好性分析[J]. 熱帶作物學報,2022,43(3):439-446.
[32]耿曉姍,賈 魏,陳佳寧,等. 金花茶葉綠體基因組密碼子偏好性分析[J]. 分子植物育種,2022,20(7):2196-2203.
收稿日期:2022-12-22
基金項目:湖南省教育廳科學研究重點項目(編號:20A281);湖南省自然科學基金面上項目(編號:2021JJ30376);湖南省科技特派員服務鄉(xiāng)村振興項目(編號:2022NK4218);湘潭市農(nóng)業(yè)科學研究所橫向項目(編號:380220590112)。
作者簡介:龔意輝(1988—),男,湖南漣源人,博士,講師,主要從事園藝作物分子生物學方向研究。E-mail:gyhzgh@163.com。
通信作者:李 鵬,農(nóng)藝師,主要從事果蔬分子生物學方向研究。E-mail:907653797@qq.com。