何積翠 喻達(dá)輝 白麗蓉
摘要:【目的】探究瓜螺(Melo melo)線粒體全基因組密碼子使用偏好性,明確影響密碼子偏好性的因素,為提高基因表達(dá)效率及了解瓜螺線粒體基因組的特性和進(jìn)化方向提供科學(xué)依據(jù)?!痉椒ā恳怨下菥€粒體全基因組序列為研究對象,從中篩選出11條長度大于300 bp且以ATG為起始密碼子的非重復(fù)基因序列,利用CodonW 1.4.2、Excel 2017及SPSS 22.0等軟件進(jìn)行瓜螺線粒體全基因組密碼子偏好性分析?!窘Y(jié)果】不同基因序列密碼子位置所對應(yīng)的G+C含量不同,其中,GC1(密碼子第1位所代表的G+C含量)、GC2(密碼子第2位所代表的G+C含量)、GC3(密碼子第3位所代表的G+C含量)的變化范圍分別為35.20%~51.90%、16.40%~40.60%和13.10%~34.90%,對應(yīng)平均值為41.15%、32.29%和23.71%,GC1和GC2明顯高于GC3;密碼子適應(yīng)指數(shù)(CAI)在0.110~0.180,平均為0.137;密碼子偏好性指數(shù)(CBI)在-0.272~-0.090,平均為-0.175;最優(yōu)密碼子使用頻率(FOP)在0.216~0.339,平均為0.277;有效密碼子數(shù)(ENC)在36.84~53.75,平均為45.59;總平均親水性(GRAVY)在0.480~1.394,平均為0.968。有30個同義密碼子的相對使用度(RSCU)大于1.00,且主要以A/U結(jié)尾。中性繪圖分析發(fā)現(xiàn),GC1和GC2平均值(GC12)與GC3的相關(guān)系數(shù)為-0.438,相關(guān)性不顯著(P>0.05,下同);ENC-plot繪圖分析結(jié)果顯示,各散點(diǎn)(基因)均位于標(biāo)準(zhǔn)曲線附近,其中,NAD4、COX2和NAD3基因位于標(biāo)準(zhǔn)曲線上方,COX1、ATP6、NAD1、NAD6、COB、NAD5、COX3及NAD2等8個基因位于標(biāo)準(zhǔn)曲線下方;在對應(yīng)性分析中,第一、第二、第三、第四向量軸的貢獻(xiàn)率分別23.12%、15.19%、13.17%和9.63%,前4軸累計(jì)差異為61.12%。綜合高頻密碼子與高表達(dá)密碼子,最終篩選出4個最優(yōu)密碼子(UUU、GUU、ACU和CAU),且均以U結(jié)尾?!窘Y(jié)論】瓜螺線粒體全基因組密碼子偏好以A/U結(jié)尾的形式,篩選出的4個最優(yōu)密碼子(UUU、GUU、ACU和CAU)均以U結(jié)尾。除了自然選擇在瓜螺線粒體全基因組密碼子偏好性形成中占主導(dǎo)地位外,突變壓力和堿基組成也影響其密碼子偏好。因此,可通過瓜螺目的基因密碼子優(yōu)化,有效提高外源基因表達(dá)且優(yōu)化性狀決定基因,從而加速瓜螺優(yōu)良親本培育的進(jìn)程。
關(guān)鍵詞: 瓜螺;線粒體;基因組;密碼子偏好性;自然選擇
中圖分類號: S917? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)志碼: A 文章編號:2095-1191(2022)01-0191-09
Codon usage bias analysis in mitochondrial genome of Melo melo
HE Ji-cui, YU Da-hui, BAI Li-rong*
(Beibu Gulf University/Guangxi Key Laboratory of Beibu Gulf Marine Biodiversity Conservation,
Qinzhou, Guangxi? 535011, China)
Abstract:【Objective】The use preference of mitochondrial whole genome codon of Melo melo was investigated, and the factors affecting codon preference were analyzed, to improve gene expression efficiency,study the characteristics, ecological adaptation and evolutionary direction of mitochondrial genome of M. melo. 【Method】Based on the mitochondrial genome sequence of M. melo, eleven non-repetitive sequences with length more than 300 bp and ATG as the starting codon were selected as the research objects, and the codon bias was analyzed by using the softwares of CodonW 1.4.2, Excel 2017, SPSS 22.0. 【Result】The G+C content corresponding to codon positions of different gene sequence varies, including GC1(G+C content represented by codon position 1), GC2(G+C content represented by codon position 2), GC3(G+C content represented by codon position 3), was 35.20%-51.90%, 16.40%-40.60%, 13.10%-34.90%, corresponding average of 41.15%, 32.29%, and 23.71%, respectively. The content of GC1 and GC2 was higher than that of GC3. The codon adaptation index (CAI )value ranged from 0.110 to 0.180, with an average of 0.137. The codonbiasindex (CBI) was at -0.272 to -0.090, with an average of -0.175. The optimal codon usage frequency (FOP) was from 0.216-0.339, with an average of 0.277. The effective codon number (ENC) ranged from 36.84 to 53.75, with an average of 45.59; grand average of hydropathy (GRAVY) ranged from 0.480 to 1.394, with an average of 0.968. There were 30 codons with relative synonymous codon usage (RSCU)>1.00, mainly ending with A/U. Neutral mapping analysis showed that the correlation coefficient between the mean of GC1 and GC2(GC12) and GC3 was -0.438, the correlation was not significant(P>0.05, the same below). ENC-plot analysis showed that all genes were located near the standard curve, among them, NAD4, COX2 and NAD3 genes were located above the standard curve, and eight genes including COX1, ATP6, NAD1, NAD6, COB, NAD5, COX3 and NAD2 were located below the standard curve. Correspondence analysis showed that the first, second, third and fourth axis contributed 23.12%, 15.19%, 13.17% and 9.63% of the difference, respectively. The total contribution rate of the first four vectors was 61.12%. Combining high frequency codons and high expression codons, four optimal codons (UUU, GUU, ACU and CAU) were selected, all ending with U. 【Conclusion】The whole mitochondrial genome codon of M. melo mainly prefers to use the codon ending in A/U, and the four selected optimal codons (UUU, GUU, ACU, and CAU) end with U. In addition to dominating natural selection in genome-wide codon preference formation in M. melo mitochondria, mutational pressure and base composition also influence their codon preference. Codon optimization of the target gene can effectively improve the foreign gene expression and optimize the trait determination gene, so as to accelerate the process of excellent parental cultivation.
Key words: Melo melo; mitochondria; genome; codon bias; natural selection
Foundation items: National Key Research and Development Program of China(2018YFD0901406); Guangxi Key Research and Development Project(2018AB52002); Guangxi Natural Science Foundation (2021GXNSFAA075008)
0 引言
【研究意義】自然界中DNA序列以三聯(lián)密碼子法則翻譯成氨基酸,經(jīng)組裝修飾后形成具有特定空間結(jié)構(gòu)和功能的蛋白(Zhang et al.,2011)。遺傳信息主要是按照“中心法則”進(jìn)行傳遞,即從DNA轉(zhuǎn)錄為mRNA,最后翻譯成氨基酸的過程(段曉克,2015),而準(zhǔn)確識別編碼不同氨基酸密碼子是保證遺傳信息正確表達(dá)的關(guān)鍵(楊國鋒等,2015)。在生物體內(nèi)的蛋白翻譯過程中,編碼同一種氨基酸的不同密碼子稱之為同義密碼子(Synonymous codon)(吳憲明等,2007)。在密碼子使用過程中,會出現(xiàn)某些密碼子使用頻率高于其他同義密碼子使用頻率的現(xiàn)象,稱為密碼子使用偏好性(Codon usage bias,CUB)(武志娟和鐘金城,2012)。密碼子偏好性是導(dǎo)致外源基因在宿主中表達(dá)量降低的原因之一,且受自然選擇和突變壓力等因素的共同影響。因此,研究密碼子偏好性對揭示物種進(jìn)化關(guān)系及提高外源基因的表達(dá)具有重要作用,同時對進(jìn)一步了解生物基因或基因組特征和生態(tài)適應(yīng)等具有重要意義。【前人研究進(jìn)展】至今,線粒體基因組密碼子使用模式已在小麥(Triticum aestivum)、擬南芥(Arabidopsis thaliana)和煙草(Nicotiana tabacum)等農(nóng)作物(Zhou and Li,2009),以及壯體長春鳊(Parabramis pekinensis strenosom)、團(tuán)頭魴(Megalobrama amblycephala)(段曉克,2015)、真白鮭(Coregonus lavaretus)(朱秀芳等,2015)、小鯢科(姜艷,2016)、斑石鯛(Oplegnathus punctatus)和條石鯛(O. fasciatus)(孟乾等,2020)等水生生物上得到廣泛研究及應(yīng)用,有效解釋了影響其密碼子偏性形成的原因,也為了解系統(tǒng)發(fā)育、分子進(jìn)化過程及遺傳育種等提供了理論依據(jù)(徐蘇麗等,2013;蔣瑋等,2014;Barbhuiya et al.,2020)。此外,張志東等(2019)利用生物信息學(xué)方法對文蛤?qū)伲∕eretrix)貝類進(jìn)行密碼子偏好性分析,明確其密碼子偏好性及特征,同時比較文蛤與近緣種密碼子使用偏好性的差異;孟乾等(2020)利用中性繪圖分析及聚類分析等生物信息學(xué)方法,從mtDNA水平上分析斑石鯛和條石鯛編碼蛋白序列的密碼子使用偏好性,并與其他魚類的密碼子偏好性進(jìn)行對比;慎佩晶等(2020)通過對羅氏沼蝦(Macrobrachium rosenbergii)相關(guān)的同義密碼子進(jìn)行密碼子偏好性分析,發(fā)現(xiàn)其偏向于以T或A結(jié)尾的密碼子,與黑腹果蠅(Drosophila melanogaster)、中華絨螯蟹(Eriocheir sinensis)及酵母(Saccharomyces cervisiae)等相比,羅氏沼蝦具有明顯不同的密碼子偏好性。【本研究切入點(diǎn)】瓜螺(Melo melo)又稱油螺或紅螺,隸屬于軟體動物門(Mollusca)腹足綱(Gastropoda)新腹足目(New Gastropoda)渦螺科(Oncomelania)(鄭小東和曲學(xué)存,2013;Zhong et al.,2019)。瓜螺腹足部肉質(zhì)肥厚、營養(yǎng)豐富、味道鮮美,且具有清火明目之功效,但近年來因采捕野生數(shù)量不斷減少,導(dǎo)致其種質(zhì)資源日漸枯竭。培育具有優(yōu)良性狀的親本繁殖后代對保護(hù)瓜螺種質(zhì)資源具有重要意義,而明確密碼子偏好性能有效提高外源基因的表達(dá)并優(yōu)化性狀決定基因,進(jìn)而加速優(yōu)良親本的培育進(jìn)程?!緮M解決的關(guān)鍵問題】以瓜螺線粒體全基因組序列為研究對象,利用CodonW 1.4.2、Excel 2020及SPSS 20.0等軟件探究瓜螺線粒體全基因組密碼子的使用偏好性,明確影響密碼子偏好性的因素,為提高基因表達(dá)效率及了解瓜螺線粒體基因組的特性和進(jìn)化方向提供科學(xué)依據(jù)。
1 材料與方法
1. 1 序列來源與分析
從NCBI細(xì)胞器基因組數(shù)據(jù)庫中搜索瓜螺拉丁名:Melo melo,檢索并下載瓜螺線粒體全基因組序列及其編碼區(qū)(Coding DNA sequence,CDS),瓜螺線粒體全基因組序列全長15721 bp,包含37個基因。為確保試驗(yàn)數(shù)據(jù)的準(zhǔn)確性,本研究選取11條長度大于300 bp且以ATG為起始密碼子的非重復(fù)基因序列進(jìn)行密碼子偏好性分析(柳燕杰等,2020;王宇等,2020),并利用CodonW 1.4.2、Excel 2017及SPSS 22.0等軟件進(jìn)行統(tǒng)計(jì)分析。
1. 2 密碼子偏好性參數(shù)計(jì)算
以選取的CDS序列為研究對象,采用CodonW 1.4.2分析密碼子偏好性參數(shù),包括密碼子G+C總含量及GC1(密碼子第1位所代表的G+C含量)、GC2(密碼子第2位所代表的G+C含量)、GC3(密碼子第3位所代表的G+C含量)、GC3S(同義密碼子第3位的G+C含量)、密碼子適應(yīng)指數(shù)(Codon adaption index,CAI)、密碼子偏好性指數(shù)(Codon bias index,CBI)、最優(yōu)密碼子使用頻率(Frequency of optimal codon,F(xiàn)OP)、有效密碼子數(shù)(Effective number of codon,ENC)、同義密碼子相對使用度(Relative synonymous codon usage,RSCU)及蛋白疏水性均值(Grand average of hydropathy,GRAVY)(王鵬良等,2019;趙森等,2019)。其中,ENC的范圍在20~61,ENC越小說明偏好性越強(qiáng),通常以35為標(biāo)準(zhǔn),當(dāng)ENC小于35時偏好性較強(qiáng),反之則越弱(王媛媛和楊美青,2021)。RSCU為某一特定密碼子使用頻率/其在無偏好性時的使用頻率,以1.00為標(biāo)準(zhǔn),當(dāng)RSCU小于1.00時說明該密碼子使用頻率較低,RSCU等于1.00時說明該密碼子無偏好性,而RSCU大于1.00時表明該密碼子使用頻率較高(吳憲明等,2007)。CAI的變化范圍在0~1,CAI越小說明密碼子偏好性越弱(吳憲明等,2007;周丹等,2013)。
1. 3 中性繪圖分析
中性繪圖是初步判斷影響密碼子使用偏好因素的方法之一(原曉龍等,2020b),是以GC3為橫坐標(biāo)、GC12為縱坐標(biāo),繪制散點(diǎn)圖。GC12是GC1和GC2的平均值。中性繪圖可根據(jù)密碼子的前2位堿基和第3位堿基的關(guān)系,而判斷密碼子使用偏好是由突變壓力還是自然選擇所造成。如果散點(diǎn)均在對角線上,說明密碼子偏好性受突變壓力的影響,否則就是受自然選擇的影響(梁曉靜等,2020;原曉龍等,2020a)。
1. 4 ENC-plot繪圖分析
以GC3S為橫坐標(biāo)、ENC為縱坐標(biāo),繪制散點(diǎn)圖,且在坐標(biāo)系中繪制ENC的標(biāo)準(zhǔn)曲線。如果散點(diǎn)均在標(biāo)準(zhǔn)曲線附近,說明密碼子偏好性只受突變壓力的影響;若散點(diǎn)均位于標(biāo)準(zhǔn)曲線下方,說明密碼子偏好更多是受自然選擇的影響(吳憲明等,2007;王鵬良等,2018)。標(biāo)準(zhǔn)曲線公式如下:
ENC=2+GC3S+[29GV3S2+(1-GC3S2)]? ? ? ?(1)
為了更準(zhǔn)確地體現(xiàn)ENC期望值(ENCexp)與ENC實(shí)際值(ENCobs)的差異,而統(tǒng)計(jì)ENC比值(ENCRatio)頻數(shù)分布情況,具體公式如下:
ENCRatio=[ENCexp-ENCobsENCexp]? ? ? (2)
當(dāng)ENCexp與ENCobs接近時,表明基因密碼子受突變壓力的影響;而ENCexp與ENCobs差別較大時,說明基因密碼子受自然選擇的影響(趙洋等,2016;趙婉清等,2020)。
1. 5 對應(yīng)性分析
參照王鵬良等(2018)的方法進(jìn)行對應(yīng)性分析,根據(jù)對應(yīng)性分析得到影響瓜螺線粒體全基因密碼子偏好性的因素。
1. 6 最優(yōu)密碼子確定
以ENC為標(biāo)準(zhǔn),對所有參試基因按從大到小的順序進(jìn)行排列,分別從ENC的兩端選取20%的參試基因(各選2個),建立高表達(dá)基因庫和低表達(dá)基因庫(姜艷等,2016)。
ΔRSCU=RSCUH-RSCUL
將高表達(dá)基因庫(RSCUH)與低表達(dá)基因庫(RSCUL)的同義密碼子相對使用度差值(ΔRSCU)>0.08的判為高表達(dá)密碼子,同義密碼子相對使用度(RSCU)>1.00的密碼子為高頻密碼子。既是高表達(dá)又是高頻的密碼子即為最優(yōu)密碼子(Optimal codon)(段曉克,2015;姜艷等,2016)。
2 結(jié)果與分析
2. 1 密碼子組成分析結(jié)果
瓜螺線粒體基因組是一個總長為15721 bp的環(huán)狀DNA分子,包含有37個基因,G+C含量為31.66%,A+T含量為68.34%,說明瓜螺表現(xiàn)出對A和T堿基的偏好性。瓜螺線粒體基因組特征如表1所示。根據(jù)密碼子使用偏好分析要求,篩選得到11條非重復(fù)且長度大于300 bp的基因序列,采用CodonW 1.4.2對篩選獲得的11條基因序列進(jìn)行分析,結(jié)果(表2)顯示,不同基因序列密碼子位置所對應(yīng)的G+C含量也不同,其中,GC1的范圍在35.20%~51.90%,GC2的范圍在16.40%~40.60%,GC3的范圍在13.10%~34.90%,GC1、GC2、GC3的平均值分別為41.15%、32.29%和23.71%,說明瓜螺線粒體全基因組密碼子偏好以堿基U或A結(jié)尾的密碼子為主。CAI的范圍在0.110~0.180,平均為0.137,說明瓜螺密碼子偏好性較弱;CBI的范圍在-0.272~-0.090,平均為-0.175;FOP的范圍在0.216~0.339,平均為0.277;ENC的范圍在36.84~53.75,平均為45.59,且ENC均大于35,也說明瓜螺密碼子偏好性較弱;GRAVY的范圍在0.480~1.394,平均為0.968。
密碼子偏好性參數(shù)相關(guān)分析結(jié)果(表3)表明:GC1與GC2和GC3的相關(guān)性不顯著(P>0.05,下同);GC1與GC和CAI呈極顯著正相關(guān)(P<0.01,下同),與GRAVY呈極顯著負(fù)相關(guān),其相關(guān)系數(shù)分別為0.814、0.806和-0.780;GC2與GC3呈顯著負(fù)相關(guān)(P<0.05,下同),其相關(guān)系數(shù)為-0.643,與其他參數(shù)的相關(guān)性均未達(dá)顯著水平;GC3與GC3S和ENC呈極顯著負(fù)相關(guān),其相關(guān)系數(shù)分別為0.992和0.768;GC3S與ENC呈極顯著正相關(guān),其相關(guān)系數(shù)為0.797??梢?,GC3和GC3S對瓜螺線粒體全基因組密碼子偏好性有較大的影響作用,但二者與GC、CAI、CBI、FOP和GRAVY的相關(guān)性均不顯著。GC與CBI和FOP呈顯著正相關(guān),其相關(guān)系數(shù)分別為0.616和0.653;CAI與FOP呈顯著相關(guān),與GRAVY呈極顯著負(fù)正相關(guān),相關(guān)系數(shù)分別為0.677和-0.777;CBI與FOP呈極顯著正相關(guān),其相關(guān)系數(shù)為0.948。
RSCU分析結(jié)果(表4)顯示,有30個同義密碼子的RSCU大于1.00。在這30個同義密碼子中,以堿基U結(jié)尾的同義密碼子有15個,以堿基A結(jié)尾的有14個,以堿基G結(jié)尾的僅有1個,即以堿基U和A結(jié)尾的同義密碼子數(shù)目占總同義密碼子數(shù)目的96.67%,說明瓜螺線粒體全基因組密碼子偏好以堿基U或A結(jié)尾。
2. 2 中性繪圖分析結(jié)果
瓜螺線粒體基因中性繪圖分析結(jié)果(圖1)表明,GC3的范圍在13.10%~34.90%,GC12的范圍在26.70%~46.25%。GC12與GC3的相關(guān)系數(shù)為-0.438,相關(guān)性不顯著;回歸方程為y=-0.3256x+0.4444(R2=0.1914),說明GC12與GC3的相關(guān)性不強(qiáng)。在圖1中,幾乎所有的散點(diǎn)(基因)都在對角線上方,僅有1個基因在對角線下方,且GC12均高于GC3,說明瓜螺線粒體基因組密碼子偏好雖然受突變壓力的影響,但受自然選擇的影響作用更大。
2. 3 ENC-plot繪圖分析結(jié)果
采用SPSS 22.0進(jìn)行ENC-plot繪圖分析,以GC3S為橫坐標(biāo)、ENC為縱坐標(biāo)建立直角坐標(biāo)系圖,將各參數(shù)導(dǎo)入該坐標(biāo)系,并根據(jù)公式(1)添加標(biāo)準(zhǔn)曲線。瓜螺線粒體基因組密碼子ENC-plot繪圖分析結(jié)果(圖2)表明,各散點(diǎn)(基因)均位于標(biāo)準(zhǔn)曲線附近,其中,NAD4、COX2和NAD3基因位于標(biāo)準(zhǔn)曲線上方,COX1、ATP6、NAD1、NAD6、COB、NAD5、COX3及NAD2等8個基因位于標(biāo)準(zhǔn)曲線下方。為了更準(zhǔn)確地體現(xiàn)ENCexp與ENCobs的差異,通過公式(2)計(jì)算ENCRatio,并統(tǒng)計(jì)其頻數(shù)分布情況。由表5可知,有63.64%基因的ENCRatio范圍在0~0.1,18.18%基因的ENCRatio范圍在-0.1~0,ENCRatio范圍在-0.2~-0.1和0.1~0.2的基因各占9.09%,說明突變壓力和自然選擇均對瓜螺線粒體全基因組密碼子偏好性的有影響,但以自然選擇占主導(dǎo)地位。
2. 4 對應(yīng)性分析結(jié)果
對應(yīng)性分析結(jié)果表明:第一、第二、第三和第四向量軸的貢獻(xiàn)率分別為23.12%、15.19%、13.17%和9.63%,前4軸的累計(jì)差異為61.12%。第一和第二向量軸的貢獻(xiàn)率均大于15.00%,說明第一、第二向量軸是瓜螺線粒體全基因組密碼子偏好性的主要影響因素。第一向量軸與GC3和GC3S呈極顯著正相關(guān),其相關(guān)系數(shù)分別為0.803和0.804,與GC2呈極顯著負(fù)相關(guān),相關(guān)系數(shù)為-0.750,說明堿基差異對瓜螺線粒體全基因密碼子偏好性有一定影響;第一向量軸與GC1、GC、CAI、CBI、FOP、ENC的相關(guān)系數(shù)分別為0.272、0.231、0.013、0.208、-0.007和0.539,相關(guān)性均不顯著。為更好地觀察瓜螺線粒體全基因密碼子偏好性,以第一向量軸為橫坐標(biāo)、第二向量軸為縱坐標(biāo)繪制對應(yīng)性分析圖,結(jié)果(圖3)發(fā)現(xiàn)ATP6、COB、NAD5、NAD4、NAD1、COX2、NAD3及NAD2等8個基因相對較集中,說明這8個基因密碼子使用偏好較接近,而另外3個基因相對較分散,可能是密碼子使用偏好存在明顯差異。
2. 5 最優(yōu)密碼子分析結(jié)果
高、低表達(dá)基因庫的ΔRSCU如表6所示。按ΔRSCU>0.08的標(biāo)準(zhǔn),共確定獲得29個瓜螺線粒體全基因組高表達(dá)密碼子,其中,0.30>ΔRSCU>0.08的有9個密碼子(表6中以*標(biāo)注),0.50>ΔRSCU>0.30的有4個密碼子(表6中以**標(biāo)注),ΔRSCU>0.50的有16個密碼子(表6中以***標(biāo)注)。在這些高表達(dá)密碼子中,以C結(jié)尾的密碼子有11個,以G結(jié)尾的有9個,以U結(jié)尾的有6個,以A結(jié)尾的有3個。將表4中的30個高頻密碼子與表6中的29個高表達(dá)密碼子進(jìn)行綜合分析,確定既是高表達(dá)密碼子又是高頻密碼子的密碼子為最優(yōu)密碼子,最終確定出4個最優(yōu)密碼子,分別為UUU、GUU、ACU和CAU,對應(yīng)編碼苯丙氨酸(Phe)、纈氨酸(Val)、組氨酸(His)和蘇氨酸(Thr)4個氨基酸殘基,且這4個最優(yōu)密碼子均以U結(jié)尾,說明最優(yōu)密碼子偏好以U結(jié)尾的形式。
3 討論
同義密碼子的主要區(qū)別在其第3位堿基上。本研究的密碼子偏好性參數(shù)相關(guān)分析結(jié)果表明,GC1與GC2和GC3相關(guān)不顯著,GC2與GC3呈極顯著負(fù)相關(guān),且GC1和GC2明顯高于GC3,說明瓜螺線粒體全基因組偏好使用以A/U結(jié)尾的密碼子,RSCU分析結(jié)果(RSCU>1.00的密碼子有30個,以A/U結(jié)尾的有29個)也支持這一觀點(diǎn),與張志東等(2019)分析5種文蛤?qū)儇愵惥€粒體基因密碼子使用偏好性、孟乾等(2020)分析斑石鯛和條石鯛線粒體基因組密碼子使用偏好性、慎佩晶等(2020)分析羅氏沼蝦轉(zhuǎn)錄組線粒體密碼子使用偏好性得出的結(jié)論相似;不同的是斑石鯛和條石鯛線粒體基因組密碼子偏好以A/C結(jié)尾的形式(孟乾等,2020)、羅氏沼蝦轉(zhuǎn)錄組線粒體密碼子偏好以A/T/U結(jié)尾的形式(慎佩晶等,2020),李喜蓮等(2014)分析螯蝦次目功能基因密碼子偏好時則發(fā)現(xiàn)其偏好于C/G結(jié)尾的密碼子,說明不同生物的線粒體基因密碼子使用規(guī)律具有相似性,但也存在一定差異。瓜螺線粒體基因組ENC平均值為45.59,參照王媛媛和楊美青等(2021)的研究結(jié)論(ENC>35表明密碼子偏好性較弱,ENC<35則密碼子偏好性較強(qiáng))可判定,瓜螺線粒體基因組密碼子為弱偏好性,其CAI參數(shù)數(shù)據(jù)也支持這一觀點(diǎn)。
影響密碼子偏好性的因素諸多,包括突變壓力、自然選擇、堿基組成及tRNA豐度等(吳憲明等,2007;梁菲菲,2010;李若愚等,2021)。一般認(rèn)為影響密碼子偏好的兩大主要因素是突變壓力和自然選擇(Hershberg and Petrov,2008;吳煒倩等,2020)。本研究結(jié)果表明,GC3和GC3S與ENC均呈極顯著相關(guān),在對應(yīng)性分析中第一向量軸與GC3和GC3S呈極顯著正相關(guān),其相關(guān)系數(shù)分別為0.803和0.804,說明堿基組成也是影響瓜螺線粒體全基因組密碼子偏好性的因素之一;GRAVY與CBI和FOP的相關(guān)性不顯著,說明瓜螺線粒體全基因組密碼子偏好性對蛋白的親/疏水性幾乎沒有影響。此外,由中性繪圖分析和ENC-plot繪圖分析可知,瓜螺線粒體全基因組密碼子偏好性雖然受突變壓力的作用,但更多的是受自然選擇所影響。
4 結(jié)論
瓜螺線粒體全基因組密碼子偏好以A/U結(jié)尾的形式,篩選出的4個最優(yōu)密碼子(UUU、GUU、ACU和CAU)均以U結(jié)尾。除了自然選擇在瓜螺線粒體全基因組密碼子偏好性形成中占主導(dǎo)地位外,突變壓力和堿基組成也影響瓜螺線粒體基因組密碼子偏好。因此,可通過瓜螺目的基因密碼子優(yōu)化,有效提高外源基因表達(dá)且優(yōu)化性狀決定基因,從而加速瓜螺優(yōu)良親本培育的進(jìn)程。
參考文獻(xiàn):
段曉克. 2015. 壯體長春鳊線粒體基因組全長測定及團(tuán)頭魴密碼子偏好模型分析[D]. 武漢:華中農(nóng)業(yè)大學(xué). [Duan X K. 2015. Studies on complete mitochondrial genome of Parabramis pekinensis strenosoma and codon usage patterns of Megalobrma amblycephala[D]. Wuhan:Huazhong Agricultural University.] doi:10.7666/d.Y2803757.
姜艷,張全星,管德龍,許升全. 2016. 小鯢科動物Cytb基因密碼子偏好性分析[J]. 陜西師范大學(xué)學(xué)報(自然科學(xué)版),44(4):77-82. [Jiang Y,Zhang Q X,Guan D L,Xu S Q. 2016. Codon bias of Cytb genes in hynobiidae[J]. Journal of Shaanxi Normal University(Natural Science Edition),44(4):77-82.] doi:10.15983/j.cnki.jsnu.2016.04.345.
姜艷. 2016. 小鯢科線粒體基因組密碼子偏好性及進(jìn)化關(guān)系的分析[D]. 西安:陜西師范大學(xué). [Jiang Y. 2016. Analysis of codon bias and evolutionary relationship in mitochondrial genome of Hynobidae[D]. Xi’an:Shaanxi Normal University.]
蔣瑋,呂貝貝,何建華,王金斌,吳瀟,武國干,鮑大鵬,陳明杰,張勁松,譚琦,唐雪明. 2014. 草菇密碼子偏好性分析[J]. 生物工程學(xué)報,30(9):1424-1435. [Jiang W,Lü B B,He J H,Wang J B,Wu X,Wu G G,Bao D P,Chen M J,Zhang J S,Tan Q,Tang X M. 2014. Codon usage bias in the straw mushroom Volvariella volvacea[J]. Chinese Journal of Biotechnology,30(9):1424-1435.] doi:10. 13345/j.cjb.130623.
李若愚,張小丹,馬昕怡,郭瑞,顏少賓,金光,周平. 2021. 桃基因密碼子使用模式及其偏好性分析[J]. 分子植物育種,19(3):799-807. [Li R Y,Zhang X D,Ma X Y,Guo R,Yan S B,Jin G,Zhou P. 2021. Analysis of codon usage patterns and codon usage bias in peach (Prunus persica)[J] Molecular Plant Breeding,19(3):799-807.] doi:10. 13271/j.mpb.019.000799.
李喜蓮,楊元杰,李倩,劉金殿,顧志敏. 2014. 螯蝦次目功能基因密碼子偏好性研究[J]. 浙江農(nóng)業(yè)學(xué)報,26(4):862-867. [Li X L,Yang Y J,Li Q,Liu J D,Gu Z M. 2014. Analysis on codon bias of functional gene of Astacidea[J]. Acta Agriculturae Zhejiangensis,26(4):862-867.] doi:10.3969/j.issn.1004-1524.2014.04.04.
梁菲菲. 2010. 密碼子偏性的影響因素及研究意義[J]. 畜牧與飼料科學(xué),31(1):118-119. [Liang F F. 2010. Influen-cing factors of codon bias and its research significance[J]. Animal Husbandry and Feed Science,31(1):118-119.] doi:10.16003/j.cnki.issn1672-5190.2010.01.077.
梁曉靜,朱昌叁,李開祥,安家成,王鵬良. 2020. 香樟轉(zhuǎn)錄組基因密碼子偏好性分析[J]. 廣西植物,41(12):2077-2083. [Liang X J,Zhu C S,Li K X,An J C,Wang P L. 2020. Genes codon bias of transcriptome in Cinnamomum camphora[J]. Guihaia,41(12):2077-2083.] doi:10. 11931/guihaia.gxzw202003074.
柳燕杰,田旭平,李倩. 2020. 美國紅梣葉綠體基因組密碼子偏好性分析[J]. 江蘇農(nóng)業(yè)科學(xué),48(15):83-88. [Liu Y J,Tian X P,Li Q. 2020. Analysis of codon bias in chloroplast genome of Fraxinus pennsylvanica[J]. Jiangsu Agricultural Science,48(15):83-88.] doi:10.15889/j.issn.1002- 1302.2020.15.014.
孟乾,張志勇,張志偉,張曹進(jìn),陳淑吟,祝斐,賈超峰,曹廣勇. 2020. 斑石鯛和條石鯛線粒體基因組密碼子使用分析[J]. 水產(chǎn)科學(xué),39(5):702-709. [Meng Q,Zhang Z Y,Zhang Z W,Zhang C J,Chen S Y,Zhu F,Jia C F,Cao G Y. 2020. Codon bias and cluster analysis on coding regions of mtDNA in rock porgy Oplegnathus punctatus and rock bream O. fasciatus[J]. Fisheries Science,39(5):702-709.] doi:10.16378/j.cnki.1003-1111.2020.05.008.
慎佩晶,張宇飛,李喜蓮,高強(qiáng),徐洋,黃振遠(yuǎn),蔣文枰,陳雪峰. 2020. 羅氏沼蝦轉(zhuǎn)錄組密碼子使用偏好性分析[J]. 現(xiàn)代農(nóng)業(yè)科技,(16):175-178. [Shen P J,Zhang Y F,Li X L,Gao Q,Xu Y,Huang Z Y,Jiang W P,Chen X F. 2020. Analysis of codon usage bias based on Macrobrachium rosenbergii transcriptome[J]. Modern Agricultural Science and Technology,(16):175-178.] doi:10.3969/j.issn.1007-5739.2020.16.103.
王鵬良,吳雙成,楊利平,王華宇,陳乃明,張照遠(yuǎn). 2019. 巨桉葉綠體基因組密碼子偏好性分析[J]. 廣西植物,39(12):1583-1592. [Wang P L,Wu S C,Yang L P,Wang H Y,Chen N M,Zhang Z Y. 2019. Analysis of codon bias of chloroplast genome in Eucalyptus grandis[J]. Guihaia,39(12):1583-1592.] doi:10.11931/guihaia.gxzw201810027.
王鵬良,楊利平,吳紅英,農(nóng)有良,吳雙成,肖玉菲,覃子海,王華宇,劉海龍. 2018. 普通油茶葉綠體基因組密碼子偏好性分析[J]. 廣西植物,38(2):135-144. [Wang P L,Yang L P,Wu H Y,Nong Y L,Wu S C,Xiao Y F,Qin Z H,Wang H Y,Liu H L. 2018. Condon preference of chloroplast genome in Camellia oleifera[J]. Guihaia,38(2):135-144.] doi:10.11931/guihaia.gxzw201708001.
王宇,周俊良,唐冬梅,仲偉敏,馬玉華,張敏. 2020. 闊葉獼猴桃葉綠體基因組特征及密碼子偏好性分析[J]. 種子,39(5):13-19. [Wang Y,Zhou J L,Tang D M,Zhong W M,Ma Y H,Zhang M. 2020. Analysis of chloroplast genome characteristics and codon preference in broad-leaf kiwifruit[J]. Seed,39(5):13-19.] doi:10.16590/j.cnki. 1001-4705.2020.05.013.
王媛媛,楊美青. 2021. 蒙古韭葉綠體基因組密碼子使用偏好性分析[J]. 分子植物育種,19(4):1084-1092. [Wang Y Y,Yang M Q. 2021. Analysis of the codon usage bias in the chloroplast genome of Allium mongolicum Regel[J]. Molecular Plant Breeding,19(4):1084-1092.] doi:10.13271/ j.mpb.019.001084.
吳煒倩,胡源,胡接力,黃愛龍,涂增. 2020. 乙型肝炎病毒密碼子偏好性及影響因素分析[J]. 中國病原生物學(xué)雜志,15(12):1404-1410. [Wu W Q,Hu Y,Hu J L,Huang A L,Tu Z. 2020. Codon usage bias of the hepatitis B virus and factors influencing it[J]. Journal of Parasitic Biology,15(12):1404-1410.] doi:10.13350/j.cjpb.201208.
吳憲明,吳松鋒,任大明,朱云平,賀福初. 2007. 密碼子偏性的分析方法及相關(guān)研究進(jìn)展[J]. 遺傳,29(4):420-426. [Wu X M,Wu S F,Ren D M,Zhu Y P,He F C. 2007. The analysis method and progress in the study of codon bias[J]. Hereditas(Beijing),29(4):420-426.] doi:10. 3321/j.issn:0253-9772.2007.04.006.
武志娟,鐘金城. 2012. 密碼子偏性及其應(yīng)用[J]. 生物學(xué)通報,47(4):9-11. [Wu Z J,Zhong J C. 2012. Codon usage bias and its application[J]. Bulletin of Biology,47(4):9-11.] doi:10.3969/j.issn.0006-3193.2012.04.004.
徐蘇麗,王俊峰,陳士華. 2013. 稻瘟病病菌線粒體基因密碼子使用偏好性分析[J]. 河南農(nóng)業(yè)大學(xué)學(xué)報,47(6):722-726. [Xu S L,Wang J F,Chen S H. 2013. Analysis on codon usage preference of mitochondria genome of Magaporthe orisea[J]. Journal of Henan Agricultural University,47(6):722-726.] doi:10.16445/j.cnki.1000-2340.2013. 06.011.
楊國鋒,蘇昆龍,趙怡然,宋智斌,孫娟. 2015. 蒺藜苜蓿葉綠體密碼子偏好性分析[J]. 草業(yè)學(xué)報,24(12):171-179. [Yang G F,Su K L,Zhao Y R,Song Z B,Sun J. 2015. Analysis of codon usage in the chloroplast genome of Medicago truncatula[J]. Acta Prataculturae Sinica,24(12):171-179.] doi:10.11686/cyxb2015016.
原曉龍,李云琴,王毅,張勁峰. 2020a. 西南樺葉綠體基因組密碼子偏好性分析[J]. 基因組學(xué)與應(yīng)用生物學(xué),39(12):5758-5764. [Yuan X L,Li Y Q,Wang Y,Zhang J F. 2020a. Analysis of codon usage in the chloroplast genome of Betula alnoides[J]. Genomics and Applied Bio-logy,39(12):5758-5764.] doi:10.13417/j.gab.039.005758.
原曉龍,李云琴,張勁峰,王毅. 2020b. 乳油木葉綠體基因組密碼子偏好性分析[J]. 分子植物育種,18(17):5658-5664. [Yuan X L,Li Y Q,Zhang J F,Wang Y. 2020b. Codon usage bias analysis of chloroplast genome in Vitellaria paradoxa[J]. Molecular Plant Breeding,18(17):5658-5664.] doi:10.13271/j.mpb.018.005658.
張志東,陳愛華,吳楊平,張雨,陳素華,曹奕,曹廣勇,田鎮(zhèn). 2019. 5種文蛤?qū)儇愵惥€粒體基因密碼子偏好性分析[J]. 海洋漁業(yè),41(5):589-595. [Zhang Z D,Chen A H,Wu Y P,Zhang Y,Chen S H,Cao Y,Cao G Y,Tian Z. 2019. Analysis of codon usage bias in five species of Meretrix[J]. Marine Fisheries,41(5):589-595.] doi:10.13233/j.cnki.mar.fish. 2019.05.006.
趙森,鄧力華,陳芬. 2020. 秋茄葉綠體基因組密碼子使用偏好性分析[J]. 森林與環(huán)境學(xué)報,40(5):534-541. [Zhao S,Deng L H,Chen F. 2020. Codon usage bias of chloroplast genome in Kandelia obovata[J]. Journal of Forest and Environment,40(5):534-541.] doi:10.13324/j.cnki.jfcf.2020.05.011.
趙婉清,張敏,柳大軍,雷慧,伊文博,劉佳,高志忠,張虎芳. 2020. 菜蝽線粒體基因組密碼子偏好性分析[J]. 山西農(nóng)業(yè)科學(xué),48(7):1005-1009. [Zhao W Q,Zhang M,Liu D J,Lei H,Yi W B,Liu J,Gao Z Z,Zhang H F. 2020. Ana-lysis of codon usage bias in mitochondrial genome of Eurydema dominulus[J]. Journal of Shanxi Agricultural Scien-ces,48(7):1005-1009.] doi:10.3969/j.issn.1002-2481. 2020.07. 01.
趙洋,劉振,楊培迪,成楊,楊陽. 2016. 密碼子偏性分析方法及茶樹中密碼子偏性研究進(jìn)展[J]. 茶葉通訊,43(2):3-7. [Zhao Y,Liu Z,Yang P D,Cheng Y,Yang Y. 2016. Codon bias analysis method and research progress on codon bias in Camellia sinensis[J]. Tea Communication,43(2):3-7.] doi:10.3969/j.issn.1009-525X.2016.02.001.
鄭小東,曲學(xué)存. 2013. 中國水生貝類圖譜[M]. 青島:青島出版社. [Zheng X D,Qu X C. 2013. Atlas of aquatic molluscs in China[M]. Qingdao:Qingdao Press House.]
周丹,薛仁余,張曉峰,杜科,馬吉敏,顧穎,孫效文. 2013. 鯉和斑馬魚HOX基因家族同義密碼子使用偏性的分析[J]. 水產(chǎn)學(xué)雜志,26(2):19-25. [Zhou D,Xue R Y,Zhang X F,Du K,Ma J M,Gu Y,Sun X W. 2013. Sysnonymous codon bias of HOX gene family in common carp(Cyprinus carpio) and zebrafish(Danio rerio)[J]. Chinese Journal of Fisheries,26(2):19-25.] doi:10.3969/j.issn.1005-3832.2013.02.004.
朱秀芳,郭宇超,米琦,劉頓. 2015. 真白鮭線粒體蛋白編碼基因的密碼子偏性研究[J]. 凱里學(xué)院學(xué)報,33(6):60-63. [Zhu X F,Guo Y C,Mi Q,Liu D. 2015. Analysis on codon usage of mitochondrial protein-coding genes of Coregonus lavaretus[J]. Journal of Kaili University,33(6):60-63.] doi:10.3969/j.issn.1673-9329.2015.06.18.
Barbhuiya P A,Uddin A,Chakraborty S. 2020. Analysis of compositional properties and codon usage bias of mitochondrial CYB gene in anura,urodela and gymnophiona[J]. Gene,751:144762. doi:10.1016/j.gene.2020.144762.
Hershberg R,Petrov D A. 2008. Selection on codon bias[J]. Annual Review of Genetics,42:287-299. doi:10.1146/annurev.genet.42.110807.091442.
Zhang L,Guo Y,Luo L,Wang Y P,Dong Z M,Sun S H,Qiu L J. 2011. Analysis of nuclear gene codon bias on soybean genome and transcriptome[J]. Acta Agronomica Sinica,37(6):965-974. doi:10.1016/S1875-2780(11)60028-X.
Zhong S P,Huang G Q,Liu Y H,Huang L H. 2019. The complete mitochondrial genome of marine gastropod Melo melo(Neogastropoda:Volutoidea)[J]. Mitochondrial DNA Part B,4(2):4161-4162. doi:10.1080/23802359.2019. 1693293.
Zhou M,Li X. 2009. Analysis of synonymous codon usage patterns in different plant mitochondrial genomes[J]. Molecular Biology Reports,36(8):2039-2046. doi:10.1007/s11033-008-9414-1.
(責(zé)任編輯 陳德元)