• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      里氏木霉基因組密碼子偏好性研究

      2022-03-17 08:58:58秦麗娜江賢章
      食品工業(yè)科技 2022年6期
      關(guān)鍵詞:里氏木霉密碼子

      楊 鑫,秦麗娜,江賢章,

      (1.福建師范大學(xué)生命科學(xué)學(xué)院,福建福州 350000;2.工業(yè)微生物發(fā)酵技術(shù)國(guó)家地方聯(lián)合工程研究中心,福建福州 350000)

      遺傳信息是由三聯(lián)體密碼子記載的。由于密碼子的簡(jiǎn)并性,大多數(shù)氨基酸是由2~6種同義密碼子編碼。不同的物種編碼同種氨基酸所利用的密碼子種類(lèi)與使用頻率存在差別,這種現(xiàn)象稱(chēng)為密碼子偏好性(Codon Usage Bias)[1]。許多因素影響各種生物體中密碼子的使用,如自然選擇(基因表達(dá)水平[2]、RNA豐度[3]、基因長(zhǎng)度[4-5]、基因翻譯起始信號(hào)和蛋白質(zhì)結(jié)構(gòu)[6])和突變壓力(GC含量、突變頻率和模式),以及隨機(jī)遺傳漂變等[7-9]。密碼子使用模式的全基因組研究對(duì)理解基因組中分子組織的基本特征具有重要意義。迄今為止,對(duì)于遺傳密碼子偏好性的研究主要集中在一些模式物種,包括模式真菌釀酒酵母(Saccharomyces cerevisiae)、模式細(xì)菌大腸桿菌(Escherichia coli)、模式植物擬南芥(Arabidopsis thaliana)等方面[10-11],相比之下,對(duì)絲狀真菌的研究相對(duì)較少。

      絲狀真菌里氏木霉作為生產(chǎn)纖維素酶和半纖維素酶的工業(yè)微生物,具有生長(zhǎng)環(huán)境粗放、穩(wěn)定性好、安全無(wú)毒、產(chǎn)酶效率高等優(yōu)點(diǎn)。在食品加工工業(yè)中,用纖維素酶對(duì)農(nóng)產(chǎn)品進(jìn)行預(yù)處理,可以使植物組織膨化松軟,減少農(nóng)產(chǎn)品營(yíng)養(yǎng)物質(zhì)的損失。里氏木霉除了在食品工業(yè)中的作用外,還用于生物乙醇[12]和工業(yè)酶的生產(chǎn),具有廣泛的生物應(yīng)用價(jià)值。迄今為止,大約有243種通過(guò)微生物發(fā)酵制造的市售酶產(chǎn)品,其中30種是使用里氏木霉作為宿主制成的,其中21種是重組產(chǎn)品,用于飼料和技術(shù)應(yīng)用,包括紡織品、紙漿和紙張等[13-17],因此里氏木霉具有重要的研究?jī)r(jià)值。

      目前,里氏木霉QM6a菌株的基因組已經(jīng)完成測(cè)序[18],這為研究該絲狀真菌的分子生物學(xué)提供了有利條件。本文以里氏木霉基因組為研究對(duì)象,通過(guò)對(duì)編碼序列的核苷酸組成及密碼子的偏好性進(jìn)行分析,探究影響里氏木霉密碼子使用偏差的因素。本研究結(jié)果有助于闡明該物種分子進(jìn)化的機(jī)制,同時(shí)為通過(guò)密碼子優(yōu)化提高里氏木霉外源基因表達(dá)水平提供了理論依據(jù)。

      1 材料與方法

      1.1 材料與儀器

      里氏木霉QM6a基因組數(shù)據(jù)來(lái)自Joint Genome Institute(基因聯(lián)合研究所,JGI http://genome.jgi.doe.gov/portal/)公共數(shù)據(jù)庫(kù),基因組項(xiàng)目編號(hào)為1184794;使用Galaxy生物信息學(xué)分析平臺(tái)(https://usegalaxy.org/)中的Fasta Statistics對(duì)里氏木霉QM6a進(jìn)行統(tǒng)計(jì)、Filter sequences by length對(duì) CDS進(jìn)行過(guò)濾、cusp對(duì)密碼子的GC含量進(jìn)行分析;利用Python 3.9中的biopython-1.79模塊對(duì)序列進(jìn)行處理;利用CodonW 1.4.2軟件對(duì)各個(gè)CDS密碼子進(jìn)行分析;利用Origin 9.0進(jìn)行數(shù)據(jù)統(tǒng)計(jì)與作圖。

      1.2 實(shí)驗(yàn)方法

      1.2.1 基因的選擇 通過(guò)JGI數(shù)據(jù)庫(kù)下載CDS序列,由于計(jì)算短序列的密碼子數(shù)沒(méi)有生物學(xué)意義[19],因此利用Galaxy的Filter sequences by length腳本過(guò)濾長(zhǎng)度小于300 bp的CDS,收集最終序列(包含9352個(gè)CDS)用于進(jìn)一步分析。

      1.2.2 GC含量統(tǒng)計(jì) 利用Galaxy的cusp腳本統(tǒng)計(jì)分析各基因GC總含量以及密碼子的第1、2和3位堿基為G或C的含量比例,分別記為GC、GC1、GC2和GC3。其中GC3對(duì)密碼子使用偏好性具有重要影響。

      1.2.3 中性繪圖分析 中性圖是一種用于測(cè)量密碼子使用模式的分析方法。本研究分析了第1、2和3位密碼子位置(分別為GC1、GC2和GC3)的GC含量。GC12代表 GC1和 GC2的平均值;GC12和GC3用于中性繪圖分析。在中性圖中,如果GC12和GC3之間的相關(guān)性在統(tǒng)計(jì)學(xué)上顯著,且回歸線的斜率接近1,則假設(shè)突變偏差是影響密碼子使用的主要因素。相反,針對(duì)突變偏倚的選擇可能導(dǎo)致GC含量的窄分布以及GC12和GC3之間缺乏相關(guān)性[20]。

      1.2.4 ENC-plot分析 有效密碼子數(shù)(Effective number of codon,ENC)提供了對(duì)絕對(duì)密碼子偏差的有用估計(jì),是確定某個(gè)基因的總體密碼子使用偏差的一種度量。總GC含量,尤其是GC3(第三位的GC含量),經(jīng)常反映定向突變的強(qiáng)度。以ENC為縱坐標(biāo),GC3為橫坐標(biāo)繪制的ENC-plot,廣泛用于確定基因的密碼子使用是否受到突變和選擇的影響[21]。當(dāng)對(duì)應(yīng)點(diǎn)落在預(yù)期曲線附近時(shí),突變是決定密碼子使用的主要力量,當(dāng)對(duì)應(yīng)點(diǎn)大大低于預(yù)期曲線時(shí),選擇是決定密碼子使用的主要力量。

      1.2.5 相關(guān)性分析 變量和樣本之間的關(guān)系可以通過(guò)多元統(tǒng)計(jì)分析來(lái)探索。使用皮爾森相關(guān)系數(shù)(Pearson correlation coefficient)進(jìn)行相關(guān)性分析,使用雙尾檢測(cè)相關(guān)系數(shù)的顯著性。相關(guān)性分析用來(lái)揭示密碼子使用模式的主要因素并探究樣本各變量之間的關(guān)聯(lián)性[22]。

      1.2.6 PR2-plot分析 計(jì)算第3密碼子位置(A3、U3、C3和G3)的核苷酸組成,并分析AT偏差(A3/(A3+U3))和 GC 偏差(G3/(G3+C3))。PR2-plot是以 AT偏差(A3/(A3+T3))作為縱坐標(biāo)和 GC 偏差(G3/(G3+C3))作為橫坐標(biāo)繪制的[23]。若核苷酸組成是影響同義密碼子使用的唯一因素,那么A(T)和C(G)的使用頻率應(yīng)該相等。

      1.2.7 相對(duì)同義密碼子使用分析 運(yùn)用CodonW軟件分析相對(duì)同義密碼子使用度(relative synonymous codon usage,RSCU)。RSCU是指對(duì)于某一特定的密碼子在編碼對(duì)應(yīng)氨基酸的同義密碼子的相對(duì)概率,它去除了氨基酸組成對(duì)密碼子的影響。公式如下:

      式中:xij表示編碼第i個(gè)氨基酸的第j個(gè)密碼子的出現(xiàn)次數(shù);ni總表示編碼第i個(gè)氨基酸的同義密碼子的數(shù)量(值為1~6)。如果密碼子使用沒(méi)有偏好,則該密碼子的RSCU值等于1。當(dāng)某一密碼子的RSCU值大于1,則表明密碼子的使用偏好性較強(qiáng)。由于它計(jì)算方便,而且很直觀地反映出密碼子使用的偏好性,因此在大多數(shù)的密碼子相關(guān)分析中,都使用它作為衡量偏好性的標(biāo)準(zhǔn)。

      1.2.8 高表達(dá)密碼子的確定 ENC值的范圍在20~61之間,單個(gè)基因的ENC值越低,該基因的整體密碼子使用偏好就越強(qiáng),基因的表達(dá)量相對(duì)越高[24]。故以ENC值為偏好性標(biāo)準(zhǔn),兩級(jí)各選10%的基因分別創(chuàng)建高低表達(dá)樣本庫(kù),取兩庫(kù)△RSCU>0.08的密碼子進(jìn)行分析[25-26]。

      1.2.9 與其他真菌密碼子偏好性比較 運(yùn)用Bioinformatics在線平臺(tái)(http://www.bioinformatics.org)的Codon Usage計(jì)算里氏木霉各密碼子的使用頻率[27]。用CodonW分別計(jì)算出同屬的長(zhǎng)梗木霉(Trichoderma longibrachiatum)、絲狀模式真菌粗糙脈孢霉(Neurospora crassa)、模式真菌釀酒酵母(Saccharomyces cerevisiae)的密碼子使用頻率,將里氏木霉密碼子使用頻率與它們進(jìn)行比較分析。

      2 結(jié)果與分析

      2.1 密碼子偏性分析

      單一類(lèi)型密碼子的密碼子使用偏差受基因組總核苷酸含量的影響很大[28],因此,首先利用Galaxy平臺(tái)分析了里氏木霉基因組中編碼序列(CDS)的GC核苷酸組成。在里氏木霉基因組中,97%的基因GC含量、96%的基因GC1含量、18%的基因GC2含量和 37%的基因 GC3含量分布在 50%~68%(圖1),GC核苷酸平均含量為58.1%,三個(gè)密碼子位置(GC1、GC2和GC3)的GC平均含量分別為58.9%、45.0%和70.4%。單因素方差分析表明密碼子三個(gè)位置的 GC 含量差異極顯著(P<0.001),GC3>GC1>GC2表明第三位置的GC含量不同于第一和第二位置的GC含量,第三位密碼子的GC含量在密碼子位置中最高,說(shuō)明GC3是導(dǎo)致密碼子使用發(fā)生偏好性的重要原因,且里氏木霉的密碼子第三位受到的選擇壓力較大。核苷酸組成分析結(jié)果表明,里氏木霉基因第三位偏好G/C末端密碼子比A/U末端密碼子更受歡迎。

      圖1 GC含量分布Fig.1 Distribution of the GC contents

      2.2 中性繪圖分析

      中性分析是揭示GC12和GC3之間關(guān)系的一種有用方法。為了分析三個(gè)密碼子位置之間的關(guān)系,本文構(gòu)建了里氏木霉基因組編碼序列的中性圖(GC12與 GC3)。結(jié)果顯示(圖2)GC12和 GC3不相關(guān)(R2=0.0009),且斜率接近0,說(shuō)明里氏木霉密碼子沒(méi)有受到定向突變壓力的影響,導(dǎo)致密碼子偏好性的原因主要是選擇壓力。

      圖2 里氏木霉中性分析Fig.2 Neutrality plot of T.reesei

      2.3 ENC-plot 分析

      有效密碼子數(shù)廣泛用于測(cè)量單個(gè)基因的密碼子偏好水平。為了闡明里氏木霉序列中核苷酸組成和密碼子偏好之間的關(guān)系,繪制了ENC和GC3s圖,從而探索了基因間密碼子使用的主要特征。如圖3所示,大部分基因的ENC觀察值落在ENC期望值曲線之下,表明其里氏木霉密碼子的使用主要受選擇壓力的影響,與中性繪圖分析的結(jié)果一致。

      圖3 里氏木霉ENC-plot曲線Fig.3 Relationship between the ENC and GC3 in T.reesei

      為了更準(zhǔn)確地估計(jì)觀測(cè)值和預(yù)期ENC值之間的差異,本文計(jì)算了(ENCexp-ENCobs)/ENCexp 的值。如圖4所示,(ENCexp-ENCobs)/ENCexp的峰值為0~0.1,表明大多數(shù)基因的ENC值與基于GC3的預(yù)期ENC值略有不同。因此,大多數(shù)基因觀察到的ENC接近基于GC3的預(yù)期ENC,盡管有部分基因觀察到的ENC要低得多。

      圖4 有效密碼子數(shù)(ENC)比率的頻率分布圖Fig.4 Frequency distribution of the effective number of codons (ENC) ratio

      2.4 相關(guān)性分析

      里氏木霉基因組編碼區(qū)中GC含量、ENC和密碼子出現(xiàn)頻數(shù)(CN)間相關(guān)性分析結(jié)果顯示(表1),GC Total與GC1、GC2、GC3 呈極顯著相關(guān)(P<0.001),GC3與GC1、GC2相關(guān)性水平不顯著,說(shuō)明GC3與GC1、GC2的密碼子組成存在較大差異。進(jìn)一步發(fā)現(xiàn),ENC與 GC1、GC2相關(guān)性較弱,與 GC3以及GC TOTAL極顯著相關(guān)(P<0.001),表明密碼子不同位置的堿基組成會(huì)影響有效密碼子數(shù)。CN值與GC1、GC2、GC3、GC Total相關(guān)性都不顯著,說(shuō)明CN對(duì)ENC的影響很小,排除了基因序列過(guò)短對(duì)后續(xù)分析的影響。

      表1 各基因相關(guān)參數(shù)的相關(guān)性分析Table 1 Correlation analysis of each gene-related parameters

      2.5 PR2-plot分析

      為了研究偏向密碼子選擇是否局限于高度偏向的蛋白質(zhì)編碼基因,通過(guò)PR2-plot分析了64個(gè)密碼子氨基酸家族中嘌呤和嘧啶之間的關(guān)聯(lián)[29],若密碼子使用模式完全由突變?cè)斐桑瑒tG和C以及A和T的使用頻率應(yīng)相等。然而圖5顯示,在里氏木霉中G和C的使用頻率高于A和T,說(shuō)明里氏木霉密碼子的使用模式除了核苷酸的組成,還受到其它因素的影響,例如選擇壓力等。

      圖5 PR2-plot分析Fig.5 Parity Rule 2 (PR2)-plot analysis

      2.6 相對(duì)同義密碼子使用分析

      為了確定同義密碼子的使用模式以及C/G末端密碼子的首選程度,本文進(jìn)行了相對(duì)同義密碼子使用(RSCU)分析并計(jì)算了RSCU值(表2),繪制RSCU堆積圖(圖6)。在24個(gè)最常用的密碼子中,22個(gè)(UUC、CUG、AUC、AUG、 GUC、UCC、 CCC、ACC、 GCC、 UAG、 CAC、 CAG、 AAC、 AAG、GAC、 GAG、 UCG、 UGG、 CGC、 AGC、 AGG、GGC)是C/G末端密碼子(C末端:13個(gè);G末端:9個(gè)),其余2個(gè)(UAA、AGA)是A末端密碼子;沒(méi)有一個(gè)首選密碼子是U末端的。這些結(jié)果表明,核苷酸組成在里氏木霉密碼子使用模式中起著不可或缺的作用。

      圖6 里氏木霉相對(duì)密碼子使用堆積圖Fig.6 Stacked plot of RSCU in T.reesei

      表2 里氏木霉蛋白編碼區(qū)相對(duì)同義密碼子使用度Table 2 RSCU analysis of protein coding region acid in T.reesei coding sequences

      2.7 高表達(dá)密碼子的確定

      以ENC值為偏好性標(biāo)準(zhǔn),對(duì)基因進(jìn)行排序,兩極各取10%構(gòu)建高低表達(dá)基因庫(kù),計(jì)算高低基因表達(dá)庫(kù)密碼子RSCU值和△RSCU值(表3),星號(hào)標(biāo)注的21個(gè)密碼子是高表達(dá)優(yōu)越密碼子,這些密碼子(除了終止密碼子UAA)全部以C或G結(jié)尾,這表明里氏木霉中的密碼子使用偏向于C或G結(jié)尾的同義密碼子。此外,4個(gè)密碼子 CUC、GCC、CGC和GGC是里氏木霉高表達(dá)基因的最優(yōu)密碼子。

      表3 里氏木霉最優(yōu)密碼子分析Table 3 Optimal codons in T.reesei

      2.8 與其他真菌密碼子偏好性比較

      將里氏木霉分別與同屬的長(zhǎng)梗木霉、絲狀模式真菌粗糙脈孢霉、模式真菌釀酒酵母的密碼子使用頻率進(jìn)行比較(表4),其中R/L、R/N、R/S分別表示里氏木霉與長(zhǎng)梗木霉、粗糙脈孢霉、釀酒酵母的每種密碼子使用頻率比值。結(jié)果顯示,里氏木霉與釀酒酵母的密碼子使用頻率比值有34種大于等于2.0或小于等于0.5,占53.1%;與長(zhǎng)梗木霉的密碼子使用頻率比值幾乎都接近于1;而里氏木霉與粗糙脈孢霉的密碼子使用頻率比值有6種大于等于1.5或小于等于0.67,占9.3%。說(shuō)明絲狀真菌里氏木霉與模式真菌釀酒酵母的密碼子偏好性差別較大,而與同屬的長(zhǎng)梗木霉以及絲狀模式真菌粗糙脈孢霉的密碼子偏好性差別相對(duì)較小。粗糙脈孢霉經(jīng)常作為研究木質(zhì)纖維素降解的模式真菌,將相關(guān)基因表達(dá)于里氏木霉時(shí),兩者密碼子使用模式接近,無(wú)需考慮兩者密碼子的偏好性。

      表4 里氏木霉與其他物種密碼子偏好性比較Table 4 Comparision of codon preference between T.reesei and other species

      3 討論與結(jié)論

      當(dāng)重組蛋白異源表達(dá)時(shí),密碼子使用偏好對(duì)蛋白質(zhì)表達(dá)水平有重要的影響。DNA序列中密碼子的頻率與物種中相應(yīng)的tRNA呈正相關(guān),tRNA濃度決定了可用于蛋白質(zhì)翻譯延伸的氨基酸數(shù)量,進(jìn)而影響蛋白質(zhì)合成的效率[30]。蛋白質(zhì)的表達(dá)水平與密碼子使用偏好高度相關(guān)。稀有密碼子往往會(huì)降低翻譯速度,甚至導(dǎo)致翻譯錯(cuò)誤。因此,密碼子優(yōu)化是增加蛋白質(zhì)表達(dá)的最關(guān)鍵的決定因素。

      里氏木霉作為工業(yè)生產(chǎn)纖維素酶的菌株,其某些突變株的蛋白分泌能力在發(fā)酵條件下可達(dá)到100 g/L[31-32],鑒于此優(yōu)良特征,里氏木霉可以作為異源蛋白表達(dá)的優(yōu)良宿主。對(duì)其密碼子偏好性進(jìn)行研究具有重要的理論研究和工業(yè)應(yīng)用意義。在本研究中,通過(guò)對(duì)里氏木霉基因組進(jìn)行分析,編碼區(qū)的GC3(70.4%)含量表明,該基因組富含C+G,總體密碼子使用偏向于C和G末端密碼子。在進(jìn)化過(guò)程中,若A(T)到G(C)的突變壓力大,那么密碼子的第3位堿基是G(C)的概率就要高[33]。在里氏木霉使用頻率較高的24個(gè)密碼子中,有22個(gè)均是以GC結(jié)尾的。通過(guò)對(duì)里氏木霉基因組密碼子使用模式的分析發(fā)現(xiàn),其密碼子使用的偏好性受到選擇壓力的影響,其次自然選擇在塑造密碼子偏好性使用過(guò)程中也扮演著非常重要的作用。通過(guò)ENC差異構(gòu)建了里氏木霉高低表達(dá)基因庫(kù),確定了21個(gè)高表達(dá)優(yōu)越密碼子和4個(gè)高表達(dá)最優(yōu)密碼子(CUC、GCC、CGC和 GGC)。

      續(xù)表 4

      將里氏木霉分別與其它真菌的密碼子使用頻率進(jìn)行比較,發(fā)現(xiàn)里氏木霉基因的密碼子偏好性與酵母的差異較大,這可以解釋為什么里氏木霉的許多基因都無(wú)法實(shí)現(xiàn)在畢赤酵母中的異源表達(dá),然而通過(guò)對(duì)來(lái)源于里氏木霉的Cel5A、Cel6A經(jīng)過(guò)密碼子優(yōu)化后,可以成功在畢赤酵母中進(jìn)行表達(dá)[34,35]。里氏木霉與粗糙脈孢霉的密碼子偏好性差異最小,因此不經(jīng)過(guò)任何密碼子優(yōu)化的里氏木霉基因可以在粗糙脈孢霉中成功表達(dá)并且互補(bǔ)粗糙脈孢霉相關(guān)基因的缺失表型[36]。這些例子充分表明密碼子偏好性對(duì)基因表達(dá)的重要性。本研究對(duì)里氏木霉的密碼子使用偏好性進(jìn)行了系統(tǒng)分析,可為外源基因在里氏木霉以及與其進(jìn)化關(guān)系較為接近的其他物種中進(jìn)行異源表達(dá)時(shí)提供密碼子優(yōu)化指導(dǎo)。

      猜你喜歡
      里氏木霉密碼子
      高硬度區(qū)間P91鋼的里氏-布氏硬度關(guān)系研究
      木霉和殺菌劑聯(lián)用對(duì)橡膠榕白絹病菌的抑制作用
      密碼子與反密碼子的本質(zhì)與拓展
      歐盟評(píng)估來(lái)自一種轉(zhuǎn)基因里氏木霉的α-淀粉酶的安全性
      10種藏藥材ccmFN基因片段密碼子偏好性分析
      中成藥(2018年7期)2018-08-04 06:04:10
      嗜酸熱古菌病毒STSV2密碼子偏嗜性及其對(duì)dUTPase外源表達(dá)的影響
      綠色木霉發(fā)酵制備雷竹筍渣膳食纖維的工藝研究
      不同保存條件對(duì)里氏木霉孢子粉保質(zhì)期的影響
      煙草葉綠體密碼子的偏好性及聚類(lèi)分析
      鲁山县| 台湾省| 伊吾县| 肇州县| 红桥区| 彭山县| 久治县| 中西区| 麦盖提县| 乌兰察布市| 泰州市| 游戏| 旺苍县| 南乐县| 仙桃市| 苏州市| 大化| 嵩明县| 河津市| 宾阳县| 游戏| 丽水市| 罗甸县| 休宁县| 宜君县| 佳木斯市| 阿克苏市| 博乐市| 开原市| 天台县| 璧山县| 玉门市| 治多县| 卢氏县| 石首市| 龙川县| 沈丘县| 顺昌县| 江门市| 溧水县| 南开区|