蔣瑋,呂貝貝,何建華,王金斌,吳瀟,武國干,鮑大鵬,陳明杰,張勁松,譚琦,唐雪明
1 上海市農(nóng)業(yè)科學(xué)院生物技術(shù)研究所,上海 201106
2 上海市農(nóng)業(yè)遺傳育種重點實驗室,上海 201106
3 國家食用菌工程技術(shù)研究中心,上海 201106
在絕大多數(shù)生物中,密碼子并不是均等地被使用,長期的進化過程中,某一物種或基因都會形成對特定的同義密碼子的使用偏好,這些被優(yōu)先使用的密碼子被稱為該物種或基因的最優(yōu)密碼子(Optimal codon),這種現(xiàn)象稱為密碼子的使用偏好性(Codon bias)。分析密碼子的使用偏好性對提高外源基因在宿主中的表達水平具有重要的意義。近幾年,通過優(yōu)化密碼子的途徑提高外源基因在微生物、植物、動物等宿主生物中的表達效率的研究屢見不鮮[1-7],其前提便是對宿主生物的密碼子偏好性的分析,而酵母密碼子偏好性的解析更是為酵母的基因工程技術(shù)化應(yīng)用帶來了突破,得到大量應(yīng)用[8-14]。
食用菌作為營養(yǎng)、健康的食物代表,日益受到人們的關(guān)注,但是食用菌中密碼子偏好性分析研究仍然少之又少。其中包括雙孢蘑菇[15]和銀耳[16],但是他們的分析只是基于部分表達序列,以某一食用菌全基因組序列為分析對象的密碼子偏好性研究還尚未報道。草菇Volvariella volvacea作為一種重要的常見食用菌,在中國有著悠久的栽培歷史,因其味道鮮美,營養(yǎng)豐富,在中國及東南亞地區(qū)很受歡迎。本研究通過分析測序得到的草菇全基因組編碼序列數(shù)據(jù),了解草菇基因密碼子用法特征,并與不同的代表性物種進行比較,為草菇基因選擇合適的表達系統(tǒng),優(yōu)化密碼子提高基因表達量等提供重要理論基礎(chǔ)。
草菇全基因組序列由測序得到,利用真核基因預(yù)測軟件 Genemark-ES預(yù)測,共獲得 11 097個蛋白編碼基因[17]。剔除380條長度小于300 bp的序列,剩余10 717條序列用于本研究的各項分析[18]。在 GenBank (http://www.ncbi.nlm.nih.gov/)中檢索草菇mRNA序列,從中篩選用于比較分析的蛋白質(zhì)編碼序列40條(Accession No.: AF329731.1,AF329732.1, AY316307.1, AY855921.1, DQ888226.1,EF143259.1, FJ536255.1, FJ913469.1, GU376797.1,HM237364.1, HM366445.1, HM366446.1, JN830959.1,JN861640.1, JQ478424.1, JQ478425.1, JQ922270.1,JX402409.1, JX402410.1, JX402411.1, KC520537.1,KC748445.1, KC748452.1, KF365489.1, KF365492.1,KF365493.1, KF365495.1, KF365499.1, KF528321.1,KF528322.1, KF528324.1, KF528325.1, KF528326.1,KF528327.1, KF528328.1, KF528329.1, KF528330.1,KF528331.1, KF528332.1, KF528333.1)。
1.2.1 草菇基因同義密碼子偏好性分析
運用 CodonW1.4.2軟件進行分析相對密碼子使用度(Relative synonymous codon usage,RSCU)和有效密碼子數(shù)(Effective number of codons, Nc)。
1.2.2 草菇高表達最優(yōu)密碼子確定
采用Sharp等[19]的方法,先計算每個基因的Nc值并進行排列,從這一排列的兩端抽取10%的樣本分別組成高、低表達樣本組。然后各自計算這兩個樣本組中各個密碼子的 RSCU值,最后通過卡方檢驗確定出高表達基因的優(yōu)越密碼子,確定草菇基因組最優(yōu)密碼子。
1.2.3 草菇與其他物種密碼子偏好性比較
運用 CUSP程序計算草菇基因各密碼子的使用頻率,并與從 Codon Usage Database(http://www.kazusa.or.jp/codon/)中獲得的人Homo sapiens、酵母Saccharomys cerevisiae、擬南芥Arabidopsis thaliana、小鼠Mus musculus、斑馬魚 Danio rerio果蠅 Drosophila melanogaster、灰蓋鬼傘Coprinopsis cinerea、雙孢蘑菇 Agaricus bisporus、香菇 Lentinula edodes、平菇Pleurotus ostreatus的密碼子使用頻率進行比較。
1.2.4 基于密碼子使用偏好性的聚類
利用SPSS16.0對草菇及其他10種物種進行基于密碼子使用偏好性的歐氏平方距離系數(shù)進行聚類分析。在聚類過程中,將每個物種作為一個對象,密碼子使用頻率作為變量。采用59個同義密碼子(不包括起始密碼子 ATG和色氨酸TGG以及3個終止密碼子TAG、TAA、TGA)的密碼子使用頻率值對其進行分析。物種間的距離規(guī)定為同義密碼子使用頻率的歐氏平方距離,根據(jù)兩兩間的距離構(gòu)建距離系數(shù)矩陣,進行聚類分析。
運用CodonW軟件分析了10 717條草菇蛋白質(zhì)基因編碼序列的RSCU值,結(jié)果如表1所示。有偏好性(RSCU>1)的密碼子共計35個,其中以G/C結(jié)尾的19個,以A/T結(jié)尾的16個。各氨基酸 RSCU值最高的密碼子分別是:TTC(Phe)、CTC (Leu)、ATC (Ile)、GTC (Val)、TCC(Ser)、CCA (Pro)、ACC (Thr)、GCT (Ala)、TAC(Tyr)、CAC (His)、CAA (Gln)、AAC (Asn)、AAG(Lys)、GAT (Asp)、GAG (Glu)、TGC (Cys)、CGC(Arg)、GGT (Gly)、TGA (終止密碼子)。這19個密碼子以G/C結(jié)尾的13個,以A/T結(jié)尾的6個。以上結(jié)果表明,草菇偏好于以G/C結(jié)尾的密碼子。
一般地,密碼子的有效數(shù)(Nc)與基因表達量有關(guān),高表達基因密碼子偏好性強,Nc值小[20]。本研究以草菇基因組中各基因的Nc值排列獲取高、低表達基因樣本,通過計算基因之間同義密碼子相對使用頻率之差,并經(jīng)卡方測驗,最終確定了TTC、CTC、CTG等24個密碼子為草菇的高表達優(yōu)越密碼子(表2)。它們在高、低表達基因樣本組間的使用頻率差異較大,顯著性測驗結(jié)果均呈極顯著水平。通過分析40條已知草菇蛋白質(zhì)編碼序列所得的最優(yōu)密碼子與分析草菇全基因組序列所得的最優(yōu)密碼子,經(jīng)比較可見后者所得結(jié)果可靠且更全面(表2)。
表1 草菇蛋白編碼基因的密碼子用法Table 1 The codon usage of Volvariella volvacea coding sequences
表2 草菇中高/低表達樣本組的密碼子用法與最優(yōu)密碼子的確定和驗證Table 2 Codon usage of high/low expressed sample group in Volvariella volvacea and confirmation of optimal codons in Volvariella volvacea
草菇與人、酵母、擬南芥、小鼠、斑馬魚、果蠅等6種物種密碼子使用頻率進行比較 (表3),其中,V/H、V/Y、V/A、V/M、V/D、V/F分別表示草菇與人、酵母、擬南芥、小鼠、斑馬魚、果蠅的每種密碼子使用頻率比值,密碼子使用頻率若在0.5?2.0之間,表明這兩個物種對該密碼子的偏好性較接近,若≥2.0或≤0.5,則表明偏好性差異較大[21]。草菇與人、酵母、擬南芥、小鼠、斑馬魚、果蠅的比值中,≥2.0或≤0.5的密碼子分別有7、12、3、7、3、5種,表明草菇與這些物種之間存在不同程度的密碼子偏好性差異。
表3 草菇與代表性物種密碼子偏好性比較Table 3 Comparison of codon preference between the Volvariella volvacea and other representative organisms
續(xù)表3
草菇與灰蓋鬼傘、雙孢蘑菇、香菇、平菇 4種食用菌密碼子使用頻率進行比較 (表4),其中,V/C、V/A、V/L、V/P分別表示草菇與灰蓋鬼傘、雙孢蘑菇、香菇、平菇的每種密碼子使用頻率比值,≥2.0或≤0.5的密碼子分別有1、2、1、4種,表明草菇與灰蓋鬼傘、雙孢蘑菇、香菇的密碼子偏好性差異較小,與平菇的密碼子偏好性差異較大。
續(xù)表4
根據(jù)表 3及表 4中各物種密碼子的使用頻率,利用SPSS16.0進行聚類分析,聚類結(jié)果見圖1。從圖1可以看出,利用密碼子使用頻率得出的聚類圖接近這11個物種的系統(tǒng)分類,在一定程度上反映了物種間的進化關(guān)系。
圖1 基于物種密碼子使用頻率的聚類圖Fig. 1 Cluster analysis dendrogram of frequency of codon usage for 11 species. 1: Volvariella volvacea; 2: Homo sapiens; 3: Saccharomys cerevisiae; 4: Arabidopsis thalian; 5: Mus musculus; 6: Danio rerio; 7: Drosophila melanogaster; 8: Coprinopsis cinerea; 9: Agaricus bisporus; 10: Lentinula edodes; 11: Pleurotus ostreatus.
在長期的進化過程中,由于進化環(huán)境和選擇壓力的不同,不同物種經(jīng)歷了不同的進化歷程,所以任何一個物種為適應(yīng)其基因組環(huán)境,都要形成特定的符合其基因組的密碼子使用法則。不同生物物種密碼子偏性有一定差別,將外源基因轉(zhuǎn)入受體生物時,由于轉(zhuǎn)入基因的密碼子和宿主基因組密碼子使用偏好不同,易引起甲基化,從而引發(fā)轉(zhuǎn)基因沉默或轉(zhuǎn)基因表達量降低[22]。因此,在外源基因轉(zhuǎn)入前,應(yīng)按照宿主物種的密碼子使用偏好性對其進行優(yōu)化和改造。本研究對草菇全基因組蛋白編碼基因的密碼子偏好性進行分析,結(jié)果表明草菇基因密碼子偏愛使用 G/C結(jié)尾的密碼子,這種偏好可能是由于以G/C結(jié)尾的密碼子具有較高的結(jié)合能,有利于保證翻譯的準確性[23]。
草菇密碼子偏好性與人、酵母、擬南芥、小鼠、斑馬魚、果蠅、平茹都具有不同程度的差異,如果這些生物的基因要在草菇中表達,則應(yīng)該首先進行密碼子優(yōu)化。草菇與灰蓋鬼傘、雙孢蘑菇、香菇的密碼子偏好性差異較小。如果這些生物的基因要在草菇中表達,只需優(yōu)化個別密碼子。聚類結(jié)果表明密碼子偏好性差異大小在一定程度上反映物種間的進化關(guān)系,可作為研究物種進化關(guān)系的參考。但基于物種密碼子使用頻率的聚類結(jié)果與傳統(tǒng)分類存在一定的差異,這可能是參數(shù)選擇單一的問題,若與其他參數(shù)聯(lián)用,可能會更貼切地反映物種間的進化關(guān)系[24]。
目前,通過密碼子優(yōu)化方法提高外源基因在食用菌中的表達量的研究還鮮有報道。本研究中確定了草菇的24個最優(yōu)密碼子,對于今后草菇轉(zhuǎn)基因過程中對構(gòu)建合適的轉(zhuǎn)基因表達系統(tǒng)具有重要的指導(dǎo)意義,在目的表達基因中針對草菇所偏好的密碼子進行優(yōu)化改造,從而提高目的蛋白的表達量,進而使草菇獲得更多有利性狀,對草菇品種進行定向改良具有十分重要的理論和現(xiàn)實意義。
[1]Zhou ZL, Lin ZM, Geng LL, et al. Comparison of codon optimizations of cry1Ah1 gene in rice. Chin J Biotech, 2012, 28(10): 1184–1194 (in Chinese).周宗梁, 林智敏, 耿麗麗, 等. 水稻中 cry1Ah1基因密碼子優(yōu)化方案的比較. 生物工程學(xué)報,2012, 28(10): 1184–1194.
[2]Zelasko S, Palaria A, Das A. Optimizations to achieve high-level expression of cytochrome P450 proteins using Escherichia coli expression systems.Protein Expres Purif, 2013, 92(1): 77–87.
[3]Stephen JS, Jeremy DV, Robert M, et al.Expression of chicken parvovirus VP2 in chicken embryo fibroblasts requires codon optimization for production of naked DNA and vectored meleagrid herpesvirus type 1 vaccines. Virus Genes, 2013,47(2): 259–267.
[4]Rasheda J, Muhammad SK, Yusuf Z, et al. Codon optimization of cry1Ab gene for hyper expression in plant organelles. Mol Biol Rep, 2010, 37(2):1011–1017.
[5]Mizuki T, Masafumi T, Takahiro S, et al.Transcripts of a heterologous gene encoding mite allergen Der f 7 are stabilized by codon optimization in Aspergillus oryzae. Appl Microbal Biot, 2012, 96(5): 1275–1282.
[6]Kyoko HT, Mpanja N, Tadayoshi H, et al.High-level accumulation of recombinant miraculin protein in transgenic tomatoes expressing a synthetic miraculin gene with optimized codon usage terminated by the native miraculin terminator. Plant Cell Rep, 2011, 30(1): 113–124.
[7]Soohyun P, Seung PP, Jinwon L. Expression of codon-optmiazed phosphoenolpyruvate carboxylase gene from Glaciecola sp. HTCC2999 in Escherichia coli and its application for C4 chemical production. Appl Biochem Biotech, 2012, 167(7):1845–1853.
[8]Mirzaei SA, Tabatabaei M, Sepehrizadeh Z.Secretory expression and purification of a soluble NADH cytochrome b5 reductase enzyme from Mucor racemosus in Pichia pastoris based on codon usage adaptation. Biotechnol Lett, 2010,32(11): 1705–1711.
[9]Andrea M, Roland W, Anton G, et al. Expression of lignocellulolytic enzymes in Pichia pastoris. Micro Cell Fact, 2012(11): 61.
[10]Fu XY, Zhao W, Xiong AS, et al. High expression of recombinant Streptomyces sp. S38 xylanase in Pichia pastoris by codon optimization and analysis of its biochemical properties. Mol Biol Rep, 2011,38(8): 4991–4997.
[11]Christoph S, Alexander G, Iris K, et al. Simple and efficient expression of Agaricus meleagris pyranose dehydrogenase in Pichia pastoris. Appl Microbiol Biot, 2012, 94(3): 695–704.
[12]Sandra A, Jozef N, Margit W. High-level expression of Rhodotorula gracilis D-amino acid oxidase in Pichia pastoris. Biotechnol Lett, 2011,33(3): 557–563.
[13]Ruth C, Zuellig T, Mellitzer A, et al. Variable production windows for porcine trypsinogen employing synthetic inducible promoter variants in Pichia pastoris. Syst Synth Biol, 2010, 4(3):181–191.
[14]Li CL, Han L, Zheng ZY, et al. Optimization of plant des-pGlu1-Brazzein gene according to yeasty biased codons and its expression in Pichia pastoris.Chin J Biotech, 2011, 27(8): 1158–1163 (in Chinese).李春麗, 韓露, 鄭振宇, 等. 植物甜蛋白des-pGlu1-Brazzein的密碼子優(yōu)化及其在畢氏酵母中的表達. 生物工程學(xué)報, 2011, 27(8): 1158–1163.
[15]Rene VV, Peter JS, Yvonne M. A codon usage table for Agaricus bisporus. Cultivated Mushroom Research (CMR)Newsletter, 1993(1): 50–52.
[16]Huang XX. Analysis of codon usage bias and promoter cloning of Tremella fuciformis [D].Fuzhou: Fujian Agriculture and Forestry University, 2011 (in Chinese).黃曉星. 銀耳密碼子偏好性分析及啟動子克隆[D]. 福州: 福建農(nóng)林大學(xué), 2011.
[17]Bao DP, Zhao GP, Tan Q, et al. Draft sequence of the Volvariella volvacea genome. Acta Edulis Fungi, 2010, 17(1): 1–2 (in Chinese).鮑大鵬, 趙國屏, 譚琦, 等. 草菇全基因組框架圖. 食用菌學(xué)報, 2010, 17(1): 1–2.
[18]Paul MS, Elizabeth C. Synonymous codon usage in Saccharomyces cerevisiae. Yeast, 1991, 7(7): 657–678.
[19]Sharp PM, Li WH. The codon adaptation index-a measure of directional synonymous codon usage bias, and its potential applications. Nucleic Acids Res, 1987, 15(3): 1281–1295.
[20]Wu XM, Wu SF, Ren DM, et al. The analysis method and progress in the study of codon bias.Hereditas, 2007, 29(4): 420–426 (in Chinese).吳憲明, 吳松鋒, 任大明, 等. 密碼子偏性的分析方法及相關(guān)研究進展. 遺傳, 2007, 29(4):420–426.
[21]Fan SH, Guo AG, Shan LW, et al. Analysis of genetic code preference in Arabidopsis thaliana.Prog Biochem Biophys, 2003, 30(2): 221–225 (in Chinese).范三紅, 郭藹光, 單麗偉, 等. 擬南芥基因密碼子偏愛性分析. 生物化學(xué)與生物物理進展, 2003,30(2): 221–225.
[22]Perlak FJ, Deaton RW, Armstrong TA, et al. Insect resistant cotton plants. Biol Technol, 1990(8):939–943.
[23]Shi XF, Huang JF, Liu SQ, et al. The features of synonymous codon bias and GC-content relationship in human genes. Prog Biochem Biophys, 2002, 29(3): 411–414 (in Chinese).石秀凡, 黃京飛, 柳樹群, 等. 人類基因同義密碼子偏好的特征以及與基因 GC含量的關(guān)系. 生物化學(xué)與生物物理進展, 2002, 29(3): 411–414.
[24]Chao YE, Wu ZQ, Yang HM, et al. Cluster analysis and codon usage bias studies on psbA genes from 11 plant species. Acta Agric Nucl Sin, 2011, 25(5):927–932 (in Chinese).晁岳恩, 吳政卿, 楊會民, 等. 11種植物psbA基因的密碼子偏好性及聚類分析. 核農(nóng)學(xué)報, 2011,25(5): 927–932.