郭玉平等
摘要:本研究運(yùn)用多種軟件對(duì)12種作物的 FAD2基因進(jìn)行密碼子偏好性分析。結(jié)果表明:FAD2基因在12種作物中密碼子使用偏好性差異很大,禾本科作物玉米、水稻、高粱的FAD2基因有效密碼子數(shù)(Effective Number of Codons, ENC)在30左右,為偏好性很強(qiáng)的基因;油料作物油菜和亞麻的FAD2基因的ENC值分別為45.49和48.58,為一般偏好性基因;另外6種油料作物和模式植物擬南芥的FAD2基因ENC值都大于50,偏好性較弱。玉米、水稻、高粱、油菜、亞麻、花生和擬南芥的FAD2基因偏好以G或C堿基結(jié)尾的密碼子,其余5種油料作物的FAD2基因偏好使用以A或T結(jié)尾的密碼子。在12種作物中,密碼子CTC的RSCU值都大于1,屬于高頻使用的密碼子;而CTA、ATA、GTA、AGT、CCC屬于低頻密碼子。在聚類分析中,12種作物基于FAD2基因密碼子用法與基于CDS序列的聚類結(jié)果大體一致。
關(guān)鍵詞:FAD2基因;密碼子偏好性
中圖分類號(hào):Q755文獻(xiàn)標(biāo)識(shí)號(hào):A文章編號(hào):1001-4942(2013)07-0024-06
脂肪酸脫氫酶(Fatty Acid Desaturase, FAD2)是存在于作物細(xì)胞內(nèi)質(zhì)網(wǎng)表面的一種脫氫酶,可以向油酸(C18∶1)引入第二個(gè)雙鍵,提供質(zhì)膜結(jié)構(gòu)所需的亞油酸(C18∶2)等多元不飽和脂肪酸,是作物產(chǎn)生多聚不飽和脂肪酸的關(guān)鍵酶。不飽和脂肪酸在增加生物膜的流動(dòng)性中發(fā)揮重要作用,其在生物膜中的含量和作物的抗寒性、抗高溫性、以及抗病性等有極其重要的作用;在人和動(dòng)物體內(nèi)也發(fā)揮著重要作用,包括脂類代謝、心血管功能調(diào)節(jié)、血糖濃度調(diào)節(jié)、癌細(xì)胞調(diào)控、免疫調(diào)節(jié)、對(duì)視力和腦的發(fā)育調(diào)控、骨質(zhì)形成的調(diào)控等各個(gè)方面[1]。由于FAD2只存在于作物和微生物中,人體細(xì)胞中沒有FAD2基因,自身不能合成α-亞麻酸(ALA)、γ-亞麻酸(GLA)等多不飽和脂肪酸,必須從食物中攝取[2]。
目前,擬南芥[3]、油菜[4]、大豆[5]等多種植物的FAD2基因已被克隆并應(yīng)用于轉(zhuǎn)基因作物的研究。本研究分析了棉花、花生、油菜、大豆、蓖麻、亞麻及千年桐、油桐等8種油料作物的FAD2基因的密碼子使用特征,并與模式植物擬南芥和禾本科植物玉米、水稻、高粱進(jìn)行比較。根據(jù)FAD2基因密碼子的RSCU(Relative Synonymous Codon Usage)值對(duì)12種作物進(jìn)行了聚類分析,并將其聚類結(jié)果與基于FAD2基因CDS(Coding DNA Sequences)序列的聚類結(jié)果做了比較。了解FAD2基因的密碼子在各個(gè)作物中的使用特性,為進(jìn)一步深入研究FAD2基因及其表達(dá)調(diào)控機(jī)制等提供重要理論依據(jù)。
1材料與方法
1.1序列來源
本研究使用的FAD2基因蛋白編碼序列(CDS)來源于GenBank (http://www.ncbi.nlm.nih.gov/) ,不同作物的FAD2基因在數(shù)據(jù)庫中的登錄號(hào)見表1。
1.2分析方法
1.2.112種作物的FAD2基因同義密碼子堿基組成及偏好性分析運(yùn)用Codon W1.4.2軟件(http://codonw.sourceforge.net/)對(duì)12種作物的FAD2基因的CDS序列進(jìn)行分析,分別計(jì)算每條序列同義密碼子的相對(duì)使用度、有效密碼子數(shù)、GC及GC3s含量。并利用Mobyle在線工具(http://mobyle.pasteur.fr)中的CUSP計(jì)算GC1s和GC2s含量。
(1) 同義密碼子相對(duì)使用度(RSCU)是對(duì)同義密碼子使用偏愛性的評(píng)估,定義為某一同義密碼子使用次數(shù)的觀察值與該密碼子出現(xiàn)次數(shù)的期望值的比值。如果密碼子的使用無偏愛性,則 RSCU值為1;如果某一密碼子使用頻繁,則RSCU值大于1;如果某一密碼子使用頻率低,則RSCU值小于1。RSCU值直觀地反映了密碼子使用的偏好性[6]。
(2) 有效密碼子數(shù)(ENC)反映基因密碼子使用的偏愛程度,取值范圍為20(每個(gè)氨基酸只使用一個(gè)密碼子)~61(各個(gè)密碼子被均衡使用),其值越小,表明該基因的密碼子使用偏好性越強(qiáng)[7]。
(3) 密碼子的組成度量指標(biāo)包括GC(鳥嘌呤和胞嘧啶)、GC1s(同義密碼子第1位的鳥嘌呤和胞嘧啶)、GC2s(同義密碼子第 2 位的鳥嘌呤和胞嘧啶)、GC3s(同義密碼子第 3 位的鳥嘌呤和胞嘧啶)含量。
1.2.2基于密碼子RSCU值及CDS序列的聚類分析利用SAS 8.1軟件(Institute Inc., Cary, North Carolina, USA)編程,以每條基因作為研究對(duì)象,將59個(gè)密碼子(去除3個(gè)終止密碼子和2個(gè)只編碼Trp、Met的密碼子)的RSCU值作為變量,根據(jù)其相對(duì)使用度之間的歐氏距離,采用系統(tǒng)聚類法中的最大距離法進(jìn)行聚類,并對(duì)12種作物FAD2基因密碼子偏好性進(jìn)行比較分析。
利用MEGA5.10軟件(http://www.megasoftware.net/mega.php)中的ClustalW模塊對(duì)FAD2的CDS序列進(jìn)行多序列比對(duì)[8],然后采用UPGMA法對(duì)FAD2基因CDS序列進(jìn)行聚類分析[16]。
2結(jié)果與分析
2.1有效密碼子數(shù)及堿基組成分析
12種作物FAD2基因的ENC值、GC堿基含量以及密碼子第一、二、三位的GC堿基含量計(jì)算結(jié)果見表2。結(jié)果顯示:在12種作物中,F(xiàn)AD2基因ENC值差異很大,其中玉米、水稻、高粱FAD2基因的ENC值均在30左右,表明它們具有較強(qiáng)的密碼子使用偏好性;油菜和亞麻FAD2基因的ENC值分別為45.49和48.58,說明它們的密碼子偏好性比禾本科作物要弱些,為一般偏好性基因;剩余6種油料作物FAD2基因的ENC值均大于50,說明它們的密碼子使用偏好性很弱。進(jìn)一步分析12種作物FAD2基因GC含量及密碼子第一、二、三位的GC含量,發(fā)現(xiàn)玉米、水稻、高粱、油菜、亞麻、擬南芥FAD2基因GC含量呈現(xiàn)GC3s>GC1s>GC2s這一規(guī)律。除擬南芥外,它們的GC含量都大于50%,分別為67.18%、65.81%、62.89%、55.06%、54.53%。陸地棉、花生、大豆、蓖麻、千年桐、油桐FAD2基因GC含量呈現(xiàn)GC1s>GC3s>GC2s規(guī)律,且它們的GC含量都小于50%,分別為45.45%、48.00%、46.48%、46.35%、45.05%、44.79%?;ㄉ⒂筒?、亞麻、玉米、水稻、高粱以及擬南芥FAD2基因的GC3s含量都大于50%,說明這7種作物FAD2基因在編碼時(shí)偏好使用G或C結(jié)尾的密碼子。陸地棉、大豆、蓖麻、千年桐、油桐FAD2基因的GC3s含量小于50%,說明這5種作物FAD2基因在編碼時(shí)偏好使用A或T結(jié)尾的密碼子。
2.2FAD2基因密碼子使用特性分析
用CodonW1.4.2軟件計(jì)算12種作物FAD2基因密碼子的RSCU值(表3)。在12種作物中,密碼子CTC的RSCU值都大于1,屬于共同偏好使用的密碼子,而密碼子CTA、ATA、GTA、AGT、CCC的 RSCU值小于1,屬于使用頻率較低的密碼子。進(jìn)一步分析發(fā)現(xiàn),密碼子ATC、AAG的RSCU值分別只在大豆、棉花中小于1,在其他11個(gè)作物中都是高頻使用的密碼子;密碼子CTG、GCG在玉米、水稻、高粱中高度偏好使用,但在8種油料作物和擬南芥中RSCU值都小于1;TCC只在兩種木本油料作物中是低頻密碼子。
綜上,F(xiàn)AD2基因在12種作物中,每個(gè)氨基酸在同義密碼子使用上都存在著明顯的不同,每種作物都有自己偏好使用的密碼子。在基因工程中可以根據(jù)每種作物FAD2基因的密碼子使用特征來設(shè)計(jì)基因序列,優(yōu)化基因密碼子,盡量避免使用頻率低的密碼子,使外源基因在受體物種中能夠高效穩(wěn)定地表達(dá)。
2.3基于密碼子用法和CDS序列的聚類分析
基于FAD2基因密碼子用法的聚類結(jié)果見圖1。12種作物可以分為兩大類,第一大類包括8種油料作物和擬南芥。其中,屬于油桐屬的油桐、千年桐最先聚在一起,后與同為大戟科的蓖麻聚為一小類;屬于蝶形花科的花生、大豆單獨(dú)聚為一小類;油菜和擬南芥為十字花科作物,油菜先與亞麻聚在一起,后與擬南芥聚為一類。另一大類包括3種禾本科作物玉米、水稻、高粱。這一結(jié)果與FAD2基因基于CDS序列的聚類結(jié)果(圖2)基本相符。由此可見,F(xiàn)AD2基因密碼子偏好性差異大小與物種的親緣關(guān)系遠(yuǎn)近有關(guān),親緣關(guān)系越遠(yuǎn),基因密碼子偏好性差異越大,親緣關(guān)系越近,密碼子偏好性差異越小?;贔AD2基因密碼子用法的聚類能很好地反映出植物之間的親緣關(guān)系。
3討論
影響密碼子使用偏好性的因素很多,如基因堿基組成、表達(dá)水平等[9,10],許多研究都表明禾本科作物GC含量高,雙子葉作物GC含量低[11,12]。禾本科作物少用或避免使用以A或T結(jié)尾的密碼子,偏好于使用以G或C結(jié)尾的密碼子,而雙子葉作物則相反[13,14]。本研究對(duì)8種油料作物(雙子葉)、3種禾本科作物(單子葉)和擬南芥(雙子葉)共12種作物的FAD2基因分析發(fā)現(xiàn),玉米、水稻、高粱3種禾本科作物FAD2基因GC含量都超過了60%,比雙子葉作物高,和前人研究結(jié)果一致[15,16]。但油料作物油菜、亞麻雖為雙子葉作物,GC含量在55%左右,超過了50%,這一結(jié)果與前人研究結(jié)果不符[15,16],出現(xiàn)這種現(xiàn)象可能是由于與前人分析的基因及作物不同造成的。進(jìn)一步從ENC值和GC3s含量上看,玉米、水稻、高粱的GC3s含量都很高,玉米、水稻都在95%以上,高粱為87.37%,油菜和亞麻GC3s也在70%左右;同時(shí)玉米和水稻的ENC值都小于30,高粱的為35.48,油菜和亞麻分別為45.49和48.58,由此可知玉米、水稻、高粱、油菜、亞麻密碼子偏好性較強(qiáng)或一般。因此推測,GC堿基含量的多少可能會(huì)導(dǎo)致FAD2基因密碼子偏好性的強(qiáng)弱。
密碼子作為聯(lián)系核酸和蛋白質(zhì)的紐帶,可用來推測基因組內(nèi)部或基因組間的演化關(guān)系,即不同作物的同一基因或同一作物的不同基因?qū)γ艽a子的用法特征有所不同,這種密碼子使用偏好性差異大小與作物的親緣關(guān)系遠(yuǎn)近有關(guān),親緣關(guān)系越遠(yuǎn),密碼子偏好性差異越大,親緣關(guān)系越近,密碼子偏好性差異越小[17]。對(duì)8種油料作物、3種禾本科作物和擬南芥FAD2基因密碼子用法進(jìn)行了聚類分析,并與基于FAD2基因CDS序列的聚類分析進(jìn)行了比較。兩種方法的聚類結(jié)果對(duì)比顯示,12種作物親緣關(guān)系大體上是一致的,驗(yàn)證了前人的結(jié)論:在基因類型和功能一定的情況下,進(jìn)化上親緣關(guān)系較近的作物間,同義密碼子的用法相似[15]。兩種聚類結(jié)果有一些作物在位置上存在差異,這種現(xiàn)象在前人的研究中也出現(xiàn)過[16],比如玉米、水稻、高粱三者之間的親緣關(guān)系,從基因組學(xué)上來說[18],玉米與高粱的親緣關(guān)系更近一些,但在基于FAD2基因密碼子用法的作物聚類分析中,玉米先與水稻聚在一起,后又與高粱聚為一類;油菜和擬南芥為十字花科作物,亞麻屬于薔薇亞綱作物,從親緣關(guān)系上來說,油菜與擬南芥應(yīng)更近一些,但在FAD2基因密碼子用法上,油菜與亞麻比擬南芥要近些;而蝶形花科的花生與大豆的FAD2基因,在密碼子使用上很相似,但在FAD2基因CDS序列上存在較大的差異。出現(xiàn)這些現(xiàn)象可能是由于本研究只選取了一個(gè)FAD2基因,分析的作物種類也太少,在統(tǒng)計(jì)計(jì)算上可能出現(xiàn)一些誤差。單基因在進(jìn)化上也可能存在較大的突變,導(dǎo)致其密碼子使用偏好性發(fā)生較大變化,因而表現(xiàn)出與真實(shí)的分類地位不同[15]。如果多選用一些基因,作物基于密碼子用法的聚類分析和基于基因CDS序列的聚類分析可能更接近于真實(shí)的系統(tǒng)分類。目前在基于分子序列的系統(tǒng)發(fā)育分析中,基于編碼區(qū)密碼子用法的聚類分析可為系統(tǒng)發(fā)育分析提供可靠信息,可作為各種系統(tǒng)發(fā)育分析方法的重要補(bǔ)充,用于作物進(jìn)化關(guān)系和分子進(jìn)化機(jī)制研究。
參考文獻(xiàn):
[1]張洪濤, 單雷, 畢玉平.n-6和n-3多不飽和脂肪酸在人和動(dòng)物體內(nèi)的功能關(guān)系[J]. 山東農(nóng)業(yè)科學(xué),2006, 2:115-120.
[2]Liu Q, Bnibaker C L, Green A G, et al. Evolution of the FAD2-1 fatty acid desaturase 5′UTR intron and the molecular system atics of Gossypium (Malvaceae)[J]. American Journal of Botanv, 2001, 88(1): 92-102.
[3]Okuley J, Lightner J, Feldmann K, et a1. Arabidopsis FAD2 gene encodes the enzyme that is essential for polyunsaturated lipid synthesis[J]. Plant Cell, 1994, 6(1): 147-158.
[4]Wang M H, Liu M X, Li D K, et a1.Cloning and protoplast transient expression of BnFAD2 promoter in Brassica napus[J].Journal of Agricultural Science and Technology, 2009, 11(5):96-101.
[5]Heppard E P, Kinney A J, Stecca K L, et a1. Developmental and growth temperature regulation of two different microsomal ω-6 desaturase genes in soybeans[J]. Plant Physiol., 1996, 110(1): 311-319.
[6]Sharp P M, Li W H. An evolutionary perspective on synonymous codon usage in unicellular organisms [J]. Journal Molecular Evolution, 1986, 24(1-2): 28-38.
[7]Gupta S K, Bhattacharyya T K, Ghosh T C. Synonymous codon usage in lactococcus lactis: mutational bias versus translational selection[J]. Journal of Biomolecular Structure and Dynamics, 2004, 21(4): 1-9.
[8]王鳳德, 李利斌, 李化銀, 等. 大白菜GIF蛋白家族的生物信息學(xué)分析[J]. 山東農(nóng)業(yè)科學(xué), 2012, 44(1): 1-5.
[9]Carlini D B,Chen Y,Stephan W.The relationship between third-codon position nucleotide content,cocon bias,mRNA secondary structure and gene expression in the drosopilid alcohol dehydrogenase genes Adh and Adhr[J]. Genetics,2001,159(2):623-633.
[10]Karlin S, Campbell A M, Mrazek J. Comparative DNA analysis across diverse genomes [J]. Annual Reviews of Genetics, 1998, 32: 185-225.
[11]Wang H C, Hickey D A. Rapid divergence of codon usage patterns within the rice genome [J]. BMC Evolutionary Biology, 2007, 7(Suppl.1): 1-6.
[12]Liu H M, He R, Zhang H Y, et al. Analysis of synonymous codon usage in Zea mays [J]. Molecular Biology Reports, 2010, 37(2): 677-684.
[13]Wang L, Roossinck M J. Comparative analysis of expressed sequences reveals a conserved pattern of optimal codon usage in plants [J]. Plant Molecular Biology.2006, 61(4-5):699-710.
[14]劉慶坡, 馮英, 董輝. 20個(gè)物種同義密碼子偏性的比較分析[J]. 西北農(nóng)林科技大學(xué)學(xué)報(bào), 2004, 32(7): 67-71.
[15]劉漢梅,趙耀,顧勇,等.幾種植物waxy基因的密碼子用法特性分析[J]. 核農(nóng)學(xué)報(bào),2010,24(3):476-481.
[16]晁岳恩, 吳政卿, 楊會(huì)民, 等. 11種植物psbA基因的密碼子偏好性及聚類分析[J]. 核農(nóng)學(xué)報(bào), 2011, 25(5): 927-932.
[17]胡桂冰, 張上隆, 徐昌杰, 等. 不同種類柑橘的密碼子用法分析[J]. 華南農(nóng)業(yè)大學(xué)學(xué)報(bào), 2006, 27(1): 13-16.
[18]Hulbert S H, Richter T E, Axtell J D, et al. Genetic mapping and characterization of sorghum and related crops by means of maize DNA probes[J]. Proceedings of the National Academy of Sciences of the United States of America, 1990, 87(11): 4251- 4255.