王鵬良+韋翠娥+覃柳輝+楊利平+張照遠(yuǎn)+吳幼媚+覃子海
摘 要:WRKY轉(zhuǎn)錄因子參與植物生長(zhǎng)發(fā)育、抗病蟲(chóng)、耐逆境等眾多過(guò)程,并在其中起重要作用。為了研究WRKY在赤桉中的結(jié)構(gòu)和功能,本研究利用電子克隆的方法克隆了赤桉與AtWRKY50高度同源的一個(gè)WRKY基因EcWRKY50,并利用生物信息學(xué)方法對(duì)該基因編碼蛋白的氨基酸組成,理化性質(zhì),亞細(xì)胞定位和高級(jí)結(jié)構(gòu)等方面進(jìn)行預(yù)測(cè)和分析。結(jié)果表明,EcWRKY50基因全長(zhǎng)為585 bp,包含一個(gè)480 bp的開(kāi)放閱讀框,編碼159個(gè)氨基酸,該基因蛋白分子量為18.187 KD,理論等電點(diǎn)為5.45。該蛋白含有一個(gè)WRKYGKK的保守結(jié)構(gòu)域和C2H2結(jié)構(gòu)域,屬于GroupⅡc成員,很可能在細(xì)胞質(zhì)中起轉(zhuǎn)錄和轉(zhuǎn)錄調(diào)控的作用;并對(duì)該蛋白進(jìn)行了同源性分析。這些研究為該基因功能的進(jìn)一步分析奠定了堅(jiān)實(shí)的基礎(chǔ)。
關(guān)鍵詞:赤桉 EcWRKY50轉(zhuǎn)錄因子 基因電子克隆 生物信息學(xué)分析
桉樹(shù)是桃金娘科(Myrtaceae)桉樹(shù)屬(Eucalyptus)的總稱,原產(chǎn)于澳大利亞及其附近島嶼。桉樹(shù)生長(zhǎng)迅速,輪伐周期短,用途廣泛,經(jīng)濟(jì)效益顯著,已經(jīng)成為我國(guó)主要的短周期工業(yè)用材樹(shù)種。
赤桉(Eucalyptus camaldulensis)是在澳大利亞分布最廣,引種較多的樹(shù)種[1 ]。赤桉其木材可制作高檔家具,工藝品,還可以作為鋸材、紙槳材、干材和薪炭林等重要用途,同時(shí)其對(duì)干旱[1 ],低溫[2-5 ],高溫[6 ]和鹽堿等逆境有較好的適應(yīng)能力,而且耐瘠薄。由于其良好耐逆性,赤桉已經(jīng)在全世界廣泛種植,而且種植面積呈日趨擴(kuò)大之勢(shì)。
WRKY轉(zhuǎn)錄因子是植物特有的最大的轉(zhuǎn)錄因子家族之一,WRKY轉(zhuǎn)錄因子由其N端的保守氨基酸WRKY而得名,由于其在不同的進(jìn)化模式,從而產(chǎn)生了多樣的WRKY基因成員[7 ]。研究人員已經(jīng)在水稻,短柄草等多種植物中鑒定出近百個(gè)WRKY基因成員[8-10 ],其成員廣泛參與植物的抗逆,抗病,生長(zhǎng)發(fā)育和衰老等多個(gè)生理代謝通路,并起重要作用[11]。WRKY50基因是WRKY轉(zhuǎn)錄因子家族基因的一個(gè)成員,但尚未見(jiàn)赤桉WRKY50基因克隆及分析的相關(guān)報(bào)道。
電子克?。↖n silico cloning)是在基因組或EST測(cè)序的基礎(chǔ)上,利用生物信息學(xué)手段進(jìn)行基因克隆的新方法[12 ]。本研究利用該技術(shù)開(kāi)展赤桉WRKY50轉(zhuǎn)錄因子的克隆及序列分析,并對(duì)基因編碼蛋白的氨基酸組成、理化性質(zhì)、結(jié)構(gòu)等多方面進(jìn)行分析和預(yù)測(cè),為該基因的實(shí)驗(yàn)克隆,功能分析及其應(yīng)用奠定良好基礎(chǔ)。
1 材料與方法
1.1 EST序列來(lái)源
2013年12月5日從dbEST/GenBank(http://www.ncbi.nlm.nih. gov/ nucest)中以FASTA格式下載58584條EST序列。
1.2 基因全長(zhǎng)的獲得
①利用Trimmer截去EST序列兩端的載體序列,再利用編寫的Perl腳本提取可能含有WRKY氨基酸的EST序列。
②利用NCBI中Blastx(http://blast.st-va.ncbi.nlm.nih.gov/Blast.cgi)對(duì)可能含有WRKY氨基酸的EST進(jìn)行比對(duì),其中數(shù)據(jù)庫(kù)為Nr(Non-redundant protein sequences)。
③利用NCBI中ORF Finder(http://www.ncbi.nlm.nih.gov/gorf/gorf.html)對(duì)含有WRKY保守結(jié)構(gòu)域的EST搜索開(kāi)放閱讀框(ORF, Open Reading Frame),得到WRKY轉(zhuǎn)錄因子全長(zhǎng)基因。
1.3 EcWRKY50基因編碼的蛋白質(zhì)生物信息學(xué)分析
① EcWRKY50蛋白氨基酸序列一級(jí)結(jié)構(gòu)的預(yù)測(cè) 利用ExPASy服務(wù)器(http:// www. expasy. org/ resources)中的ProtParam、Compute pI/Mw和ProtScale軟件預(yù)測(cè)EcWRKY50蛋白的氨基酸組成、分子量、等電點(diǎn)、疏水性/親水性、不穩(wěn)定系數(shù)及脂肪系數(shù)等。
②EcWRKY50蛋白的亞細(xì)胞定位 利用在線軟件PSORT(http://psort.hgc.jp/form. html),預(yù)測(cè)EcWRKY50蛋白的位置。
③EcWRKY50蛋白的二級(jí)結(jié)構(gòu)預(yù)測(cè) 利用SOPMA(http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)預(yù)測(cè)該蛋白二級(jí)結(jié)構(gòu)。
④EcWRKY50蛋白結(jié)構(gòu)域的三維結(jié)構(gòu)預(yù)測(cè) 利用ExPASy 中SWISS-MODEL workspace(http://swissmodel.expasy.org/)預(yù)測(cè)該蛋白的三維結(jié)構(gòu)。
⑤EcWRKY50基因的功能分類 利用ProtFun(http://www.cbs.dtu.dk/services/ ProtFun/)預(yù)測(cè)該基因的功能分類。
⑥EcWRKY50基因的同源性分析 利用NCBI中Blast程序?qū)cWRKY50蛋白進(jìn)行比對(duì),并選擇與該蛋白同源性高的不同物種構(gòu)建系統(tǒng)進(jìn)化樹(shù)。
2 結(jié)果
2.1 EcWRKY50基因的克隆
首先對(duì)下載的赤桉58584條EST序列兩端各截去25 bp,以去除載體序列,再以WRKY蛋白對(duì)應(yīng)的DNA為探針,利用自己編寫的perl腳本搜索到110條可能含有WRKY蛋白的EST序列。利用NCBI中Blastx程序?qū)?10條可能含有WRKY蛋白的EST序列進(jìn)行注釋,獲得17條含有WRKY的EST序列,再利用NCBI中ORF Finder對(duì)獲得的17條EST序列進(jìn)行開(kāi)放閱讀框的搜尋,只獲得1條擁有完整的開(kāi)放閱讀框的EST序列。該EST序列的長(zhǎng)度為585 bp,開(kāi)放閱讀框(63~542 bp)的長(zhǎng)度為480 bp,以ATG為起始密碼子,以TAG為終止密碼子,編碼159個(gè)氨基酸。其推導(dǎo)的氨基酸序列N端具有1個(gè)WRKYGKK的保守結(jié)構(gòu)域,C端具有Cx4-5Cx22-23HxH結(jié)構(gòu)域(圖1),因此認(rèn)為該基因?yàn)閃RKY家族基因成員。由于該基因與AtWRKY50高度同源,屬于WRKY家族基因GroupⅡc成員,故命名為EcWRKY50。
2.2 EcWRKY50蛋白氨基酸序列的一級(jí)結(jié)構(gòu)預(yù)測(cè)
利用ExPASy服務(wù)器中的ProtParam和Compute pI/Wm程序,預(yù)測(cè)EcWRKY50蛋白質(zhì)一級(jí)結(jié)構(gòu)的氨基酸組成、分子量、等電點(diǎn)、平均疏水性、不穩(wěn)定系數(shù)及脂肪系數(shù)等。由表1可見(jiàn),該蛋白的不穩(wěn)定系數(shù)為53.31,大于40,說(shuō)明該蛋白不太穩(wěn)定;平均疏水性為-1.136,說(shuō)明該蛋白可能是親水性蛋白。
由表2可知,該蛋白由20種氨基酸組成,其中Ser(S)含量最高,為10.1%,其次為Glu(E),占9.4%;Cys(C)和Trp(W)含量最低,均為1.3%。
疏/親水性是蛋白質(zhì)的重要屬性,其對(duì)蛋白質(zhì)二級(jí)結(jié)構(gòu)的預(yù)測(cè)和分析具有重要參考價(jià)值。因此利用ProtScale對(duì)EcWRKY50蛋白進(jìn)行疏/親水性分析,結(jié)果見(jiàn)表2。采用Kyte & Doolittle標(biāo)度計(jì)算,得到明顯的親水信號(hào),如圖2。圖2顯示,除了5個(gè)小峰表現(xiàn)疏水性外,整體表現(xiàn)為親水性,這再次表明該蛋白為親水性的不穩(wěn)定蛋白。
2.3 EcWRKY50蛋白的亞細(xì)胞定位
基因編碼的蛋白質(zhì)在細(xì)胞中的分布與該蛋白的功能緊密相關(guān),從而在一定程度上反映了該基因的功能。研究采用PSPORT程序預(yù)測(cè)EcWRKY50的可能分布位置,從表3來(lái)看,該蛋白分布在細(xì)胞質(zhì)中的可能性最大。
2.4 EcWRKY50蛋白二級(jí)結(jié)構(gòu)預(yù)測(cè)
蛋白質(zhì)的二級(jí)結(jié)構(gòu)是指多肽鏈骨架通過(guò)α螺旋、β折疊、β轉(zhuǎn)角和無(wú)規(guī)則卷曲等方式盤繞折疊而成。二級(jí)結(jié)構(gòu)預(yù)測(cè)結(jié)果,由表4,圖3表明,該蛋白由α螺旋、β折疊、延伸鏈和無(wú)規(guī)則卷曲構(gòu)成,其中α螺旋和無(wú)規(guī)則卷曲的比例較高,分別為25.16%和53.46%,延伸鏈和β折疊的比例相對(duì)較低,分別為14.47%和6.92%。
2.5 EcWRKY50蛋白結(jié)構(gòu)域的三維結(jié)構(gòu)預(yù)測(cè)
正常情況下蛋白質(zhì)并不是以完全伸展的多肽鏈而是以緊密折疊的結(jié)構(gòu)存在, 并且一個(gè)特定蛋白質(zhì)行使其功能的能力通常是由它的三維結(jié)構(gòu)或構(gòu)象決定。因此,研究利用ExPASy 中SWISS-MODEL workspace程序預(yù)測(cè)了其蛋白的三級(jí)結(jié)構(gòu),結(jié)果見(jiàn)圖4。
2.6 EcWRKY50的功能分類
基因功能分類是基因注釋過(guò)程中的重要環(huán)節(jié)之一。為了加強(qiáng)對(duì)EcWRKY50基因的認(rèn)識(shí),增加對(duì)該基因功能了解,研究對(duì)該基因進(jìn)行了功能分類,功能分類結(jié)果(見(jiàn)表5)表明,EcWRKY50最重要的功能是轉(zhuǎn)錄調(diào)控和轉(zhuǎn)錄,其概率分別為0.345和0.269,這符合轉(zhuǎn)錄因子的功能。
2.7 EcWRKY50基因的同源性分析
以EcWRKY50為探針,利用NCBI中Blast程序與reference protein數(shù)據(jù)庫(kù)進(jìn)行比對(duì),搜索到與該探針蛋白同源性較高的蛋白,這些蛋白基本上都是來(lái)自不同物種的WRKY50蛋白。研究選與該蛋白同源性高的橙子(Citrus sinensis),可可(Theobroma cacao),蓖麻(Ricinus communis),葡萄(Vitis vinifera),黃豆(Glycine max),鷹嘴豆(Cicer arietinum),蒺藜苜蓿(Medicago truncatula),擬南芥(Arabidopsis thaliana),琴葉擬南芥(Arabidopsis lyrata)9個(gè)物種的WRKY蛋白進(jìn)行氨基酸的多序列比對(duì)(見(jiàn)圖5),發(fā)現(xiàn)在保守結(jié)構(gòu)域上氨基酸相似度高,在非保守結(jié)構(gòu)域上氨基酸的變化較大。
研究利用上述9個(gè)物種的WRKY蛋白和EcWRKY50構(gòu)建系統(tǒng)進(jìn)化樹(shù),從圖6中顯示,親緣關(guān)系較近的擬南芥和琴葉擬南芥聚為一類,在一定程度上反映了物種間的親緣關(guān)系的遠(yuǎn)近。
3 討論
隨著EST計(jì)劃,基因組計(jì)劃的深入開(kāi)展,伴隨著測(cè)序技術(shù)的快速改進(jìn),產(chǎn)生的EST序列和基因組數(shù)據(jù)越來(lái)越多,基因組研究已經(jīng)開(kāi)始從結(jié)構(gòu)基因組學(xué)轉(zhuǎn)向功能基因組學(xué)的時(shí)代,獲得基因全長(zhǎng)是研究基因功能不可或缺的環(huán)節(jié)。在這樣的情況下,電子克隆應(yīng)用而生,其特點(diǎn)非常明顯,高效快速,成本低,對(duì)實(shí)驗(yàn)要求也低[13 ],勢(shì)必大大推動(dòng)功能基因組的研究。
在電子克隆過(guò)程中,探針的選擇對(duì)能否成功地獲得基因全長(zhǎng)起到重要作用,當(dāng)選擇的探針較長(zhǎng)時(shí),能較完整匹配的序列就少,減少了獲得全長(zhǎng)的可能性;當(dāng)選擇探針較短時(shí),能更多地匹配相應(yīng)序列,經(jīng)過(guò)對(duì)匹配序列的拼接,可獲得較多的序列,增加了獲得全長(zhǎng)的可能性;同時(shí)也增加了工作量。考慮到使用序列的來(lái)源不同(不同的樹(shù)種、單株或處理),通過(guò)電子克隆獲得的基因全長(zhǎng)與真實(shí)狀況下的基因可能存在差異[14 ],需要進(jìn)一步的實(shí)驗(yàn)證明。
WRKY基因家族擁有眾多成員,參與植物生長(zhǎng)發(fā)育,抗病蟲(chóng),耐逆境及衰老等許多方面起重要作用。據(jù)報(bào)道,AtWRKY50蛋白參與水楊酸和低油酸抑制茉莉酸信號(hào)的通路從而調(diào)控植物對(duì)病蟲(chóng)害的抗性[15 ]。實(shí)驗(yàn)利用電子克隆技術(shù)克隆EcWRKY50蛋白基因,并對(duì)其結(jié)構(gòu)和功能進(jìn)行了預(yù)測(cè),為進(jìn)一步利用實(shí)驗(yàn)手段研究該基因的結(jié)構(gòu)和功能奠定了堅(jiān)實(shí)的基礎(chǔ)。
參考文獻(xiàn)
[1] 鄒紹榮,羅建中,藍(lán)賀勝,等. 衛(wèi)閩赤桉幼林種源/家系的遺傳變異[J].桉樹(shù)科技,2004,64(1): 19-23.
[2] 吳良棟,陳強(qiáng),余青云,等. 福建南平引種赤桉和鄧恩桉試驗(yàn)[J]. 林業(yè)科技開(kāi)發(fā),2004,18(6):20- 22.
[3] 唐三定,李俊芳,俞一見(jiàn). 寒害天氣對(duì)永州市赤桉組培苗造林的影響[J]. 桉樹(shù)科技,2008,25(1):31-34.
[4] 湯勇華. 赤桉 8 號(hào)、 2 號(hào)無(wú)性系在閩東沿海山地適應(yīng)性試驗(yàn)初報(bào)[J]. 浙江林業(yè)科技,2006,26(4):24-26.
[5] 項(xiàng)東方,陳健波,陳崇征,等. 廣西耐寒桉樹(shù)研究進(jìn)展[J]. 廣西林業(yè)科學(xué),2002,31(4):178- 180.
[6] 鄭益興,段安安. 國(guó)內(nèi)外赤桉育種研究回顧及云南的現(xiàn)狀與對(duì)策[J]. 西南林學(xué)院學(xué)報(bào),1999,19(4):258-262.
[7] Agarwal,P.,Reddy,M.P.,Chikara,J. WRKY: its structure,evolutionary relationship,DNA- binding selectivity,role in stress tolerance and development of plants[J]. Mol Biol Rep,2011,38(6):3883-3896.
[8] 仇玉萍,荊邵娟,付堅(jiān),等. 13 個(gè)水稻 WRKY 基因的克隆及其表達(dá)譜分析[J]. 科學(xué)通報(bào),2004, 49(18):1860-1869.
[9] Ramamoorthy,R.,Jiang,S.-Y.,Kumar,N.,et al. A Comprehensive Transcriptional Profiling of the WRKY Gene Family in Rice Under Various Abiotic and Phytohormone Trea- tments[J]. Plant Cell Physiol 2008,49(6): 865-879.
[10] Tripathi,P.,Rabara,R.C.,Langum,T.J.,et al. The WRKY transcription factor family in Brachypodium distachyon[J]. BMC Genomics, 2012,13:270.
[11] Eulgem,T.,Rushton,P.J.,Robatzek,S.,et al. The WRKY superfamily of plant transcription factors[J]. Trends Plant Sci,2000,5(5): 199-206.
[12] 黃驥,張紅生,曹雅君,等. 水稻功能基因的電子克隆策略[J].中國(guó)水稻科學(xué),2002,16(4):295- 298.
[13] 胡皝,蕭浪濤. 生物信息學(xué)在新基因全長(zhǎng) cDNA 電子克隆中的應(yīng)用[J].生物技術(shù)通報(bào),2007,4(93-96).
[14] 李國(guó)印,闕友雄,許莉萍,等. 甘蔗 MYB2 轉(zhuǎn)錄因子的電子克隆和生物信息學(xué)分析[J]. 生物信息學(xué),2011,9(1):24-27.
[15] Gao,Q.M.,Venugopal,S.,Navarre,D.,et al.,A. Low oleic acid-derived repression of jasmonic acid-inducible defense responses requires the WRKY50 and WRKY51 proteins[J]. Plant Physiol,2011,155(1):464-76.
[6] 鄭益興,段安安. 國(guó)內(nèi)外赤桉育種研究回顧及云南的現(xiàn)狀與對(duì)策[J]. 西南林學(xué)院學(xué)報(bào),1999,19(4):258-262.
[7] Agarwal,P.,Reddy,M.P.,Chikara,J. WRKY: its structure,evolutionary relationship,DNA- binding selectivity,role in stress tolerance and development of plants[J]. Mol Biol Rep,2011,38(6):3883-3896.
[8] 仇玉萍,荊邵娟,付堅(jiān),等. 13 個(gè)水稻 WRKY 基因的克隆及其表達(dá)譜分析[J]. 科學(xué)通報(bào),2004, 49(18):1860-1869.
[9] Ramamoorthy,R.,Jiang,S.-Y.,Kumar,N.,et al. A Comprehensive Transcriptional Profiling of the WRKY Gene Family in Rice Under Various Abiotic and Phytohormone Trea- tments[J]. Plant Cell Physiol 2008,49(6): 865-879.
[10] Tripathi,P.,Rabara,R.C.,Langum,T.J.,et al. The WRKY transcription factor family in Brachypodium distachyon[J]. BMC Genomics, 2012,13:270.
[11] Eulgem,T.,Rushton,P.J.,Robatzek,S.,et al. The WRKY superfamily of plant transcription factors[J]. Trends Plant Sci,2000,5(5): 199-206.
[12] 黃驥,張紅生,曹雅君,等. 水稻功能基因的電子克隆策略[J].中國(guó)水稻科學(xué),2002,16(4):295- 298.
[13] 胡皝,蕭浪濤. 生物信息學(xué)在新基因全長(zhǎng) cDNA 電子克隆中的應(yīng)用[J].生物技術(shù)通報(bào),2007,4(93-96).
[14] 李國(guó)印,闕友雄,許莉萍,等. 甘蔗 MYB2 轉(zhuǎn)錄因子的電子克隆和生物信息學(xué)分析[J]. 生物信息學(xué),2011,9(1):24-27.
[15] Gao,Q.M.,Venugopal,S.,Navarre,D.,et al.,A. Low oleic acid-derived repression of jasmonic acid-inducible defense responses requires the WRKY50 and WRKY51 proteins[J]. Plant Physiol,2011,155(1):464-76.
[6] 鄭益興,段安安. 國(guó)內(nèi)外赤桉育種研究回顧及云南的現(xiàn)狀與對(duì)策[J]. 西南林學(xué)院學(xué)報(bào),1999,19(4):258-262.
[7] Agarwal,P.,Reddy,M.P.,Chikara,J. WRKY: its structure,evolutionary relationship,DNA- binding selectivity,role in stress tolerance and development of plants[J]. Mol Biol Rep,2011,38(6):3883-3896.
[8] 仇玉萍,荊邵娟,付堅(jiān),等. 13 個(gè)水稻 WRKY 基因的克隆及其表達(dá)譜分析[J]. 科學(xué)通報(bào),2004, 49(18):1860-1869.
[9] Ramamoorthy,R.,Jiang,S.-Y.,Kumar,N.,et al. A Comprehensive Transcriptional Profiling of the WRKY Gene Family in Rice Under Various Abiotic and Phytohormone Trea- tments[J]. Plant Cell Physiol 2008,49(6): 865-879.
[10] Tripathi,P.,Rabara,R.C.,Langum,T.J.,et al. The WRKY transcription factor family in Brachypodium distachyon[J]. BMC Genomics, 2012,13:270.
[11] Eulgem,T.,Rushton,P.J.,Robatzek,S.,et al. The WRKY superfamily of plant transcription factors[J]. Trends Plant Sci,2000,5(5): 199-206.
[12] 黃驥,張紅生,曹雅君,等. 水稻功能基因的電子克隆策略[J].中國(guó)水稻科學(xué),2002,16(4):295- 298.
[13] 胡皝,蕭浪濤. 生物信息學(xué)在新基因全長(zhǎng) cDNA 電子克隆中的應(yīng)用[J].生物技術(shù)通報(bào),2007,4(93-96).
[14] 李國(guó)印,闕友雄,許莉萍,等. 甘蔗 MYB2 轉(zhuǎn)錄因子的電子克隆和生物信息學(xué)分析[J]. 生物信息學(xué),2011,9(1):24-27.
[15] Gao,Q.M.,Venugopal,S.,Navarre,D.,et al.,A. Low oleic acid-derived repression of jasmonic acid-inducible defense responses requires the WRKY50 and WRKY51 proteins[J]. Plant Physiol,2011,155(1):464-76.