周麗霞 曹紅星
摘?要:該研究從NCBI網站下載油棕全基因組序列信息,從The?Arabidopsis?Information?Resource(TAIR)數據庫中下載得到擬南芥WRKY轉錄因子序列,并在油棕基因組數據庫中進行BLAST同源序列比對分析,通過NCBI在線工具CDD和PFAM數據庫進行蛋白結構與分析,剔除無WRKY結構域的系列,利用生物信息學方法對油棕WRKY轉錄因子進行分析及功能預測。結果表明:(1)從油棕基因組數據庫中發(fā)掘WRKY轉錄因子95個,該WRKY轉錄因子蛋白質所編碼氨基酸大小為116~1?303?bp,95個均為親水性蛋白,總體為不穩(wěn)定蛋白(EgWRKY25和EgWRKY56除外),60個蛋白以α-螺旋為主要二級結構元件,35個以無規(guī)卷曲為主要二級結構元件。(2)保守結構域系統(tǒng)進化樹結果表明,油棕WRKY轉錄因子家族蛋白主要分為三大類,即I、Ⅱ和Ⅲ類,其中I類分為I?C、I?N亞類,Ⅱ類分為Ⅱ?a、Ⅱ?b、Ⅱ?c和Ⅱ?d亞類。(3)內含子和外顯子結構顯示,EgWRKY基因結構進化高度保守。以上結果為油棕WRKY轉錄因子的挖掘、功能分析及分子生物學研究奠定了基礎,同時為分子育種和遺傳改良提供了參考。
關鍵詞:油棕,基因組,WRKY轉錄因子,生物信息學,表達分析
中圖分類號:Q943
文獻標識碼:A
文章編號:1000-3142(2020)07-0977-11
Abstract:Genome-wide?sequence?information?of?oil?palm?from?NCBI?website,and?the?WRKY?transcription?factor?sequence?from?The?Arabidopsis?Information?Resource?(TAIR)?Database?were?downloaded,BLAST?homology?sequence?alignment?analysis?was?carried?out?in?oil?palm?genome?database.?Protein?structure?and?analysis?were?carried?out?through?CDD?and?PFAM?database?of?NCBI?online?tool,and?the?series?without?WRKY?domain?were?eliminated.?Bioinformatics?analysis?and?functional?prediction?of?WRKY?transcription?factor?in?oil?palm.?The?results?were?as?follows:(1)?A?total?of?95?EgWRKY?transcription?factors?were?excavated,and?they?encoded?116-1?303?bp?amino?acids,predicting?hydrophilic?and?unstable?(except?for?EgWRKY25?and?EgWRKY56).?The?main?structure?of?60?EgWRKY?proteins?was?α-helix,and?the?remaining?35?proteins?were?irregular?curl.?(2)?The?phylogenetic?analysis?on?conserved?domain?showed?that?EgWRKY?transcription?factor?family?proteins?were?divided?into?three?categories?(I,Ⅱ?and?Ⅲ).?Category?I?could?be?separated?into?I?C?and?I?N,and?Category?Ⅱ?was?classified?into?Ⅱ?a,Ⅱ?b,Ⅱ?c?and?Ⅱ?d.??(3)?The?intron-exon?structure?analysis?revealed?that?structures?of?EgWRKY?gene?were?highly?conserved.?This?research?will?lay?a?foundation?for?the?study?of?WRKY?transcription?factor?exacavation,function?analysis,and?molecular?biology?of?oil?palm?and?provide?references?for?its?genetic?modification?and?molecular?breeding.
Key?words:oil?palm,genome,WRKY?transcription?factors,bioinformatics,expression?and?analysis
植物經過長期的進化,自身形成了一套對抗不良環(huán)境的適應機制,植物受到脅迫后,通過相應的信號傳遞途徑,誘導相關基因的表達以抵御脅迫,而基因的表達受到轉錄因子的調控(謝政文等,2016)。轉錄因子又稱反式作用因子,其作為一類重要的調控基因,主要通過與基因啟動子區(qū)域中的順式作用元件結合來發(fā)揮調控作用,近年來已成為基因挖掘與功能分析領域的研究熱點(賈翠玲和侯和勝,2010)。轉錄因子的特點為含有DNA結合域、轉錄調控區(qū)、核定位信號區(qū)及寡聚化位點等結構。根據DNA結合域結構的不同,轉錄因子又可分為MYB、WRKY、NAC、Zinx?finger(鋅指蛋白)等諸多家族(伍林濤等,2013)。
WRKY作為植物中最大的轉錄因子家族之一,通過結合植物次生代謝產物合成途徑關鍵酶基因的啟動子元件來調控植物的代謝過程(丁蒙蒙等,2018)。WRKY的N-末端具有7個高度保守氨基酸殘基WRKYGQK,C端有1個非典型的鋅指結構,其結構域由近60個氨基酸組成。根據WRKY結構域的數目及鋅指結構的類型,WRKY蛋白可分為三個類型:第一類為含有2個WRKY結構域,鋅指結構的類型為C2H2;第二類為含有1個WRKY結構域,鋅指結構的類型為C2H2;第三類為含有1個WRKY結構域,鋅指結構的類型為C2HC(伍林濤等,2013)。WRKY?cDNA最初是從甘薯中克隆出來的(Ishiguro?&?Nakamura,1994),隨后在其他植物如歐芹(Rushton?et?al.,1995)、野燕麥(Rushton?et?al.,1996)、擬南芥(Pater?et?al.,1996)、水稻(孫利軍等,2014)、棗樹(Xue?et?al.,2019)等不同物種中分離鑒定出來。谷彥冰等(2016)利用WRKY保守域全蛋白序列鑒定出61個桃WRKY基因,通過生物信息學分析發(fā)現桃WRKY蛋白分為I、Ⅱ和Ⅲ類型,應用半定量和熒光定量PCR技術發(fā)現有16個WRKY基因均在桃的根、莖、葉、花和果重表達。劉潮等(2017)基于桑樹全基因組蛋白數據庫,鑒定出55個桑樹WRKY基因,通過系統(tǒng)進化分析將WRKY蛋白分為I、Ⅱ和Ⅲ類型,應用保守結構域分析發(fā)現WRKY蛋白序列高度保守,在植物抵御非生物脅迫過程中發(fā)揮作用。包昌艷等(2018)應用“紅陽”獼猴桃全基因組數據,鑒定出89個WRKY基因,通過進化分析發(fā)現WRKY蛋白可分為I、Ⅱ和Ⅲ類型,有33個WRKY基因在獼猴桃根、葉、花和果四個器官中均有顯著表達。Fei?et?al.(2019)從隴南大紅袍花椒中分離鑒定出38個WRKY家族成員,其中ZbWRKY33是對干旱脅迫反應最敏感的成員之一,通過直接與乙烯合成前體基因asc結合調節(jié)花椒抵御干旱的能力。由此可見,諸多植物中WRKY轉錄因子均得到鑒定與分析,但目前針對油棕WRKY轉錄因子基因及蛋白質的鑒定與生物信息學分析的研究鮮見報道,本研究基于油棕基因組數據,利用生物信息學方法全面分析油棕WRKY轉錄因子家族結構及特征,為深入研究WRKY轉錄因子家族的生物學功能奠定基礎。
1?材料與方法
1.1?EgWRKY序列獲取與鑒定
油棕全基因組序列從NCBI下載獲得,擬南芥WRKY基因序列從The?Arabidopsis?Information?Resource(TAIR)數據庫中下載獲得(http://www.arabidopsis.org),以擬南芥WRKY序列為探針,閾值設定為e-10,在油棕基因組數據庫中進行同源序列比對分析得到油棕WRKY基因序列,將得到的油棕WRKY基因序列在美國麻省理工學院在線基因掃描服務器(The?GENSCAN?Web?Server?at?MIT)搜索以獲得WRKY蛋白序列,通過NCBI在線工具CDD(http://www.ncbi.nlm.nih.gov/cdd)和PFAM數據庫(http://pfam.xfam.org/)進行蛋白結構域分析,剔除無WRKY保守結構域的蛋白序列。
1.2?方法
1.2.1?EgWRKY蛋白理化性質分析?利用ProtParam分析EgWRKY蛋白的理化性質,利用NetPhos?3.1?Server和DictyOGlyc?1.1?Server預測氨基酸序列磷酸化及O-糖基化修飾情況,利用ProtScale分析蛋白質的親/疏水性,利用SignalP和ProtComp預測蛋白的信號肽和亞細胞定位預測,應用SOPMA預測蛋白的二級結構。
1.2.2?EgWRKY的進化樹、外顯子及內含子分析
應用MEGA?6.06軟件構建EgWRKY進化樹,執(zhí)行參數為Neighbor-Joining,Bootstrap重復1?000次。
2?結果與分析
2.1?EgWRKY轉錄因子家族成員基本信息
基于油棕全基因組數據及擬南芥WRKY基因序列,通過BLAST搜索同源序列和WRKY蛋白保守結構域鑒定,共挖掘95個油棕WRKY轉錄因子成員。由表1可知,該95個蛋白質所含氨基酸大小為116~1?303?bp,其中蛋白氨基酸數目小于300?aa的基因序列占35.8%,介于300~700?aa的基因序列占57.9%,大于700?aa的基因序列占6.3%。
2.2?EgWRKY蛋白理化性質分析
利用ProtParam在線軟件(http://expasy.org/tools/protparam.html)分析EgWRKY蛋白的基本性質,預測結果如表2所示。95個WRKY蛋白中,56個蛋白的理論等電點(pI)小于7,39個蛋白的pI大于7,pI最小值為4.74(EgWRKY73),最大值為10.18(EgWRKY84),平均pI為7.15;EgWRKY25和EgWRKY56蛋白質的不穩(wěn)定系數小于40,為穩(wěn)定蛋白,其余93個EgWRKY蛋白的不穩(wěn)定系數大于40,為不穩(wěn)定蛋白,該結果表明EgWRKY轉錄因子家族大多為不穩(wěn)定蛋白。利用NetPhos?3.1?Server在線軟件(http://www.cbs.dtu.dk/services/NetPhos/)預測氨基酸序列磷酸化;利用DictyOGlyc?1.1?Server在線軟件(http://www.cbs.dtu.dk/services/DictyOGlyc/)預測氨基酸序列的O-糖基化修飾情況,發(fā)現平均磷酸化位點有37.8個,O-糖基化位點有1.6個;利用ProtScale在線軟件(https://web.expasy.org/protscale/)分析蛋白質的親/疏水性,從EgWRKY蛋白的脂肪系數來看,該95個EgWRKY蛋白的脂肪系數均小于100,該結果表明其均為親水性蛋白;利用SignalP?5.0在線軟件(http://www.cbs.dtu.dk/services/SignalP/)預測蛋白的信號肽,發(fā)現5個EgWRKY蛋白存在信號肽(EgWRKY29、EgWRKY38、EgWRKY45、EgWRKY63及EgWRKY87),為分泌蛋白;利用ProtComp?9.0(http://linux1.softberry.com/berry.phtml?topic=protcomppl&group=programs&subgroup=proloc)在線軟件預測蛋白亞細胞定位,結果表明95個EgWRKY蛋白中有84個定位在細胞核中,占總蛋白的88.3%,11個在細胞質中,推測可能參與細胞質基因的轉錄調控;應用SOPMA在線軟件(https://npsa-prabi.ibcp.fr/cgi-bin/np?sa_automat.pl?page=npsa_sopma.html)預測蛋白的二級結構,發(fā)現所有EgWRKY蛋白的二級結構均有4種,即α-螺旋、β-轉角、無規(guī)卷曲及延伸鏈,其中60個EgWRKY蛋白以α-螺旋為主要結構,無規(guī)卷曲為次要結構,35個以無規(guī)卷曲為主要結構,α-螺旋為次要結構,β-轉角及延伸鏈所占比例較少。
2.3?EgWRKY的進化樹分析
利用MEGA?6.06對油棕95個WRKY轉錄因子蛋白的保守結構域進行系統(tǒng)進化樹分析,結果如圖1所示。油棕WRKY蛋白主要分為三大類,即Ⅰ、Ⅱ、Ⅲ類。其中,根據WRKY保守結構域所處的位置,將第I類分為I?N和I?C兩個亞類;第Ⅱ類含有1個鋅指結構和1個WRKY保守結構域,根據鋅指結構的不同,又將其分為Ⅱ?a、Ⅱ?b、Ⅱ?c及Ⅱ?d四個亞類;第Ⅲ類是含有2個WRKY保守結構域。
2.4?油棕WRKY外顯子及內含子
通過油棕基因組數據分析得到WRKY轉錄因子基因外顯子和內含子的結構分布示意圖(圖2)。EgWRKY轉錄因子家族成員所含內含子數的范圍為0~12個,平均每個EgWRKY含內含子數為2.99個。其中,EgWRKY42含有內含子數最多(12個),轉錄因子基因長度變化范圍為477?bp(EgWRKY08)至89?167?bp(EgWRKY71),平均大小為5?992?bp,圖2中陰影部分的數字代表該外顯子翻譯成部分WRKY保守結構域的長度。EgWRKY基因家族的結構變化較大,說明在長期進化過程中油棕基因組經歷了較大的變異選擇。
3?討論與結論
隨著高通量測序技術的成熟,WRKY作為調控植物多種生理過程的轉錄因子家族之一,已在多個物種中被挖掘及鑒定,如擬南芥基因組中含有72個WRKY轉錄因子(Ulker?&?Somssich,2004),黃瓜基因組中有132個WRKY轉錄因子(谷彥冰等,2015),棉花基因組中有116個WRKY轉錄因子(Dou?et?al.,2014),橡膠樹基因組中含有81個WRKY轉錄因子(Li?et?al.,2014),桑樹基因組中含有54個WRKY轉錄因子(Baranwal?et?al.,2016)及鷹嘴豆基因組中含有70個WRKY轉錄因子(Waqas?et?al.,2019)。本研究通過分析油棕基因組數據,挖掘出95個WRKY轉錄因子,WRKY家族中轉錄因子的數目不僅與物種的基因組相關,而且與植物在長期進化過程中所受的外界環(huán)境影響有關。油棕WRKY轉錄因子數目與其他物種相比,屬于中等數目的類型,該結果可推測油棕在自然進化過程中,WRKY基因家族受到了一定的外界環(huán)境壓力。
本研究通過預測油棕WRKY蛋白的二級結構,發(fā)現其以α-螺旋及無規(guī)卷曲為主,這與丁蒙蒙等(2018)報道結果相一致。本研究對油棕WRKY保守結構域進行系統(tǒng)進化分析,將油棕WRKY家族蛋白分為三大類,即I、Ⅱ、Ⅲ類,其中Ⅱ類又分為四個亞類。本研究中油棕95個WRKY家族成員均含有WRKYGQK保守基序,Ⅱ類均含有1個鋅指結構及1個WRKY保守結構域,根據鋅指結構和位置的不同又分為四個亞類,類似分類在擬南芥及桑樹等物種中發(fā)現,該結果可推測植物WRKY基因家族在結構上具有高度保守性。油棕作為熱帶地區(qū)重要的油料作物之一,低溫氣候嚴重限制著油棕的大面積種植,若能挖掘與低溫脅迫相關的調節(jié)基因,并對其功能進行預測,運用分子技術對油棕品種進行改良,提高其抗寒性,從而實現油棕大面積的種植。
參考文獻:
BAO?CY,DENG?L,ZHOU?J,et?al.,2018.?Genome-wide?identification?and?analysis?of?the?WRKY?transcription?factor?gene?family?in?kiwi?fruit[J].?Mol?Plant?Breed,2(12):301-310.[包昌艷,鄧浪,周軍,等,2018.?獼猴桃WRKY轉錄因子家族全基因組鑒定與分析[J].?分子植物育種,2(12):301-310.]
BARANWAL?VK,NEGI?N,KHURANA?P,2016.?Genome-wide?identification?and?structural,functional?and?evolutionary?analysis?of?WRKY?components?of?mulberry[J].?Sci?Reports,6:30794-30807.
DING?MM,SHI?XD,GU?YX,et?al.,2018.?Transcriptome-based?excavation?and?analysis?of?MYB?family?transcription?factors?in?Phoebe?zhennan[J].?Guihaia,38(1):90-100.[丁蒙蒙,時小東,顧雨熹,等,2018.?基于轉錄組的楠木MYB轉錄因子的挖掘及分析[J].?廣西植物,38(1):90-100.]
DOU?LL,ZHANG?XH,PANG?CY,et?al.,2014.?Genome-wide?analysis?of?the?WRKY?gene?family?in?cotton[J].?Mol?Genet?Genom,289(6):1103-1121.
FEI?XT,HOU?LX,SHI?JW,et?al,2019.?Patterns?of?drought?response?of?38?WRKY?transcription?factors?of?Zanthoxylum?bungeanum?Maxim[J].?Int?J?Mol?Sci,20(1):68-85.
GU?YB,JI?ZR,CHI?FM,et?al.,2016.?Genome-wide?identification?and?expression?analysis?of?the?WRKY?gene?family?in?peach[J].?Hereditas,38(3):254-270.[谷彥冰,冀志蕊,遲福梅,等,2016.?桃WRKY基因家族全基因組鑒定和表達分析[J].?遺傳,38(3):254-270.]
GU?YB,JI?ZR,CHI?FM,et?al.,2015.?Bioinformatics?and?expression?analysis?of?the?WRKY?gene?family?in?apple[J].?Sci?Agric?Sin,48(16):3221-3238.[谷彥冰,冀志蕊,遲福梅,等,2015.?蘋果WRKY基因家族生物信息學及表達分析[J].?中國農業(yè)科學,48(16):3221-3238.]
ISHIGURO?S,NAKAMURA?K,1994.?Characterization?of?a?cDNA?encoding?a?novel?DNA-binding?protein,SPF1,that?recognizes?SP8?sequences?in?the?5?upstream?regions?of?genes?coding?for?sporamin?and?β-amylase?from?sweet?potato[J].?Mol?Genet?Genet,244(6):563-571.
JIA?CL,HOU?HS,2010.?Structure?of?plant?WRKY?transcription?factors?and?their?roles?in?plant?defense?response[J].?Tianjin?Agric?Sci,16(2):21-26.[賈翠玲,侯和勝,2010.?植物WRKY轉錄因子的結構特點及其在植物防衛(wèi)反應中的作用[J].?植物生理與生物技術,16(2):21-26.]
LI?HL,GUO?D,YANG?ZP,et?al.,2014.?Genome-wide?identification?and?characterization?of?WRKY?gene?family?in?Hevea?brasiliensis[J].?Genomics,104(1):14-23.
LIU?C,HAN?LH,SONG?PB,et?al.,2017.?Genome-wide?identification?and?bioinformatics?analysis?for?mulberry?WRKY?transcription?factors[J].?J?S?Agric,48(9):1691-1699.[劉潮,韓利紅,宋培兵,等,2017.?桑樹WRKY轉錄因子的全基因組鑒定及生物信息學分析[J].?南方農業(yè)學報,48(9):1691-1699.]
PATER?S,GRECO?V,PHAM?K,et?al.,1996.?Characterization?of?a?zinc?dependent?transcriptional?activator?from?Arabidopsis[J].?Nucl?Acids?Res,24(23):4624-4631.
RUSHTON?PJ,MACDONALD?H,HUTTLY?AK,et?al.,1995.?Members?of?a?new?family?of?DNA-binding?proteins?bind?to?a?conserved?cis-element?in?the?promoters?of?α-Amy2?genes[J].?Plant?Mol?Biol,29(4):691-702.
RUSHTON?PJ,TORRES?JT,PARNISKE?M,et?al.,1996.?Interaction?of?elicitor-induced?DNA-binding?proteins?with?elicitor?response?elements?in?the?promoters?of?parsley?PR1?genes[J].?EMBO?J,15?(20):5690-5700.
SUN?LJ,HUANG?L,LI?DY,et?al.,2014.?Comprehensive?expression?analysis?suggests?overlapping?of?rice?OsWRKY?transcription?factor?genes?during?abiotic?stress?responses[J].?Plant?Physiol?J,50(11):1651-1658.[孫利軍,黃磊,李大勇,等,2014.?水稻OsWRKY轉錄因子對非生物脅迫響應的重疊表達特性分析[J].?植物生理學報,50(11):1651-1658.]
ULKER?B,SOMSSICH?IE,2004.?WRKY?transcription?factors:From?DNA?binding?towards?biological?function[J].?Curr?Opin?Plant?Biol,7(5):491-498.
WAQAS?M,AZHAR?MT,RANA?IA,et?al.,2019.?Genome-wide?identification?and?expression?analyses?of?WRKY?transcription?factor?family?members?from?chickpea?(Cicer?arietinum?L.)?reveal?their?role?in?abiotic?stress-responses[J].?Genes?Genom,41(4):467-481.
WU?LT,DU?CF,ZHANG?MQ,et?al.,2013.?The?structure?and?function?of?WRKY?transcription?factors?in?abiotic?and?biotic?stress[J].?Mol?Plant?Breed,11(4):634-638.[伍林濤,杜才富,張敏琴,等,2013.?WRKY轉錄因子的結構及其在植物抗逆境脅迫中的功能[J].?分子植物育種,11(4):634-638.]
XIE?ZW,WANG?LJ,CHEN?JY,et?al.,2016.?Studies?on?WRKY?transcription?factors?and?their?biological?functions?in?plants[J].?J?Agric?Sci?Technol,18(3):46-54.[謝政文,王連軍,陳錦洋,等,2016.?植物WRKY轉錄因子及其生物學功能研究進展[J].?中國農業(yè)科技導報,18(3):46-54.]
XUE?CL,LI?HT,LIU?ZG,et?al.,2019.?Genome-wide?analysis?of?the?WRKY?gene?family?and?their?positive?responses?to?phytoplasma?invasion?in?Chinese?jujube[J].?BMC?Genom,20(1):?464-478.
(責任編輯?周翠鳴)