孫晶琦 許煒清 孫晨 許曉倩 陳晶晶 王曉立
摘 要:WRKY轉(zhuǎn)錄因子是植物中最大的轉(zhuǎn)錄調(diào)控家族之一,是調(diào)控植物許多生物過(guò)程信號(hào)網(wǎng)絡(luò)的組成部分,具有多種生物學(xué)功能。該研究根據(jù)已公布的擬南芥基因組中當(dāng)前確定的WRKY基因家族成員,利用其序列進(jìn)行結(jié)構(gòu)域的分析,從而確定WRKY基因家族的基本特征,并以此為基礎(chǔ),從毛果楊序列庫(kù)中篩選出WRKY基因家族的成員。再利用MEGA5軟件、在線(xiàn)工具ExpasyProtparma、BioEdit等進(jìn)行理化性質(zhì)分析、motif結(jié)構(gòu)對(duì)比、進(jìn)化樹(shù)構(gòu)建、基因表達(dá)分析等。結(jié)果表明:毛果楊WRKY基因家族20個(gè)成員編碼序列長(zhǎng)為189~624bp,有多個(gè)染色體定位重復(fù)分布于第1、5、14號(hào)染色體上。WRKY蛋白均定位于細(xì)胞外,親水性較差,具有較高的脂溶性和不穩(wěn)定性。20個(gè)WRKY基因均在毛果楊中表達(dá),但有明顯的差異。
關(guān)鍵詞:毛果楊;WRKY蛋白;基因家族;生物信息
中圖分類(lèi)號(hào) Q943.2文獻(xiàn)標(biāo)識(shí)碼 A文章編號(hào) 1007-7731(2021)09-0016-04
Abstract: WRKY transcription factors, one of the largest transcriptional regulatory families in plants, are part of the signal networks that regulate many biological processes in plants, and have a variety of biological functions. In this study, the WRKY gene family members were identified in Arabidopsis thaliana on the published Arabidopsis genome, and the basic characteristics of the WRKY gene family were determined by using their sequences for domain analysis. On this basis, the members of the WRKY gene family were screened out from the sequence library of Populustrichocarpa. MEGA5 software, online tools such as ExPASyProtparma and Bioedit were used to analyze physical and chemical properties, motif structure comparison, evolutionary tree construction and gene expression analysis. The results showed that the coding sequence length of 20 members of the WRKY gene family was 189~624bp, and multiple chromosomes were located and repeated on chromosomes 1, 5 and 14. All WRKY proteins were extracellular, with poor hydrophilicity and high lipid solubility and instability. All the 20 WRKY genes were expressed in Populustrichocarpa, but there were significant differences.
Key words: Populustrichocarpa; WRKY proteins; Gene family; Biological information
轉(zhuǎn)錄調(diào)控是生物在生長(zhǎng)發(fā)育及代謝過(guò)程中調(diào)控細(xì)胞或組織中基因表達(dá)的重要機(jī)制[1]。轉(zhuǎn)錄因子(Transcription factors,TFs)是一類(lèi)錨定在目標(biāo)基因啟動(dòng)子區(qū)域特異序列上的蛋白質(zhì),能對(duì)下游目標(biāo)基因的轉(zhuǎn)錄進(jìn)行促進(jìn)或抑制作用,對(duì)生物體的正常生長(zhǎng)發(fā)育和應(yīng)對(duì)外界脅迫過(guò)程都具有重要的作用[1,2]。WRKY基因家族是近年來(lái)發(fā)現(xiàn)的一類(lèi)植物特有的轉(zhuǎn)錄調(diào)節(jié)因子,它是一種植物特有的調(diào)控因子,已從多種植物中分離,如甜土豆[3]、野燕麥[4]、皺葉歐芹[5]、擬南芥[6]、煙草[7]等。根據(jù)目前所有的研究資料來(lái)看,WRKY蛋白在植物的各項(xiàng)生理活動(dòng)過(guò)程中發(fā)揮著重要的調(diào)控作用,如胚胎形態(tài)的發(fā)生[8]、葉片的衰老等[9],同時(shí)在非生物脅迫包括寒冷、干旱、鹽堿等[10]和生物脅迫包括細(xì)菌、真菌、病毒等[11]逆境響應(yīng)及信號(hào)轉(zhuǎn)導(dǎo)過(guò)程中也起著重要的調(diào)控作用。
目前,對(duì)毛果楊(Populustrichocarpa)WRKY基因家族研究尚不深入。本研究通過(guò)各種途對(duì)選中的20個(gè)毛果楊WRKY基因進(jìn)行理化性質(zhì)分析、motif結(jié)構(gòu)比對(duì)、進(jìn)化樹(shù)構(gòu)建、基因表達(dá)分析等,為今后更深入的研究奠定基礎(chǔ)。
1 數(shù)據(jù)來(lái)源與分析方法
1.1 數(shù)據(jù)來(lái)源 以毛果楊、擬南芥為實(shí)驗(yàn)材料。毛果楊(Populustrichocarpa)、擬南芥(Arabidopsis thaliana)WRKY家族成員的基因序列信息均在美國(guó)生物技術(shù)信息中心即NCBI進(jìn)行的下載。
1.2 分析方法
1.2.1 毛果楊中WRKY基因的確認(rèn)與分類(lèi) 根據(jù)已公布的擬南芥基因組中當(dāng)前確定的WRKY基因家族成員,利用其序列進(jìn)行結(jié)構(gòu)域的分析,從而確定WRKY基因家族的基本特征,以此為基礎(chǔ),從毛果楊序列庫(kù)中篩選出WRKY基因家族的成員。
1.2.2 序列比對(duì)和進(jìn)化樹(shù)分析 利用MEGA5軟件,對(duì)毛果楊的20個(gè)WRKY基因進(jìn)行氨基酸序列比對(duì),分析它們的同源性。毛果楊的20個(gè)WRKY基因和擬南芥(Arabidopsis thaliana)WRKY家族的5個(gè)成員進(jìn)行系統(tǒng)進(jìn)化樹(shù)構(gòu)建,將bootstrap值設(shè)置為1200次,根據(jù)不同的需求選擇不同的進(jìn)化樹(shù)格式。
1.2.3 WRKY蛋白的理化性質(zhì)分析 毛果楊WRKY蛋白相關(guān)基因的DNA長(zhǎng)度、基因序列長(zhǎng)度、CDS序列以及外顯子數(shù)量均從Phytozome的毛果楊數(shù)據(jù)庫(kù)中獲得。毛果楊WRKY蛋白的氨基酸數(shù)量、分子量、脂溶性、親水性和穩(wěn)定性均通過(guò)在線(xiàn)工具ExpasyProtparma進(jìn)行研究分析。對(duì)WRKY蛋白的亞細(xì)胞定位使用Plant-mPLoc進(jìn)行在線(xiàn)預(yù)測(cè)。
1.2.4 基因組織表達(dá)分析 在Affy網(wǎng)站(http://www.affymetrix.com /estore/index.jsp)檢索毛果楊WRKY基因家族成員的探針集,然后通過(guò)BAR數(shù)據(jù)庫(kù)(http://bar.utoronto.ca /welcome.htm)分析并在線(xiàn)繪制熱圖,研究其在不同組織中的表達(dá)模式以及相對(duì)表達(dá)量。
2 結(jié)果與分析
2.1 毛果楊WRKY基因家族的結(jié)構(gòu) 通過(guò)分析,到最后選用20個(gè)毛果楊WRKY基因家族成員(見(jiàn)表1)。WRKY基因的序列長(zhǎng)度差異較大。其中POPTR_0014s08640g只有570bp,而POPTR_0014s15320g有1875bp。除POPTR_0014s08640g和POPTR_0006s13550g基因外,外顯均為3-7個(gè)。從上面的數(shù)據(jù)分析可以看出,不同的基因有著不同的結(jié)構(gòu)形式,造成了它們可以用不同的方式發(fā)揮不同的作用。
2.2 毛果楊WRKY基因序列的同源性 利用MEGA5軟件,對(duì)20個(gè)毛果楊WRKY蛋白家族的氨基酸序列進(jìn)行在線(xiàn)分析(見(jiàn)圖1)。標(biāo)注標(biāo)星號(hào)序列的同源性較高(515D-592H),表現(xiàn)出高的保守性。
2.3 毛果楊WRKY基因的理化性質(zhì) 對(duì)毛果楊WRKY蛋白的理化性質(zhì)以及亞細(xì)胞定位進(jìn)行了預(yù)測(cè)分析(見(jiàn)表2)。由表2可知,所有WRKY家族成員的氨基酸序列均較長(zhǎng),含189~624個(gè)氨基酸。WRKY蛋白的等電點(diǎn)(PI)為5.56~9.86,說(shuō)明WRKY蛋白帶正電荷。WRKY蛋白的親水性為-0.1015~-0.486,表現(xiàn)為親水性低。所有WRKY家族成員的穩(wěn)定性指數(shù)均大于40,表現(xiàn)為不穩(wěn)定。WRKY蛋白的脂溶指數(shù)(Aliphatic index)較高,為47.51~74.23。預(yù)測(cè)大部分WRKY蛋白定位于細(xì)胞外,這與其行使功能的位置保持一致。
2.4 進(jìn)化樹(shù)的構(gòu)建及分析 對(duì)擬南芥5個(gè)基因和毛果楊20個(gè)基因構(gòu)建了系統(tǒng)進(jìn)化樹(shù)。如圖2所示,這部分基因組成的進(jìn)化樹(shù)可分為以下4類(lèi):A類(lèi)支持率較高,由擬南芥4個(gè)基因和毛果楊17個(gè)基因組成;剩下3類(lèi)支持率較低,即B類(lèi)由毛果楊1個(gè)基因組成、C類(lèi)由擬南芥1個(gè)基因組成、D類(lèi)由毛果楊2個(gè)基因組成。由此可見(jiàn),WRKY基因家族的親緣關(guān)系遠(yuǎn)近表現(xiàn)出相當(dāng)高的保守性,且在進(jìn)化中扮演著相當(dāng)重要的角色。A類(lèi)中POPTR_0002s18770g和POPTR_0014s15320具有較高的重復(fù)性,且親緣關(guān)系緊密地聯(lián)系在一起。
2.5 毛果楊WRKY基因的表達(dá)模式 為了進(jìn)一步地深入剖析WRKY基因家族在毛果楊植物體中轉(zhuǎn)錄水平的高低,在其根、幼葉、成葉、雌蕊、雄蕊、木質(zhì)部6個(gè)不同組織以及光生苗中進(jìn)行了分析并繪制成圖(圖3)。從圖3可以看出,20個(gè)WRKY基因在成葉中的表達(dá)量最低,在其他5個(gè)組織及光生苗中均有較高的表達(dá)水平。其中,POPTR_0001s00350g在營(yíng)養(yǎng)器官中的表達(dá)量均呈現(xiàn)較低水平。幾乎所有的家族成員都存在著差異表達(dá),而且大多數(shù)基因在根部和雌、雄蕊處有較高的表達(dá)量。值得關(guān)注的是,POPTR_0005s08860g、POPTR_0001s37260g在木質(zhì)部中的表達(dá)較高,而在其他組織中表達(dá)量低,這意味POPTR_0005s08860g、POPTR_0001s37260g可能以某種方式參與毛果楊木質(zhì)部形成的分子調(diào)控過(guò)程中。而POPTR_0012s01380g主要在雌、雄蕊中表達(dá),其可能參與雌、雄蕊的發(fā)育過(guò)程。
3 討論與結(jié)論
3.1 討論 基因是控制生物性狀的基本遺傳單位[12]?;蚴莻€(gè)體生命活動(dòng)以及發(fā)揮功能作用的基礎(chǔ),在它里面儲(chǔ)存著大量的關(guān)于個(gè)體生長(zhǎng)發(fā)育的一系列過(guò)程的信息數(shù)據(jù)。WRKY基因存在于毛果楊染色體的不同位點(diǎn)上,具有不同的基因形式。WRKY轉(zhuǎn)錄因子具有非常顯著的結(jié)構(gòu)特點(diǎn),其蛋白結(jié)構(gòu)基本含有1~2個(gè)WRKY結(jié)構(gòu)域,為DNA結(jié)合域(DBD),約由60個(gè)高度保守的氨基酸殘基組成,包括位于N端的七肽和位于C端的鋅指結(jié)構(gòu)。位于N末端的七肽WRKYGQK絕對(duì)保守,是核心序列,位于C端的序列由C2H2(C-X4-5-C-X22-23-H-X-H)或C2HC(C-X7-C-X23-H-X-C)型鋅指結(jié)構(gòu)組成[13-15]。WRKY蛋白普遍存在于高等植物中,在擬南芥的74個(gè)成員中,絕大多數(shù)的生物學(xué)功能還未弄清楚[16]。WRKY轉(zhuǎn)錄因子可通過(guò)WRKY結(jié)構(gòu)域與靶基因啟動(dòng)子區(qū)的順式作用元件TTGAC(C/T)核苷酸序列(W-box)特異性結(jié)合,以此激活或抑制轉(zhuǎn)錄,進(jìn)而調(diào)控下游基因的表達(dá)。有報(bào)道擬南芥WRKY4結(jié)構(gòu)域由1個(gè)四鏈β片層組成,在β片層的C端由保守的半胱氨酸/組氨酸(Cys/His)殘基形成1個(gè)鋅結(jié)合袋,WRKYGQK殘基對(duì)應(yīng)于序列的N端鏈,在序列的中間被Gly殘基扭折,使得涉及Trp(色氨酸)殘基的廣泛疏水作用,進(jìn)而促使β鏈的結(jié)構(gòu)具有穩(wěn)定性。β鏈的WRKYGQK基序可以接觸1個(gè)大約6bp區(qū)域,這在很大程度上與W-box(TTGACY)的長(zhǎng)度是一致的。表明WRKYGQK的基序可以與靶基因啟動(dòng)子區(qū)的W-box結(jié)構(gòu)特異性結(jié)合。除WRKY結(jié)構(gòu)域之外,WRKY轉(zhuǎn)錄因子還包含其他結(jié)構(gòu)域,包括TIR-NBS-LRR(Toll/interleukin-1receptor-nucleotidebindingsite-leucine-richrepeat)、激酶結(jié)構(gòu)域、脯氨酸富集區(qū)、谷氨酰胺富集區(qū)、絲氨酸-蘇氨酸富集區(qū)、亮氨酸拉鏈、核定位結(jié)構(gòu)域等。擬南芥AtWRKY7同時(shí)含有1個(gè)WRKY結(jié)構(gòu)域和1個(gè)鈣調(diào)蛋白CaM結(jié)合結(jié)構(gòu)域。WRKY轉(zhuǎn)錄因子多樣的結(jié)構(gòu)域表明,擁有特殊結(jié)構(gòu)的WRKY轉(zhuǎn)錄因子可以在基因表達(dá)調(diào)控中發(fā)揮重要的特殊功能作用。
3.2 結(jié)論 本研究獲得了WRKY基因家族的結(jié)構(gòu)特征,20個(gè)基因家族成員主要分布在12條染色體上。毛果楊WRKY基因家族20個(gè)成員編碼序列長(zhǎng)為189~624bp,有多個(gè)染色體定位重復(fù)分布于第1、5、14號(hào)染色體上。WRKY蛋白均定位于細(xì)胞外,親水性較差,具有較高的脂溶性和不穩(wěn)定性。20個(gè)WRKY基因均在毛果楊中表達(dá),但有明顯差異。從基因家族成員結(jié)構(gòu)來(lái)看,毛果楊20個(gè)WRKY基因中大多數(shù)含有3個(gè)及以上的內(nèi)含子,說(shuō)明不同的基因有著不同的結(jié)構(gòu)形式,從而它們可以用不同的方式發(fā)揮不同的作用。從毛果楊WRKY基因家族的熱圖來(lái)看:毛果楊WRKY基因在成葉中的轉(zhuǎn)錄水平最低,而在根、幼葉、雌蕊、雄蕊、木質(zhì)部其他5個(gè)組織及光生苗中均具有較高的轉(zhuǎn)錄水平。從理化性質(zhì)分析結(jié)果來(lái)看:毛果楊WRKY基因多數(shù)定位在細(xì)胞外,其不穩(wěn)定指數(shù)較高,脂溶性指數(shù)較低,親水性較低。
本研究利用多種計(jì)算機(jī)軟件工具,對(duì)毛果楊WRKY基因家族進(jìn)行了生物信息學(xué)的分析,對(duì)其家族成員進(jìn)行了鑒定,為今后研究該類(lèi)基因的功能提供了信息依據(jù)。另外,本研究對(duì)毛果楊WRKY基因家族的研究還只停留在對(duì)其基因序列等的簡(jiǎn)要分析,而要想真正了解它的相關(guān)作用,還需要在未來(lái)對(duì)各個(gè)領(lǐng)域進(jìn)行更深入的研究。
參考文獻(xiàn)
[1]Zhang YJ,WangLJ.The WRKY transcription factor superfamily:its origin in eukaryotes and expansion in plants[J]. BMC Evol Biol.,2005,5(1):1.
[2]Martinez E. Multi-protein complexes in eukaryotic genetranscription[J]. PlantMolBiol,2002,50(6):925-947.
[3]lshiguro S,Nakamura K. Characterization of a cDNA encoding a novel DNA-binding protein,SPF1,that recognizes SP8 sequences in the 5′ upstream regions of genes coding for sporamin and beta-amylase from sweet potato[J]. Mol Gen Genet.,1994,244:563-571.
[4]Rushton PJ,MacDonald H,Huttly AK,et al. Members of a new family of DNA-binding proteins bind to a conserved cis-element in the promoters of alpha-Amy2 genes[J].Plant MolBiol.1995,29:691-702.
[5]ushton PJ,Torres JT,Parniske M,et al. Interaction of elicitorinduced DNA-binding proteins with elicitor response elements in the promoters of parsley PR1 genes[J]. EMBO J,1996,15:5690-5700.
[6]de Pater S,Greco V,Pham K,et al. Characterization of a zincdependent transcriptional activator from Arabidopsis[J]. Nucleic Acids Res.,1996,24:4624-4631.
[7]Chen CH,ChenZX.Isolation and characterization of two pathogen-and salicylic acid-induced genes encoding WRKT DNA-binding proteins from tobacco[J].Plant Mol Biol.,2000,42(2):387-396.
[8]Lagace,M,Matton,et al. Characterization of a WRKY transcription factor expressed in late torpedo-stage embryos of Solanumchacoense[J]. PLANTA,2004,219(1):185-189.
[9]RobatzekS,Somssich IE. Targets of ArWRKY6 regulation during plant senescence and pathogen defense[J]. Genes Dev.,2002,16(9):1139-1149.
[10]Fu QT,Yu DQ. Expression profiles of AtWRKY25.AtW(_RKY26and AtWRKY33under abioticstresses[J].Hereditas(Beijing),2010,32(8):848-856.
[11]EulgemT,RushtonPJ,RobatzekS,et al The WRKY superfamily of plant transcription factors[J]. Trends Plant Sci.,2000,5(5):199-206.
[12]龐文玉,王安,楊寶誼,等.大白菜ENT基因家族的鑒定與生物信息學(xué)分析[J].江蘇農(nóng)業(yè)科學(xué),2019,47(12):52-57.
[13]EulgemT,RushtonPJ,RobatzekS,et al.The WRKY superfamily of plant transcription factors[J]. Trends in Plant Science,2000,5(5):199-206.
[14]Rushton PJ,SomssichIE,RinglerP,et al.WRKY transcription factor[J]. Trends in Plant Science,2010,15(5):247-258.
[15]MaeoK,HayashiS,KojimaSH,et al.Role of conserved residues of the WRKY domain in the DNA-binding of tobacco WRKY family proteins[J]. Bioscience Biotechnology,2001,65(11):2428-2436.
[16]Dong J,Chen C,Chen Z. Expression profiles of the Arabidopsis wrky gene superfamily during plant defense response[J].Plant MolBiol.,2003,51:21-37.
(責(zé)編:張宏民)