• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      蘋(píng)果Hsf家族成員的序列特征、表達(dá)與進(jìn)化分析

      2017-06-28 12:36:31張國(guó)俊王婷婷胡利宗李書(shū)粉高武軍
      華北農(nóng)學(xué)報(bào) 2017年2期
      關(guān)鍵詞:基序內(nèi)含子結(jié)構(gòu)域

      張國(guó)俊,王婷婷,胡利宗,李書(shū)粉,高武軍

      (1.新鄉(xiāng)醫(yī)學(xué)院 基礎(chǔ)醫(yī)學(xué)院,河南 新鄉(xiāng) 453003;2.河南師范大學(xué) 生命科學(xué)學(xué)院,河南 新鄉(xiāng) 453007;3.漯河職業(yè)技術(shù)學(xué)院 食品工程系,河南 漯河 462000)

      蘋(píng)果Hsf家族成員的序列特征、表達(dá)與進(jìn)化分析

      張國(guó)俊1,2,王婷婷3,胡利宗2,李書(shū)粉2,高武軍2

      (1.新鄉(xiāng)醫(yī)學(xué)院 基礎(chǔ)醫(yī)學(xué)院,河南 新鄉(xiāng) 453003;2.河南師范大學(xué) 生命科學(xué)學(xué)院,河南 新鄉(xiāng) 453007;3.漯河職業(yè)技術(shù)學(xué)院 食品工程系,河南 漯河 462000)

      為全面了解蘋(píng)果基因組中熱激轉(zhuǎn)錄因子(Hsf)的序列特征及進(jìn)化,采用生物信息學(xué)手段,在蘋(píng)果全基因組水平上鑒定出50個(gè)MdHsf基因,并對(duì)其系統(tǒng)發(fā)育關(guān)系、序列特征、表達(dá)情況以及選擇壓力進(jìn)行詳細(xì)分析。系統(tǒng)發(fā)育與序列分析顯示:與擬南芥和水稻相似,50個(gè)MdHsf基因可分為A、B、C 3個(gè)亞族;2個(gè)或多個(gè)MdHsf基因位于同一個(gè)末端進(jìn)化支,說(shuō)明該基因家族在蘋(píng)果中發(fā)生了物種特異性擴(kuò)增;盡管MdHsf基因的內(nèi)含子數(shù)目和長(zhǎng)度變異較大,但其蛋白的保守基序和功能結(jié)構(gòu)域具有較高的保守性,這可能與功能約束有關(guān)。基于EST數(shù)目,可推知:除了MdHsfA2a和MdHsfA3a/b/c等14個(gè)基因沒(méi)有相應(yīng)的EST外,其余72%的基因都有轉(zhuǎn)錄活性。選擇壓力檢測(cè)和結(jié)構(gòu)建模分析顯示:在36個(gè)MdHsf蛋白的選擇壓力檢測(cè)中,位點(diǎn)模型未鑒定到正選擇位點(diǎn)的存在;而在顯著水平下(P<0.05),分支-位點(diǎn)模型在d和e進(jìn)化分支上,共檢測(cè)到5個(gè)正選擇位點(diǎn),它們是28R、30L、35D、51M、67V,其中28R和30L位于Hsf結(jié)構(gòu)域中,35D、51M和67V位于Hsf結(jié)構(gòu)域之外,這說(shuō)明除了MdHsfA4d/e和MdHsfC1a/b發(fā)生快速進(jìn)化外,其他成員受控于純凈選擇,具有高度保守性。綜合以上研究結(jié)果,蘋(píng)果基因組中存在多種熱激轉(zhuǎn)錄因子,其蛋白的保守基序和功能結(jié)構(gòu)域具有較高保守性,大多具有轉(zhuǎn)錄活性,在進(jìn)化上該家族受純凈選擇主導(dǎo)。

      蘋(píng)果;熱激轉(zhuǎn)錄因子;表達(dá);進(jìn)化

      熱激轉(zhuǎn)錄因子(Heat shock transcription factor,Hsf)是一種反式作用因子,能與熱激元件相互作用,通過(guò)調(diào)控Hsp基因(Heat shock protein,Hsp)的表達(dá),參與生物體的熱應(yīng)激反應(yīng)[1]。由于熱激蛋白基因的表達(dá)受到熱激轉(zhuǎn)錄因子的調(diào)控,因此,Hsf在植物抗擊熱脅迫反應(yīng)中扮演著十分重要的角色[2]?;谧阚E法和親和層析法,Wiederrecht等[3]于1988年首次在酵母(Saccharomycescerevisiae)中克隆得到第一個(gè)Hsf基因,隨后,有關(guān)Hsf基因的克隆與研究工作主要集中于少數(shù)模式動(dòng)物,例如果蠅(Drosophilamelanogaster)[4]、小鼠(Musmusculus)[5]和人類(Homosapiens)[6]等。幾乎同時(shí),Scharf等[7]以酵母Hsf的保守結(jié)構(gòu)域?yàn)闄z索序列,在番茄(Solanumlycopersicum)中克隆到了3個(gè)Hsf基因。此后,研究人員陸續(xù)在擬南芥(Arabidopsisthaliana)[8]和水稻(Oryzasativa)[9]等物種中,克隆并鑒定了多個(gè)Hsf基因。動(dòng)物、植物和微生物Hsf基因數(shù)目的比較分析表明,植物Hsf基因不但成員數(shù)目多,而且具有功能的冗余性和多樣性等特點(diǎn)。與動(dòng)物相比,由于固著生長(zhǎng)的植物面對(duì)更為復(fù)雜的逆境脅迫,相應(yīng)地需要更多功能多樣化的防御體系來(lái)維持生理穩(wěn)態(tài),可推測(cè)植物很可能具有更多的熱激轉(zhuǎn)錄因子成員參與熱激反應(yīng)。因此,在基因組水平上,鑒定所有Hsf基因成員仍然是一項(xiàng)重要而艱巨的任務(wù)。

      近年來(lái),隨著測(cè)序技術(shù)的快速發(fā)展,越來(lái)越多的模式植物全基因組測(cè)序工作已經(jīng)完成,這為鑒定與分析Hsf基因家族提供了便捷。在全基因組水平上,許多植物Hsf基因家族包括多個(gè)成員,每個(gè)成員都含有保守的DNA結(jié)合結(jié)構(gòu)域,例如擬南芥、水稻、玉米(Zeamays)、高粱(Sorghumbicolor)、大豆、楊樹(shù)(Populustrichocarpa)、番茄、大白菜(Brassicarapassp.pekinensis)、胡蘿卜(Daucuscarota)和茶樹(shù)(Camelliasinensis)中分別至少有21,25,25,24,52,27,24,35,35,16個(gè)Hsf基因[10-16]。根據(jù)蛋白序列、結(jié)構(gòu)和進(jìn)化上的關(guān)系,植物中Hsf蛋白家族存在A、B、C共3類成員。其中,A類Hsf主要負(fù)責(zé)熱激基因表達(dá)的調(diào)控;B類Hsf雖然具有DNA結(jié)合活性但卻沒(méi)有熱激誘導(dǎo)的轉(zhuǎn)錄激活活性,可能與A類Hsf共同發(fā)揮作用,C類Hsf的作用尚不清楚[17-18]。

      目前,對(duì)Hsf基因的研究主要集中在模式植物上,而對(duì)果樹(shù)的相關(guān)研究報(bào)道還比較少。蘋(píng)果(Malusdomestica)全基因組測(cè)序的完成為系統(tǒng)剖析MdHsf基因家族提供了便捷[19]。2012年,Giorno等[20]在蘋(píng)果基因組中鑒定了25個(gè)Hsfs,并進(jìn)行了分類和表達(dá)分析。分析發(fā)現(xiàn),在蘋(píng)果基因組中存在著更多的Hsfs。為此,本研究圍繞基因結(jié)構(gòu)、保守基序、功能結(jié)構(gòu)域、蛋白三維結(jié)構(gòu)、表達(dá)與快速進(jìn)化等問(wèn)題,對(duì)蘋(píng)果MdHsf家族基因的50個(gè)成員進(jìn)行了全面而系統(tǒng)的分析,以期為克隆和鑒定蘋(píng)果MdHsf的生物學(xué)功能奠定基礎(chǔ),為植物Hsf基因的系統(tǒng)發(fā)育關(guān)系與快速進(jìn)化機(jī)制提供線索。

      1 材料和方法

      1.1 蘋(píng)果Hsf基因的鑒定和進(jìn)化樹(shù)構(gòu)建

      根據(jù)已有報(bào)道,擬南芥和水稻Hsf基因家族成員的相關(guān)信息直接查文獻(xiàn)獲得[10-11],其相關(guān)序列主要來(lái)源于3個(gè)數(shù)據(jù)庫(kù):Phytozome v8.0(http://www.phytozome.net/)、JGI(http://genome.jgi.doe.gov/programs/plants/index.jsf)和NCBI(http://www.ncbi.nlm.nih.gov/)。為獲取蘋(píng)果Hsf基因,本研究分別以擬南芥Hsf基因、水稻Hsf基因和植物Hsf結(jié)構(gòu)域(PF00447)的一致性序列為檢索序列,對(duì)蘋(píng)果基因組數(shù)據(jù)庫(kù)進(jìn)行了Blast搜索(E=0.01)。移走冗余序列,利用Pfam工具(http://pfam.sanger.ac.uk/)對(duì)所得Hsf蛋白序列進(jìn)行分析,若存在Hsf結(jié)構(gòu)域(PF00447),則認(rèn)為該蛋白質(zhì)屬于Hsf家族成員。如果同一個(gè)基因座有多個(gè)轉(zhuǎn)錄本,選擇最長(zhǎng)的轉(zhuǎn)錄本作為代表,每個(gè)基因座只算作1個(gè)基因成員。為闡明蘋(píng)果Hsf基因的進(jìn)化關(guān)系,構(gòu)建了擬南芥、水稻和蘋(píng)果Hsf蛋白的進(jìn)化樹(shù)。具體步驟如下:在默認(rèn)參數(shù)下,利用MUSCLE軟件對(duì)Hsf蛋白序列進(jìn)行多重比對(duì)分析[21];基于比對(duì)結(jié)果,采用極大似然法(Maximum likelihood method)構(gòu)建系統(tǒng)發(fā)育樹(shù),進(jìn)化樹(shù)的構(gòu)建和輸出均由MEGA軟件完成[22]。

      1.2 蘋(píng)果Hsf基因的序列特征分析

      通過(guò)Hsf基因的DNA和cDNA序列的比較,可確定Hsf基因的結(jié)構(gòu),其結(jié)構(gòu)模式圖由GSDS軟件(http://gsds.cbi.pku.edu.cn/)繪制。利用MEME工具(http://meme.sdsc.edu/)對(duì)蘋(píng)果Hsf蛋白的保守基序進(jìn)行分析。參數(shù)設(shè)置如下:同一基序在一條序列中出現(xiàn)的次數(shù)為0或者1,基序長(zhǎng)度為6~200個(gè)氨基酸殘基,基序最大發(fā)現(xiàn)數(shù)目10個(gè),其他參數(shù)為默認(rèn)值。此外,利用Pfam工具(http://pfam.sanger.ac.uk/)對(duì)所有Hsf蛋白的功能結(jié)構(gòu)域進(jìn)行鑒定,并對(duì)結(jié)構(gòu)域的排列方式進(jìn)行分析。

      1.3 蘋(píng)果Hsf基因的表達(dá)分析

      不同組織來(lái)源EST數(shù)目的統(tǒng)計(jì)分析不僅能推測(cè)基因的轉(zhuǎn)錄活性,而且能反映基因的表達(dá)水平。以蘋(píng)果Hsf基因的編碼序列為檢索序列,利用Blast工具在GenBank中dbEST數(shù)據(jù)庫(kù)搜索相應(yīng)的EST序列,參數(shù)設(shè)置為默認(rèn)值。基于最佳匹配的EST序列,鏈接到UniGene,利用該UniGene的EST組織表達(dá)譜推測(cè)Hsf基因的表達(dá)情況。

      1.4 蘋(píng)果Hsf基因選擇壓力的檢測(cè)

      由于50個(gè)蘋(píng)果Hsf基因間的差異度較大,不便于進(jìn)行選擇壓力研究,因此,有必要對(duì)這些基因進(jìn)行分組。首先,利用ClustalX軟件對(duì)Hsf基因進(jìn)行多重序列比對(duì)[23]。然后,根據(jù)3個(gè)標(biāo)準(zhǔn)進(jìn)行分組:①氨基酸水平上組內(nèi)的平均相似度大于30%;②組內(nèi)每個(gè)成員氨基酸序列長(zhǎng)度大于總長(zhǎng)度的50%;③每個(gè)組內(nèi)的成員數(shù)目大于3個(gè)基因。上述標(biāo)準(zhǔn)用在線工具BLASTclust(http://toolkit.tuebingen.mpg.de/blastclust)計(jì)算檢測(cè),其中36個(gè)蘋(píng)果Hsf基因符合上述標(biāo)準(zhǔn)。最后,利用Gblock軟件[24]移走這些基因多序列比對(duì)中的高度分歧區(qū),對(duì)剩余的同源區(qū)進(jìn)行進(jìn)一步的選擇壓力分析。36個(gè)蘋(píng)果Hsf基因同源區(qū)的密碼子比對(duì)文件由Pal2nal工具[25]生成,其樹(shù)文件由TreeView軟件[26]產(chǎn)生。利用PAML3.15(http://abacus.gene.ucl.ac.uk/software/paml.html)軟件包中的CODEML程序?qū)μO(píng)果Hsf基因的選擇壓力進(jìn)行分析,其中,位點(diǎn)特異模型用于每個(gè)組內(nèi)的選擇壓力檢測(cè),而位點(diǎn)分支模型用于每個(gè)分支的選擇壓力檢測(cè)[27]。為將MdHsfA4d、MdHsfA4e、MdHsfC1a和MdHsfC1b蛋白的正選擇位點(diǎn)定位在三維結(jié)構(gòu)中,本研究基于同源建模方法,利用SWISS-MODEL服務(wù)器對(duì)4個(gè)蘋(píng)果Hsf蛋白的三維結(jié)構(gòu)進(jìn)行預(yù)測(cè)[28],其中MdHsfA4d、MdHsfC1a和MdHsfC1b以人類Hsf1蛋白(2lduA)為模板,而MdHsfA4e以乳酸克魯維酵母Hsf蛋白(3hsfA)為模板。同時(shí),經(jīng)Loop區(qū)優(yōu)化、能量最小化和動(dòng)力學(xué)模擬等步驟,最后得到最佳三維構(gòu)象。

      2 結(jié)果與分析

      2.1 蘋(píng)果Hsf基因的鑒定及其系統(tǒng)發(fā)育分析

      分別以AtHsf、OsHsf和植物Hsf結(jié)構(gòu)域(PF00447)的一致性序列為檢索序列,利用Blast同源搜索方法在蘋(píng)果基因組數(shù)據(jù)庫(kù)中挖掘Hsf候選基因,移走冗余序列后,利用Pfam對(duì)所有蛋白進(jìn)行特征結(jié)構(gòu)域掃描。最終,在蘋(píng)果基因組中共鑒定了50個(gè)Hsf基因,其中包括前人鑒定得到的23個(gè)Hsf基因。表1列舉了這些基因的名稱、類型、登錄號(hào)、疊連群與染色體位置。

      為闡明不同植物Hsf基因的進(jìn)化關(guān)系,對(duì)50個(gè)MdHsf以及具有代表性的21個(gè)AtHsf和25個(gè)OsHsf的蛋白序列進(jìn)行親緣關(guān)系分析,獲得環(huán)狀進(jìn)化樹(shù)(圖1)。其中,蘋(píng)果和擬南芥隸屬于雙子葉植物,而水稻屬于單子葉植物。結(jié)果表明:3種代表性植物的96個(gè)Hsf蛋白可分為3個(gè)亞家族,即A、B、C亞家族。根據(jù)MdHsf與AtHsf蛋白的系統(tǒng)發(fā)育關(guān)系,并參考擬南芥該家族的名稱,對(duì)每個(gè)MdHsf基因進(jìn)行了編號(hào)和命名(表1、圖1)。從亞家族的成員數(shù)目看,蘋(píng)果的亞家族A包括37個(gè)基因,亞家族B包括11個(gè)基因,亞家族C僅包括2個(gè)基因。其中,23個(gè)基因?yàn)镚iorno等[21]已經(jīng)鑒定過(guò)的(表1)。通過(guò)對(duì)比該分類結(jié)果和Giorno等的分類結(jié)果,對(duì)這23個(gè)基因的分類是完全一致的。從親緣關(guān)系角度看,絕大多數(shù)蘋(píng)果Hsf蛋白優(yōu)先與擬南芥同源基因聚在一起,然后再與水稻相應(yīng)同源基因聚為一簇,這與物種進(jìn)化關(guān)系具有較高一致性(圖1)。

      2.2 蘋(píng)果Hsf基因的序列與進(jìn)化特征

      本研究基于蘋(píng)果Hsf蛋白全長(zhǎng)序列構(gòu)建了該家族的進(jìn)化樹(shù)(圖2-A),并對(duì)蘋(píng)果50個(gè)MdHsf基因的結(jié)構(gòu)進(jìn)行分析(圖2-B)。結(jié)果顯示,除了MdHSFA9g基因沒(méi)有內(nèi)含子外,其余的MdHsf基因都至少有1個(gè)內(nèi)含子。若以內(nèi)含子數(shù)目為準(zhǔn),具有內(nèi)含子的49個(gè)蘋(píng)果MdHsf基因的結(jié)構(gòu)可分為6種類型,它們分別有1,2,3,4,6,10個(gè)內(nèi)含子。不同類型的基因結(jié)構(gòu)具有不同的頻率:1個(gè)內(nèi)含子類型基因數(shù)目最多,包括MdHsfA6c等19個(gè)基因;2個(gè)內(nèi)含子類型基因數(shù)目次之,包括MdHsfA3c等13個(gè)基因;3個(gè)內(nèi)含子類型包括MdHsfA6e等10個(gè)基因;4個(gè)內(nèi)含子類型包括Mdhsfa6a等5個(gè)基因;而6個(gè)內(nèi)含子和10個(gè)內(nèi)含子類型數(shù)目最少,僅各包含MdHsfAqe和MdHsfAbe(圖2-B).

      注:Md.蘋(píng)果;Hsf.熱激轉(zhuǎn)錄因子;Chr.染色體。

      Note:Md.Apple;Hsf.Heat shock factor;Chr. Chromosome.

      其次,蛋白結(jié)構(gòu)域分析顯示,絕大多數(shù)蘋(píng)果Hsf僅僅包括Hsf結(jié)構(gòu)域。但MdHsfA6e、MdHsfA8a/b、MdHsfB1a、MdHsfA10b和MdHsfA10e不但含有典型Hsf結(jié)構(gòu)域,而且還包括額外的功能結(jié)構(gòu)域,例如MdHsfA6e包括1個(gè)ARD,MdHsfA8a/b各包括1個(gè)EF,MdHsfB1a包括RCC,MdHsfA10b包括4個(gè)串聯(lián)的HPR,MdHsfA10e包括2個(gè)串聯(lián)的WD結(jié)構(gòu)域(圖2-C)。利用MEME軟件對(duì)50個(gè)蘋(píng)果Hsf蛋白保守基序進(jìn)行預(yù)測(cè),結(jié)果顯示,在該蛋白家族中共檢測(cè)到10個(gè)保守基序,依次編號(hào)為1~10(圖2-D)。在蘋(píng)果Hsf蛋白的A亞家族中,除了MdHsfA9g、MdHsfA9b、MdHsfA10d和MdHsfA10c只包含一個(gè)保守基序外,其他的蛋白都至少具有2個(gè)保守基序,其中包括MdHsfA6d等在內(nèi)的23個(gè)蛋白都至少包含5個(gè)保守基序,這些保守序列的組成和排列順序具有較高的保守性。與A亞家族保守基序相比,蘋(píng)果Hsf蛋白的B亞家族蛋白最多僅包含5個(gè)保守基序,并且不包括保守基序3,5,6,7和8。C亞家族的保守基序模式與A亞家族十分相似,但該亞家族并不包括保守基序5,6,7和8,因此,可推測(cè)保守基序5,6,7和8是A亞家族所特有的。

      為了解親緣關(guān)系比較近的蘋(píng)果Hsf基因是否具有相同或相似的序列特征,基于蘋(píng)果Hsf蛋白全長(zhǎng)序列構(gòu)建了該家族的進(jìn)化樹(shù)(圖2-A)。一般而言,位于進(jìn)化樹(shù)末端的同源基因?qū)哂邢嗤蛳嗨频男蛄刑卣鳎鏜dHsfA2a/b、MdHsfA9c/d、MdHsfA4a/b、MdHsfB4a/b和MdHsfB2b/c等(圖2-B);但也有許多同源基因?qū)Φ男蛄刑卣靼l(fā)生了較大的分化,尤其是基因結(jié)構(gòu),其差異非常明顯,例如MdHsfA6a/b、MdHsfA6c/e、MdHsfA10a/b、MdHsfA10e/f和MdHsfC1a/b等(圖2-B)。與基因結(jié)構(gòu)相比,同源基因?qū)Φ谋J鼗蚝凸δ芙Y(jié)構(gòu)域的組成與排列順序幾乎完全相同(圖2-C、D),具有非常高的保守性,這意味著內(nèi)含子序列的變異是驅(qū)動(dòng)基因分化的主要?jiǎng)恿Α?/p>

      2.3 蘋(píng)果Hsf基因的表達(dá)譜分析

      在50個(gè)MdHsf家族成員中,MdHsfA2a、MdHsfA3a/b/c、MdHsfA6c/d/e、MdHsfA9a/b/e、MdHsfA10c/e/g和MdHsfC1a共有14個(gè)基因未找到與Hsf基因編碼序列顯著匹配的EST序列,因此,這些基因是否具有轉(zhuǎn)錄活性有待進(jìn)一步試驗(yàn)驗(yàn)證。其余的36個(gè)基因均具有轉(zhuǎn)錄活性,占基因總數(shù)的72%。由于MdHsfA5a/b、MdHsfB3a/b和MdHsfA10b相應(yīng)的UniGene中EST并沒(méi)有進(jìn)行正態(tài)化和統(tǒng)計(jì)處理,因此,不能推斷這些基因的表達(dá)水平。根據(jù)這些基因相應(yīng)的EST或cDNA的組織器官來(lái)源,可推知:MdHsfA5a/b在花和果實(shí)中均有轉(zhuǎn)錄活性,MdHsfB3a/b在花中有轉(zhuǎn)錄活性,MdHsfA10b在果實(shí)中有轉(zhuǎn)錄活性。由于有些蘋(píng)果Hsf基因之間相似程度高,多個(gè)基因同時(shí)對(duì)應(yīng)1個(gè)UniGene,因此,31個(gè)蘋(píng)果Hsf基因只能檢測(cè)到13個(gè)UniGene。這些UniGene的EST表達(dá)譜結(jié)果顯示:在蘋(píng)果根中,MdHsfB1a/b/c、MdHsfA4d/e和MdHsfC1a/c等基因均有表達(dá),其中MdHsfA4d/e基因表達(dá)量最高;在蘋(píng)果莖中,MdHsfA4a/b/c、MdHsfA8a/b/c、MdHsfA9c/d/g、MdHsfB1a/b/c和MdHsfB2b/c/d等基因均有表達(dá),其中B亞家族基因MdHsfB1a/b/c和MdHsfB2b/c/d表達(dá)量最高;在蘋(píng)果葉中,除了MdHsfA4a、MdHsfA9c/d、MdHsfB4a/b和MdHsfC1a/c等基因沒(méi)有轉(zhuǎn)錄活性外,其他基因均有表達(dá),其中MdHsfB1a/b/c表達(dá)量最高;在蘋(píng)果花中,所有基因均沒(méi)有轉(zhuǎn)錄活性;在蘋(píng)果果實(shí)中,MdHsfA4d/e、MdHsfA9c/d/g、MdHsfB1a/b/c、MdHsfB2b/c/d、MdHsfA10f和MdHsfC1a/c等基因均有表達(dá),其中MdHsfA4d/e表達(dá)水平最高;在蘋(píng)果芽中,MdHsfA8a/b/c、MdHsfB1a/b/c和MdHsfB4a/b等基因均未檢測(cè)到轉(zhuǎn)錄活性;在蘋(píng)果細(xì)胞培養(yǎng)組織中,只有MdHsfB1a/b/c等基因具有轉(zhuǎn)錄活性(圖 3)。

      圖2 基于蘋(píng)果Hsf蛋白序列的進(jìn)化樹(shù)及Hsf基因及其蛋白的序列特征

      2.4 基于位點(diǎn)模型的正選擇位點(diǎn)檢測(cè)

      M0和M3、M1a和M2a、M7和M8是3對(duì)位點(diǎn)特異模型,這些模型假設(shè)了ω值在不同分支之間是同質(zhì)的,在不同位點(diǎn)是異質(zhì)的。因此,它們常被用于檢測(cè)基因不同位點(diǎn)的選擇壓力。首先,準(zhǔn)備序列比對(duì)文件和無(wú)根樹(shù)(圖4),然后用PAML軟件包中的Codeml程序?qū)?6個(gè)蘋(píng)果Hsf基因進(jìn)行選擇壓力分析,進(jìn)一步利用LRT測(cè)試所鑒定的正選擇位點(diǎn)是否達(dá)到顯著水平。結(jié)果顯示:與相應(yīng)的假設(shè)模型M1a和M7相比,備擇模型M2a和M8均不具有優(yōu)勢(shì),這一結(jié)論受到LRT檢測(cè)的支持;盡管M3和M0之間的LRT檢測(cè)支持蘋(píng)果Hsf基因經(jīng)歷快速進(jìn)化,但是這個(gè)模型對(duì)不推薦作為參考標(biāo)準(zhǔn)(表2)。這一結(jié)果揭示蘋(píng)果Hsf基因在進(jìn)化過(guò)程中受到了負(fù)選擇,具有較高的保守性。

      圖3 MdHsf家族基因在蘋(píng)果不同器官中的表達(dá)分析

      2.5 基于分支-位點(diǎn)模型的正選擇位點(diǎn)檢測(cè)

      在顯著水平上,位點(diǎn)模型沒(méi)有檢測(cè)到正選擇位點(diǎn),這有可能是該模型并不適合于蘋(píng)果Hsf基因。由于分支-位點(diǎn)模型允許不同分支上不同位點(diǎn)具有不同的功能約束和進(jìn)化速率,這就意味著不同分支不同位點(diǎn)的ω值具有異質(zhì)性,因此,該模型可以評(píng)價(jià)不同分支上不同位點(diǎn)所受到的選擇壓力。

      將所有包括2個(gè)或2個(gè)以上基因的進(jìn)化支標(biāo)記為前景支,剩余的其他分支標(biāo)記為背景支,執(zhí)行檢測(cè)時(shí)用Model A的測(cè)驗(yàn)2[29-30]。結(jié)果顯示:以a、b、c、d、e、f、g進(jìn)化支為前景支時(shí),它們的ω值均大于1,除了c進(jìn)化支沒(méi)有檢測(cè)到正選擇位點(diǎn)以外,其余進(jìn)化支均能檢測(cè)到此類位點(diǎn);盡管a、b、f、g進(jìn)化支的ω值大于1,并且能夠檢測(cè)到正選擇位點(diǎn),但在顯著水平(P<0.05)上,LRT檢測(cè)并不支持這些正選擇位點(diǎn)的存在;d、e進(jìn)化支為前景支時(shí),它們不但ω值大于1,而且在顯著水平上,d、e進(jìn)化支中分別包括3,2個(gè)正選擇位點(diǎn)(圖 4、表 3)。

      2.6 蘋(píng)果熱激轉(zhuǎn)錄因子三維結(jié)構(gòu)的建模

      為闡明蘋(píng)果Hsf蛋白的立體結(jié)構(gòu)以及正選擇位點(diǎn)在三維空間中的位置,以位于進(jìn)化分支d和e中MdHsfA4e/d和MdHsfC1a/b蛋白作為研究對(duì)象,利用SWISS-MODEL工具對(duì)這4個(gè)蛋白結(jié)構(gòu)進(jìn)行同源模擬,經(jīng)Loop區(qū)優(yōu)化、能量最小化和動(dòng)力學(xué)模擬分別得到最佳三維構(gòu)象(圖5)。結(jié)果顯示:MdHsfA4d(圖5-A)、MdHsfC1a(圖5-C)和MdHsfC1b(圖5-D)共享同一模板2lduA,它們與模板匹配序列區(qū)段的相似性分別為44.25%,42.48%,43.24%,它們的結(jié)構(gòu)極其相似,主要結(jié)構(gòu)包括3個(gè)α-螺旋、4個(gè)β-折疊和7或8個(gè)β-轉(zhuǎn)角;MdHsfA4e(圖5-B)的模板是3hsfA,其序列匹配序列區(qū)段的相似性為45.59%,它的結(jié)構(gòu)明顯有別于另外3個(gè)蛋白結(jié)構(gòu),包括3個(gè)α-螺旋、2個(gè)β-折疊和5個(gè)β-轉(zhuǎn)角。由于模擬蛋白是部分序列的三維結(jié)構(gòu),而該序列C端包括正選擇位點(diǎn)28R和30L,但不包括正選擇位點(diǎn)35D、51M和67V,這說(shuō)明該蛋白片段的C端在d和e進(jìn)化支上均發(fā)生了快速進(jìn)化。

      粗線表示進(jìn)化支的ω值大于1;箭頭表示進(jìn)化支的ω值大于1且具有統(tǒng)計(jì)意義上的顯著性。

      The thick line represents the ω value of the evolution branch is greater than 1;The arrow indicates that the ω value of the evolution branch is greater than 1 and also is significant statistically.

      圖4 用于蘋(píng)果Hsf蛋白選擇壓力檢測(cè)的無(wú)根樹(shù)

      Fig.4 The unrooted tree used in detection for selection pressures on Hsf proteins in apple

      表2 基于位點(diǎn)模型的蘋(píng)果Hsf基因正選擇位點(diǎn)檢測(cè)

      表3 基于分支-位點(diǎn)模型的蘋(píng)果Hsf基因選擇壓力檢測(cè)

      3 結(jié)論與討論

      基于生物信息學(xué)手段,本研究以Hsf保守結(jié)構(gòu)域?yàn)闄z索序列,鑒定了蘋(píng)果基因組中具有50個(gè)Hsf基因家族的成員,這比Giorno等[20]鑒定的成員數(shù)目多了1倍,這可能是由于所采用的鑒定方法有所不同。從基因結(jié)構(gòu)、蛋白結(jié)構(gòu)和進(jìn)化分析上來(lái)看,筆者鑒定的基因都為Hsf基因家族的成員,所以,本研究是在蘋(píng)果全基因組水平上全面而系統(tǒng)的對(duì)Hsf基因家族的分析。根據(jù)系統(tǒng)分析結(jié)果,并參考在其他物種中Hsf基因的分類情況,將蘋(píng)果Hsf基因家族分為A、B和C 3個(gè)亞家族。該分類結(jié)果與Giorno等[20]的分類是一致的。目前在所研究的物種中,對(duì)于HSF的分類一般都采用A、B、C 3個(gè)亞家族的分類,其中B一般會(huì)形成單系,C在一些物種中會(huì)形成單系,在另外的物種是和A亞家族聚在一起的,而A亞家族包含的成員數(shù)量眾多,一般很少會(huì)形成單系[17,31-32]。系統(tǒng)進(jìn)化分析顯示,2個(gè)或多個(gè)蘋(píng)果Hsf蛋白總是先聚在一起,然后與一個(gè)擬南芥同源基因再聚在一起,最后與水稻相應(yīng)同源基因聚為一簇,這不僅說(shuō)明Hsf基因在蘋(píng)果基因組中發(fā)生了擴(kuò)增,也印證了這3個(gè)物種的演化過(guò)程。蘋(píng)果基因組測(cè)序分析揭示了該物種是由其祖先物種(與滅絕物種Gillenia相似)全基因加倍后,再經(jīng)過(guò)二倍和非整倍體化過(guò)程,然后形成的新物種[19],因此,蘋(píng)果Hsf基因的擴(kuò)增與全基因組加倍具有十分密切的關(guān)系。由于熱激轉(zhuǎn)錄因子特異識(shí)別熱激蛋白啟動(dòng)子區(qū)的保守順式元件(HSE:AGAAnnTTCT),因此,它至少包括能與HSE元件特異結(jié)合的功能結(jié)構(gòu)域。通常情況下,植物熱激轉(zhuǎn)錄因子主要包括:1個(gè)N端DNA結(jié)合區(qū)域(DNA binding domain,DBD)、1個(gè)雙向寡聚化區(qū)域(Heptads repeat of hydrophobic amino acid residues,HR-A/B)、1個(gè)細(xì)胞核定位信號(hào)(Nuclear localization signal,NLS)和細(xì)胞核輸出信號(hào)(Nuclear export signal,NES)[16];此外,少數(shù)植物Hsf蛋白還具有1個(gè)酸性C端的激活域(C terminal activator domain,CTAD)[16]。從基因結(jié)構(gòu)角度看,蘋(píng)果Hsf基因具有多樣化的結(jié)構(gòu),尤其是內(nèi)含子數(shù)目和長(zhǎng)度,存在著豐富的變異。從蛋白水平看,該蛋白家族成員之間具有較高的相似性,這是因?yàn)镠sf蛋白保守基序與功能結(jié)構(gòu)域之間相互重疊,例如DBD與Motif1/2,HR-A/B與Motif3/4等。Hsf蛋白為了正確行使功能,其序列的變異就會(huì)受限制,因而蛋白序列具有較高的保守性,但不同亞家族之間保守基序組成類型可能不同。

      圖5 四個(gè)蘋(píng)果熱激轉(zhuǎn)錄因子蛋白的結(jié)構(gòu)

      就蘋(píng)果Hsf基因家族成員的表達(dá)而言,雖然UniGene中的EST或cDNA序列能推斷基因的轉(zhuǎn)錄活性,甚至表達(dá)的相對(duì)量,但是基于同一個(gè)UniGene的EST表達(dá)譜推斷多個(gè)同源基因表達(dá)是不精確的。這是因?yàn)檫M(jìn)化過(guò)程中,作為非編碼區(qū)的啟動(dòng)子發(fā)生變異較快,而啟動(dòng)子序列又是基因表達(dá)調(diào)控的關(guān)鍵元件,因此,同源基因的表達(dá)或多或少會(huì)有差異,其精確表達(dá)有待試驗(yàn)進(jìn)一步驗(yàn)證。

      在選擇壓力檢測(cè)時(shí),通常用ω=dN/dS值來(lái)衡量選擇壓力。若ω>1且似然比檢驗(yàn)具有顯著性差異,則認(rèn)為編碼序列在對(duì)應(yīng)的分支或位點(diǎn)經(jīng)受正選擇。本研究采用位點(diǎn)模型與分支-位點(diǎn)模型,針對(duì)36個(gè)蘋(píng)果Hsf基因進(jìn)行選擇壓力分析。盡管位點(diǎn)模型沒(méi)有檢測(cè)到正選擇位點(diǎn)的存在,但分支-位點(diǎn)模型在d和e進(jìn)化支上共檢測(cè)到5個(gè)正選擇位點(diǎn),其中d進(jìn)化支上正選擇位點(diǎn)是30L、35D和51M,e進(jìn)化支上是28R和67V。為了確定這5個(gè)正選擇位點(diǎn)在Hsf蛋白三維結(jié)構(gòu)中的位置,本研究在模擬了MdHsfA4d、MdHsfA4e、MdHsfC1a和MdHsfC1b(圖5-D)蛋白結(jié)構(gòu)的基礎(chǔ)上,比較了正選擇位點(diǎn)與模擬結(jié)構(gòu)區(qū)序列。結(jié)果顯示,d進(jìn)化支上的30L和e進(jìn)化支上的28R均被定位于保守的Hsf結(jié)構(gòu)域中,這說(shuō)明Hsf結(jié)構(gòu)域不僅高度保守,而且在特定進(jìn)化支的某些位點(diǎn)也發(fā)生了快速進(jìn)化。D進(jìn)化支上的35D和51M以及e進(jìn)化支上的67V正選擇位點(diǎn)均遠(yuǎn)離活性DNA結(jié)合區(qū)域(DNA binding domain,DBD),并且它們分布在不同的位置,這充分說(shuō)明了正選擇很可能提高該蛋白家族特定進(jìn)化支的適應(yīng)性??傊?,純凈選擇主導(dǎo)了該家族的進(jìn)化,尤其對(duì)于Hsf結(jié)構(gòu)域而言,純凈選擇是該蛋白行使功能,維持酶活性的基礎(chǔ)。同時(shí)揭示快速進(jìn)化可以發(fā)生特定進(jìn)化支系的某些位點(diǎn)內(nèi),很可能為該酶結(jié)構(gòu)演化和適應(yīng)新環(huán)境提供原始動(dòng)力。本研究結(jié)果為后續(xù)的Hsf功能研究和利用基因工程方法改良蛋白活性提供參考信息。

      [1] ?kerfelt M, Morimoto R I, Sistonen L. Heat shock factors: integrators of cell stress, development and lifespan[J]. Nat Rev Mol Cell Bio, 2010, 11(8): 545-555.

      [2] Ohama N, Sato H, Shinozaki K, et al. Transcriptional regulatory network of plant heat stress response[J]. Trends Plant Sci, 2016, 22(1): 53-65.

      [3] Wiederrecht G,Seto D,Parker C S.Isolation of the gene encoding theS.cerevisiaeheatshock transcription factor [J]. Cell,1988,54(6):841-853.

      [4] Clos J,Westwood J T,Becker P B,et al.Molecular cloning and expression of a heaxameric drosophila heat stress factor subject to negative regulation [J].Cell,1990,63(5):1085-1097.

      [5] Fujimoto M, Hayashida N, Katoh, et al. A novel mouse HSF3 has a potential to activate nonclassical heat-shock genes during heat shock[J]. Mol Biol Cell, 2010, 21(1): 106-116.

      [6] Rabindran S K,Giorgi G,Clos J,et al.Molecular cloning and expression of a human heat shock factor,HSF1 [J].Proc Natl Acad Sci USA,1991,88(16):6906-6910.

      [7] Scharf K D,Rose S,Zott W,et al.Three tomato genes code for heat stress transcription factors with a region of remarkable homology to the DNA-binding domain of the yeast HSF [J].EMBO J,1990,9(13):4495-4501.

      [8] Hü bel A,Sch? ffl F.Arabidopsisheat shock factor:isolation and characterization of the gene and the recombinant protein [J].Plant Mol Biol,1994,26(1):353-362.

      [9] Yamanouchi U,Yano M,Lin H,et al.A rice spotted leaf gene,Spl7,encodes a heat stress transcription factor protein [J].Proc Natl Acad Sci USA,2002,99(11):7530-7535.

      [10] Guo J,Wu J,Ji Q,et al.Genome-wide analysis of heat shock transcription factor families in rice andArabidopsis[J].J Genetics Genomics,2008,35(2):105-118.

      [11] Chauhan H,Khurana N,Agarwal P,et al.Heat shock factors in rice(OryzasativaL.):genome-wide expression analysis during reproductive development and abiotic stress [J].Mol Genet Genomics,2011,286(2):171-187.

      [12] Lin Y X,Jiang H Y,Chu Z X,et al.Genome-wide identification,classification and analysis of heat shock transcription factor family in maize [J].BMC Genomics,2011,12(1):76.

      [13] Scharf K D,Berberich T,Ebersberger I,et al.The plant heat stress transcription factor(Hsf)family:structure,function and evolution [J].Biochimica et Biophysica Acta 2012,1819(2):104-119.

      [14] Song X,Liu G,Duan W,et al.Genome-wide identification,classification and expression analysis of the heat shock transcription factor family in Chinese cabbage [J].Mol Genet Genomics,2014,289(4):541-551.

      [15] Huang Y,Li M Y,Wang F,et al.Heat shock factors in carrot:genome-wide identification,classification,and expression profiles response to abiotic stress [J].Mol Biol Rep,2015,42(5):893-905.

      [16] Liu Z W, Wu Z J, Li X H, et al. Identification, classification, and expression profiles of heat shock transcription factors in tea plant (Camelliasinensis) under temperature stress[J]. Gene, 2016, 576(1): 52-59.

      [17] Guo M, Liu J H, Ma X, et al. The plant heat stress transcription factors (HSFs): structure, regulation, and function in response to abiotic stresses[J]. Front Plant Sci, 2016, 7(273): 114.

      [18] Raxwal V. Structural and functional diversity of plant heat shock factors[J]. Plant Stress, 2012, 6: 89-96.

      [19] Velasco R,Zharkikh A,Affourtit J,et al.The genome of the domesticated apple(MalusdomesticaBorkh.)[J].Nature Genetics,2010,42(10):833-839.

      [20] Giorno F,Guerriero G,Baric S,et al.Heat shock transcriptional factors inMalusdomestica:identification,classification and expression analysis [J].BMC Genomics,2012,13(1):639.

      [21] Edgar R C.MUSCLE:multiple sequence alignment with high accuracy and high throughput [J].Nucl Acids Res,2004,32(5):1792-1797.

      [22] Tamura K, Stecher G, Peterson D, et al. MEGA6: Molecular evolutionary genetics analysis version 6.0[J]. Mol Biol Evol, 2013, 30(12): 2725-2729.

      [23] Thompson J D,Gibson T J,Plewniak F,et al.The CLUSTAL_X windows interface:flexible strategies for multiple sequence alignment aided by quality analysis tools [J].Nucleic Acids Res,1997,25(25):4876-4882.

      [24] Castresana J.Selection of conserved blocks from multiple alignments for their use in phylogenetic analysis [J].Mol Biol Evol,2000,17(4):540-552.

      [25] Suyama M,Torrents D,Bork P.PAL2NAL:robust conversion of protein sequence alignments into the corresponding codon alignments [J].Nucleic Acids Res,2006,34:609-612.

      [26] Page R D.TreeView:an application to display phylogenetic trees on personal computers [J].Comput Appl Biosci,1996,12(4):357-358.

      [27] Yang Z.PAML4:phylogenetic analysis by maximum likelihood [J].Mol Biol Evol,2007,24(8):1586-1591.

      [28] Arnold K,Bordoli L,Kopp J,et al.The SWISS-MODEL workspace:a web-based environment for protein structure homology modelling [J].Bioinformatics,2006,22(2):195-201.

      [29] Yang Z,Wong W S,Nielsen R.Bayes empirical Bayes inference of amino acid sites under positive selection [J].Mol Biol Evol,2005,22(4):1107-1118.

      [30] Zhang J,Nielsen R,Yang Z.Evaluation of an improved branch-site likelihood method for detecting positive selection at the molecular level [J].Mol Biol Evol,2005,22(12):2472-2479.

      [31] Wang F,Dong Q,Jiang H,et al.Genome-wide analysis of the heat shock transcription factors inPopulustrichocarpaandMedicagotruncatula[J].Mol Biol Rep,2012,39(2):1877-1886.

      [32] Chung E,Kim K M,Lee J H.Genome-wide analysis and molecular characterization of heat shock transcription factor family inGlycinemax[J].J Genet Genomics,2013,40(3):127-135.

      Sequence Characterization,Expression,and Evolutionary Analysis of Heat Shock Transcription Factors in Apple

      ZHANG Guojun1,2,WANG Tingting3,HU Lizong2,LI Shufen2,GAO Wujun2

      (1.Scoool of Basic Medical Sciences,Xinxiang Medical University,Xinxiang 453003,China;2.College of Life Sciences,Henan Normal University,Xinxiang 453007,China;3.Department of Food Engineering,Luohe Vocational Technology College,Luohe 462000,China)

      To extensively understand the sequence feature and evolution of heat shock transcription factors(Hsf)in the genome of apple,fiftyMdHsfgenes were identified using bioinformatics methods at the whole-genome level of apple,and a series of analysis including sequence characterization,phylogenetic relationship,gene expression and selective pressure ofMdHsfgenes were further performed.Phylogenetic relationship and sequence characterization analysis showed that,like the model speciesArabidopsisand rice,50MdHsfgenes were divided into three subfamilies A,B and C.Additionally,at least two genes were found in the same end clades in the phylogenetic tree,indicating that the lineage-specific amplification had happened during evolutionary processes of appleHsfgene family.Although the intron numbers and sizes ofMdHsfgenes were relatively divergent,the conserved motifs and domains of MdHsf proteins were highly conserved because of functional constraints.Based on EST data,72% of the 50 genes(except 14 genes such asMdHsfA2aandMdHsfA3a/b/c)had transcription activities.Selective pressure signatures demonstrated that no positive selection site was identified in the cleaned codon alignments for 36MdHsfgenes based on site-specific model,suggesting that this protein family was controlled by purifying selection.However,branch-site model had identified a total of five positively selected sites in the d and e clade of the phylogenetic tree,i.e.28R,30L,35D,51M and 67V.28R and 30L were included in the Hsf domains,while 35D,51M and 67V were not mapped on the region of Hsf domains,suggesting that purifying selection was the main evolutionary dynamics of functional conservation Hsf domains except for 28R and 30L.In conclusion,various Hsfs existed in apple genome,and the conserved motifs and functional domains were conserved.The majority of them had transcription activity,and the evolution of this family was dominated by purifying selection.

      Apple;Heat shock transcription factors(Hsf);Expression;Evolution

      2016-08-12

      國(guó)家自然科學(xué)基金項(xiàng)目(31300202;31470334)

      張國(guó)俊(1980-),男,河南南陽(yáng)人,講師,碩士,主要從事分子遺傳學(xué)研究。

      高武軍(1973-),男,山西芮城人,教授,博士,主要從事分子細(xì)胞遺傳學(xué)研究。

      Q78;S661.03

      A

      1000-7091(2017)02-0071-10

      10.7668/hbnxb.2017.02.012

      猜你喜歡
      基序內(nèi)含子結(jié)構(gòu)域
      EPIYA 基序與幽門(mén)螺桿菌感染相關(guān)胃病關(guān)系的研究進(jìn)展
      帶TRS基序突變的新型冠狀病毒威脅更大
      芥藍(lán)Aux/IAA家族基因生物信息學(xué)與表達(dá)分析
      線粒體核糖體蛋白基因中內(nèi)含子序列間匹配特性分析
      不同方向內(nèi)含子對(duì)重組CHO細(xì)胞中神經(jīng)生長(zhǎng)因子表達(dá)的影響
      蛋白質(zhì)結(jié)構(gòu)域劃分方法及在線服務(wù)綜述
      更 正
      內(nèi)含子的特異性識(shí)別與選擇性剪切*
      重組綠豆BBI(6-33)結(jié)構(gòu)域的抗腫瘤作用分析
      組蛋白甲基化酶Set2片段調(diào)控SET結(jié)構(gòu)域催化活性的探討
      剑川县| 雷州市| 门源| 乌兰浩特市| 双牌县| 德令哈市| 醴陵市| 砚山县| 聂拉木县| 靖安县| 长子县| 江西省| 锡林郭勒盟| 顺义区| 曲麻莱县| 那曲县| 孟连| 龙南县| 民和| 达拉特旗| 崇义县| 班玛县| 当雄县| 铁岭市| 和龙市| 芮城县| 女性| 永德县| 轮台县| 焉耆| 平陆县| 桂林市| 金秀| 五大连池市| 元谋县| 晋中市| 凌源市| 大兴区| 乐业县| 海安县| 邵阳县|