霍如雪 劉振寧 楊青 +王光全
摘要:多聚半乳糖醛酸酶(polygalacturonase,PG)屬于一個大的水解酶家族,它通過降解果膠在植株生長發(fā)育過程中的細(xì)胞分離事件中發(fā)揮重要作用。為深入研究桃PG基因家族的功能,利用生物信息學(xué)方法對桃基因組中PG基因家族成員進行鑒定,對其基因和蛋白特征、保守結(jié)構(gòu)域、基因進化樹分類和基因表達(dá)模式等方面進行研究。結(jié)果表明,在桃基因組中共鑒定出了84個PG基因,可以聚類成7個分支A~G;PG基因在8條染色體上呈現(xiàn)不均勻分布,并存在明顯的串聯(lián)重復(fù)現(xiàn)象,共發(fā)現(xiàn)16個串聯(lián)重復(fù)基因簇;利用 UniGene 數(shù)據(jù)庫進行的組織表達(dá)分析。說明有 10 個基因在數(shù)據(jù)庫中有表達(dá)數(shù)據(jù),其中有6個基因具有組織表達(dá)特異性。
關(guān)鍵詞:桃;多聚半乳糖醛酸酶;基因家族;生物信息學(xué)
中圖分類號: S662.103文獻(xiàn)標(biāo)志碼: A
文章編號:1002-1302(2016)06-0033-08
多聚半乳糖醛酸酶(polygalacturonase,PG)是一種細(xì)胞壁結(jié)合蛋白,具有水解酶性質(zhì),廣泛存在于細(xì)菌、真菌和植物中。PG大約在52年以前被鑒定,并被證明參與到植株生長發(fā)育各個時期中果膠的降解。在降解果膠的諸多酶類中,PG屬于其中最大的水解酶家族。目前,已經(jīng)在擬南芥、水稻、楊樹、白菜、黃瓜、甜瓜、卷柏、小立碗蘚等物種中對其基因家族進行了鑒定,并在進化上進行了分析[1-8]。PG從性質(zhì)上主要分成3種,即內(nèi)切PG、外切PG、鼠李糖PG。根據(jù)不同的分類標(biāo)準(zhǔn),不同研究者將PG聚類為不同的亞類。擬南芥A~F等6類中的PG基因在表達(dá)模式上存在差異,有些亞類的成員趨向于在營養(yǎng)組織中表達(dá),而有些則趨向于在生殖器官中表達(dá)[8]。不同亞類的PG可能具有獨特的生物學(xué)功能。Park 等認(rèn)為,A類和B類含有陸生植物的PG基因,E類含有從藻類到開花植物的PG基因,而C、D、F類則只含有開花植物的PG基因[8]。對水稻、楊樹、苔蘚、小立碗蘚和擬南芥5個物種中的225個PG的研究表明,A類和B類為內(nèi)切PG,C類和D類為外切PG,E類為鼠李糖PG,而F類的成員不能被歸類于不同性質(zhì)PG中的任何一種[6]。
根據(jù)Hadfield等對植物PG功能的分類,PG可以分為三大類,與果實成熟相關(guān)的PG、與器官脫落相關(guān)的PG、與花粉發(fā)育相關(guān)的PG[9]。研究表明,cpPG1和木瓜果肉軟化有關(guān),cpPG1在木瓜中的過表達(dá)能夠促進果肉的軟化[10]。Roongsattham等在油棕果實成熟和脫落的過程中鑒定出14個PG基因,這些基因均在果實成熟時基部的脫落區(qū)表達(dá)[11]。RDPG1是油菜中的一個PG基因,主要在果莢和花藥的開裂區(qū)表達(dá),并且在花器官的脫落區(qū)、花粉管生長過程中的花柱組織、莖和花梗的節(jié)點中表達(dá),表明RDPG1可能與器官脫落有關(guān)[12]。在擬南芥花粉發(fā)育過程中,花粉母細(xì)胞減數(shù)分裂形成四分體小孢子,研究發(fā)現(xiàn),PG基因[WTBX][STBX]QRT3[WTBZ][STBZ]參與了四分體小孢子的分離。在花粉發(fā)育的早期,[WTBX][STBX]QRT3[WTBZ][STBZ]由絨氈層分泌降解四分體小孢子周圍的花粉母細(xì)胞壁,從而使得四個小孢子能夠正常分離[13]。
桃(Prunus persica)是薔薇科(Rosaceae)李屬(Prunus)植物,是世界上廣泛栽培的落葉果樹之一[14]。與薔薇科木本植物如李和酸櫻桃等多倍體果樹相比,桃是二倍體(n=8 ),具有相對較小的基因組(230 Mbp),而且具有相對短的童期(2~3年),這些獨特的優(yōu)點使得桃成為李屬及其他薔薇科植物的模式基因組物種[15]。桃基因組測序的完成和序列釋放[16]使得在全基因組水平上對桃的重要功能基因的發(fā)掘比較和功能研究成為可能。本研究利用生物信息學(xué)方法對桃PG基因家族成員進行了鑒定和基因組注釋,分析了其基因結(jié)構(gòu)和保守域,以期為進一步對桃PG家族基因的功能研究提供基礎(chǔ)信息并最終在分子水平上對桃品種的改良提供明確的候選基因。
1材料與方法
1.1桃PG基因家族的鑒定
首先,利用擬南芥PG蛋白的氨基酸序列作為種子序列在桃基因組數(shù)據(jù)庫(http://www.rosaceae.org/species/prunus_persica/genome_ version 2.0)[16]中BlastP比對搜索。其次,為保證候選基因沒有被遺漏,又利用搜索到的PG蛋白的氨基酸序列對桃基因組數(shù)據(jù)庫進行2次BLASTP比對搜索。最后,利用Pfam數(shù)據(jù)庫(http://pfam.janelia.org/)、SMART數(shù)據(jù)庫(http://smart.embl-heidelberg.de/)和NCBI的保守域數(shù)據(jù)庫(http://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)分析候選蛋白的結(jié)構(gòu)域,根據(jù)候選蛋白的氨基酸序列是否至少具有一個PG的保守結(jié)構(gòu)域(SPNTDGI、GDDC、CGPGHGISIGSLG和RIK)進行候選PG基因的篩選和鑒定。除上述方法獲得的PG基因外,還包括[WTBX][STBX]At4g20050(QRT3[WTBZ][STBZ])[13],該基因雖然不含有PG基因的任何一個結(jié)構(gòu)域,但是它已經(jīng)被證明為PG基因。因此,[WTBX][STBX]At4g20050[WTBZ][STBZ]基因在桃基因組中的同源基因單獨用BLASTP搜索獲得。
1.2桃PG基因的基因組信息和染色體定位
桃PG基因的序列和基因組信息通過桃基因組數(shù)據(jù)庫獲得,并根據(jù)每一個PG基因在染色體上的精確位置和染色體的長度使用Photoshop軟件將PG基因人工定位到對應(yīng)的染色體上。
1.3桃PG蛋白的生理生化分析
PG蛋白的分子量和等電點通過(Compute pI/Mwsoftware (http://www.expasy.ch/tools/pi_tool.html)[17]來預(yù)測,信號肽序列通過SignalP 4.1(http://www.cbs.dtu.dk/services/SignalP/)[18]分析。
[BT2+*5]1.4桃PG基因的結(jié)構(gòu)分析、保守域分析和進化樹分析
GSDS網(wǎng)站(http://gsds1.cbi.pku.edu.cn/)[19]用來分析PG基因的外顯子-內(nèi)含子結(jié)構(gòu)。在線的MEME軟件(http://meme.sdsc.edu/meme/meme.html)[20]用來鑒定PG蛋白的氨基酸序列中的基序。Clustal X軟件用來對PG蛋白的氨基酸序列進行比對。對進化樹的構(gòu)建,首先利用MEGA 50軟件(http://www.megasoftware.net/)自帶的Clustal W應(yīng)用對蛋白的氨基酸序列進行比對分析,空格罰分設(shè)置為10,空格擴展罰分設(shè)置為0.2。然后將比對好的序列利用MEGA 50軟件構(gòu)建進化樹,進化樹使用鄰接法構(gòu)建,采用泊松校正,成對刪除和1 000次重復(fù)等建樹參數(shù)[21]。
1.5桃PG基因的表達(dá)
在NCBI數(shù)據(jù)庫中對每個桃PG基因進行BLASTN比對搜索,取高相似度的序列(>95%)搜索其Unigene的EST表達(dá)數(shù)據(jù),并將基因的表達(dá)數(shù)據(jù)轉(zhuǎn)換成Log2的格式,最終的基因表達(dá)數(shù)據(jù)使用Multiple Array Viewer軟件[22]以熱點圖的形勢呈現(xiàn)。
2結(jié)果與分析
2.1桃PG基因家族的鑒定和注釋
根據(jù)擬南芥PG蛋白的氨基酸序列,通過對桃基因組數(shù)據(jù)庫的BLAST搜索,在桃基因組中共鑒定出了84個PG基因,并參考擬南芥PG基因的命名方法[4]對桃PG基因進行命名(表1)。這84個PG基因的開放閱讀框長度在426~2 127 bp,編碼141~708個氨基酸,相應(yīng)的蛋白分子量在1576~7463 ku,等電點在4.48~9.52之間。對PG蛋白信號肽的預(yù)測表明,其中64個蛋白具有一段N末端信號肽,信號肽長度為15~32個氨基酸。對桃PG基因染色體定位(圖1),研究表明,PG基因在桃的8條染色體上呈現(xiàn)不均勻分布,其中第1、第2、第3、第4、第7染色體上具有比較多的PG基因,而第5、第6、第8染色體上的PG基因比較少。此外,PG基因在染色體上分布存在明顯的串聯(lián)重復(fù)現(xiàn)象,共發(fā)現(xiàn)了16個串聯(lián)重復(fù)基因簇,共包含48個基因,占PG基因總數(shù)的57%。
2.2桃PG基因的系統(tǒng)發(fā)育分析和分類
為進一步分析桃PG基因在植物中的進化模式,筆者選取了桃、擬南芥、楊樹、水稻、卷柏和小立碗蘚等6個代表性物種[2,5]中PG蛋白的氨基酸序列使用MEGA5.0軟件,構(gòu)建了NJ進化樹并對各物種中PG基因進行了聚類分析(圖2)。結(jié)果表明,這6個物種的298個PG基因被聚類成7個分支(A~G)。為明確每個物種在每個分支中PG基因的數(shù)目,對每個分支中不同物種PG基因的數(shù)目進行統(tǒng)計(表2)。結(jié)果表明,桃PG基因家族成員存在于所有的A~G等7個分支中,分別含有8、5、15、31、13、9、3個,擬南芥中分別含有8、6、8、20、14、11、1個。楊樹PG基因分布于A~F等6個分支中,分別含有12、7、21、16、14、5個。單子葉植物水稻PG基因也分布于A~F等6個分支中,分別含有7、11、4、9、12、1個。卷柏和小立碗蘚中PG基因數(shù)目比較少,卷柏中含有16個,分別為A類2個、B類6個、E類7個、F類1個;小立碗蘚中有11個,分別為A類2個、B類1個、E類8個。統(tǒng)計數(shù)據(jù)也表明,A、B、E類包含上述6個陸生植物的PG基因;C類、D類只包括桃、擬南芥、楊樹和水稻的PG基因;F類包含桃、擬南芥、楊樹、水稻和卷柏的PG基因;而G類只包括桃和擬南芥的PG基因。
2.3桃PG基因的基因結(jié)構(gòu)分析
為研究桃PG基因的基因結(jié)構(gòu),根據(jù)桃基因組信息獲取每一個PG基因的DNA和CDS序列信息并構(gòu)建其基因結(jié)構(gòu)(圖3)。結(jié)果表明,大部分PG基因都有3~8個不等的內(nèi)含子,其中分支D中有11個基因不具有內(nèi)含子結(jié)構(gòu)。通過對基因結(jié)構(gòu)圖和基因進化樹的比較分析,發(fā)現(xiàn)每一個分支中PG基因的結(jié)構(gòu)相對是比較保守的,尤其是每一個更小分支中的PG基因。
2.4桃PG蛋白的氨基酸序列比對和保守域分析
為研究桃PG蛋白的保守域,利用CLUSTAL X對桃PG蛋白的氨基酸序列進行多重比對(圖4)。結(jié)果表明,PG蛋白一般具有4個典型的保守結(jié)構(gòu)區(qū)域(Ⅰ,SPNTDGI;Ⅱ,GDDC;Ⅲ,CGPGHGIS;Ⅳ,RIK)。除了分支G中的3個特殊蛋白不包含這4個結(jié)構(gòu)域之外,分支A~F中的蛋白都至少具有其中一個結(jié)構(gòu)域。尤其是分支A、B、C、F中的蛋白一般都具有所有4個結(jié)構(gòu)域,而分支E中的13個蛋白一般只具有Ⅰ、Ⅱ和Ⅳ這3個結(jié)構(gòu)域,都缺少結(jié)構(gòu)域Ⅲ。 另外,利用MEME軟件對桃PG保守基序的分析(圖5),發(fā)現(xiàn)了6個比較保守的基序(motif 1~6),其中motif 1、motif 5、motif 2和motif 3分別對應(yīng)Ⅰ~Ⅳ 4個保守結(jié)構(gòu)域。另外,還分別在74、76個PG蛋白中發(fā)現(xiàn)了motif 4和motif 6。
2.5桃PG基因的表達(dá)分析
利用 UniGene 數(shù)據(jù)庫進行的組織表達(dá)。結(jié)果表明,有 10 個基因在數(shù)據(jù)庫中有表達(dá)數(shù)據(jù)(圖6)。其中有6個基因具有組織表達(dá)特異性,[WTBX][STBX]PpaPG10、PpaPG65、PpaPG66、PpaPG67、PpaPG68[WTBZ][STBZ]在果實中特異表達(dá),[WTBX][STBX]PpaPG60[WTBZ][STBZ]在莖中特異表達(dá)。對另外4個非組織特異表達(dá)的基因,[WTBX][STBX]PpaPG01[WTBZ][STBZ]在莖中表達(dá)量比較高,[WTBX][STBX]PpaPG23[WTBZ][STBZ]主要在果實中表達(dá),而[WTBX][STBX]PpaPG80[WTBZ][STBZ]在葉中具有比較高的表達(dá)。
3結(jié)論與討論
PG家族是一個大的基因家族。在不同物種中,PG基因的進化和分類已經(jīng)被進行了大量的研究。Park等通過聚類分析,將藻類到陸生植物的PG基因家族成員進行了詳細(xì)的劃分[8]。8個物種的225個PG成員被聚類到A~F等6個分支,分支A、分支B包含所有陸生植物的PG基因,分支E包含藻類到開花植物的PG成員,而分支C、D、F則只含有開花植物的PG成員[6]。本研究對桃、擬南芥、楊樹、水稻、卷柏和小立碗蘚等6個代表性物種中的298個PG基因構(gòu)建了進化樹和聚類分析,將PG基因聚類到A~G等7個分支。桃和擬南芥PG基因家族成員存在于所有的A~G等7個分支中,楊樹和水稻PG基因分布于A~F等6個分支中,卷柏PG基因分布于分支A、B、E、F中,小立碗蘚PG基因僅分布于分支A、B、E等3個分支中。與Park等的研究結(jié)果[6]不同的是,分支F中存在1個卷柏PG基因,因此F亞類應(yīng)該包含除苔蘚以外的所有陸生植物的PG基因。
桃、擬南芥、水稻、楊樹基因組大小分別為230、125、466、480 Mbp,而這4個物種基因組中PG基因的數(shù)目分別為84、68、44、75個,說明桃基因組中PG基因出現(xiàn)了基因的擴增。進一步對這4個物種每個分支中PG基因數(shù)目進行統(tǒng)計和比較發(fā)現(xiàn),桃的分支C、分支D分別包含15、31個PG基因,明顯比其他物種在這2個分支中PG基因多,說明桃PG基因的擴增主要出現(xiàn)在這2個分支中?;驍U增是基因組進化最主要的[CM(25]驅(qū)動力之一,是產(chǎn)生具有新功能的基因和進化出新物種的[CM)][FL)]
主要原因之一?;蚩梢酝ㄟ^多種方式進行擴增,包括全基因組復(fù)制、串連復(fù)制、片段復(fù)制和逆轉(zhuǎn)座復(fù)制等。對桃PG基因染色體定位進行研究發(fā)現(xiàn),PG基因在染色體上,分布存在明顯的串聯(lián)重復(fù)現(xiàn)象,共有16個串聯(lián)重復(fù)基因簇,包含48個基因,占PG基因總數(shù)的57%,表明串聯(lián)重復(fù)是桃PG基因擴增的主要方式。分支C中有4個串聯(lián)重復(fù)基因簇,包含13個基因;分支D有7個串聯(lián)重復(fù)基因簇,包含22個基因。表明桃PG基因的串聯(lián)重復(fù)主要發(fā)生在分支C和分支D中?;驍U增后會產(chǎn)生大量的基因重復(fù),基因重復(fù)在生物系統(tǒng)進化中發(fā)揮著極其重要的作用,是基因組和遺傳系統(tǒng)分化的重要推動力[23]。一般認(rèn)為,復(fù)制基因在進化過程中有4種命運,即假基因化、[JP2]保持原有基因功能、亞功能化、新功能化。桃基因組中大量重復(fù)PG基因的進化命運仍需要進一步研究。[JP]
桃的使用主要是鮮食和加工2種方式,而這2種方式對果實的硬度和成熟度要求不同[24-26]。PG基因已被證明在果
實成熟和軟化過程中具有重要作用。在桃UniGene 數(shù)據(jù)庫中找到了10個有表達(dá)數(shù)據(jù)的PG基因,其中有9個基因均在果實中表達(dá),而且有5個基因是在果實中特異表達(dá),表明PG基因在桃果實發(fā)育過程中扮演者重要角色。對桃PG基因與果實發(fā)育關(guān)系研究能夠為培育符合市場需求的桃優(yōu)良品種提供重要的理論依據(jù),并具有現(xiàn)實的指導(dǎo)意義。
參考文獻(xiàn):
[1][ZK(#]Torki M,Mandaron P,Mache R,et al. Characterization of a ubiquitous expressed gene family encoding polygalacturonase in Arabidopsis thaliana[J]. Gene,2000,242 (1):427-436.
[2]Gonzalez-Carranza Z H,Elliott K A,Roberts J A. Expression of polygalacturonases and evidence to support their role during cell separation processes in Arabidopsis thaliana[J]. Journal of Experimental Botany,2007,58(13):3719-3730.
[3]Yu Y,Liang Y,Lv M,et al. Genome-wide identification and characterization of polygalacturonase genes in Cucumis sativus and Citrullus lanatus[J]. Plant Physiology and Biochemistry,2014,74:263-275.
[4]Liang Y,Yu Y,Shen X,et al. Dissecting the complex molecular evolution and expression of polygalacturonase gene family in Brassica rapa ssp. chinensis[J]. Plant Molecular Biology,2015,89 (6):629-646.[ZK)][HJ][FL)]
[5][ZK(#]Yang Z L,Liu H J,Wang X R,et al. Molecular evolution and expression divergence of the Populus polygalacturonase supergene family shed light on the evolution of increasingly complex organs in plants[J]. The New Phytologist,2013,197 (4):1353-1365.
[6]Park K C,Kwon S J,Kim N S. Intron loss mediated structural dynamics and functional differentiation of the polygalacturonase gene family in land plants[J]. Genes & Genomics,2010,32 (6):570-577.
[7]Kim J,Shiu S H,Thoma S,et al. Patterns of expansion and expression divergence in the plant polygalacturonase gene family[J]. Genome Biol,2006,7:87.
[8]Park K C,Kwon S J,Kim P H,et al. Gene structure dynamics and divergence of the polygalacturonase gene family of plants and fungus[J]. Genome,2007,51(1):30-40.
[9]Hadfield K A,Bennett A B. Polygalacturonases:many genes in search of a function[J]. Plant Physiology,1998,117(2):337-343.[ZK)]
[10][ZK(#]Fabi J P,[HJ1.85mm]Broetto S G,da Silva S L,et al. Analysis of papaya cell wall-related genes during fruit ripening indicates a central role of polygalacturonases during pulp softening[J]. PLoS One,2014,9(8):e105685.
[11]Roongsattham P,Morcillo F,Jantasuriyarat C,et al. Temporal and spatial expression of polygalacturonase gene family members reveals divergent regulation during fleshy fruit ripening and abscission in the monocot species oil palm[J]. BMC Plant Biology,2012,12(1):150.
[12]Sander L,Child R,Ulvskov P,et al. Analysis of a dehiscence zone endo-polygalacturonase in oilseed rape (Brassica napus) and Arabidopsis thaliana:evidence for roles in cell separation in dehiscence and abscission zones,and in stylar tissues during pollen tube growth[J]. Plant Molecular Biology,2001,46 (4),469-479.[ZK)][HJ]
[13][ZK(#]Rhee S Y,Osborne E,Poindexter P D,et al. Microspore separation in the quartet 3 mutants of Arabidopsis is impaired by a defect in a developmentally regulated polygalacturonase required for pollen mother cell wall degradation[J]. Plant Physiology,2003,133(3):1170-1180.
[14]王富榮,佟兆國,章鎮(zhèn),等. 野生桃幼葉 DNA 提取方法的改良研究[J]. 江蘇農(nóng)業(yè)科學(xué),2006(5):66-69.
[15]Shulaev V,Korban S S,Sosinski B,et al. Multiple models for Rosaceae genomics[J]. Plant Physiology,2008,147(3):985-1003.
[16]Verde I,Abbott A G,Scalabrin S,et al. The high-quality draft genome of peach (Prunus persica) identifies unique patterns of genetic diversity,domestication and genome evolution[J]. Nature Genetics,2013,45(5):487-494.
[17]Gasteiger E,Gattiker A,Hoogland C,et al. ExPASy:the proteomics server for in-depth protein knowledge and analysis[J]. Nucleic Acids Research,2003,31(13):3784-3788.
[18]Petersen T N,Brunak S,von Heijne G,et al. SignalP 4.0:discriminating signal peptides from transmembrane regions[J]. Nature Methods,2011,8(10):785-786.
[19]Hu B,Jin J,Guo A Y,et al. GSDS 2.0:an upgraded gene feature visualization server[J]. Bioinformatics,2015,31(8):1296-1297.
[20]Bailey T L,Williams N,Misleh C,et al. MEME:discovering and analyzing DNA and protein sequence motifs[J]. Nucleic Acids Research,2006,34(Suppl2):369-373.
[21]Saitou N,Nei M. The neighbor-joining method:a new method for reconstructing phylogenetic trees[J]. Molecular Biology and Evolution,1987,4(4):406-425.
[22]Saeed A I,Hagabati N K,Braisted J C,et al. TM4 microarray software suite[J]. Methods in Enzymology,2006,411:134-193.
[23]Ohno S. Evolution by gene duplication[M]. Berlin:Springer Science & Business Media,2013.
[24]馬瑞娟,張斌斌,張春華,等. 套袋對金陵黃露桃果實品質(zhì)的影響[J]. 江蘇農(nóng)業(yè)學(xué)報,2014,30(5):1127-1131.
[25]王彩君,高貴如,馬艷芝,等. 不同果袋對晚西妃桃發(fā)育過程中果實品質(zhì)的影響EJ]. 江蘇農(nóng)業(yè)科學(xué),2014,42(8):160-162.
[26]趙劍波,姜全,郭繼英,等. 桃果實風(fēng)味品質(zhì)指標(biāo)測定與品種篩選[J]. 江蘇農(nóng)業(yè)科學(xué),2007(6):165-168.[ZK)][HJ][FL)]