戴明丹 馮珂 張曄 張智研 孫俊玲 張一名
【摘 ? 要】 ? 通過進化生物學方法對胼胝質(zhì)合成酶(CalS)進行分析,對于獲取的基因家族成員應用不同的系統(tǒng)進化方法分析。在該基因家族中獲得了六個比較穩(wěn)定的進化分支,并探究其進化關(guān)系和拷貝擴增方式。最后從33個植物物種內(nèi)鑒定得到了317個CalS成員。分析發(fā)現(xiàn),僅有高等植物(維管植物,Vascular plants)具有完整的CalS基因,其中苔蘚植物和蕨類植物均有三種類型的CalS成員,被子植物主要有六種類型的CalS成員。CalS基因的擴增方式以片段重復為主,但也存在串聯(lián)重復。
【關(guān)鍵詞】 ? 胼胝質(zhì)合成酶;基因家族;進化;拷貝積累形式
Identification of CalloseSynthase Gene and Analysis of Amplification Pattern of Its Family Members in Plants
Dai Mingdan,F(xiàn)eng Ke, Zhang Ye,Zhang Zhiyan,Sun Junling,Zhang Yiming*
(Langfang Normal University, Langfang 065000 ,China)
【Abstract】 Evolutionary biology method is used to analyze the obtained gene family members, and different phylogenetic analysis methods are applied. Finally, six stable evolutionary branches of the gene family were obtained, and their evolutionary relationship and copy amplification mode were explored. In this study, 317 CalS members were identified from 33 plant species. It was found that only higher plants (vascular plants) had complete CalS genes. Moss and ferns had three types of CalS members, and angiosperms had six types of CalS members. The amplification of CalS gene copys was mainly in the form of heavy fragment, but there were also tandem repeats.
【Keywords】CalS;gene family;evolution;amplification of copies
〔中圖分類號〕 ?S666 ? ? ? ? ? ? 〔文獻標識碼〕 ?A ? ? ? ? ? ? 〔文章編號〕 1674
0 ? ? 引言
胼胝質(zhì)合成酶(Callose Synthase,CalS)是以UDP-G(二磷酸尿苷葡糖)為底物催化合成胼胝質(zhì)反應中一類重要的酶[1],而胼胝質(zhì)是廣泛存在于細胞中的多糖,其主要成分是β-1,3-葡聚糖,胼胝質(zhì)的合成和降解涉及植物發(fā)育的各種過程、應對多種脅迫[2]和入侵病原的防御等[3],因此,胼胝質(zhì)合成酶在保障植物進行正常生命活動中具有重要意義。
CalS屬于葡聚糖合成酶(Glucan Synthase)家族[4],它是一種分子量較大的蛋白,具有多個跨膜結(jié)構(gòu)域,含有3個保守的功能域Vta1(Vps twenty associated 1)、FKS1(FK506 sensitivity 1)和Glucan Synthase。許多植物都含有這一類基因,這些基因在細胞板形成、胞間連絲調(diào)節(jié)、篩孔及纖維形成、花粉發(fā)育、配子發(fā)育、韌皮部運輸、氣孔形成及抗逆境等過程中均有不同的調(diào)節(jié)功能。[5]而且CalS在胼胝質(zhì)壁、胼胝質(zhì)塞和花粉管壁的合成中起主導作用。[6]
CalS蛋白參與孢子發(fā)育是陸生植物具有的一個共同特征,但各個成員之間的進化關(guān)系少有報道[7]。目前,關(guān)于植物CalS的研究多集中于模式植物擬南芥(Arabidopsis thaliana)且其基因分為兩大類,一類有助于細胞分裂和生殖,一類有助于加強結(jié)構(gòu)細胞壁[4]。在葡萄(Vitisvinifera) [3]等植物細胞中,CalS通過合成胼胝質(zhì)增強了植物對外界的抵抗能力,并且促進了其自身的生長發(fā)育以及植物營養(yǎng)物質(zhì)的轉(zhuǎn)移等多種代謝過程,CalS基因表達升高,胼胝質(zhì)局部沉積能夠明顯提升植物應對病原體的攻擊能力。[8]
現(xiàn)如今,隨著越來越多植物全基因組數(shù)據(jù)的陸續(xù)公布以及新版本基因組的不斷完善,我們有機會針對多種植物類群,從更宏觀的視角上對CalS基因家族進行研究。本文通過選取不同分類關(guān)系的33個植物物種,對其CalS基因家族成員在全基因組水平上進行大規(guī)模鑒定和結(jié)構(gòu)研究,并在前人工作的基礎(chǔ)上,進一步梳理植物CalS基因家族不同成員的演化關(guān)系,并且通過應用系統(tǒng)發(fā)生分析、假基因篩選以及基于同義突變速率的分化時間推測等方法對其進化歷程進行初步探索,從而為進一步研究植物CalS基因不同亞型的潛在功能提供理論基礎(chǔ)。
1 ? ? 材料與方法
1.1 ? 數(shù)據(jù)來源
目前各大數(shù)據(jù)庫中,部分類群缺少可靠注釋的基因組,因此本研究根據(jù)植物分類學進化關(guān)系,以及被子植物APG分類系統(tǒng)[9],選取基因組注釋較完整,且在分類體系中具有代表性的33個植物物種進行分析。其中所涉基因組數(shù)據(jù)來源于NCBI Genome(https://www.ncbi.nlm.nih.gov/genome)、Plants ensemble(https://plants.ensembl.org)以及植物JGI數(shù)據(jù)庫phytozome v12.1(https://phytozome.jgi.doe.gov/pz/portal.html)(表1)。
1.2 ? CalS基因的鑒定
首先,在Pfam[10]數(shù)據(jù)庫(http://pfam.xfam.org)下載CalS蛋白特征結(jié)構(gòu)域的隱馬爾可夫模型(HMM, hidden markov model)文件(號碼:PF02364)。隨后應用HMMER v 3.1[11]在物種全蛋白序列中搜索候選基因。由于CalS基因家族蛋白結(jié)構(gòu)域較大(模型長度819個氨基酸),因此選擇連續(xù)結(jié)構(gòu)域,序列覆蓋率大于80%,并且e值小于1e-200;或者結(jié)構(gòu)域分離,但間隔不超過50個氨基酸,各部分序列覆蓋率之和大于80%,且每個部分的e值小于1e-200的蛋白為候選成員。隨后,選取每個基因的第一個拷貝提交候選成員到SMART(Simple Modular Architecture Research Tool: http://smart.embl-heidelberg.de)進行驗證。所得結(jié)果再與背景種子樹中建樹確認后,作為CalS基因家族成員進入下游分析環(huán)節(jié)。
1.3 ? 建立系統(tǒng)發(fā)生關(guān)系
用MEGA7[12]軟件構(gòu)建CalS基因家族成員的系統(tǒng)發(fā)生關(guān)系,采用蛋白全長序列,使用ClustalW[13]和Muscle[14]兩種方法進行比對,以Maximum Likelihood方法(ML)[15]和Neighbor-Joining法(NJ)[16]建樹,Bootstrap均為1000。構(gòu)建系統(tǒng)發(fā)生關(guān)系通常選擇重要分支Bootstrap值更大的方法,對比發(fā)現(xiàn)Muscle比對NJ法所得系統(tǒng)發(fā)生關(guān)系中主要分支的Bootstrap值更大,因此后續(xù)均選擇此法,并且將所得進化樹提交至在線工具itol[17](https://itol.embl.de;v 4.3.2)實現(xiàn)可視化。
1.4 ? 家族成員擴增分析
本研究主要對片段重復(segmental duplication)和串聯(lián)重復(tandem duplication)[18]兩種復制機制進行研究。將基因間隔不超過2000bp [19]的CalS基因家族成員,識別為串聯(lián)重復基因;對于片段重復,本研究專門針對成員拷貝數(shù)在10個以上的物種在Plant Genome Duplication Database (http://chibba.agtec.uga.edu/duplication/)數(shù)據(jù)庫中進行重復片段的搜索,并得到相應的重復片段以及堿基同義替換率(Ks),并按公式“T=Ks/2λ”估算相應基因之間的分離時間[20]。同時用CodeML[21]計算物種內(nèi)成員間的Ks值。
2 ? ? 結(jié)果與分析
2.1 ? 植物CalS基因家族成員的跨物種分布
經(jīng)過對植物界33個物種的全基因組進行搜索和過濾,最終發(fā)現(xiàn)了317個較為可靠的CalS基因家族成員,分布于30個植物物種內(nèi),藻類植物(紅藻:Cyanidioschyzonmerolae;團藻:Volvoxcarteri;衣藻:Chlamydomonasreinhardtii)中未搜索到CalS基因家族成員。從篩選結(jié)果中可知,本研究所涉及的所有維管植物中均含有至少1個CalS基因家族成員,但不同類群的成員數(shù)量存在明顯差異。其中,蕨類植物CalS基因拷貝數(shù)比較少,不超過5個。而CalS基因家族成員數(shù)量最多的物種則屬于被子植物,其中雙子葉植物——陸地棉(Gossypiumhirsutum),成員數(shù)高達24個,是本研究中CalS基因家族成員最多的物種。在雙子葉植物中,大豆(Glycine max)含有19個CalS基因,位居第二。番木瓜(Carica Papaya)僅有兩個CalS基因,是本研究中含CalS基因最少的高等植物種類(表2)。
通過對比高等植物的CalS蛋白的亞型分布,最原始的植物無油樟已經(jīng)含有了六個亞型,而且多個被子植物類群中的個別物種雖有某個亞型成員的缺失,但是CalS不同亞型在物種類群中總體上分布較為平均,說明被子植物的早期就有CalS蛋白六個亞型的分化。一共有19個物種完全具有六個亞型,11個物種不完全具有六個亞型。缺失個別亞型成員的11個物種包括,小立碗蘚(Physcomitrella patens)、卷柏(Selaginellamoellendorffii)、番木瓜(Carica papaya)、獼猴桃(ActinidiaChinensis)、玉米(Zea mays)、黃瓜(Cucumissativus)、番茄(Solanumlycopersicum)、胡蘿卜(Daucuscarota)、菠蘿(Ananascomosus)、水稻(Oryza sativa)、西瓜(Citrullulanatus)。
2.2 ? 植物CalS基因家族成員的結(jié)構(gòu)和系統(tǒng)發(fā)育分析
研究發(fā)現(xiàn),不同方法所構(gòu)建的系統(tǒng)進化樹都包括六個穩(wěn)定的主要分支,但是在不同的系統(tǒng)發(fā)育分析中,不同亞型之間的進化關(guān)系并不穩(wěn)定(見圖1、2),雖然不能確定各個亞型在進化過程中的從屬關(guān)系,但結(jié)合前人結(jié)果可將317個成員分為六個亞型[4]。Ⅱ型CalS基因數(shù)量最多,占比為21.5%,Ⅰ型CalS基因數(shù)量次之,為21.2%,Ⅵ型CalS基因數(shù)量第三,Ⅵ型為20.8%,Ⅲ型為14.8%,Ⅳ型為7.9%,Ⅴ型為13.9%,尤其是被子植物類群部分物種含有較多的Ⅰ型和Ⅱ型CalS基因。從基因結(jié)構(gòu)分析中發(fā)現(xiàn),各成員間mRNA序列長度差異較大,從794(西瓜Citrullus lanatus,Gene id: ClCG03G013930.1,屬于Ⅰ型)到2112(菠蘿Ananascomosus,Gene id: Aco025277.1,屬于Ⅵ型),但是聚類相近的家族成員,具有相似的基因結(jié)構(gòu)。植物CalS基因家族的氨基酸序列等電點差異較小,其數(shù)值主要在7.5-9之間,平均等電點為8.97。其中Ⅰ型平均8.51,Ⅱ型平均9.27,Ⅲ型平均8.66,Ⅳ型平均8.65,Ⅴ型平均9.12,Ⅵ型平均9.36。由此發(fā)現(xiàn)不同亞型的CalS基因成員等電點略有起伏,但是并未發(fā)現(xiàn)其是否與亞型分化存在關(guān)聯(lián)。
2.3 ? 植物CalS基因家族成員的復制
在對30個物種的分析中,發(fā)現(xiàn)在亞麻(Linumusitatissimum)、蘋果(Malusdomestica)、可可(Theobromacacaov)中存在串聯(lián)重復基因(表3)。針對片段重復,我們在PGDD數(shù)據(jù)庫中搜索了本研究所涉及到的CalS基因拷貝數(shù)較多的物種,小立碗蘚(Physcomitrella patens)拷貝數(shù)大于10個,向日葵(Helianthus annuus)、擬南芥(Arabidopsis thaliana)、可可(Theobroma cacao)、陸地棉(Gossypiumhirsutum)、楊樹(Populustrichocarpa)、大豆(Glycinemax)、短柄草(Brachypodiumsylvaticum)、胡蘿卜(Daucuscarota)、亞麻(Linumusitatissimum)、蘋果(Malusdomestica)、菜豆(Phaseolus vulgaris)、甜橙(Citrus sinensis)。最終在擬南芥(Arabidopsis thaliana)、可可(Theobroma cacao)、楊樹(Populustrichocarpa)、大豆(Glycinemax)、短柄草(Brachypodiumsylvaticum)搜索到8對片段重復,其中三對為Ⅵ型,兩對為Ⅱ型,兩對為Ⅲ型,還有一對為不同亞型之間的片段重復,為Ⅰ型、Ⅵ型基因。另外,未發(fā)現(xiàn)包含Ⅳ型、Ⅴ型的片段重復,可能是成員數(shù)量較少的原因。根據(jù)片段重復的有效Ks值估算分離時間,發(fā)現(xiàn)這些片段重復的分離時間與所在物種的基因組加倍時間相似(表4)。
為進一步研究CalS基因家族的復制事件,本研究以成員數(shù)量最多的陸地棉(Gossypiumhirsutum)為模型。對陸地棉(Gossypiumhirsutum)中所有CalS成員之間的Ks值進行分析,發(fā)現(xiàn)同型成員之間Ks值主要是在2~4之間,一般在3左右,說明陸地棉Ks值除無效值之外其余的趨近于飽和。同型之間Ks值基本相近,然后按棉屬植物平均同義替換率為每109年2.6個堿基(λ=2.6×10-9)[22]估算陸地棉(Gossypiumhirsutum)CalS成員的分離時期。結(jié)果發(fā)現(xiàn),同型成員之間的分歧事件與前人預測的三次陸地棉(Gossypiumhirsutum)基因加倍時間相似,一是被子植物中共有的基因組加倍事件(γ事件)[23],二是57-70 mya的棉屬植物基因組加倍[24],三是在5-10 mya之間的四倍體棉花A、D異源染色體祖先的分離[25]。計算出的陸地棉(Gossypiumhirsutum)Ks值在各個亞型間其數(shù)值差異不大,本研究所涉及的其他成員數(shù)較多的物種內(nèi)也發(fā)現(xiàn)了此類現(xiàn)象(陸地棉Ks值數(shù)據(jù)見圖2)。
綜上,結(jié)合PGDD數(shù)據(jù)以及對陸地棉(Gossypiumhirsutum)CalS基因的分析,本研究認為高等植物的基因組加倍事件(whole-genome duplication, WGD)在物種CalS基因家族成員的積累過程中,發(fā)揮了最主要的作用。
3 ? ? 討論
3.1 ? 植物CalS基因的遺傳分析
通過對不同類群植物中317個CalS基因進行聚類分析發(fā)現(xiàn),植物CalS基因家族至少包含了六個起源于共同祖先的不同類型,這六個亞型共同從一個大的分支分化而來,說明這六個亞型可能是同源的,并且在綠色植物中逐漸分化,該六個亞型極有可能是被子植物從原始的苔蘚植物、蕨類植物繼承和演化而來。根據(jù)圖1發(fā)現(xiàn)Ⅰ型、Ⅱ型共同處于一個分支,這兩個亞型之間親緣關(guān)系可能較近,而Ⅲ型、 Ⅳ型、Ⅵ型處于同一分支,這三個亞型間的親緣關(guān)系可能比較近。
結(jié)合前人對于擬南芥(Arabidopsis thaliana)中12個CalS基因家族成員的研究,我們發(fā)現(xiàn),不同亞型的基因成員具有不同的功能。其中Ⅰ型、Ⅱ型、Ⅴ型在有絲分裂周期參加花粉發(fā)育[4]。如在Ⅰ亞型中,AT3G07160對小孢子進入有絲分裂及不對稱分裂非常重要,AT2G36850參與花粉發(fā)育,是細胞板上胼胝質(zhì)生物合成所需,同時也參與調(diào)節(jié)胞間連絲的氣孔形態(tài)和沉積[26-28];在Ⅱ亞型中,AT4G04970、AT4G03550這兩個基因在四分體內(nèi)分離小孢子的胼胝質(zhì)壁的合成、防止小孢子發(fā)育早期胼胝質(zhì)壁降解以及孢子體組織細胞板形成中都發(fā)揮了重要作用,并且AT4G03550在外壁形成和花粉壁形態(tài)的形成中也具有一定作用[29-32];Ⅴ亞型中AT2G13680對于萌發(fā)花粉管壁和胼胝質(zhì)塞中的胼胝質(zhì)沉積、小孢子發(fā)生過程中外壁形成和花粉生活力的需要以及防止花粉在發(fā)育早期退化都具有重要作用[33-34]。此外,我們還發(fā)現(xiàn)Ⅲ型、 Ⅳ型、Ⅵ型主要在應對脅迫狀況時發(fā)揮作用,例如屬于Ⅲ亞型的AT1G06490是篩板處胼胝質(zhì)沉積所需[35],Ⅳ亞型中AT3G14570在病原菌感染和機械脅迫下調(diào)節(jié)胞間連絲通透性[36],Ⅵ亞型AT1G05570與UDP葡萄糖轉(zhuǎn)移酶形成復合物,在胞質(zhì)分裂時定位于細胞板[37],AT5G13000參與胞間連絲中胼胝質(zhì)的積累[38],AT5G36870在分枝近軸芽的原基中表達,但其確切作用未知[39]。這種功能上的相似性似乎也印證了系統(tǒng)發(fā)生分析中,Ⅲ型、 Ⅳ型、Ⅵ型這三個亞型之間,以及Ⅰ型、Ⅱ型之間的親緣關(guān)系。
3.2 ? 被子植物CalS基因的亞型分布
根據(jù)每種植物在各個亞型之間的分布,除番木瓜(Carica papaya)外,其他物種中均有Ⅱ型CalS基因。由圖1推斷Ⅰ型、Ⅱ型CalS基因可能是原始亞型,此外,三個亞型在相對原始的植物(小立碗蘚Physcomitrella patens和卷柏Selaginellamoellendorffii)就已存在,但其基因成員在Ⅰ型、Ⅱ型數(shù)目較多,Ⅴ型數(shù)目較少,因此,V亞型或許也是最原始的胼胝質(zhì)合成酶之一。在本研究所涉及的所有被子植物中均含有六個亞型的CalS基因或相應的假基因遺跡。說明可能被子植物之前就已經(jīng)形成了六個亞型的分化。而在部分物種內(nèi),其部分亞型成員功能的退化或缺失,似乎暗示了不同亞型之間存在一定的功能替代作用。雖然番木瓜(Carica papaya)只有Ⅴ型、Ⅵ型CalS基因,但是經(jīng)假基因篩選發(fā)現(xiàn)其存在Ⅰ型、Ⅱ型、Ⅲ型、 Ⅳ型的假基因,原因可能是在進化過程中被淘汰掉了。而對于西瓜(Citrullulanatus)和菠蘿(Ananascomosus)存在的幾個假基因,其序列長度與其他序列對比太長,存在一定的可疑性,本次研究不予考慮。猜測其長度過長可能是終止子未識別等情況。
3.3 ? 植物CalS基因的擴增方式分析
對于本研究中搜索到的片段重復,楊樹(Populustrichocarpa)CalS基因家族成員中存在相同亞型及不同亞型成員間的片段重復,同型成員中估算的分離時間與前人預測的基因組加倍時間相似,一是被子植物的形成時間,為300 mya[23],二是被子植物中共有的基因組加倍事件(γ event),加倍時間為170~235 mya[23],三為其自身的基因組加倍時間(表4)。而對于不同亞型間的片段重復(Potri.001G230000,Potri.001G011900),其CalS基因成員的估算分離時間為578 mya,明顯高于被子植物共有的基因組加倍事件(γ event)的時間,此外,在本研究中,這一對片段重復為孤立事件,且此對片段重復成員所屬亞型為Ⅵ型和Ⅰ型,為兩個聚類關(guān)系比較遠的亞型(圖1),說明雖然這種亞型間的分化可能發(fā)生在被子植物形成之前,但六個亞型間的總體差異較小。
4 ? ? ?結(jié)論
在本研究涉及的33個植物物種中,除紅藻、團藻和衣藻不含有CalS基因外,剩余的30個物種均含有CalS基因,共識別到317個不同類型的CalS基因家族成員,這些成員主要可歸為六大類;不同物種的CalS基因拷貝數(shù)差異明顯,并且拷貝數(shù)較多的物種集中于被子植物類群。在本研究中所有的高等植物,除番木瓜外,均含有Ⅱ型基因。而對于擴增方式的分析發(fā)現(xiàn),在CalS基因家族成員在適應性進化規(guī)程中,蘋果、亞麻、可可這三個物種中各有一對成員屬于串聯(lián)重復,其余成員的擴增方式均為片段重復,這說明片段重復在植物CalS基因拷貝積累過程中發(fā)揮了主要作用。以上研究結(jié)果,使我們增進了對植物CalS基因家族的進化歷程的理解,為進一步探究該基因家族的進化以及其功能結(jié)構(gòu)進化打下了基礎(chǔ)。
參考文獻:
[1] Kelly R, Register E, Hsu M J, et al. Isolation of a gene involved in 1,3-beta-glucan synthesis in Aspergillusnidulans and purification of the corresponding protein[J]. Journal of Bacteriology,1996, 178(15):4381-4391.
[2] PⅠr?elová B, Matu?íková Ⅰ. Callose: the plant cell wall polysaccharide with multiple biological functions[J]. ActaPhysiologiaePlantarum, 2013, 35(3):635-644.
[3] Yu Y , Jiao L , Fu S , et al. Callose Synthase Family Genes Involved in the Grapevine Defense Response to Downy Mildew Disease[J]. Phytopathology, 2016, 106(1):56.
[4] ZáveskáDrábková L, Honys D. Evolutionary history of callose synthases in terrestrial plants with emphasis on proteins involved in male gametophyte development[J]. PLoS One, 2017,12(11):187331-187355.
[5] 彭蘊,范海芳,雷天剛, 等.柑橘胼胝質(zhì)合成酶基因家族的表達分析[J].園藝學報,2019,46(2):330-336.
[6] Abercrombie JM, O'Meara BC, MoffattAR, et al. Developmental evoluion of flowering plant pollen tube cell walls:callose synthase (CalS) gene expression patterns[J].Evodevo, 2011,2(1):14.
[7] Shi X, Han X, Lu TG.Callose synthesis during reproductive development in monocotyledonous and dicotyledonous plants[J]. Plant Signal Behav, 2016, ?11(2):1062196-1062201.
[8] Barratt DH, K?lling K, Graf A,etal.Callose synthase GSL7 is necessary for normal phloem transport and inflorescence growth in Arabidopsis[J]. Plant Physiol, 2011, 155(1):328-341.
[9] ChaseMW, ChristenhuszMJM, FayMF, et al.An update of the Angiosperm Phylogeny Group classification for the orders and families of flowering plants: APG IV[J]. Botanical Journal of the Linnean Society, 2016, 18 (1): 1-20.
[10] Bateman A, Coin L, Durbin R, et al. The Pfam protein families database[J]. Nucleic Acids Res, 2004, 32(Database issue):D138-D141.