馬正寶 劉銘 杜澤光 祈樂(lè) 魏兵強(qiáng)
摘要:利用生物信息學(xué)分析方法對(duì)辣椒Exo-PG基因家族成員的數(shù)量、分子特征、亞細(xì)胞定位、基因結(jié)構(gòu)、順式作用元件及系統(tǒng)進(jìn)化進(jìn)行分析,以明確辣椒Exo-PG基因家族成員。結(jié)果表明,辣椒Exo-PG基因家族有49個(gè)成員,不均勻分布于13條染色體上,并分為3個(gè)亞族;辣椒Exo-PG基因家族成員編碼的蛋白酸堿性各占一半,且均定位于細(xì)胞外;該家族成員在啟動(dòng)子序列中含有激素響應(yīng)元件、低溫響應(yīng)元件、厭氧誘導(dǎo)元件等多種順式作用元件。
關(guān)鍵詞:辣椒;外切多聚半乳糖醛酸酶;基因家族;生物信息學(xué)
中圖分類(lèi)號(hào):S641.3 ? ? ? 文獻(xiàn)標(biāo)志碼:A ? ? ? 文章編號(hào):1001-1463(2021)10-0011-08
doi:10.3969/j.issn.1001-1463.2021.10.004
Bioinformatics Analysis of Exo-polygalacturonase Gene Family in Pepper
MA Zengbao, LIU Ming, DU Zeguang, QI Le, WEI Bingqiang
(College of Horticulture, Gansu Agriculture University, Lanzhou Gansu 730070, China)
Abstract:In order to identify the Exo-PG gene family members in pepper, the number, molecular characteristics, subcellular localization, gene structure, cis acting elements and phylogeny of Exo-PG gene family members in pepper were analyzed by bioinformatics. The results showed that pepper contains 49 Exo- PG ?gene family members, which were distributed unevenly on 13 chromosomes and divided into three subgroups. The Exo- PG gene family members in pepper encode half of the proteins with acid-base properties, and all of them are located extracell. There are many cis-acting elements in the promoter sequence of the family members, such as hormone response element, low temperature response element, anaerobic induction element and so on.
Key words:Pepper; Exo-polygalacturonase; Gene family; Bioinformatics
辣椒(Capsicum annuum L.)原產(chǎn)中南美洲,約于16世紀(jì)后期傳入我國(guó)。它是重要的蔬菜及調(diào)味品,我國(guó)栽植面積在200萬(wàn)hm2以上,并且呈逐年增大的趨勢(shì),對(duì)保障我國(guó)蔬菜周年供應(yīng)有著重要作用[1 ]。因此,保障辣椒的產(chǎn)量、品質(zhì)與周年供應(yīng)成為重大民生問(wèn)題。
果膠或果膠物質(zhì)普遍存在于初生細(xì)胞壁和幼小植物組織的中層[2 ],是細(xì)胞維持一定形態(tài)結(jié)構(gòu)的重要物質(zhì)。在花粉發(fā)育過(guò)程中,包被花粉母細(xì)胞、四分體的初生細(xì)胞壁主要由纖維素、半纖維素、果膠和糖蛋白等組成?;ǚ蹆?nèi)壁是成熟花粉壁的組成部分,其主要成分與初生細(xì)胞壁相似。通常情況下,多糖代謝密切參與這些壁的形成和降解,從而參與花粉壁的正常發(fā)育[3 ]。在植物體內(nèi),廣泛分布于果膠代謝相關(guān)的酶,根據(jù)其作用底物的不同,可以分為3 種類(lèi)型,即斷裂多聚半乳糖醛酸中α-1,4-糖苷鍵的解聚酶(PG)、對(duì)高甲酯化果膠發(fā)揮脫甲酯作用的果膠酯酶以及降解不溶性果膠類(lèi)物質(zhì)的原果膠酶[4 ],目前應(yīng)用最為廣泛的PG是解聚酶的一種。已有研究表明,PG基因家族的多個(gè)成員特異地存在于花粉中,它們可能在花粉成熟和花粉管伸長(zhǎng)中發(fā)揮重要的作用[5 ]。 PG基因是一大基因家族,目前仍不明確在辣椒中有多少PG家族成員在花粉發(fā)育中起作用。根據(jù)對(duì)底物的酶促作用模式,多聚半乳糖醛酸酶分為兩類(lèi),即隨機(jī)切割型(內(nèi)切多聚半乳糖醛酸酶)和末端切割型(外切多聚半乳糖醛酸酶),外切 PG 從多聚半乳糖醛酸鏈的非還原末端逐個(gè)水解, 內(nèi)切 PG 則可從分子中間隨機(jī)裂解多聚半乳糖醛酸[6 ]。我們?cè)诶苯啡蚪M范圍內(nèi)鑒定和篩選出辣椒外切多聚半乳糖醛酸酶(Exo-PG)基因家族成員,并利用生物信息學(xué)方法分析了基因結(jié)構(gòu),以預(yù)測(cè)蛋白質(zhì)理化性質(zhì)及啟動(dòng)子區(qū)域的順式作用元件,旨在為全面鑒定和認(rèn)識(shí)辣椒Exo-PG基因家族,為后續(xù)研究辣椒Exo-PG基因家族成員的生物學(xué)功能奠定基礎(chǔ)。
1 ? 材料與方法
1.1 ? 數(shù)據(jù)來(lái)源
在擬南芥綜合數(shù)據(jù)庫(kù)TAIR(https://www. arabidopsis.org)上進(jìn)行搜索關(guān)鍵詞“exo-polygalacturonase”,獲取并下載擬南芥exo-poly-
galacturonase基因的蛋白序列。
1.2 ? 方法
1.2.1 ? 辣椒CaExo-PG基因家族鑒定 ? 以下載的擬南芥exo-polygalacturonase基因蛋白序列作為搜索序列,在茄科基因網(wǎng)站(https://solgenomics.net /tools/blast)進(jìn)行blastp比對(duì),獲取辣椒的exo-polygalacturonase基因家族蛋白候選序列[7 ]。將候選序列提交至Pfam(http://pfam.xfam.org/)和SMART進(jìn)行結(jié)構(gòu)域驗(yàn)證[8 ],最終確定CaExo-PG基因家族成員。利用在線軟件ProtParam(http://web.expasy.org/protparam/)分析CaExo-PG家族成員的蛋白質(zhì)序列長(zhǎng)度、分子量及等電點(diǎn)等理化性質(zhì)[9 ]。利用Euk- mPLoc 2.0(http://www. csbio.sjtu.edu.cn/bioinf/euk-multi-2/)進(jìn)行亞細(xì)胞定位分析[10 ]。
1.2.2 ? 進(jìn)化樹(shù)、染色體定位和保守基序分析 ? 利用 MEGA-X構(gòu)建辣椒系統(tǒng)進(jìn)化樹(shù),構(gòu)建方法為最大法(Maximum Likelihood,ML)。將Bootstrap 的重復(fù)次數(shù)設(shè)置為1 000,剩余設(shè)置選擇默認(rèn)選項(xiàng)[11 ]。染色體定位分析用MapChart軟件進(jìn)行。通過(guò)MEME網(wǎng)站對(duì)CaExo-PG蛋白的氨基酸序列中的保守基序進(jìn)行分析,參數(shù)設(shè)置為模體基序長(zhǎng)度最小為15 aa、最大為150 aa,保守序列數(shù)目最大為6,其他均采用默認(rèn)參數(shù)。
1.2.3 ? 基因結(jié)構(gòu)和啟動(dòng)子順式作用元件 ? 通過(guò)GSDS網(wǎng)站(http://gsds.gao-lab.org/index.php)分析辣椒CaExo-PG基因的內(nèi)含子-外顯子結(jié)構(gòu)及數(shù)目[12 ]。利用TBtool工具提取CaExo-PG編碼序列(coding sequence,CDS)的起始密碼子上游2000 bp序列作為啟動(dòng)子序列,并通過(guò)PlantCARE數(shù)據(jù)庫(kù)進(jìn)行啟動(dòng)子順式作用元件分析[13 - 14 ]。
2 ? 結(jié)果與分析
2.1 ? 辣椒CaExo-PG基因家族的獲取和鑒定
利用生物信息學(xué)的方法,從辣椒‘zunla-1全基因組中共鑒定到 49個(gè) CaExo-PG家族成員(表1),根據(jù)在染色體的位置,將其名為CaExo-PG1~CaExo-PG49。該基因家族所有成員編碼的蛋白質(zhì)均含有一個(gè)“Glyco hydro 28”結(jié)構(gòu)域,氨基酸數(shù)的變化范圍在106~598個(gè),分子量變化范圍在11 415.82~63 472.85,其中CaExo-PG31基因編碼的蛋白質(zhì)分子量最大,CaExo-PG2最小。等電點(diǎn)介于4.73~9.80,其中有24個(gè)成員蛋白質(zhì)呈堿性,25個(gè)成員蛋白質(zhì)呈酸性。通過(guò)亞細(xì)胞定位分析,發(fā)現(xiàn)該基因家族成員編碼的蛋白質(zhì)均定位于細(xì)胞外。
2.2 ? 辣椒CaExo-PG基因家族
2.2.1 ? 辣椒CaExo-PG基因家族進(jìn)化樹(shù)分析
為了解辣椒Exo-PG基因家族和擬南芥(ATexo)之間的同源關(guān)系,構(gòu)建辣椒、擬南芥 Exo-PG基因家族系統(tǒng)進(jìn)化樹(shù)(圖1)。辣椒CaExo-PG基因家族可分為三個(gè)亞家族(Group1、Group2和Group3)。其中第一亞家族有成員21個(gè);第二亞家族有成員19個(gè),第三亞家族有成員9個(gè),ATexo-PG1與CaExo-PG47位于同一亞家族,且具有較高的同源性,說(shuō)明這兩個(gè)基因具有相似的生理學(xué)功能。
2.2.2 ? 染色體定位分析 ? 對(duì)辣椒CaExo-PG基因家族成員進(jìn)行染色體定位分析,結(jié)果顯示,49個(gè)基因分散于辣椒的所有染色體上(圖2)。其中2號(hào)、4號(hào)、6號(hào)、7號(hào)、8號(hào)、11號(hào)染色體上有2個(gè)基因;1號(hào)染色體上有4個(gè)基因;5號(hào)、9號(hào)、12號(hào)、0號(hào)染色體上有6個(gè)基因;3號(hào)染色體上有7個(gè)基因。其中0號(hào)染色體最長(zhǎng),3號(hào)、9號(hào)、12號(hào)染色體出現(xiàn)基因簇且都分布于染色體上端,3號(hào)染色體分布的基因最多。大多數(shù)染色體上有2個(gè)基因。
2.2.3 ? 保守基序分析 ? 對(duì)辣椒CaExo-PG基因家族的蛋白質(zhì)保守基序進(jìn)行分析(圖3),共獲得6個(gè)保守基序(Motif1、Motif2、Motif3、Motif4、Motif5、Motif6),其中CaExo- PG24和CaExo-PG25沒(méi)有保守基序。絕大多數(shù)基因中有Motif1、Motif5分布,說(shuō)明Motif1與Motif5在該家族基因中發(fā)揮重要的作用。Motif2、Motif3、Motif4、Motif6也廣泛分布于該基因家族。
2.3 ? 基因結(jié)構(gòu)和啟動(dòng)子順式作用元件分析
2.3.1 ? 基因結(jié)構(gòu) ? 通過(guò)GSDS網(wǎng)站分析辣椒CaExo-PG基因的內(nèi)含子-外顯子結(jié)構(gòu)及數(shù)目(圖4)。從基因內(nèi)含子數(shù)目分析,該基因家族成員的內(nèi)含子數(shù)目為1~13個(gè)之間,大多數(shù)成員具有3~5個(gè)內(nèi)含子,其中CaExo- PG10具有的內(nèi)含子數(shù)目最多,數(shù)量為13個(gè)。從基因的長(zhǎng)度進(jìn)行分析,CaExo-PG4的長(zhǎng)度最長(zhǎng),大于12 kb,CaExo-PG2長(zhǎng)度最短,小于1 kb。有3個(gè)成員(CaExo-PG12、CaExo-PG35、CaExo-PG9)含有非翻譯區(qū)。
2.3.2 ? 啟動(dòng)子順式作用元件分析 ? 利用PlantCARE數(shù)據(jù)庫(kù)分析了啟動(dòng)子區(qū)域的順式作用元件(圖5)。CaExo-PG家族基因的啟動(dòng)子順式作用元件可以分為9大類(lèi),分別為auxin(生長(zhǎng)素)、defense and stress(防御與脅迫)、gibberellin(赤霉素)、low-temperature(低溫響應(yīng))、salicylic acid(水楊酸)、anaerobic induction(厭氧誘導(dǎo))、MeJA(茉莉酸甲酯)、meristem expression(分生組織表達(dá))、endosperm expression(胚乳表達(dá))。其中CaExo-PG9只有厭氧誘導(dǎo)響應(yīng)元件,CaExo- PG29只有水楊酸響應(yīng)元件。多數(shù)基因含有水楊酸、茉莉酸甲酯和分生組織表達(dá)的作用元件。
3 ? 結(jié)論與討論
本研究從辣椒全基因組范圍內(nèi)共鑒定出 49個(gè)CaExo-PG 基因,分散排布在辣椒的全部染色體上,其中大多數(shù)染色體上有2個(gè)基因,3號(hào)、5號(hào)、9號(hào)、12號(hào)染色體上端有明顯的基因簇出現(xiàn)。該基因家族的蛋白質(zhì)分子量為11 415.82~63 472.85,差異較大;等電點(diǎn)介于4.73~9.80,其中有24個(gè)基因編碼的蛋白質(zhì)呈酸性,25個(gè)基因編碼的蛋白質(zhì)呈堿性;亞細(xì)胞定位分析發(fā)現(xiàn)該基因家族蛋白全定位于細(xì)胞外,說(shuō)明在細(xì)胞外發(fā)揮重要功能。
利用1個(gè)擬南芥和49個(gè)辣椒CaExo-PG蛋白序列構(gòu)建系統(tǒng)進(jìn)化樹(shù),根據(jù)進(jìn)化樹(shù)結(jié)果將辣椒CaExo-PG家族成員分為3個(gè)亞家族,分別為第一亞家族(Group1)、第二亞家族(Group2)及第三亞家族(Group3)。對(duì)CaExo- PG基因家族進(jìn)行了蛋白保守結(jié)構(gòu)域分析,發(fā)現(xiàn)多數(shù)蛋白具有Motif1、Motif5,說(shuō)明Motif1、Motif5在該家族基因中發(fā)揮重要功能。結(jié)合進(jìn)化樹(shù)分析發(fā)現(xiàn),同一亞族的基因基本含有相似的保守基序。對(duì)CaExo-PG基因結(jié)構(gòu)分析,大多數(shù)基因具有3~5個(gè)內(nèi)含子,CaExo-PG10含有內(nèi)含子最多(13個(gè));在該家族成員中,有3個(gè)成員含有非翻譯區(qū),其中基因CaExo-PG12非翻譯區(qū)長(zhǎng)度最短,CaExo-PG35長(zhǎng)度次之,CaExo-PG9最長(zhǎng)。
研究發(fā)現(xiàn),多數(shù)辣椒CaExo-PG基因含有激素和逆境響應(yīng)相關(guān)順式調(diào)控元件(水楊酸、茉莉酸甲酯和分生組織表達(dá)),其中CaExo-PG9只有厭氧誘導(dǎo)、CaExo-PG29只有水楊酸響應(yīng)?;駽aExo-PG4和CaExo-PG49只含有2個(gè)作用元件,即水楊酸響應(yīng)和厭氧誘導(dǎo);基因CaExo-PG21和基因CaExo-PG43含有作用元件最多,有7個(gè)。
參考文獻(xiàn):
[1] ZHENG J Y,LI X F,LIU F,et al. ?The research progresses on pepper in 2018[J]. ?Journal of China Capsicum,2019,17(1):1-9;17.
[2] KOTINO H,YAMASAKI Y,KATOH K. Degradation of pectic polysaccharides,extracted from suspension cultures of carrot by purified exo-polygalacturonase[J]. ?Physiol. Plant.,1984,61:20-26.
[3] 魏兵強(qiáng). ?辣椒胞質(zhì)雄性不育育性恢復(fù)的遺傳與候選基因鑒定[D]. ? 蘭州:甘肅農(nóng)業(yè)大學(xué),2017.
[4] SINGH J R,SAXENA S,GUPTA R. ?Microbial pectinolytic enzymes:A review[J]. ?Process Biochem.,2005,40(9):2931-2944.
[5] 張?jiān)コ?,葉意群,黃 ? 鸝,等. ?花粉發(fā)育相關(guān)基因BjMF6的分子克隆及其生物信息學(xué)分析[J]. ?細(xì)胞生物學(xué)雜志,2007,29(1):158-162.
[6] 佟兆國(guó),王 ? 飛,高志紅,等. ?果膠降解相關(guān)酶與果實(shí)成熟軟化[J]. ?果樹(shù)學(xué)報(bào),2011,
28(2): 305-312.
[7] 李洪有,霍冬敖,蔡 ? 芳,等. ?蕎麥ARF基因家族的鑒定及生物信息學(xué)分析[J]. ?浙江農(nóng)業(yè)學(xué)報(bào),2018,30(1):7-13.
[8] 孟文靜,張家琦,趙康路,等. ?谷子Dof轉(zhuǎn)錄因子家族分析及功能預(yù)測(cè)[J]. ?分子植物育種,2019,17(4):1080-1089.
[9] 朱冉冉,吉雪花,張中榮,等. ?辣椒超氧化物歧化酶基因家族的生物信息學(xué)分析[J]. ?石河子大學(xué)學(xué)報(bào)(自然科學(xué)版),2020,38(6):712-717.
[10] HOONDAL G S,TIWARI R P,TEWARI R,et al. ?Microbial alkaline pectinases and their industrial applications:A review[J]. ?Appl. Microbiol. Biotechnol.,2002,59(4-5):409-418.
[11] 齊晨輝,趙先炎,韓朋良,等. ?蘋(píng)果Plant U-Box型E3泛素連接酶MdPUB24的耐鹽性和ABA敏感性鑒定[J]. ?園藝學(xué)報(bào),2017,
44(12):2255-2264.
[12] 鄭忠凡,張亞利,胡 ? 燦,等. ?辣椒全基因組中LBD轉(zhuǎn)錄因子的鑒定與表達(dá)分析[J]. 園藝學(xué)報(bào),2016,43(4):683-694.
[13] 毛佳昊,熊曉輝,盧一辰. ?茉莉酸調(diào)控植物應(yīng)對(duì)逆境脅迫作用的研究進(jìn)展[J]. ?生物加工過(guò)程,2021,19(1):413-419;462.
[14] 張 ? 茹,王蘭蘭,陳靈芝. ?耐低溫辣椒種質(zhì)資源的快速篩選[J]. ?甘肅農(nóng)業(yè)科技,2020(4):24-27.
(本文責(zé)編:楊 ? ?杰)
收稿日期:2021 - 06 - 15
基金項(xiàng)目:甘肅農(nóng)業(yè)大學(xué)省級(jí)大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃項(xiàng)目(S202010733089);甘肅農(nóng)業(yè)大學(xué)科研訓(xùn)練計(jì)劃(SRTP)項(xiàng)目(202012012)。
作者簡(jiǎn)介:馬正寶(1998 — ),男,甘肅蘭州人,碩士在讀,研究方向?yàn)槭卟藢W(xué)。Email:2372128737@qq.com。
通信作者:魏兵強(qiáng)(1980 — ),男,甘肅天水人,副研究員,博士,主要從事蔬菜遺傳與分子育種。聯(lián)系電話:(0931)7632155。Email:bqwei@gsau.edu.cn。
執(zhí) ?筆 ?人:劉 ? 銘。