齊燕妮 李聞娟 王利民 趙瑋 黨照 謝亞萍 張建平
摘要:COBRA基因編碼糖基磷脂酰肌醇錨定蛋白,是次生壁加厚和纖維素含量的調(diào)節(jié)因子。亞麻纖維為韌皮纖維,纖維產(chǎn)量與次生壁中纖維素含量及次生壁加厚密切相關(guān)。通過(guò)BLASTP和Pfam分析,鑒定到24個(gè)亞麻COBRA家族成員,并對(duì)其進(jìn)行基因結(jié)構(gòu)、蛋白理化性質(zhì)及系統(tǒng)進(jìn)化等生物信息學(xué)分析。結(jié)果表明,有22個(gè)成員具有跨膜結(jié)構(gòu)域,21個(gè)成員具有N-端信號(hào)肽,16個(gè)成員具有GPI錨定位點(diǎn),所有蛋白均具有CCVS保守結(jié)構(gòu)域而且都定位在細(xì)胞膜?;蚪Y(jié)構(gòu)和系統(tǒng)進(jìn)化分析表明,亞麻COBRA基因家族分為2個(gè)亞家族:COBRA-I和COBRA-II,2個(gè)亞家族的基因結(jié)構(gòu)具有明顯的差異。
關(guān)鍵詞:亞麻;纖維;COBRA基因家族;序列分析;系統(tǒng)進(jìn)化分析
中圖分類(lèi)號(hào):S565.9 ? ? ?文獻(xiàn)標(biāo)志碼:A ? ? ?文章編號(hào):1001-1463(2019)09-0033-06
doi:10.3969/j.issn.1001-1463.2019.09.009
Abstract:The COBRA gene encodes the glycosylphosphatidylinositol anchoring protein, which is a regulator of secondary wall thickening and cellulose content. Flax fiber is bast fiber, and fiber yield is closely related to the content of cellulose in secondary wall and the thickening of secondary wall. Through BLASTP and Pfam analysis, 24 members of the COBRA family were identified in this study, and the gene structure, physicochemical properties of proteins, systematic evolution were conducted. The results showed that 22 members had transmembrane domain, 21 members had N-terminal signal peptide, 16 members had GPI anchor site, and all proteins had CCVS conserved domain and were located in cell membrane. The results of gene structure analysis and systematic evolution showed that the COBRA gene family was divided into two subfamilies, COBRA-I and COBRA-II, the gene structure of the two subfamilies were significantly different. This study laid a foundation for the in-depth study on the function of COBRA gene and the use of COBRA gene to increase the fiber yield.
Key words:Flax;Fiber;COBRA gene family;Sequence analysis;Phylogeny analysis
亞麻(Linum usitatissimum L.)是一年生自花授粉的植物,是亞麻科中唯一重要的農(nóng)作物 [1 ]。亞麻根據(jù)其用途,分為油用、纖維用兩種,也有油纖兩用亞麻[2 ]。纖維亞麻株高可達(dá)到80~120 cm、分枝少、籽粒小,主要分布西歐、俄羅斯、中國(guó)[3 ]。亞麻纖維是紡織產(chǎn)品制造的原材料,中國(guó)亞麻纖維需求較大,而且是世界上最大的亞麻纖維出口國(guó),黑龍江占亞麻纖維總產(chǎn)量的85%[4 ]。提高纖維產(chǎn)量是亞麻育種的主要目標(biāo)之一,明確纖維合成及調(diào)控基因可以為纖維產(chǎn)量的提高提供理論基礎(chǔ)。
COBRA基因編碼糖基磷脂酰肌醇錨定蛋白(glycosyl-phosphatidyl inositol-anchored protein),一般具有N-端信號(hào)肽、碳水化合物結(jié)合模塊(CBM)、高度保守的中心半胱氨酸富集區(qū)(CCVS)以及將蛋白靶向內(nèi)質(zhì)網(wǎng)的C-端GPI錨定位點(diǎn)和疏水尾巴[5 ]。COBRA蛋白是細(xì)胞定向生長(zhǎng)和纖維素結(jié)晶度的關(guān)鍵調(diào)節(jié)因子,其突變會(huì)導(dǎo)致細(xì)胞次生壁厚度和纖維素含降量低[6 - 7 ]。已經(jīng)在擬南芥、番茄、水稻及玉米中分別鑒定到12、17、11、9個(gè)COBRA基因家族成員,擬南芥中COBRA家族分為2個(gè)亞家族[8 - 11 ]。我們利用生物信息學(xué)方法,在亞麻全基因組中對(duì)COBRA基因家族進(jìn)行鑒定,并對(duì)其序列及系統(tǒng)進(jìn)化進(jìn)行分析,以期為深入研究COBRA家族各成員功能,進(jìn)而提高亞麻纖維產(chǎn)量提供依據(jù)。
1 ? 材料與方法
1.1 ? 亞麻COBRA基因家族的鑒定
從NCBI數(shù)據(jù)庫(kù)中下載擬南芥COBRA基因家族各成員的蛋白序列。使用BlastP在亞麻全基因組蛋白數(shù)據(jù)庫(kù)中進(jìn)行搜索,閾值小于等于1E-5,得到候選序列后用Pfam對(duì)結(jié)構(gòu)域進(jìn)行確認(rèn)。
1.2 ? COBRA基因家族的序列分析
利用Expasy在線分析蛋白質(zhì)的分子量、等電點(diǎn),采用SignalP-5.0對(duì)亞麻COBRA蛋白進(jìn)行N-端信號(hào)肽預(yù)測(cè)。使用big-PI分析蛋白的C端疏水末端錨定位點(diǎn),用SOSUI在線預(yù)測(cè)跨膜結(jié)構(gòu)域,用MEME分析 ? COBRA蛋白的保守基序,使用Plant-mPloc進(jìn)行亞細(xì)胞定位預(yù)測(cè)。利用IBS繪制基因結(jié)構(gòu)圖。
1.3 ? COBRA基因家族的進(jìn)化分析
利用MEGA6.0軟件中的ClustalW,采用默認(rèn)參數(shù),對(duì)擬南芥和亞麻COBRA蛋白的氨基酸序列進(jìn)行多重比對(duì),比對(duì)結(jié)果采用NJ(Neighbor-Joining)法構(gòu)建系統(tǒng)進(jìn)化樹(shù),Bootstrap校驗(yàn)值為1 000次。
2 ? 結(jié)果與分析
2.1 ? 亞麻COBRA基因家族的鑒定
利用12條擬南芥COBRA基因氨基酸序列在亞麻全基因組進(jìn)行BLASTP搜索,獲得亞麻COBRA蛋白的候選序列。用Pfam對(duì)候選序列進(jìn)行注釋?zhuān)罱K確定亞麻基因組COBRA家族含有24個(gè)成員,均含有COBRA家族的特有結(jié)構(gòu)域COBRA,命名為L(zhǎng)uCOBL1~LuCOBL24(表1)。
2.2 ? 亞麻COBRA基因家族的序列和結(jié)構(gòu)域特征
對(duì)亞麻COBRA基因家族進(jìn)行系統(tǒng)進(jìn)化分析,并對(duì)其外顯子-內(nèi)含子結(jié)構(gòu)進(jìn)行分析(圖1,表1)。從進(jìn)化樹(shù)可以看出,亞麻COBRA蛋白與擬南芥類(lèi)似,也被分為2個(gè)亞家族(COBRA-I和COBRA-II)。COBRA-I有18個(gè)成員,包括LuCOBL-3、LuCOBL- 4、LuCOBL-6~LuCOBL-16、LuCOBL-20~Lu COBL-24,蛋白質(zhì)長(zhǎng)度為375~616 aa,大部分成員的氨基酸數(shù)量在400多個(gè),外顯子數(shù)量為4~8個(gè),內(nèi)含子數(shù)量為3~7個(gè);其中有14個(gè)基因均含有6個(gè)外顯子,5個(gè)內(nèi)含子,說(shuō)明同一亞家族的基因具有相似的基因結(jié)構(gòu);COBRA-II包含LuCOBL-1、LuCOBL- 2、LuCOBL-5、LuCOBL-17~LuCOBL-19共6個(gè)基因,蛋白質(zhì)長(zhǎng)度范圍在662~709 aa,外顯子數(shù)量2~3個(gè);其中有4個(gè)基因均含有2個(gè)外顯子。從以上結(jié)果看出,亞麻COBRA-II亞家族的蛋白長(zhǎng)度明顯大于 ? COBRA-I,但外顯子數(shù)量卻比較少,2個(gè)亞家族具有明顯的差異。
對(duì)亞麻24個(gè)COBRA蛋白的理化性質(zhì)進(jìn)行分析表明,不同亞家族之間,同一亞家族不同成員之間均有差異(表1)。分子量為41 648.89~77 575.57 Da,等電點(diǎn)為5.61~9.12,跨膜結(jié)構(gòu)域?yàn)?~3,大部分蛋白含有2個(gè)跨膜結(jié)構(gòu)域。信號(hào)肽預(yù)測(cè)結(jié)果表明,除COBRA-I亞家族的LuCOBL-8、LuCOBL-16和LuCOBL-3無(wú)N-端信號(hào)肽外,其余蛋白質(zhì)均含有信號(hào)肽序列。COBRA-I亞家族除LuCOBL-9、LuCOBL-21、LuCOBL-22和LuCOBL-24外,其余成員都有GPI錨定位點(diǎn),而COBRA-II只有2個(gè)成員具有GPI錨定位點(diǎn)(LuCOBRA-1和LuCOBRA-17)。對(duì)COBRA蛋白進(jìn)行亞細(xì)胞定位預(yù)測(cè),所有基因都定位在細(xì)胞膜。
亞麻COBRA蛋白多重序列比對(duì)結(jié)果表明,所有亞麻COBRA蛋白均具有保守結(jié)構(gòu)域CCVS(圖2)。利用MEME對(duì)亞麻COBRA蛋白進(jìn)行Motif預(yù)測(cè),所有蛋白都具有Motif1、Motif3和Motif5,說(shuō)明這3個(gè)Motif為COBRA家族的特征性Motif。此外,有23個(gè)基因含有Motif2,有17~20個(gè)基因含有Motif4、Motif6、Motif15、 Motif20,說(shuō)明這些Motif在COBRA蛋白中也相當(dāng)保守(圖3)。
2.3 ? 亞麻COBRA基因家族的系統(tǒng)進(jìn)化分析
選擇模式植物擬南芥COBRA基因和亞麻COBRA基因,利用MEGA6.0以NJ法構(gòu)建系統(tǒng)進(jìn)化樹(shù)(圖4)。從進(jìn)化樹(shù)上可以看出,亞麻和擬南芥的COBRA基因都被聚類(lèi)在兩大支上,與單獨(dú)用亞麻蛋白序列構(gòu)建進(jìn)化樹(shù)的聚類(lèi)結(jié)果一致。在COBRA-I亞家族中,AtCOBL4與LuCOBL7和LuCOBL20,AtCOB與LuCOBL10、LuCOBL13和LuCOBL15,AtCOBL3與LuCOBL6、LuCOBL11和LuCOBL24進(jìn)化距離較近;在COBRA-I亞家族中,AtCOBL10、AtCOBL11與LuCOBL2和LuCOBL18,AtCOBL7、AtCOBL8、AtCOBL9與LuCOBL17和LuCOBL19遺傳距離比較相近。
3 ? 結(jié)論與討論
共鑒定到24個(gè)亞麻COBRA基因家族成員。對(duì)其基因及蛋白序列進(jìn)行分析發(fā)現(xiàn),所有蛋白都具有CCVS結(jié)構(gòu)域,有21個(gè)蛋白含有N-端信號(hào)肽,22個(gè)蛋白含有跨膜結(jié)構(gòu)域,16個(gè)蛋白具有GPI錨定位點(diǎn),這符合COBRA蛋白的主要特征[5 ]。LuCOBL2、LuCOBL8、 LuCOBL16等基因編碼蛋白雖缺少信號(hào)肽或GPI錨定位點(diǎn),但由于其含有COBRA家族特有結(jié)構(gòu)域COBRA(PF0 4833.1012),親緣關(guān)系與其他成員又比較接近,所以將其作為亞麻COBRA基因。從亞麻COBRA基因家族整體分析結(jié)果看,亞麻COBRA基因分為2個(gè)亞家族,與擬南芥分類(lèi)結(jié)果相同,同一亞家族的基因具有相似的基因結(jié)構(gòu),蛋白長(zhǎng)度,不同亞家族之間差異明顯。
目前對(duì)COBRA基因家族的研究在擬南芥、水稻、番茄、玉米、楊樹(shù)等植物中有過(guò)報(bào)道,也研究過(guò)其中一些成員的功能[8 - 12 ],亞麻COBRA基因家族的研究尚未有報(bào)道,因此本研究對(duì)亞麻COBRA基因家族的鑒定及一系列生物信息學(xué)分析,為進(jìn)一步挖掘各成員的功能奠定了基礎(chǔ)。然而,本研究只是初步鑒定了亞麻COBRA基因,對(duì)于無(wú)COBRA家族主要特征的個(gè)別成員需進(jìn)行更深入的分析驗(yàn)證,同時(shí)需要利用CRISPR/Cas9、過(guò)表達(dá)、反義RNA、遺傳轉(zhuǎn)化等技術(shù)對(duì)各成員的具體功能進(jìn)行研究,以便更好的利用COBRA基因進(jìn)行亞麻育種。
參考文獻(xiàn):
[1] ZOHARY D. MONOPHYLETIC V S. Polyphyletic origin of the crops on which agriculture was founded in the near east[J]. ?Gen. Resour. Crop Evol.,1999(46):133-142.
[2] 張運(yùn)暉,趙 ? 瑛,羅俊杰. ?甘肅胡麻產(chǎn)業(yè)發(fā)展淺議[J]. ?甘肅農(nóng)業(yè)科技,2013(7):54-55.
[3] GREEN A G,CHEN Y,SINGH S P,et al. ?Flax. In Compendium of transgenic crop plants[D]. ?Oxford:BlackwellPublishing Ltd,2008:199-226.
[4] WU J,ZHAO Q,ZHANG L,et al. QTL mapping of fiber-related traits based on a high-density genetic map in flax (Linum usitatissimum L.)[J]. ?Front. Plant. Sci.,2018(9):885.
[5] BORNER G H,LILLEY K S,STEVENS T J,et al. Identification of glycosyl phosphatidylinositol-anchored proteins in Arabidopsis,a proteomic and genomic analysis[J]. Plant Physiol,2003(132):568-577.
[6] BROWN, D M, ZEEF L A H, ELLIS ?J, et al. Identification of novel genes in Arabidopsis involved in secondary cell wall formation using expression profiling and reverse genetics[J]. ?Plant Cell, 2005(17):2281-2295.
[7] SATO K,SUZUKI R,NISHIKUBO N,et al. Isolation of a novel cell wall architecture mutant of rice with defective Arabidopsis COBL4 ortholog BC1 required for regulated deposition of secondary cell wall components[J]. ?Planta,2010(232):257-270.
[8] ROUDIER F,SCHINDELMAN G,DESALLE R,et al. The COBRA family of putative GPI-anchored proteins in Arabidopsis a new fellowship in expansion[J]. Plant Physiol.,2002(130):538-548.
[9] CAO Y,TANG X F, GIOVANNONI J,et al. Functional characterization of a tomato COBRA-like gene functioning in fruit development and ripening[J]. BMC Plant Biol.,2012(12):211.
[10] DAI X X,YOU C J,WANG L,et al. Molecular characterization,expression pattern,and function analysis of the OsBC1L family in rice[J]. ?Plant Mol. Biol.,2009(71):469-48119.
[11] BRADY S M,SONG S,DHUGGA K S,et al. Combining expression and comparative evolutionary analysis. The COBRA gene family[J]. ?Plant Physiol.,2007(143):172-187.
[12] YE X,KANG B G,OSBURN L D,et al. The COBRA gene family in populus and gene expression invegetative organs and in response to hormones and environmental stresses[J]. ? Plant Growth Regul.,2009(58):211-223.
(本文責(zé)編:陳 ? ?珩)