鞏元勇 趙麗華 閆飛 朱麗紅
摘 要:? GeBP轉(zhuǎn)錄因子調(diào)控植物表皮毛的生長發(fā)育,并且參與控制植物葉片的發(fā)育。該文利用生物信息學(xué)方法,在大豆全基因組范圍內(nèi)搜索GeBP基因家族,并從氨基酸理化性質(zhì)、基因結(jié)構(gòu)、染色體的物理分布、系統(tǒng)進(jìn)化、序列比對(duì)、功能結(jié)構(gòu)域、組織表達(dá)情況等基本特征方面對(duì)GmGeBP基因家族進(jìn)行分析。結(jié)果表明:(1)共獲得9個(gè)GmGeBP轉(zhuǎn)錄因子基因家族成員,其中僅2個(gè)基因含有內(nèi)含子,且都只有1個(gè)內(nèi)含子,表明該家族成員基因構(gòu)造比較簡單但穩(wěn)定。(2)GmGeBP編碼的蛋白分子量為39.65~49.24 kD,理論等電點(diǎn)為4.65~9.08;這些成員基本上都是酸性氨基酸,屬于親水性、不穩(wěn)定蛋白。(3)這9個(gè)基因不均勻的分布于7條染色體上,10和 20 號(hào)染色體上分別分布2 個(gè) GeBP基因,3、5、13、15、19號(hào)染色體上各分布 1 個(gè)基因。(4)系統(tǒng)進(jìn)化分析表明,大豆與擬南芥對(duì)應(yīng)的GeBP成員親緣關(guān)系較近,分別聚類到4個(gè)分支,而與水稻的距離較遠(yuǎn)。(5)結(jié)構(gòu)域分析表明,9個(gè)GmGeBP成員都包含DUF573結(jié)構(gòu)域,推測(cè)該部分在GeBP轉(zhuǎn)錄因子中很可能是與靶標(biāo)基因順式作用元件互作的結(jié)構(gòu)域。(6)通過分析大豆GmGeBP轉(zhuǎn)錄因子基因家族的組織表達(dá),發(fā)現(xiàn)不同基因在大豆不同組織的表達(dá)量不同,具有一定的特異性。該文對(duì)大豆GeBP轉(zhuǎn)錄因子基因家族的分析和鑒定為進(jìn)一步研究大豆表皮毛發(fā)育的分子作用提供了理論基礎(chǔ)。
關(guān)鍵詞: 大豆, GeBP轉(zhuǎn)錄因子, 生物信息, 組織表達(dá)
中圖分類號(hào):? Q943
文獻(xiàn)標(biāo)識(shí)碼:? A
文章編號(hào):? 1000-3142(2022)02-0294-10
Bioinformatics analysis of GeBP transcription
factor gene family in Glycin max
GONG Yuanyong*, ZHAO Lihua, YAN Fei, ZHU Lihong
( Biological and Chemical Engineering College (Agricultural College), Panzhihua University, Panzhihua 617000, Sichuan, China )
Abstract:? It has been clarified that GeBP transcription factor regulates the growth and development of plant epidermal hair and participates in the control of plant leaf development. The bioinformatics methods were used to identify the GeBP gene family in the whole Glycin max(soybean) genome, and from physicochemical properties of amino acids, as well as gene structure, physical distribution of chromosomes, phylogenetic tree, and multiple sequence comparison, the functional domain, tissues expression and other basic characteristics of GmGeBP gene family were analyzed. The results were as follows: (1) A total of nine members of GmGeBP transcription factor gene family were identified, of which only two genes contained introns and all had only one intron, indicating that the gene structure of the family members is relatively simple but stable. (2) The molecular weights of GmGeBPs were 39.65-49.24 kD, and the theoretical isoelectric point was 4.65-9.08; these members were basically acidic amino acids, which were hydrophilic and unstable proteins. (3) The chromosome physical distribution showed that nine genes were unevenly distributed on seven chromosomes, two GeBP genes on chromosome 10 and 20 respectively, and one gene on chromosome 3, 5, 13, 15 and 19, respectively. (4) The phylogenetic analysis showed that GeBP members of Glycin max and Arabidopsis thaliana were closely related, clustered into four branches respectively, but far away from Oryza sativa. (5) The analysis of domains showed that all the nine GmGeBP members contained DUF573 domain, which was probably the domain interacting with cis-acting elements of target genes in GeBP transcription factors. (6) By analyzing the expression of GmGeBP transcription factor gene family, we found that the expressions of different genes in different tissues were different, with a certain specificity. The analysis and identification of GmGeBP transcription factor gene family provide the theoretical basis for further studying the molecular role of Glycin max epidermal development.
Key words:? Glycin max, GeBP transcription factor, bioinformatics, tissue expression
表皮毛廣泛分布于陸地植物的葉片、莖稈以及花萼等地上部器官的表面,是植物表皮細(xì)胞分化形成的一種特殊的細(xì)胞形態(tài)。表皮毛是植物的第一道保護(hù)屏障,通過調(diào)節(jié)水分的蒸騰作用,減緩葉片的熱負(fù)荷,增強(qiáng)對(duì)冷凍或紫外線的耐受性,增強(qiáng)植物抵御昆蟲捕食的防御能力。轉(zhuǎn)錄因子是生物體生長發(fā)育過程中一類重要的調(diào)節(jié)因子,高等生物體因其機(jī)體的復(fù)雜性需要更多的轉(zhuǎn)錄因子參與。GeBP(GLABROUS1 enhancer binding protein)是一類植物特有的轉(zhuǎn)錄因子,擬南芥GeBP可以通過與GL1(GLABROUS1)基因的互作調(diào)控來控制表皮毛的發(fā)生(普利等,2003)。GeBP包含中央DNA結(jié)合區(qū)、bZIP轉(zhuǎn)錄因子保守域和C末端保守區(qū),然而這個(gè)bZIP轉(zhuǎn)錄因子保守域有別于經(jīng)典的bZIP轉(zhuǎn)錄因子保守域,且真正發(fā)揮功能的是中央DNA結(jié)合區(qū)和C末端保守區(qū),所以GeBP是植物中一類新的轉(zhuǎn)錄因子蛋白(Curaba et al., 2003;Chevalier et al., 2008)。當(dāng)前只在擬南芥(Arabidopsis thaliana)、水稻(Oryza sativa)、番茄(Solanum lycopersicum)和毛竹(Phyllostachys edulis)中有關(guān)于GeBP轉(zhuǎn)錄因子基因家族的報(bào)道,這四種植物GeBP基因家族成員分別是22個(gè)(Chevalier et al., 2008)、15個(gè)(石蕾,2013)、10個(gè)(陳凱等,2019)和16個(gè)(單雪萌等,2020),關(guān)于GeBP轉(zhuǎn)錄因子具體功能的報(bào)道還很少。
在植物中,轉(zhuǎn)錄因子通常參與激素途徑與激素互作來調(diào)控植物的發(fā)育。GeBP蛋白可與GL1基因順式調(diào)控元件結(jié)合調(diào)控該基因的轉(zhuǎn)錄,GL1基因?qū)儆趍yb基因,參與決定表皮細(xì)胞且被赤霉素和細(xì)胞分裂素調(diào)控(Gan et al., 2007);GeBP基因的表達(dá)受到KNOX家族轉(zhuǎn)錄因子BP(BREVIPEDICELLUS)基因的正向調(diào)控(Curaba et al., 2004),KNOX在莖端分生組織正向調(diào)控細(xì)胞分裂素途徑(Jasinski et al., 2005),由此推測(cè)GeBP可能通過調(diào)控赤霉素和細(xì)胞分裂素途徑來控制表皮毛的發(fā)生(Chevalier et al., 2008)。
Ray等(2011)研究發(fā)現(xiàn)C2H2、C2C2、C3H、LIM、PHD、WRKY、ZF-HD和ZIM等鋅指類轉(zhuǎn)錄因子成員,以及GeBP、jumonji、MBF1和ULT等轉(zhuǎn)錄因子家族在缺水條件下出現(xiàn)表達(dá)差異。一般認(rèn)為MBF1、jumonji、ULT和GeBP這四類轉(zhuǎn)錄因子家族主要參與植物發(fā)育過程和植物激素反應(yīng)(Curaba et al., 2003;Noh et al., 2004;Kenichi et al., 2004;Carles et al., 2005;Chevalier et al., 2008),通常不參與脅迫條件下的應(yīng)激反應(yīng)性,然而在水分虧缺脅迫條件下都表現(xiàn)為表達(dá)上調(diào),表明GeBP等轉(zhuǎn)錄因子在植物對(duì)干旱逆境的反應(yīng)中發(fā)揮一定的作用。新近研究發(fā)現(xiàn),LiGeBP、LiMYB、LibZIP、LieBp-2和LiERF五類轉(zhuǎn)錄因子可能是薰衣草中單萜合酶的激活劑,LiGeBP可能參與控制薰衣草中單萜合酶的合成(Sarker et al., 2019)。
大豆(Glycin max)起源于中國,隨著人類活動(dòng)范圍的擴(kuò)大已經(jīng)廣泛種植于世界各地,并成為世界性的重要經(jīng)濟(jì)作物,為人類提供了主要的植物油和植物蛋白,同時(shí)也是動(dòng)物飼料蛋白質(zhì)的主要來源。大豆表皮毛同其他植物的一樣,也是典型的單細(xì)胞結(jié)構(gòu),不存在分支。研究證實(shí),大豆表皮毛的密度同抗蟲和抗旱等性狀密切相關(guān),但關(guān)于大豆表皮毛發(fā)育的分子基礎(chǔ)研究還鮮有報(bào)道。大豆基因組測(cè)序工作已于2010年完成并公布(Schmutz et al., 2010),這為大豆相關(guān)基因家族及功能基因在基因組水平上的探索研究提供了可能。大豆WRKY、ERF、Dof等轉(zhuǎn)錄因子基因家族在全基因組層面的分析報(bào)道也越來越多(Yu et al., 2016;Song et al., 2016;翟瑩等,2016,2019;劉蓓等,2020),但是還未見有關(guān)于大豆GeBP轉(zhuǎn)錄因子基因家族的研究報(bào)道。本研究通過生物信息學(xué)的方法,從基因的核苷酸序列長度和氨基酸序列的基本理化性質(zhì)、基因在染色體的物理定位、基因結(jié)構(gòu)、系統(tǒng)進(jìn)化樹、序列對(duì)比、功能結(jié)構(gòu)域分布、基因在不同組織的表達(dá)情況等基本特征方面對(duì)大豆GeBP轉(zhuǎn)錄因子基因家族進(jìn)行全面預(yù)測(cè)和分析,為進(jìn)一步深入探究大豆GeBP轉(zhuǎn)錄因子基因家族的生理生化功能提供理論依據(jù)。
1 材料與方法
1.1? 材料
從植物轉(zhuǎn)錄因子數(shù)據(jù)庫PlantTFDB(http://planttfdb.cbi.pku.edu.cn/)搜索獲得擬南芥(Arabidopsis thaliana)、水稻(Oryza sativa)和大豆(Glycine max)這3個(gè)物種GeBP轉(zhuǎn)錄因子基因家族共40個(gè)成員的基因座位置信息,然后從JGI的Phytozome (https://phytozome.jgi.doe.gov/pz/portal.html)搜索獲得水稻、大豆和擬南芥的GeBP轉(zhuǎn)錄因子基因的編碼區(qū)及CDS序列和氨基酸序列,同時(shí)獲得大豆GeBP轉(zhuǎn)錄因子基因家族在不同組織部位表達(dá)的FPKM(Fragments Per Kilobase of transcript per Million fragments mapped)值。
1.2 方法
1.2.1大豆GeBP基因家族基本信息獲取
利用DNASTAR Lasergene軟件中的EditSeq分析獲得大豆GeBP基因的編碼區(qū)和CDS序列長度,用Expasy(https://web.expasy.org/protparam/)在線分析大豆GeBP的氨基酸序列,獲得氨基酸殘基長度、分子質(zhì)量、理論等電點(diǎn)、不穩(wěn)定系數(shù)、親水性指數(shù)等基因基本信息。
1.2.2 大豆GeBP基因染色體定位 大豆GeBP基因在染色體的位置信息來自Phytozome大豆基因組數(shù)據(jù)庫,從NCBI的Genome Data Viewer(https://www.ncbi.nlm.nih.gov/genome/gdv/)獲得大豆每條染色體的總長度,根據(jù)這些信息用maplnspect軟件繪制大豆GeBP基因在染色體上的物理分布圖。
1.2.3 大豆GeBP基因的生物信息學(xué)分析 用GSDS9(Gene Structure Dispely Server,http://gsds.cbi.pku.edu.cn/)(Hu et al., 2015)在線繪制大豆和擬南芥GeBP基因結(jié)構(gòu)圖;用MEGA 7軟件采用鄰接法NJ(Neighbor-Joining)構(gòu)建大豆、擬南芥和水稻GeBP基因家族氨基酸序列的系統(tǒng)進(jìn)化樹(Kumar et al., 2018),校驗(yàn)參數(shù)Bootstrap=1 000;運(yùn)用DNAMAN軟件對(duì)大豆GeBP基因家族的氨基酸序列進(jìn)行多重序列比對(duì);用Lasergene軟件的MegAlign分析大豆GeBP基因家族氨基酸序列間的相似性;用Pfam 32.0(http://pfam.xfam.org/)在線搜尋鑒定大豆GeBP蛋白序列功能結(jié)構(gòu)域(Domain)的存在情況。
1.2.4 大豆GeBP基因在不同組織的表達(dá)
用Heml軟件(http://hemi.biocuckoo.org/down.php)繪制大豆GeBP基因在花(flower)、葉(leaves)、根瘤(nodules)、莢果(pod)、根(root)、根毛(root hair)、種子(seed)、莖尖分生組織(shoot apical meristem)、莖(stem)等9個(gè)不同組織的表達(dá)熱圖。
2 結(jié)果與分析
2.1 大豆GeBP基因的基本信息及染色體定位
通過在植物轉(zhuǎn)錄因子數(shù)據(jù)庫PlantTFDB搜索獲得大豆轉(zhuǎn)錄因子GeBP基因成員,共獲得9個(gè)大豆無表皮毛增強(qiáng)子結(jié)合蛋白基因,分別命名為GmGeBP1-9(表1)。 在Phytozome大豆基因組數(shù)據(jù)庫搜索獲得這9個(gè)基因所對(duì)應(yīng)的編碼區(qū)序列、CDS序列、氨基酸序列,并用Expasy在線分析氨基酸序列獲得蛋白質(zhì)序列基本的理化性質(zhì)信息。
如圖1所示,GmGeBP轉(zhuǎn)錄因子家族的9個(gè)成員分別分布在7條染色體上,其中10號(hào)染色體上有 GmGeBP3和GmGeBP4兩個(gè)GeBP基因,20號(hào)染色體上有 GmGeBP8和GmGeBP9兩個(gè)GeBP基因,其余染色體各有一個(gè)GeBP基因。有7個(gè)大豆GeBP基因的編碼區(qū)長度和CDS長度一樣,表明這些GeBP基因結(jié)構(gòu)中不含有內(nèi)含子;只有GmGeBP2和GmGeBP4這兩個(gè)基因的編碼區(qū)長度和CDS長度不一樣, 說明這兩個(gè)基因在基因結(jié)構(gòu)上包含內(nèi)含子。大豆GeBP基因翻譯后蛋白質(zhì)的長度在353~448 個(gè)氨基酸之間。其中5個(gè)成員蛋白質(zhì)長度在300~400 個(gè)氨基酸之間;有4個(gè)家族成員的長度在400~500 個(gè)氨基酸之間。其中:GmGeBP5的氨基酸長度最長,為448 aa,其分子質(zhì)量也是最大,為49.24 kD;GmGeBP9的氨基酸長度最短,為353 aa,其分子質(zhì)量也是最小,為39.65 kD。這9 個(gè) GeBP蛋白的理論等電點(diǎn)也存在一定的差異,其理論等電點(diǎn)值在4.65~9.08之間,只有 GmGeBP2的理論等電點(diǎn)為9.08,是堿性氨基酸,其余8個(gè)GeBP蛋白理論等電點(diǎn)均小于7,為酸性氨基酸。蛋白質(zhì)的不穩(wěn)定系數(shù)是用來分析該蛋白是否是穩(wěn)定蛋白,如果不穩(wěn)定系數(shù)大于40,則表明是不穩(wěn)定蛋白;反之,如果不穩(wěn)定系數(shù)小于40,則表明是穩(wěn)定蛋白,GmGeBP所有的不穩(wěn)定系數(shù)都大于40,說明這些蛋白都是不穩(wěn)定蛋白。親水性指數(shù)大于+0.5的為疏水性蛋白,親水性指數(shù)若小于-0.5的則為親水性蛋白,如果介于-0.5~+0.5之間則為兩性蛋白,所有GmGeBP蛋白的親水性指數(shù)都小于-0.5,說明這些蛋白都是親水性蛋白。
大豆共有20對(duì)40條染色體,基因在染色體上的分布用1-20號(hào)染色體來表示。大豆GeBP基因家族共有9個(gè)成員,不均勻的分布在Chr3、Chr5、Chr10、Chr13、Chr15、Chr19和Chr20 7條染色體上。其中,在Chr10和Chr20上各分布有兩個(gè)GeBP基因,從后面的序列一致性及進(jìn)化樹分析結(jié)果可見,盡管GmGeBP3和GmGeBP4、GmGeBP8和GmGeBP9這兩組基因在物理位置上距離很近,但是它們之間在進(jìn)化上不存在復(fù)制關(guān)系,是獨(dú)立進(jìn)化的。由圖1可知,這些基因在染色體上相對(duì)獨(dú)立存在,在染色體上沒有以基因簇的形式存在。
2.2 GeBP基因結(jié)構(gòu)分析
利用大豆和擬南芥GeBP基因家族成員的編碼區(qū)序列和CDS序列通過GSDS在線構(gòu)建基因結(jié)構(gòu)圖,用圖像直觀地研究GeBP 基因的結(jié)構(gòu)情況。如圖2所示,大豆中的9條GeBP 基因有7個(gè)不包含內(nèi)含子,另外兩個(gè)有內(nèi)含子的基因也只包含一個(gè)內(nèi)含子。在進(jìn)行基因克隆研究基因功能的時(shí)候,沒有內(nèi)含子的基因可以直接通過提取的DNA為模板來獲得基因序列,而沒有必要提取RNA之后再反轉(zhuǎn)錄作為擴(kuò)增模板。
本研究發(fā)現(xiàn)擬南芥22個(gè)GeBP基因有16個(gè)成員也沒有內(nèi)含子,有6個(gè)基因包含內(nèi)含子,其中有4個(gè)基因均只含有1個(gè)內(nèi)含子,1個(gè)基因含有3個(gè)內(nèi)含子,1個(gè)基因含有4個(gè)內(nèi)含子(圖3)。總體來看,GeBP基因的基因結(jié)構(gòu)在不同植物上都表現(xiàn)的比較穩(wěn)定,因?yàn)闆]有內(nèi)含子存在或存在很少的內(nèi)含子,在轉(zhuǎn)錄時(shí)不易形成可變剪接體。
2.3 構(gòu)建GeBP基因家族進(jìn)化樹
為進(jìn)一步了解GeBP 基因家族系統(tǒng)進(jìn)化關(guān)系,本研究選取 20 個(gè)擬南芥 GeBP 基因、11個(gè)水稻GeBP基因、9個(gè)大豆GeBP基因3種植物的GeBP 基因進(jìn)行比對(duì)分析,利用MEGA 7的鄰接法構(gòu)建這40個(gè)GeBP蛋白序列的進(jìn)化樹。其中,為了更加方便辨識(shí),在圖形處理上,將大豆基因標(biāo)注黑色圓形,擬南芥基因標(biāo)注白色圓形,水稻基因標(biāo)注白色方框。如圖4所示,進(jìn)化樹可以分為4個(gè)大的分支,分別含有 14 個(gè)、10 個(gè)、6 個(gè)和 10 個(gè) GeBP 基因。在第一個(gè)分支,三個(gè)物種的基因都有;第二個(gè)分支只包含擬南芥的基因;第三個(gè)分支基因數(shù)量最少,但是包含有擬南芥和大豆的基因;第四個(gè)分支以水稻基因?yàn)橹?,僅有一個(gè)來源擬南芥的基因??梢?,因大豆和擬南芥同屬雙子葉植物的緣故,這兩個(gè)物種的基因在進(jìn)化關(guān)系上要更近一些。
從單個(gè)基因的進(jìn)化關(guān)系來看,相同物種間的基因進(jìn)化關(guān)系最近,如大豆的 GmGeBP1和GmGeBP7,GmGeBP3和GmGeBP9,GmGeBP4和GmGeBP8,擬南芥的AtGeBP10和AtGeBP21,AtGeBP3和AtGeBP6,AtGeBP8和AtGeBP15,水稻的OsGeBP6和OsGeBP9,OsGeBP3和OsGeBP5,OsGeBP4和OsGeBP8等。表明GeBP基因在物種間進(jìn)化上比較保守。
2.4 大豆GeBP基因家族的序列比對(duì)和結(jié)構(gòu)域分析
進(jìn)行序列比對(duì)的目的是從核酸以及氨基酸的層次來分析序列的相同點(diǎn)和不同點(diǎn),進(jìn)而推測(cè)它們的結(jié)構(gòu)、功能以及進(jìn)化上的聯(lián)系。大豆 GeBP 家族成員含有大約 131 個(gè)氨基酸組成的功能結(jié)構(gòu)域,功能結(jié)構(gòu)域含有大量的堿性氨基酸:精氨酸(R)和賴氨酸(K)。不同物種間GeBP蛋白的氨基酸序列的一致性比較低(結(jié)果沒有展示)。大豆的GeBP蛋白質(zhì)氨基酸多重序列比對(duì)的結(jié)果表明,大豆本身的GeBP蛋白質(zhì)氨基酸序列的一致性也不是很高,所有成員共有的氨基酸序列非常少(圖5)。
通過分析大豆GeBP基因家族成員之間的氨基酸序列的一致性發(fā)現(xiàn),盡管整體序列一致性比較低,但有些成員之間的一致性較高:GmGeBP1和GmGeBP7的一致性最高(90.2%),其次是GmGeBP3和GmGeBP9(88.5%),然后是GmGeBP4和GmGeBP8(87.4%),最后是GmGeBP5和GmGeBP6(86.6%),這些都是一致性在85%以上的序列,同進(jìn)化樹的分析結(jié)果也相似。氨基酸序列一致性高,表明在功能上這些基因也可能類似或互補(bǔ)。
如圖6所示,大豆所有的9個(gè)GmGeBP成員都包含DUF573結(jié)構(gòu)域,屬于DUF573超家族。盡管標(biāo)注為未知功能結(jié)構(gòu)域,但是可以推測(cè)該部分在GeBP轉(zhuǎn)錄因子氨基酸序列中很可能與靶標(biāo)基因順式作用元件互作的結(jié)構(gòu)域,但是不同GmGeBP中DUF573功能結(jié)構(gòu)域所處的位置存在一定的差異,這可能是導(dǎo)致不同GmGeBP功能差異的原因之一。
2.5 大豆GeBP基因在不同組織的表達(dá)分析
從總體來看,大豆GmGeBP家族成員在所有組織中都有表達(dá),其中GmGeBP4和GmGeBP8在各個(gè)組織中的表達(dá)量相對(duì)其他基因都普遍偏低(圖7)。從單個(gè)基因來看,GmGeBP1在所有組織中都表達(dá),在花和種子中表達(dá)量最高,在葉、結(jié)節(jié)、莢果、根、根毛、莖尖分生組織、莖表達(dá)量次之;GmGeBP2在葉、結(jié)節(jié)、莢果、根毛、種子、莖尖分生組織、莖的表達(dá)比在花和根中表達(dá)量更高;GmGeBP3的表達(dá)主要集中在花器官中,在葉、結(jié)節(jié)、莢果、根、根毛、種子的表達(dá)中次之,在莖尖分生組織、莖的表達(dá)量更少;GmGeBP4在各組織中表達(dá)量較低;GmGeBP5在花、葉、結(jié)節(jié)、莢果、根、根毛、種子、莖尖分生組織、莖中均有表達(dá);GmGeBP6在花、葉、結(jié)節(jié)、莢果、根、根毛、種子、莖尖分生組織、莖中均有表達(dá),在葉和根毛表達(dá)量最高;GmGeBP7在花、葉、結(jié)節(jié)、莢果、根、根毛、種子、莖尖分生組織、莖中均有表達(dá),在花、葉、莢果、種子中表達(dá)最高;GmGeBP8在花中表達(dá)量最高,在其他組織表達(dá)量低;GmGeBP9在花、葉、根組織中表達(dá)量高,在花中表達(dá)量最高。
數(shù)據(jù)分析結(jié)果表明,同一基因在不同位置的表達(dá)量不一樣,同一位置表達(dá)所對(duì)應(yīng)的基因表達(dá)量也有差異,對(duì)此分析得到GmGeBP家族成員的表達(dá)具有一定的特異性,且各成員之間不盡相同。因此,一定程度上基因的功能取決基因在不同時(shí)期不同組織和器官的表達(dá)情況。
3 討論與結(jié)論
對(duì)植物轉(zhuǎn)錄因子的研究,似乎更偏向于參與逆境脅迫反應(yīng)途徑相關(guān)的轉(zhuǎn)錄因子。以WRKY轉(zhuǎn)錄因子為例,WRKY轉(zhuǎn)錄因子是植物體特有一類成員數(shù)量龐大的轉(zhuǎn)錄因子家族,廣泛地參與到植物對(duì)多種生物和非生物脅迫的反應(yīng)過程(Jiang et al., 2017),是當(dāng)前研究最熱的植物轉(zhuǎn)錄因子之一。2020年7月20日在中國知網(wǎng)(https://www.cnki.net/)搜索篇名含有WRKY的文章,共找到1 512條結(jié)果,不僅有數(shù)量眾多的對(duì)不同植物種類WRKY轉(zhuǎn)錄因子基因家族的全基因組鑒定和分析,還有很多對(duì)單個(gè)WRKY基因相關(guān)功能的研究。反觀對(duì)GeBP的搜索,只找到7篇文章,植物只涉及擬南芥、水稻、番茄和毛竹4種,盡管最早關(guān)于GeBP基因研究的文章發(fā)表于2003年(Curaba et al., 2003),但是這十幾年來對(duì)GeBP轉(zhuǎn)錄因子的研究還是非常緩慢,GeBP基因的很多功能還不明確。
從已經(jīng)報(bào)道的結(jié)果來看,植物GeBP轉(zhuǎn)錄因子基因家族成員數(shù)量不是很多,擬南芥包含的GeBP成員最多,有22個(gè)(Chevalier et al., 2008);毛竹含有16個(gè)成員(單雪萌等,2020);水稻含有15個(gè)成員(石蕾,2013);番茄含有10個(gè)成員(陳凱等,2019);本文鑒定的大豆GeBP成員更少,只有9個(gè)。GeBP轉(zhuǎn)錄因子家族成員基因結(jié)構(gòu)相對(duì)簡單,不含有內(nèi)含子的基因所占比例很高。毛竹有13個(gè)成員沒有內(nèi)含子,這3個(gè)有內(nèi)含子的基因,有2個(gè)只有1個(gè)內(nèi)含子(單雪萌等,2020);番茄有8個(gè)成員沒有內(nèi)含子,2個(gè)基因有內(nèi)含子,其中1個(gè)基因只有1個(gè)內(nèi)含子(單雪萌等,2020);擬南芥有16個(gè)成員沒有內(nèi)含子,6個(gè)有內(nèi)含子的基因有4個(gè)只有1個(gè)內(nèi)含子;大豆有7個(gè)成員沒有內(nèi)含子,剩下有內(nèi)含子的2個(gè)基因都只有1個(gè)內(nèi)含子。由此可見,GeBP轉(zhuǎn)錄因子基因家族由于多數(shù)成員不含內(nèi)含子,在轉(zhuǎn)錄時(shí)減少了出現(xiàn)可變剪接體的幾率,基因在進(jìn)化時(shí)就更加穩(wěn)定和保守。
在進(jìn)化關(guān)系上,本文的研究結(jié)果同其他研究類似,單-雙子葉植物之間各自的進(jìn)化關(guān)系最近,同時(shí)都有一個(gè)分支為雙子葉植物所特有,且相同物種間的家族成員的進(jìn)化關(guān)系要高于不同物種間的進(jìn)化關(guān)系(陳凱等,2019;單雪萌等,2020),這些都表明GeBP轉(zhuǎn)錄因子基因家族在進(jìn)化上的保守性。所有報(bào)道的和本文的GeBP轉(zhuǎn)錄因子蛋白都有DUF573功能結(jié)構(gòu)域(陳凱等,2019;單雪萌等,2020),盡管該結(jié)構(gòu)域的功能未知,推測(cè)該功能域應(yīng)該位于轉(zhuǎn)錄因子的中央DNA結(jié)合區(qū),可與靶基因的順式作用元件結(jié)合調(diào)控基因的表達(dá),但因?yàn)镈UF573功能結(jié)構(gòu)域在轉(zhuǎn)錄因子上的位置不同,所以,在調(diào)控靶基因的表達(dá)上也存在差異。
基因的表達(dá)模式同基因的功能密切相關(guān)。總體來看,不同物種GeBP轉(zhuǎn)錄因子基因在各自物種不同組織和不同發(fā)育時(shí)期都有表達(dá),很多只是表達(dá)強(qiáng)弱的差異(陳凱等,2019;單雪萌等,2020),表明GeBP轉(zhuǎn)錄因子基因在不同組織和不同發(fā)育時(shí)期都發(fā)揮有重要作用。對(duì)毛竹16個(gè)PeGeBPs基因的表達(dá)研究發(fā)現(xiàn),其中有12個(gè)PeGeBPs基因在帶有表皮毛的葉、籜、籜片以及纖毛中的表達(dá)量高于無表皮毛的筍,表明它們?cè)诒砥っ男纬芍袘?yīng)該發(fā)揮了主要功能(單雪萌等,2020)。表皮毛在大豆植株上的分布位于葉片、莖稈、豆莢和花萼等地上部器官表面,結(jié)合GeBP轉(zhuǎn)錄因子基因調(diào)控表皮毛生長發(fā)育的功能,GmGeBP7和GmGeBP6是研究大豆調(diào)控表皮毛生長發(fā)育的最佳候選基因。
本研究通過生物信息學(xué)的方法,從植物轉(zhuǎn)錄因子數(shù)據(jù)庫和大豆基因組搜尋獲得9個(gè)GeBP轉(zhuǎn)錄因子基因,隨后對(duì)家族成員基因的核苷酸序列長度和氨基酸序列的基本理化性質(zhì)、基因在染色體的物理定位、基因結(jié)構(gòu)、系統(tǒng)進(jìn)化樹、序列對(duì)比、功能結(jié)構(gòu)域分布、基因在不同組織的表達(dá)模式進(jìn)行綜合的預(yù)測(cè)和分析,研究結(jié)果將為進(jìn)一步深入探究大豆GeBP轉(zhuǎn)錄因子基因的功能機(jī)制提供理論依據(jù)和參考價(jià)值。
參考文獻(xiàn):
CARLES CC, CHOFFNES-INADA D, REVILLE K, et al., 2008. ULTRAPETALA1 encodes a SAND domain putative transcriptional regulator that controls shoot and floral meristem activity in Arabidopsis [J]. Development, 132(5): 897-911.
CHEN K, LIU JQ, SONG HH, et al., 2017. Identification, evolution and expression analysis of GeBP transcription factors family in tomato [J]. Mol Plant Breed, 15(9): 3438-3445.? [陳凱, 劉金秋, 宋?;郏?等, 2017. 番茄GeBP轉(zhuǎn)錄因子家族的鑒定及其進(jìn)化和表達(dá)分析 [J]. 分子植物育種, 15(9): 3438-3445.]
CHEVALIER F, PERAZZA D, LAPORTE F, et al., 2008. GeBP and GeBP-like proteins are noncanonical leucine-zipper transcription factors that regulate cytokinin response in arabidopsis [J]. Plant Physiol, 146(3): 1142-1154.
CURABA J, HERZOG M, VACHON G, et al., 2003. GeBP, the first member of a new gene family in Arabidopsis, encodes a nuclear protein with DNA-binding activity and is regulated by KNAT1 [J]. Plant J, 33(2): 305-317.
CURABA J, MORITZT, BLERVAQUE R, et al., 2004. AtGA3ox2, a key gene responsible for bioactive gibberellin biosynthesis, is regulated during embryogenesis by LEAFY COTYLEDON2 and FUSCA3 in Arabidopsis [J]. Plant Physiol, 136(3): 3660-3669.
HU B, JIN J, GUO AY, et al., 2015. GSDS 2.0: an upgraded gene feature visualization server [J]. Bioinformatics, 31(8): 1296-1297.
JASINSKI S, PIAZZA P, CRAFT J, et al., 2005. KNOX action in Arabidopsis is mediated by coordinate regulation of cytokinin and gibberellin activities [J]. Curr Biol, 15(17): 1560-1565.
JIANG JJ, MA SH, YE NH, et al., 2017. WRKY transcription factors in plant responses to stresses [J]. J Integr Plant Biol, 59(2): 86-101.
KUMAR S, STECHER G, LI M, et al., 2018. MEGA X: molecular evolutionary genetics analysis across computing platforms [J]. Mol Biol Evol, 35(6): 1547-1549.
LIU B, QIU S, HE JQ, et al., 2020. Bioinformatics analysis and expression of eight Dof transcription factors in soybean under drought stress [J]. Soybean Sci, 39(3): 377-383.? [劉蓓, 邱爽,? 何佳琦, 等, 2020. 8個(gè)大豆Dof轉(zhuǎn)錄因子的生物信息學(xué)分析及干旱誘導(dǎo)表達(dá) [J]. 大豆科學(xué), 39(3): 377-383.]
NOH B, LEE SH, KIM HJ, et al., 2004. Divergent roles of a pair of homologous jumonji/zinc-finger-class transcription factor proteins in the regulation of Arabidopsis flowering time [J]. Plant Cell, 16(10): 2601-2613.
PU L, SUO JF, XUE YB, 2003. Molecular control of plant trichome development [J]. Acta Genet Sin, 30(11): 1078-1084.? [普莉, 索金鳳, 薛勇彪, 2003. 植物表皮毛發(fā)育的分子遺傳控制 [J]. 遺傳學(xué)報(bào), 30 (11): 1078-1084.]
RAY S, DANSANA PK, GIRI J, et al., 2011. Modulation of transcription factor and metabolic pathway genes in response to water-deficit stress in rice [J]. Funct Integr Genomics, 11(1): 157-178.
SARKER LS, ADAL AM, MAHMOUD SS, 2019. Diverse transcription factors control monoterpene synthase expression in lavender (Lavandula) [J]. Planta, 251(1): 1-5.
SHAN XM, YANG KB, SHI JJ,et al., 2020.Genomewide identification and expression analysis of GeBP transcription factor gene family in moso bamboo [J]. J Nanjing For Univ (Nat Sci Ed), 44(3): 41-48. [單雪萌, 楊克彬, 史晶晶, 等, 2020. 毛竹GeBP轉(zhuǎn)錄因子家族的全基因組鑒定和表達(dá)分析 [J]. 南京林業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版), 44(3):41-48.]
SHI L, 2013. Preliminary functional analysis of the GeBP gene family in rice [D]. Wuhan: Huazhong Agricultural University.? [石蕾, 2013. 水稻 GeBP家族基因的功能初探 [D]. 武漢:華中農(nóng)業(yè)大學(xué).]
SONG H, WANG PF, HOU L, et al., 2016. Global Analysis of WRKY genes and their response to dehydration and salt stress in soybean [J]. Front Plant Sci, 7: 9.
KENICHIT, TOSHIHIRO T, SUSUMU H, et al., 2004. Three Arabidopsis MBF1 homologs with distinct expression profiles play roles as transcriptional co-activators [J]. Plant Cell Physiol, 45(2): 225-231
YU YC, WANG N, HU RB, et al., 2016. Genome-wide identification of soybean WRKY transcription factors in response to salt stress [J]. Springerplus, 5(1): 920.
ZHAI Y, QIU S, ZHANG J, et al., 2019. Bioinformatics and expression analysis of three Dof transcription factors in soybean [J]. Acta Agric Boreal-Sin, 34(6): 14-19.? [翟瑩, 邱爽, 張軍, 等, 2019. 大豆中3個(gè)Dof轉(zhuǎn)錄因子的生物信息學(xué)及表達(dá)分析 [J]. 華北農(nóng)學(xué)報(bào), 34(6): 14-19.]
ZHAI Y, ZHANG J, ZHAO Y, et al., 2016. Bioinformatics and expression analysis of 5 newfound ERF genes in soybean [J]. Acta Agric Zhejiang, 28(10): 1644-1649.? [翟瑩, 張軍, 趙艷, 等, 2016. 大豆5個(gè)新發(fā)現(xiàn)ERF基因的生物信息學(xué)及表達(dá)分析 [J]. 浙江農(nóng)業(yè)學(xué)報(bào), 28(10): 1644-1649.]
(責(zé)任編輯 李 莉)
收稿日期:? 2020-11-30
基金項(xiàng)目:? 國家自然科學(xué)基金(31301682);金沙江干熱河谷生態(tài)修復(fù)與治理創(chuàng)新研究團(tuán)隊(duì)專項(xiàng)經(jīng)費(fèi)(035200179);攀枝花大學(xué)科技園發(fā)展有限責(zé)任公司種子資金“雙創(chuàng)”項(xiàng)目(2019-46)? [Supported by? National Natural Science Foundation of China (31301682); Special Fund for Research Team of Ecological Restoration and Governance Innovation in Dry Hot Valley of Jinsha River (035200179); “Double Creation” Project of Seed Fund of Panzhihua University Science Park Development Co., Ltd. (2019-46)]。
第一作者: 鞏元勇(1982-),博士,副教授,主要從事植物生物技術(shù)研究,(E-mail)gyy2011qh@163.com。
*通信作者
2539501186257