陳麗娟,張 斌
(湖南科技學(xué)院化學(xué)與生物工程學(xué)院,湖南 永州 425199)
大豆[Glycine max(Linn.)Merr.]是豆科大豆屬一年生草本植物,種子中富含大豆蛋白、活性肽、脂肪、異黃酮和皂苷等生物活性成分,具有抗高血壓、抗氧化、抗癌、降血脂等生理保健功能[1],尤其是大豆皂苷具備降血糖血脂、抗誘變、抗衰老、抗凝血等作用,對癌細胞也有一定的抑制作用[2]。熱激蛋白HSP (Heat Shock Proteins)是一類高度保守的蛋白質(zhì),具有幫助多肽正確折疊、轉(zhuǎn)運和修復(fù)的功能,在植物生 長發(fā)育和抗脅迫過程中發(fā)揮重要的作用[3]。HSP大 體可分為小分子HSP、HSP10、HSP40、HSP60、HSP70、 HSP90和HSP100這7類[4-5]。其中,小分子HSP的分 子量在15~42 kD之間,通常被稱為蛋白錯誤折疊的第一道防線,也被稱為“細胞衛(wèi)士”[6]。HSP基因轉(zhuǎn)入大豆可以提高其抗逆性[7],但是,目前為止,關(guān)于GmHSP20家族基因的研究還非常有限。大豆基因組的成功測序為大豆基因功能研究提供了有力條件,筆者對GmHSP20家族基因進行了鑒定,并對其理化性質(zhì)、系統(tǒng)進化、啟動子原件以及表達模式進行了分析,為探究GmHSP20家族基因的功能打下了一定基礎(chǔ)。
GmHSP20家族基因相關(guān)數(shù)據(jù)來自Ensembl數(shù)據(jù)庫;擬南芥HSP20蛋白家族基因相關(guān)數(shù)據(jù)來自擬南芥基因組數(shù)據(jù)庫(TAIR);HSP20蛋白隱馬爾可夫模型(pf 00011)來自PFAM數(shù)據(jù)庫。
1.2.1 HSP20蛋白家族基因成員的鑒定首先,從Ensembl數(shù)據(jù)庫下載基因組序列、CDS和蛋白序列,建立本地數(shù)據(jù)庫。第二,以pf 00011為參考序列,設(shè)置e值≤1E-20,用HMME軟件在本地數(shù)據(jù)庫搜索HSP20結(jié)構(gòu)域,建立GmHSP20的隱馬爾可夫模型,搜索GmHSP20序列,e值≤0.001;將GmHSP20序列提交到NCBI進一步確認結(jié)構(gòu)域,去除假陽性。第三,使用MEGA6.0軟件鄰接法(NJ)構(gòu)建大豆和擬南芥HSP20蛋白的系統(tǒng)發(fā)育樹,bootstrap設(shè)置值為1000。通過http://web.expasy.org/compute_pi/獲得GmHSP20的長度、分子量和等電點。第四,從Phytozome數(shù)據(jù)庫中提取GmHSP20起始密碼子上游1500 bp基因組序列,利用PlantCARE預(yù)測其順式作用元件,用TBtools軟件繪制啟動子順式元件圖。第五,通過CDS找出GmHSP20基因在染色體上的位置,將信息提交到http://gsds.cbi.pku.edu.cn/生成基因結(jié)構(gòu)。
1.2.2 HSP20蛋白家族基因的表達從大豆數(shù)據(jù)庫SoyKB(http://soykb.org/)下載GmHSP20基因表達數(shù) 據(jù),利用TBtools軟件繪制基因的表達熱圖。
2.1GmHSP20蛋白家族基因的篩選、鑒定和染色體定位
該研究在大豆基因組數(shù)據(jù)庫中鑒定出56個GmHSP20蛋白家族基因。根據(jù)蛋白質(zhì)分子量的大小命名,相同分子量命名為A、B等,結(jié)果(表1)顯示, 基因的氨基酸長度不一,分子量和等電點變化范圍比較大。GmHSP20的氨基酸長度為136~372(aa),最長的為GmHSP41.8,最短的為GmHSP15.6;GmHSP20 相對分子質(zhì)量為15.2~41.8 Da,最大的為GmHSP41.8,最小為GmHSP15.2;蛋白質(zhì)的等電點為4.49~10.28,最高為GmHSP17.8,最低為GmHSP17.5B。大豆全基因組共含有20條染色體,而56個GmHSP20基因分布在18條染色體上(圖1)。不同染色體含有不同的GmHSP20基因數(shù)目,1、11、12、17和19號只有1個基因,5、9、16號有2個基因;6、10、18、20號有3個基因;其中2、4、7、8、13、14號染色體上有基因成簇存在。
圖1 GmHSP20基因的染色體定位
表1 GmHSP20基因家族信息
2.2GmHSP20基因進化樹構(gòu)建
根據(jù)HSP20家族基因在銀杏中的分組方法,GmHSP20基因可分為11個亞家族,如圖2所示,分別是CⅠ、CⅡ、CⅢ(細胞質(zhì)或細胞核),MⅠ、MⅡ(線粒體),P(質(zhì)體),Po(過氧化物酶體),ER(內(nèi)質(zhì)網(wǎng))和UN1、UN2、UN3(位置未知)。對比擬南芥系統(tǒng)的進化分析發(fā)現(xiàn),大豆和擬南芥HSP20基因家族成員具有高度的同源性。在各個亞族中,成員數(shù)量不一,CI有26個成員,CⅡ有2個,CⅢ有2個,P有7個,ER有6個,MI有4個,MⅡ有2個,Po有3個,未知功能的UN1亞族有2個,UN2有2個,UN3有13個。大多數(shù)GmHSP20基因分布在細胞質(zhì)或細胞核中,少量分布在細胞器內(nèi)。
圖2 GmHSP20基因進化樹
2.3GmHSP20基因啟動子原件分析
為了研究GmHSP20基因在進化過程中的多樣性變化,對基因結(jié)構(gòu)進行分析,結(jié)果(圖3左)表明,家族基因在結(jié)構(gòu)上較為保守,雖然56個GmHSP20基因長短差異較大,但內(nèi)含子主要為0~2個。CⅠ和ER亞族基因長度比較短,都只含有1個內(nèi)含子;UN1亞族含有5個內(nèi)含子,而且外顯子和內(nèi)含子相對位置高度相似;其余絕大部分基因都只含有2個內(nèi)含子。值得注意的是,P亞族中GmHSP26.1和UN3亞族中GmHSP26.7比較特殊,基因結(jié)構(gòu)較長,內(nèi)含子超過了4 kb。
圖3 大豆GmHSP20基因結(jié)構(gòu)(左)和啟動子原件(右)
對GmHSP20基因的啟動子(圖3右)進行分析,發(fā)現(xiàn)所有GmHSP20基因都含有與植物脅迫相關(guān)的元件,例如ARE、LTR、MBS和TC-rich。ARE元件在GmHSP20基因中普遍存在,表現(xiàn)為1~4個重復(fù)。
2.4GmHSP20基因表達模式分析
研究對56個GmHSP20基因的表達模式進行了分析,結(jié)果如圖 4所示。整體上,GmHSP20基因在種子發(fā)育第42天表達水平較高,其中GmHSP17.3A、GmHSP17.7A、GmHSP17.9和GmHSP18.5B在種子發(fā)育第35天和第42天表達最高。值得注意的是,同一亞族GmHSP18.5A和GmHSP18.5B在大豆不同生長部位和生長發(fā)育階段都有表達,而且表達水平均較高,表現(xiàn)出相似的表達模式。
圖4 GmHSP20基因表達模式圖
HSP蛋白廣泛存在于植物體內(nèi),參與植物生長發(fā)育、非生物脅迫響應(yīng)等多種生物學(xué)過程[8]。關(guān)于HSP20蛋白家族基因的分析報道比較多,擬南芥有19個Hsp20[9],楊樹有36個[10],水稻有39個[11],銀杏有39個[12],可以分成了不同的亞族,并且在基因數(shù)量、亞細胞定位、功能和序列方面體現(xiàn)出多樣性。但是,到目前為止,關(guān)于GmHSP20基因的研究十分有限。該研究從大豆全基因組中鑒定出56個GmHSP20基因,分為11個亞族,大多數(shù)分布在細胞質(zhì)或細胞核中,少量分布在細胞器內(nèi),說明細胞質(zhì)可能是GmHSP20基因的主要功能區(qū),這與銀杏中的研究一致;但是,銀杏中只有10個亞族,這可能與銀杏和大豆基因組具有不同的系統(tǒng)發(fā)育狀態(tài)有關(guān)[12]。GmHSP20蛋白的氨基酸長度不一、分子量和等電點變化范圍比較大,推測可能與這些蛋白是在不同亞細胞中發(fā)揮作用有關(guān)。18條染色體含有不同的GmHSP20基因數(shù)目,有的基因成簇存在,這些成簇的基因可能對某一生物學(xué)功能有加強作用。GmHSP20基因在在種子發(fā)育第42天表達量比較高,暗示這些基因在種子發(fā)育過程中發(fā)揮了一定的作用,其中GmHSP17.3A、GmHSP17.7A、GmHSP17.9和GmHSP18.5B在種子發(fā)育第35天和第42天表達最高,說明這4個基因在種子發(fā)育過程中可能發(fā)揮重要作用。GmHSP18.5A和GmHSP18.5B在大豆不同生長部位和各生長發(fā)育階段都有表達,表現(xiàn)出相似的表達模式,提示著這2個基因可能具有相同的功能,還需要進一步的研究確定。綜上所述,該研究結(jié)果為GmHSP20基因在大豆生長發(fā)育及非生物脅迫響應(yīng)過程中的功能研究提供了參考。