侯 哲,梅 梅,張曉林,陸秀君
(1.沈陽農業(yè)大學 林學院,遼寧 沈陽 110866;2.中國林業(yè)科學研究院 a.林業(yè)研究所;b.國家林業(yè)局森林培育重點實驗室;c.林木遺傳育種國家重點實驗室,北京 100091)
天女木蘭Magnolia sieboldiiK.Koch 是世界上稀有的珍貴樹種之一,主要分布于中國北部地區(qū),朝鮮、日本也有少量的分布。天女木蘭具有廣泛的開發(fā)利用價值,花色潔白素雅,異常芬芳,是一種庭院綠化及觀賞樹種,木質優(yōu)良,樹干通直,可做家具和雕刻用材。
天女木蘭種子不同部位都存在不同程度的發(fā)芽抑制物質,種胚發(fā)育不完全造成了種子的深休眠[1]。種子在可收獲的時候,胚乳中存在的不同濃度的植物激素,是致使種子難以萌發(fā)的又一個重要原因[2]。合理的濃度和浸種時間有利于提高種子質量,促進種子萌發(fā)[3]。生理休眠是天女木蘭種子難以萌發(fā)的原因,種皮的機械束縛并不能造成種子深度休眠,其主要原因是種胚發(fā)育不完全,對種子進行150 d 的低溫沙藏后高溫15 d 催芽,種子可以達到90%的發(fā)芽率[4]。將GA3質量濃度設置為300 mg/L 后浸種,通過變溫層積催芽效果較好,且在整個沙藏過程中溫度起主導作用。而種胚的生長分化在采用GA3浸種變溫層積處理后會有一定的促進作用,這是因為種子內各種促進種胚成熟物質的積累對種胚的生長產生有利的影響[5]。
種子打破休眠進而萌發(fā)是一個復雜的生理過程,可以通過蛋白質組學的研究來洞悉其分子機理[6]。木本植物在發(fā)芽期間的蛋白組變化的研究已有報道,包括山楂[6]、山毛櫸[7]、槭樹[8]、麻風樹[9]、鳳仙花[10]和南洋杉[10]等。本課題組在前期的研究中,對天女木蘭種子進行變溫層積處理,分別比較了種子在層積0、6、110 和150 d 的個體發(fā)育變化和蛋白組差異變化,以期確定與種子萌發(fā)相關的蛋白質,從而進一步了解種子萌發(fā)的分子機理[11]。
天女木蘭層積催芽的種子在休眠解除過程中,差異表達蛋白天冬氨酸蛋白酶在層積過程中隨種胚的伸長生長呈波動變化[12],表明天冬氨酸蛋白酶在種子萌發(fā)過程中發(fā)揮著重要作用。天冬氨酸蛋白酶是重要的蛋白水解酶,參與機體的新陳代謝及生物調控作用,廣泛存在于植物種子、花及葉片等組織中。有研究表明,天冬氨酸蛋白酶在種子休眠解除過程中起主導作用,參與了種子萌發(fā)期間儲藏蛋白的水解[12]。擬南芥PCS1基因編碼的天冬氨酸蛋白酶參與調控胚胎發(fā)育,而PCS1突變體缺失該功能,導致發(fā)育胚細胞死亡和雌雄配子體退化[13]。
眾多研究表明,天冬氨酸蛋白酶在種子休眠解除過程中起主導作用。本課題組在天女木蘭種子休眠解除過程中種胚發(fā)育和相關蛋白的研究中指出,天冬氨酸蛋白酶在層積過程呈波動變化,在110 d 時達到高峰,說明該蛋白參與種子萌發(fā)期間儲存蛋白的水解,在種子成熟胚的發(fā)育過程中發(fā)揮重要作用[11]。本研究以天女木蘭種子為試驗材料,在建立天女木蘭總RNA 提取體系的基礎上,利用同源克隆法RACE 技術從天女木蘭種子中克隆得到天冬氨酸蛋白酶基因全長,采用生物信息學的方法進行分析,利用分子生物學技術對天女木蘭種子休眠及其萌發(fā)機理進行深入研究,這對于天女木蘭這一“活化石”樹種的保護和開發(fā)利用具有非常重要的意義。
試驗用到的天女木蘭種子采于沈陽農業(yè)大學植物園(40°49′N,123°34′E)內8年生的健康植株,于9月末采集種子等材料并迅速冷凍于液氮中,或者冷藏于-80℃的超低溫冰箱中,直到RNA 提取。
參照北京天根生化科技有限公司RNA 提取試劑盒(DP419)說明書進行RNA 的提取,按照PrimeScriptRT(TaKaRa,Japan)試劑盒說明書反轉錄合成cDNA。
1.3.1 基因中間片段的獲得
1.3.1.1 設計天冬氨酸蛋白酶的簡并引物
根據已公布的麻瘋樹、梅花、油棕、綠豆等天冬氨酸蛋白酶的基因序列,利用Primer5.0 設計簡并引物(表1),交由沈陽匯佰生物科技有限公司合成。
表1 簡并引物Table1 Degenerate primers
1.3.1.2 PCR 擴增目的片段
PCR 用的是promega 的Go Taq DNA 聚合酶,反應體系是20 μL 體系,溫度梯度從48 ℃到65 ℃,擴增體系嚴格按照試劑說明書進行。
1.3.1.3 目的片段的回收
為了進一步純化目的片段cDNA,使用全式金的EasyPure? Quick Gel Extractiom Kit 膠回收試劑盒進行目的片段的回收。
1.3.1.4 目的基因與pGEM?-TEasy 載體連接及轉化
目的基因與pGEM?-TEasy 載體連接轉化反應步驟參照pGEM?-TEasy 載體說明書。
1.3.1.5 陽性克隆載體的鑒定
篩選出只有白色菌落的部位,取出一部分稀釋到10 μL ddH2O 中,取2 μL 菌液作為PCR 模板,進行陽性克隆載體的鑒定。
1.3.1.6 測序及序列分析將符合要求的菌液送至沈陽佰創(chuàng)生物技術有限公司進行測序。測完序后用BLAST 軟件進行序列比對分析。
1.3.2 天冬氨酸蛋白酶基因的3′ RACE 擴增
根據已得到的天冬氨酸蛋白酶基因中間保守序列設計3′RACE特異性引物RC226-F1、RC226-F2,反轉錄引物、接頭引物及特異性引物序列如表2所示。
以3′ RACE Adaptor 為反轉引物的cDNA 為模板進行3′ RACE 巢式PCR 擴增(參照invitrogen 3′ race system manua 說明書進行),直到獲得3′目的片段。將巢式PCR 產物回收純化、連接載體、轉化測序。
1.3.3 天冬氨酸蛋白酶基因的5′ RACE 擴增
5′ RACE 特異性引物、反轉錄引物、接頭引物及特異性引物序列如表3所示。
以特異性引物RC226-RT1 為反轉錄引物,得到cDNA,經RNase H 和TdT 處理后,進行巢氏PCR(操作步驟見invitrogen 5′ race system manual),直到獲得5′目的片段,然后將巢式PCR 產物回收純化、連接載體、轉化測序。
表2 3′RACE引物Table2 3′ RACE adaptor
表3 5′RACE引物Table3 5′ RACE adaptor
1.3.4 DNAMAN 拼接全長序列
將得到的天冬氨酸蛋白酶基因的保守序列、5′RACE序列及3′RACE序列通過DNAMAN軟件進行拼接,進一步剪切掉重疊序列就可以得到天冬氨酸蛋白酶基因的全長cDNA 序列。
將得到的全長序列通過BLAST 中的nucleotide blast 進行基因的同源性分析,將全長cDNA 通過DNAMAN 軟件轉化為氨基酸序列后,輸入Blastp軟件進一步進行氨基酸的同源性分析,Clustalx 1.83 和MEGA 4.1 結合構建系統(tǒng)進化樹進行親緣性分析。目的基因翻譯成蛋白后預測分析其理化性質,如相對分子量與等電點可以通過ProtParam(http://www.expasy.org/tools/protparam.html)進行分析預測;親水性與疏水性可以用ProtScale 軟件分析;蛋白的結構域、二級結構與三維結構可以通過軟件Phyre2 預測分析;天冬氨酸蛋白酶基因的跨膜結構是否存在可以通過在線分析軟件TMHMM Server-2.0 預測;利用Plant-mPLoc 軟件對天女木蘭天冬氨酸蛋白酶基因編碼的蛋白進行亞細胞定位預測分析。
所得到的RNA 十分完整,28 S RNA 的亮度是18 S RNA 的2 倍,完全滿足后續(xù)的分子試驗要求(圖1,表4)。
3.2.1 天冬氨酸蛋白酶基因中間序列的克隆
由簡并引物克隆得到的序列回收純化、連接載體后轉入感受態(tài)細胞中,選取陽性克隆載體,從電泳檢測結果(圖2)可以看出1 和2 目的片段連接到載體上,可以進行測序分析。
圖1 天女木蘭種子總RNA 電泳檢測 Fig.1 Electrophoresis detection of total RNA of M.sieboldii seeds
表4 天女木蘭總RNA質量濃度和產率的檢測Table4 Detection of concentrations and productivities of M.sieboldii total RNA
圖2 陽性克隆載體的鑒定Fig.2 Identification of positive cloning vector
3.2.2 天冬氨酸蛋白酶基因的3′ RACE 擴增
將3′ RACE 的PCR 產物回收純化后測序得到了224 bp 的堿基序列(圖3),該序列具有天然的poly(A)尾巴,且與已獲得的中間序列可以通過DNAMAN 軟件準確拼接,BLAST 后發(fā)現與其他植物中的天冬氨酸蛋白酶基因同源性較高,可以確定克隆到的該序列為天女木蘭天冬氨酸蛋白酶基因的3′端。
3.2.3 天冬氨酸蛋白酶基因的5′ RACE 擴增
圖3 3′ RACE 結果Fig.3 Results of 3′ RACE
將5′ RACE 的PCR 產物回收純化后測序得到了265 bp 的堿基序列(圖4),該序列與已獲得的中間序列可以通過DNAMAN 軟件準確拼接,BLAST 后發(fā)現其與其他植物中的天冬氨酸蛋白酶基因同源性較高,可以確定克隆到的該序列為天女木蘭天冬氨酸蛋白酶基因的5′端。
圖4 5′ RACE 結果Fig.4 Results of 5′ RACE
3.2.4 天冬氨酸蛋白酶基因ORF 的獲得
將天冬氨酸蛋白酶基因的中間、3′端和5′端3 個片段經過DNAMAN 軟件拼接后得到了1 798 bp 的堿基序列,全長序列與已知的天冬氨酸蛋白酶基因的同源性較高,進一步驗證了該序列為天女木蘭天冬氨酸蛋白酶基因(圖5、圖6)。
圖5 全長cDNA 示意圖Fig.5 Schematic diagram of the full length cDNA
圖6 天冬氨酸蛋白酶的核苷酸序列及氨基酸序列Fig.6 Nucleotide sequences and amino acid residues sequences of aspartic acidase
3.3.1 天冬氨酸蛋白酶基因的相似性分析
通過NCBI 中的Blastx 數據庫對獲得的天女木蘭天冬氨酸蛋白酶基因全長進行氨基酸同源性分析,比對結果顯示目的序列推導的氨基酸序列與其它植物中的已知的天冬氨酸蛋白酶基因的氨基酸序列的同源性都在85%以上,其中與蓮科的蓮花Nelumbo nucifera(XP 010252464.1)以及大戟科的蓖麻Ricinus communis,(XP 002529926.1)等的相似性最高,達到了87%;與其他植物的同源性都在84%~87%之間,同源性非常高,進一步驗證了所獲得的全長序列是天女木蘭的天冬氨酸蛋白酶基因全長,比對結果見表5。
通過MEGA 5.1 軟件中Neighbouring-Joining聚類法對天女木蘭的天冬氨酸蛋白酶的氨基酸序列與其它植物的天冬氨酸蛋白酶氨基酸序列構建進化樹(圖7)。從圖7中可以看出,26 種植物的天冬氨酸蛋白合成酶基因由于親緣關系被分成三大類,就聚類分析來看,與睡蓮科的蓮花首先聚為一類,這與BLAST 同源性分析結果一致,可能是因為二者均為開花類的觀賞植物,屬于直系同源蛋白,與豆科的蕓豆與豇豆親緣關系較遠。本研究在木蘭科及其親緣關系較近的其他植物的分子水平研究方面奠定了一定的基礎。
3.3.2 Ms Aspartic proteinase 基因編碼的蛋白結構的分析
3.3.2.1 基本理化性質的分析
將Ms Aspartic proteinase 編碼的氨基酸序列輸入在線軟件ProtParam,分析預測其基本的理化性質,通過軟件分析可知,Ms Aspartic proteinase 編碼的蛋白質的分子量為55.176 KDa,理論等電點為5.25,推斷為含有酸性的蛋白;帶有49 個負電荷殘基(Asp+Glu),40 個正電荷殘基(Arg+Lys);共含有7 714 個原子,其中C、H、N、O、S 的原子含量分別為2 452、3 839、651、748、24;不穩(wěn)定系數計算后為37.31,歸于穩(wěn)定蛋白一類。
目的基因的親水性與疏水性可以通過在線分析軟件ProtScale 進行預測分析(圖8),該蛋白的總平均親水性數值為0.015,因此判定天女木蘭天冬氨酸蛋白酶屬于疏水性蛋白。
表5 天冬氨酸蛋白酶基因和其它25種植物天冬氨酸蛋白酶基因推導的氨基酸序列相似性比對Table5 Similarity comparison of aspartic proteinase and other 25 plants aspartic proteinase synthase andamino acid in GenBank
圖7 26 種植物Aspartic proteinase 合成酶基因氨基酸序列構建的N-J 樹Fig.7 Constructed N-J tree of amino acid sequences of aspartic proteinase from 26 plants
3.3.2.2 跨膜結構的預測
Ms Aspartic proteinase 編碼的蛋白質跨膜結構可以通過在線分析軟件TMHMM 2.0 進行分析預測,結果見圖9。
結果顯示,天女木蘭的天冬氨酸蛋白屬于跨膜蛋白。
圖8 疏水性的預測分析Fig.8 Prediction analysis of hydrophobicity
圖9 跨膜結構域的預測Fig.9 Prediction of transmembrane domain
3.3.2.3 信號肽位點的預測分析
在線分析軟件SignalIP 4.0 可以預測分析天女木蘭天冬氨酸蛋白的信號肽,結果如圖10 所示。
由圖10 可知,天女木蘭天冬氨酸蛋白酶基因編碼的蛋白在氨基酸的第26 位C 值最大,S 值陡峭,Y 值最高峰,為信號肽剪切位點,屬于分泌蛋白。
3.3.2.4 三維結構的構建與分析
將天女木蘭的天冬氨酸蛋白酶同Phyre2 中其他同源的天冬氨酸蛋白酶已知的蛋白結構作對比后創(chuàng)建模型(圖11),該蛋白由二級結構和三維結構覆蓋,覆蓋率高達84%,可信度為100%,再一次證明了所克隆得到的基因是天女木蘭天冬氨酸蛋白酶基因。
圖10 信號肽的預測Fig.10 Prediction of signal peptide
圖11 蛋白質三維結構建模Fig.11 Modeling of three-dimensional protein structure
RACE 技術在獲取各物種基因的全長方面得到了廣泛的應用。本研究以RACE 技術為核心技術獲取天女木蘭天冬氨酸蛋白酶基因,在獲取中間片段的基礎上,通過設計特異性引物和RACE需要的5′ 與3′ 端接頭引物,在優(yōu)化的PCR 擴增條件以及為防止其他雜帶的產生而采取的巢式擴增技術下,成功獲得了天女木蘭種子天冬氨酸蛋白酶基因的5′ 與3′ 端,具有5′ 與3′ 端應有的特征外,同時通過DNAMAN 軟件可以正確的拼接,得到的全長序列與其他已公布的天冬氨酸蛋白酶基因具有非常高的同源性,證實了克隆的正確性與完整性。
雖然RACE 技術在植物全長cDNA 的克隆上取得了很大的進展,但是科研人員在實際的實驗操作上依然存在著大量的問題與技術難題,如RACE 實驗的基礎是一段已知的基因片段才能夠向兩端延伸,而中間片段的獲得也需要科研工作者大量的研究實驗,具有一定的難度;RACE 對于RNA、cDNA、引物、擴增條件都具有相當高的要求,在實驗的過程中每一步都需要注意操作的精細度以獲得高質量的實驗材料以及實驗環(huán)境;RACE 的3′ 端擴增相對簡單,而5′ 端擴增難度較大,需要的技術較為復雜,即使各部分酶反應順利,也有可能會產生大量的非特異性條帶。因此,需要針對不同的物種、不同的基因加以摸索研究,不斷優(yōu)化反應條件,才能成功地利用RACE 技術獲取目的基因的全長cDNA。
天冬氨酸蛋白酶基因總長1 798 bp,序列中包含一段從109 bp ATG 起始到1 653 bpTAA 終止的完整的ORF 區(qū)域,總長1 545 bp,可以編碼514個氨基酸殘基。天女木蘭天冬氨酸蛋白酶基因是否存在基因家族并不明確,該基因在天女木蘭的時空表達模式在本研究中沒有體現,下一步還需要進行深入的研究。
利用分子生物學技術對天女木蘭種子休眠及其解除機理深入研究,利用同源克隆法RACE 技術克隆得到天冬氨酸蛋白酶基因全長,結合生物分析技術來對天冬氨酸蛋白酶的結構與功能以及亞細胞定位,有利于后續(xù)遺傳轉化中掌握天冬氨酸蛋白酶基因在天女木蘭植物體中的作用,有助于全面地研究天女木蘭種子休眠解除機理,為系統(tǒng)地探索天女木蘭種子休眠機制提供了理論基礎,找到了新的窗口與靶點。