趙 凡,曾秀麗,張姍姍
(西藏自治區(qū)農(nóng)牧科學(xué)院蔬菜研究所,西藏 拉薩 850000)
被譽(yù)為“花中之王”的牡丹在長(zhǎng)期的培育中已經(jīng)成為世界上園藝化程度最高的花卉之一,在我國(guó)已有1500多年的園藝栽培歷史。作為觀賞植物,在牡丹的眾多性狀中,花型一直是一個(gè)重要的因素,它是由花瓣、雄蕊、雌蕊、萼片的形態(tài)數(shù)量變異及其排列組合決定的。從其應(yīng)用角度而言,牡丹花型是其重要的觀賞特征之一,直接影響到牡丹的觀賞價(jià)值;從分類角度而言,花型分類是一種重要的分類方法,能夠客觀地反映牡丹品種的演進(jìn)規(guī)律。重瓣程度的高低無疑對(duì)它的觀賞效果有著極大的影響,故而有必要研究其重瓣性瓣化機(jī)理,進(jìn)一步改變其花型從而提高觀賞性,2016年,西藏自治區(qū)農(nóng)科院蔬菜所牡丹課題組首次在拉薩馴化栽培的大花黃牡丹中發(fā)現(xiàn)了2株雄蕊瓣化后單花花瓣數(shù)量達(dá)到28瓣,雌蕊為3~4個(gè)的變異材料,而多年的野外調(diào)查發(fā)現(xiàn)大花黃牡丹的花瓣數(shù)量為11~12,從未發(fā)現(xiàn)過重瓣變異植株。
轉(zhuǎn)錄組是特定組織細(xì)胞在某一發(fā)育階段轉(zhuǎn)錄出來的所有RNA的集合。轉(zhuǎn)錄組研究能夠從整體水平研究基因功能以及基因結(jié)構(gòu),揭示特定生物學(xué)過程以及疾病發(fā)生過程的中的分子機(jī)理。轉(zhuǎn)錄組測(cè)序(RNA-Seq)是利用第2高通量測(cè)序技術(shù)進(jìn)行cDNA測(cè)序,全面快速地獲取某一物種特定器官或組織在某一特定器官或組織在某一狀態(tài)下的幾乎所有轉(zhuǎn)錄本。隨著后基因組的時(shí)代的到來,轉(zhuǎn)錄組學(xué)、蛋白質(zhì)組學(xué)、代謝組學(xué)等各種組學(xué)相繼出現(xiàn),其中轉(zhuǎn)錄組學(xué)是率先發(fā)展起來以及應(yīng)用最廣泛的技術(shù)[1]。遺傳學(xué)中心法則表明,遺傳信息在精密的調(diào)控下通過信使5RNA(mRNA)從DNA傳遞到蛋白質(zhì)。因此,mRNA被認(rèn)為是DNA與蛋白質(zhì)生物之間信息傳遞的媒介,而所有表達(dá)基因的身份以及其轉(zhuǎn)錄水平,一起被稱作轉(zhuǎn)錄組[2](Transcriptome)轉(zhuǎn)錄組是特定組織或細(xì)胞在某一發(fā)育階段或功能狀態(tài)下轉(zhuǎn)錄出來的所有RNA的總和,主要包括mRNA和非編碼RNA的總和,主要包括非編碼RNA(non-codingRNA,ncRNA)[3]。轉(zhuǎn)錄組研究是基因功能及結(jié)構(gòu)研究的基礎(chǔ)和出發(fā)點(diǎn),了解轉(zhuǎn)錄組是解讀基因組功能元件和揭示細(xì)胞及組織中分子組成所必需的,并且對(duì)理解機(jī)體發(fā)育和疾病具有重要的作用。事實(shí)上,大花黃牡丹雄蕊瓣化也是機(jī)體病變的過程,應(yīng)用轉(zhuǎn)錄組學(xué)技術(shù)研究大花黃牡丹雄蕊瓣化將會(huì)是一個(gè)直接有效的方法。
因此本實(shí)驗(yàn)將從生態(tài)學(xué)和轉(zhuǎn)錄組2個(gè)方面找出導(dǎo)致大花黃牡丹雄蕊瓣化的因子。
本實(shí)驗(yàn)在西藏自治區(qū)農(nóng)牧科學(xué)院蔬菜研究所園區(qū)大棚內(nèi)開展。該實(shí)驗(yàn)基地的海拔為3650 m,光照充足,紫外線強(qiáng)。雨季多集中在6-9月,土壤為沙壤土,保水保肥能力一般。
從林芝已移栽到拉薩的六年生大花黃牡丹瓣化植株2棵,大花黃牡丹正常植株3棵、液氮罐、干冰、RNA保存液、鋁紙、游標(biāo)卡尺、記號(hào)筆、標(biāo)簽、記錄本。
本實(shí)驗(yàn)采集正常株和變異株對(duì)照試驗(yàn),在形態(tài)學(xué)上進(jìn)行花部結(jié)構(gòu)上的觀察,選取花芽分化時(shí)期頂芽,制作石蠟切片,顯微鏡觀察頂芽結(jié)構(gòu)特征。在轉(zhuǎn)錄組方面進(jìn)行RNA測(cè)序unigene的差異性分析。提取大花黃牡丹雄蕊瓣化群體和正常群體樣本總RNA,加接頭,建庫(kù)。然后利用11umina HIseq2000測(cè)序平臺(tái)進(jìn)行生物學(xué)分析及功能注釋。兩種材料轉(zhuǎn)錄組進(jìn)行比較分析,鑒定雄蕊瓣化形成時(shí)期相關(guān)差異表達(dá)基因。
從表1可知,通過3個(gè)時(shí)間的觀察,記錄大花黃牡丹正常株和變異株一些形態(tài)指標(biāo)的觀察,發(fā)現(xiàn)變異植株,從冠幅、長(zhǎng)枝長(zhǎng)、長(zhǎng)枝莖粗、短枝長(zhǎng)、短枝莖粗、花蕾數(shù)等方面的優(yōu)勢(shì)要強(qiáng)于正常株,分別高于正常株0.32 m、0.40 m、0.41 cm、0.13 m、0.04 cm、3.5個(gè),然而在長(zhǎng)短枝平均生長(zhǎng)量上要弱于正常株0.04 m,正常株與變異株在長(zhǎng)枝長(zhǎng)度上存在極顯著性差異,在長(zhǎng)枝莖粗上有顯著性差異,在短枝長(zhǎng)度和莖粗上沒有顯著性差異。
2017年11月23日開始,間隔10 d從正常和變異的大花黃牡丹植株上采集花芽,并在體式顯微鏡下進(jìn)行觀察,采集4次,于2017年12月23日結(jié)束。通過4次采集花芽的觀察得出,正?;ㄑ縿傞_始被四周的葉芽包圍,且高度高于其中的花芽,到后面花芽生長(zhǎng)的很快,葉芽和花芽的數(shù)量也不斷增加。但葉芽的生長(zhǎng)速度要弱于花芽,到后面花芽也高于葉芽;相比較而言,變異花芽從剛開始觀察,其花芽就高于葉芽,到后面花芽和葉芽的高度差越來遠(yuǎn)大,同等時(shí)期花芽和葉芽都比正常株長(zhǎng)得弱小,1個(gè)混合芽中,花芽和葉芽生長(zhǎng)速度的快慢、數(shù)量、高度差、或許是導(dǎo)致大花黃牡丹雄蕊瓣化的1個(gè)形態(tài)判斷指標(biāo)。
2.3.1 樣品采集 本實(shí)驗(yàn)于2017年4月18日、2017年5月10日,2017年6月24日,3個(gè)時(shí)間點(diǎn),總計(jì)118個(gè)樣,1個(gè)樣1個(gè)花蕾,變異樣品9個(gè),正常樣品9個(gè)。寫上標(biāo)簽,用錫箔紙包裹,置于-80 ℃液氮中保存,于2017年8月底,送至武漢進(jìn)行樣品轉(zhuǎn)錄組分析。
注:2017-3-23觀察冠幅、標(biāo)記的各五個(gè)長(zhǎng)短枝長(zhǎng)度、莖粗平均值,2107-04-13統(tǒng)計(jì)標(biāo)記長(zhǎng)短枝得總花蕾數(shù)、2017-05-17統(tǒng)計(jì)標(biāo)記的長(zhǎng)短枝生長(zhǎng)量均枝。
表2 不同時(shí)間采樣情況
2.3.2 樣本檢測(cè)、文庫(kù)構(gòu)建和上機(jī)測(cè)序 對(duì)總RNA樣本進(jìn)行1 %的瓊脂糖電泳檢測(cè)RNA樣品是否有降解以及雜質(zhì);凱奧k5500分光光度計(jì)檢測(cè)樣品純度;安捷倫2100RNA Nano 6000 Assay Kit (Agilent Technologies,CA,USA) 檢測(cè)RNA樣品的完整性和濃度??俁NA樣本檢測(cè)合格后,用帶有Oligo(dT)的磁性富集mRNA,向得到的mRNA中加入片段緩沖液使其片段成為短片段,在以片段后的mRNA為模板,用六堿基隨機(jī)引物合成cDNA第1鏈,并加入緩沖液、dNTPS、RNaseH和DNA polymerase I繼續(xù)合成cDNA第2鏈,經(jīng)過QIAQUick PCR試劑盒純化并加EB緩沖液洗脫。洗脫純化后的雙鏈cDNA再進(jìn)行末端修復(fù)、加堿基A、加測(cè)序接頭處理,然后經(jīng)瓊脂糖凝膠電泳回收目的大小片段并進(jìn)行PCR擴(kuò)增,從而完成整個(gè)文庫(kù)制備工作。
2.3.3 樣本信息 項(xiàng)目共有18個(gè)樣本用于分析,樣本信息名稱對(duì)應(yīng)到檢測(cè)時(shí)的名稱如表3所示:
2.4.1 差異基因的獲取 從表中通過計(jì)算,可以得出TEST01和CONTRIL01差異基因總數(shù)272個(gè)、上調(diào)基因200個(gè)、下調(diào)基因72個(gè);TEST02和CONTRIL02差異基因總數(shù)2526個(gè)、上調(diào)基因1403個(gè)、下調(diào)基因1123個(gè);TEST03和CONTRIL03差異基因總數(shù)2539個(gè)、上調(diào)基因736個(gè)下調(diào)基因1803個(gè)。
表3 18個(gè)樣本信息名稱對(duì)應(yīng)的檢測(cè)名稱
圖1 本本差異基因
2.4.2 差異表達(dá)基因韋恩圖 通過比較處理組和參考組,對(duì)不同組別之間的差異表達(dá)基因作韋恩圖,如下:3個(gè)組合加起來共有不重復(fù)基因4709個(gè),3個(gè)組合互不重合基因4694個(gè),3個(gè)組合共同重合的基因有15個(gè)。這15個(gè)差異基因的部分基因可能是導(dǎo)致大花黃牡丹雄蕊瓣化的基因。
圖2 差異基因韋恩圖
2.4.3 GO分析 TEST01-CONTRIL01、TEST02-CONTRIL02、TEST03-CONTRIL03 3個(gè)組合差異基因?qū)纳镞^程(biological process)、細(xì)胞組成(cellular component)和分子功能(Molecular Function)3個(gè)部分。基因或蛋白質(zhì)通過ID對(duì)應(yīng)或者序列注釋的方法找到與之對(duì)應(yīng)的GO編號(hào),而GO編號(hào)可用于對(duì)應(yīng)到Term,即功能類別或者細(xì)胞定位。
圖3 GO分析樣本1
利用Blast2GO,計(jì)算每個(gè)Term的基因數(shù)目。并根據(jù)結(jié)果繪制柱形圖,結(jié)果如下:
TEST01-CONTRIL01組合差異基因被定位到了生物過程(biological process)中代謝過程(Metabolic processs)參與基因52個(gè);細(xì)胞過程(Cellular processs)參與基因48個(gè);單一生物體過程(Single-organism processs)參與基因32個(gè);刺激反應(yīng)(Response to stimulus)參與基因17個(gè);生物調(diào)節(jié)(Biological regulation)參與基因15個(gè);發(fā)展過程(Developmental process)參與基因7個(gè);復(fù)制過程(Reproductive process)參與基因6個(gè),多微生物過程(Multi-organism process)參與基因6個(gè);細(xì)胞組成的組織或生物起源(Cellular component organization or biogenesiss)參與基因6個(gè);多細(xì)胞有機(jī)體過程(Multicellular organismal process)參與基因2個(gè);生長(zhǎng)(Growth)參與基因2個(gè);定位(Localization)參與基因2個(gè);免疫系統(tǒng)過程(Immune system process)參與基因1個(gè)。細(xì)胞組成(cellular component)中細(xì)胞組分(Cell part)參與基因59個(gè);細(xì)胞膜組分(Membrane part)參與基因26;細(xì)胞器官(Organelle)參與基因29;細(xì)胞膜(Membrane)參與基因16個(gè);細(xì)胞外區(qū)域(Extracellular region)參與基因9個(gè);細(xì)胞器官組分(Organelle part)參與基因9個(gè);復(fù)雜的大分子(Macromolecular complex)參與基因8個(gè);細(xì)胞外區(qū)組分(Extracellular region part)參與基因2個(gè)。分子功能(Molecular Function)中催化作用(Catalytic)參與基因51;粘合物(Binding)參與基因47個(gè);核轉(zhuǎn)錄因子和綁定(Nucleic acid binding transcription factor)參與基因11個(gè);選擇載體(Electron carrier)參與基因5個(gè);運(yùn)輸(Transporter)參與基因5個(gè);信號(hào)轉(zhuǎn)換器(Signal transducer)參與基因2個(gè);分子傳感器(Molecular transducer)參與基因1個(gè);分子結(jié)構(gòu)(Structural molecule)參與基因1個(gè);翻譯機(jī)構(gòu)(Translation regulator)參與基因1個(gè);轉(zhuǎn)錄因子活性,蛋白質(zhì)綁定(Transcription factor activity,protein binding)參與基因1個(gè)。
圖4 GO分析樣本2
TEST02-CONTRIL02組合差異基因被定位到了生物過程(biological process)中細(xì)胞過程(Cellular processs)參與基因793個(gè);代謝過程(Metabolic processs)參與基因642個(gè);單一生物體過程(Single-organism processs)參與基因475個(gè);生物調(diào)節(jié)(Biological regulation)參與基因317個(gè);細(xì)胞組成的組織或生物起源(Cellular component organization or biogenesiss)參與基因199個(gè);刺激反應(yīng)(Response to stimulus)參與基因314個(gè);發(fā)展過程(Developmental process)參與基因226個(gè);定位(Localization)上下調(diào)基因144個(gè);復(fù)制過程(Reproductive process)參與基因122個(gè);多細(xì)胞有機(jī)體過程(Multicellular organismal process)參與基因95個(gè);多微生物過程(Multi-organism process)上下調(diào)基因67個(gè);生長(zhǎng)(Growth)參與基因20個(gè);生物階段(Biological phase)參與基因9個(gè);免疫系統(tǒng)過程(Immune system process)參與基因15個(gè);生長(zhǎng)運(yùn)轉(zhuǎn)(Locomotion)參與基因10個(gè);解毒作用(Detoxification)參與基因2個(gè);生物附著(Biological adhesion)參與基因2個(gè);信號(hào)(Signaling)參與基因1個(gè);反應(yīng)(Behavior)參與基因1個(gè);細(xì)胞殺傷功能(Cell killing)參與基因1個(gè)。細(xì)胞組成(cellular component)中細(xì)胞組分(Cell part)參與基因943個(gè);細(xì)胞器官(Organelle)參與基因577個(gè);細(xì)胞器官組分(Organelle part)參與基因322個(gè);復(fù)雜的大分子(Macromolecular complex)參與基因187;細(xì)胞膜組分(Membrane part)參與基因321個(gè);細(xì)胞膜(Membrane)參與基因167個(gè);細(xì)胞外區(qū)域(Extracellular region)參與基因95個(gè);復(fù)雜的超分子(Supramolecular complex)參與基因27個(gè);細(xì)胞接合(Cell junction)參與基因40個(gè);細(xì)胞外區(qū)域(Extracellular region part)參與基因9個(gè);關(guān)閉的膜腔(Membrane-enclosed lumen)參與基因7個(gè);擬核(Nucleoid)參與基因2個(gè);;病毒粒子部分(Virion part)參與基因2個(gè);其他有機(jī)體的一部分(Other organism part)參與基因2個(gè)。分子功能(Molecular Function)中粘合物(Binding)參與基因786個(gè);催化作用(Catalytic)參與基因636個(gè);運(yùn)輸(Transporter)參與基因95個(gè);核轉(zhuǎn)錄因子和綁定(Nucleic acid binding transcription factor)參與基因97個(gè);分子結(jié)構(gòu)(Structural molecule)參與基因34個(gè);分子功能監(jiān)管機(jī)構(gòu)(Molecular function regulator)參與基因20個(gè);選擇載體(Electron carrier)參與基因35個(gè);信號(hào)轉(zhuǎn)換器(Signal transducer)參與基因21個(gè);分子傳感器(Molecular transducer)參與基因9個(gè);轉(zhuǎn)錄因子活性,蛋白質(zhì)綁定(Transcription factor activity,protein binding)參與基因4個(gè);抗氧化(Antioxidant)參與基因4個(gè);抗氧化(Nutrient reservoir)參與基因3個(gè)。
圖5 GO分析樣本3
TEST03-CONTRIL03組合差異基因被定位到了生物過程(biological process)中代謝過程(Metabolic processs)參與基因651個(gè);細(xì)胞過程(Cellular processs)參與基因652個(gè);單一生物體過程(Single-organism processs)參與基因424個(gè);生物調(diào)節(jié)(Biological regulation)參與基因277個(gè);(Response to stimulus)參與基因311個(gè);刺激反應(yīng)發(fā)展過程(Developmental process)參與基因128個(gè);定位(Localization)參與基因125個(gè);復(fù)制過程(Reproductive process)參與基因78個(gè);多細(xì)胞有機(jī)體過程(Multicellular organismal process)參與基因67個(gè);細(xì)胞組成的組織或生物起源(Cellular component organization or biogenesiss)參與基因83個(gè);多微生物過程(Multi-organism process)參與基因68個(gè);免疫系統(tǒng)過程(Immune system process)參與基因29個(gè);生長(zhǎng)(Growth)參與基因25個(gè);信號(hào)(Signaling)參與基因5個(gè);有節(jié)奏的過程(Rhythmic process)參與基因3個(gè);反應(yīng)(Behavior)參與基因3個(gè); 復(fù)制(Reproduction)參與基因1個(gè);生物附著(Biological adhesion)參與基因2個(gè);生長(zhǎng)運(yùn)轉(zhuǎn)(Locomotion)參與基因2個(gè)。細(xì)胞組成(cellular component)中細(xì)胞組分(Cell part)參與基因820個(gè);細(xì)胞器官(Organelle)參與基因435個(gè);細(xì)胞膜組分(Membrane part)參與基因379個(gè);細(xì)胞膜(Membrane)參與基因310個(gè);細(xì)胞器官組分(Organelle part)參與基因226個(gè);細(xì)胞外區(qū)域(Extracellular region)參與基因115個(gè);復(fù)雜大分子(Macromolecular complex)參與基因93個(gè);細(xì)胞接合(Cell junction)參與基因48個(gè);細(xì)胞外區(qū)域(Extracellular region part)參與基因14個(gè);復(fù)雜的超分子(Supramolecular complex)參與基因10個(gè);突觸部分(Synapse part)參與基因1個(gè);關(guān)閉的膜腔(Membrane-enclosed lumen)參與基因3個(gè)。分子功能(Molecular Function)中催化作用(Catalytic)參與基因711個(gè);粘合物(Binding)參與基因703個(gè);核轉(zhuǎn)錄因子和綁定(Nucleic acid binding transcription factor)參與基因115個(gè);運(yùn)輸(Transporter)參與基因93個(gè);選擇載體(Electron carrier)參與基因67個(gè);信號(hào)轉(zhuǎn)換器(Signal transducer)參與基因39個(gè);分子結(jié)構(gòu)(Structural molecule)參與基因25個(gè);分子傳感器(Molecular transducer)參與基因22個(gè);分子功能監(jiān)管機(jī)構(gòu)(Molecular function regulator)參與基因27個(gè);氧化(Antioxidant)參與基因6個(gè);抗氧化(Nutrient reservoir)參與基因5個(gè);轉(zhuǎn)錄因子活性,蛋白質(zhì)綁定(Transcription factor activity,protein binding)參與基因2個(gè)。
2.4.4 KEGG通路分析 KEGG(Kyoto Encyclopedia of genes and Genomes,京都基因與基因組百科全書)是基因組破譯方面的數(shù)據(jù)庫(kù),在給出染色體中一套完整基因的情況下,它可以對(duì)蛋白質(zhì)交互(互動(dòng))網(wǎng)絡(luò)在各種各樣的細(xì)胞活動(dòng)中起的作用進(jìn)行預(yù)測(cè)。為了方便查看PAthway在每個(gè)比較中的富集程度,取所有樣品的顯著性Map的并集,并根據(jù)q值做出分布圖,結(jié)果如下:
圖6 KEGG通路分析
取所有樣品富集的GO條目進(jìn)行分析,縱坐標(biāo)為GO的條目,橫坐標(biāo)為不同樣品的名稱,不同的顏色,代表不同的富集程度。通過圖表可以看出,3個(gè)對(duì)照組合樣品PAthway的富集程度顯著性,主要體現(xiàn)在DNA replication(DNA復(fù)制)、Homologous reciombination(同源性重組)、Mismatch repair(錯(cuò)配修復(fù))、Nucleotide excision repair(核苷酸切除修復(fù))、Plant hormone signal transduction(植物荷爾蒙信號(hào)傳導(dǎo))、Non-homologous end-joining(非同源末端連接物)、Base excision repair(堿基切除修復(fù))、Phenylpopanoid biosythesis(苯丙素生物合成)、Isoflavonoid biosynthesis(異黃酮類生物合成)、Brassinosteroid biosynthesis(油菜類固醇生物合成)、Thiamine metabolism(硫胺素新陳代謝)這11個(gè)代謝過程。
通過GO和KEGG通路分析,將差異基因比對(duì)到不同的分子功能及代謝途徑中,發(fā)現(xiàn)兩個(gè)基因調(diào)控的蛋白質(zhì)和大花黃牡丹的雄蕊瓣化有關(guān)。參考Hua Ling等[5]關(guān)于油菜雄性不育和Seonghoe Jang等[6]關(guān)于水稻多花的研究。分別篩選得到GDSL esterase/lipase At1g54790、Polygalacturonase-inhibiting protein 2個(gè)基因參與大花黃牡丹的雄蕊瓣化。
針對(duì)Hua Ling等人關(guān)于油菜雄性不育和Seonghoe Jang等人關(guān)于水稻多花的文章。油菜雄性不育代謝過程中的GDSL esterase/lipase At1g54790基因和大花黃牡丹雄蕊瓣化所調(diào)控的基因有相似之處。但是雄蕊的瓣化最終的結(jié)果就是不育。不育并一定就代表雄蕊瓣化,這其中有許多基因的協(xié)同作用,因而只能說油菜的不育和大花黃牡丹的雄蕊瓣化有著類似的基因注釋的功能蛋白。水稻多花的代謝過程中基因不再葉片上表達(dá),該基因被干涉后導(dǎo)致水稻花器官數(shù)量改變,包括雄蕊、外面的穎殼等。同時(shí)該基因表達(dá)影響多個(gè)花器官發(fā)育相關(guān)基因的改變。polygalacturonase proteing基因可作為導(dǎo)致大花黃牡丹雄蕊瓣化的重點(diǎn)。
通過對(duì)2個(gè)相關(guān)基因的比較,Seonghoe Jang等人關(guān)于水稻多花的文章中,提出的polygalacturonase proteing基因,是導(dǎo)致大花黃牡丹雄蕊瓣化的最有可能的基因,接下來的工作,找到大花黃牡丹中該基因進(jìn)行驗(yàn)證,確定它是否是導(dǎo)致大花黃牡丹雄蕊瓣化的基因。