錢晨,劉智微,鐘小仙*,吳娟子,張建麗,潘玉梅
(1.江蘇省農(nóng)業(yè)科學(xué)院畜牧研究所, 江蘇 南京 210014;2.農(nóng)業(yè)部種養(yǎng)結(jié)合重點實驗室, 江蘇 南京 210014)
禾本科植物的自交不親和屬于配子體自交不親和,受到2個不連鎖的復(fù)等位基因座S和Z控制, 比單位點控制的自交不親和分子機制更為復(fù)雜[1]。至今為止, 這2個基因仍然沒有被成功克隆[2]。近年來禾本科自交不親和相關(guān)機制研究主要圍繞在轉(zhuǎn)錄水平開展并取得了明顯進展。天藍虉草(Phalarisarundinacea)的研究中發(fā)現(xiàn)了新的自交不親和控制位點T[3]并利用差異顯示的方法中克隆到一個與自交不親和相關(guān)的關(guān)鍵基因:硫氧還蛋白(thioredoxin)基因[4];多年生黑麥草(Loliumperenne)的研究中則通過cDNA-AFLP擴增獲得的一些與自交不親和現(xiàn)象密切相關(guān)的蛋白酶類轉(zhuǎn)錄衍生片段基因, 如蛋白激酶、肌動蛋白、GTP結(jié)合蛋白或泛素相關(guān)的蛋白, 其中包括鈣依賴受體激酶(calcium-dependent protein kinase, CDPK)以及一些包含有鈣離子結(jié)合結(jié)構(gòu)域的多肽[5-6]。
隨著現(xiàn)代分子生物學(xué)研究技術(shù)的快速發(fā)展, 利用芯片雜交或基于第二代高通量測序技術(shù)等可以在全基因組轉(zhuǎn)錄水平分析基因表達特征, 對于沒有參考基因組的物種, 可以進行denovo轉(zhuǎn)錄組測序研究, 這為研究植物自交不親和反應(yīng)提供了更有利的條件。近年來這項技術(shù)已被應(yīng)用于植物自交不親和反應(yīng)的分子機理研究[7], Zhang等[8]通過比較分析短莛飛蓬(Erigeronbreviscapus)開花組織自花授粉和異花授粉的表達譜, 初步闡述了菊科植物自交不親和反應(yīng)的分子機理,同時篩選了240個相關(guān)差異表達基因并克隆了7個自交不親和反應(yīng)的關(guān)鍵基因。
海濱雀稗(Paspalumvaginatum)作為禾本科多年生草本植物, 具有耐澇、耐旱、耐踐踏以及耐鹽等特性[9-14], 是優(yōu)良的草坪草種和牧草資源[15-16], 但由于其自交不親和特性限制了它的推廣應(yīng)用。獲得自交結(jié)實的突變體是研究植物自交不親和反應(yīng)分子機制的關(guān)鍵環(huán)節(jié)。由于缺乏自交結(jié)實突變體, 海濱雀稗自交不親和的研究進展緩慢。隨著科學(xué)技術(shù)的進步人們逐漸掌握了創(chuàng)造突變體的各種手段, 利用化學(xué)藥劑誘發(fā)植物產(chǎn)生遺傳變異獲得自然界沒有的或一般常規(guī)方法難以獲得的新表現(xiàn)型、新突變、新基因, 豐富了遺傳變異范疇[17]。鐘小仙等[18]以二倍體海濱雀稗品種Adalayd (2n=20, DD)為材料, 通過化學(xué)誘變獲得了自交結(jié)實的體細胞突變體, 細胞學(xué)檢測發(fā)現(xiàn)突變體的染色體數(shù)目較野生型沒有發(fā)生變化(2n=20), 二倍體自交結(jié)實型海濱雀稗特異種質(zhì)的獲得, 為研究海濱雀稗自交結(jié)實分子機制提供了可能。但由于海濱雀稗基因數(shù)據(jù)庫資源十分匱乏, 限制了相關(guān)的研究[19], 本研究以自交結(jié)實突變體和野生型為材料, 結(jié)合轉(zhuǎn)錄組測序方法篩選自交不親和相關(guān)的差異表達基因, 為解析二倍體海濱雀稗自交不親和分子機制的研究提供了新的思路。
試驗材料為二倍體自交結(jié)實海濱雀稗突變體“SP2008-3”和海濱雀稗品種“Adalayd”, 自交結(jié)實海濱雀稗突變體“SP2008-3”由江蘇省農(nóng)業(yè)科學(xué)院畜牧研究所化學(xué)誘變獲得。突變體“SP2008-3”自交結(jié)實率可達80%以上, 海濱雀稗品種“Adalayd”自交不結(jié)實。試驗于2013 年9 月在江蘇省農(nóng)業(yè)科學(xué)院畜牧研究所大田中進行, 選取長勢良好、健康、生長期一致植株的5個幼穗組織, 幼穗組織中包含了柱頭、子房、花藥等植物生殖器官組織。剪取幼穗組織后迅速將其放入紙袋內(nèi), 立即用液氮速凍后保存于實驗室-80 ℃超低溫冰箱中備用。
利用TRhoL法提取試驗材料海濱雀稗幼穗組織的總RNA。提取的RNA樣品加入75%乙醇于-80 ℃超低溫冰箱中保存?zhèn)溆谩?/p>
提取樣品總RNA, 建立測序文庫后用Illumina HiSeq 2000 進行測序。采用Illumina兩個末端(PE)測序法, 原始的測序結(jié)果去除制備文庫時產(chǎn)生的接頭序列、兩端低質(zhì)量序列和低度復(fù)雜序列, 利用SOAPdenovo軟件進行序列拼接, 之后通過連接兩末端和填補空位, 將拼接成的重疊群(contig), 進一步組裝成Unigene。轉(zhuǎn)錄組測序產(chǎn)生的原始序列信息已提交到NCBI的SRA數(shù)據(jù)庫(SRA Bioproject: SRR3747528)。
將樣本Unigene與公共數(shù)據(jù)gene進行比較, 通過gene的相似性進行功能注釋?;蛳嗨菩员葘χ饕贐LAST算法。使用BLAST程序?qū)⑵唇拥玫降?Unigene與核酸、蛋白質(zhì)數(shù)據(jù)庫進行比對(E值≤1×10-10), 選取最佳的功能注釋。核酸數(shù)據(jù)庫為NCBI的非冗余核酸序列數(shù)據(jù)庫(non-redundant nucleotide database, Nt), 蛋白質(zhì)數(shù)據(jù)庫包NCBI的非冗余核酸數(shù)據(jù)庫(non-redundant protein database, Nr)和蛋白質(zhì)序列數(shù)據(jù)庫(swissprot protein sequence database,SwissProt)。根據(jù)NCBI數(shù)據(jù)庫的功能注釋信息, 使用Blast2 GO軟件得到Unigene的GO條目, 然后用WEGO軟件對所有的Unigene進行GO功能分類統(tǒng)計。然后對Unigene分別進行蛋白質(zhì)直系同源數(shù)據(jù)庫(cluster of orthologous groups, COG)功能分類和京都基因與基因組百科全書(kyoto encyclopedia of genes and genomes, KEGG)代謝途徑分析。
二倍體自交結(jié)實海濱雀稗突變體SP2008-3和野生型兩個表達譜之間的差異表達分析, 旨在找出不同樣本間存在差異表達的Unigene, 再利用RNA-seq數(shù)據(jù)比較分析兩個樣品中同一個Unigene是否存在差異表達。利用錯誤發(fā)現(xiàn)率(false discovery rate,FDR)值的計算方法先要對每個Unigene進行P-value的計算, 再用FDR錯誤控制法對P-value作多重假設(shè)檢驗校正, fold change是實驗組與對照組的差異表達倍數(shù)。默認篩選差異的條件為P≤0.05, 本實驗設(shè)定的fold change是表達相差2倍以上為有意義差異表達基因, 最終篩選出兩個表達譜之間的差異表達基因。
本研究采用了Illumina Hiseq 2000高通量測序技術(shù)對海濱雀稗幼穗組織進行轉(zhuǎn)錄組測序, 共得到了68175654個Raw reads片段。denovo拼接共獲得了≥200 bp的contig序列208884個, 其中≥500 bp的contig序列有122390個, 而≥1000 bp的contig序列有76934個。在contig數(shù)據(jù)的基礎(chǔ)上, 進一步對序列進行組裝, 共獲得117619個Unigene序列, 平均長度為717.88 bp, N50為1259 bp;其中≥500 bp的Unigene有47168個, 而≥1000 bp的Unigene序列有26553個(表1)。
表1 海濱雀稗轉(zhuǎn)錄contig和Unigene數(shù)據(jù)組裝統(tǒng)計Table 1 Data assembly for contig and Unigene in the transcriptome of P. vaginatum (bp)
將樣本Unigene與公共數(shù)據(jù)gene進行比較, 通過Unigene的相似性進行功能注釋。將Unigene序列, 分別與蛋白質(zhì)序列數(shù)據(jù)庫SwissProt、翻譯核苷酸序列蛋白數(shù)據(jù)庫TrEMBL(translated EMBL nucleotide sequence data library)、保守結(jié)構(gòu)域數(shù)據(jù)庫CDD(conserved domain database)、蛋白家族數(shù)據(jù)庫PFAM(protein families database)、非冗余核酸數(shù)據(jù)庫Nr和真核同源群數(shù)據(jù)庫KOG(eukaryotic orthologous groups)進行比對, 取相似度>30%, 且e<1e-5的進行注釋, 合并得到的所有注釋詳細信息, 注釋結(jié)果表明有58810個Unigene可在Nr數(shù)據(jù)庫中注釋上信息, 占總Unigene數(shù)的50%;相似序列匹配的近緣物種中, 高粱(Sorghumbicolor, 53.72%)占的比例最高,之后依次為玉米(Zeamays, 20.64%)、水稻(Oryzasativacv.Japonica, 8.25%)、短柄草(Brachypodiumdistachyon, 3.50%)、另外一個水稻品種(Oryzasativacv.indica, 3.38%)、大麥(Hordeumvulgare1.51%)(圖1)。在與蛋白質(zhì)序列數(shù)據(jù)庫SwissProt、翻譯核苷酸序列蛋白數(shù)據(jù)庫TrEMBL、保守結(jié)構(gòu)域數(shù)據(jù)庫CDD、蛋白家族數(shù)據(jù)庫PFAM 4個數(shù)據(jù)比對后, 有28663、59709、26042、50942個Unigene分別被注釋上信息(表2),有近50%的Unigene在數(shù)據(jù)庫中無法被注釋上信息。
圖1 海濱雀稗Unigene的序列Nr數(shù)據(jù)庫相似性分析Fig.1 Characteristics of blast homology search of all assembled Unigenes against the Nr
項目 Item比對的unigene總數(shù) All blast unigene number非冗余核酸數(shù)據(jù)庫Non-redundant protein database (Nr)蛋白質(zhì)序列數(shù)據(jù)庫Swissprot protein sequence database (SwissProt)翻譯核苷酸序列蛋白數(shù)據(jù)庫Translated EMBL nucleotide sequence data library (TrEMBL)保守結(jié)構(gòu)域數(shù)據(jù)庫Conserved domain database (CDD)蛋白家族數(shù)據(jù)庫Protein families database (PFAM)注釋信息的基因數(shù) Annotaion unigene number1176195881028663597092604250942百分比 Percentage100%50.00%24.37%50.76%22.14%43.31%
GO分析表明, 可將海濱雀稗Unigene劃分為62個功能組, 并對每個功能組涉及的Unigene進行統(tǒng)計分析(圖2)。分析發(fā)現(xiàn)19028個Unigene歸屬細胞組分, 36159個Unigene歸屬分子功能, 32782個Unigene歸屬生物學(xué)過程。Unigene的功能在生物學(xué)過程(biological process)中主要聚集于細胞進程(cellular process)和代謝進程(metabolic process);在細胞組分(cellular component)中主要聚集于細胞成分(cell part)和細胞(cell);在分子功能(molecular function)分類中主要聚集于結(jié)合活性(binding activity)和催化活性(catalytic activity)。
對海濱雀稗的Unigene進行COG功能分類, 預(yù)測發(fā)現(xiàn)共有15835個Unigene被注釋上25種COG分類(圖3)。Unigene涉及的COG功能類別比較全面, 涉及了大多數(shù)的生命活動。其中信號傳導(dǎo)機制(signal transduction mechanisms)類的基因最多(3559個)、其次是翻譯后修飾, 蛋白質(zhì)折疊和分子伴侶(posttranslational modification, protein turnover, chaperones)(2966個)、一般功能預(yù)測(general function prediction only)(2418個)、翻譯, 核糖體結(jié)構(gòu)和生物發(fā)生(translation, ribosomal structure and biogenesis)類基因(1615個)、細胞內(nèi)運轉(zhuǎn), 分泌和小泡運輸(intracellular trafficking, secretion, and vesicular transport)(1533個);細胞運動(cell motility)類基因則是最少的(9個);其他類別的基因所占數(shù)量各不相同。
圖2 海濱雀稗Unigene的GO分類Fig.2 Gene ontology (GO) classifications of assembled Unigenes 1:生物黏附Biological adhesion;2:生物調(diào)節(jié)Biological regulation;3:細胞殺傷Cell killing;4:細胞成分組織的生物發(fā)生Cellular component orgarization of biogenesis;5:細胞進程Cellular process;6:發(fā)育進程Developmental process;7:定位活性Establishment of localization;8:生長Growth;9:免疫系統(tǒng)進程Immune system process;10:定位Localization;11:代謝進程Metabolic process;12:有機體進程Multi-organism process;13:有機體多細胞進程Multicellular organismal process;14:生物進程負調(diào)控Negative regulation of biological process;15:生物進程正調(diào)控Positive regulation of biological process;16:生物進程的調(diào)控Regulation of biological process;17:繁殖Reproduction;18:繁殖進程Reproductive process;19:應(yīng)激反應(yīng)Response to stimulus;20:節(jié)律進程Rhythmic process;21:信號傳導(dǎo)Signaling;22:單組織進程Single-organism process;23:細胞Cell;24:細胞連接Cell junction;25:細胞成分Cell part;26:胞外基質(zhì)Extracellular matrix;27:胞外基質(zhì)成分Extracellular matrix part;28:胞外區(qū)域Extracellular region;29:胞外區(qū)域成分Extracellular region part;30:復(fù)雜大分子Macromolecular complex;31:膜成分Membrane part;32:膜關(guān)閉內(nèi)腔Membrane enclosed lumen;33:內(nèi)質(zhì)網(wǎng)相關(guān)的復(fù)雜黏附物Mitochondrion-associated adherens complex;34:類核Nucleoid;35:細胞器Organelle;36:細胞器成分Organelle part;37:共質(zhì)體Symplast;38:突觸Synapse;39:突觸成分Synapse;40:病毒Virion;41:病毒成分Virion part;42:D-丙酰胺載體活性D-alanyl carrier activity;43:抗氧化活性Antioxidant activity;44:結(jié)合活性Binding activity;45:催化活性Catalytic activity;46:通道調(diào)控活性Channel regulation activity;47:細胞趨化活性Chemoattractant activity;48:化學(xué)抗性活性Chemorepellent activity;49:電子傳遞體活性Electron carrier activity;50:酶調(diào)節(jié)活性Enzyme regulator activity;51:金屬伴侶活性Metallochaperone activity;52:分子轉(zhuǎn)導(dǎo)活性Molecular transducer activity;53:形態(tài)發(fā)生素活性Morphogen activity;54:結(jié)合核酸轉(zhuǎn)錄活性Nucleic acid binding transcription factor activity;55:營養(yǎng)庫活性Nutrient reservoir activity;56:結(jié)合蛋白轉(zhuǎn)錄活性Protein binding transcription factor activity;57:蛋白標簽Protein tag;58:受體活性Receptor activity;59:受體調(diào)控活性Receptor regulator activity;60:結(jié)構(gòu)分子活性Structural molecule activity;61:翻譯調(diào)節(jié)活性Translation regulator activity;62:轉(zhuǎn)運活性Transporter activity.
2.3.1差異表達基因的篩選 對海濱雀稗測序獲得的Unigene進行功能注釋后, 篩選自交結(jié)實海濱雀稗突變體SP2008-3與對照野生型Adalayd之間的顯著性差異表達基因。本研究中, 差異表達基因條件是差異表達的倍數(shù)≥2(即 |log2Ratio|≥1)且 FDR≤0.001 的基因,比較兩個表達譜發(fā)現(xiàn)SP2008-3較Adalayd共有差異表達基因1303個,其中上調(diào)表達基因373個,下調(diào)表達基因930個(圖4)。
2.3.2差異表達基因的GO分析 通過比較SP2008-3和Adalayd兩個表達譜獲得1303個差異表達的Unigene之后, 對差異表達Unigene進行GO分析, 對其功能進行描述。 統(tǒng)計每個GO條目中所包括的差異Unigene個數(shù), 并用超幾何分布檢驗方法計算每個GO條目中差異表達的Unigene富集的顯著性(圖5)??梢愿鶕?jù)GO分析的結(jié)果結(jié)合生物學(xué)意義挑選用于后續(xù)研究的Unigene。Unigene的功能在生物學(xué)過程(biological process)中主要聚集于應(yīng)激反應(yīng)(response to stress)和光合作用(photosynthesis);在細胞組分(cellular component)中主要聚集于細胞壁(cell wall)和葉綠體(chloroplast);在分子功能(molecular function)分類中主要聚集于果膠質(zhì)酶活性(pectinesterase activity)和酶抑制劑活性(enzyme inhibitor activity)。
2.3.3差異表達基因的KEGG分析 將1303個差異表達基因的注釋信息與KEGG中酶注釋的關(guān)系文件進行分析從而映射到不同的通路中, 分析結(jié)果總共獲得了147張通路圖, 如圖6列出了富集, 其中戊糖和葡萄糖醛酸鹽相互轉(zhuǎn)化(pentose and glucuronate interconv-ersions)和光合天線蛋白(photosynthesis-antenna proteins)富集的差異表達基因最多。分別將上調(diào)基因和下調(diào)基因進行KEGG歸類, 分析發(fā)現(xiàn)930個下調(diào)基因歸類出106個通路, 其中歸為淀粉和蔗糖代謝途徑的差異表達基因最多, 共有31個;其次是葡萄糖醛酸轉(zhuǎn)換途徑, 共有27個差異表達基因歸入其中;再次是植物和病原菌互作途徑, 共有20個基因歸入其中。而將373個上調(diào)基因進行KEGG功能分析發(fā)現(xiàn), 共歸納出86張通路圖, 其中歸為內(nèi)質(zhì)網(wǎng)蛋白加工途徑的差異表達基因最多, 共有23個;其次是光和生物固碳, 共有20個差異表達基因歸于其中;再次是谷胱甘肽代謝途徑, 共有12個差異表達基因歸入其中。
圖3 海濱雀稗Unigene的COG功能分類Fig.3 Histogram of clusters of orthologous groups (COG) classification A:RNA加工和修飾 RNA processing and modification;B:染色質(zhì)結(jié)構(gòu)和活力 Chromatin structure and dynamics;C:能量生成和轉(zhuǎn)換 Energy production and conversion;D:細胞周期控制, 細胞分裂, 染色體分區(qū) Cell cycle control, cell division, chromosome partitioning;E:氨基酸運輸和代謝 Amino acid transport and metabolism;F:核苷酸運輸和代謝 Nucleotide transport and metabolism;G:碳水化合物運輸和代謝 Carbohydrate transport and metabolism;H:輔酶運輸和代謝 Coenzyme transport and metabolism;I:脂質(zhì)運輸和代謝 Lipid transport and metabolism;J:翻譯, 核糖體結(jié)構(gòu)和生物發(fā)生 Translation, ribosomal structure and biogenesis;K:轉(zhuǎn)錄 Transcription;L:復(fù)制, 重組和修復(fù) Replication, recombination and repair;M:細胞壁/薄膜/膜的生物發(fā)生 Cell wall/membrane/envelope biogenesis;N:細胞運動 Cell motility;O:翻譯后修飾, 蛋白質(zhì)折疊和分子伴侶 Posttranslational modification, protein turnover, chaperones;P:礦脂運輸和代謝 Inorganic ion transport and metabolism;Q:次生代謝物合成, 運輸和代謝 Secondary metabolites biosynthesis, transport and catabolism;R:一般功能預(yù)測 General function prediction only;S:功能未知 Function unknown;T:信號傳導(dǎo)機制 Signal transduction mechanisms;U:細胞內(nèi)轉(zhuǎn)運, 分泌及小泡運輸 Intracellular trafficking, secretion, and vesicular transport;V:防衛(wèi)機制 Defense mechanisms;W:胞外結(jié)構(gòu) Extracellular structures;Y:核結(jié)構(gòu) Nuclear structure;Z:細胞骨架 Cytoskeleton.
圖4 海濱雀稗SP2008-3突變體與Adalayd的差異表達基因Fig.4 Differentially expressed genes in self-compatibility mutant SP2008-3 and Adalayd M: SP2008-3突變體Self-compatibility mutant SP2008-3; CK: Adalayd.
通過比較分析測序基因在自交結(jié)實突變和自交不親和Adalayd對照中的表達量差異, 結(jié)合前期研究中發(fā)現(xiàn)的與植物自交不親和相關(guān)的通路或基因, 對1303個差異表達基因進行篩選。本研究獲得的數(shù)據(jù)中篩選出了3類與二倍體海濱雀稗自交不親和相關(guān)的通路或基因, 包括14個鈣離子通路基因, 3個F-box基因和5個硫氧還蛋白基因(表3)。
2.4.1鈣信號通路差異表達基因 本研究通過比較突變體和Adalayd的表達譜發(fā)現(xiàn), 其中有一個鈣調(diào)素基因(comp36284) 在Adalayd中發(fā)生下調(diào)表達;其中有8個鈣依賴蛋白激酶(comp53237, comp37823,comp24441, comp61028,comp61403, comp58623,comp10880, comp9941)在Adalayd中發(fā)生下調(diào)表達;5個類鈣調(diào)素互作蛋白激酶基因(comp63471, comp10442, comp8817, comp8819, comp49346), 其中有3個類鈣調(diào)素互作蛋白激酶基因(CBL-interacting protein kinase, CIPK)基因(comp8817, comp8819, comp49346)在Adalayd中發(fā)生下調(diào)表達, 2個CIPK基因(comp63471, comp10442) 則在突變體中發(fā)生上調(diào)表達。進而對14個鈣離子通路基因的KEGG歸類發(fā)現(xiàn)其中鈣調(diào)素基因(comp36284)歸為植物和病原菌互作途徑, 8個鈣依賴蛋白激酶則共同歸入了toxoplasmosis途徑中, 而5個類鈣調(diào)素互作蛋白激酶基因并未在KEGG數(shù)據(jù)庫中找到相應(yīng)的功能途徑。對14個鈣離子通路基因的GO分析發(fā)現(xiàn)8個鈣依賴蛋白激酶基因中有7個基因(comp53237, comp24441, comp61028, com61-403, comp58623, comp10880, comp9941)在生物學(xué)過程(biological process)中歸為蛋白質(zhì)磷酸化, 一個鈣依賴蛋白激酶基因(comp37823)和一個鈣調(diào)素基因(comp36284) 僅知其為鈣離子途徑基因, 參與的生物學(xué)過程尚且未知;5個類鈣調(diào)素互作蛋白激酶基因中3個類鈣調(diào)素互作蛋白激酶基因(comp8817, comp8819, comp49346)在生物學(xué)過程(biological process)中歸為蛋白質(zhì)磷酸化和信號傳導(dǎo), 另2個類鈣調(diào)素互作蛋白激酶基因(comp63471, comp10442)的生物學(xué)過程未知。由此可初步判斷鈣信號途徑中多數(shù)基因是通過蛋白磷酸化的方式參與到了二倍體海濱雀稗自交不親和途徑中, 其中涉及了鈣信號的傳導(dǎo), 傳導(dǎo)的過程主要是蛋白激酶參與其中。
圖5 按照參與的生物學(xué)過程、分子功能、細胞組分標準差異表達基因的GO分類結(jié)果Fig.5 Classfication of differentially expressed genes according to biological process, molecular function, cellular component 1: 應(yīng)激反應(yīng)Response to stress;2: 光合作用Photosynthesis;3: 催化活性負調(diào)控Negative regulation of catalytic activity;4: 細胞壁修飾Cell wall modification;5: 光合作用的光能捕獲Photosynthesis light harvesting;6: 五碳糖磷酸還原循環(huán)Reductive pentose-phosphate cycle;7: 植物形態(tài)的細胞壁組織Plant-type cell wall organization;8: 染色體蛋白的連接Protein-chromophore linkage;9: 脂運輸Lipid transport;10: 糖運輸Carbohydrate transport;11: 硫同化Sulfate assimilation;12: 果實催熟Fruit ripening;13: 過氧化氫分解代謝進程Hydrogen peroxide catabolic process;14: 固氮作用Nitrogen fixation;15: 水反應(yīng)Response to water;16: 有性生殖Sexual reproduction;17: 噬菌作用Phagocytosis;18: 谷氨酰胺生物合成過程Glutamine biosynthetic process;19: 多糖分解代謝進程Polysaccharide catabolic process;20: 乙烯生物合成過程Ethylene biosynthetic process;21: 細胞壁Cell wall;22: 葉綠體Chloroplast;23: 光系統(tǒng) Ⅰ Photosystem Ⅰ;24: 胞外區(qū)Extracellular region;25: 質(zhì)體Plastid;26: 葉綠體類囊體膜Chloroplast thylakoid membrane;27: 類囊體Thylakoid;28: 光系統(tǒng) Ⅱ Photosystem Ⅱ;29: 光系統(tǒng)Ⅰ反應(yīng)中心Photosystem Ⅰreaction center;30: 葉綠體膜Chloroplast membrane;31: 葉綠體基質(zhì)Chloroplast stroma;32: 液泡Vacuole;33: 細胞外間隙Extracellular space;34: 膜外Extrinsic to membrane;35: 放氧符合體Oxygen evolving complex;36: 葉綠體類囊體腔Chloroplast thylakoid lumen;37: 類囊體膜Thylakoid membrane;38: 膜Membrane;39: 細胞質(zhì)Cytoplasm;40: 液泡膜Vacuolar membrane;41: 果膠質(zhì)酶活性Pectinesterase activity;42: 酶抑制劑活性Enzyme inhibitor activity;43: 天冬氨酰酯酶活性Aspartyl esterase activity;44: 果膠裂解酶活性Pectate lyase activity;45: 葉綠素結(jié)合Chlorophyll binding;46: 脂結(jié)合Lipid binding;47: L-抗壞血酸過氧化物酶活性L-ascorbate peroxidase activity;48: 裂解酶活性Lyase activity;49: 鈣調(diào)蛋白結(jié)合Calmodulin binding;50: 谷胱甘肽轉(zhuǎn)移酶活性Glutathione transferase activity;51: 外切多聚半乳糖醒酸酶活性Galacturan 1,4-alpha-galac-turonidase activity;52: 1-氨基環(huán)丙烷-1-羧酸氧化酶活性1-aminocyclopropane-1-carboxylate oxidase activity;53: 谷氨酸氨連接酶活性Glutamate-ammonia ligase activity;54: 過氧化物酶活性Peroxidase activity;55: 磷酸甘油酸激酶活性Phosphoglycerate kinase activity;56: L-抗壞血酸結(jié)合L-ascorbic acid binding;57: β-淀粉酶活性Beta-amylase activity;58: 果糖二磷酸醛縮酶活性Fructose-bisphosphate aldolase activity;59: 甘油醛-3-磷酸脫氫酶Cytosolic glyceraldehyde-3-phosphate dehydrogenase;60: 碳酸鹽脫水酶活性Carbonate dehydratase activity.
2.4.2F-box基因 F-box蛋白基因被證實在S-RNase調(diào)控的植物自交不親和反應(yīng)中發(fā)揮了關(guān)鍵的作用, 在本研究中發(fā)現(xiàn)有3個F-box基因在結(jié)實突變體和自交不親和Adalayd的表達譜中存在差異表達, comp37969, comp38061 和comp45767這3個基因在突變體中較Adalayd發(fā)生了顯著的下調(diào)表達, 其中comp37969 和comp38061較comp45767發(fā)生了更為顯著的下調(diào)表達, 由此判斷F-box基因可能參與了二倍體海濱雀稗的自交不親和反應(yīng)。
2.4.3硫氧還蛋白 (thioredoxin)基因 本研究發(fā)現(xiàn)有5個硫氧還蛋白基因在結(jié)實突變體和自交不親和Adalayd的表達譜中存在差異表達, 其中2個硫氧還蛋白基因(comp62783, comp62777)在突變體中較Adalayd發(fā)生了上調(diào)表達, 而有3個硫氧還蛋白基因(comp34593, comp20916, comp63644)在突變體中較Adalayd發(fā)生了下調(diào)表達, 對5個硫氧還蛋白基因的GO分析發(fā)現(xiàn)4個硫氧還蛋白基因(comp62783,comp62777,comp34593, comp63644)在細胞組分中歸為細胞質(zhì), 生物學(xué)過程(biologica process)中歸為甘油醚代謝過程及運輸, 1個硫氧還蛋白基因(comp20916)則在細胞組分中歸為細胞質(zhì), 在生物學(xué)過程(biological process)中歸為色氨酸的代謝過程及運輸, 基因的差異表達表明硫氧還蛋白基因可能也參與了二倍體海濱雀稗的自交不親和反應(yīng), GO分析獲悉5個硫氧還蛋白基因作用于細胞的細胞質(zhì)中, 而不同表達量以及不同的生物學(xué)過程則需進一步研究。
圖6 1303個差異表達基因的KEGG分類結(jié)果Fig.6 Classfication of differentially expressed genes according to KEGG database 1:戊糖和葡萄糖醛酸鹽相互轉(zhuǎn)化Pentose and glucuronate interconversions;2:光合天線蛋白Photosynthesis-antenna proteins;3:光合生物中的碳固定Carbon fixation in photosynthetic organisms;4:光合作用Photosynthesis;5:淀粉和蔗糖的代謝Starch and sucrose metabolism;6:弓形蟲病Toxoplasmosis;7:抗原加工和提呈Antigen processing and presentation;8:植物和病原菌互作Plant-pathogen interaction;9:谷胱甘肽代謝Glutathione metabolism;10:化學(xué)致癌Chemical carcinogenesis;11:抗壞血酸與醛酸代謝Ascorbate and aldarate metabolism;12:細胞色素p450對外源化合物的代謝Metabolism of xenobiotics by cytochrome p450;13:內(nèi)質(zhì)網(wǎng)蛋白加工Protein processing in endoplasmic reticulum;14:硫代葡萄糖苷的生物合成Glucosinolate biosynthesis;15:細胞色素p450的藥物代謝Drug metabolism-cytochrome p450;16:類NOD受體信號通路NOD-like receptor signaling pathway;17:半胱氨酸和蛋氨酸代謝Cysteine and methionine metabolism;18:硫代謝Sulfur metabolism;19:苯丙氨酸代謝Phenylalanine metabolism;20:甲烷代謝Methane metabolism.
海濱雀稗相關(guān)的分子生物學(xué)研究基礎(chǔ)相對薄弱, 基因組測序尚未完成, 因此通過經(jīng)典遺傳學(xué)手段開展海濱雀稗自交不親和的分子機制研究十分困難, 隨著高通量測序技術(shù)的出現(xiàn), 此技術(shù)廣泛地應(yīng)用于很多無參考基因組物種的研究, 為研究海濱雀稗自交不親和反應(yīng)的分子機制, 挖掘關(guān)鍵基因提供了新的思路[20]。本研究應(yīng)用 Illumina 高通量測序技術(shù)對海濱雀稗穗部開花組織的轉(zhuǎn)錄組進行測序, 目的是為了比較自交結(jié)實突變體SP2008-3和自交不親和Adalayd兩個材料間表達譜的差異, 篩選差異表達基因, 同時也為海濱雀稗的分子生物學(xué)研究提供穗部的基因組數(shù)據(jù)信息。本研究的測序結(jié)果獲得了117619個單基因簇(Unigene),平均長度為717.88, N50為1259 bp, N50的數(shù)值越大, 則表現(xiàn)為組裝得到的長片斷越多, 組裝質(zhì)量就越高。本研究結(jié)果表明, 此次序列組裝的長度可以滿足轉(zhuǎn)錄組分析的基本要求。但在本研究中, 由于海濱雀稗尚未完成基因組測序, 因此只有58810 個Unigene(總Unigene的50%)被注釋上信息, 這說明有另外50%的Unigene無法預(yù)測其功能, 而這些未知功能的基因可能在海濱雀稗自交不親和反應(yīng)中發(fā)揮作用。但在現(xiàn)有研究基礎(chǔ)下, 無法進行篩選, 有待于將來海濱雀稗全基因組測序完成進行深入研究和挖掘。
本研究結(jié)合生物信息學(xué)理論對海濱雀稗測序結(jié)果進行了細致深入的分析, GO、COG以及KEGG分析可以初步將測序獲得的Unigene進行注釋和歸類。賈新平等[21]首次對海濱雀稗的葉部完成了轉(zhuǎn)錄組測序分析, 對46169個Unigene進行了GO、COG和KEGG分析, 將本研究結(jié)果與其進行初步的比較發(fā)現(xiàn), 在GO分析上結(jié)果大致相似;在COG分析結(jié)果上存在差異, 在葉部轉(zhuǎn)錄組測序的結(jié)果中歸類于“一般功能預(yù)測類基因”的Unigene最多, 而本研究中更多的Unigene歸類于“信號傳導(dǎo)機制”, 這些差異可能和不同的測序組織部位相關(guān), 本研究的測序分析結(jié)果進一步豐富了海濱雀稗不同組織部位的基因組數(shù)據(jù), 同時還對自交結(jié)實突變體與野生型對照之間的差異表達基因進行了GO、COG和KEGG分析, 為進一步挖掘海濱雀稗穗部自交不親和的重要表達基因, 開展相關(guān)重要基因的克隆及功能驗證等研究奠定了數(shù)據(jù)及理論基礎(chǔ)。
比較自交結(jié)實突變體和對照之間表達譜的差異, 結(jié)合相關(guān)的注釋信息從1303個差異表達的Unigene中發(fā)掘了一批可能與海濱雀稗自交不親和相關(guān)的基因, 其中包括了鈣離子通路基因、硫氧還蛋白基因以及F-box基因。
表3 各個通路上的差異表達基因分類及表達特征Table 3 Classification of gene expression pattern in different pathways
3.2.1鈣離子信號通路 Ca2+信號通路作為植物細胞的第二信使廣泛的參與到了植物的生長發(fā)育, 抗病抗逆等生理活動[22], 前期研究發(fā)現(xiàn)Ca2+介導(dǎo)了罌粟科、禾本科等一些物種的自交不親和反應(yīng)[23-25], Ca2+主要作用體現(xiàn)在Ca2+濃度的升高能夠抑制植物花粉管的伸長[26], 在罌粟科虞美人(Papaverrhoeas)自交不親和的研究中發(fā)現(xiàn)Ca2+通過傳遞信號介導(dǎo)柱頭的細胞程序性死亡從而影響花粉管生長造成罌粟科虞美人發(fā)生自交不親和反應(yīng)[27-28], 而在禾本科裸麥(Secalecereale)的研究中發(fā)現(xiàn)蛋白激酶阻遏物和Ca2+通道阻滯劑能夠抑制裸麥自交不親和反應(yīng)的發(fā)生[29], 由此可見Ca2+參與自交不親和與蛋白激酶相關(guān), 而Klaas等[6]對黑麥草(Loliumperenne)自交不親和的研究證實了這一點, 研究以自交結(jié)實突變體為基礎(chǔ)通過對黑麥草不成熟柱頭的cDNA-AFLP擴增篩選獲得了一個與自交不親和相關(guān)鈣依賴受體激酶(CDPK), 以及一些包含有鈣離子結(jié)合結(jié)構(gòu)域的多肽, 這些研究結(jié)果都表明Ca2+作為重要的傳導(dǎo)信號參與了植物自交不親和反應(yīng), 并且在參與過程中鈣離子信號相關(guān)的受體激酶在其中扮演著非常重要的作用, 在本研究中篩選到了1個鈣調(diào)素基因、8個鈣依賴蛋白激酶基因以及5個類鈣調(diào)素互作蛋白激酶基因在體細胞突變體SP2008-3和野生型Adalayd之間存在差異表達, 結(jié)合它們的表達量差異結(jié)果, 這些鈣離子通路基因可能參與了海濱雀稗自交不親和反應(yīng), 具體的功能正在進一步研究。
3.2.2硫氧還蛋白和F-box蛋白 硫氧還蛋白在禾本科以及十字花科的自交不親和反應(yīng)中發(fā)揮著重要的作用, 其中禾本科天藍虉草的自交不親和研究中發(fā)現(xiàn)的關(guān)鍵基因bm2是類硫氧還蛋白, 功能驗證發(fā)現(xiàn)bm2在天藍虉草自交不親和中發(fā)揮著非常重要的作用[4], 但bm2在其他禾本科植物中的同源基因并沒有發(fā)揮類似的作用, 因此類硫氧還蛋白參與禾本科自交不親和反應(yīng)存在著物種特異性, 本研究發(fā)現(xiàn)在自交結(jié)實突變體和對照之間有5個硫氧還蛋白基因存在差異表達, 這5個硫氧還蛋白是否參與了海濱雀稗自交不親和反應(yīng)以及具體發(fā)揮的功能則需要將來的研究進行驗證;F-box蛋白基因是在S-RNase體系中發(fā)現(xiàn)在植物自交不親和反應(yīng)中發(fā)揮作用[30], 尚未有參與禾本科自交不親和反應(yīng)的報道, 在體細胞突變體SP2008-3和野生型Adalayd的表達譜比較分析后, 也發(fā)現(xiàn)了3個F-box基因存在差異表達, 而這些基因是否參與到了海濱雀稗自交不親和反應(yīng)以及其功能則需要將來進一步地驗證。
本研究首次將轉(zhuǎn)錄組測序技術(shù)應(yīng)用于海濱雀稗自交不親和的研究中, 建立了海濱雀稗幼穗組織的轉(zhuǎn)錄組數(shù)據(jù)庫, 豐富了海濱雀稗的轉(zhuǎn)錄本信息, 在此基礎(chǔ)上挖掘了一批可能參與海濱雀稗自交不親和反應(yīng)的候選基因, 有助于進一步研究海濱雀稗自交不親和反應(yīng), 也為揭示禾本科植物自交不親和反應(yīng)的分子機制奠定了重要的基礎(chǔ)。