劉 源, 隋正紅??, 劉昊昕, Sadaf RIAZ,2
(1.中國(guó)海洋大學(xué)海洋生物遺傳學(xué)與育種教育部重點(diǎn)實(shí)驗(yàn)室, 山東 青島 266003; 2. Department of Microbiology,University of Veterinary and Animal Sciences, Lahore 54660, Pakistan)
鏈狀亞歷山大藻(Alexandriumpacificum)作為重要的赤潮甲藻,在全球范圍內(nèi)分布廣泛,對(duì)由其引發(fā)的赤潮的機(jī)理的研究受到了研究者的廣泛關(guān)注。研究表明,氮、磷濃度的升高對(duì)該藻的生長(zhǎng)有促進(jìn)作用[1]。鐵、錳等微量元素是觸發(fā)塔瑪亞歷山大藻爆發(fā)性增殖的重要因子之一,同樣在鏈狀亞歷山大藻中,錳濃度的提升(18~36 μg/L),使得其生長(zhǎng)速率也隨之上升。Laabir等的研究發(fā)現(xiàn)光照強(qiáng)度從10~90 μmol photons·m-2·s-1的提高,對(duì)鏈狀亞歷山大藻的生長(zhǎng)有促進(jìn)作用[2-3]。由于甲藻基因組巨大且復(fù)雜,目前的研究發(fā)現(xiàn)鏈狀亞歷山大藻基因組在60 G左右[4],因此在研究基因調(diào)控機(jī)制方面對(duì)轉(zhuǎn)錄組測(cè)序和研究就顯得更為重要。
表達(dá)譜及轉(zhuǎn)錄組通過篩選不同條件下差異表達(dá)基因進(jìn)行后續(xù)分析,所獲得的信息往往是碎片化的,可能會(huì)忽略不同處理或不同組織間基因的表達(dá)存在的內(nèi)在聯(lián)系或相關(guān)性。WGCNA以比較轉(zhuǎn)錄組或表達(dá)譜數(shù)據(jù)為基礎(chǔ),是一種從高通量數(shù)據(jù)中挖掘模塊信息的算法。與傳統(tǒng)的轉(zhuǎn)錄組分析重點(diǎn)關(guān)注差異表達(dá)基因不同,WGCNA分析采用皮爾遜相關(guān)系數(shù)或其他統(tǒng)計(jì)學(xué)方法衡量基因間的表達(dá)關(guān)系,從而構(gòu)建基因共表達(dá)模塊(Module),其分析可以覆蓋整個(gè)轉(zhuǎn)錄組,并將復(fù)雜的數(shù)據(jù)進(jìn)行歸納整理,從而對(duì)傳統(tǒng)轉(zhuǎn)錄組分析進(jìn)行補(bǔ)充并獲取新的發(fā)現(xiàn)。在高等植物中,通過轉(zhuǎn)錄組測(cè)序找到了羽衣甘藍(lán)不同組織的芥子油苷的代謝的相關(guān)基因,隨后對(duì)轉(zhuǎn)錄組測(cè)序得到的相關(guān)合成基因進(jìn)行WGCNA分析發(fā)現(xiàn),根以及衰老的葉子可能是芥子油合成發(fā)生的主要組織[5]。WGCNA理論最早在2005年提出,隨后在理論的基礎(chǔ)上完成了基于R語(yǔ)言完成相關(guān)軟件包的開發(fā)[6]。在WGCNA的分析過程中,首先構(gòu)建基因共表達(dá)模塊(Module),基因模塊中含有一組具有似表達(dá)模式的基因。模塊中的樞紐基因(Hub gene)作為模塊中與其他基因連接最緊密的基因往往決定了一個(gè)模塊的特性,更容易發(fā)現(xiàn)與性狀相關(guān)的生物學(xué)意義。
WGCNA被廣泛應(yīng)用在醫(yī)學(xué)研究方面。在膠質(zhì)母細(xì)胞瘤的研究中,通過對(duì)100多位患者的基因表達(dá)數(shù)據(jù)的WGCNA分析,發(fā)現(xiàn)了一個(gè)癌癥相關(guān)的基因模塊,而該模塊的樞紐基因也成為了治療膠質(zhì)母細(xì)胞瘤的關(guān)鍵靶基因[7]。此外,在阿爾茲海默癥、骨質(zhì)疏松癥等的研究中[8-9],也找到了與治病相關(guān)聯(lián)的基因及治療的靶點(diǎn)。在植物中,通過WGCNA分析在擬南芥中找到了參與中種子萌發(fā)的基因模塊,并由此對(duì)種子萌發(fā)過程中基因調(diào)控機(jī)制進(jìn)行了深入的研究[10]。在蘋果中,利用WGCNA分析找到了與蘋果酸味產(chǎn)生相關(guān)的基因模塊。
本研究通過模擬赤潮爆發(fā)的條件對(duì)鏈狀亞歷山大藻進(jìn)行表達(dá)譜測(cè)序,利用表達(dá)譜測(cè)序后得到的基因表達(dá)量數(shù)據(jù),計(jì)算基因間的相關(guān)性,從而構(gòu)建基因共表達(dá)模塊,并將模塊與鏈狀亞歷山大藻爆發(fā)性生長(zhǎng)(EG)相關(guān)聯(lián),對(duì)顯著性相關(guān)的模塊內(nèi)的樞紐基因進(jìn)行篩選并進(jìn)行功能富集分析,以探索鏈狀亞歷山大藻爆發(fā)性生長(zhǎng)的分子機(jī)制。
鏈狀亞歷山大藻藻株來源于中國(guó)海洋大學(xué)海洋生物遺傳與育種教育部重點(diǎn)實(shí)驗(yàn)室。具體培養(yǎng)條件如下:培養(yǎng)基:f/2培養(yǎng)基(不加硅);光照強(qiáng)度:30 μmol·m-2·s-l;溫度:(20±1)℃;光暗周期:12 h︰12 h。
鏈狀亞歷山大藻于f/2培養(yǎng)基中培養(yǎng)至對(duì)數(shù)生長(zhǎng)期,將其中生長(zhǎng)活力較好的藻在黑暗條件下進(jìn)行48 h同步化處理,使其處于同一生長(zhǎng)時(shí)期。同步化完成后以2×106個(gè)/L的濃度將藻接種于高磷高錳(M)、高光(G)、低氮(N)、低磷(P)以及正常培養(yǎng)(C)這五個(gè)處理?xiàng)l件下進(jìn)行培養(yǎng)(見表1),每個(gè)處理?xiàng)l件設(shè)置3個(gè)平行。
隨后在鏈狀亞歷山大藻生長(zhǎng)對(duì)數(shù)期(第12天)用除菌方法收集藻細(xì)胞,方法如下:在20 ℃條件下,用經(jīng)過無菌處理的10 μm孔徑篩絹過濾藻液,每過濾100 mL藻液用300 mL相應(yīng)的無菌培養(yǎng)基進(jìn)行沖洗,對(duì)沖洗后的藻液用50 mL無菌培養(yǎng)基(含有0.05%Tween-80和0.01 mol/L EDTA)懸浮30 min,超聲破碎1 min(50 w,超聲時(shí)間5 s,間隔時(shí)間5 s),隨后用溶菌酶(0.5 mg/mL)在20 ℃下處理10 min,加入0.25% SDS處理10 min,用相應(yīng)的無菌培養(yǎng)基沖洗,去除試劑殘留。隨后除菌后的藻液經(jīng)0.01%的吖啶橙染色2 min后,在熒光顯微鏡下進(jìn)行觀察[11],篩選其中的無菌樣品進(jìn)入后續(xù)實(shí)驗(yàn)。
表1 表達(dá)譜所需樣品的處理?xiàng)l件Table 1 Samples used for DGE analysis
收集無菌處理后的鏈狀亞歷山大藻,每個(gè)處理?xiàng)l件的1個(gè)平行即為1個(gè)樣品,每個(gè)樣品中約含5×106個(gè)藻細(xì)胞,共計(jì)15個(gè)樣品保存在液氮中,用于后續(xù)RNA文庫(kù)的構(gòu)建。
1.3.1 總RNA的提取及檢測(cè) 采用RNAiso Plus (Trizol) (TaKaRa)法進(jìn)行對(duì)15個(gè)樣品的總RNA進(jìn)行提取,得到的RNA用DNase I(TaKaRa)進(jìn)行DNA消化,并用1.5%的瓊脂糖凝膠電泳150 V,10 min進(jìn)行檢測(cè),用Nano Drop2000進(jìn)行RNA濃度和純度檢測(cè)。
1.3.2 文庫(kù)構(gòu)建 使用NEBNext Ultra RNA Library Prep Kit for Illumina(NEB)試劑盒按照說明書步驟進(jìn)行文庫(kù)的構(gòu)建。
用Oligo(dT)磁珠對(duì)總RNA中的mRNA進(jìn)行富集,用Fragmentation buffer將mRNA隨機(jī)打斷成短片段,利用六堿基隨機(jī)引物合成第一條cDNA鏈,隨后加入dNTPs、DNA polymerase I、RNaseH合成第二條鏈。連接測(cè)序接頭,經(jīng)過PCR擴(kuò)增,增加模板量,構(gòu)建cDNA測(cè)序文庫(kù)。
對(duì)構(gòu)建的15個(gè)cDNA文庫(kù)用Illumina Genome Analyzer進(jìn)行單末端100 bp測(cè)序。采用FastQC(v0.11.5)軟件對(duì)測(cè)序數(shù)據(jù)進(jìn)行質(zhì)量評(píng)估,隨后用FASTX-Toolkit(v0.0.6)去除接頭序列,去除N堿基所占比例大于10%的序列,去除低質(zhì)量序列,得到Clean reads。
分析流程見圖1。
圖1 加權(quán)基因共表達(dá)分析流程Fig.1 The process of WGCNA
數(shù)據(jù)預(yù)處理以實(shí)驗(yàn)室已經(jīng)測(cè)序得到的比較轉(zhuǎn)錄組數(shù)據(jù)(SRX368254)為參考序列,通過軟件RSEM(v1.3.0,以期望最大值算法為基礎(chǔ)),計(jì)算表達(dá)譜所有reads的表達(dá)量情況[12]。
利用WGCNA軟件包中的pickSoftThreshold函數(shù)進(jìn)行軟閾值的計(jì)算,軟閾值的標(biāo)準(zhǔn)是使共表達(dá)網(wǎng)絡(luò)要符合無尺度分布[13-14]。
利用R語(yǔ)言的moduleEigengenes函數(shù)計(jì)算基因模塊的特征向量基因,模塊特征向量基因代表了模塊內(nèi)所有基因的一種表達(dá)模式,再引入樣品的特征,計(jì)算特征向量基因與樣品特征之間的相關(guān)性,相關(guān)系數(shù)越高代表模塊與樣品特征越關(guān)聯(lián),對(duì)其中顯著相關(guān)模塊進(jìn)行后續(xù)的模塊基因表達(dá)和功能富集分析。利用plotME和barplot函數(shù)將顯著相關(guān)模塊中的基因依據(jù)其在不同處理?xiàng)l件下的表達(dá)量進(jìn)行聚類分析,并繪制各個(gè)模塊的特征向量基因在不同處理?xiàng)l件下的柱狀圖以分析其表達(dá)情況。
對(duì)與性狀顯著相關(guān)的每個(gè)模塊利用R語(yǔ)言包ClusterProfiler(v3.6.0)中的enrichKEGG函數(shù)進(jìn)行KEGG富集分析。利用基于基因顯著性和模塊身份的函數(shù)NetworkScreening計(jì)算基因與模塊的相關(guān)性,以相關(guān)性q值為基礎(chǔ)進(jìn)行樞紐基因的篩選。采用Cytoscape軟件中的BinGO插件,對(duì)與性狀顯著相關(guān)模塊的樞紐基因進(jìn)行GO富集分析[16],富集分析的顯著性水平p<0.05。
實(shí)驗(yàn)中的顯著性水平的標(biāo)準(zhǔn)為p<0.001,以錯(cuò)誤發(fā)現(xiàn)率 (False discovery rate,F(xiàn)DR)對(duì)p值進(jìn)行驗(yàn)證得到q值,用q<0.05來排除假陽(yáng)性。
對(duì)五個(gè)處理?xiàng)l件下的鏈狀亞歷山大藻進(jìn)行隔天計(jì)數(shù)并繪制生長(zhǎng)曲線(見圖2),以觀察其生長(zhǎng)狀態(tài),確定取樣時(shí)間。通過繪制的生長(zhǎng)曲線可以看出,在高磷高錳以及高光的誘導(dǎo)條件下,鏈狀亞歷山大藻的生長(zhǎng)速率以及細(xì)胞數(shù)量都高于其他處理?xiàng)l件,表現(xiàn)出了爆發(fā)性生長(zhǎng)的特征,而在低氮和低磷處理?xiàng)l件下,該藻的生長(zhǎng)速率較慢,通過顯微鏡觀察在15天后,該藻開始逐漸衰亡,出現(xiàn)了大量的死細(xì)胞,通過生長(zhǎng)曲線確定選取第12天作為取樣時(shí)間進(jìn)行后續(xù)實(shí)驗(yàn)。
圖2 不同培養(yǎng)條件下鏈狀亞歷山大藻生長(zhǎng)曲線Fig.2 Growth curve of A. pacificum under five treatments
將15個(gè)樣品的表達(dá)譜數(shù)據(jù)進(jìn)行質(zhì)控,去除低表達(dá)量(RPKM值低于3.57)的基因,并篩選不同處理?xiàng)l件下,基因表達(dá)量方差較大的前25%的基因(表明在不同處理間變異性較高),隨后利用R語(yǔ)言中的WGCNA軟件包gsg數(shù)據(jù)過濾去除離群值,共得到16 326個(gè)基因用于網(wǎng)絡(luò)基因的構(gòu)建。
對(duì)15個(gè)樣品進(jìn)行聚類分析,繪制聚類圖,以檢驗(yàn)樣品組間的相關(guān)性,去除離群樣品,并依據(jù)樣品的處理?xiàng)l件,標(biāo)注其生物學(xué)特征。通過模擬赤潮爆發(fā)的條件,在培養(yǎng)過程中,鏈狀亞歷山大藻在高磷高錳以及高光的誘導(dǎo)條件下的生長(zhǎng)速率和細(xì)胞總數(shù)要顯著高于其他3個(gè)處理?xiàng)l件,表現(xiàn)出了爆發(fā)性生長(zhǎng)的特性,因此將高磷高錳誘導(dǎo)以及高光誘導(dǎo)兩個(gè)處理?xiàng)l件作為爆發(fā)性生長(zhǎng)的樣品特征(Explosive growth,EG)。聚類分析顯示,沒有離群樣本的存在(見圖3),15個(gè)樣品組間的相關(guān)性較好,均可以用于后續(xù)的分析。圖中紅色代表高光和高磷高錳處理的爆發(fā)性生長(zhǎng)條件。
在確定軟閾值后,依據(jù)確定值進(jìn)行基因模塊的構(gòu)建。首先計(jì)算兩兩基因間的相似性系數(shù)以及相異度,從而構(gòu)建層次聚類樹。最終得到35個(gè)相關(guān)性基因模塊(見圖4),不同的顏色代表不同的基因共表達(dá)模塊,灰色模塊為未被分配的基因。
統(tǒng)計(jì)得到的各個(gè)基因模塊的基因個(gè)數(shù),在這35個(gè)基因模塊中,基因數(shù)目從32到2 812個(gè)不等(見圖5)。
將每個(gè)基因模塊的特征向量基因與樣品的特征相關(guān)聯(lián),從而找到與樣品特征密切相關(guān)的基因模塊。圖中顏色越紅代表顯著相關(guān)性越高,以p<0.001為顯著性相關(guān)的篩選標(biāo)準(zhǔn),分析得到了與鏈狀亞歷山大藻爆發(fā)性生長(zhǎng)(EG)顯著性相關(guān)的6個(gè)模塊,分別是blue4(0.79,p=8e-05)、blue(0.74,p=4e-04)、darkseagreen3(0.7,p=0.001)、firbrick3(0.79,p=8e-05)、black(0.92,p=5e-08)、darkgrey(0.82,p=3e-05)(見圖6)。
圖3 15個(gè)樣品聚類結(jié)果及樣品特征Fig.3 The phylogenetic tree and the information of the 15 samples
(Dynamic Tree Cut代表初步識(shí)別的基因模塊;Merged Dynamic為融合相似模塊后的基因表達(dá)模塊。Dynamic Tree Cut represent the initial identification of the gene module,merged dynamic represent merged similar modules. )
圖4 基因共表達(dá)網(wǎng)絡(luò)聚類樹
Fig.4 WGCNA cluster tree for the samples
基于基因模塊的特征向量基因與樣品特征關(guān)聯(lián)分析結(jié)果,對(duì)在高磷高錳誘導(dǎo)、高光誘導(dǎo)條件下6個(gè)顯著性相關(guān)模塊(P<0.001)的基因數(shù)進(jìn)行了統(tǒng)計(jì)(見表2)。由表2可見,模塊blue4中包含的基因最多有2 812個(gè),而darkgrey模塊最少有360個(gè)。對(duì)這6個(gè)模塊的基因及特征向量基因在表達(dá)譜15個(gè)處理?xiàng)l件下的相對(duì)表達(dá)量分別進(jìn)行熱圖層次聚類和柱狀圖分析,結(jié)果顯示這六個(gè)模塊在高磷高錳誘導(dǎo)以及高光誘導(dǎo)條件下均上調(diào)表達(dá)(見圖7)。
圖5 各模塊基因數(shù)分布Fig.5 Number of genes in the 35 modules
圖6 各模塊特征向量與樣品特征間的相關(guān)性分析Fig.6 Diagram of correlation between modules and sample treatment information
表 2 6個(gè)顯著性相關(guān)模塊的基因數(shù)統(tǒng)計(jì)Table 2 The numbers of genes in 6 modules
對(duì)6個(gè)模塊的基因分別進(jìn)行KEGG富集分析,其中模塊blue4中的基因顯著富集到核糖體的生物合成、細(xì)胞骨架調(diào)節(jié)途徑(q<0.05),而模塊black顯著富集到了光合作用中的碳固定途徑、磷酸戊糖途徑(q<0.05)(見圖8)。
以基因與性狀的相關(guān)性q值為基礎(chǔ)對(duì)各個(gè)模塊中的基因進(jìn)行排序,每個(gè)模塊中選取排序后前10%的基因作為樞紐基因,以6個(gè)顯著性相關(guān)模塊中的樞紐基因?yàn)檠芯繉?duì)象,進(jìn)行GO富集分析(見圖9),圖中黃色越深代表富集越顯著,圓圈大小表示GO條目的層級(jí)關(guān)系(p<0.05)。在分子功能方面,樞紐基因顯著性富集在了結(jié)合活性(p=2.70e-6),電子轉(zhuǎn)運(yùn)活性(p=5.20e-6)以及催化活性(p=3.20e-5);在生物過程方面,樞紐基因富集在信號(hào)轉(zhuǎn)導(dǎo)(p=6.10e-6),蛋白質(zhì)代謝(p=6.60e-6),碳水化合物代謝(p=7.30e-6)以及大分子物質(zhì)的合成過程(p=8.20e-6);在細(xì)胞組分方面,樞紐基因主要富集在核糖體(p=4.70e-5)、蛋白復(fù)合體(p=6.20e-5)以及核糖核蛋白復(fù)合體(p=8.20e-5)等。
(15個(gè)處理?xiàng)l件為低氮(N1、N2、N3),低磷(P1、P2、P3),正常培養(yǎng)(C1、C2、C3),高磷高錳誘導(dǎo)(M1、M2、M3)和高光誘導(dǎo)(G1、G2、G3)。15 treatments contain low nitrogen(N1、N2、N3),low phosphorus(P1、P2、P3),normal condition(C1、C2、C3),high phosphorus(M1、M2、M3)and hight light(G1、G2、G3).)
圖7 顯著性相關(guān)模塊的基因在表達(dá)譜15個(gè)處理?xiàng)l件下的聚類分析
Fig.7 Cluster analysis of the genes in 6 modules under 15 different treatments of DGE analysis
(Rich factor 是該模塊樞紐基因中位于該通路的基因數(shù)目與所有該通路的基因數(shù)的比值。a. Blue4模塊;b. Black模塊。Rich factor represent the ratio of the hub genes in this pathway and all the genes of this pathway. a. Blue4 module;b. Black module.)
圖8 模塊blue4和black的KEGG富集分析
Fig.8 KEGG enrichment analysis of module black
(a. 分子功能;b. 生物過程;c. 細(xì)胞組分。a. Molecular function; b. Biological process; c. Cellular component.)圖9 樞紐基因GO富集分析圖 Fig.9 GO enrichment analysis of hub genes
對(duì)富集到的GO條目中顯著性p<5e-4的基因進(jìn)行統(tǒng)計(jì)(見表3),在生物過程基因包括涉及蛋白代謝的伴侶蛋白和預(yù)測(cè)蛋白,涉及碳水化合物代謝的6磷酸葡萄糖酸內(nèi)酯酶,涉及信號(hào)傳導(dǎo)的磷酸二酯酶(PDE)(同時(shí)富集在分子功能的催化活性)、鈣離子依賴性激酶(同時(shí)富集在分子功能鈣離子結(jié)合活性),以及涉及翻譯過程的40s及60s核糖體蛋白(同時(shí)富集在細(xì)胞組分的核糖體上);在分子功能方面基因涉及電子轉(zhuǎn)運(yùn)活性的光系統(tǒng)1的鐵硫中心,鐵氧還蛋白還原酶和紅素氧還蛋白,涉及蛋白結(jié)合活性的類泛素蛋白。
表3 爆發(fā)性生長(zhǎng)條件下樞紐基因GO富集結(jié)果(部分)Table 3 GO enrichment of hub genes in response to explosive growth of A. pacificum
續(xù)表3
GO編號(hào)及過程GO ID and process基因IDGene ID功能Functionp值p-value分子功能Molecular Function細(xì)胞組成CellularComponentElectron carrier activity (GO:0009055)Catalytic activity (GO:0003824)Protein binding (GO:0005515)Calcium ion binding (GO:0005509)Ribosome (GO:0005840)Algae_064-3_Unigene_BMK.26288photosystem I iron-sulfur center1.40e-8Algae_064-1_Unigene_BMK.49816ferredoxin oxidoreductase4.10e-7Algae_064-1_Unigene_BMK.42171Rubredoxin-22.70e-6Algae_064-1_Unigene_BMK.1603Calcium/calmodulin-dependent 3′,5′-cyclic nucleotide phosphodiesterase6.60e-8Algae_064-3_Unigene_BMK.29372hypothetical protein6.10e-6Algae_064-3_Unigene_BMK.44168small ubiquitin-like protein1.70e-5Algae_064-2_Unigene_BMK.30688protein kinase6.12e-6Algae_064-1_Unigene_BMK.10610calcium-dependent protein kinase7.50e-6Algae_064-3_Unigene_BMK.2010660S ribosomal protein4.10e-9Algae_064-3_Unigene_BMK.1520540S ribosomal protein4.90e-9Algae_064-3_Unigene_BMK.174060S ribosomal protein4.60e-5Algae_064-3_Unigene_BMK.1400240S ribosomal protein7.70e-5Algae_064-3_Unigene_BMK.1356940S ribosomal protein9.50e-5
對(duì)6個(gè)顯著相關(guān)模塊中q值排序前3的hub基因進(jìn)行統(tǒng)計(jì)(見表4),模塊blue4中包括60s核糖體蛋白亞基、核糖體蛋白,說明該模塊可能與核糖體相關(guān)。模塊Firebrick3中包括類形成蛋白、端錨聚合酶等。Darkgrey模塊中基因包括轉(zhuǎn)錄起始因子、泛素激活酶以及粘蛋白。Darkseagreen3模塊可能與蛋白質(zhì)的合成加工相關(guān),基因包括多聚泛素、熱激蛋白(HSP)。Blue模塊包含光捕獲蛋白、細(xì)胞色素復(fù)合體b6f等,該模塊可能與電子轉(zhuǎn)運(yùn)相關(guān)。模塊Black中的基因包括轉(zhuǎn)酮醇酶、甘油醛3磷酸脫氫酶以及輔酶A轉(zhuǎn)移酶蛋白家族。
表4 與爆發(fā)生長(zhǎng)顯著相關(guān)模塊前3個(gè)樞紐基因信息Table 4 The top 3 hub genes of modules significant correlate to explosive growth
續(xù)表4
分子Module基因Gene ID注釋Annotation藍(lán)色模塊Blue moduleAlgae_064-3_Unigene_BMK.26938Light-harvesting proteinAlgae_064-3_Unigene_BMK.88955Light-harvesting proteinAlgae_064-2_Unigene_BMK.6496cytochrome b6f complex黑色模塊Black moduleAlgae_064-2_Unigene_BMK.37578TransketolaseAlgae_064-3_Unigene_BMK.73675Ribulose-1,5-biphosphate carboxylaseAlgae_064-2_Unigene_BMK.61673Phosphoribulokinase
在鏈狀亞歷山大藻爆發(fā)性生長(zhǎng)條件下,樞紐基因中的光捕獲蛋白以及細(xì)胞色素復(fù)合體b6f參與到了光合作用的電子傳遞過程,光捕獲蛋白捕獲光能并將其轉(zhuǎn)移到光系統(tǒng)中以開始光合作用的光反應(yīng),同時(shí)光捕獲蛋白可以維持類囊體膜的結(jié)構(gòu)[17]?;贕O富集分析(見表3),紅素氧還蛋白和鐵氧還蛋白氧化還原酶顯著富集在電子轉(zhuǎn)運(yùn)活性。紅素氧還蛋白屬于鐵硫蛋白家族,在光合作用和非生物脅迫方面發(fā)揮重要作用,最初植物中的紅素氧還蛋白由擬南芥類囊體上分離得到[18],隨后在聚球藻的研究中發(fā)現(xiàn)該蛋白可能參與光系統(tǒng)I的組裝,它的缺失將導(dǎo)致光系統(tǒng)I功能喪失[19]。在植物光合作用中,鐵氧還蛋白還原酶接受鐵氧還蛋白傳遞的電子使NADP+還原為NADPH,同時(shí)基于KEGG富集分析,顯著相關(guān)模塊的基因富集在光合作用碳固定途徑,而光合電子傳遞為其提供了所需的NADPH和ATP,保證了碳固定途徑的順利進(jìn)行?;趯?duì)模塊基因的GO及KEGG富集分析,以及對(duì)樞紐基因的分析,說明光合作用在鏈狀亞歷山大藻爆發(fā)性生長(zhǎng)方面起到重要作用。
樞紐基因中的40s以及60s核糖體蛋白亞基,在GO富集分析(見圖9)中顯著富集在生物過程中的翻譯過程以及細(xì)胞組分的核糖體中,基于KEGG分析(見圖8)參與了核糖體的生物合成,說明了核糖體的生物合成與細(xì)胞生長(zhǎng)息息相關(guān)。
通過GO富集分析(見表3),發(fā)現(xiàn)了與鈣離子結(jié)合活性相關(guān)的基因鈣離子依賴性激酶(CaMK)以及與信號(hào)傳導(dǎo)相關(guān)的PDE,這兩個(gè)基因均受到鈣離子/鈣調(diào)蛋白信號(hào)通路的調(diào)控,從而參與到細(xì)胞周期調(diào)控中。PDE是一類催化水解環(huán)核苷酸(cAMP)的關(guān)鍵酶,通過調(diào)節(jié)細(xì)胞內(nèi)cAMP的水平,影響細(xì)胞的生理功能[20],研究發(fā)現(xiàn)cAMP的含量隨著細(xì)胞周期的進(jìn)行而改變,在S期之前,其含量的變化與DNA的合成相關(guān),在纖細(xì)裸藻中,cAMP含量的增加會(huì)抑制DNA的合成,使細(xì)胞分裂停在G2期,而其含量下降,細(xì)胞周期也會(huì)隨之恢復(fù)。鈣離子及鈣調(diào)蛋白信號(hào)通路參與了細(xì)胞內(nèi)眾多的生理過程,同時(shí)在細(xì)胞周期調(diào)控方面也起到了重要作用,受其調(diào)控的與細(xì)胞周期相關(guān)的CaMK和PDE的發(fā)現(xiàn),說明了相關(guān)的信號(hào)通路在鏈狀亞歷山大藻細(xì)胞周期調(diào)控方面也有重要作用。
熱激蛋白常以分子伴侶的形式存在,作為保護(hù)蛋白與其他蛋白結(jié)合從而穩(wěn)定結(jié)合蛋白的結(jié)構(gòu),在細(xì)胞中參與蛋白的合成、蛋白的翻譯后修飾以及蛋白質(zhì)的跨膜運(yùn)輸?shù)冗^程。其中Hsp90是真核生物中含量最豐富的蛋白之一,在真核生物中普遍存在,其活性受到ATP酶的調(diào)控,參與蛋白折疊、降解過程,與植物發(fā)育過程中參與多種酶以及激素受體的蛋白成熟過程,能促進(jìn)信號(hào)肽的成熟,促進(jìn)肽鏈的正確折疊,維持和穩(wěn)定蛋白構(gòu)象[21]。目前研究發(fā)現(xiàn)Hsp90參與到細(xì)胞周期調(diào)控,并受到鈣調(diào)蛋白的作用參與信號(hào)轉(zhuǎn)導(dǎo)過程[22]。Hsp70參與新生肽鏈的合成,調(diào)控新生蛋白質(zhì)的折疊以及蛋白的跨膜運(yùn)輸?shù)冗^程[23],在細(xì)胞快速生長(zhǎng)階段,需要大量蛋白質(zhì)的合成,而Hsp90和Hsp70在蛋白質(zhì)的合成加工方面的作用有助于保證蛋白質(zhì)的正確折疊。
通過對(duì)hub基因進(jìn)行統(tǒng)計(jì)后發(fā)現(xiàn),大量的hub基因未被注釋功能或注釋為預(yù)測(cè)蛋白(Hypothetical protein),如在blue4模塊中,對(duì)q值前20的hub基因進(jìn)行統(tǒng)計(jì)并分析后發(fā)現(xiàn),其中有11個(gè)基因未被注釋。雖然有未注釋蛋白存在,但同屬于一個(gè)模塊的基因在表達(dá)量上存在相關(guān)性,意味著這些基因在功能方面有相似性,可以由此來推測(cè)未注釋基因的功能。
通過分析比較表達(dá)譜數(shù)據(jù),基于WGCNA分析,核糖體的合成、磷酸戊糖途徑、光合作用的碳固定途徑起到了重要的調(diào)控作用,同時(shí)在表達(dá)譜測(cè)序篩選得到的差異基因外,樞紐基因中與蛋白質(zhì)合成加工相關(guān)的熱激蛋白以及參與光合作用光反應(yīng)的熒光素結(jié)合蛋白以及電子傳遞蛋白的發(fā)現(xiàn),更有助于完善鏈狀亞歷山大藻光合作用以及蛋白質(zhì)代謝的調(diào)控機(jī)制,為進(jìn)一步闡明這些調(diào)控機(jī)制對(duì)細(xì)胞生長(zhǎng)的影響提供基礎(chǔ)。
本研究以鏈狀亞歷山大藻模擬赤潮爆發(fā)條件下的表達(dá)譜數(shù)據(jù)為基礎(chǔ),首次將WGCNA分析用于赤潮爆發(fā)的機(jī)制的研究中。依據(jù)WGCNA分析的流程構(gòu)建了基因的共表達(dá)網(wǎng)絡(luò),共得到了35個(gè)基因共表達(dá)模塊。將基因模塊與鏈狀亞歷山大藻爆發(fā)性生長(zhǎng)特征相關(guān)聯(lián)。通過功能富集分析以及對(duì)模塊中樞紐基因的功能分析,與爆發(fā)性生長(zhǎng)相關(guān)的樞紐基因涉及核糖體的生物合成、碳水化合物代謝(碳固定途徑、磷酸戊糖途徑)、光合作用光反應(yīng)的電子傳遞過程以及蛋白質(zhì)的合成和加工等,這些途徑為細(xì)胞的快速增殖提供了物質(zhì)基礎(chǔ),同時(shí),樞紐基因中包含了大量的未知功能的基因,雖功能未知,但通過分析基因共表達(dá)模塊,這些基因在調(diào)控細(xì)胞生長(zhǎng)方面同樣存在重要作用,對(duì)這些基因的進(jìn)一步研究將有助于挖掘鏈狀亞歷山大藻爆發(fā)性生長(zhǎng)的潛在的分子機(jī)制。