韓 陽
首都醫(yī)科大學(xué)附屬北京友誼醫(yī)院檢驗(yàn)科,北京 100050
神經(jīng)膠質(zhì)瘤起源于神經(jīng)膠質(zhì)細(xì)胞,是目前最常見的顱內(nèi)惡性腫瘤之一,占原發(fā)性中樞神經(jīng)系統(tǒng)腫瘤的45%左右[1],年發(fā)病率在3/10萬~8/10萬[2]。有研究認(rèn)為,膠質(zhì)瘤治療極其困難,預(yù)后尤為不佳,大約77%的惡性膠質(zhì)瘤患者在確診后1年內(nèi)死亡[3-4]。其中,膠質(zhì)母細(xì)胞瘤是最為常見的腦膠質(zhì)瘤類型,是所有腫瘤中預(yù)后最差的類型之一。因此,研究膠質(zhì)母細(xì)胞瘤的早期干預(yù)靶點(diǎn)具有重要意義。
隨著基因芯片及二代高通量測(cè)序技術(shù)的不斷發(fā)展,越來越多的研究利用基因測(cè)序技術(shù)與生物信息學(xué)分析方法,通過篩選與疾病發(fā)生發(fā)展相關(guān)的差異基因,為疾病的機(jī)制研究尋找新的靶標(biāo)和研究思路[5-6]。膠質(zhì)母細(xì)胞瘤屬于多基因疾病,其發(fā)生和惡性進(jìn)展與遺傳因素密切相關(guān)[7]。因此,本研究擬通過基因表達(dá)譜數(shù)據(jù)庫(GEO)篩選出膠質(zhì)母細(xì)胞瘤相關(guān)的差異表達(dá)基因,探討這些潛在致病基因與膠質(zhì)母細(xì)胞瘤患者診斷、預(yù)后的相關(guān)性,為尋找新的標(biāo)志物指明方向。
1.1資料來源 本研究對(duì)GEO數(shù)據(jù)庫進(jìn)行檢索,選擇“human”為物種類別,檢索關(guān)鍵詞設(shè)定為“Glioma”,分析對(duì)象為GSE31262基因表達(dá)譜數(shù)據(jù)集,該數(shù)據(jù)集主要包括5個(gè)成人神經(jīng)干細(xì)胞個(gè)體樣本和9個(gè)膠質(zhì)母細(xì)胞瘤干細(xì)胞個(gè)體樣本[8]。
1.2差異表達(dá)基因篩選 采用R語言軟件中的limma程序包,首先對(duì)所得到的全部數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理;其次,對(duì)比兩組膠質(zhì)母細(xì)胞瘤干細(xì)胞樣本和正常成人神經(jīng)干細(xì)胞樣本得到的基因數(shù)據(jù),并從這批數(shù)據(jù)中尋找差異有統(tǒng)計(jì)學(xué)意義的差異表達(dá)基因。判定標(biāo)準(zhǔn)為|log2(FC)|>1及校正后P<0.05。
1.3差異表達(dá)基因的功能富集分析 使用基因本體論(GO)富集分析和京都基因和基因組百科全書(KEGG)通路分析方法預(yù)測(cè)潛在功能及信號(hào)通路。
1.4蛋白質(zhì)-蛋白質(zhì)相互作用(PPI)網(wǎng)絡(luò)構(gòu)建及差異基因篩選 在STRING在線數(shù)據(jù)庫(https://string-db.org/)中,對(duì)篩選出的差異基因所編碼的蛋白進(jìn)行PPI網(wǎng)絡(luò)構(gòu)建,篩選combined score>0.4的相互作用蛋白。使用Cytoscape軟件分析PPI結(jié)果,采用Degree算法和Cytohubba插件,得到評(píng)分最高的前10位差異基因。
1.5差異基因的批量生存分析 利用癌癥基因圖譜(TCGA)數(shù)據(jù)庫檢索到666例膠質(zhì)母細(xì)胞瘤患者的轉(zhuǎn)錄組測(cè)序結(jié)果及其臨床數(shù)據(jù)資料。根據(jù)基因表達(dá)水平差異,將篩選出的差異基因分為高、低表達(dá)組。
1.6免疫浸潤分析 使用R GSVA程序包中提供的 ssGSEA 算法,通過識(shí)別24種免疫細(xì)胞標(biāo)志物[9],評(píng)估膠質(zhì)母細(xì)胞瘤組織的免疫細(xì)胞浸潤情況。結(jié)果采用“ggplot2”進(jìn)行可視化,所有分析和可視化均在 R 4.2.1 中進(jìn)行。
1.7統(tǒng)計(jì)學(xué)處理 采用Graphpad Prism 8.4統(tǒng)計(jì)軟件進(jìn)行數(shù)據(jù)分析。采用R語言軟件中的ggplot和pheatmap程序包繪制差異表達(dá)基因的火山圖及熱圖,采用ClusterProfiler程序包進(jìn)行基因富集的分析及繪制圖譜,兩組比較采用t檢驗(yàn),多組間比較采用方差分析。使用R語言軟件中的pROC程序包進(jìn)行受試者工作特征(ROC)曲線分析,分析各差異基因診斷膠質(zhì)母細(xì)胞瘤的曲線下面積(AUC)。分析結(jié)果用ggplot2進(jìn)行可視化。繪制Kaplan-Meier生存分析曲線,比較兩組患者生存率的差異并計(jì)算風(fēng)險(xiǎn)比(HR),Kaplan-Meier曲線的P和HR(95%CI)通過Log-rank檢驗(yàn)和單變量COX回歸分析得出。以P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
2.1差異基因的篩選結(jié)果 選取GSE31262數(shù)據(jù)集為分析對(duì)象,分析5個(gè)成人神經(jīng)干細(xì)胞個(gè)體樣本和9個(gè)膠質(zhì)母細(xì)胞瘤干細(xì)胞個(gè)體樣本,從上述樣本中的全部基因中篩選出|log2(FC)|>1的差異表達(dá)基因2 692個(gè),其中表達(dá)上調(diào)1 182個(gè)、表達(dá)下調(diào)1 510個(gè)。差異基因火山圖及聚類熱圖結(jié)果見圖1。
注:A為差異基因火山圖;●代表上調(diào)基因,●代表下調(diào)基因,●為無差異基因;B為差異基因聚類熱圖;藍(lán)色為下調(diào)基因,紅色為上調(diào)基因,G1為膠質(zhì)母細(xì)胞瘤干細(xì)胞樣本,G2為正常成人神經(jīng)干細(xì)胞。圖1 差異基因的篩選結(jié)果
2.2差異基因的GO富集分析和KEGG通路分析結(jié)果 篩選出的上調(diào)、下調(diào)差異表達(dá)基因的相關(guān)功能分析結(jié)果見圖2。KEGG通路分析結(jié)果顯示,篩選到的差異表達(dá)基因主要參與細(xì)胞內(nèi)吞作用、溶酶體、MAPK信號(hào)通路、細(xì)胞周期、人乳頭瘤病毒感染、人類免疫缺陷病毒感染等;GO富集分析結(jié)果顯示,差異表達(dá)基因主要涉及細(xì)胞器裂變、核分裂、胚胎器官發(fā)育、染色體分離、軸突生成、膠質(zhì)細(xì)胞再生、蛋白質(zhì)定位于細(xì)胞外圍等。
注:A為KEGG通路分析;B為GO富集分析。圖2 差異基因的KEGG通路分析和GO富集分析結(jié)果
2.3差異基因蛋白網(wǎng)絡(luò)分析 采用STRING在線數(shù)據(jù)庫構(gòu)建PPI網(wǎng)絡(luò),對(duì)528個(gè)|log2(FC)|大于2的上調(diào)基因進(jìn)行STRING蛋白質(zhì)關(guān)系分析,利用PPI網(wǎng)絡(luò)篩選出差異基因,評(píng)分居前10位的差異基因主要包括CDK1、CCNB1、CCNA2、BUB1、KIF11、TOP2A、CCNB2、CHEK1、RRM2和ASPM。見圖3。
注:A為差異表達(dá)基因編碼蛋白的PPI網(wǎng)絡(luò);B為評(píng)分最高的前10位差異基因。圖3 差異基因編碼蛋白的PPI網(wǎng)絡(luò)及差異基因的篩選
2.4生存分析 根據(jù)基因表達(dá)水平差異,將篩選出的10個(gè)差異基因分為高、低表達(dá)組,比較兩組患者生存率的差異,結(jié)果顯示,上述差異基因均與疾病預(yù)后相關(guān)(P<0.000 1),見表1。10個(gè)差異基因表達(dá)水平越高,HR越大,膠質(zhì)母細(xì)胞瘤患者預(yù)后越差;其中,CCNA2基因預(yù)測(cè)膠質(zhì)母細(xì)胞瘤患者預(yù)后的HR最大,為5.563 4(4.073 7,7.598 0),差異有統(tǒng)計(jì)學(xué)意義(P<0.000 1)。
表1 差異基因表達(dá)水平與患者預(yù)后的關(guān)系
2.5免疫浸潤分析 本研究使用ssGSEA 算法探索了膠質(zhì)母細(xì)胞瘤組織的24種免疫細(xì)胞浸潤水平和10個(gè)hub基因的表達(dá)水平之間的關(guān)系。Th2細(xì)胞的浸潤水平與10個(gè)基因的表達(dá)呈明顯正相關(guān),巨噬細(xì)胞與RRM2的表達(dá)呈負(fù)相關(guān),與其他9個(gè)基因的表達(dá)呈明顯正相關(guān)。肥大細(xì)胞與ASPM、BUB1、CDK1、CCNA2、CCNB2、CHEK1、KIF11、TOP2A、RRM2的表達(dá)呈明顯負(fù)相關(guān)(|R|>0.2)。樹突狀細(xì)胞與除RRM2外的其他9個(gè)基因呈明顯負(fù)相關(guān)(|R|>0.2)。見圖4。
注:A~J分別為ASPM、BUB1、CCNB2、CCNB1、CCNA2、CDK1、CHEK1、KIF11、RRM2、TOP2A基因表達(dá)相關(guān)性分析;*P<0.05;**P<0.01;***P<0.001。圖4 膠質(zhì)母細(xì)胞瘤組織的24種免疫細(xì)胞浸潤水平與10個(gè)差異基因表達(dá)水平之間的關(guān)系
2.6ROC曲線分析 ROC曲線分析結(jié)果顯示,10個(gè)基因診斷膠質(zhì)母細(xì)胞瘤的AUC及95%CI如下:CDK1,0.944(95%CI:0.910~0.978);CCNB1,0.918(95%CI:0.827~1.000);CCNA2,0.904(95%CI:0.841~0.968);BUB1,0.966(95%CI:0.936~0.997);KIF11,0.952(95%CI:0.924~0.980);TOP2A,0.971(95%CI:0.952~0.989);CCNB,20.918(95%CI:0.827~1.000);CHEK1,0.936(95%CI:0.874~0.998);RRM2,0.834(95%CI:0.734~0.934);ASPM,0.905(95%CI:0.858~0.952)。這提示10個(gè)基因在膠質(zhì)母細(xì)胞瘤中均有較高的診斷價(jià)值。
現(xiàn)有研究表明約30%左右的腦腫瘤為神經(jīng)膠質(zhì)瘤,占惡性中樞神經(jīng)系統(tǒng)腫瘤的80%[10]。其中,膠質(zhì)母細(xì)胞瘤是最為常見的腦膠質(zhì)瘤類型,是所有腫瘤中預(yù)后最差的類型之一。膠質(zhì)母細(xì)胞瘤的發(fā)病機(jī)制較為復(fù)雜,多數(shù)研究針對(duì)多種膠質(zhì)母細(xì)胞瘤相關(guān)基因進(jìn)行了研究[11]。然而,膠質(zhì)母細(xì)胞瘤發(fā)生的確切機(jī)制、表觀遺傳特征及基因分子特征仍未闡明。隨著生物信息學(xué)技術(shù)的持續(xù)發(fā)展,通過多種富集分析方法篩選疾病差異基因信息逐漸成為尋找疾病診斷和治療靶點(diǎn)的新思路[12]。
本研究選取GSE31262基因表達(dá)譜數(shù)據(jù)集作為分析對(duì)象,分析了5個(gè)成人神經(jīng)干細(xì)胞個(gè)體樣本和9個(gè)膠質(zhì)母細(xì)胞瘤干細(xì)胞個(gè)體樣本,從中篩選出了2692個(gè)差異表達(dá)基因。通過對(duì)這些差異基因進(jìn)行KEGG通路分析,本研究發(fā)現(xiàn)上述差異基因主要參與細(xì)胞內(nèi)吞作用、溶酶體、MAPK信號(hào)通路、細(xì)胞周期、人乳頭瘤病毒感染、人類免疫缺陷病毒感染等。GO富集分析顯示這些差異表達(dá)基因主要涉及細(xì)胞器裂變、核分裂、胚胎器官發(fā)育、染色體分離、軸突生成、膠質(zhì)細(xì)胞再生、蛋白質(zhì)定位于細(xì)胞外圍等。其次,本研究采用Cytoscape軟件分析所得到的各個(gè)差異基因之間的關(guān)系,并篩選出了可能在膠質(zhì)母細(xì)胞瘤發(fā)生發(fā)展中發(fā)揮關(guān)鍵作用的10個(gè)差異基因(CDK1、CCNB1、CCNA2、BUB1、KIF11、TOP2A、CCNB2、CHEK1、RRM2、ASPM)。進(jìn)一步在TCGA數(shù)據(jù)庫中分析上述10個(gè)差異基因的表達(dá)水平與膠質(zhì)母細(xì)胞瘤患者預(yù)后的關(guān)系,結(jié)果顯示,上述10個(gè)差異基因均與患者預(yù)后有關(guān)(P<0.000 1)。與低表達(dá)組患者比較,高表達(dá)組患者的風(fēng)險(xiǎn)比明顯升高,臨床預(yù)后較差。其中,CCNA2基因預(yù)示膠質(zhì)母細(xì)胞瘤患者預(yù)后的風(fēng)險(xiǎn)比值最高,該結(jié)果提示CCNA2基因可能與膠質(zhì)母細(xì)胞瘤患者預(yù)后的關(guān)系最為密切。
CCNA2基因定位于人染色體4號(hào)染色體,q27區(qū),全長7 489 bp,在人體多種器官組織中表達(dá)[13]。GAO等[14]研究發(fā)現(xiàn),CCNA2基因在多種腫瘤中表達(dá)上調(diào),SAVIRANTA等[15]研究顯示CCNA2基因在癌癥轉(zhuǎn)化和進(jìn)展中發(fā)揮關(guān)鍵作用。然而,目前鮮有研究表明CCNA2基因與膠質(zhì)母細(xì)胞瘤患者的不良預(yù)后有直接關(guān)系。本研究通過生物信息學(xué)分析發(fā)現(xiàn),CCNA2基因是膠質(zhì)母細(xì)胞瘤PPI信號(hào)通路中的差異基因之一,并與膠質(zhì)母細(xì)胞瘤患者的預(yù)后相關(guān)。目前,有研究發(fā)現(xiàn),CCNA2基因具有促進(jìn)膠質(zhì)母細(xì)胞瘤細(xì)胞增殖、遷移和侵襲的作用[16]。這提示CCNA2基因在膠質(zhì)母細(xì)胞瘤的發(fā)生發(fā)展中可能發(fā)揮重要作用,為CCNA2與膠質(zhì)母細(xì)胞瘤預(yù)后相關(guān)提供了理論依據(jù),其更深的潛在機(jī)制值得進(jìn)一步探索。
此外,本研究進(jìn)一步分析了膠質(zhì)母細(xì)胞瘤組織的24種免疫細(xì)胞浸潤水平和10個(gè)hub基因的表達(dá)水平之間的關(guān)系,為其在膠質(zhì)母細(xì)胞瘤發(fā)生發(fā)展中的具體作用和機(jī)制提供思路。本研究ROC曲線分析也進(jìn)一步證實(shí)了這10個(gè)基因在膠質(zhì)母細(xì)胞瘤中的診斷價(jià)值。
綜上所述,本研究利用GEO數(shù)據(jù)庫篩選出10個(gè)與膠質(zhì)母細(xì)胞瘤密切相關(guān)的基因,對(duì)其進(jìn)行深入研究可能有助于進(jìn)一步闡釋膠質(zhì)母細(xì)胞瘤發(fā)生、發(fā)展的機(jī)制,并且10個(gè)差異基因有望成為評(píng)估膠質(zhì)母細(xì)胞瘤患者診斷和預(yù)后的新的標(biāo)志物。然而,本研究也存在一些局限性,如尚未深入的分子生物學(xué)研究驗(yàn)證上述發(fā)現(xiàn)。因此,未來研究方向?yàn)檫M(jìn)一步擴(kuò)充膠質(zhì)母細(xì)胞瘤樣本庫,深入分析上述差異基因與疾病進(jìn)展的關(guān)系。