韓小玲,凌志甫,韓俏英
(廣東醫(yī)科大學(xué),廣東 東莞 523808)
宮頸癌是女性生殖系統(tǒng)常見的三大惡性腫瘤之一。近幾年,該病的發(fā)病率和死亡率均呈逐漸上升的趨勢。據(jù)統(tǒng)計,全球每年約有53 萬新發(fā)宮頸癌患者,每年約有27.5 萬宮頸癌患者死亡[1]。近三十年來,我國宮頸癌的發(fā)病率提高了10% ~40%,每年新發(fā)宮頸癌患者的數(shù)量超過14 萬,每年死亡的宮頸癌患者數(shù)量約為3.7 萬。宮頸癌已成為我國年輕女性發(fā)病率較高的婦科惡性腫瘤之一[2]。積極地探索宮頸癌發(fā)生、發(fā)展的機制、新的診斷和治療靶點具有重要的臨床意義。腫瘤組織的代謝情況與正常組織不同,具有代謝重編程的顯著特點。腫瘤組織即使在有氧的條件下,仍以糖酵解為主要代謝方式,即存在Warburg 效應(yīng)[3]。糖酵解是腫瘤組織特有的代謝方式。腫瘤組織糖酵解的程度與其進展情況具有密切的聯(lián)系。有多個糖酵解相關(guān)基因會參與調(diào)控糖酵解,并影響宮頸癌的發(fā)生和發(fā)展。但目前對于這些基因在宮頸癌發(fā)生和發(fā)展中的具體作用仍未可知。生物信息學(xué)分析方法是基于高通量芯片和測序技術(shù)發(fā)展起來的一種研究方法。生物信息學(xué)分析方法的出現(xiàn)為人們探索疾病的發(fā)展過程提供了新的方法。本文主要是利用生物信息學(xué)分析方法研究多個糖酵解相關(guān)基因在宮頸癌組織中的表達(dá)譜。
從腫瘤基因組圖譜計劃(The Cancer Genome Atlas,TCGA)數(shù)據(jù)庫(https://portal.gdc.cancer.gov/)下載2020年11 月20 日前收集的宮頸癌轉(zhuǎn)錄組數(shù)據(jù)。數(shù)據(jù)類型為FPKM 形式。該數(shù)據(jù)集來自3 例正常宮頸樣本和306 例宮頸癌樣本。然后將下載后的轉(zhuǎn)錄組數(shù)據(jù)進行基因重注釋。從基因富集分析(Gene Set Enrichment Analysis,GSEA)數(shù)據(jù)庫(https://www.gsea-msigdb.org/gsea/index.jsp)下載與糖酵解相關(guān)的基因集。該數(shù)據(jù)集包括383 個糖酵解相關(guān)基因。提取TCGA 數(shù)據(jù)庫宮頸癌數(shù)據(jù)集中存在上述糖酵解相關(guān)基因的表達(dá)譜。
利用R 軟件中的limma 包對383 個糖酵解相關(guān)基因進行差異分析。刪除在樣本中表達(dá)較低的基因,按照過濾條件(差異倍數(shù)絕對值大于1.5,且P 值<0.01)篩選基因。借助R 軟件的clusterprofiler 包對識別出的差異基因進行GO 功能和KEGG 通路富集分析。基于在線網(wǎng)站String(https://string-db.org/)構(gòu)建的糖酵解相關(guān)差異基因蛋白互作網(wǎng),利用cytoscape 軟件中的cytohubba 插件對這些差異基因進行蛋白互作網(wǎng)絡(luò)分析。按照degree 大于10 的標(biāo)準(zhǔn),識別蛋白互作網(wǎng)絡(luò)中的核心基因。
本次研究中共篩選出76 個差異基因。其中包括54 個基于正常宮頸組織基因上調(diào)的差異基因,22 個基于正常宮頸組織基因下調(diào)的差異基因。
對這些差異基因進行GO 功能富集分析的結(jié)果顯示,這76 個差異基因顯著富集在能量代謝、能量合成等生物學(xué)過程中。詳見表1。對這些差異基因進行KEGG 通路富集分析的結(jié)果顯示,這76 個差異基因顯著富集在與氨基酸、糖代謝相關(guān)的通路上。詳見表2。
表1 對這些差異基因進行GO 功能富集分析的結(jié)果
表2 對這些差異基因進行KEGG 通路富集分析的結(jié)果
在這些差異基因中, 有CDK1、NDC1、NUP107、PFKM、IGF1 和HK2 六個可識別的蛋白互作網(wǎng)絡(luò)核心基因。
近年來,高通量芯片和測序技術(shù)得到飛速的發(fā)展,TCGA 及GEO 等公共腫瘤數(shù)據(jù)庫存儲的腫瘤組織轉(zhuǎn)錄組數(shù)據(jù)不斷完善,科研人員已經(jīng)可以借助這些技術(shù)和平臺對腫瘤基因進行生物信息學(xué)分析。這為臨床上進行腫瘤學(xué)研究開辟了一個新的思路。使用生物信息學(xué)分析方法進行科研所需的經(jīng)費少,耗時較短,無需科研人員自己在臨床上尋找病例。TCGA 是由美國國家癌癥研究所(National Cancer Institute,NCI)和國家人類基因組研究所(National Human Genome Research Institute,NHGRI)合作繪制出的涵蓋多種腫瘤類型及亞型、多維度關(guān)鍵基因組變化的圖譜。TCGA是目前最大的儲存癌癥基因信息的數(shù)據(jù)庫。TCGA 中收集了大量各種癌癥的基因表達(dá)數(shù)據(jù)、miRNA 表達(dá)數(shù)據(jù)、拷貝數(shù)變異數(shù)據(jù)、DNA 甲基化數(shù)據(jù)、SNP 數(shù)據(jù)及臨床研究數(shù)據(jù)[4-5]。科研人員可以通過對TCGA 數(shù)據(jù)庫中的相關(guān)數(shù)據(jù)進行分析和整合,探索腫瘤的發(fā)生、發(fā)展、診斷、風(fēng)險分層、治療策略及患者的預(yù)后等。宮頸癌是臨床上常見的婦科惡性腫瘤之一。目前臨床上主要使用手術(shù)、放療、化療等多種治療方法治療宮頸癌。在發(fā)病早期和中期接受科學(xué)有效治療的宮頸癌患者通??梢垣@得較好的預(yù)后。但在病情進展到晚期才接受治療的宮頸癌患者在發(fā)病后5 年的生存率仍較低[6]。探索對宮頸癌患者進行治療的新靶點具有重要的意義。與正常組織進行有氧氧化代謝不同,腫瘤組織代謝的方式傾向于進行無氧糖酵解。與腫瘤組織糖酵解相關(guān)的課題是目前腫瘤學(xué)研究領(lǐng)域中比較熱門的課題。目前關(guān)于糖酵解與宮頸癌發(fā)生、發(fā)展及結(jié)局關(guān)系的研究比較缺乏,現(xiàn)有的部分研究往往將研究目標(biāo)集中在單個分子上。生物信息學(xué)分析方法是基于高通量芯片和測序技術(shù)發(fā)展起來的一種研究方法。該方法為科研人員研究多個分子與疾病的相關(guān)性提供了便利。本次研究中,我們提取TCGA 數(shù)據(jù)庫中宮頸癌轉(zhuǎn)錄組多個糖酵解相關(guān)基因的數(shù)據(jù),利用生物信息學(xué)方法系統(tǒng)地分析了多個糖酵解相關(guān)基因在宮頸癌組織中的表達(dá)情況、功能及通路等,為深入開展宮頸癌領(lǐng)域的研究奠定了基礎(chǔ),也為臨床進一步選取治療靶點打開了新的思路。
本次研究中,我們利用R 軟件中的limma 包對數(shù)據(jù)樣本進行差異分析,篩選出了76 個差異基因。其中包括54個基于正常宮頸組織基因上調(diào)的差異基因,22 個基于正常宮頸組織基因下調(diào)的差異基因。這從基因角度印證了多個糖酵解相關(guān)基因可參與宮頸癌的發(fā)生和發(fā)展。對這些差異基因進行KEGG 通路富集分析的結(jié)果顯示,這76 個差異基因顯著富集在與氨基酸、糖代謝相關(guān)的通路上。富集在這些通路中的HK2 又被稱為己糖激酶,可催化己糖磷酸化。HK2 是糖酵解途徑中的第一個酶,也是糖酵解途徑的限速酶。正常情況下,HK2 在哺乳動物中呈高度保守的特性。相關(guān)的研究結(jié)果顯示,HK2 基因可拮抗經(jīng)線粒體途徑的細(xì)胞凋亡[7]。在腫瘤細(xì)胞中,約60% 的ATP 來源于糖酵解過程。已有研究證實,在被切除的肺、胃腸及乳腺惡性腫瘤組織中,HK2 的含量明顯增高[8-9]。富集在這些通路中的PCK2 即線粒體磷酸烯醇式丙酮酸羧激酶2,是糖異生途徑中的關(guān)鍵限速酶。PCK2 是健康組織代謝過程中連接三羧酸循環(huán)、糖酵解和糖異生的樞紐分子,可為組織代謝提供足夠的能量和中間體[10]。PCK2 在多種腫瘤組織中均呈異常表達(dá)。PCK2 既具有促進腫瘤進展的作用,又具有抑制腫瘤進展的作用。本次研究中我們發(fā)現(xiàn),與正常的宮頸組織相比,宮頸癌組織中的PCK2 呈高表達(dá)趨勢。這提示,PCK2 在宮頸癌組織中或許屬于一種抑癌分子。本次研究中,我們利用cytoscape 軟件中的cytohubba 插件對這些差異基因進行蛋白互作網(wǎng)絡(luò)分析,結(jié)果識別出CDK1、NDC1、NUP107、PFKM、IGF1 和HK2 六個核心基因。在目前對宮頸癌的相關(guān)研究中,針對上述6 個基因開展的研究均較少。這些基因可作為今后研究宮頸癌發(fā)生機制的重要靶點。
綜上所述,宮頸癌組織中存在多個與正常宮頸組織基因存在差異的糖酵解相關(guān)基因。這些差異基因顯著富集在與能量代謝相關(guān)的功能和通路上。在這些差異基因中,有CDK1、NDC1、NUP107、PFKM、IGF1 和HK2 六個可識別的蛋白互作網(wǎng)絡(luò)核心基因。