姚宇同,劉 巖,戴 露,夏彬彬
(錦州醫(yī)科大學附屬第一醫(yī)院泌尿外科,錦州 121000)
腎細胞癌(renal cell carcinoma,RCC)是全世界范圍內(nèi)常見的泌尿系統(tǒng)惡性腫瘤之一。2018 年的癌癥統(tǒng)計數(shù)據(jù)顯示,全年新診斷為RCC 的患者約40 萬人,其中約17.5 萬人死亡[1]。其中腎透明細胞癌(clear cell renal cell carcinoma,ccRCC)是RCC中最常見的一種病理類型,占全部RCC 的65%~85%。由于RCC 對放療及化療不敏感,故目前仍以手術(shù)治療為主。RCC 早期多無明顯的臨床表現(xiàn)及體征,往往就診時已經(jīng)發(fā)生轉(zhuǎn)移,而轉(zhuǎn)移性RCC 手術(shù)難度大且預(yù)后較差,因此,研究RCC 的關(guān)鍵基因?qū)CC 的診斷、治療及提示預(yù)后具有重大價值。
egl-9 家族缺氧誘導(dǎo)因子1(egl-9 family hypoxia inducible factor 1,EGLN1,又稱PHD2)是一種存在于生物機體中的氧敏感因子,通過感知細胞組織內(nèi)的氧含量的情況調(diào)控其下游基因的表達,進而影響如葡萄糖攝取、代謝調(diào)節(jié)、血管生成、細胞周期等重要生理過程[2]。有研究表明,EGLN1的表達情況與大腸癌[3]、子宮內(nèi)膜癌[4]、乳腺癌[5]、肺癌[6]等多種惡性腫瘤事件的發(fā)生及預(yù)后具有密切關(guān)系。目前ccRCC 中EGLN1表達的臨床意義尚不明確,本文應(yīng)用生物信息學的方法,綜合分析EGLN1在ccRCC中的表達情況,為臨床中ccRCC 的診斷、治療及預(yù)后評估提供新的方向。
基于癌癥基因組圖譜(The Cancer Genome Atlas,TCGA,https://portal.gdc.cancer.gov),下載ccRCC患者的基因表達數(shù)據(jù)[530 例,癌組織樣本539 例(存在1 枚病理提取數(shù)條樣本的可能),癌旁正常腎組織樣本72 例]。從該數(shù)據(jù)中提取全部EGLN1基因的表達情況并進行整理分析,使用R(v3.6.1)中l(wèi)imma及beeswarm程序包繪制EGLN1表達散點差異圖。
使用在線分析平臺UALCAN(http://ualcan.path.uab.edu/index.html)分析ccRCC 中EGLN1基因在病理分期、腫瘤分級、患者年齡、淋巴結(jié)轉(zhuǎn)移狀態(tài)、組織亞型等角度的表達情況。
基于TCGA 數(shù)據(jù)庫中ccRCC 的臨床信息數(shù)據(jù)(537 例,表1)中EGLN1基因的表達情況進行其與總生存率的相關(guān)性單因素及多因素Cox分析。
基因富集分析(gene set enrichment analysis,GSEA)是一種針對全基因組表達譜芯片數(shù)據(jù)的分析方法。以京都基因與基因組百科全書(Kyoto encyclopedia of genes and genomes,KEGG)為背景,根據(jù)EGLN1所有的基因表達量進行統(tǒng)計分析,了解EGLN1在各個代謝通路中的高低表達組中的差異。
表1 TCGA ccRCC患者的特征Tab. 1 Characteristics of ccRCC patients in TCGA
功能蛋白互作網(wǎng)絡(luò)(STRING,https://string-db.org/)[7]是包含已知和預(yù)測的蛋白質(zhì)相互作用的數(shù)據(jù)庫,包括從基因組分析、高通量試驗及共表達研究中獲得的物理和功能的關(guān)聯(lián)。應(yīng)用STRING(v11.0)數(shù)據(jù)庫獲取EGLN1 來自智人(Homo sapi-ens)的蛋白質(zhì)互作網(wǎng)絡(luò)圖,并了解EGLN1存在的共表達基因,通過在線平臺基因表達譜交互式分析網(wǎng)站(Gene Expression Profiling Interactive Analysis,GEPIA,http://gepia.cancer-pku.cn/)進行相關(guān)分析。
圖1 EGLN1在TCGA數(shù)據(jù)庫中的基因表達情況Fig. 1 EGLN1 gene expression in the TCGA database
應(yīng)用R(v3.6.1)對ccRCC臨床病例數(shù)據(jù)中EGLN1的表達量與總生存期進行單因素及多因素Cox 回歸分析。統(tǒng)計檢驗采取雙邊檢驗,P<0.05 為差異具有統(tǒng)計學意義。GSEA中符合|NES|>1、NOM p-val<0.05及FDR q-val<0.25 的富集結(jié)果為差異具有統(tǒng)計學意義。(NES為標準化富集分數(shù);NOM p-val為標準化顯著性水平;FDR q-val為矯正多重假設(shè)檢驗)。
使用R(v3.6.1),安裝limma和beeswarm程序包,于TCGA 數(shù)據(jù)庫下載截止于2019 年8 月ccRCC 數(shù)據(jù)中的EGLN1基因表達樣本(530 例,癌組織樣本539例,癌旁正常腎組織樣本72例)。應(yīng)用UALCAN在線分析平臺分析ccRCC中EGLN1在患者年齡、病理分期、腫瘤分級、淋巴結(jié)轉(zhuǎn)移狀態(tài)及組織亞型等角度的表達情況(圖1)發(fā)現(xiàn),在所有樣品中,EGLN1在ccRCC組織中的表達明顯高于癌旁正常組織。另外,EGLN1 的表達量隨年齡的增長而增加。同時,EGLN1 的表達量與腫瘤的分級和分期成反比,這表明EGLN1基因可能對腫瘤的惡性進展有抑制作用。
提取TCGA數(shù)據(jù)庫中所有ccRCC樣本中(537例,表1)EGLN1基因的表達數(shù)據(jù),根據(jù)表達差異分為高表達組和低表達組,應(yīng)用R(v3.6.1)對罹患ccRCC患者的生存率進行描繪(圖2)。可見EGLN1高表達組患者生存率高于低表達組,且P<0.05,差異具有統(tǒng)計學意義。
圖2 EGLN1在ccRCC患者高低表達組的生存差異Fig. 2 Survival difference of EGLN1 between high and low expression groups of patients with ccRCC
將ccRCC 患者臨床數(shù)據(jù)樣本中EGLN1的表達量與總生存期進行單因素及多因素Cox 回歸分析發(fā)現(xiàn),ccRCC 患者癌組織中EGLN1的表達量是患者生存期的獨立風險因素。由表2 和圖3 可知風險比(hazard ratio,HR)為0.93,95%置信區(qū)間(95% confidence interval,95%CI)為0.90~0.97,P為0.000 08。
表2 ccRCC患者EGLN1表達量與總生存期相關(guān)性的單因素及多因素Cox回歸分析Tab. 2 Univariate and multivariate Cox regression analysis of the correlation between EGLN1 expression and overall survival in patients with ccRCC
圖3 ccRCC患者EGLN1表達量與總生存期多因素Cox分析Fig. 3 Multivariate Cox analysis of EGLN1 expression and overall survival in patients with ccRCC
為了解EGLN1基因在ccRCC 中參與的生物過程和信號通路,本研究將539 例癌組織樣本按EGLN1表達量的中位值[每千個堿基的轉(zhuǎn)錄每百萬映射讀取的碎片(fragments per kilobase of exon model per million mapped fragments,F(xiàn)PKM)=19.725]分為高表達組及低表達組進行基因GSEA 富集分析(number of permutations:1 000,|NES|>1,NOM p-val<0.05,F(xiàn)DR q-val<0.25)。結(jié)果顯示,EGLN1的高表達與前列腺癌、子宮內(nèi)膜癌、胰腺癌、RCC、小細胞肺癌、甲狀腺癌、大腸癌等惡性腫瘤密切相關(guān),同時在癌癥途徑、泛素介導(dǎo)蛋白水解途徑、細胞凋亡通路中也呈高表達型(圖4、5)。此外,EGLN1在心肌收縮通路中呈低表達型。
圖4 EGLN1在各途徑的表達情況Fig. 4 The expression of EGLN1 in each pathway
為進一步了解基因EGLN1在人體內(nèi)的功能機制,本研究應(yīng)用STRING 數(shù)據(jù)庫構(gòu)建了EGLN1 相關(guān)功能蛋白質(zhì)互作網(wǎng)絡(luò)。由圖6 可知,共有20 種預(yù)測的功能蛋白與EGLN1 相互作用。其中有4 種相關(guān)蛋白基因已被證實與ccRCC 的發(fā)生和進展有關(guān)。von Hippel-Linda 腫瘤抑制因子(von Hippel-Lindau tumor suppressor,VHL)具有泛素連接酶E3 活性,參與缺氧誘導(dǎo)因子(hypoxia inducible factor,HIF)的泛素化及降解,進而影響其下級通路[如血管內(nèi)皮生長因子(vascular endothelial growth factor,VEGF)、血小板衍生生長因子(platelet derived growth factor,PDGF)等轉(zhuǎn)錄的增加],由此促進惡性腫瘤的進展[8]。已有研究表明,絕大多數(shù)ccRCC 中均發(fā)生了VHL 的失活[9]。低氧誘導(dǎo)因子1A 亞基(hypoxia inducible factor 1 subunit alpha,HIF1A)的過表達會激活多種致癌信號通路,或使腫瘤抑制因子失活,其升高多發(fā)生在癌癥早期,通常與腫瘤的惡性進展、預(yù)后差及對放化療的低敏感度有關(guān)[10]。雷帕霉素靶蛋白(mammalian target of rapamycin,mTOR)的過度表達可能促進腎臟癌變,其所存在的mTOR 通路的過度激活被認為是RCC 發(fā)生的標志[11]。同時,mTOR 的過表達也被認為是多種癌癥的不良預(yù)后因素[12]。叉頭盒O3(forkhead box O3,F(xiàn)OXO3)被認為是一種抑癌基因,參與細胞增殖、細胞程序性死亡等細胞生理過程的調(diào)節(jié)[13]。在RCC 組織中,miR-122 可直接靶向FOXO3以起到促進腫瘤生長的作用[14]。通過在線網(wǎng)站GEPIA 分析發(fā)現(xiàn)EGLN1與VHL、HIFIA、mTOR、FOXO3 的表達均呈正相關(guān)(P<0.05)(圖7)。
圖5 EGLN1基因相關(guān)富集分析(細胞凋亡、心機收縮通路、大腸癌、子宮內(nèi)膜癌、胰腺癌、癌癥通路、前列腺癌、RCC、小細胞肺癌、甲狀腺癌、泛素介導(dǎo)蛋白水解途徑)Fig. 5 EGLN1 gene-related enrichment analysis (apoptosis, cardiac muscle contraction pathway, colorectal cancer, endometrial cancer,pancreatic cancer, pathway in cancer, prostate cancer, RCC, small cell lung cancer, thyroid cancer, ubiquitin-mediated proteolytic pathway)
圖6 構(gòu)建EGLN1相關(guān)蛋白質(zhì)互作網(wǎng)絡(luò)Fig. 6 Construction of EGLN1 related protein interaction network
圖7 EGLN1相關(guān)性分析Fig. 7 EGLN1 correlation analysis
缺氧環(huán)境發(fā)生于多種實體惡性腫瘤事件這一發(fā)現(xiàn)已成為國內(nèi)外研究的焦點。腫瘤細胞會根據(jù)缺氧環(huán)境發(fā)生一系列生物學變化來應(yīng)對組織缺氧,如凋亡受限、血管的異常增殖、耐藥等。EGLN 家族屬于亞鐵和2-氧戊二酸雙加氧酶家族,作為生物細胞組織中的氧感受器調(diào)節(jié)著生物機體內(nèi)的氧穩(wěn)態(tài)。其家族之一的EGLN1 的主要作用即在常氧情況下將HIF1A 羥基化,并通過募集VHL 將其靶向降解[15]。而在乏氧時,EGLN1 活性降低,HIF1A 降解受限并不斷積蓄,導(dǎo)致了控制血管生成、葡萄糖代謝、增殖、侵襲及轉(zhuǎn)移等基因的轉(zhuǎn)錄[16]。由此可見,EGLN1的表達情況很有可能潛移默化地影響著腫瘤的發(fā)生及進展。
EGLN1在不同的癌組織中的作用不盡相同,甚至其表達水平會出現(xiàn)截然相反的情況。在宮頸癌的相關(guān)研究中,EGLN1在宮頸上皮內(nèi)瘤變組織和癌變組織中的陽性表達呈升高趨勢[17]。相關(guān)試驗證明,隨著宮頸病變程度的增加,EGLN1 蛋白和其mRNA 水平上調(diào),這表明EGLN1表達高低與宮頸病變嚴重程度呈正相關(guān)。在乳腺癌中,EGLN1 與表皮生長因子受體(epidermal growth factor receptor,EGFR)在低氧環(huán)境中的相互作用可能增強了腫瘤的進展和轉(zhuǎn)移[18]。而最近也有研究表明,EGLN1低表達水平的乳腺癌患者的生存時間明顯縮短,表明該基因可能存在抗腫瘤作用[18]。同樣,肝細胞癌中EGLN1 的高水平與腫瘤分期更高、腫瘤尺寸更大以及患者總體生存狀況較差有關(guān)[19]。EGLN1 高表達的肺腺癌患者的總生存期(overall surviva,OS)及無復(fù)發(fā)生存期(relapse free survival,RFS)顯著縮短,提示預(yù)后不良[20]。Di 等[3]研究發(fā)現(xiàn),在缺氧狀態(tài)下,mTOR 通路會抑制P70S6K 的活性,進而釋放PP2A/B55α 信號,P70S6K 的下調(diào)以及PP2A /B55α 磷酸酶活性的相互上調(diào)導(dǎo)致EGLN1 的去磷酸化及部分失活,最終促進HIF1A 的穩(wěn)定。
本研究整理TCGA 數(shù)據(jù)庫發(fā)現(xiàn),EGLN1 在ccRCC中高表達,這與EGLN1 在多種其他惡性腫瘤中的表達相一致。在整理分析EGLN1 表達情況與病理結(jié)果時發(fā)現(xiàn),該基因的表達量隨年齡的增長而增加,結(jié)合多因素Cox 回歸分析結(jié)果,提示老齡是罹患ccRCC 的高危風險之一。同時,在較高分期及分級的病理組織中,EGLN1 的表達量反而呈下降趨勢。其影響ccRCC 惡性程度的機制可能是:在腫瘤組織內(nèi),EGLN1 表達下調(diào)及HIF1A 的上調(diào)加劇了缺氧微環(huán)境,激活了血管生成相關(guān)刺激因子[21],大量異型血管形成,為腫瘤組織提供了豐富血供的同時也促進了腫瘤的生長和侵襲。此外,低氧環(huán)境亦可通過PHD2-HIF1A 驅(qū)動機制調(diào)節(jié)癌癥相關(guān)成纖維細胞(cancer associated fibroblast,CAF)誘導(dǎo)的基質(zhì)重塑和癌細胞侵襲[22]。這也間接說明EGLN1 的高表達可能對腫瘤的惡性進展有著抑制作用。多因素Cox 分析顯示,EGLN1 的表達量是ccRCC 患者的獨立風險因素,提示EGLN1 的表達水平可能會影響ccRCC 患者的預(yù)后情況。將TCGA 數(shù)據(jù)庫中ccRCC 患者總體生存率與EGLN1 高低表達進行分析,發(fā)現(xiàn)EGLN1 低表達的患者生存率較差,這使得EGLN1 有望成為我們評估ccRCC 的預(yù)后指標。我們利用STRING 構(gòu)建EGLN1 蛋白功能互作網(wǎng)絡(luò)預(yù)測出20 種功能蛋白與EGLN1 相互作用,其中的4 種與ccRCC 的發(fā)生與進展相關(guān)。進一步應(yīng)用GEPIA 數(shù)據(jù)庫對它們進行Spearman 分析發(fā)現(xiàn),EGLN1與HIF1A、VHL、mTOR、FOXO3 的表達情況可能相互作用推動著ccRCC 的發(fā)生進展。通過富集分析發(fā)現(xiàn),EGLN1 在RCC、癌癥途徑、泛素介導(dǎo)的蛋白水解途徑及細胞凋亡通路中均呈高表達型。同時結(jié)合UALCAN 分析平臺分析ccRCC 發(fā)現(xiàn),隨著腫瘤分期及分級的升高,EGLN1 的表達量呈下降趨勢,提示EGLN1 在ccRCC 中可能抑制著腫瘤的惡性進展。Liu 等[23]研究發(fā)現(xiàn),EGLN1 的缺失會導(dǎo)致AKT-mTOR 信號通路的激活,并與致癌性B-Raf 原癌基因(B-Raf proto-oncogene,BRAF)的協(xié)同作用可增加原發(fā)性皮膚黑色素瘤(skin cutaneous melanoma,SKCM)的淋巴結(jié)轉(zhuǎn)移能力。
本研究利用TCGA 數(shù)據(jù)庫樣本及生物信息學方法分析驗證了EGLN1在ccRCC 臨床樣本中的表達情況,隨后進行ccRCC 患者生存分析及總生存期相關(guān)Cox 分析,提出EGLN1可能是ccRCC 中潛在的抑癌因素。生物信息學分析是使用計算機系統(tǒng)收集和分析大量生物數(shù)據(jù)的技術(shù),缺少試驗數(shù)據(jù)支持驗證,存在一定的局限性。未來可以從臨床角度對EGLN1與腫瘤病理類型、腫瘤病理分級、術(shù)后預(yù)后的關(guān)系進行分析驗證,也可以從基礎(chǔ)的角度敲低EGLN1后研究ccRCC 細胞系的侵襲遷移情況。EGLN1在ccRCC 發(fā)生與進展中的具體機制及生物學作用仍等待進一步研究。