葉碩鵬 林登強(qiáng) 陳凌宇 賴鵬
腎透明細(xì)胞癌(clear cell renal cell carcinoma, ccRCC)是腎小管上皮來源最常見的腎臟惡性腫瘤,全球每年新發(fā)ccRCC病例約為29.5萬人,相關(guān)死亡人數(shù)達(dá)13.4萬人[1]。盡管目前局部進(jìn)展和晚期ccRCC的治療已從非特異性免疫方法轉(zhuǎn)變?yōu)樾滦兔庖忒煼?,但這類患者預(yù)后仍然較差[2]。因此,我們亟需尋找新型有效的ccRCC腫瘤標(biāo)志物去協(xié)助臨床醫(yī)師診斷、指導(dǎo)治療、評估并改善患者預(yù)后。
在人類基因組中,參與編碼蛋白的RNAs僅占基因組的1%~2%,既往研究主要集中于此,而高達(dá)98%的非編碼RNA(non-coding RNA, ncRNA)同樣具備調(diào)控細(xì)胞復(fù)制、細(xì)胞特點(diǎn)及細(xì)胞功能的作用,并在腫瘤免疫應(yīng)答過程中發(fā)揮至關(guān)重要的作用,如抗原暴露、抗原識別、免疫激活、免疫浸潤、腫瘤清除等[3]。長鏈非編碼RNA(long non-coding RNA, lncRNA)作為ncRNA的一大類,相關(guān)研究已證實其不僅在腫瘤中異常表達(dá),而且參與腫瘤的發(fā)生、發(fā)展,有望成為腫瘤診斷或治療的分子標(biāo)志物[4]。
近來研究表明lncRNA與ccRCC的發(fā)生、發(fā)展密切相關(guān),其可能通過調(diào)控免疫浸潤、免疫功能等影響ccRCC的臨床預(yù)后[5]。因此,我們基于免疫相關(guān)的lncRNA,納入臨床病理學(xué)信息,構(gòu)建包含lncRNA風(fēng)險評分(lncRNA-Score)和臨床病理學(xué)信息的聯(lián)合預(yù)后模型,旨在協(xié)助臨床診療,改善ccRCC患者的預(yù)后。
ccRCC患者的基因表達(dá)譜及相應(yīng)臨床數(shù)據(jù)來源于癌癥基因組圖譜(The Cancer Genome Atlas, TCGA)數(shù)據(jù)庫(https://cancergenome.nih.gov/),排除沒有完整臨床數(shù)據(jù)或生存時間≤30 d的患者,共納入539例ccRCC組織數(shù)據(jù)和72例正常腎臟組織數(shù)據(jù)。而免疫應(yīng)答和免疫系統(tǒng)過程基因集來源于基因集富集分析(gene set enrichment analysis, GSEA)數(shù)據(jù)庫(https://www.gsea-msigdb.org/gsea/msigdb/)。
因變量:生存結(jié)局。包含生存或死亡,如果沒有出現(xiàn)終點(diǎn)事件或截止到最后一次隨訪時患者仍存活,則被作為截尾數(shù)據(jù)處理。
自變量:lncRNA的數(shù)據(jù)及ccRCC患者的年齡、性別、腫瘤分期、腫瘤分級。
首先,通過人類基因注釋文件注釋基因芯片信息,結(jié)合GSEA數(shù)據(jù)庫來源的免疫相關(guān)基因集,獲取免疫相關(guān)的lncRNA(r>0.7,P<0.001),并通過R軟件的Heatmap包繪制lncRNA表達(dá)熱圖、GSEA 1.0.3軟件進(jìn)行基因富集分析。然后,利用R 軟件的Survival包進(jìn)行生存分析和多因素Cox回歸分析,將P<0.05作為lncRNA最終保留在預(yù)后模型中的標(biāo)準(zhǔn)。輸出回歸系數(shù)值、P值和HR及其95%CI等統(tǒng)計量。計算每個患者的風(fēng)險評分:Risk score=coef AL117336.2×expr AL117336.2+coef AC046143.1×expr AC046143.1+…+ coef AC016773.1×expr AC016773.1。coef表示lncRNA的多因素Cox比例風(fēng)險回歸系數(shù),expr表示lncRNA的表達(dá)值。以此建立風(fēng)險評分預(yù)后模型。結(jié)合lncRNA-Score與臨床病理學(xué)信息構(gòu)建聯(lián)合預(yù)后模型。根據(jù)計算結(jié)果,將中位風(fēng)險評分作為截斷值,將其分為高危組和低危組。最后,利用R軟件的Survival包和Surviminer包繪制高危組和低危組的生存曲線,利用R軟件的Survival包繪制受試者工作特征(receiver operating characteristic, ROC)曲線和校準(zhǔn)曲線,并以此結(jié)果來驗證預(yù)后預(yù)測模型的可行性、有效性。為進(jìn)一步使模型可視化,利用R軟件的rms包繪制Nomogram圖。
從TCGA數(shù)據(jù)庫中提取了539例ccRCC患者的數(shù)據(jù),共獲取14 142個lncRNA表達(dá)信息。經(jīng)GSEA數(shù)據(jù)庫(免疫系統(tǒng)過程相關(guān)基因集M13664和免疫應(yīng)答相關(guān)基因集M19817)比對,共發(fā)現(xiàn)128個與免疫相關(guān)的lncRNA。結(jié)合TCGA中患者的生存資料,我們篩選了30個與臨床預(yù)后相關(guān)的lncRNA。通過多因素Cox回歸分析,我們發(fā)現(xiàn)7個與免疫相關(guān)的lncRNA(均P<0.05)是ccRCC預(yù)后的獨(dú)立危險因素,7個lncRNA分別為AL117336.2、AC046143.1、AC027601.2、AL136295.2、LINC00886、AC046143.2和AC016773.1(表1)。根據(jù)多變量Cox風(fēng)險回歸模型的結(jié)果,構(gòu)建lncRNA-Score預(yù)后模型:Risk score=coef AL117336.2×expr AL117336.2+coef AC046143.1×expr AC046143.1+…+ coef AC016773.1×expr AC016773.1。依據(jù)中位風(fēng)險評分(0.81)將納入研究的患者分為高危組和低危組。通過計算所有患者7種免疫相關(guān)lncRNA的風(fēng)險評分、生存時間和表達(dá),結(jié)果表明lncRNA的表達(dá)與患者的生存相關(guān)。
表1 多因素Cox回歸分析結(jié)果
為構(gòu)建聯(lián)合預(yù)后模型,我們將lncRNA-Score及ccRCC患者的年齡、性別、腫瘤分級及腫瘤分期納入多因素Cox回歸分析中,分別平衡各項因素后發(fā)現(xiàn)lncRNA-Score(HR=1.18,P<0.01)、年齡(HR=1.03,P<0.01)、腫瘤分期(HR=1.65,P<0.01)和腫瘤分級(HR=1.31,P=0.03)是ccRCC的獨(dú)立危險因素(圖1、2)。依據(jù)中位風(fēng)險評分將ccRCC患者分成高危組和低危組。相對低危組而言,高危組患者的預(yù)后更差(P<0.01,圖2F)。因此,我們基于上述5個因素構(gòu)建了ccRCC聯(lián)合預(yù)后模型(C指數(shù)=0.78),對ccRCC患者進(jìn)行1年、3 年和5年的生存率預(yù)測后(圖3),患者1年、3年和5年生存率的ROC曲線下面積(area under curve, AUC)分別為0.86、0.81和0.77,校準(zhǔn)曲線也吻合良好(圖4),此結(jié)果提示構(gòu)建聯(lián)合預(yù)后預(yù)測模型具有優(yōu)越的預(yù)測效能。
圖1 森林圖可視化展示多因素Cox回歸分析結(jié)果
A:lncRNA-Score與ccRCC患者預(yù)后的關(guān)系;B:年齡與ccRCC患者預(yù)后的關(guān)系;C:性別與ccRCC患者預(yù)后的關(guān)系;D:腫瘤分級與ccRCC患者預(yù)后的關(guān)系;E:腫瘤分期與ccRCC患者預(yù)后的關(guān)系;F:風(fēng)險評分與ccRCC患者預(yù)后的關(guān)系圖2 Kaplan-Meier法分析各風(fēng)險因素與ccRCC患者預(yù)后的關(guān)系
圖3 Nomogram圖預(yù)測ccRCC患者生存率
A:ROC曲線展示聯(lián)合預(yù)后模型的AUC;B:校準(zhǔn)圖檢驗聯(lián)合預(yù)后模型的效能圖4 聯(lián)合預(yù)后模型的ROC曲線及校準(zhǔn)圖
近年來,對于ccRCC的治療取得了一定的進(jìn)步,但轉(zhuǎn)移性腎細(xì)胞癌的生存率仍不盡如人意。既往研究已證實ccRCC是一種免疫相關(guān)性疾病、免疫源性的腫瘤,腫瘤微環(huán)境可見大量淋巴細(xì)胞浸潤為其主要的組織學(xué)特征[6-7]。因此,免疫療法逐漸被臨床專家所認(rèn)可[8]。近來研究發(fā)現(xiàn)lncRNA在免疫應(yīng)答中發(fā)揮著至關(guān)重要的調(diào)控作用,并與多種腫瘤的發(fā)生、發(fā)展密切相關(guān),對其預(yù)后有良好的預(yù)測價值,且是它們治療的潛在有效靶點(diǎn)[9]。 因此篩選與ccRCC預(yù)后相關(guān)的免疫相關(guān)性lncRNA并聯(lián)合臨床病理學(xué)特征,由此構(gòu)建ccRCC預(yù)后模型,將有助于改善患者預(yù)后,為疾病治療提供理論依據(jù)。
在本研究中,我們將來自于TCGA數(shù)據(jù)庫中的539例ccRCC患者的14 142個lncRNA與GSEA數(shù)據(jù)庫的免疫相關(guān)基因集進(jìn)行比對,共發(fā)現(xiàn)128個免疫相關(guān)性lncRNA。結(jié)合TCGA中患者的生存資料,篩選出了30個與ccRCC患者臨床預(yù)后顯著相關(guān)的lncRNA。我們通過進(jìn)一步分析確認(rèn)了7個免疫相關(guān)的lncRNA為ccRCC預(yù)后的獨(dú)立危險因素,并計算lncRNA-Score。隨后,我們基于lncRNA-Score及ccRCC患者的年齡、性別、腫瘤分期和腫瘤分級構(gòu)建聯(lián)合預(yù)后模型,依據(jù)中位風(fēng)險評分將ccRCC患者分為高危組和低危組。相較于低危組患者而言,高危組患者的預(yù)后更差。同時患者1年、3年和5年生存率的AUC分別為0.86、0.81和0.77,該結(jié)果進(jìn)一步證實了該模型具有良好的預(yù)測效能。
最近,Khadirnaikar等[10]基于143個免疫相關(guān)性lncRNA,利用K均值聚類算法將504例患者分成3個亞型(C1、C2和C3),其中C3亞型高表達(dá)PD1基因且預(yù)后最差。盡管我們的研究并未比較低危組和高危組患者的基因表達(dá)差異情況,但我們篩選出了7個與預(yù)后相關(guān)的lncRNA,后續(xù)研究可深入探索。在Zeng等[11]的研究中,先篩選出ccRCC與癌旁組織間的差異表達(dá)lncRNA,隨后應(yīng)用Cox回歸分析并建立了基于6個差異lncRNA的ccRCC預(yù)后預(yù)測模型,該預(yù)后模型證明了lncRNA的預(yù)后價值。我們的預(yù)后模型同時納入了lncRNA-Score和患者的臨床病理學(xué)信息,且預(yù)測效能更佳,無論1年、3年還是5年生存率預(yù)測ROC的AUC均超過Zeng等研究的AUC(0.683)。此外,我們研究納入的均為免疫相關(guān)性lncRNA,表明ccRCC是免疫原性的腫瘤。
另外,我們通過共表達(dá)分析發(fā)現(xiàn)7個lncRNA中有2個lncRNA與免疫基因共表達(dá),即AC027601.2與NOTCH4和AC016773.1與TAZ。 NOTCH4是NOTCH信號通路的重要成員,在血管生成中起重要作用。有研究表明Notch4蛋白陽性表達(dá)可抑制微血管形成及腎細(xì)胞癌惡化[12]。 TAZ是具有PDZ結(jié)構(gòu)域的轉(zhuǎn)錄共活化因子,由WWTR1基因編碼,在人類多種癌癥的細(xì)胞增殖、分化和遷移中起到關(guān)鍵作用[13]。已有文獻(xiàn)表明,TAZ蛋白可通過鐵死亡信號通路EMP1-NOX4調(diào)節(jié)腎細(xì)胞癌的生長,促進(jìn)腫瘤的進(jìn)展[14]。
本研究基于lncRNA-Score和臨床病理學(xué)特征(年齡、性別、腫瘤分級及腫瘤分期)建立了一個新的ccRCC預(yù)后預(yù)測模型,能夠較好地預(yù)測患者的1年、3年、5年生存率,有助于區(qū)分ccRCC進(jìn)展高風(fēng)險者,為密切隨訪患者、制定積極有效的治療策略提供了理論幫助。此外,7個免疫相關(guān)性lncRNA也可能成為腎細(xì)胞癌的腫瘤標(biāo)志物,不僅可能協(xié)助診斷ccRCC,而且可能成為潛在有效的治療靶點(diǎn)。當(dāng)然,由于我們的研究是基于數(shù)據(jù)庫的回顧性分析,仍需要在后續(xù)的臨床和實驗中進(jìn)行驗證。同時,本次文獻(xiàn)檢索中未發(fā)現(xiàn)對應(yīng)于另外5個lncRNA的基因,也需要在后續(xù)的研究中進(jìn)一步找尋,并探索7個lncRNA影響腎細(xì)胞癌生長的分子機(jī)制。