安外爾·約麥爾阿卜拉,布爾蘭·葉爾肯別克,孫莉莉,劉富中,迪麗娜爾·葉爾夏提,郭文佳
新疆醫(yī)科大學(xué)附屬腫瘤醫(yī)院,烏魯木齊 830011
三陰性乳腺癌(triple-negative breast cancer,TNBC)是一種缺乏雌激素受體(estrogen receptors,ER)、孕激素受體(progesterone receptors,PR)和人表皮生長因子受體2(human epidermal growth factor receptor 2,HER2)表達(dá)的乳腺癌亞型,占所有乳腺癌的10%~20%[1]。TNBC的預(yù)后較差,易于轉(zhuǎn)移和復(fù)發(fā),治療難度大,常規(guī)內(nèi)分泌治療和化療藥物易產(chǎn)生耐藥[2]。因此,全面了解TNBC的分子機(jī)制將有助于探索更有效的治療方法。
免疫治療是一種利用人體免疫系統(tǒng)來攻擊癌細(xì)胞的治療方法。在TNBC 中,免疫治療的主要目標(biāo)是增強(qiáng)免疫細(xì)胞對癌細(xì)胞的攻擊能力[3]。免疫檢查點是一種負(fù)向調(diào)節(jié)機(jī)制,如程序性死亡-1(procedural death-1,PD-1)、程序性死亡配體-1(programmed death ligand-1,PD-L1)、狐猴酪氨酸激酶3(lemur tyrosine kinase 3,LMTK3),可以抑制免疫細(xì)胞的活性,從而保護(hù)正常組織不受免疫攻擊[4-5]。然而,腫瘤細(xì)胞可以利用免疫檢查點來逃避免疫攻擊。因此,免疫檢查點抑制劑可以通過阻斷免疫檢查點來激活免疫細(xì)胞,從而攻擊腫瘤細(xì)胞。在TNBC 中,PD-1 可通過與PD-L1 的結(jié)合來抑制T 細(xì)胞的活性[6],而PD-1/PD-L1 抑制劑可以通過阻斷PD-1/PD-L1 信號通路來激活T 細(xì)胞,進(jìn)而攻擊腫瘤細(xì)胞[7]。目前,PD-1/PD-L1 抑制劑已被證明對TNBC具有一定的療效。
5-甲基胞嘧啶(5-methylcytosine,m5C)是一種重要的RNA 修飾,其在轉(zhuǎn)錄后的RNA 分子中廣泛存在,并參與調(diào)控RNA 的穩(wěn)定性、翻譯和功能[8]。近年來,越來越多的研究表明,m5C 修飾與腫瘤的發(fā)生和發(fā)展密切相關(guān)[9]。m5C 甲基化的形成過程由甲基轉(zhuǎn)移酶(也稱為“寫入器”)如NSUN和DNMT 家族成員催化,并可由去甲基化酶如TET 家族和結(jié)合蛋白如YBX1(稱為“閱讀器”)動態(tài)調(diào)節(jié)[10],此外,m5C甲基化的異常表達(dá)與多種惡性腫瘤的發(fā)生發(fā)展有關(guān)[8]。最近的研究還表明,m5C相關(guān)基因表達(dá)與肺癌和胰腺癌患者的預(yù)后相關(guān)[11-12],而尚未有研究報道m(xù)5C 相關(guān)基因在TNBC預(yù)后中的作用。本研究基于m5C 的相關(guān)基因,構(gòu)建了TNBC 的預(yù)后預(yù)測模型,并對化療藥物的敏感性進(jìn)行了分析。同時,進(jìn)行了免疫浸潤分析和高低風(fēng)險組免疫檢查點表達(dá)的分析,以期為TNBC的治療提供新的策略。
從GEO公共數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/geo/)獲得了GSE76275 和GSE38959 數(shù)據(jù)集的基因表達(dá)譜,用于鑒定差異表達(dá)基因以及富集分析。從TCGA(https://portal.gdc.cancer.gov/)數(shù)據(jù)庫下載了100 個TNBC 樣本的RNA-seq 數(shù)據(jù)以及相應(yīng)的臨床信息作為訓(xùn)練集。選取GSE58812 數(shù)據(jù)集中107 個樣本的基因表達(dá)譜以及相應(yīng)的臨床信息用作驗證集。詳細(xì)研究流程見圖1。
圖1 研究流程圖Fig.1 Flowchart of the study
把GSE76275 數(shù)據(jù)集的265 個樣本和GSE38959數(shù)據(jù)集的47個樣本分為TNBC和非TNBC組,并進(jìn)行主成分分析,然后用Limma R包分析TNBC和非TNBC組之間的基因表達(dá)差異(P<0.05,|log2FC|>1),隨后用火山圖展示了差異分析結(jié)果并標(biāo)注了差異最顯著的前10個基因,繪制熱圖顯示了兩組之間前30個基因的差異表達(dá)譜。
我們對GSE76275 和GSE38959 兩個數(shù)據(jù)集差異表達(dá)的196 個基因用Cluster Profiler 包進(jìn)行了基因本體(gene ontology,GO)和京都基因與基因組百科全書(Kyoto encyclopedia of genes and genomes,KEGG)富集分析。利用提供的分子數(shù)值通過GO plot 包計算每個富集條目對應(yīng)的z-score值,使用ggplot 2包對富集分析結(jié)果進(jìn)行可視化。
從先前發(fā)表的文獻(xiàn)中獲得了m5C 甲基化調(diào)節(jié)基因,包括NSUN2、NSUN3、NSUN4、NSUN5、NSUN6、NSUN7、DNMT2、DNMT3A、DNMT3B、TET2和ALYREF共11 個,并用Pearson 方法對m5C 調(diào)節(jié)基因和196 個差異表達(dá)基因的相關(guān)性分析,以P<0.05、相關(guān)系數(shù)|r|>0.03 為篩選條件選出了99 個基因,隨后對這99 個基因用Logrank-test方法鑒定了預(yù)后相關(guān)的5個m5C相關(guān)基因。
使用Predict 函數(shù)基于5 個基因的表達(dá)計算了風(fēng)險評分,并按風(fēng)險評分中位數(shù)把樣本分為高風(fēng)險組和低風(fēng)險組構(gòu)建預(yù)后預(yù)測模型,訓(xùn)練集和驗證集模型的預(yù)測效果通過ROC 曲線、Kaplan-Meier 生存分析、列線圖和校準(zhǔn)曲線進(jìn)行評估。
根據(jù)Cibersort 的基因集和Charoentong 的研究,采用ssGSEA 來定量每個TME 細(xì)胞浸潤的豐度。為了控制由腫瘤純度引起的偏差,我們通過使用估計算法計算腫瘤純度來調(diào)整每個腫瘤微環(huán)境(tumor microenvironment,TME)細(xì)胞亞型的富集分?jǐn)?shù),共評估了28種人類TME細(xì)胞亞型。
基于癌癥藥物敏感性基因組學(xué)(cancer drug sensitivity genomics,GDSC)(https://www.cancerRxgene.org)數(shù)據(jù)庫中的嶺回歸模型,TCGA-TNBC 中某些藥物的半最大抑制濃度(half maximal inhibitory concentration,IC50)值通過“pRRophetic”包計算,t檢驗比較高風(fēng)險組和低風(fēng)險組之間某些藥物的IC50值差異,進(jìn)行了藥物敏感性預(yù)測。
對GSE76275數(shù)據(jù)集中的198個TNBC和67個非TNBC 樣本進(jìn)行了主成分分析,結(jié)果如圖2A 所示;對樣本進(jìn)行差異分析發(fā)現(xiàn)有668個差異表達(dá)基因,結(jié)果用火山圖(圖2C)展示并在圖上注釋了差異最顯著的10個基因,熱圖(圖2E)展示了前30個基因的表達(dá)譜;同理,GSE38959數(shù)據(jù)集中30個TNBC 和17 個非TNBC 樣本的主成分分析結(jié)果如圖2B 所示,發(fā)現(xiàn)有1 628 個差異基因,結(jié)果用火山圖(圖2D)展示并在圖上注釋了差異最顯著的10 個基因,熱圖(圖2F)展示了前30個基因的表達(dá)譜。
圖2 篩選差異表達(dá)基因Fig.2 Screening differentially expressed genes
對上述2 個數(shù)據(jù)集差異表達(dá)基因使用韋恩圖取交集,顯示有196個共差異表達(dá)基因(圖3)。為了探索這些基因在TNBC 中潛在的生物學(xué)功能和靶標(biāo)通路,進(jìn)行KEGG/GO 分析。氣泡圖(圖4A)、弦圖(圖4B)、柱狀圖(圖4C)、圈圖(圖4D)可視化富集分析結(jié)果發(fā)現(xiàn),它們主要跟泌尿生殖系統(tǒng)發(fā)育、細(xì)胞器裂變、腺發(fā)育、微絨毛膜、濃縮的染色體、著絲粒區(qū)域、染色體、著絲粒區(qū)、DNA結(jié)合轉(zhuǎn)錄激活活性、RNA聚合酶Ⅱ特異性-轉(zhuǎn)錄輔激活子結(jié)合等生物學(xué)過程相關(guān),也與細(xì)胞周期、卵母細(xì)胞減數(shù)分裂等通路相關(guān)(表1)。
表1 差異表達(dá)基因功能富集特征Table 1 Characters of functional enrichment of differentially expressed genes
圖3 GSE76275和GSE38959差異表達(dá)基因韋恩圖Fig.3 Venn diagram of differentially expressed genes of GSE76275 and GSE38959
圖4 差異表達(dá)基因功能富集分析Fig.4 Functional enrichment analysis of differentially expressed genes
為了篩出在TNBC 中起到關(guān)鍵作用的m5C相關(guān)基因,進(jìn)行了相關(guān)性分析和單因素Cox 分析,結(jié)果共篩選出99 個m5C 相關(guān)基因(圖5),其中LMO4、BCL11A、UGT8、PSAT1、SLC6A14等5 個基因與預(yù)后相關(guān)(表2)。TCGA-TNBC 作為訓(xùn)練集,GSE58812 作為驗證集基于以上5 個基因計算了風(fēng)險評分,按風(fēng)險評分中位數(shù)分成高風(fēng)險和低風(fēng)險2 組,結(jié)果發(fā)現(xiàn)高風(fēng)險組患者比低風(fēng)險組患者的預(yù)后更差(P=0.0056、P=0.028)(圖6A、B)。風(fēng)險因子圖顯示,隨著風(fēng)險值的增加,患者死亡率顯著增加(圖6C、D)。在驗證集中,高風(fēng)險組和低風(fēng)險組相比,這5 個基因顯著低表達(dá);而在驗證集,高風(fēng)險組中的BCL11A、PSAT1、LMO4顯著低表達(dá),UGT8和SLC6A14表達(dá)差異沒有統(tǒng)計學(xué)意義(圖6E、F)。
表2 與預(yù)后有關(guān)的m5C基因Table 2 m5C genes related with prognosis
圖5 m5C相關(guān)基因的鑒定Fig.5 Identification of m5C-related genes
圖6 預(yù)后模型的構(gòu)建Fig.6 Construction of prognostic model
為驗證模型的預(yù)測效能,我們構(gòu)建了列線圖(圖7A)及校正曲線(圖7B),結(jié)果顯示風(fēng)險評分和腫瘤分期相關(guān),模型預(yù)測效能良好。通過多因素分析和ROC 曲線分析進(jìn)一步評估了模型的價值,風(fēng)險評分結(jié)果顯示是獨立的TNBC 預(yù)后因子(圖7C)。訓(xùn)練集1、3、5 年AUC 值分別為0.85、0.79、0.79(圖7D),而驗證集中生存時間在一年內(nèi)的患者不足于計算AUC 值,因此圖中顯示了3、5年的生存ROC 曲線,AUC 值分別為0.68、0.72(圖7E)。
圖7 模型預(yù)測效能的驗證Fig.7 Validation of model prediction efficacy
為了探索高低風(fēng)險組中的TME 浸潤情況,研究分析了PD-1、LMTK3 等免疫檢查點基因在高低風(fēng)險組中的表達(dá),發(fā)現(xiàn)與高風(fēng)險組相比低風(fēng)險組的PD-1、LMTK3 呈高表達(dá)(P=0.031、P=0.0044)(圖8A、B)。基質(zhì)評分和免疫評分顯示,在高低風(fēng)險組中基質(zhì)評分沒有顯著差異(P=0.24)(圖8C),免疫評分在高風(fēng)險組中更高,差異有統(tǒng)計學(xué)意義(P=0.022)(圖8D)。進(jìn)一步分析28 種免疫細(xì)胞在不同風(fēng)險組中的浸潤情況,結(jié)果顯示中性粒細(xì)胞、17型輔助性T細(xì)胞、明亮自然殺傷細(xì)胞、γδT 細(xì)胞、巨噬細(xì)胞、髓源性抑制細(xì)胞、單核細(xì)胞、T濾泡輔助細(xì)胞、活化的CD8T 細(xì)胞在高風(fēng)險組中是高表達(dá)的,而2型輔助性T細(xì)胞在低風(fēng)險組中呈現(xiàn)高表達(dá)(圖8E)。
圖8 高低風(fēng)險組間免疫浸潤分析Fig.8 Analysis of immune infiltration between high and low risk groups
為了探究模型與藥物敏感性之間關(guān)系,研究用pRRophetic 包預(yù)測了常用的化療藥物IC50值在高低分險組中的差異,結(jié)果發(fā)現(xiàn)多西他賽(docetaxel)、多柔比星(doxorubicin,DOX)、紫杉醇(paclitaxel)等藥物IC50值在高低風(fēng)險組中的差異沒有統(tǒng)計學(xué)意義(P>0.05 圖9),ARFGAP1 抑制劑(QS11)在低風(fēng)險組中的IC50值更低,低風(fēng)險組患者對QS11 更名為敏感(圖9)。Akt1/2/3 抑制劑(mk2206)、組蛋白去乙?;福℉DACs)抑制劑(ms275)、PI3K 和 mTOR 抑制劑(NVP.BEZ235)、CDK4/CDK6 選擇性抑制劑(PD.0332991)等藥物在高風(fēng)險組中的IC50值比低風(fēng)險組低,說明高風(fēng)險組患者對這些藥物更為敏感(圖9)。
圖9 高低風(fēng)險組間化療藥物IC50值差異分析Fig.9 Analysis of differences in IC50 values for chemotherapy drugs between high and low risk groups
乳腺癌是婦女中最常見的癌癥類型之一,全球每年估計有150 萬新病例,是全世界常見的死亡原因[13]。TNBC 占侵襲性乳腺癌的15%~20%,其主要表現(xiàn)為ER 和PR 的表達(dá)缺乏以及HER2的擴(kuò)增不足[14],TNBC 比非TNBC 更具侵襲性和增殖性,并且具有更差的預(yù)后和存活率[15],然而TNBC 缺乏確定的治療靶標(biāo)(例如ER 和HER2),非特異性化療仍然是TNBC 患者的主要治療選擇[16]?;熌退幮允前┌Y治療的主要障礙,DOX(一種蒽環(huán)類DNA 損傷劑)作為TNBC 的一線方案,在TNBC 患者中重復(fù)給藥時常常導(dǎo)致耐藥[17]。盡管已有報道表明RNA 修飾與疾病發(fā)病機(jī)制和癌癥腫瘤發(fā)生有關(guān)[18-19],但是TNBC 和m5C 相關(guān)基因之間的潛在關(guān)系尚不清楚。本研究通過對GEO 數(shù)據(jù)集的分析,鑒定了196 個差異表達(dá)基因,并對這些基因進(jìn)行了KEGG/GO 富集分析,結(jié)果表明差異表達(dá)基因主要涉及到了一些與癌癥相關(guān)的生物學(xué)過程和通路,如DNA 結(jié)合轉(zhuǎn)錄激活活性、RNA 聚合酶Ⅱ特異性-轉(zhuǎn)錄輔激活子結(jié)合、細(xì)胞周期、卵母細(xì)胞減數(shù)分裂等。通過相關(guān)性分析和單因素分析發(fā)現(xiàn)m5C 相關(guān)的5個基因在TNBC 中具有重要的生物學(xué)意義。進(jìn)一步,我們使用了TCGA-TNBC 和GEO 數(shù)據(jù)集作為訓(xùn)練集和驗證集,基于m5C 相關(guān)的5 個基因構(gòu)建了TNBC 預(yù)后預(yù)測模型,此模型可以有效地預(yù)測TNBC 患者的預(yù)后。我們還進(jìn)行了免疫浸潤分析,發(fā)現(xiàn)高風(fēng)險組和低風(fēng)險組在免疫細(xì)胞浸潤方面存在顯著差異,高風(fēng)險組中大部分免疫抑制相關(guān)免疫細(xì)胞的豐度較高,PD-1、LMTK3 等免疫檢查點也在高風(fēng)險組中呈現(xiàn)高表達(dá),這也可能是其免疫逃逸的原因之一。此外,本研究還使用pRRophetic 包進(jìn)行了藥物敏感性分析,發(fā)現(xiàn)高風(fēng)險組和低風(fēng)險組對某些化療藥物的敏感性存在差異。這些結(jié)果為臨床治療提供了一些有價值的參考。
RNA 甲基化是RNA 轉(zhuǎn)錄后調(diào)控中最重要的表觀遺傳修飾之一,也是近年來的研究熱點。RNA 甲基化包括m6A、m1A、m5C、m7G、Nm 等幾種類型,其中RNA m5C 甲基化是指RNA 的第5個胞嘧啶發(fā)生甲基化修飾[20-21]。m5C 甲基化通過影響免疫細(xì)胞,從而重塑TME。例如,TET 家族可以影響許多免疫細(xì)胞表型的功能,包括B 細(xì)胞、漿細(xì)胞、樹突狀細(xì)胞和Tregs[22-23]。在這項研究中我們鑒定了5 個與m5C 相關(guān)的基因,包括SLC6A14、BCL11A、UGT8、LMO4、PSAT1,構(gòu)建了預(yù)后模型。不同組間的免疫浸潤分析結(jié)果表明,高風(fēng)險組與低風(fēng)險組相比,PD-1、LMTK3 呈高表達(dá)。在高風(fēng)險組中免疫評分更高,中性粒細(xì)胞、17型輔助細(xì)胞、CD56 明亮的自然殺傷細(xì)胞、γδT 細(xì)胞、巨噬細(xì)胞、髓源性抑制細(xì)胞、單核細(xì)胞、T 濾泡輔助細(xì)胞、活化的CD8T 細(xì)胞在高風(fēng)險組中高表達(dá),而2型輔助細(xì)胞在低風(fēng)險組高表達(dá)。
綜上所述,本研究的主要貢獻(xiàn)在于構(gòu)建了一個基于m5C 相關(guān)基因的TNBC 預(yù)后預(yù)測模型,并對化療藥物敏感性、免疫浸潤和免疫檢查點表達(dá)等方面進(jìn)行了深入研究。這些結(jié)果為TNBC 的個性化治療提供了新的思路和方法。但是,本研究也存在一些局限,例如樣本量較小、數(shù)據(jù)來源有限等。未來需要進(jìn)一步擴(kuò)大樣本量、整合多個數(shù)據(jù)集進(jìn)行驗證,并結(jié)合臨床實踐進(jìn)行進(jìn)一步探索。