沈劍 廖海英 黃謙
[摘要]目的:基于生物信息學(xué)構(gòu)建GOPC(golgi associated PDZ and coiled-coil motif containing)的皮膚黑素瘤(Skin cutaneous melanoma,SKCM)預(yù)后模型,進(jìn)一步為SKCM的早期篩查發(fā)揮一定的指導(dǎo)意義。方法:提取癌癥基因組圖譜TCGA數(shù)據(jù)庫中的SKCM數(shù)據(jù)和GTEx數(shù)據(jù)庫對應(yīng)的正常組織數(shù)據(jù)。利用ggplot2包繪制GOPC在兩者之間的表達(dá)差異。采用基因本體(GO)數(shù)據(jù)庫和京都基因與基因組百科全書(KEGG)數(shù)據(jù)庫對GOPC基因進(jìn)行進(jìn)一步功能富集分析,探索該基因潛在的功能和通路。采用單因素/多因素Cox回歸分析篩選與SKCM相關(guān)的影響因素,再通過rms包構(gòu)建列線圖建立SKCM患者預(yù)后模型,ROC曲線評價(jià)構(gòu)建的模型預(yù)測SKCM患者預(yù)后的價(jià)值,最后通過survival包構(gòu)建關(guān)于總生存期(Overall survival,OS)的生存曲線。結(jié)果:在1282例樣本中正常組織樣本有813例、皮膚黑素瘤組織樣本有469例,發(fā)現(xiàn)GOPC在這兩組之間有表達(dá)差異(P<0.001)。該模型預(yù)測SKCM患者總生存的ROC曲線下面積(AUC)為0.776,說明其具有一定的診斷價(jià)值。K-M曲線中GOPC高表達(dá)預(yù)后較差(P=0.036)。在多因素COX回歸中GOPC在SKCM中也是獨(dú)立預(yù)后風(fēng)險(xiǎn)因素(HR=0.506,95%CI=0.263~0.971,P=0.041),表明模型對SKCM患者生存具有較高的預(yù)測能力。結(jié)論:構(gòu)建的SKCM的GOPC基因預(yù)后模型可用于預(yù)測SKCM患者的預(yù)后,為黑素瘤的精準(zhǔn)化治療提供了新的思路。
[關(guān)鍵詞]生物信息學(xué);黑素瘤;預(yù)后模型;GOPC;生物標(biāo)志物
[中圖分類號]R739.5? ? [文獻(xiàn)標(biāo)志碼]A? ? [文章編號]1008-6455(2023)03-0070-05
Abstract: Objective? To construct a golgi associated PDZ and coiled-coil motif containing (GOPC) prognostic model of cutaneous melanoma (skin cutaneous melanoma,SKCM) based on bioinformatics to further play a guiding role in early screening of SKCM. Methods? the SKCM data of cancer genome map TCGA database and the corresponding normal tissue data of GTEx database were extracted. Ggplot2 package was used to draw the expression difference of GOPC between them. Gene Ontology (GO) database and Kyoto Encyclopedia of Gene and Genome (KEGG) database were used to further analyze the functional enrichment of GOPC gene to explore its potential function and pathway. Univariate/multivariate Cox regression analysis was used to screen the influencing factors related to SKCM, and then the prognosis model of SKCM patients was established by rms package. The prognostic value of the model constructed by ROC curve was evaluated. Finally, the survival curve of OverallSurvival was constructed by survival package. Results? among the 1282 samples, there were 813 normal tissues and 469 skin melanoma tissues. It was found that there was a difference in the expression of GOPC between the two groups (P<0.001). The area under the ROC curve (AUC) of the model for predicting the total survival of patients with SKCM is 0.776, indicating that it has a certain diagnostic value. The high expression of GOPC in K-M curve showed a poor prognosis (P<0.05). In multivariate COX regression, GOPC was also an independent prognostic risk factor in SKCM (HR=0.506,95% CI=0.263-0.971), indicating that the model has a high ability to predict the survival of patients with SKCM. Conclusion? the GOPC gene prognostic model of SKCM can be used to predict the prognosis of patients with SKCM, which provides a new idea for accurate treatment of melanoma.
Key words: bioinformatics; skin cutaneous melanoma;prognostic model; GOPC; biomarkers
皮膚癌是全世界最常見的癌癥之一,而SKCM是僅次于基底細(xì)胞癌和鱗狀細(xì)胞癌中第三常見的皮膚癌[1]。SKCM的發(fā)生與黑素細(xì)胞痣、紫外線照射、種族和遺傳、外傷、內(nèi)分泌及病毒等因素密切相關(guān)。一般情況下,早期SKCM可通過手術(shù)治愈,但是一旦轉(zhuǎn)移,可導(dǎo)致患者在短期內(nèi)死亡[2]。隨著科學(xué)的發(fā)展,針對SKCM的治療方法包括免疫治療、基因治療及靶向治療等,但這些方法只對少數(shù)患者有效,而導(dǎo)致這一結(jié)果最主要的原因是對SKCM的發(fā)病機(jī)制和診斷標(biāo)志物認(rèn)識不足,所以有必要探索新的SKCM標(biāo)志物來指導(dǎo)臨床治療。因此,筆者建立GOPC預(yù)后模型,發(fā)現(xiàn)其具有一定的診斷價(jià)值。筆者旨在確定皮膚黑素瘤的發(fā)病機(jī)制和預(yù)后生物標(biāo)志物,將其用作皮膚黑素瘤新的治療靶點(diǎn)。
1? 資料和方法
1.1 數(shù)據(jù)的收集與處理:通過從UCSC數(shù)據(jù)庫(https:xenabrowser.net/datapages)中提取TCGA和GTEx的TPM(Transcripts per million reads)格式的RNAseq數(shù)據(jù),進(jìn)一步驗(yàn)證了GOPC在泛癌中的正常樣本與腫瘤樣本的差異表達(dá)值,發(fā)現(xiàn)其在黑素瘤與正常樣本這兩組中有表達(dá)差異。然后提取SKCM數(shù)據(jù),將1282個樣本分為腫瘤組(469個腫瘤樣本)和對照組(813個正常樣本)。將TPM格式的RNAseq數(shù)據(jù)進(jìn)行l(wèi)og2轉(zhuǎn)化后進(jìn)行樣本間的表達(dá)比較, 再使用R統(tǒng)計(jì)軟件包中的ggplot2工具對兩組表達(dá)差異基因進(jìn)行分析。
1.2 基因功能富集分析:通過TCGA數(shù)據(jù)庫下載SKCM數(shù)據(jù)進(jìn)行|r|>0.2且P<0.05篩選后,再通過R語言軟件org.Hs.eg.db包、clusterProfiler包及ggplot2包對GO數(shù)據(jù)庫及KEGG數(shù)據(jù)庫進(jìn)行分析,P<0.05表明差異具有統(tǒng)計(jì)學(xué)意義。通過clusterPorfiler包對GOPC高低表達(dá)組進(jìn)行GSEA分析,根據(jù)數(shù)據(jù)富集情況,找出GOPC表達(dá)可能富集的相關(guān)信號通路。
1.3 GOPC預(yù)后模型的構(gòu)建:通過TCGA數(shù)據(jù)庫下載黑素瘤的數(shù)據(jù),應(yīng)用R語言軟件survival包進(jìn)行單因素/多因素Cox回歸分析,使用rms包、survival包進(jìn)行Nomogram繪制,P<0.05表明差異具有統(tǒng)計(jì)學(xué)意義。通過中位數(shù)將GOPC分為高GOPC組、低GOPC組,分別應(yīng)用survival包、survminer包進(jìn)行Kaplan-Meier總生存曲線,最后通過pROC包、ggplot2包進(jìn)行ROC曲線繪制。
1.4 統(tǒng)計(jì)學(xué)分析:統(tǒng)計(jì)分析和圖形繪制采用R語言軟件(3.6.3版)。正態(tài)分布計(jì)量資料以均數(shù)±標(biāo)準(zhǔn)差(x?±s)表示,非正態(tài)分布計(jì)量資料以中位數(shù)(范圍)表示;K-M生存曲線以log-rank檢驗(yàn)表示,P<0.05表示差異具有統(tǒng)計(jì)學(xué)意義。
2? 結(jié)果
2.1 GOPC基因在SKCM中表達(dá)下調(diào):通過TCGA數(shù)據(jù)庫及GTEx數(shù)據(jù)庫中的數(shù)據(jù)(1282例樣本其中正常組織樣本有813例、皮膚黑素瘤組織樣本有469例),發(fā)現(xiàn)GOPC在SKCM中表達(dá)下調(diào)(P<0.001)。見圖1。
2.2 GOPC高低表達(dá)組共表達(dá)差異基因熱圖:通過TCGA的SKCM數(shù)據(jù),以GOPC表達(dá)情況根據(jù)表達(dá)中位數(shù)為中間值將其分為兩組分別是高表達(dá)組、低表達(dá)組,用于分析GOPC與共表達(dá)差異基因的相關(guān)性。結(jié)果顯示與GOPC基因高表達(dá)top10相關(guān)基因主要有NUS1、BCLAF1、UFL1、ATG5、PPIL4、LATS1、CDC40、ZUP1、MAP3K7、IBTK;與GOPC基因低表達(dá)top10相關(guān)基因主要有MRPL41、AC136632.2、MT-ND3、OCA2、TECRP1、AGPAT2、DPP7、TECR、NUDT8、ATOX1并繪制熱圖。見圖2。
2.3 基因功能富集分析:對GOPC的共表達(dá)差異基因進(jìn)行GO富集分析和KEGG通路富集分析,找出共表達(dá)基因富集的信號通路。GO富集分析并對其主要的富集通路繪制了氣泡圖。見圖3。
結(jié)果顯示:分子功能富集主要包括泛素樣蛋白轉(zhuǎn)移酶活性、作用于RNA的催化活性、解旋酶活性;在細(xì)胞成分富集主要包括核顆粒、染色體區(qū)域、泛素連接酶復(fù)合體、染色體著絲粒區(qū)域;在生物學(xué)過程富集主要包括蛋白酶體蛋白分解代謝過程、RNA剪切、蛋白酶體介導(dǎo)的泛素依賴蛋白分解代謝過程、RNA定位。KEGG通路分析結(jié)果顯示,這些GOPC的共表達(dá)差異基因主要富集的通路有細(xì)胞周期、基本轉(zhuǎn)錄因子、RNA轉(zhuǎn)錄、泛素介導(dǎo)的蛋白質(zhì)降解等。見圖4。
2.4? 臨床相關(guān)性分析
2.4.1 GOPC臨床相關(guān)的基線資料表:進(jìn)一步研究了SKCM的臨床變量與GOPC高低表達(dá)差異之間的關(guān)系(見表1)。本研究利用卡方檢驗(yàn)或Fisher分析發(fā)現(xiàn)GOPC的差異表達(dá)與各因素之間無明顯表達(dá)差異。
2.4.2 GOPC預(yù)后模型評估(ROC曲線分析):為了研究GOPC對SKCM的診斷是否存在作用。通過ROC(Receiver Operating Characteristic,ROC)曲線分析GOPC對SKCM的診斷效能(見圖5)。顯示:GOPC的曲線下面積(AUC)為0.776(0.750-0.802),這提示了GOPC可能為潛在的診斷分子。
2.5 預(yù)后模型的構(gòu)建
2.5.1 KMplot曲線分析:下載TCGA-SKCM患者預(yù)后信息,利用survminer、survival包繪制Kaplan-Meier圖,評估GOPC在SKCM中總生存期的預(yù)后價(jià)值(見圖6)。按照表達(dá)量中位數(shù)從而分成高表達(dá)組、低表達(dá)組。結(jié)果顯示低表達(dá)GOPC具有更差的總生存期[HR=0.75(0.57-0.98),P=0.036]。
2.5.2 單因素/多因素Cox回歸分析:將單因素Cox回歸P<0.05的變量納入到多因素Cox回歸中.通過多因素Cox回歸分析發(fā)現(xiàn):M分期(P=0.001)、GOPC(P=0.041)在皮膚黑素瘤OS中是獨(dú)立預(yù)后因子(P<0.05)。見表2。
2.5.3 列線圖預(yù)測模型:利用風(fēng)險(xiǎn)模型結(jié)合放療、GOPC、腫瘤T分期、腫瘤N分期、腫瘤M分期、放療等構(gòu)建列線圖(見圖7),成功構(gòu)建可量化的預(yù)后模型。列線圖一致性(Concordance,C-index):0.661(0.638-0.683)。
3? 討論
黑素瘤作為致命的皮膚癌[3]具有較高的轉(zhuǎn)移率和死亡率[4-5],研究發(fā)現(xiàn)一旦出現(xiàn)轉(zhuǎn)移,患者的中位生存時間僅為8~9個月,而5年生存率低于5%,這種疾病嚴(yán)重威脅人們的健康[6],因此它被認(rèn)為是皮膚癌最常見的死亡原因。最近的分子生物學(xué)研究發(fā)現(xiàn),在30%~60%的黑素瘤中及50%的交界痣中可發(fā)現(xiàn)BRAF基因突變[7],而與國外的報(bào)道相比,我國黑素瘤BRAF基因突變率相對低,約為24.3%[8]。聯(lián)合使用BRAF和MEK抑制劑是晚期BRAF突變黑素瘤患者的治療標(biāo)準(zhǔn)之一。目前有針對性的靶向治療(如BRAF和MEK抑制劑)和免疫治療(如單獨(dú)抗pd-1抗體或與抗ctla4抗體聯(lián)合使用),這已使晚期黑素瘤的全身治療發(fā)生了巨大變革,但是大多數(shù)反應(yīng)都是暫時的,幾乎所有患者都在1年內(nèi)出現(xiàn)腫瘤復(fù)發(fā)[9]。目前急需一種既容易獲取又能靶向治療的藥物。
GOPC基因在各個組織中廣泛表達(dá),它具有多種重要的生物學(xué)功能,比如可參與分泌和內(nèi)吞途徑的膜泡轉(zhuǎn)運(yùn)過程,并且可以與syntaxin6、golgin160、wnt家族蛋白(frizzled5 和frizzled8)、δ2型谷氨酸受體(GluRδ2)以及與β1型腎上腺素受體(β1AR)等蛋白質(zhì)相互作用,大部分相互作用都是與PDZ結(jié)構(gòu)域直接相關(guān)的[10]。Kasey L研究中發(fā)現(xiàn)皮膚黑素瘤中具有GOPC-ROS1基因融合[11],而筆者研究中發(fā)現(xiàn)GOPC在皮膚黑素瘤中表達(dá)下調(diào),GOPC的表達(dá)水平與患者的總生存率相關(guān), GOPC的表達(dá)水平越高,皮膚黑素瘤患者的預(yù)后越好。GOPC的曲線下面積(AUC)為0.776(0.750-0.802),且多因素Cox回歸分析發(fā)現(xiàn):GOPC(P=0.041)在皮膚黑素瘤癌OS中是獨(dú)立預(yù)后因子(P<0.05)。并且有可能是通過細(xì)胞周期、基本轉(zhuǎn)錄因子、RNA轉(zhuǎn)錄、泛素介導(dǎo)的蛋白質(zhì)降解等通路來調(diào)節(jié)皮膚黑素瘤的發(fā)生、發(fā)展。
當(dāng)然,本研究也存在一些不足之處。首先,由于缺乏體外或體內(nèi)實(shí)驗(yàn),所以需要進(jìn)行相關(guān)的實(shí)驗(yàn)如細(xì)胞生物學(xué)分析、動物和臨床研究,用于驗(yàn)證從筆者的生物信息學(xué)分析中確定的GOPC基因表達(dá)和信號通路。其次,需要更多的臨床信息用于篩選可能與SKCM總體生存率、無病生存率相關(guān)的臨床因素如吸煙史、主要腫瘤大小、腫瘤部位是否暴露或未暴露于陽光的區(qū)域、家族史等因素以提高數(shù)據(jù)可靠性。
在皮膚黑素瘤中,GOPC表達(dá)水平較正常組織中明顯降低。功能富集分析發(fā)現(xiàn)GOPC蛋白可參與泛素樣蛋白轉(zhuǎn)移酶活性、RNA的催化活性、解旋酶活性核顆粒、染色體區(qū)域、泛素連接酶復(fù)合體、染色體著絲粒區(qū)域、蛋白酶體蛋白分解代謝過程、RNA剪切、蛋白酶體介導(dǎo)的泛素依賴蛋白分解代謝過程、RNA定位。KEGG通路分析結(jié)果顯示,這些GOPC的共表達(dá)差異基因主要富集的通路有細(xì)胞周期、基本轉(zhuǎn)錄因子、RNA轉(zhuǎn)錄、泛素介導(dǎo)的蛋白質(zhì)降解。生存分析發(fā)現(xiàn)GOPC可以預(yù)測皮膚黑素瘤患者的預(yù)后,并且其高表達(dá)水平預(yù)測患者較好的總生存率。多因素Cox分析中發(fā)現(xiàn)GOPC的表達(dá)水平可以作為皮膚黑素瘤患者的獨(dú)立預(yù)后因子。因此,GOPC可能通過多種途徑調(diào)控皮膚黑素瘤細(xì)胞的發(fā)生和發(fā)展,是其潛在的生物學(xué)預(yù)后標(biāo)志物及治療靶標(biāo),具有深入研究的臨床價(jià)值。
[參考文獻(xiàn)]
[1]Linos E,Swetter S M,Cockburn M G,et al.Increasing burden of melanoma in the United States[J].J Invest Dermatol,2009,129(7):1666-1674.
[2]Lugovic-Mihic L, Cesic D, Vukovic P, et al. Melanoma development:current knowledge on melanoma pathogenesis[J]. Acta Dermatovenerol??Croat, 2019, 27(3):163-168.
[3]Chu H,Li M,Wang X.Capsaicin induces apoptosis and autophagy in human melanoma cells[J].Oncol Lett,2019,17(6):4827-4834.
[4]Rastrelli M,Tropea S,Rossi C R,et al. Melanoma:epidemiology,risk factors,pathogenesis,diagnosis and classification[J].In Vivo,2014,28(6):1005-1011.
[5]Wei D A. Multigene support vector machine predictor for metastasis of cutaneous melanoma[J].Mol Med Rep,2018,17(2):2907-2914.
[6]地里夏提·庫爾班,陳召.Notch1調(diào)控PI3K/AKT信號通路促進(jìn)黑素瘤細(xì)胞發(fā)展的研究[J].中國美容醫(yī)學(xué),2019,28(01):93-96
[7]Moran B,Silva R,Perry A S,et al.Epigenetics of malignant melanoma[J].Semin Cancer Biol,2018,51(1):80-88.
[8]Wu X,Yan J,Dai J,et al.Mutations in BRAF codons 594 and 596 predict good prognosis in melanoma[J].Oncol Lett,2017,14(3):3601-3605.
[9]Rossi A,Roberto M,Panebianco M,et al. Drug resistance of BRAF-mutant melanoma:review of up-to-date mechanisms of action and promising targeted agents [J].Eur J Pharmacol,2019,27(3):163-168.
[10]李祥,張家海,曹贊霞,等.GOPC蛋白PDZ結(jié)構(gòu)域的溶液結(jié)構(gòu)及其與Neuroligin羧基末端的相互作用[C].第十次中國生物物理學(xué)術(shù)大會論文摘要集,2006:284.
[11]Ha J H,Lee C,Lee K S,et al.The molecular pathogenesis of Trichilemmal carcinoma[J].BMC Cancer,2020,20(1):516.
[收稿日期]2022-07-22
本文引用格式:沈劍,廖海英,黃謙.基于生物信息學(xué)構(gòu)建GOPC的皮膚黑素瘤預(yù)后模型[J].中國美容醫(yī)學(xué),2023,32(3):70-74.