李周瑜,楊欣,張迎,石昌菊,金繼華
(貴州中醫(yī)藥大學(xué)基礎(chǔ)醫(yī)學(xué)院,貴州 貴陽 550025)
結(jié)腸癌是世界上第二大癌癥,病死率高,存活率低,嚴(yán)重威脅人類健康,主要由大腸內(nèi)層惡性贅生物引起[1]。目前,結(jié)腸癌發(fā)病率呈逐年上升狀態(tài),臨床上主要采用傳統(tǒng)的化療、放療和外科手術(shù)結(jié)合中藥輔助治療,但在化療過程中使用的抗腫瘤藥物不僅抑制、殺滅腫瘤細(xì)胞,對(duì)正常細(xì)胞也具有破壞作用[2]。由于現(xiàn)階段缺乏有效的早期診斷手段,多數(shù)病人發(fā)現(xiàn)時(shí)已經(jīng)為結(jié)腸癌晚期并發(fā)生轉(zhuǎn)移,幾乎無法手術(shù)根治,使結(jié)腸癌患者的預(yù)后變差。結(jié)腸癌的發(fā)展涉及多階段、多因素,受原癌基因或腫瘤抑制基因的共同影響[3]。
隨著多學(xué)科的相互交叉,腫瘤基礎(chǔ)檢測(cè)水平不斷提高,內(nèi)源性小分子中基因與蛋白表達(dá)的變化規(guī)律可以通過代謝組學(xué)、基因組學(xué)、蛋白質(zhì)組學(xué)等現(xiàn)代科學(xué)技術(shù)進(jìn)行監(jiān)測(cè),以幫助人們對(duì)癌癥有更好的認(rèn)知,從而提高對(duì)于癌癥的預(yù)防、診斷和治療能力[4]。TCGA 是目前最大的癌癥基因信息數(shù)據(jù)庫,相比GEO 數(shù)據(jù)庫其優(yōu)勢(shì)是具有規(guī)范的臨床數(shù)據(jù),不只展現(xiàn)在多種癌型上,還包括基因表達(dá)數(shù)據(jù)、miRNA 表達(dá)數(shù)據(jù)、DNA 甲基化和SNP 等[5]。本研究首先采用網(wǎng)絡(luò)藥理學(xué)的方法篩選出結(jié)腸癌的關(guān)鍵靶點(diǎn),基于TCGA 數(shù)據(jù)庫分析關(guān)鍵靶點(diǎn)TP53、MYC、VEGFA、JUN、MMP9、TNF 和EGFR 基因在結(jié)腸癌患者中的表達(dá)狀態(tài);采用GEPIA 數(shù)據(jù)庫對(duì)TP53、MYC、VEGFA、EGFR、MMP9、JUN 基因進(jìn)行Kaplan-Meier 生存分析和Log-rankP檢驗(yàn);選擇與結(jié)腸癌預(yù)后相關(guān)的基因VEGFA 和EGFR 探討其與臨床分期和多種臨床病理特征的關(guān)系;采用COX 比例風(fēng)險(xiǎn)回歸模型對(duì)與臨床病理相關(guān)的基因VEGFA 進(jìn)行單因素和多因素分析。揭示VEGFA 基因在結(jié)腸癌中的表達(dá)及臨床意義,為進(jìn)一步探討VEGFA 在結(jié)腸癌發(fā)生、發(fā)展和預(yù)后中的作用提供理論依據(jù)。
TCGA數(shù)據(jù)庫(https://cancergenome.nih.gov/);STRING(https://stringhttpsdb.org/);Commparative Toxicogenomics Database(http://ctdbase.org/);Cytoscape 3.5.1軟件(http://www.cytoscape.org);GEPIA(http://gepia.cancerhttpspku.cn/)。
通過CTD(Commparative Toxicogenomics Database)篩選結(jié)腸癌的潛在靶標(biāo)基因,通過疾病名稱(Colonic Neoplasms)或疾病ID(D003110)進(jìn)行在線篩選,選擇marker/mechanism(M)或者therapeutic(T)的靶標(biāo)為研究對(duì)象。
結(jié)腸癌靶點(diǎn)GO 功能分析基于DAVID 6.8(DAVID 6.8,https://david.ncifcrf.gov/)在線分析,將174個(gè)靶點(diǎn)導(dǎo)入DAVID 數(shù)據(jù)庫,限定物種為人源,設(shè)定閾值P<0.01,GO(Gene Ontology)注釋分析包含生物過程(biological process,BP)、細(xì)胞組分(cellular component,CC)以及分子功能(molecular function,MF)。
基于Cytoscape 3.5.1 軟件中的CytoHubba 模塊篩選結(jié)腸癌的Hub靶點(diǎn)。包括連接度(degree)、邊緣滲出組件(edge percolated component,EPC)、最大鄰居組件(maximum neighborhood component,MNC)、最大鄰居組件的密度(density of maximum neighborhood component,DMNC)、最大團(tuán)中心性(maximal clique centrality,MCC)、瓶頸值(bottleneck,BN)、偏心度(EcCentricity)、緊密度(closeness)、發(fā)散性(radiality)、中介性(betweenness)、應(yīng)力(stress),本研究基于Degree、MNC、MCC和Stress四種算法輸出Hub基因[6-7]。
TCGA 數(shù)據(jù)庫(Access TCGA Data)下載結(jié)腸癌患者基因表達(dá)譜數(shù)據(jù)(mRNA),基因表達(dá)譜數(shù)據(jù)已進(jìn)行l(wèi)g2(x+1)轉(zhuǎn)化?;趐erl 合并數(shù)據(jù),刪除數(shù)據(jù)缺失及差異較大的樣本,確定473 例結(jié)腸癌樣品和41 例正常樣品,分析TP53、MYC、VEGFA、EGFR、MMP9、JUN 和TNF 基因在結(jié)腸癌患者中的表達(dá)狀態(tài),所有數(shù)據(jù)均使用R軟件處理(V3.5.1)。
采用R 3.5.1 軟件進(jìn)行統(tǒng)計(jì)學(xué)分析,以mRNA 表達(dá)量的中位數(shù)為節(jié)點(diǎn),將基因表達(dá)定義為高表達(dá)組和低表達(dá)組,用點(diǎn)圖對(duì)TCGA-結(jié)腸癌(COAD)數(shù)據(jù)集患者的TP53、MYC、VEGFA、EGFR、MMP9、JUN 和TNF表達(dá)進(jìn)行評(píng)價(jià)。采用GEPIA(http://gepia.cancer-pku.cn/)數(shù)據(jù)庫用Kaplan-Meier 分 析TP53、MYC、VEGFA、EGFR、MMP9 和JUN 基因表達(dá)量與COAD 預(yù)后的相關(guān)性[8]。根據(jù)TCGA 數(shù)據(jù)庫的臨床數(shù)據(jù),分析VEGFA 和EGFR 基因在不同等級(jí)COAD 組織中的mRNA 表達(dá)水平,探討其與COAD 臨床分期和多種臨床病理特征的關(guān)系。單因素分析和多因素分析采用Cox比例風(fēng)險(xiǎn)回歸模型,P<0.05代表差異具有統(tǒng)計(jì)學(xué)意義。
薏苡仁化合物基于TCMSP 下載化學(xué)結(jié)構(gòu),采用SYBYL 對(duì)小分子進(jìn)行Minimize 能量最小化優(yōu)化,獲得合理構(gòu)象。采用藥物分子設(shè)計(jì)模擬SYBYL 2.1.1軟件的Surflex-Dock 模塊完成分子對(duì)接研究。從蛋白質(zhì)晶體結(jié)構(gòu)數(shù)據(jù)庫RCSB(http://www.rcsb.org/pdb)獲取VEGFA蛋白晶體結(jié)構(gòu)(PDB ID:5T89)。
選擇已經(jīng)有實(shí)驗(yàn)驗(yàn)證的“M”或“T”為靶標(biāo),共篩選出174個(gè)結(jié)腸癌的靶標(biāo)基因。GO(Gene Ontology)注釋結(jié)果見圖1,174 個(gè)靶點(diǎn)主要參與negative regulation of apoptotic process(凋亡過程的負(fù)調(diào)節(jié))、positive regulation of gene expression(基因表達(dá)的正調(diào)控)、positive regulation of protein phosphorylation(蛋白磷酸化的正調(diào)控)和positive regulation of cell proliferation(細(xì)胞增殖的正調(diào)控)等生物過程;174 個(gè)靶點(diǎn)主要分布在extracellular space(細(xì)胞外間隙)、cytosol(胞質(zhì)溶膠)、extracellular exosome、nucleoplasm(核質(zhì))和cytoplasm(細(xì)胞質(zhì))等;174 個(gè)靶點(diǎn)主要有enzyme binding(酶結(jié)合)、transcription factor binding(轉(zhuǎn)錄因子結(jié)合)、protein binding(蛋白質(zhì)結(jié)合)、protein kinase binding(蛋白激酶結(jié)合)和chromatin binding(染色質(zhì)結(jié)合)等分子功能。見圖1。
174 個(gè)結(jié)腸癌靶點(diǎn)通過STRING 進(jìn)行相互作用分析,基于Cytoscape 3.5.1 中的CytoHubba 中的Degree、MNC、MCC和Stress四種算法輸出前10個(gè)Hub基因,見圖2。采用FunRich 3.0 軟件繪制結(jié)腸癌Hub 靶點(diǎn)的韋恩圖,通過取交集的方法獲取7 個(gè)Hub 靶點(diǎn):腫瘤壞死因子(TNF)、p53 腫瘤蛋白(TP53)、原癌基因MYC 蛋白(MYC)、血管內(nèi)皮生長因子A(VEGFA)、表皮生長因子受體(EGFR)、基質(zhì)金屬蛋白酶-9(MMP9)和轉(zhuǎn)錄因子AP-1(JUN)。
圖2 關(guān)鍵靶標(biāo)篩選
TCGA 數(shù)據(jù)中刪除臨床信息和預(yù)后信息不完整樣本,保留473 例結(jié)腸癌樣品和41 例癌旁組織樣品,將TP53、MYC、VEGFA、JUN、MMP9、EGFR、TNF mRNA 表達(dá)值平均分為2份,數(shù)值從小到大依次為低表達(dá)和高表達(dá)。TNF mRNA 表達(dá)值在結(jié)腸癌組織和正常組織中差異無統(tǒng)計(jì)學(xué)意義(P>0.05);TP53、MYC、VEGFA、JUN、MMP9 mRNA 表達(dá)值在結(jié)腸癌組織中顯著高于正常組織(P≤0.01);EGFR mRNA 表達(dá)值在結(jié)腸癌組織中顯著低于正常組織(P<0.01)。見圖3。
圖3 關(guān)鍵基因mRNA表達(dá)
TNF mRNA 表達(dá)值在結(jié)腸癌患者中無統(tǒng)計(jì)學(xué)意義(P>0.05),將不進(jìn)行預(yù)后研究。為明確TP53、MYC、VEGFA、JUN、MMP9、EGFR 表達(dá)與結(jié)腸癌預(yù)后之間的關(guān)系。運(yùn)用Kaplan-Meier 模型進(jìn)行分析。TP53、MYC、VEGFA、JUN、MMP9、EGFR 表達(dá)水平在總生存率(overall survival,OS)中與結(jié)腸癌患者預(yù)后情況無關(guān)(Log-rankP>0.05);TP53、MYC、JUN、MMP9 表達(dá)水平在無病生存率(disease-free survival,DFS)中與結(jié)腸癌患者預(yù)后情況無關(guān)(Log-rankP>0.05);EGFR 表達(dá)水平在DFS 中與結(jié)腸癌患預(yù)后情況顯著相關(guān)(Log-rankP= 0.036);VEGFA 表達(dá)水平在DFS 中與結(jié)腸癌患預(yù)后情況顯著相關(guān)(Log-rankP=0.016)。見圖4。
圖4 不同基因的總生存率和無疾病進(jìn)展生存率
EGFR、VEGFA 基因表達(dá)與預(yù)后有一定相關(guān)性(P <0.05),將進(jìn)一步探討EGFR、VEGFA 表達(dá)量與COAD臨床分期(stage)和T、N、M分期的相關(guān)性。臨床分期結(jié)果顯示:EGFR基因表達(dá)量與COAD臨床分期無顯著相關(guān)性(P=0.064);VEGFA 基因表達(dá)量與COAD臨床分期具有顯著相關(guān)性(P=0.006)。見圖5。T 分期、N 分期和M 分期結(jié)果顯示:EGFR 基因的表達(dá)量與T 分期、N 分期和M 分期無顯著相關(guān)性;VEGFA 基因的表達(dá)量與N 分期呈顯著正相關(guān),N1 和N2 期COAD 組織中VEGFA的基因表達(dá)量顯著高于N0期(P <0.05)。見圖6。
圖5 EGFR、VEGFA基因表達(dá)量與COAD臨床分期的相關(guān)性
圖6 EGFR、VEGFA基因表達(dá)與COAD臨床病理特征的相關(guān)性
EGFR 基因的表達(dá)量與臨床病理參數(shù)相關(guān)性差異不顯著(P>0.05),將不進(jìn)行預(yù)后的單因素分析和多因素分析。故本研究只進(jìn)行VEGFA 在結(jié)腸癌患者中表達(dá)的單因素和多因素分析。單因素回歸分析發(fā)現(xiàn),年齡、臨床分期及T、N、M 分期能夠影響患者的預(yù)后(P<0.05),VEGFA 表達(dá)狀態(tài)和性別對(duì)預(yù)后沒有明顯影響。見表1。以上因素納入COX 多因素回歸分析,結(jié)果提示年齡、T 分期是影響結(jié)腸癌患者預(yù)后的獨(dú)立因素(P<0.05)。
表1 VEGFA在結(jié)腸癌患者中表達(dá)的單因素分析和多因素分析
通過TCGA 分析發(fā)現(xiàn)VEGFA 與結(jié)腸癌發(fā)生、發(fā)展和預(yù)后關(guān)系密切,基于TCMSP 下載薏苡仁化學(xué)成分38 個(gè),其中16 個(gè)化學(xué)成分與VEGFA 有較好的結(jié)合(T_Score >5),薏苡仁內(nèi)酯與VEGFA 的結(jié)合分?jǐn)?shù)最高,為6.6。見表2。
表2 化學(xué)成分與VEGFA分子對(duì)接結(jié)果
本次研究分析了來自TCGA 數(shù)據(jù)庫的結(jié)腸癌mRNA 數(shù)據(jù),共納入514 例樣本。根據(jù)VEGFA mRNA的中位表達(dá)量,將研究對(duì)象分為VEGFA 高表達(dá)及低表達(dá)兩組。主要分析結(jié)腸癌中VEGFA 表達(dá)與臨床病理及預(yù)后的關(guān)系。VEGFA mRNA 在結(jié)腸癌組織中高表達(dá),其表達(dá)量與N分期呈正相關(guān),進(jìn)一步揭示了結(jié)腸癌患者VEGFA 表達(dá)量與預(yù)后的關(guān)系,繪制Kaplan-Meier 生存函數(shù)曲線,結(jié)果提示VEGFA mRNA 高表達(dá)組與低表達(dá)組DFS 的差異均有統(tǒng)計(jì)學(xué)意義(P<0.05)。單因素分析發(fā)現(xiàn),年齡、臨床分期及T、N、M 分期能夠影響結(jié)腸癌患者的預(yù)后(P<0.05),性別和VEGFA 表達(dá)狀態(tài)與結(jié)腸癌患者預(yù)后無相關(guān)性(P>0.05);COX 多因素回歸分析結(jié)果提示,年齡、T 分期是影響結(jié)腸癌患者預(yù)后的獨(dú)立因素(P<0.05)。
結(jié)腸癌的發(fā)生、發(fā)展過程,包括腫瘤生長、侵襲和轉(zhuǎn)移,與血管的生成密切相關(guān),其過程中多種因子參與的信號(hào)通路起到一定作用[9]。VEGFA 表達(dá)水平在DFS中與結(jié)腸癌患預(yù)后情況顯著相關(guān)。VEGFA 又稱為血管通透因子,是血管生長因子VEGF 的一類重要亞型,為血管生成促進(jìn)因子,影響器官的發(fā)育、創(chuàng)傷愈合、組織再生、內(nèi)皮細(xì)胞生長和血管滲透等[10]。有研究表明在結(jié)腸癌患者中VEGFA 過表達(dá)與血管生成以及腫瘤的生長、轉(zhuǎn)移密切相關(guān)[11],而且有研究發(fā)現(xiàn),很多實(shí)體瘤中VEGFA/VEGFR2信號(hào)可以誘導(dǎo)腫瘤的血管生成,其中包括結(jié)直腸癌、肝癌、乳腺癌和胃癌等[12-13],也有一些抑制劑Vatalanib、Cabozantinib、Foretinib 能夠通過抑制VEGF的表達(dá),控制腫瘤血管生長的過程[14-16]。本研究揭示VEGFA 基因在結(jié)腸癌中的表達(dá)及臨床意義,為進(jìn)一步探討VEGFA 在結(jié)腸癌發(fā)生、發(fā)展和預(yù)后中的作用提供理論依據(jù)。
目前,結(jié)腸癌患者死亡多數(shù)與復(fù)發(fā)和轉(zhuǎn)移相關(guān)。但是臨床上結(jié)腸癌的靶向治療處于初級(jí)階段,因此,掌握結(jié)腸癌的發(fā)生、發(fā)展的生物學(xué)特征及關(guān)鍵靶點(diǎn),可更好地為開發(fā)抗結(jié)腸癌藥物提供理論依據(jù)。本研究對(duì)TCGA 數(shù)據(jù)庫進(jìn)行數(shù)據(jù)挖掘,揭示VEGFA 基因在結(jié)腸癌中的表達(dá)及臨床意義,為進(jìn)一步探討VEGFA在結(jié)腸癌發(fā)生、發(fā)展和預(yù)后提供理論依據(jù)。但是,本研究研究的樣本量數(shù)量有限,僅mRNA 水平探討VEGFA 基因在結(jié)腸癌患者中的表達(dá)及預(yù)后作用,后期將進(jìn)一步采用蛋白印記或免疫組化在蛋白水平上進(jìn)行深入研究。