賈喬迪,李莎莎,張紅宇,黃炎清,梁紅霞
鄭州大學(xué)第一附屬醫(yī)院感染與肝病科 鄭州 450052
肝細胞癌(hepatocellular carcinoma,HCC)是原發(fā)性肝癌的主要組織學(xué)亞型,占原發(fā)性肝癌的90%[1]。HCC是一種常見的惡性腫瘤,其死亡率在惡性腫瘤中排名第三[2],早期診斷率低,大多數(shù)患者發(fā)現(xiàn)時已經(jīng)處于中晚期[3-4]。HCC的主要治療方法有手術(shù)切除、移植、放療、化療和射頻治療[5]。由于HCC具有高侵襲性、高轉(zhuǎn)移性、高復(fù)發(fā)率的特點,其不良預(yù)后并未得到根本改變[6]。因此,探討與HCC預(yù)后相關(guān)的關(guān)鍵指標(biāo)和機制,對HCC的診斷和治療具有重要的臨床意義。本研究擬通過生物信息學(xué)分析來識別HCC患者與正常人肝臟組織的差異表達基因,以探究HCC發(fā)病機制中的關(guān)鍵基因。
1.1 HCC患者與正常人數(shù)據(jù)集的獲取本研究從GEO數(shù)據(jù)庫(http://www.ncbi.nlm.nih.gov/geo)獲取基因表達數(shù)據(jù)集。數(shù)據(jù)集包含來自HCC患者肝臟和(或)正常人肝臟的全基因組表達數(shù)據(jù)。最終篩選出4個基因表達數(shù)據(jù)集。
1.2 差異表達基因分析使用GEO2R在線分析工具(https://www.ncbi.nlmnih.gov/geo/geo2r/)對每個數(shù)據(jù)集進行分析,計算得出校正后的P值和|log2FC|,P<0.05和|log2FC|≥1.0為差異表達基因。使用韋恩圖在線工具(http://bioinformatics.psb.ugent.be/webtools/Venn/)識別4個數(shù)據(jù)集中共同的差異表達基因。
1.3 GO及KEGG通路富集分析用DAVID在線工具(http://david.abcc.ncifcrf.gov)對差異表達基因進行GO分析和KEGG通路富集分析。錯誤發(fā)現(xiàn)率(flase discovery rate,FDR)<0.01被認為具有統(tǒng)計學(xué)意義。利用R語言工具代碼對GO分析和KEGG通路富集分析進行可視化處理。
1.4 蛋白相互作用網(wǎng)絡(luò)(PPI)的構(gòu)建和關(guān)鍵基因的選取PPI的構(gòu)建和關(guān)鍵基因的鑒定使用STRING數(shù)據(jù)庫(http://www.string-db.org/),利用Cytoscape 3.7.2(http://cytoscape.org/)對PPI進行可視化處理。PPI中的節(jié)點代表蛋白質(zhì),邊代表蛋白質(zhì)之間的相互作用。Cyhubba是Cytoscape軟件的一個插件,用來確定每個節(jié)點的度值,排名前十的基因被認為是關(guān)鍵基因。
1.5 生存分析GEPIA數(shù)據(jù)庫(http://gepia.cancer-pku.cn/)用于分析來自癌癥基因組圖譜(TCGA,https://portal.gdc.cancer.gov/)和GTEx數(shù)據(jù)庫(https://www.gtexportal.org/) 的9 736個腫瘤和8 587個正常樣本的RNA測序表達數(shù)據(jù)。應(yīng)用GEPIA數(shù)據(jù)庫分析關(guān)鍵基因與HCC預(yù)后的關(guān)系,以基因表達水平中位數(shù)為界,將HCC患者分為高表達組和低表達組,繪制Kaplan-Meier生存曲線。檢驗水準(zhǔn)α=0.05。
1.6 具有預(yù)后價值的關(guān)鍵基因的表達分析應(yīng)用腫瘤相關(guān)數(shù)據(jù)庫及數(shù)據(jù)挖掘平臺Oncomine(https://www.oncomine.org/resource/login.html)數(shù)據(jù)庫,分析具有預(yù)后價值的關(guān)鍵基因在20種腫瘤中的表達、在不同HCC芯片研究中的表達。設(shè)定篩選條件:gene為所篩選出的具有預(yù)后價值的基因;analysis type為cancervsnormal analysis;cancer type為hepatocellular carcinoma;data type為mRNA;sample type為clinical specimen。檢驗水準(zhǔn)α=0.05。
2.1 差異表達基因分析從GEO數(shù)據(jù)庫篩選出的4個數(shù)據(jù)集(GSE62232、GSE57957、GSE121248和GSE39791)中共選出2 915個差異表達基因,其中上調(diào)基因1 211個,下調(diào)基因1 704個,見表1。通過韋恩圖在線工具識別出共同的差異表達基因,其中上調(diào)基因26個,下調(diào)基因124個(圖1)。
表1 GEO數(shù)據(jù)庫中4個數(shù)據(jù)集的統(tǒng)計
A:共同的上調(diào)基因;B:共同的下調(diào)基因
2.2 差異表達基因的功能注釋分析GO分析和KEGG通路富集分析結(jié)果見圖2。GO分析表明,這些差異表達基因在分子功能、生物過程、細胞組成中分別以“絲氨酸肽鏈內(nèi)切酶活性”“氧化還原過程”“細胞外泌體”富集最為明顯。KEGG分析中,“代謝通路”和“碳代謝”通路的富集最顯著。
上:GO分析氣泡圖;下:KEGG分析氣泡圖;橫坐標(biāo)代表每個條目中差異表達基因所占比例,氣泡顏色代表FDR值的大小,氣泡大小代表每個條目中涉及的差異表達基因數(shù)目
2.3 PPI的構(gòu)建和關(guān)鍵基因的選取PPI由149個節(jié)點和348條邊組成(圖3)。節(jié)點為差異表達基因編碼的蛋白,紅色代表上調(diào)基因,綠色代表下調(diào)基因;度值代表每個節(jié)點所連接的其他節(jié)點的個數(shù),度值排名前十的基因為關(guān)鍵基因(表2)。
圖3 PPI
表2 關(guān)鍵基因的信息
2.4 關(guān)鍵基因的生存分析Kaplan-Meier生存曲線見圖4。結(jié)果顯示,CYP3A4、TAT與HCC生存有關(guān),且表達水平低者中位生存期更短(圖4),F(xiàn)TCD、MBL2、C8A、ALDH8A1、KLKB1、APOA5、PLG和ASS1與HCC生存無關(guān)。
圖4 關(guān)鍵基因的Kaplan-Meier生存分析
2.5 具有預(yù)后價值的關(guān)鍵基因的表達分析結(jié)果見圖5。
在20種腫瘤中,CYP3A4在7種腫瘤中表達下調(diào)(圖5A),TAT在3種腫瘤中表達下調(diào)(圖5B)。CYP3A4、TAT在HCC組中的表達均低于對照組(圖5C、D)。在Roessler、Chen、Wurmbach、Mas等基因芯片研究中,CYP3A4在HCC中的表達量均低于對照組(圖5E);在Roessler、Wurmbach、Mas等基因芯片研究中,TAT在HCC中的表達量低于對照組(圖5F)。
A、B:分別為CYP3A4、TAT在20種腫瘤中的表達(紅色代表高表達,藍色代表低表達);C、D:分別為CYP3A4、TAT在HCC組與對照組中的表達(1代表對照組,2代表HCC組);E、F:Oncomine數(shù)據(jù)庫中HCC組織中CYP3A4、TAT的表達
HCC多見于中晚期,結(jié)合社會經(jīng)濟因素,可能不具備肝葉切除、肝移植等手術(shù)的適應(yīng)證,預(yù)后不理想[4]。盡管出現(xiàn)了新的診斷和治療技術(shù),但HCC的發(fā)病率和死亡率仍在上升,其發(fā)病機制仍不明確[7]。探討HCC侵襲轉(zhuǎn)移的機制,尋找有效的診斷分子標(biāo)志物和治療靶點,已成為HCC的重要研究方向。
本研究共篩選出150個與HCC有關(guān)的差異表達基因,其中表達上調(diào)26個,下調(diào)124個。GO功能富集分析表明,這些差異表達基因在氧化還原過程、細胞外泌體和血紅素結(jié)合中發(fā)揮作用。KEGG分析中,這些差異表達基因在“代謝通路”和“碳代謝”通路的富集最顯著。有研究[8-9]表明,大多數(shù)類型的細胞均可分泌外泌體,其對細胞間通信、疾病的傳播及組織修復(fù)具有重要的調(diào)節(jié)作用;外泌體在腫瘤微環(huán)境中的通信功能促進了HCC細胞的發(fā)展,有望成為HCC的治療靶點。本研究結(jié)果與文獻[8-9]報道一致。
生存分析發(fā)現(xiàn)10個關(guān)鍵基因中CYP3A4和TAT與HCC患者的預(yù)后有關(guān)。CYP3A4基因編碼的細胞色素P4503A4是細胞色素P450氧化酶家族成員之一[10],是人肝和腸中主要的P450氧化酶,參與了許多藥物的氧化[11]。Fanni等[11]發(fā)現(xiàn)CYP3A4與索拉非尼化療反應(yīng)有關(guān)并可能在HCC的個體化治療過程中發(fā)揮作用。有研究[12]指出CYP3A4基因下調(diào)是HCC患者生存和早期復(fù)發(fā)的獨立預(yù)測因子。本研究結(jié)果顯示,CYP3A4在HCC中低表達,且表達水平與HCC的預(yù)后有關(guān),與既往研究[13]一致。除了HCC,CYP3A4還與乳腺癌[13]、胃癌[14]、結(jié)直腸癌[15]的預(yù)后有關(guān)。
TAT是一種核基因,編碼存在于肝臟中的線粒體蛋白酪氨酸轉(zhuǎn)氨酶,催化L-酪氨酸轉(zhuǎn)化為對羥基苯丙酮酸,這種酶被認為在Ⅱ型酪氨酸血癥、肝炎和HCC的恢復(fù)中發(fā)揮作用[16]。酪氨酸代謝失調(diào)常發(fā)生于癌癥和各種慢性疾病[17]。TAT與HCC[18]和乳腺癌[19]等腫瘤相關(guān)。有研究[20]發(fā)現(xiàn),TAT基因缺失和高甲基化導(dǎo)致的失活參與了HCC的發(fā)病機制,且TAT基因?qū)際CC細胞可有效抑制其致瘤性,提示TAT在HCC的發(fā)病機制中發(fā)揮抑制腫瘤的作用。
綜上所述,CYP3A4和TAT基因在HCC組織中低表達,且表達量低者預(yù)后差。CYP3A4和TAT有望成為HCC的診斷分子標(biāo)志物和治療靶點。