陳偉毅,陳立軍
(湖南醫(yī)藥學(xué)院醫(yī)學(xué)院,湖南懷化418000)
肝內(nèi)膽管癌(intrahepatic cholangiocarcinoma,ICC)是指起源于肝內(nèi)膽管上皮的一種惡性腫瘤。ICC 約占肝臟原發(fā)惡性腫瘤的10%~15%,是發(fā)病率僅次于肝細(xì)胞肝癌的肝臟原發(fā)惡性腫瘤[1]。ICC 早期往往無典型臨床癥狀,大多數(shù)患者確診時往往已失去了手術(shù)的機(jī)會,而未行手術(shù)治療者,預(yù)后極差[2]。因此對ICC 的早期診斷對于改善患者的預(yù)后具有重要意義。
目前臨床上診斷ICC 所使用的腫瘤標(biāo)記物特異度及敏感度欠缺,診斷價值很低[3],尋找新的具有臨床診斷價值的潛在生物標(biāo)志物對提高ICC 患者的早期診斷率具有重要作用。
隨著生物學(xué)技術(shù)的發(fā)展,二代測序技術(shù)已廣泛應(yīng)用于探索腫瘤新的生物標(biāo)志物和治療靶點(diǎn)[4]?,F(xiàn)今研究[5]表明,基因組的不穩(wěn)定性以及變異性可能會對ICC 的發(fā)生和發(fā)展產(chǎn)生影響。本研究通過生物信息學(xué)方法篩選ICC 的關(guān)鍵調(diào)控基因,評估關(guān)鍵調(diào)控基因?qū)CC 的預(yù)測能力,為診斷和治療ICC 患者提供新的思路,為深入認(rèn)識ICC 疾病提供新的方法。
從公共數(shù)據(jù)庫GEO 中下載2個ICC 轉(zhuǎn)錄組數(shù)據(jù)集,編號分別為GSE107943 和GSE119336。數(shù)據(jù)集信息、檢測平臺以及樣本分類等信息具體見表1。
表1 ICC轉(zhuǎn)錄組數(shù)據(jù)信息和樣本分類Table 1 ICC transcriptome data information and sample classification
1.2.1 轉(zhuǎn)錄組數(shù)據(jù)預(yù)處理過程 GSE107943 數(shù)據(jù)集預(yù)處理過程:⑴使用MAP-R Seq 管道進(jìn)行分析RNA 測序樣本。⑵采用bowtie1 軟件進(jìn)行選項比對,雙端讀段由TopHatv2 對比人類參考基因組hg19后構(gòu)建。⑶使用FeatureCounts 軟件量化基因表達(dá),每個樣本的映射讀段與ENSEMBL 的GRCh37.75 RNA 特征參考基因定義文件對齊,然后量化。⑷將與每個RNA 特征對齊的原始讀取數(shù)標(biāo)準(zhǔn)化為RPKM值。GSE119336 數(shù)據(jù)集預(yù)處理過程:⑴測序讀段被修剪為適配器序列,屏蔽低復(fù)雜性或低質(zhì)量序列。⑵使用TopHat (v2.0.10) 將序列與人類參考基因組(hg19 版本)和RefSeq 注釋基因進(jìn)行比對,發(fā)現(xiàn)轉(zhuǎn)錄本剪接位點(diǎn)。⑶根據(jù)TopHat 生成的基因圖譜,使用Cufflinks (v2.1.1) 評估基因表達(dá)水平。⑷將每個基因的表達(dá)水平標(biāo)準(zhǔn)化為FPKM 值,以便于樣本之間的轉(zhuǎn)錄水平比較。
1.2.2 差異表達(dá)基因篩選 轉(zhuǎn)錄組數(shù)據(jù)預(yù)處理后,采用R 語言的edgeR 包對ICC 組織和正常組織進(jìn)行差異表達(dá)基因篩選,設(shè)置校正P<0.01 且|log2FC|≥2為閾值條件。
1.2.3 差異表達(dá)基因的GO 和KEGG 富集分析 使用R 語言 的clusterProfiler、org.Hs.eg.db程序包對差異表達(dá)基因進(jìn)行GO 功能(包括生物學(xué)過程BP、細(xì)胞組分CC、分子功能MF)和KEGG 通路富集分析,并將TOP5 的顯著富集結(jié)果以氣泡圖展示。
1.2.4 差異表達(dá)基因的蛋白質(zhì)-蛋白質(zhì)相互作用網(wǎng)絡(luò)(Protein-Protein Interaction,PPI)Networks 構(gòu)建與關(guān)鍵模塊挖掘 采用STRING 數(shù)據(jù)庫(https://www.string-db.org)對差異表達(dá)基因進(jìn)行PPI 網(wǎng)絡(luò)分析,設(shè)置combined score>0.9 為閾值條件,然后使用Cytoscape 軟件對其進(jìn)行可視化。采用Cytoscape 軟件中的MCODE 插件對PPI 網(wǎng)絡(luò)中的關(guān)鍵子網(wǎng)絡(luò)進(jìn)行辨別,并從中挖掘出關(guān)鍵調(diào)控基因,設(shè)置參數(shù)為:Degree Cutoff=2,Node Score Cutoff=0.2,Max. Depth=100,K-Core=2。
1.2.5 關(guān)鍵調(diào)控基因的表達(dá)分析與驗證 通過SPSS26.0 分析關(guān)鍵調(diào)控基因在ICC 組織和正常組織中的表達(dá),分析方法采用獨(dú)立樣本t檢驗,采用UALCAN、GEPIA 數(shù)據(jù)庫對基因表達(dá)進(jìn)行驗證。
1.2.6 關(guān)鍵調(diào)控基因的泛癌表達(dá)分析 在UCSC XENA 數(shù)據(jù)庫(https://xenabrowser.net/datapages)下載經(jīng)統(tǒng)一處理的TCGA 和GTEx 的RNAseq 數(shù)據(jù),使用R 語言的ggplot2 包對關(guān)鍵調(diào)控基因進(jìn)行泛癌表達(dá)分析。
1.2.7 關(guān)鍵調(diào)控基因在ICC 中的共表達(dá)基因分析、PPI 網(wǎng)絡(luò)分析、富集分析 在TCGA 數(shù)據(jù)庫(https://portal.gdc.cancer.gov)下載膽管癌RNAseq 數(shù)據(jù),使用R 語言的stat 包分析編碼基因與關(guān)鍵調(diào)控基因的相關(guān)系數(shù),選取相關(guān)系數(shù)TOP10 的編碼基因進(jìn)行可視化。采用STRING 數(shù)據(jù)庫對相關(guān)系數(shù)TOP10 的編碼基因和關(guān)鍵調(diào)控基因進(jìn)行PPI 網(wǎng)絡(luò)分析,利用Metasacape 網(wǎng) 站(http://metascape.org)進(jìn)行富集分析。
1.2.8 關(guān)鍵調(diào)控基因的表達(dá)與腫瘤分期、分級、淋巴轉(zhuǎn)移、預(yù)后關(guān)系的分析 利用UALCAN 數(shù)據(jù)庫分析關(guān)鍵調(diào)控基因與腫瘤分期、分級、淋巴轉(zhuǎn)移的相關(guān)性。利用GEPIA 數(shù)據(jù)庫分析關(guān)鍵調(diào)控基因與患者預(yù)后的相關(guān)性。
1.2.9 關(guān)鍵調(diào)控基因表達(dá)對ICC 免疫細(xì)胞浸潤的影響分析 在TCGA 數(shù)據(jù)庫下載膽管癌RNAseq 數(shù)據(jù),使用R 語言GSVA 包計算免疫浸潤相關(guān)性及顯著性。
1.2.10 繪制ROC 曲線評價關(guān)鍵調(diào)控基因?qū)CC 的診斷能力 使用Graphpad 8.0 軟件繪制受試者工作特征曲線(ROC 曲線)。ROC 曲線下面積(AUC)越接近于1.0,其診斷效果越好。
1.2.11 細(xì)胞及培養(yǎng) 人肝內(nèi)膽管上皮細(xì)胞(HIBEC)購于北京北納創(chuàng)聯(lián)生物技術(shù)研究院,人肝內(nèi)膽管癌細(xì)胞(RBE)購于中科院上海細(xì)胞庫,兩種細(xì)胞株均采用含10% 的胎牛血清的RPMI 1640,培養(yǎng)于37 ℃、5% CO2孵箱中,每48 h 進(jìn)行消化傳代。
1.2.12 RT-qPCR 檢測mRNA 表達(dá) 采用TRIzol 法(美國Invitrogen 公司)提取細(xì)胞總RNA,用分光光度計檢測RNA 濃度,用逆轉(zhuǎn)錄試劑盒(日本TaKaRa 公 司) 將RNA逆轉(zhuǎn)錄成cDNA,然 后 用SYBR Green 法(美國Thermo Fisher 公司)進(jìn)行實時熒光定量PCR,以GAPDH 為內(nèi)參,采用2-ΔΔCt法計算目的基因的相對表達(dá)量。Polo 樣激酶1 (Pololike Kinase, PLK1)上游引物:5'-GCT GGG CAA CCT TTT CCT G-3',下游引物:5'-CCA GTG GGA TCT GTC TGA AGC-3';羥基酸氧化酶(hydroxyacid oxidase 2,HAO2)上游引物:5'-TGA CAG ACT TTC AGG CCC AT-3',下游引物:5'-CAC TGA TCT CCT CCC CTT GG-3';纖維膠凝蛋白(ficolin-2,F(xiàn)CN2)上游引物:5'-CTG CCA TGT GT CAA ACC TGA A-3',下游引物:5'-TTC CCC GAC TTC CAG TTG ATG-3';GAPDH 上游引物:5'-GAG TCA ACG GAT TTG GTC GT-3',下游引物:5'-GAC AAG CTT CCC GTT CTC AG-3'。
1.2.13 Western blot 檢測蛋白表達(dá) 提取細(xì)胞蛋白,采用BCA 法測量蛋白濃度,每組取60 g 蛋白樣品進(jìn)行電泳,之后將蛋白轉(zhuǎn)移到PDVF 膜上,5%脫脂奶粉封閉后加入一抗4 ℃孵育過夜,再加入二抗孵育2 h,曝光顯影,以GAPDH 為內(nèi)參計算蛋白相對表達(dá)量。PLK1、HAO2、FCN2、GAPDH 抗體均購自美國Abcam 公司。
采用R 語言的edgeR 包對兩個轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行分析,設(shè)置校正P<0.01 且|log2FC|≥2 為閾值條件。GSE107943 數(shù)據(jù)集中共篩選出2 242個(3.88%)差異表達(dá)基因,其中上調(diào)基因1 320個,下調(diào)基因922個(圖1A)。GSE119336 數(shù)據(jù)集中共篩選出1 663個(6.50%) 差異表達(dá)基因,其中上調(diào)基因904個,下調(diào)基因759個(圖1B)。兩個數(shù)據(jù)集共同的差異表達(dá)基因為1 123個(圖1C),其中有567個基因為共同上調(diào)基因(圖1D),527個基因為共同下調(diào)基因(圖1E)。表2 羅列了2個數(shù)據(jù)集中差異表達(dá)最大的5個共同上調(diào)和共同下調(diào)基因。共同上調(diào)和共同下調(diào)的基因共1 094個。在ICC 的發(fā)生機(jī)制中這1 094個差異表達(dá)基因可能起著非常重要的作用,故后續(xù)分析都根據(jù)此。
圖1 ICC差異表達(dá)基因的分析結(jié)果 A:GSE107943差異表達(dá)基因火山圖;B:GSE119336差異表達(dá)基因火山圖;C:兩個數(shù)據(jù)集共同差異表達(dá)基因Venn圖;D:兩個數(shù)據(jù)集共同上調(diào)基因Venn圖;E:兩個數(shù)據(jù)集共同下調(diào)基因Venn圖Figure 1 Results of analysis of differentially expressed genes in ICC A: Volcano map of GSE107943; B: Volcano map of GSE119336; C: Venn diagram of differentially expressed genes both in GSE107943 and GSE119336; D: Venn diagram of up-regulated differentially expressed genes;E:Venn diagram of down-regulated differentially expressed genes
表2 兩個數(shù)據(jù)集中差異表達(dá)最大的5個共同上調(diào)和下調(diào)基因Table 2 The five co-up-regulated and co-down-regulated genes
對1 094個差異表達(dá)基因進(jìn)行GO 富集分析結(jié)果顯示:1 094個共同差異表達(dá)基因主要參與BP 的小分子分解代謝、有機(jī)酸生物合成、羧酸生物合成、羧酸分解代謝、有機(jī)酸分解代謝等過程(圖2A);CC 主要與含膠原的細(xì)胞外基質(zhì)、細(xì)胞頂端、內(nèi)質(zhì)網(wǎng)內(nèi)腔、頂端質(zhì)膜、血液微粒等有關(guān)(圖2B);MF 主要與酶結(jié)合、硫化合物結(jié)合、羧酸結(jié)合、維生素結(jié)合、單加氧酶活性等有關(guān)(圖2C)。KEGG通路分析發(fā)現(xiàn),1 094個共同差異表達(dá)基因主要參與碳代謝、補(bǔ)體與凝血級聯(lián)、氨基酸生物合成、纈氨酸、亮氨酸和異亮氨酸降解、甘氨酸、絲氨酸和蘇氨酸代謝等(圖2D)。
圖2 ICC共同差異表達(dá)基因的功能和通路富集 A:共同差異表達(dá)基因的GO—BP富集;B:共同差異表達(dá)基因的GO—CC富集;C:共同差異表達(dá)基因的GO—MF富集;D:共同差異表達(dá)基因的KEGG通路富集Figure 2 GO and KEGG enrichment of common differentially expressed genes in ICC A: GO—BP enrichment; B: GO—CC enrichment;C:GO—MF enrichment;D:GO—BP enrichment
采用STRING 數(shù)據(jù)庫對1 094個共同差異表達(dá)基因進(jìn)行PPI 網(wǎng)絡(luò)的構(gòu)建,使用Cytoscape 進(jìn)行可視化,該P(yáng)PI 網(wǎng)絡(luò)共有451個節(jié)點(diǎn)和1288 條邊(圖3)。使用MCODE 插件一共篩選出17個關(guān)鍵子網(wǎng)絡(luò),取得分最高的前3個子網(wǎng)絡(luò)進(jìn)行分析(表3)(圖4),從中挖掘出3個關(guān)鍵調(diào)控基因PLK1、HAO2、FCN2(表4)。
圖3 ICC差異表達(dá)基因的PPI網(wǎng)絡(luò)Figure 3 PPI network of the differentially expressed genes in ICC
表3 得分前三的子網(wǎng)絡(luò)模塊信息Table 3 Information of the top 3 sub-network modules
圖4 ICC差異表達(dá)基因PPI網(wǎng)絡(luò)中3個關(guān)鍵子網(wǎng)絡(luò)Figure 4 Three key subnetworks in ICC differential expression gene PPI network
表4 關(guān)鍵蛋白調(diào)控功能基因節(jié)點(diǎn)信息Table 4 Node information of the key genes
采用獨(dú)立樣本t檢驗比較ICC 組織和正常肝臟組 織 中PLK1、HAO2、FCN2 表達(dá),ICC組織中PLK1 表達(dá)明顯高于正常組織,HAO2、FCN2 表達(dá)明顯低于正常組織,差異均有顯著性(均P<0.001)(圖5A)。結(jié)果表明PLK1 在ICC 中呈高表達(dá)、HAO2、FCN2 在ICC 中呈低表達(dá)。利用UALCAN 中的TCGA 數(shù)據(jù)庫對3個基因在ICC 中的表達(dá)進(jìn)行驗證,發(fā)現(xiàn)PLK1 在ICC 中高表達(dá),HAO2、FCN2 在ICC 中低表達(dá),與分析結(jié)果一致(圖5B)。利用GEPIA 數(shù)據(jù)庫對3個基因的表達(dá)進(jìn)行驗證,發(fā)現(xiàn)PLK1 在ICC 中高表達(dá),HAO2、FCN2 在ICC 中低表達(dá),與分析結(jié)果也是一致的(圖5C)。
圖5 關(guān)鍵調(diào)控基因的表達(dá)分析及驗證 A:PLK1、HAO2、FCN2在ICC組織和正常組織中的表達(dá)差異;B:PLK1、HAO2、FCN2在UALCAN數(shù)據(jù)庫中的表達(dá)差異;C:PLK1、HAO2、FCN2在GEPIA數(shù)據(jù)庫中的表達(dá)差異Figure 5 Expression analysis and validation of the key regulatory genes A: The expression differences of PLK1, HAO2 and FCN2 between ICC and normal tissues; B: The expression differences of PLK1, HAO2 and FCN2 in UALCAN database;C:The expression differences of PLK1,HAO2 and FCN2 in GEPIA database
采用UCSC XENA 數(shù)據(jù)庫分析PLK1、HAO2、FCN2 在腫瘤中的表達(dá)情況。發(fā)現(xiàn)在33 種腫瘤中,PLK1 在28 種腫瘤表達(dá)明顯增高(圖6A),HAO2 在24 種腫瘤表達(dá)明顯降低(圖6B),F(xiàn)CN2 在27 種腫瘤表達(dá)明顯降低(圖6C)。
圖6 PLK1、HAO2、FCN2在腫瘤中的表達(dá)情況分析 A:PLK1在28/33種腫瘤中表達(dá)上調(diào);B:HAO2在24/33種腫瘤中表達(dá)下調(diào);C:FCN2在27/33種腫瘤中表達(dá)下調(diào)Figure 6 Analysis of the expressions of PLK1, HAO2 and FCN2 in tumors A: Up-regulation of PLK1 in 28/33 tumors;B:Down-regulation of HAO2 in 24/33 tumors;C:Down-regulation of FCN2 in 27/33 tumors
采用TCGA 數(shù)據(jù)庫分析關(guān)鍵調(diào)控基因在ICC 中的共表達(dá)基因,發(fā)現(xiàn)PLK1 與CCNA2、GTSE1 等基因共表達(dá)相關(guān)性最強(qiáng)(圖7A),HAO2 與MTTP、CPS1 等基因共表達(dá)相關(guān)性最強(qiáng)(圖7B),F(xiàn)CN2 與FAM99A、 GDF2 等基因共表達(dá)相關(guān)性最強(qiáng)(圖7C)。
圖7 關(guān)鍵調(diào)控基因在ICC中的共表達(dá)基因分析 A:PLK1共表達(dá)基因熱圖;B:HAO2共表達(dá)基因熱圖;C:FCN2共表達(dá)基因熱圖;D:共表達(dá)基因和關(guān)鍵基因的PPI網(wǎng)絡(luò);E:共表達(dá)基因GO和KEGG富集分析Figure 7 Co-expression gene analysis of the key regulatory genes in ICC A: Heat map of PLK1 co-expressed genes; B: Heat map of HAO2 co-expressed genes; C: Heat map of FCN2 co-expressed genes; D: PPI network of co-expressed genes and key regulatory genes;E:GO and KEGG enrichment of co-expressed genes
利用STRINGS 數(shù)據(jù)庫構(gòu)建共表達(dá)基因和關(guān)鍵基因的PPI 網(wǎng)絡(luò),該P(yáng)PI 網(wǎng)絡(luò)共有30個節(jié)點(diǎn)和110 條邊(圖7D)。采用Metascape 網(wǎng)站對共表達(dá)基因進(jìn)行富集分析,發(fā)現(xiàn)共表達(dá)基因主要參與細(xì)胞分裂、補(bǔ)體激活、凝集素途徑、甘油三酯代謝過程等(圖7E)。
利用UALCAN 中的TCGA 數(shù)據(jù)庫分析關(guān)鍵調(diào)控基因?qū)CC 發(fā)展的影響。結(jié)果顯示,PLK1、HAO2、FCN2 表達(dá)與腫瘤分期、分級、淋巴轉(zhuǎn)移有關(guān),PLK1 表達(dá)越高、HAO2、FCN2 表達(dá)越低,腫瘤分期越高、分化越差、越易出現(xiàn)淋巴轉(zhuǎn)移(圖8A-C)。
圖8 關(guān)鍵調(diào)控基因?qū)CC發(fā)展、預(yù)后的影響 A:PLK1、HAO2、FCN2對腫瘤分級的影響;B:PLK1、HAO2、FCN2對腫瘤分期的影響;C:PLK1、HAO2、FCN2對腫瘤淋巴轉(zhuǎn)移的影響;D:PLK1、HAO2、FCN2對患者預(yù)后的影響Figure 8 Effects of the key regulatory genes on the development and prognosis of ICC A: Effect of PLK1, HAO2, FCN2 on tumor grade; B: Effect of PLK1, HAO2, FCN2 on tumor stages; C: Effect of PLK1, HAO2, FCN2 on tumor nodal metastasis;E:Effect of PLK1,HAO2,FCN2 on prognosis of patients
利用GEPIA 數(shù)據(jù)庫分析關(guān)鍵調(diào)控基因?qū)CC 患者預(yù)后的影響。結(jié)果顯示PLK1、HAO2、FCN2 與ICC 患者總體生存率無相關(guān)性(圖8D)。
分析關(guān)鍵調(diào)控基因表達(dá)與免疫細(xì)胞浸潤水平的相關(guān)性。結(jié)果發(fā)現(xiàn)PLK1 表達(dá)與Th2 細(xì)胞浸潤正相關(guān)性最大,與NK 細(xì)胞浸潤負(fù)相關(guān)性最大;HAO2 表達(dá)與中性粒細(xì)胞浸潤正相關(guān)性最大,與CD8 T 細(xì)胞浸潤負(fù)相關(guān)性最大;FCN2 表達(dá)與Tcm浸潤正相關(guān)性最大,與aDC 浸潤負(fù)相關(guān)性最大(圖9A)。
圖9 關(guān)鍵調(diào)控基因?qū)CC 免疫浸潤水平的影響 A:PLK1、HAO2、FCN2 表達(dá)與免疫細(xì)胞浸潤水平的相關(guān)性;B:PLK1表達(dá)與Th2細(xì)胞、NK細(xì)胞浸潤相關(guān)性;C:HAO2表達(dá)與中性粒細(xì)胞、CD8 T細(xì)胞浸潤相關(guān)性;D:FCN2表達(dá)與Tcm、aDC浸潤相關(guān)性Figure 9 Effect of key regulatory genes on ICC immune infiltration level A: Correlation between PLK1, HAO2, FCN2 expression and immune cell infiltration level; B: Correlation between PLK1 expression and Th2 cells as well as NK cell infiltration; C: Correlation between HAO2 expression and neutrophils as well as CD8 T cells infiltration; D: Correlation between FCN2 expression and Tcm as well as aDC
進(jìn)一步分析關(guān)鍵調(diào)控基因表達(dá)與正、負(fù)相關(guān)性最大細(xì)胞浸潤的顯著性。結(jié)果發(fā)現(xiàn)PLK1 表達(dá)與Th2 細(xì)胞浸潤呈顯著正相關(guān)(r=0.517,P=0.001),PLK1 表達(dá)與NK 細(xì)胞浸潤相關(guān)性不顯著(P=0.090)(圖9B);HAO2 表達(dá)與CD8 T 細(xì)胞、中性粒細(xì)胞浸潤相關(guān)性均不顯著(P=0.103,P=0.070)(圖9C);FCN2 表達(dá)與Tcm 浸潤相關(guān)性不顯著(P=0.126),F(xiàn)CN2 表達(dá)與aDC 浸潤呈負(fù)相關(guān)(r=0.435,P=0.008)(圖9D)。
繪制ROC 曲線評估關(guān)鍵調(diào)控基因診斷ICC 的效果。結(jié)果發(fā)現(xiàn)PLK1、HAO2、FCN2 3個基因?qū)CC 的AUC 值均>0.98,表明3個基因?qū)CC 均有較好的診斷能力,其中HAO2 的AUC 值最大,表明HAO2 診斷能力最 好。PLK1 聯(lián) 合HAO2 或FCN2 后AUC 值均為1.000,表明PLK1 聯(lián)合HAO2 或FCN2 對ICC 具有非常好的診斷能力。HAO2 和FCN2 聯(lián)合應(yīng)用后AUC 值為0.999 5,診斷能力略微下降。PLK1、HAO2 和FCN2 3個基因聯(lián)合應(yīng)用后AUC 值為1.000,表明3個基因聯(lián)合應(yīng)用同樣具有非常好的診斷能力(圖10)。
圖10 關(guān)鍵調(diào)控基因?qū)CC的診斷能力分析Figure 10 Diagnostic abilities of the key regulatory genes for ICC
檢測關(guān)鍵調(diào)控基因在HIBEC 和RBE mRNA 和蛋白表達(dá)差異,結(jié)果發(fā)現(xiàn)PLK1 mRNA 和蛋白在RBE 中表達(dá)顯著高于HIBEC (P<0.01,P<0.001),HAO2、FCN2 mRNA 和蛋白在RBE 系中表達(dá)顯著高低于HIBEC (P<0.01,P<0.001)(圖11)。實驗結(jié)果表明關(guān)鍵調(diào)控基因在細(xì)胞中表達(dá)差異與生物信息學(xué)分析結(jié)果一致。
圖11 關(guān)鍵調(diào)控基因在HIBEC 和RBE 表達(dá)差異 A:兩種細(xì)胞株P(guān)LK1、HAO2、FCN2 mRNA 表達(dá)差異;B:兩種細(xì)胞株P(guān)LK1、HAO2、FCN2蛋白表達(dá)差異Figure 11 Differential expression of key regulatory genes in HIBEC and RBE A: Differential expression of PLK1, HAO2,FCN2 mRNA in two cell lines;B:Differential expression of PLK1,HAO2,FCN2 protein in two cell lines
ICC 約占肝臟原發(fā)惡性腫瘤的10%~15%,近年來發(fā)病率呈上升趨勢[6]。由于缺乏特異典型的臨床表現(xiàn)和敏感可靠的診斷標(biāo)志物,多數(shù)ICC 患者被確診時已進(jìn)入晚期,因此急切面臨對ICC 分子機(jī)制的切實解析與探究[7-8]。本研究首先在GEO 數(shù)據(jù)庫中篩選出ICC 轉(zhuǎn)錄組層面的2個高通量數(shù)據(jù)集GSE107943 和GSE119336,從中篩選出3個關(guān)鍵調(diào)控基因PLK1、HAO2、FCN2。對關(guān)鍵調(diào)控基因表達(dá)進(jìn)行分析,發(fā)現(xiàn)PLK1 在ICC 組織中呈高表達(dá),HAO2、FCN2 在ICC 組織中呈低表達(dá)。采用TCGA和GTex 數(shù)據(jù)庫聯(lián)合分析關(guān)鍵調(diào)控基因在泛癌中的表達(dá),發(fā)現(xiàn)PLK1 在28 種腫瘤顯著高表達(dá),HAO2在24 種腫瘤顯著低表達(dá),F(xiàn)CN2 在27 種腫瘤顯著呈低表達(dá)。通過UALCAN 數(shù)據(jù)庫分析關(guān)鍵調(diào)控基因與ICC 腫瘤分級和分期、淋巴轉(zhuǎn)移的相關(guān),發(fā)現(xiàn)PLK1 高表達(dá)、HAO2、FCN2 低表達(dá)提示分化差、分期高、易淋巴轉(zhuǎn)移。分析關(guān)鍵調(diào)控基因表達(dá)與免疫細(xì)胞浸潤水平的相關(guān)性,發(fā)現(xiàn)PLK1 表達(dá)與Th2 細(xì)胞浸潤呈顯著正相關(guān),F(xiàn)CN2 表達(dá)與aDC 浸潤呈顯著負(fù)相關(guān)。繪制ROC 曲線評估PLK1、HAO2、FCN2 對ICC 的診斷效果,發(fā)現(xiàn)3個基因?qū)CC 均有較好的診斷能力。采用細(xì)胞實驗驗證關(guān)鍵調(diào)控基因在ICC 中的表達(dá),發(fā)現(xiàn)在RBE 中PLK1 表達(dá)顯著上調(diào),HAO2、FCN2 表達(dá)顯著下調(diào)。
PLK1 是一種高度保守的絲/蘇氨酸激酶,其在有絲分裂進(jìn)程中的重要作用已經(jīng)被闡明[9]。最近的研究發(fā)現(xiàn),PLK1 有誘導(dǎo)DNA 合成、DNA 完整性的檢修以及防止細(xì)胞凋亡方面的作用[10]。PLK1 還能通過磷酸化p53 而抑制其轉(zhuǎn)活性,進(jìn)而抑制p53 發(fā)揮檢驗點(diǎn)蛋白和誘導(dǎo)細(xì)胞凋亡的功能[11]。另外,PLK1 與腫瘤的發(fā)生發(fā)展密切相關(guān),研究發(fā)現(xiàn)PLK1在多種人類腫瘤中呈高表達(dá)[12]。本研究發(fā)現(xiàn)PLK1在ICC 中的表達(dá)明顯高于正常組織,與上述研究結(jié)果一致。同時本研究發(fā)現(xiàn)PLK1 高表達(dá)與ICC 患者腫瘤分期、分級和淋巴轉(zhuǎn)移、免疫細(xì)胞浸潤有關(guān),且對ICC 有較好的診斷能力,表明PLK1 有望成為ICC 診斷和治療的新靶點(diǎn)。
過氧化物酶體普遍存在于真核細(xì)胞內(nèi),參與多種代謝途徑[13]。 羥基酸氧化酶(hydroxyacid oxidase,HAO)是過氧化物酶體中所包含的一類氧化酶,一共有3個亞型,其中HAO2 主要在肝臟和腎臟中表達(dá)[14]。研究[15-16]發(fā)現(xiàn)HAO2 在肝癌、腎透明細(xì)胞癌中表達(dá)下降,與患者的不良預(yù)后相關(guān)。本研究發(fā)現(xiàn)HAO2 在ICC 中表達(dá)同樣下降,且HAO2 低表達(dá)提示患者生存較差。HAO2 是催化含羥基的脂肪酸的酶類,直接參與脂肪酸的氧化分解過程,而腫瘤代謝的過程脂肪酸分解減少、合成增加[17]。本研究發(fā)現(xiàn)HAO2 在ICC 中低表達(dá),提示ICC 可能通過降低HAO2 表達(dá)適應(yīng)其脂代謝重編程的需要,HAO2 可能是糾正ICC 代謝異常的一個潛在靶點(diǎn)。
FCN2 能夠與凝集素相關(guān)絲氨酸蛋白酶形成復(fù)合體,是少數(shù)能激活凝集素補(bǔ)體途徑的分子[18-19]。目前FCN2 研究多集中在感染性疾病,研究報道其單核苷酸多態(tài)性與肺結(jié)核、越南登革熱、意大利風(fēng)濕熱、風(fēng)濕性心臟病等疾病有關(guān)[20-23]。關(guān)于腫瘤方面只有少量報道,Yang 等[24]發(fā)現(xiàn)FCN2 在肝癌組織中呈表達(dá)下調(diào),F(xiàn)CN2 低表達(dá)與肝癌的侵襲轉(zhuǎn)移相關(guān)。本研究發(fā)現(xiàn)FCN2 在ICC 組織中同樣表達(dá)下降,與ICC 患者腫瘤分期、分級和淋巴轉(zhuǎn)移、免疫細(xì)胞浸潤等相關(guān),提示FCN2 在ICC 中發(fā)揮重要作用,可能是ICC 的一個潛在的作用靶點(diǎn)。
免疫細(xì)胞在調(diào)節(jié)腫瘤細(xì)胞行為中發(fā)揮重要作用,越來越多的證據(jù)支持它們在預(yù)測許多癌癥類型的結(jié)果和治療效果方面的具有重要價值[25]。本研究分析了PLK1、HAO2、FCN2 基因表達(dá)與ICC 中各種腫瘤免疫細(xì)胞浸潤的相關(guān)性,發(fā)現(xiàn)PLK1 表達(dá)與Th2 cells 浸潤呈顯著正相關(guān),F(xiàn)CN2 表達(dá)與aDC浸潤呈顯著負(fù)相關(guān),因此PLK1 和FCN2 可能通過調(diào)節(jié)腫瘤免疫影響ICC 進(jìn)展。
本研究篩選出3個對ICC 具有診斷能力的基因,這3個基因在ICC 中均未見報道但在其他腫瘤中均有報道,且報道結(jié)果與本研究結(jié)果基本一致,表明本研究篩選結(jié)果具有較高的可信度。但是本研究也存在著以下不足。第一,該研究是通過生物信息學(xué)方法進(jìn)行的,只進(jìn)行了細(xì)胞實驗驗證,缺乏臨床試驗和動物實驗驗證,因此后續(xù)還需臨床試驗和動物實驗來進(jìn)一步驗證。第二,因為ICC自身的發(fā)生機(jī)制具有異質(zhì)性,而研究樣本數(shù)量是有限的,可能要依賴單細(xì)胞水平的下一代測序技術(shù)迅速發(fā)展來解決這一難題[26-27]。第三,由于ICC疾病在發(fā)生發(fā)展過程中受到多種因素影響[28-30],只通過轉(zhuǎn)錄組層面來看的話,具有一定的片面性,本研究尚未把代謝組、基因組、蛋白質(zhì)組等多組學(xué)之間的數(shù)據(jù)信息進(jìn)行結(jié)合分析,多組學(xué)的數(shù)據(jù)信息是否有相關(guān)性還需進(jìn)一步探討。
綜上所述,本文通過生物信息學(xué)方法篩選出ICC 中3個關(guān)鍵調(diào)控基因PLK1、HAO2、FCN2,這3個基因?qū)CC 具有很好的診斷和預(yù)測能力,有可能成為ICC 潛在的治療靶點(diǎn)。本研究篩選出的3個關(guān)鍵調(diào)控基因在腫瘤中均有報道,研究結(jié)果具有較高的可信度,可以為深入理解ICC 的分子機(jī)制提供新的觀點(diǎn)和思路。
利益沖突:所有作者均聲明不存在利益沖突。