郭丹丹,楊梅,龍丹,徐麗,張陽春,張春林
(遵義醫(yī)科大學附屬醫(yī)院 耳鼻咽喉科,貴州 遵義 563000)
頭頸鱗狀細胞癌(鱗癌)是一種常見的惡性腫瘤,全球發(fā)病率排第六[1]。吸煙以及飲酒是公認的頭頸鱗癌的致癌危險因素[2]。近些年證實人乳頭狀瘤病毒(human papilloma virus,HPV)感染是頭頸鱗癌的獨立危險因素,流行病學研究發(fā)現(xiàn)HPV相關的頭頸鱗癌的發(fā)病率逐年升高[3]。與HPV(-)頭頸鱗癌相比,HPV(+)頭頸鱗癌具有淋巴結轉(zhuǎn)移早,分期較晚,但對放化療敏感,臨床預后良好的特點,其機制目前尚未完全明確,可能與HPV(+)頭頸鱗癌具有獨特的致癌及調(diào)控機制有關[4]。此外,臨床上尚無針對HPV(+)頭頸鱗癌特有的基因靶點治療。因此,本研究通過對HPV(+)及HPV(-)的頭頸鱗癌基因芯片組織進行差異分析,篩選出HPV相關頭頸鱗癌的特異性基因及相關通路,使用Cbioportal和癌癥基因組圖譜(the cancer genome atlas,TCGA)檢驗特異基因表達趨勢以及頭頸鱗癌生存預后的相關性為進一步的機制研究提供參考。
從GEO高通量基因芯片數(shù)據(jù)庫中下載芯片數(shù)據(jù)集,進行芯片篩選,目標芯片入選標準:①患者頭頸鱗癌標本,排除細胞株及動物;②入選芯片具有HPV檢測信息;③需為基因表達芯片,各探針具有歸一化的表達值;④需復核芯片質(zhì)量。本研究使用的芯片數(shù)據(jù)集,編號是GSE39366,GSE52088。
京都基因和基因組(kyoto encyclopedia of genes and genomes, KEGG)數(shù)據(jù)庫是一個可系統(tǒng)分析基因產(chǎn)物在細胞中的代謝途徑以及產(chǎn)物功能的數(shù)據(jù)庫,可用于系統(tǒng)分析基因組、生物通路、疾病、化學物質(zhì)等,通過DAVID 生物信息資源數(shù)據(jù)庫對差異基因進行信號通路分析和基因本體分析,并從生物學功能、細胞中的定位對基因產(chǎn)物進行標準化描述,對差異表達基因的生物學進程、細胞組成及分子功能進行基因本體分析,并對富集的信號通路(P<0.01)進行分析。
對兩個數(shù)據(jù)集的芯片分別進行數(shù)據(jù)下載以及差異基因篩選,利用在線工具GEO高通量基因芯片數(shù)據(jù)庫中2R分析各個芯片。以結合差異倍數(shù)進行綜合篩選,以矯正后的P<0.01且|log差異倍數(shù)|≥ 2為標準篩選差異表達基因,并將探針標準化為基因名稱,篩選出共同差異基因。
通過在線分析工具STRING 11.0,以及Cytoscape3.8.0軟件篩選關鍵基因。以蛋白節(jié)點存在關聯(lián)作用的蛋白個數(shù)為度值,通過網(wǎng)絡結構,根據(jù)關聯(lián)積分值,獲得整個網(wǎng)絡中可能形成的蛋白質(zhì)簇和關鍵節(jié)點蛋白,并在Cytoscape中進行可視化分析。最終篩選特異基因并對其進行分析。
TCGA數(shù)據(jù)庫以及表達趨勢驗證:通過UALCAN檢索頭頸鱗癌相關數(shù)據(jù),獲得來源于TCGA的正常組織44例,癌組織318例。進一步驗證特異基因在TCGA數(shù)據(jù)庫中HPV(+)頭頸鱗癌(n=80)和HPV(-)頭頸鱗癌(n=434)兩個亞組瘤體組織與正常組織間的表達差異。
GEO高通量基因芯片數(shù)據(jù)庫中篩選及芯片質(zhì)量分析,選定GSE39366、GSE52088兩個符合入選標準的芯片系列,對其Matrix文件所提供的患者相關信息進行分析,共納入390例患者,GSE39366共保留了138例樣本。基本信息見表1。檢索并獲得來源于TCGA的正常組織44例,癌組織318例?;颊呋拘畔⒁姳?。
通過DAVID 6.8生物信息資源數(shù)據(jù)庫對差異基因(表1)以及特異基因(表2)在KEGG數(shù)據(jù)庫中富集的信號通路進行分析,通路富集與基因本體分析的結果詳見圖1、2。細胞成分分析主要富集在細胞外區(qū)域,分子變化功能顯示與生長因子活性相關。
圖1 通過DAVID 生物信息資源數(shù)據(jù)庫對差異基因進行KEGG通路富集以及GO分析生物學進程、細胞組成及分子功能
表1 患者基本信息(GSE39366) (例)
表2 患者基本信息(TCGA-頭頸鱗癌) (例)
556個差異基因,從數(shù)據(jù)集GSE52088中篩選出305個差異基因,GSE39366中篩選出251個差異基因。進一步從中篩選出42個差異基因,數(shù)據(jù)集的重疊部分包含42個基因(圖3A),其中17個下調(diào)的基因和25個上調(diào)基因。
使用 STRING 11.0 對差異表達基因構建了蛋白互作用網(wǎng)絡圖(圖3B),從中共獲得17個關鍵基因。其中上調(diào)基因12個,下調(diào)基因5個。
通過 Cytoscape 軟件進行關鍵基因可視化分析(圖3C,P<0.01),從關鍵基因中篩選特異基因,共有4個基因被鑒定為度≥4的特異基因。該可視化分析圖具有29個節(jié)點和20個邊緣,可反映與節(jié)點相關聯(lián)的邊的條數(shù)關聯(lián)度(平均節(jié)點度:1.38,平均聚類系數(shù):0.383;P<0.01)各基因狀態(tài)如表3所示。
表3 篩選出的特異基因度值
圖2 通過DAVID生物信息資源數(shù)據(jù)庫對特異基因進行KEGG通路富集以及GO分析生物學進程、細胞組成及分子功能
圖3 使用STRING 11.0對差異表達基因構建了蛋白互作用網(wǎng)絡圖
通過UCSC癌癥瀏覽器構建特異基因的分層聚類,層次聚類顯示它們在頭頸部鱗癌樣本與非癌樣品中的表達差異(圖4、5)。根據(jù)cBioPortal的整體生存數(shù)據(jù)繪制Kaplan-Meier曲線。結果顯示IL-6、MMP1、CD44、CXCL1高表達組患者的總體生存率(overall survival rate,OS)、無病生存率(disease-free survival,DFS)較低(圖6)。其中,IL-6、CD44高表達組患者的OS、DFS與低表達組患者比較,差異具有統(tǒng)計學意義(P<0.01);MMP1以及CXCL1高表達組患者的OS、DFS與低表達組患者比較,差異無統(tǒng)計學意義(P>0.01)。
圖4 使用UCSC癌癥瀏覽器構建特異基因的分層聚類
圖5 IL-6
圖6 頭頸部鱗癌患者(n=318)中特異基因IL-6
近年來HPV相關的頭頸鱗癌的發(fā)病率升高,且呈年輕化趨勢[5],既往研究表明感染HPV是HPV(+)頭頸鱗癌致病的獨立危險因素[6],然而HPV(+)頭頸鱗癌的致癌及調(diào)控機制目前尚未完全明確。有學者認為[7]E6、E7蛋白在HPV增殖過程中起關鍵作用。E6能與細胞內(nèi)相關蛋白形成復合物,特異性結合P53使其降解,引起細胞無限增值。E7蛋白可結合視網(wǎng)膜母細胞瘤蛋白(Rb),導致細胞周期失控,因此檢測HPV-DNA是診斷HPV相關頭頸鱗癌的重要途徑。現(xiàn)有多種方法可用來診斷HPV(+)頭頸鱗癌,包括聚合酶鏈反應檢測HPV-DNA或RNA,原位雜交檢測HPV-DNA,免疫組化法檢測HPV的癌基因E6/E7或P16蛋白等,HPV檢測方法多種多樣,目前尚無統(tǒng)一、公認的方法。Hashmi Atif等研究表明[8]P16可作為HPV相關頭頸鱗癌診斷以及預后標記物。但P16蛋白的檢測大多采用免疫組化法,所需樣本量大,其靈敏度根據(jù)染色方法的選擇而異,僅能進行半定量分析。李雅冬等[9]采用基因芯片技術檢測頭頸部鱗癌中的HPV-DNA序列,進而定性定量分析基因序列及表達譜,篩選基因標記進而診斷頭頸鱗癌。然而國內(nèi)對于HPV(+)頭頸鱗癌基因標記物報道較少,HPV(+)頭頸鱗癌基因靶向藥物未見報道,因此本研究篩選出HPV(+)頭頸鱗癌特異基因具有重要的臨床以及社會價值。
既往研究已有利用生物信息學方法篩選HPV相關頭頸鱗癌關鍵基因[10],張軼雯等[11]學者通過生物信息學方法篩選出HPV(+)口咽癌特征基因以及這些基因參與的Wnt、PI3K-Akt信號通路,但并未闡述HPV相關頭頸鱗癌特征基因的研究方法,本研究通過篩選HPV(+)頭頸鱗癌特征基因以及這些基因參與的生物學過程和關鍵通路并篩選出HPV(+)頭頸鱗癌的特異性基因IL-6、CXCL1、MMP1、CD44。這些基因主要位于核周區(qū)域,主要參與細胞周期調(diào)控、NOD樣受體信號通路、TNF信號通路。已有研究表明NOD介導的信號通路可促進頭頸鱗癌的發(fā)展[12],腫瘤壞死因子(tumor necrosis factor, TNF)通路可誘導頭頸鱗癌細胞凋亡和細胞存活[13],本研究中基因本體分析表明IL-6主要參與細胞增殖的調(diào)節(jié)[14](G1/S期、G2/M有絲分裂周期),CD44主要參與基因表達的調(diào)控[15],MMP1主要參與蛋白磷酸化的負調(diào)控[16],提示這些基因可能參與調(diào)控HPV(+)頭頸鱗癌的發(fā)生發(fā)展過程。而特異基因富集于TNF信號通路途徑,NOD樣受體信號通路等,NOD1、NOD2通過激活核轉(zhuǎn)錄因子-κB(nuclear transcription factor-κB, NF-κB)信號通路誘導細胞產(chǎn)生促炎性因子和細胞因子,包括IL-6、IL-8、CXCL1、CXCL2等,TNF-α可通過激活NF-κB誘導MMPs基因的表達,調(diào)控細胞凋亡過程,因此,NOD樣受體信號通路、TNF信號通路作為此次研究的關鍵通路,可能與特異基因IL-6、CXCL1共同調(diào)控HPV相關頭頸鱗癌發(fā)生發(fā)展以及腫瘤侵襲過程。
Kumar等[17]研究表明頭頸鱗癌中IL-6的調(diào)節(jié)與HPV感染有關,但未闡明IL-6在HPV(+) 頭頸鱗癌發(fā)展及侵襲中的作用。Jian 等[18]研究發(fā)現(xiàn)頭頸鱗癌中IL-6高表達者預后不良,然而IL-6與HPV相關的頭頸鱗癌機制尚不明確。IL-6于口腔鱗狀細胞癌中的報道較多,IL-6家族成員中的OSM (oncostatin M,OSM)可促進HPV(+)口腔鱗狀細胞癌發(fā)生發(fā)展[18],本研究中IL-6在特異基因里度值與差異性表達程度均最高,提示IL-6可能對HPV(+)頭頸鱗癌的腫瘤進展起促進作用,然而其在不同亞組瘤體組織中的作用機制仍未確定。
此外,HPV(+)頭頸鱗癌患者對放化療敏感性性比HPV(-)頭頸鱗癌患者高,且本課題組前期研究已證實HPV(+)頭頸細胞株對放化療敏感性高于HPV(-)細胞株[19],但是導致這種敏感性增加的機制尚不清楚,可能與IL-6產(chǎn)生有關。HPV可促進腫瘤細胞分泌IL-6,從而增加敏感性[20]。已有證據(jù)表明IL-6介導的 JAK / STAT3途徑可促進細胞增殖及血管生成,淋巴結轉(zhuǎn)移,可能成為治療頭頸部鱗癌的潛在有用靶點[21],故IL-6有望成為HPV(+)頭頸鱗癌的靶點藥物。
既往研究表明MMP1與頭頸鱗癌的DFS顯著相關[22],且高表達組的預后顯著差于低表達組。但MMP1與HPV(+)頭頸鱗癌致病機制尚不清楚[23],已有研究報道MMPs作為乳腺癌[24]等惡性腫瘤靶向治療的合適靶點,MMP1是MMPs基因家族成員,提示MMP1可能成為治療HPV(+)頭頸鱗癌的潛在藥物靶點。同時,本研究結果表明CD44的表達與頭頸鱗癌的DFS呈負相關,但MMP1及CXCL1與腫瘤的預后無顯著相關性,這種差異可能與患者年齡、性別、職業(yè)暴露因素以及腫瘤的分期、分型、淋巴結轉(zhuǎn)移程度、腫瘤浸潤深度有關[25],已有學者揭示CD44可以作為頭頸鱗癌潛在分子標記物[26],其在喉癌浸潤轉(zhuǎn)移中有重要作用,CD44介導的信號通路可能為抑制HPV(+)頭頸鱗癌細胞中的順鉑耐藥性提供新的藥物靶點[27]。已有文獻報道CXCL1在口腔鱗癌基質(zhì)細胞中高表且與口腔鱗癌不良預后有關[28],故有望作為頭頸鱗癌診斷預后的標志,但與頭頸鱗癌發(fā)生發(fā)展相關機制尚不明確[29]。
綜上,本研究篩選的特異基因中,雖然IL-6、CXCL1、MMP1、CD44在頭頸鱗癌中已有報道,但在HPV相關頭頸鱗癌中的研究較少,IL-6、CD44有望成為治療HPV(+)頭頸鱗癌的關鍵靶點,而MMP1及CXCL1可能作為診斷及預后的標志物。本研究在GEO數(shù)據(jù)庫中篩選了與HPV狀態(tài)相關的兩個數(shù)據(jù)集,由于芯片系統(tǒng)檢測的局限性,cDNA間可能存在相同或相似序列,可出現(xiàn)交叉雜交影響分析結果,往往需要Northen印跡、RT-PCR等實驗在臨床樣本中驗證。然而,IL-6、CXCL1、MMP1、CD44與頭頸鱗癌及HPV的關系未見明確報道,但可作為潛在的生物學標志物進一步挖掘研究。