李偉婷 李永文 張洪兵 李穎 袁茵 宮顥 韋森 劉紅雨 陳軍
惡性腫瘤已成為世界性的公共衛(wèi)生問題,其中,肺癌的發(fā)病率呈現(xiàn)逐年上升的趨勢,其發(fā)病率在男性惡性腫瘤患者中居第一位,女性惡性腫瘤患者中居第二位,而其死亡率不論男女均位居惡性腫瘤的第一位[1]。在我國,肺癌已成為最常見的惡性腫瘤,每年新發(fā)病例大約70多萬,而死亡病例約60余萬。肺癌從組織學(xué)上主要分為小細(xì)胞肺癌(small cell lung cancer,SCLC)(占15%)和非小細(xì)胞肺癌(non-small cell lung cancer, NSCLC)(占85%)。其中NSCLC又主要分為腺癌(adenocarcinoma)、鱗癌(squamous cell carcinoma,SCC),和大細(xì)胞癌(large cell lung cancer, LCLC)。 全世界每年死于肺鱗癌的患者高達(dá)40萬人[2]。近年來,肺癌的治療研究也在不斷進(jìn)步,例如表皮生長因子受體酪氨酸激酶抑制劑(epidermal growth factor receptor tyrosine kinase inhibitors, EGFR-TKIs),人間變性淋巴瘤激酶(anaplastic lymphoma kinase, ALK)等為代表的分子靶向藥為治療帶來了新的進(jìn)展[3]?;颊叩纳鏁r(shí)間和生存質(zhì)量得到了較大的提高。有研究[4]指出,肺鱗癌發(fā)病率低但侵襲性相對肺腺癌高,大部分肺鱗癌在診斷時(shí)已處于晚期,由于肺鱗癌在的敏感突變率低于肺腺癌,EGFRTKI緩解率通常也只有30%,明顯低于肺腺癌[5],分子靶向治療藥物并不適用于大多數(shù)的肺鱗癌患者,所以晚期肺鱗癌患者的標(biāo)準(zhǔn)治療仍然是細(xì)胞毒性化療,肺鱗癌與肺腺癌具有某些相似的臨床特征,相比之下,鱗癌患者在治療上的進(jìn)展有限[6]。
肺鱗癌是一類起源于支氣管上皮、病理顯示有角化和(或)細(xì)胞間橋存在的惡性上皮腫瘤,約占NSCLC的40%。肺鱗癌多發(fā)于吸煙者,有研究表明吸煙患肺癌的危險(xiǎn)性是不吸煙者的4.97倍[7]。肺鱗癌多發(fā)生在段支氣管及次段大支氣管,故多為中央型[8],中央型具有向管腔內(nèi)生長、癌組織易變性、壞死形成空洞或發(fā)生出血的特點(diǎn)。近年來周圍型肺鱗癌發(fā)病率在上升,約占肺鱗癌總數(shù)的50%。周圍型肺鱗癌常見血管、胸膜侵犯,較少淋巴結(jié)轉(zhuǎn)移,肺泡充盈型生長方式的周圍型鱗癌預(yù)后較好。中央型和周圍型肺鱗癌組織學(xué)上并無差別[9]。有文獻(xiàn)[10]報(bào)道肺鱗癌中央型和周圍型不僅在腫瘤大小和淋巴結(jié)轉(zhuǎn)移上存在差異,其生物學(xué)特性如不同腫瘤的侵襲程度亦不同。因此,在分析周圍型與中央型肺鱗癌患者臨床特征的基礎(chǔ)上,進(jìn)一步分析其分子生物學(xué)特征的差異,必將為肺鱗癌患者的精準(zhǔn)診治奠定基礎(chǔ)。本研究擬通過癌癥基因組圖譜(The Cancer Genome Atlas, TCGA)公共數(shù)據(jù)集,在分析研究中央型肺鱗癌及周圍型肺鱗癌的臨床特征差異的基礎(chǔ)上,進(jìn)一步分析其在基因分子水平的差異,為進(jìn)一步明確中央型和周圍型肺鱗癌在發(fā)生發(fā)展中的作用機(jī)制不同和可能的靶向治療提供線索和思路。
1.1 數(shù)據(jù)資料收集 利用TCGA簡易下載工具包從TCGA數(shù)據(jù)庫(https://tcga-data.nci.nih.gov/tega/)下載肺鱗癌數(shù)據(jù)集的臨床資料及RNASEqV2信息。
1.2 數(shù)據(jù)集篩選和臨床參數(shù)及基因信息相關(guān)性研究 根據(jù)表達(dá)譜數(shù)據(jù),對樣本的中央型肺鱗癌及周圍型肺鱗癌進(jìn)行臨床信息整理和對應(yīng)基因信息的篩選,僅保留TCGA數(shù)據(jù)集中包含臨床參數(shù)和對應(yīng)的基因信息的病例。
1.3 基因差異分析 采用R軟件語言的“cluster Profiler”,“pathview”,“pheatmap”,“vegan”,“volcano”的程序包輔助編程對RNA-sequence查找差異基因,并對差異基因(differential gene, DEFs)進(jìn)行KEGG富集分析。GCBI網(wǎng)站(www.gcbi.com.cn)進(jìn)行基因間相互作用分析。
1.4 統(tǒng)計(jì)學(xué)方法 使用 SPSS 21.0軟件進(jìn)行統(tǒng)計(jì)學(xué)分析。臨床信息相關(guān)性分析,組間比較采用χ2檢驗(yàn)及Fisher確切概率法,采用乘積極限法(Kaplan-Meier)繪制生存曲線、對數(shù)秩檢驗(yàn)(Log-rank)比較不同樣本的生存曲線。P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
2.1 中央型和周圍型肺鱗癌患者的臨床病理特征分析 本研究從TCGA數(shù)據(jù)集下載、整理、分析了240例肺鱗癌患者的臨床數(shù)據(jù)和其對應(yīng)的基因信息,其中,男性181例(75.4%, 181/240),女性59例(24.6%, 59/240),平均年齡(66.528±8.828)歲;存在吸煙史的225例(95.3%),無吸煙史的11例(4.7%);中央型147例(61.25%),周圍型93例(38.75%)。如表1所示,240例中央型和周圍型肺鱗癌患者的臨床理特征相關(guān)性分析結(jié)果顯示,中央型和周圍型肺鱗癌患者在性別、年齡、腫瘤大小、 有無遠(yuǎn)處轉(zhuǎn)移、TNM分期、EGFR突變方面均無統(tǒng)計(jì)學(xué)差異,而在淋巴結(jié)轉(zhuǎn)移發(fā)生率上,中央型較周圍型肺鱗癌患者更容易發(fā)生淋巴結(jié)轉(zhuǎn)移(中央型:67/145,46.2%,周圍型:26/90,28.9%)(P=0.019)。進(jìn)一步采用Kaplan-MeierPlotter方法分析中央型和周圍型肺鱗癌患者的生存差異,如圖1所示,二者在生存時(shí)間上未見明顯的統(tǒng)計(jì)學(xué)不同(Log-rank檢驗(yàn),P=0.298,圖1)。
2.2 中央型和周圍型肺鱗癌患者的基因表達(dá)水平的分析本研究運(yùn)用R語言“pheatmap”、“vegan”、“volcano”的程序包在中央型和周圍型肺鱗癌兩組患者中篩選了差異表達(dá)基因,結(jié)果顯示二者存在1,031個(gè)差異表達(dá)基因,其中,周圍型鱗癌相對于中央型鱗癌有629個(gè)基因表達(dá)水平上調(diào),402個(gè)基因表達(dá)水平下調(diào)(圖2A-圖2B)。
2.3 中央型和周圍型肺鱗癌差異基因的相關(guān)KEGG富集信號通路分析 為了更進(jìn)一步了解造成二者基因差異的相關(guān)生物進(jìn)程,本研究采用R軟件的“cluster Profiler”、“pathview”程序包對中央型和周圍型肺鱗癌的1,031個(gè)差異表達(dá)基因信息進(jìn)行KEGG pathway富集分析,結(jié)果顯示差異基因主要富集在6個(gè)信號通路中:刺激神經(jīng)組織的配體-受體相互作用(neuroactive ligand-receptor interaction),青少年糖尿病的成年發(fā)?。╩aturity onset diabetes of the young),脂肪消化與吸收(fat digestion and absorption),細(xì)胞色素P450對異種生物的代謝作用(metabolism of xenobiotics by cytochrome P450),膽固醇代謝(cholesterol metabolism),唾液分泌(salivary secretion)(圖3)。其中,差異表達(dá)基因主要富集在刺激神經(jīng)組織的配體-受體相互作用(neuroactive ligandreceptor interaction)信號通路上,而另外5個(gè)信號通路主要與代謝(糖、脂肪)有關(guān)。因此,KEGG pathway(Kyoto Encyclopedia of Genes and Genomes)富集的結(jié)果顯示,周圍型和中央型肺鱗癌的功能差異可能主要集中在神經(jīng)分泌及代謝的差異上。
圖1 中央型和周圍型肺鱗癌的生存曲線比較Fig 1 Comparison of survival curves between central and peripheral squamous cell carcinoma
2.4 中央型及周圍型肺鱗癌差異基因的相互作用網(wǎng)絡(luò)分析 進(jìn)一步將上述篩選出的629個(gè)表達(dá)水平上調(diào)基因和402個(gè)下調(diào)基因,錄入GCBI網(wǎng)站(www.gcbi.com.cn),分析其所編碼的蛋白之間的相互作用,繪制出了差異基因的相互作用網(wǎng)絡(luò)圖(圖4)。結(jié)果顯示,即肝細(xì)胞核因子1同源體A(hepatocyte nuclear factor 1 homeobox A,HNF1A)和人血清白蛋白(Albumin, ALB)在其中影響較為廣泛,位于網(wǎng)絡(luò)中心的重要節(jié)點(diǎn)。KEGG pathway(Kyoto Encyclopedia of Genes and Genomes)分析已經(jīng)顯示差異基因主要富集在刺激神經(jīng)組織的配體-受體相互作用通路上,而HNF1A和ALB基因也主要富集在此通路上,提示HNF1A和ALB基因可能通過激神經(jīng)組織的配體-受體相互作用通路參與肺鱗癌中央型和周圍型的差異調(diào)控。HNF1A基因是糖尿病發(fā)生的重要基因之一,并且參與脂類代謝。ALB基因編碼的蛋白是人類血液中最豐富的蛋白質(zhì)。這種蛋白質(zhì)在調(diào)節(jié)血漿膠體滲透壓方面起作用,并且作為包括激素、脂肪酸和代謝物以及外源藥物的廣泛內(nèi)源分子的載體蛋白。差異基因相關(guān)作用網(wǎng)絡(luò)中還顯示胞色素P450 (cytochrome P450)家族中A亞家族中的眾多家族成員(如CYP3A4,CYP2B6;Cytochrome P450 2B6,CYP2A6 Cytochrome P450 2A6,CYP2A13;Cytochrome P450 2A13),以及載脂蛋白A1(apolipoprotein,APOA1)基因的多個(gè)同源體(APOA1、AP2、APOA3、APOA4等)也處于該相互作用網(wǎng)絡(luò)的關(guān)鍵位置,與多個(gè)基因存在相互作用的關(guān)系。細(xì)胞色素P450(cytochromeP450或CYP450,簡稱CYP450)是一類主要存在于肝臟、腸道中的單加氧酶,主要參與內(nèi)源性物質(zhì)和包括藥物、環(huán)境化合物在內(nèi)的外源性物質(zhì)的代謝。APOA1基因編碼載脂蛋白A1,是血漿高密度脂蛋白(high density lipoprotein, HDL)的主要蛋白成分,是脂代謝中重要的參與者。由此可見,差異基因相關(guān)作用網(wǎng)絡(luò)圖進(jìn)一步驗(yàn)證了,代謝相關(guān)信號通路在肺鱗癌周圍型和中央型的功能差異中扮演著重要的角色。
表1 中央型和周圍型肺鱗癌患者的相關(guān)臨床資料分析Tab 1 Analysis of clinical data of patients with central and peripheral lung squamous cell carcinoma
圖2 R程序分析出中央型和周圍型肺鱗癌之間存在1,031個(gè)有意義的差異基因,周圍型鱗癌相對于中央型鱗癌有629個(gè)基因表達(dá)水平上調(diào),402個(gè)基因表達(dá)水平下調(diào)。Fig 2 The R program analyzed 1,031 significant differential genes between central and peripheral lung squamous cell carcinoma.There are with 629 genes up-regulated and 402 genes were down-regulated (Peripheral vs central).
圖3 R程序針對周圍型和中央型肺鱗癌的1,031個(gè)差異基因分析其KEGG pathway富集(即信號通路富集)Fig 3 R program for KEGG enrichment (Signal pathway enrichment) of 1,031 differential genes in peripheral and central lung squamous cell carcinoma
圖4 GCBI網(wǎng)站對分析了1,031個(gè)差異基因編碼的蛋白之間的相互作用Fig 4 GCBI website analyzed the interaction between proteins encoded by 1,031 differential genes
肺癌是我國發(fā)病率、死亡率最高的惡性腫瘤[1]。有研究[1,11]顯示,僅在2017年城市居民肺癌患者高達(dá)222,500人,而因肺癌死亡的人也高達(dá)155,870人。 吸煙、遺傳、環(huán)境污染、職業(yè)暴露、飲食等多種因素不同程度影響著肺癌的發(fā)生發(fā)展[9]。目前,治療肺癌的方法有手術(shù)、化療、放療、分子靶向治療、介入治療和其他治療(免疫治療、中醫(yī)藥治療、光動力學(xué)治療、基因治療、支持治療)等[12]。而針對肺鱗癌患者主要采取手術(shù)治療的方式[13],而且中央型肺鱗癌的全肺切除率高于周圍型肺鱗癌[14]。肺鱗癌是一類起源于支氣管上皮、病理顯示角化和(或)細(xì)胞間橋的惡性上皮瘤,多為中央型。雖然周圍型肺鱗癌與中央型肺鱗癌在臨床表現(xiàn)及病理組織學(xué)特點(diǎn)存在一定的差異,但其分子機(jī)制是否存在差異尚不明確。鱗癌與腺癌的分子生物學(xué)特性存在明顯的差異,如有研究報(bào)道在肺鱗癌中,并未發(fā)現(xiàn)KRAS基因突變與EGFR基因突變有相關(guān)性[15,16],這點(diǎn)與腺癌有明顯不同,不過并不排除在肺鱗癌中KRAS和EGFR突變較低的緣故。肺鱗癌的發(fā)生與吸煙有強(qiáng)相關(guān)性[17],當(dāng)然也離不開多種生物遺傳事件的作用,本文主要探討了中央型和周圍型鱗癌的臨床特征以及基因分子水平的差異。首先在中央型和周圍型肺鱗癌患者的臨床理特征相關(guān)性分析中我們發(fā)現(xiàn)中央型肺鱗癌較周圍型更容易發(fā)生淋巴結(jié)的轉(zhuǎn)移,這與文獻(xiàn)報(bào)道的肺鱗癌中央型和周圍型淋巴結(jié)轉(zhuǎn)移上存在差異相一致,但在該研究中,與文獻(xiàn)報(bào)道不同的是我們并沒有發(fā)現(xiàn)二者在腫瘤大小上存在一定的差異[10],但由于數(shù)據(jù)來源的不同,其原因是很難分析的。
在分子生物學(xué)特征的分析中,我們基因集富集分析(gene set enrichment analysis, GSEA)從全局水平分析不同表型的基因表達(dá)變化,發(fā)現(xiàn)了差異基因主要富集在6個(gè)信號通路中:刺激神經(jīng)組織的配體-受體相互作用,青少年糖尿病的成年發(fā)病,脂肪消化與吸收),細(xì)胞色素P450對異種生物的代謝作用,膽固醇代謝和唾液分泌,從而揭示二者的差異主要在生物體發(fā)育和分化的機(jī)制上。目前的相關(guān)研究報(bào)道較少,一項(xiàng)全基因組關(guān)聯(lián)研究顯示15號染色體15q25.1是肺癌的主要易感區(qū)域,其中表達(dá)數(shù)量定位點(diǎn)(expression quantitative trait loci, eQTL)的功能分析結(jié)果顯示,刺激神經(jīng)組織的配體-受體相互作用(neuroactive ligand-receptor interaction)與肺癌發(fā)表風(fēng)險(xiǎn)有關(guān),可能作為主要通路參與了肺癌的發(fā)生[18]。此外,亦有文獻(xiàn)報(bào)道脂肪組織和脂肪細(xì)胞分泌的信號分子和代謝物,尤其是在肥胖狀態(tài)下,直接或間接刺激抗凋亡作用被認(rèn)為是癌癥進(jìn)展的重要因素[19,20]。在糖的代謝方面,文獻(xiàn)報(bào)道與大多數(shù)體細(xì)胞不同,癌細(xì)胞消耗大量的葡萄糖,依靠有氧糖酵解產(chǎn)生ATP,Otto Warburg對這一現(xiàn)象進(jìn)行了描述,稱之為“瓦氏效應(yīng)”(Warburg effect)[21,22]。因此,我們有理由相信上文中提到的差異基因富集信號通路如青少年糖尿病的成年發(fā)?。╩aturity onset diabetes of the young)、脂肪消化與吸收(fat digestion and absorption)、細(xì)胞色素P450對異種生物的代謝作用(metabolism of xenobiotics by cytochrome P450)、膽固醇代謝(cholesterol metabolism)、唾液分泌(salivary secretion)參與了周圍型和中央型肺鱗癌表型差異的形成。
進(jìn)一步相互作用網(wǎng)絡(luò)分析顯示HNF1A、CYP3A4、ALB與APOA1位于該該差異基因作用網(wǎng)絡(luò)的關(guān)鍵位置。而HNF1A和ALB基因也主要富集在刺激神經(jīng)組織的配體-受體相互作用通路上,提示HNF1A和ALB(Albumin,人血清白蛋白)基因可能通過激神經(jīng)組織的配體-受體相互作用通路參與肺鱗癌中央型和周圍型的差異調(diào)控;CYP3A4與APOA1分別主要參與內(nèi)源性物質(zhì)和包括藥物、環(huán)境化合物在內(nèi)的外源性物質(zhì)的代謝和脂代謝,這進(jìn)一步證實(shí)了KEGG富集信號通路分析的結(jié)果。HNF1A是編碼肝細(xì)胞核因子1同源體A,這是一種在人類肝臟、胰腺、腎臟和腸道中表達(dá)的轉(zhuǎn)錄因子[23]。HNF1A是發(fā)育成熟胰腺中調(diào)控轉(zhuǎn)錄因子通路的重要成員[24],并且HNF1A參與糖尿病和一些肝病的發(fā)生。ALB基因主要編碼人血清白蛋白[25],是人類血液中最豐富的蛋白質(zhì)。人血清白蛋白在調(diào)節(jié)血漿膠體滲透壓方面起主要作用,ALB主要結(jié)合與水,陽離子(如Ca2+、Nat和Kt),脂肪酸,激素,膽紅素,甲狀腺素(T4)和藥物(包括巴比妥酸鹽)結(jié)合,是包括激素、脂肪酸和代謝物以及外源藥物的廣泛內(nèi)源分子的載體蛋白。文獻(xiàn)報(bào)道在NSCLC中,血清中CRP/Alb 可以作為肺癌患者化療總生存期的一個(gè)預(yù)后因素[26],而NSCLC術(shù)前白蛋白球與蛋白評分可以作為其預(yù)后的一個(gè)重要因素[27],而且C反應(yīng)蛋白與白蛋白(C-reactive protein/Albumin, CRP/ALB)的比值有可能是肺癌獨(dú)立于病理分型和臨床分期的一個(gè)預(yù)后指標(biāo)[28]。
細(xì)胞色素P450(cytochrome p450 family, CYP450)是位于線粒體膜或內(nèi)質(zhì)網(wǎng)上的一組混合功能氧化酶系統(tǒng)的末端氧化酶。它們在內(nèi)源性和外源性分子的代謝中起著至關(guān)重要的作用[29]。CYP450酶是所有器官中最重要的代謝酶家族。除了在大多數(shù)內(nèi)源性化合物和外來生物的失活中起作用外,它們還介導(dǎo)大多數(shù)致癌物質(zhì)氧化及代謝[30],也因?yàn)樗诩?xì)胞中參與多條代謝作用,也有人考慮結(jié)合此特性來參與心血管疾病或是癌癥的治療[31]。APOA1基因位于11號染色體11q23-q24,其編碼的蛋白質(zhì)參與多種生物功能,可被分離成一種穩(wěn)定因子(Prostaglandin I2, PGI2);HDL由APOA1編碼,參與機(jī)體多種代謝功能,已有研究表明APOA1在肺癌患者中呈現(xiàn)較低水平表達(dá)[32]。在NSCLC接受順鉑化療的患者中,APOA1的水平可以作為預(yù)測患者中生存期的預(yù)后因素[33]。在診斷方面,APOA1也有可能作為一個(gè)生物標(biāo)志物用于臨床診斷[34]。此外,在乳腺癌中,APOA1會增加乳腺癌的風(fēng)險(xiǎn),它的多態(tài)性(APOA1-75G/A和+83C/T)與乳腺癌的發(fā)病相關(guān)[35]。
總之,本研究采用現(xiàn)有的TCGA數(shù)據(jù)庫,對中央型和周圍型肺鱗癌的差異進(jìn)行了初步研究,發(fā)現(xiàn)二者不僅在淋巴結(jié)轉(zhuǎn)移發(fā)生率上存在臨床特征的差異,而且在基因表達(dá)水平亦有明顯的不同。其中,HNF1A、CYP3A4、ALB、APOA1位于差異基因相互作用網(wǎng)絡(luò)的關(guān)鍵位置,有可能參與調(diào)控二者的差異表型(phenotypic difference),為進(jìn)一步探討中央型和周圍型肺鱗癌的發(fā)病機(jī)制和個(gè)體化治療提供新的思路。