王 純, 葉明亮, 陳志航, 羅 杰, 洪瑩暉, 趙 秋, 常 瑩
1 武漢大學(xué)中南醫(yī)院 消化內(nèi)科, 武漢 430071; 2 廣西醫(yī)科大學(xué)第一附屬醫(yī)院 結(jié)直腸肛門外科, 南寧 530021
肝細胞癌是全球第六大常見的實體癌和第二大致死性惡性腫瘤[1]。根據(jù)2014年世界衛(wèi)生組織發(fā)布的世界癌癥報告[2],中國肝癌新發(fā)病例占全球新發(fā)病例的一半,死亡總數(shù)占全球一半以上。目前治療肝癌的方法以手術(shù)治療為主和(或)結(jié)合介入治療、局部治療以及放化療為輔的多學(xué)科治療,但由于肝癌患者被診斷時往往已是肝癌晚期,腫瘤解剖位置不佳、腫瘤過大、原發(fā)腫瘤數(shù)量多和肝外轉(zhuǎn)移使其錯過了最佳治療的時機,預(yù)后往往很差。因此,探索肝癌發(fā)生機制及新的治療策略極為重要。
假基因是基因家族在進化過程中形成的無功能的殘留物[3],但近年來研究發(fā)現(xiàn),其廣泛參與了細胞的生物學(xué)過程。部分假基因可以轉(zhuǎn)錄非編碼RNA,這些長度超過200 nt的非編碼RNA為長鏈非編碼RNA(long noncoding RNAs,lncRNA)的一類。近年來許多研究[4-6]表明,lncRNA可以作為細胞核和細胞質(zhì)中的基因表達調(diào)節(jié)劑,主要在表觀遺傳學(xué)調(diào)控、轉(zhuǎn)錄調(diào)控及轉(zhuǎn)錄后調(diào)控3個層面調(diào)控基因表達。這些特征使得lncRNA作為原癌基因或抑癌基因的角色參與了腫瘤的發(fā)生發(fā)展,其在腫瘤細胞中的異常表達與腫瘤的發(fā)生發(fā)展、腫瘤細胞的耐藥性、腫瘤的診斷和預(yù)后等也有著密切的聯(lián)系[7-9]。盡管現(xiàn)在已經(jīng)對大量的lncRNA進行了測序和注釋,但其中只有一小部分lncRNA的功能得到了闡述,它們大多數(shù)發(fā)揮作用的潛在分子機制仍待確認。
DUXAP8(double homeobox A pseudogene 8)為假基因來源的lncRNA,已有研究表明DUXAP8在膀胱癌[10]、非小細胞肺癌[11]、胰腺癌[12]和腎癌[13]等癌癥中高表達,沉默DUXAP8后,腫瘤細胞的增殖、侵襲能力受到抑制,同時也誘導(dǎo)了腫瘤細胞發(fā)生凋亡,提示DUXAP8可能參與了這些腫瘤的發(fā)生發(fā)展過程。但是關(guān)于DUXAP8在肝癌中的研究尚無報道,因此探究DUXAP8參與肝癌發(fā)生發(fā)展的作用機制具有重要意義。
1.1 數(shù)據(jù)資料收集 從TCGA數(shù)據(jù)庫(https://portal.gdc.cancer.gov/)中下載截至2019年6月的肝癌組織和癌旁組織RNA-seq數(shù)據(jù)以及肝癌患者臨床數(shù)據(jù)。
1.2 數(shù)據(jù)分析
1.2.1 DUXAP8表達譜數(shù)據(jù)分析 非配對樣品(375個肝癌組織、50個癌旁組織)和50對配對樣品分別進行了Wilcoxon秩和檢驗和Wilcoxon符號秩和檢驗。
1.2.2 DUXAP8與臨床病理參數(shù)的相關(guān)性研究 表達譜數(shù)據(jù)和臨床數(shù)據(jù)配對后,對患者年齡、性別、病理分期、臨床分期、T分期與DUXAP8表達量之間的關(guān)系進行Wilcoxon秩和檢驗,以評估臨床病理特征與DUXAP8表達之間的關(guān)系。
1.2.3 DUXAP8或Hub基因與預(yù)后的相關(guān)性研究 臨床數(shù)據(jù)(n=377)刪除1例無隨訪時間數(shù)據(jù),刪除5例生存但隨訪時間為0的數(shù)據(jù),得到371例生存數(shù)據(jù)。表達譜數(shù)據(jù)(n=374)剔除重復(fù)項目3項后為371例。由于某些樣本未測表達量,有些患者生存數(shù)據(jù)刪失,最終匹配的數(shù)據(jù)為365例。根據(jù)表達譜數(shù)據(jù),對365例樣本的DUXAP8或Hub基因的表達進行由高到低的排序,前50%的樣本作為高表達組,后50%的樣本作為低表達組樣本;根據(jù)指定基因的表達水平分成高表達組和低表達組,利用Kaplan-Meier方法分析兩組患者10年生存率的差異,組間比較采用log-rank檢驗。
1.2.4 總體生存率的單變量和多變量分析 對365例數(shù)據(jù)使用Cox回歸分析患者的總體生存率和臨床病理特征之間的相關(guān)性以及變量選擇后的多變量生存模型。
1.2.5 DUXAP8相關(guān)基因及其功能分析 利用表達譜數(shù)據(jù)篩選DUXAP8的相關(guān)基因[Pearson相關(guān)法: 相關(guān)系數(shù)(r)≥0.3且P<0.05]。利用基因本體論(Gene Ontology,GO)、京都基因百科全書和基因組(Kyoto Encyclopedia of Genes, and Genomes,KEGG)對相關(guān)基因分別進行功能和通路分析。
1.2.6 DUXAP8相關(guān)靶基因的Hub基因的篩選 取DUXAP8相關(guān)靶基因r>0.4的基因,利用在線數(shù)據(jù)庫STRING(https://string-db.org/)做蛋白質(zhì)相互作用分析,然后將蛋白質(zhì)相互作用網(wǎng)絡(luò)數(shù)據(jù)導(dǎo)入Cytoscape(https://cytoscape.org/),根據(jù)degree算法計算排名前十的關(guān)鍵基因即Hub基因。
1.2.7 數(shù)據(jù)分析 使用R語言(v.3.5.1)分析和處理數(shù)據(jù)并生成統(tǒng)計分析表格和圖片。以P<0.05 為差異有統(tǒng)計學(xué)意義。
2.1 TCGA下載的患者臨床特征 從TCGA下載的376例肝癌患者的臨床特征見表1。
表1 TCGA數(shù)據(jù)庫中肝癌患者的臨床特征(n=376)
2.2 TCGA下載的RNA-seq數(shù)據(jù)篩選lncRNA 在TCGA下載的RNA-seq數(shù)據(jù)中,從531個差異表達的lncRNA中按照癌與癌旁差異表達符合logFc>2,P<0.01且同時滿足風險比(HR)>1,P<0.01的條件,篩選出了38個符合該條件的lncRNA(圖1)。在排名前三的lncRNA(DDX11-AS1、MAFG-DT、DUXAP8)中,已有文獻報道DDX11-AS1通過與EZH2和DNMT1相互作用在肝癌中表觀遺傳抑制LATS2,從而促進肝癌細胞的增殖、周期、遷移和侵襲等生物學(xué)表型[14];DDX11-AS1的表達水平也與肝癌患者的預(yù)后相關(guān)[15]。TCGA數(shù)據(jù)分析以及肝癌細胞定量檢測表明MAFG-DT在肝癌組織和肝癌細胞中均中高表達,并且通過靶向抑制miR-6852促進肝癌細胞侵襲表型[16]。而目前在肝癌中關(guān)于DUXAP8的研究甚少,故選擇DUXAP8進行進一步的分析。
注:a,篩選lncRNA,A為差異表達符合logFc>2,P<0.01的lncRNA,B為符合HR>1,P<0.01的lncRNA,C為同時符合以上兩種條件的lncRNA;b,符合條件的lncRNA。
圖1肝癌組織中差異表達的lncRNA
2.3 DUXAP8與臨床病理參數(shù)的關(guān)系 分析非配對樣品(圖2a)及配對樣品(圖2b)中DUXAP8的表達水平,癌旁組織和肝癌組織之間存在顯著差異(P值均<0.001),肝癌組織中DUXAP8表達明顯升高。將表達譜數(shù)據(jù)與臨床數(shù)據(jù)配對后分析各臨床病理學(xué)變量與DUXAP8表達量之間的關(guān)系,發(fā)現(xiàn)DUXAP8表達水平在不同性別、病理分期、臨床分期的患者間無明顯差異(P值均>0.05),但不同年齡、T分期的患者DUXAP8表達差異顯著(P值均<0.05),年齡超過60歲或T分期等級為T3或T4,DUXAP8表達量較高(圖3a~e)。
注:a,非配對樣品;b,配對樣品。
2.4 DUXAP8表達與預(yù)后分析 Kaplan-Meier生存曲線顯示,DUXAP8高表達組患者的總體生存率低于低表達組患者(P<0.001)(圖3f)。這提示DUXAP8是肝癌患者預(yù)后不良的相關(guān)因素。
2.5 單因素和多因素回歸分析預(yù)后影響因素 單因素分析顯示,臨床分期、T分期、DUXAP8表達量與患者總生存期有關(guān)(P值均<0.001)。多因素Cox回歸分析結(jié)果顯示,臨床分期晚[HR=1.648,95%可信區(qū)間(95%CI):1.330~2.709,P<0.001]、高DUXAP8表達(HR=1.849,95%CI:1.262~2.713,P<0.01)仍是預(yù)后差的獨立危險因素(表2)。
表2 肝癌患者預(yù)后單因素與多因素回歸分析
注:a~e,性別、年齡、組織學(xué)分級、臨床分期和T分期與DUXAP8表達量的關(guān)系;f,不同DUXAP8表達水平的肝癌患者生存曲線。
圖3DUXAP8與臨床病理指標及預(yù)后的關(guān)系
2.6 DUXAP8的相關(guān)基因及其功能分析 DUXAP8高表達樣品中,F(xiàn)AM133A、COX7B2、MKRN3、MAGEA1、CARD18和DCAF4L2等(僅顯示前6位)多個腫瘤相關(guān)基因高表達,而CYB5D2、KBTBD11、IGF2、HEBP1、TTC19和ACADS等(僅顯示前6位)低表達(圖4)。與DUXAP8相關(guān)基因最富集的GO項目是“微管蛋白結(jié)合”(GO:0015631;本體論:分子功能; Bonferroni校正P<0.001)和“作用于DNA的催化活性”(GO:0140097;本體論:分子功能; Bonferroni 校正P<0.001)。KEGG通路分析顯示341個重疊基因之間有149個基因有顯著的富集通路,其中最富集的是“細胞周期”(Bonferroni 校正P<0.001)相關(guān)通路(表3)。這些分子功能和生物通路都提示DUXAP8可能與維持腫瘤細胞的增殖和細胞周期等相關(guān)。
2.7 DUXAP8相關(guān)靶基因的Hub基因及其臨床預(yù)后分析
通過對DUXAP8相關(guān)靶基因進行篩選,發(fā)現(xiàn)TOP2A、KIF2C、TTK、PLK1、CDCA8、CDC20、NCAPG、BUB1B、BUB1和CCNA2為DUXAP8相關(guān)靶基因的Hub基因(圖5a)。
表3 肝癌中DUXAP8相關(guān)基因的GO和KEGG通路富集分析
Kaplan-Meier法發(fā)現(xiàn),TOP2A(P<0.01)、KIF2C(P<0.01)、TTK(P<0.01)、PLK1(P<0.01)、CDCA8(P<0.01)、CDC20(P<0.01)、NCAPG(P<0.05)、BUB1B(P<0.01)、BUB1(P<0.01)或CCNA2(P<0.01)高表達組患者的預(yù)后均明顯差于低表達組患者(圖5b~k)。這一結(jié)果提示這些Hub基因均是肝癌患者預(yù)后不良的相關(guān)因素,其高表達與患者生存期縮短顯著相關(guān),DUXAP8可能通過影響這些Hub基因參與肝癌的發(fā)生發(fā)展,影響患者的預(yù)后。
圖4 DUXAP8相關(guān)基因
注:a,Hub基因的蛋白互作網(wǎng)絡(luò)圖,紅色、橙色和黃色圓內(nèi)的基因均為Hub基因,藍色為與Hub基因有聯(lián)系的其他基因;
長期以來,假基因被認為是廢物基因組的非功能性遺物。而近十年來,有不少研究證實了假基因在腫瘤生物學(xué)功能方面扮演了重要的角色。假基因作為促癌基因或抑癌基因參與了腫瘤的發(fā)生發(fā)展,如OCT4-pg4作為OCT4的假基因,可作為天然海綿作用保護OCT4轉(zhuǎn)錄物免受miR-145的抑制,還可以促進肝癌細胞的生長和成瘤性,在肝癌中發(fā)揮致癌作用[17];PTENpg1as是腫瘤抑制基因PTEN的假基因,PTENpg1asRNAα定位于PTEN的啟動子并通過募集DNMT3A和EZH2調(diào)節(jié)PTEN轉(zhuǎn)錄,而PTENpg1asRNAβ可作為miRNA海綿影響PTEN的轉(zhuǎn)錄后調(diào)節(jié),PTENpg1as從而通過以上兩種途徑抑制腫瘤的發(fā)生[18]。本實驗所涉及的假基因來源的DUXAP8定位于22q11.1,長2107 bp,是DUXA同源異型盒基因家族的成員。因為DUXAP8、DUXAP9和DUXAP10這三個基因座具有99%的核苷酸同一性,故DUXAP8可能是通過整合后復(fù)制或來自DUXAP9或DUXAP10的轉(zhuǎn)錄本逆轉(zhuǎn)錄而產(chǎn)生的[19]。在非小細胞肺癌中,DUXAP8通過與組蛋白去甲基化酶LSD1和組蛋白甲基轉(zhuǎn)移酶EZH2結(jié)合抑制腫瘤抑制因子EGR1和RHOB轉(zhuǎn)錄,從而促進細胞的增殖、遷移和侵襲[11]。DUXAP8在膀胱癌中高表達,沉默DUXAP8后膀胱癌細胞系(UMUC3和SW780)的細胞增殖、單克隆形成、侵襲能力受到抑制,并且誘導(dǎo)細胞發(fā)生凋亡[10]。在胰腺癌組織和胰腺癌細胞系(AsPC-1、BxPC-3和PANC-1)中DUXAP8表達明顯增加,DUXAP8通過將EZH2和LSD1募集至CDKN1A和KLF2啟動子區(qū)域來抑制CDKN1A和KLF2表達,抑制了細胞增殖和侵襲能力,并誘導(dǎo)細胞發(fā)生凋亡;在裸鼠模型中,沉默DUXAP8可抑制腫瘤的生長[12]。
本研究通過大數(shù)據(jù)發(fā)現(xiàn)DUXAP8在癌旁組織和肝癌組織中表達具有顯著差異,且在肝癌組織中表達明顯增加,高DUXAP8表達與患者預(yù)后差相關(guān),提示DUXAP8可能作為促癌基因參與了肝癌發(fā)生?;颊吣挲g越大或T分期等級越高DUXAP8表達量越高,提示了患者的年齡和腫瘤的原發(fā)病灶與DUXAP8有關(guān)。通過GO和KEGG通路富集分析,發(fā)現(xiàn)DUXAP8的相關(guān)基因主要參與細胞周期,范可尼貧血途徑,纈氨酸、亮氨酸和異亮氨酸降解,DNA復(fù)制以及同源重組等生物過程,提示DUXAP8可能通過影響細胞增殖和細胞周期等生物過程參與了肝癌的發(fā)生發(fā)展。通過Kaplan-Meier分析發(fā)現(xiàn),高表達的Hub基因與患者生存期縮短顯著相關(guān)。美國國家生物技術(shù)信息中心(https://www.ncbi.nlm.nih.gov/gene/)對DUXAP8相關(guān)基因的Hub基因注釋顯示,這些基因主要與細胞有絲分裂及細胞周期等生物學(xué)過程相關(guān)。如DNA拓撲異構(gòu)酶IIA(DNA topoisomerase II alpha ,TOP2A)是細胞內(nèi)重要的核酶,在細胞DNA復(fù)制、轉(zhuǎn)錄和有絲分裂等生物過程中發(fā)揮重要作用,編碼這種酶的基因是幾種抗癌藥物的靶標[20-21]。有研究[22-23]表明在肝癌組織中TOP2A表達明顯高于癌旁組織,這一結(jié)果與大樣本數(shù)據(jù)庫的結(jié)果一致,且TOP2A的高表達與微血管侵犯、高的組織學(xué)分級、肝癌發(fā)生時的年齡以及生存期縮短密切相關(guān)。這些結(jié)果提示了DUXAP8可能通過Hub基因影響細胞的增殖、周期以及耐藥性等過程,從而參與肝癌的發(fā)生發(fā)展,影響患者預(yù)后。由于以上數(shù)據(jù)都是基于TCGA數(shù)據(jù)庫中的信息,未來尚需要進一步的實驗來驗證這些結(jié)果。
綜上所述,高表達DUXAP8可能通過影響細胞增殖、周期等過程促進肝癌的發(fā)生發(fā)展,并對肝癌患者預(yù)后產(chǎn)生不利影響,故有望成為肝癌患者的診斷、預(yù)后評價及基因治療的新指標。