余 捷 王梓樺 楊世英 薛寒冰
上海交通大學(xué)醫(yī)學(xué)院附屬仁濟(jì)醫(yī)院消化內(nèi)科 上海市消化疾病研究所(200001)
背景:DNA甲基化作為表觀遺傳學(xué)修飾的重要組成部分,與結(jié)直腸癌等多種腫瘤的發(fā)生、發(fā)展密切相關(guān),但具體作用機(jī)制尚未完全明確。篩選特異性甲基化基因和構(gòu)建腫瘤的甲基化表達(dá)譜已成為當(dāng)前研究熱點(diǎn)。目的:應(yīng)用基因甲基化芯片技術(shù)初步篩選結(jié)直腸癌組織與癌旁正常黏膜組織間差異甲基化位點(diǎn),構(gòu)建特異性結(jié)直腸癌差異甲基化基因譜。方法:應(yīng)用甲基化450K芯片技術(shù)對(duì)6例結(jié)直腸癌及其癌旁組織進(jìn)行甲基化分析,共分析位點(diǎn) 431 467 個(gè),按P值篩選出異常甲基化位點(diǎn),按甲基化β值差值區(qū)分高甲基化位點(diǎn)和低甲基化位點(diǎn);對(duì)篩選出的差異甲基化位點(diǎn)進(jìn)一步行GO分析和KEGG分析,了解差異甲基化位點(diǎn)的功能。結(jié)果:共檢出結(jié)直腸癌和癌旁正常組織顯著差異的甲基化位點(diǎn)3 649個(gè),其中高甲基化位點(diǎn)1 259個(gè),主要分布于基因啟動(dòng)子區(qū)和基因體,篩選出特異的SLC15A3等高甲基化基因;低甲基化位點(diǎn)共2 390個(gè),主要分布于基因間區(qū)和基因體,篩選出特異的ACOT2、TTLL8、UHRF1等低甲基化基因。GO分析和KEGG分析發(fā)現(xiàn),這些基因功能與DNA結(jié)合、轉(zhuǎn)錄因子活性、信號(hào)轉(zhuǎn)導(dǎo)通路等有關(guān)。結(jié)論:結(jié)直腸癌和癌旁正常組織存在大量差異甲基化位點(diǎn),提示DNA異常甲基化與結(jié)直腸癌的發(fā)生、發(fā)展密切相關(guān)?;蛐酒夹g(shù)可用于結(jié)直腸癌差異甲基化位點(diǎn)的初篩,但構(gòu)建結(jié)直腸癌差異甲基化譜作為臨床分子標(biāo)記物仍需行進(jìn)一步驗(yàn)證。
結(jié)直腸癌(colorectal cancer)的發(fā)病率和病死率分別高居世界惡性腫瘤的第3位和第4位[1]。DNA甲基化(DNA methylation)通過調(diào)節(jié)基因的表達(dá)影響其功能發(fā)揮,是表觀遺傳學(xué)的重要組成部分,亦是調(diào)節(jié)基因組功能的重要手段。已有許多研究證實(shí)DNA甲基化在結(jié)直腸癌中發(fā)揮重要作用,但多為一個(gè)或數(shù)個(gè)基因的研究,全基因組水平繪制特異性甲基化譜的研究尚處于探索階段[2-6]。本研究通過采用高敏感性、高通量的全基因組甲基化芯片技術(shù)建立結(jié)直腸癌特異性甲基化基因表達(dá)譜,并利用生物信息學(xué)手段對(duì)差異甲基化位點(diǎn)進(jìn)行篩選和分析,旨在為進(jìn)一步闡述結(jié)直腸癌發(fā)生、發(fā)展的分子機(jī)制、尋找特異性診斷標(biāo)記物以及確定可能的基因靶向治療位點(diǎn)提供理論依據(jù)。
選取2015年8月—2015年12月上海交通大學(xué)醫(yī)學(xué)院附屬仁濟(jì)醫(yī)院6例原發(fā)性結(jié)直腸癌患者術(shù)后標(biāo)本,診斷經(jīng)病理檢查證實(shí)。其中男3例,女3例;年齡64~79歲,平均(68.67±5.47)歲;根據(jù)最新AJCC結(jié)直腸癌TNM分期[7],T2N1M1、T3N0M0、T3N2bM0、T4aN0M0、T4bN0M0、T4aN1M1各1例;根據(jù)2010版WHO結(jié)直腸癌組織學(xué)分級(jí)[8],低級(jí)別腺癌4例,高級(jí)別腺癌2例。所有患者術(shù)前均未接受過放射和(或)化學(xué)藥物治療。以相應(yīng)癌旁正常黏膜組織(距癌組織2~3 cm)作為對(duì)照,組織離體后30 min 內(nèi)置于液氮中,隨后轉(zhuǎn)入-80 ℃冰箱保存。
取結(jié)直腸癌和癌旁正常黏膜組織各約50 mg,采用基因組DNA提取試劑盒(德國(guó)Qiagen公司),按說明書步驟提取DNA。提取的DNA含量先用紫外分光光度計(jì)(德國(guó)Eppendorf公司)定量,然后行1%瓊脂糖凝膠電泳檢測(cè)DNA樣本的完整性。將質(zhì)檢合格的DNA濃度調(diào)整至50 mg/L,-20 ℃冰箱保存待用。
按照EZ DNA Methylation Kit(美國(guó)Illumina公司)優(yōu)化方法行DNA亞硫酸鹽轉(zhuǎn)化;之后經(jīng)擴(kuò)增、斷化、沉淀、重懸,在Illumina Methylation 450K芯片上行雜交、溶洗、延伸、染色、掃描等過程,獲取DNA甲基化信號(hào)。信號(hào)采集與分析采用iScan軟件(美國(guó)Illumina公司)分析系統(tǒng)。對(duì)6組癌組織和癌旁正常組織逐個(gè)進(jìn)行甲基化分析,得到癌組織和癌旁組織中每個(gè)探針位點(diǎn)的甲基化β值,計(jì)算平均甲基化β值、甲基化β值差值。利用R語(yǔ)言的limma包建立線性模型,計(jì)算結(jié)直腸癌組織和癌旁正常黏膜組織間甲基化位點(diǎn)的P值。P<0.01為差異甲基化位點(diǎn)的篩選標(biāo)準(zhǔn)。
首先將芯片篩選出的差異甲基化位點(diǎn)對(duì)應(yīng)的基因映射到GO(Gene Ontology)數(shù)據(jù)庫(kù)的各個(gè)條目中,進(jìn)行GO功能注釋,計(jì)算映射到各條目的基因數(shù),利用超幾何分布計(jì)算得到P值。P<0.01為差異甲基化基因中顯著性富集的GO條目。然后利用KEGG(Kyoto Encyclopedia of Genes and Genomes)數(shù)據(jù)庫(kù),將差異甲基化基因進(jìn)行映射和通路分析。P<0.05為差異甲基化基因中顯著性富集的通路。
芯片所檢測(cè)的431 467個(gè)位點(diǎn)對(duì)應(yīng)22 300個(gè)基因,根據(jù)P<0.01和甲基化β值差值篩選出差異甲基化位點(diǎn)3 649個(gè),包括1 259個(gè)高甲基化位點(diǎn)和2 390 個(gè)低甲基化位點(diǎn),這些差異甲基化位點(diǎn)隨機(jī)分布于每條染色體。其中11號(hào)染色體的高甲基化位點(diǎn)最多(131個(gè)),其次為7號(hào)染色體(104個(gè));1號(hào)染色體的低甲基化位點(diǎn)最多(198個(gè)),其次為11號(hào)染色體(197個(gè))(表1)。
芯片所檢出的高甲基化位點(diǎn)在基因結(jié)構(gòu)元件的分布主要位于基因啟動(dòng)子區(qū)和基因體,低甲基化位點(diǎn)主要分布于基因間區(qū)、基因體和基因啟動(dòng)子區(qū)(表2)?;騿?dòng)子區(qū)的高甲基化位點(diǎn)主要分布于TSS1500、5’UTR和TSS200,低甲基化位點(diǎn)主要分布于TSS1500、5’UTR和TSS200(表3)。CpG島及其周圍區(qū)域也有差異甲基化現(xiàn)象,根據(jù)CpG位點(diǎn)含量和距離劃分,高甲基化位點(diǎn)主要分布于CpG島和島灘區(qū),低甲基化位點(diǎn)主要分布于其他區(qū)域(表4)。
表1 差異甲基化位點(diǎn)在染色體上的分布(n)
表2 差異甲基化位點(diǎn)在基因結(jié)構(gòu)元件的分布n (%)
表3 差異甲基化位點(diǎn)在基因啟動(dòng)子區(qū)的分布n (%)
表4 根據(jù)CpG島劃分的差異甲基化位點(diǎn)分布n (%)
在已篩選出的差異甲基化位點(diǎn)中,按P值選出10個(gè)最顯著的高甲基化基因,分別為溶質(zhì)載體家族15成員3(SLC15A3)、CBFA2/RUNX1易位伙伴2(CBFA2T2)、腦蛋白9(KNDC1)、硫酸皮膚素差向異構(gòu)酶(DSE)、AT豐富結(jié)合域4A(ARID4A)、卷曲螺旋結(jié)構(gòu)域蛋白5(CHCHD5)、USP6氨基端樣蛋白(USP6NL)、RP4-544H6.2、G蛋白信號(hào)調(diào)節(jié)因子19(RGS19)、胎盤堿性磷酸酶(ALPP)(表5),10個(gè)最顯著的低甲基化基因分別為脂酰輔酶A硫脂酶2(ACOT2)、微管蛋白酪氨酸連接酶家族成員8(TTLL8)、泛素樣含PHD和環(huán)指域蛋白1(UHRF1)、鋅指蛋白566(ZNF566)、CCR4-NOT轉(zhuǎn)錄復(fù)合體亞基1(CNOT1)、表皮生長(zhǎng)因子4(ERBB4)、磷酸二酯酶4D(PDE4D)、MLX相互作用蛋白(MLXIP)、可溶性鳥苷酸環(huán)化酶α亞基2(GUCY1A2)、動(dòng)力蛋白胞漿1重鏈1(DYNC1H1)(表6)。
表5 篩選出的10個(gè)最顯著的高甲基化基因
*甲基化位點(diǎn)在染色體上的位置
表6 篩選出的10個(gè)最顯著的低甲基化基因
對(duì)篩選出的差異甲基化位點(diǎn)分別行GO分析和KEGG分析,富集得到849個(gè)GO功能注釋和45條通路。GO本體涵蓋了基因的生物學(xué)過程(biological process)、細(xì)胞組分(cellular component)、分子功能(molecular function)。GO分析顯示結(jié)直腸癌差異甲基化基因涵蓋多種不同的功能群落,在生物學(xué)過程方面,主要參與器官系統(tǒng)發(fā)生、解剖結(jié)構(gòu)的形成;在細(xì)胞組分方面,主要存在于胞外區(qū)、細(xì)胞膜、突觸中;在分子功能方面,主要與DNA結(jié)合、轉(zhuǎn)錄因子活性等有關(guān)(表7)。KEGG分析顯示結(jié)直腸癌差異甲基化位點(diǎn)參與各種細(xì)胞通路,如刺激神經(jīng)組織的配體受體相互作用通路(neuroactive ligand-receptor interaction)、腫瘤蛋白多糖通路(proteoglycans in cancer)、腫瘤轉(zhuǎn)錄失調(diào)通路(transcriptional misregulation in cancer)、PI3K-AKT信號(hào)通路等(表8)。
全球每年約120萬(wàn)例患者被確診為結(jié)直腸癌,超過60萬(wàn)例患者直接或間接死于結(jié)直腸癌[1]。目前結(jié)直腸癌的發(fā)病率呈年輕化趨勢(shì)[9-12]。結(jié)直腸癌的發(fā)生是多步驟、多環(huán)節(jié)相互作用的結(jié)果,其分子機(jī)制涉及基因和染色體的結(jié)構(gòu)和(或)功能異常,如包括基因突變等在內(nèi)的DNA序列改變和包括DNA甲基化、組蛋白修飾、非編碼RNA調(diào)控等在內(nèi)的表觀遺傳學(xué)修飾。
表7 差異甲基化位點(diǎn)的GO分析
DNA甲基化系指在DNA甲基轉(zhuǎn)移酶(DNA methyltransferases, DNMTs)的催化作用下,以S-腺苷甲硫氨酸(S-adenosyl methionine, SAM)為甲基供體,將甲基基團(tuán)轉(zhuǎn)移到胞嘧啶和鳥嘌呤(CpG)二核苷酸的胞嘧啶5’-碳原子上,形成5-甲基胞嘧啶的過程[13-15]。人類甲基化發(fā)生在CpG位點(diǎn),多種基因的啟動(dòng)子區(qū)和第一外顯子富含CpG,而CpG相對(duì)集中的區(qū)域稱為CpG島。生理情況下,CpG島多處于非甲基化狀態(tài),而大部分散在CpG二核苷酸為甲基化狀態(tài),這對(duì)正常的細(xì)胞發(fā)育和維持組織穩(wěn)定性具有重要作用。但在腫瘤發(fā)生過程中,該模式發(fā)生逆轉(zhuǎn),包括總基因組甲基化水平降低、癌基因的低甲基化和抑癌基因的高甲基化。DNA低甲基化常誘導(dǎo)基因的重新活化和表達(dá),增加染色體的不穩(wěn)定性;DNA高甲基化常導(dǎo)致基因沉默抑制基因表達(dá),參與調(diào)控DNA修復(fù)[16-17]、細(xì)胞凋亡[18-19]、細(xì)胞周期[20-21]等重要生物學(xué)過程。
基因甲基化芯片憑借其高通量、高敏感性、自動(dòng)化、微型性的優(yōu)勢(shì)在各種疾病、組織特異性表達(dá)等多種領(lǐng)域研究中的應(yīng)用極為廣泛[22-24]。本研究應(yīng)用該技術(shù)共檢出結(jié)直腸癌和癌旁正常組織顯著差異的甲基化位點(diǎn)3 649個(gè),其中高甲基化位點(diǎn)1 259個(gè),主要分布于基因啟動(dòng)子區(qū)和基因體,篩選出特異的SLC15A3等高甲基化基因;低甲基化位點(diǎn)共2 390個(gè),主要分布于基因間區(qū)和基因體,篩選出特異的ACOT2、TTLL8、UHRF1等低甲基化基因。通過GO分析和KEGG分析發(fā)現(xiàn),這些基因功能與DNA結(jié)合、轉(zhuǎn)錄因子活性、信號(hào)轉(zhuǎn)導(dǎo)通路等有關(guān)。通過相關(guān)檢索發(fā)現(xiàn),針對(duì)本研究篩選出的差異甲基化基因的相關(guān)報(bào)道甚少。Zhou等[25]通過對(duì)正常腸黏膜組、腺瘤組織和腺癌組織進(jìn)行外顯子組捕獲測(cè)序研究,在結(jié)直腸腺瘤組中發(fā)現(xiàn)了包括SLC15A3在內(nèi)的12個(gè)非同義突變基因。Sabatino等[26]的研究發(fā)現(xiàn)UHRF1可能通過DNA去甲基化和組蛋白抑制修飾等途徑負(fù)調(diào)控PPARγ表達(dá),與結(jié)直腸癌增殖、遷移潛能相關(guān),且UHRF1過表達(dá)和PPARγ沉默與上皮-間質(zhì)轉(zhuǎn)化過程中的高生長(zhǎng)速率和表型特征有關(guān)。Kofunato等[27]的研究通過免疫組化染色法發(fā)現(xiàn),65.8% 的結(jié)直腸癌患者中UHRF1表達(dá)上調(diào),在右半結(jié)腸癌中更為明顯,且UHRF1高表達(dá)可能與癌細(xì)胞侵犯深度有關(guān);利用siRNA敲除UHRF1后,結(jié)腸癌HCT116和SW620細(xì)胞生長(zhǎng)速度受到明顯抑制。
總之,結(jié)直腸癌和癌旁正常組織存在大量差異甲基化位點(diǎn),提示DNA異常甲基化與結(jié)直腸癌的發(fā)生、發(fā)展密切相關(guān)。然而,利用基因甲基化芯片篩選出的差異位點(diǎn)、對(duì)應(yīng)的基因以及在結(jié)直腸癌中可能的作用機(jī)制仍需通過特異性甲基化聚合酶鏈反應(yīng)、免疫組化染色等實(shí)驗(yàn)室方法和收集大量臨床病例進(jìn)行隨機(jī)對(duì)照研究來進(jìn)一步分析驗(yàn)證。基因甲基化技術(shù)在臨床中對(duì)確定特異性甲基化標(biāo)記物、早期診斷疾病、確定靶向治療位點(diǎn)以及評(píng)估預(yù)后等有潛在的應(yīng)用前景,但目前仍存在諸多困難,其結(jié)果的準(zhǔn)確性和特異性有待實(shí)驗(yàn)室技術(shù)進(jìn)行檢驗(yàn)以及臨床大樣本研究進(jìn)行證實(shí)。