何純剛, 黃沁園, 鐘世彪, 陳利生, 肖和衛(wèi), 李 雷
結直腸腺瘤性息肉(colorectal adenomatous polyps,CAP)是結直腸癌的癌前病變,其癌變過程涉及多基因、多階段的變化。研究結直腸腺瘤的發(fā)生、發(fā)展及癌變機制具有重要意義。研究表明DNA甲基化在腫瘤的發(fā)生、發(fā)展和轉移中起重要的作用,然而基因甲基化在結直腸腺瘤中的作用機制尚未完全明確。本課題組前期研究采用全基因組甲基化芯片分析了結直腸腺瘤低甲基化譜,并篩選出低甲基化標志物,但尚未對基因啟動子區(qū)差異甲基化基因狀況進一步闡述。鑒此,本研究旨在對結直腸腺瘤基因啟動子區(qū)甲基化標志物進行篩選,為進一步研究結直腸腺瘤的發(fā)生、發(fā)展機制及早期診斷提供依據(jù)。
1
.1
研究對象 選擇2013年1月至2014年12月在廣西壯族自治區(qū)人民醫(yī)院及廣西醫(yī)科大學第一附屬醫(yī)院住院的進展期結直腸腺瘤患者9例(腺瘤組),男4例,女5例,中位年齡53歲;病變部位為結腸7例,直腸2例;病理類型:絨毛狀腺瘤2例,管狀絨毛狀腺瘤3例,管狀腺瘤4例,術后病理證實均無癌變。另選擇經腸鏡排除炎癥性腸疾病、癌前病變及癌的患者20例作為對照組,男9例,女11例,中位年齡60歲。所有研究對象知情同意參與,研究獲得醫(yī)院倫理委員會批準(科研國自-2013-017號)。1
.2
DNA提取及亞硫酸氫鹽修飾轉化 腺瘤組于內鏡下切除結直腸腺瘤標本(直徑≥2 cm),對照組取結直腸黏膜標本(結腸黏膜13例,直腸黏膜7例)。組織DNA的提取嚴格按照QIAamp DNA mini kit(Qiagen,Hidden,Germany)試劑盒說明書進行。提取到的DNA質量檢測、定量、DNA亞硫酸氫鹽修飾轉化按照Zymo EZ DNA Methylation kit試劑盒(Zymo Research,CA,USA)說明書進行。1
.3
450K甲基化芯片分析 所有經亞硫酸氫鹽修飾的DNA樣本均采用450K甲基化芯片(Illumina,San Diego,CA,USA)分析,操作嚴格按照說明書進行。每個樣本重復3次,芯片應用Illumina HiScan SQ scanner(Illumina,San Diego,CA,USA)進行掃描。具體操作由上海歐易生物醫(yī)學科技有限公司協(xié)作完成。1
.4
數(shù)據(jù)分析1.4.1 原始數(shù)據(jù)處理 應用genomestudio(genomestudio software 2011.1,Illumina)軟件進行芯片原始數(shù)據(jù)的提取、質量控制分析、校正。每個CpG位點的甲基化程度用AVG_Beta值(數(shù)值為0~1)來表示,Δβ代表腺瘤組與對照組CpG位點的差異甲基化程度(數(shù)值為-1~1)。Δβ>0.17判定為高甲基化,Δβ<-0.17判定為低甲基化。Δβ絕對值越大,其差異甲基化程度越高。根據(jù)初步篩選結果,進一步縮小篩選范圍,將Δβ值設為≥|0.4|進行二次篩選。對篩選出來的低甲基化標志物在基因組中的分布進行描述性分析。
1.4.2 進展期結直腸腺瘤基因啟動子區(qū)差異甲基化譜分析 根據(jù)Δβ值初步篩選出啟動子區(qū)差異甲基化標志物(包括TSS1500、TSS200、5′UTR及1st exons)。對篩選出來的標志物分布情況進行描述性分析。
1.4.3 基因啟動子區(qū)差異甲基化標志物的功能分析應用DAVID在線分析方法(https://david.ncifcrf.gov/home.jsp),對差異的啟動子區(qū)甲基化位點對應的基因進行GO分析及KEGG_Pathyway分析。GO包括三大功能注釋類別:生物過程、細胞成分、分子功能。通過KEGG_Pathyway分析差異甲基化標志物可能參與的信號通路。通過GO分析,統(tǒng)計每個GO條目中所包括的差異基因個數(shù),并用統(tǒng)計檢驗的方法計算每個GO條目中差異基因富集的顯著性。計算的結果會返回一個富集顯著性的P
值,P
<0.05表示差異基因在該GO條目中出現(xiàn)了富集。通過KEGG_Pathyway分析,統(tǒng)計每個信號通路條目中所包括的差異基因個數(shù),并用統(tǒng)計檢驗的方法計算每個信號通路條目中差異基因富集的顯著性,P
<0.05提示差異基因在該信號通路中出現(xiàn)富集,可能參與了該信號通路的作用。根據(jù)GO分析及KEGG_Pathyway分析的結果結合生物學意義從而挑選用于后續(xù)研究的基因。2
.1
進展期結直腸腺瘤啟動子區(qū)差異甲基化基因篩選結果 450K甲基化芯片共可檢測的甲基化位點為485 577個,根據(jù)Δβ值≥|0.17|,整個基因組中共發(fā)現(xiàn)65 535個(13.50%)差異甲基化標志物。在基因啟動子區(qū)(包括TSS1500、TSS200、5′UTR及1st exons)共發(fā)現(xiàn)22 160個(33.81%)差異甲基化標志物,見圖1。啟動子區(qū)高甲基化標志物12 795個(57.74%),低甲基化標志物9 365個(42.26%),高甲基化位點在TSS200、5′UTR及1st exons中均明顯高于低甲基化位點,見圖2。進一步將Δβ值設為≥|0.4|,在基因啟動子區(qū)共發(fā)現(xiàn)1 870個差異甲基化標志物,分別為1 524個啟動子高甲基化標志物和346個啟動子低甲基化標志物,其中包含929個啟動子差異甲基化基因。根據(jù)Δβ值進行排名,其中腺瘤組啟動子區(qū)差異(高/低)甲基化程度排名前20位的基因見表1。圖1 結直腸腺瘤中差異甲基化標志物在基因結構中的分布圖
圖2 結直腸腺瘤中差異(高/低)甲基化標志物在啟動子中的比較圖
表1 啟動子區(qū)差異甲基化程度排名前20位基因
啟動子高甲基化相關基因啟動子低甲基化相關基因LRRC4,NPY,DCLK1,CLIP4,PRKAR1B,ZNF542,FLI1,LOC389333,ITGA4,GATA5,KHDRBS2,FAM115A,CNRIP1,PTPRT,GAS1,CD34,MIR34B,BTG4,MIR34C,KCNIP4OR2M3,CHRM2,C7orf16,MACROD2,POLD3,HPVC1,LRRIQ4,TNR,OR56A1,TCN1,SVIL,ACMSD,SEC23B,SMAD3,C7orf66,SPAG4L,RBMXL2,KRT20,ANXA2,PIGB
2
.2
GO分析及KEGG_Pathyway分析結果 對929個啟動子差異甲基化基因進行GO分析及KEGG_Pathyway分析。GO分析結果顯示,在生物過程功能注釋類別中,差異甲基化基因主要富集前5位的條目有:化學性突觸傳遞、神經系統(tǒng)發(fā)育、細胞外基質組織、細胞命運確定和細胞黏附。在分子功能注釋類別中,差異甲基化基因主要富集前5位的條目有:細胞外基質結構成分、RNA聚合酶Ⅱ調控區(qū)序列特異性DNA結合、序列特異性DNA結合、轉錄因子活性、HMG盒域綁定。在細胞成分功能注釋類別中,主要富集前5位的條目有:質膜、蛋白質類細胞外基質、質膜的組成成分、突觸后膜、細胞連接。見表2。KEGG_Pathyway分析結果顯示,啟動子差異甲基化基因主要參與了神經活性的配體-受體相互作用、尼古丁成癮、鈣信號通路、膽堿能突觸和ECM-受體相互作用等信號轉導通路。見表3。表2 進展期結直腸腺瘤中啟動子差異甲基化標志物GO分析結果
注釋類別 注釋條目基因數(shù)目PFDR生物過程化學性突觸傳遞34<0.001<0.001神經系統(tǒng)發(fā)育33<0.001<0.001細胞外基質組織26<0.001<0.001細胞命運確定12<0.001<0.001細胞黏附42<0.0010.016分子功能 細胞外基質結構成分18<0.001<0.001RNA聚合酶Ⅱ調控區(qū)序列特異性DNA結合31<0.001<0.001序列特異性DNA結合53<0.001<0.001轉錄因子活性77<0.001<0.001HMG盒域綁定8<0.001<0.001細胞成分 質膜266<0.001<0.001蛋白質類細胞外基質41<0.001<0.001質膜的組成成分107<0.001<0.001突觸后膜31<0.001<0.001細胞連接47<0.001<0.001
表3 進展期結直腸腺瘤中啟動子差異甲基化基因KEGG_Pathyway分析結果
代謝通路條目基因數(shù)目PFDR神經活性的配體-受體相互作用37<0.001<0.001尼古丁成癮12<0.001<0.001鈣信號通路22<0.0010.028膽堿能突觸15<0.0010.310ECM-受體相互作用13<0.0010.013
3
.1
結直腸癌是全球第3大最常見的癌癥類型,也是癌癥相關死亡的第3大原因。近年來,結直腸癌的發(fā)病率呈上升趨勢,其發(fā)病率已排在第3位,因此,做好結直腸癌的早期防治工作有重要意義。研究表明,“正常-腺瘤-癌-癌轉移”是散發(fā)性結直腸癌發(fā)生、發(fā)展的主要路徑,至少有80%的結直腸癌由結直腸腺瘤演變而來。由于腺瘤發(fā)展為癌一般需要7~10年的時間,因此,患者有機會發(fā)現(xiàn)和切除晚期腺瘤或早期結直腸癌,而識別與腺瘤風險相關的新基因可能有助于更好地理解癌變途徑,從而改進結直腸癌的篩查和預防工作。3
.2
DNA甲基化在腫瘤的發(fā)生、發(fā)展、轉移中起重要的作用。啟動子甲基化是腫瘤抑制基因表觀遺傳學改變最常見的類型之一,在某些情況下,它是腫瘤抑制基因失活的機制。啟動子高甲基化可以影響多種細胞通路,在腫瘤的發(fā)生、發(fā)展中起重要作用。DNA異常甲基化(包括高甲基化及低甲基化狀態(tài))在結直腸腺瘤及癌中廣泛存在,許多異常甲基化基因被發(fā)現(xiàn),提示基因表觀遺傳的改變作為頻發(fā)的早期事件可能影響了結直腸腺瘤向癌轉變,同時也可能成為早期診斷的標志物。CpG島甲基化(CpG island hypermethylation,CIMP)目前被認為是鋸齒狀通路的主要發(fā)生機制,約15%的散發(fā)性結直腸癌由此途徑進展而來。3
.3
近年來發(fā)展的甲基化芯片研究技術在甲基化檢測過程中已經體現(xiàn)出了高通量檢測的優(yōu)越性,基于各種原理設計的芯片為實現(xiàn)從整個基因組到多個已知特異性基因或甲基化位點的定性、定量檢測奠定了基礎。應用芯片技術這個高通量手段檢測基因組的甲基化,大大提升了研究效率,為揭示腫瘤的發(fā)生發(fā)展機制、診斷、預防和治療提供了有效工具。目前,基因甲基化芯片已廣泛應用于各種腫瘤的研究。采用全新的基因組甲基化檢測方法,有利于全面分析結直腸腺瘤甲基化譜,更進一步揭示其在結直腸腺瘤及癌變過程的作用機制,同時新發(fā)現(xiàn)的甲基化標志物具有用于腺瘤及結直腸癌早期診斷的潛力。在本課題組的前期研究中,我們應用450K甲基化芯片及生物信息學技術對結直腸腺瘤低甲基化狀態(tài)進行了分析,共篩選出18個低甲基化基因標志物,這些低甲基化標志物主要位于基因間隔區(qū),但在結直腸腺瘤啟動子區(qū)異常甲基化狀態(tài)尚未闡明,故本研究就此進行了補充。3
.4
抑癌基因啟動子異常甲基化是最重要的甲基化事件之一,往往導致抑癌基因的沉默,在癌的發(fā)生、發(fā)展中起重要作用。本研究通過芯片數(shù)據(jù)結合生物信息學的分析方法,重點研究了基因啟動子區(qū)甲基化狀態(tài),在基因啟動子區(qū)共發(fā)現(xiàn)1 870個差異甲基化標志物,其中1 524個為高甲基化標志物,346個為低甲基化標志物,其中包含929個啟動子差異甲基化基因。在前20位啟動子高甲基化基因中有15個基因有相關文獻報道,其中10個基因在腸癌中檢測發(fā)現(xiàn),另5個基因在腺瘤中檢測發(fā)現(xiàn)。在前20位啟動子低甲基化基因中有7個基因有相關文獻報道,其中有5個基因在腸癌中檢測發(fā)現(xiàn),有4個基因在腺瘤中檢測發(fā)現(xiàn)。提示在結直腸腺瘤整個基因組中,啟動子區(qū)高甲基化狀態(tài)較低甲基化狀態(tài)更多見,同時也提示腺瘤中基因啟動子高甲基化可能是導致該基因失活的關鍵,并參與了“腺瘤-癌”的早期轉變過程。本研究對929個基因進行了GO、KEGG_Pathyway分析,結果發(fā)現(xiàn),差異甲基化基因涵蓋了許多不同的功能群落。GO分析結果顯示,啟動子差異甲基化基因主要在化學性突觸傳遞、神經系統(tǒng)發(fā)育、細胞外基質組織、細胞外基質結構成分、RNA聚合酶Ⅱ調節(jié)區(qū)序列特異性DNA結合、序列特異性DNA結合、質膜、蛋白質類細胞外基質、質膜的組成成分等注釋條目中出現(xiàn)富集。KEGG_Pathyway分析結果顯示,啟動子差異甲基化基因主要參與了神經活性的配體-受體相互作用、尼古丁成癮、鈣信號通路、膽堿能突觸、ECM-受體相互作用等信號轉導通路。表明在進展期腺瘤的發(fā)展過程,是多種類型基因參與,多種信號轉導通路共同調控的,其具體機制有待進一步深入研究。綜上所述,通過甲基化芯片分析及生物信息學分析方法發(fā)現(xiàn),大量基因啟動子甲基化狀態(tài)在結直腸腺瘤中發(fā)生了改變,其可能參與了結直腸腺瘤的發(fā)生、發(fā)展過程,為進一步探討結直腸腺瘤發(fā)病機制及早期診斷提供新的思路和線索。