謝秋,李才華,王滔,孫正怡,郁琦,張?chǎng)?/p>
(1.中國(guó)醫(yī)學(xué)科學(xué)院 北京協(xié)和醫(yī)學(xué)院 北京協(xié)和醫(yī)院,北京 100730;2.上海天昊生物,上海 200120;3. 首都兒科研究所,北京 100020)
真核生物染色體以核小體為單位進(jìn)行致密折疊,同時(shí)部分染色質(zhì)會(huì)呈現(xiàn)開(kāi)放狀態(tài),這些開(kāi)放結(jié)構(gòu)通常作為特異性反式作用因子(如轉(zhuǎn)錄因子、酶等)和順式作用元件(如增強(qiáng)子、隔離子等)與基因組DNA相關(guān)作用的活躍區(qū)域。染色體的開(kāi)放程度用染色體可接近性(Chromatin Accessibility)來(lái)表示,該狀態(tài)的變化會(huì)對(duì)基因表達(dá)調(diào)控、DNA復(fù)制和修復(fù)等產(chǎn)生重要影響。之前有研究報(bào)道的染色質(zhì)開(kāi)放性測(cè)序技術(shù)(Assay for Transposase Accessible Chromatin with high throughput sequencing,ATAC-seq)方法,利用高靈敏度的轉(zhuǎn)座酶(Transposase,Tn5)在尋找染色質(zhì)可接近位置的同時(shí)對(duì)染色體DNA進(jìn)行片段化,細(xì)胞數(shù)量級(jí)在10的四次方即可[1-2]。因此對(duì)于數(shù)量有限的臨床樣本尤其適合,實(shí)驗(yàn)操作上更方便快捷,是一種創(chuàng)新的表觀(guān)遺傳學(xué)研究技術(shù)手段。流行病學(xué)研究表明圍孕期葉酸缺乏是習(xí)慣性流產(chǎn)、出生缺陷發(fā)生的重要危險(xiǎn)因素,補(bǔ)充葉酸能有效預(yù)防上述不良反應(yīng)的發(fā)生[3-5]。越來(lái)越多的研究表明葉酸作為一碳單位的運(yùn)載體作為甲基供體影響表觀(guān)修飾調(diào)控[6-8]。本研究通過(guò)ATAC-seq技術(shù)研究葉酸代謝異常對(duì)小鼠胚胎干細(xì)胞(mouse embryonic stem cell,mESC)全基因組染色質(zhì)開(kāi)放程度的影響,為探索葉酸缺乏對(duì)早期胚胎發(fā)育表觀(guān)編程影響提供初步的研究基礎(chǔ)。
1.研究對(duì)象:Sv/129 mESC細(xì)胞來(lái)源于北京宣武醫(yī)院,采用高糖DMEM培養(yǎng),含15% 胎牛血清、β-巰基乙醇、非必須氨基酸、谷氨酸及白血病抑制因子,培養(yǎng)在預(yù)先包被有2% 明膠的培養(yǎng)瓶或者培養(yǎng)板中,37℃、5%CO2培養(yǎng)箱傳代培養(yǎng),每隔2~3 d傳代1次。
2.主要試劑:甲氨蝶呤(MTX,CalBiochem,美國(guó));Tn5轉(zhuǎn)座酶(北京MDTKBio);高保真PCR擴(kuò)增試劑盒(Next High Fidelity 2×PCR Master Mix,NEB,美國(guó));DNA文庫(kù)制備試劑盒(Nextera DNA Sample Prep Kit,Illumina,美國(guó));雙末端簇生成試劑盒(v3-cBot-HS,Illumina,美國(guó));核酸純化試劑盒(AgencourtAMPure XP,Beckman Coulter,美國(guó));核酸片段篩選試劑盒(AgencourtSPRIselect Reagent Kit,Beckman Coulter,美國(guó))。
3.主要儀器:PCR儀(ABI2720,美國(guó));低溫離心機(jī)(Eppendorf 5810R,美國(guó));核酸蛋白定量?jī)xQubit3.0(Thermo,美國(guó));磁力架DynaMag(Thermo,美國(guó));倒置顯微鏡ECLIPSETi(Nikon,日本);二代測(cè)序儀器Illumina Hiseq 2500(Illumina,美國(guó))。
1.細(xì)胞計(jì)數(shù)與裂解:分別使用葉酸濃度為4 mg/ml的正常葉酸培養(yǎng)基和終濃度為0.12 μM的MTX處理mESC 24 h(分別為正常對(duì)照組和MTX實(shí)驗(yàn)組),收集細(xì)胞。制備PBS重懸的單細(xì)胞懸液,0.4%臺(tái)盼藍(lán)染色后倒置相差顯微鏡下計(jì)數(shù),取104個(gè)細(xì)胞至新的離心管;4℃低溫500g離心5 min,小心棄去上清,用預(yù)冷的PBS洗滌1次;離心后重懸于50 μl預(yù)冷的Lysis buffer,輕柔吹打分散細(xì)胞;棄去上清,置于冰上準(zhǔn)備轉(zhuǎn)座反應(yīng)。
2.轉(zhuǎn)座反應(yīng)與純化:配制如下反應(yīng)體系,吹打混勻后重懸上一步細(xì)胞核沉淀:5×reaction buffer 10 μl,Tn5 Enzyme 5 μl,ddH2O 35 μl。反應(yīng)條件:37℃孵育30 min。使用純化試劑盒純化上一步產(chǎn)物,操作按試劑盒說(shuō)明書(shū)進(jìn)行;DNA洗脫液洗脫得到11 μl純化產(chǎn)物。
3.PCR放大與純化:對(duì)轉(zhuǎn)座文庫(kù)進(jìn)行放大和添加樣本特異的Index,配制如下反應(yīng)體系:上一步轉(zhuǎn)座DNA 11 μl,10 M Primer F 2 μl,10 M Barcoded Primer R 2 μl,NEBNextUltraTMII Q5Master Mi 15 μl。反應(yīng)條件:72℃延伸5 min;98℃變性30 s(1個(gè)cycle);98℃變性10 s;63℃退火30 s;72℃延伸1 min(10個(gè)cycle);72℃延伸5 min;4℃冷卻。使用純化試劑盒純化上一步產(chǎn)物,操作按試劑盒說(shuō)明書(shū)進(jìn)行;得到最終上機(jī)文庫(kù)。
4.文庫(kù)質(zhì)控與上機(jī):取1 μl文庫(kù)使用Qubit3.0檢測(cè)文庫(kù)濃度;將不同文庫(kù)按照等摩爾量混樣按DNA文庫(kù)制備試劑盒操作后上機(jī)至Illumina Hiseq平臺(tái),采用PE150模式測(cè)序。引物與接頭信息見(jiàn)表1。
表1 文庫(kù)構(gòu)建引物與接頭信息
*IIIIIIII為8 bp的Barcode信息
測(cè)序得到的原始測(cè)序序列(raw reads或raw data),里面含有帶接頭的、低質(zhì)量的reads,為了保證信息分析質(zhì)量,必須對(duì)raw reads進(jìn)行過(guò)濾,得到clean reads用于后續(xù)分析。利用trim_galore(http:∥www.bioinformatics.babraham.ac.uk/projects/trim_galore/)進(jìn)行質(zhì)量過(guò)濾[1,9],包括3個(gè)步驟:(1)去掉測(cè)序引物;(2)去掉末端低質(zhì)量的reads;(3)去掉上述1和2步驟后片段<35 bp的reads。正常對(duì)照組和MTX實(shí)驗(yàn)組分別設(shè)置3個(gè)生物學(xué)重復(fù),參照小鼠基因組mm10數(shù)據(jù)庫(kù)進(jìn)行生物信息學(xué)分析。
數(shù)值分析采用組間均數(shù)比較的單因素方差分析,組間計(jì)量資料的比較采用獨(dú)立樣本t檢驗(yàn),P<0.05表示差異有統(tǒng)計(jì)學(xué)意義。
為了摸索適合的Tn5酶體系,我們選擇兩個(gè)酶濃度梯度,分別為5 U和7.5 U,具體標(biāo)記見(jiàn)表2。
經(jīng)歷12個(gè)cycle擴(kuò)增后,取少量產(chǎn)物進(jìn)行瓊脂糖電泳發(fā)現(xiàn)Tn5濃度為7.5 U,正常對(duì)照組轉(zhuǎn)座酶消化后核小體周期條帶明顯優(yōu)于5 U處理濃度,而對(duì)于MTX實(shí)驗(yàn)組轉(zhuǎn)座酶5 U處理優(yōu)于7.5 U處理,文庫(kù)可見(jiàn)清晰的核小體周期條帶(圖1箭頭所示)。
表2 Tn5酶體系摸索
采用5 U、7.5 U Tn5轉(zhuǎn)座酶分別處理正常對(duì)照組、MTX實(shí)驗(yàn)組后檢測(cè)核小體分布圖1 Tn5轉(zhuǎn)座酶消化產(chǎn)物經(jīng)瓊脂糖凝膠電泳質(zhì)控
使用MACS(http:∥liulab.dfci.harvard.edu/MACS/)軟件[10]識(shí)別reads在參考基因組上的富集區(qū)域,即peak calling,作為候選的蛋白質(zhì)結(jié)合位點(diǎn)(或表觀(guān)修飾位點(diǎn))。正常對(duì)照組peak calling數(shù)量明顯多于MTX實(shí)驗(yàn)組,中位長(zhǎng)度為302 bp(圖2A);MTX實(shí)驗(yàn)組peak calling中位長(zhǎng)度為271 bp(圖2B),兩組peak calling數(shù)量采用單因素方差分析具有統(tǒng)計(jì)學(xué)差異(P<0.01),提示MTX處理后mESC染色質(zhì)可接近區(qū)域發(fā)生減少。
A:正常對(duì)照組peak calling計(jì)數(shù)及長(zhǎng)度分布,黑色箭頭示中位peak長(zhǎng)度(bp);B:MTX實(shí)驗(yàn)組peak calling計(jì)數(shù)及長(zhǎng)度分布,黑色箭頭示中位peak長(zhǎng)度(bp)圖2 兩組peak calling數(shù)量及長(zhǎng)度分布示意圖
基因本體論(Gene Ontology,GO)是基因功能?chē)?guó)際標(biāo)準(zhǔn)分類(lèi)體系,對(duì)目標(biāo)區(qū)域基因進(jìn)行篩選與分類(lèi)富集。對(duì)正常對(duì)照組和MTX實(shí)驗(yàn)組差異peak calling進(jìn)行GO富集分析比較,發(fā)現(xiàn)MTX處理后差異染色質(zhì)開(kāi)放區(qū)域主要集中胚胎器官形成、細(xì)胞周期調(diào)控、神經(jīng)骨骼系統(tǒng)發(fā)育及生殖系統(tǒng)發(fā)育有關(guān)基因(表3)。
表3 差異peak相關(guān)區(qū)域GO富集顯著性差異分析(Top 10)
我們對(duì)差異peak相關(guān)基因進(jìn)一步進(jìn)行KEGG(Kyoto Encyclopedia of Genes and Genomes) Pathway分析,通過(guò)Pathway顯著性富集分析能確定差異peak相關(guān)基因集合主要參與的生化代謝通路和信號(hào)轉(zhuǎn)導(dǎo)通路。正常對(duì)照組和MTX實(shí)驗(yàn)組差異peak 相關(guān)基因顯著性富集的pathway集中在 MAPK(mitogen-activated protein kinase)信號(hào)通路、細(xì)胞骨架調(diào)控、Rap1信號(hào)通路等(圖3)。
圖3 差異peak相關(guān)基因KEGG富集分析
目前現(xiàn)有的用于染色質(zhì)開(kāi)放區(qū)域捕獲的技術(shù)手段包括利用脫氧核糖核酸酶DNase Ⅰ酶切基因組尋找高敏位點(diǎn)的DNase-seq(DNaseⅠhypersensitive sites,DHSs);利用有機(jī)溶劑甲醛對(duì)染色體裸露的DNA進(jìn)行固定的FAIRE-seq(Formaldehyde-Assisted Isolation of Regulatory Elements with Sequencing)。這些方法對(duì)于細(xì)胞數(shù)量要求甚高,而且實(shí)驗(yàn)步驟繁瑣。本研究利用二氫葉酸還原酶抑制劑MTX誘導(dǎo)葉酸代謝障礙作用胚胎干細(xì)胞,采用ATAC-seq發(fā)現(xiàn)全基因組染色質(zhì)開(kāi)放程度即發(fā)生明顯變化,涉及基因尤以組織器官形成為主,提示葉酸代謝能夠影響早期胚胎發(fā)育表觀(guān)修飾調(diào)控。
2017《Development》通過(guò)ATAC-seq技術(shù)獲得早期小鼠胚胎組織的全基因組順式調(diào)控元件序列譜,并對(duì)預(yù)測(cè)增強(qiáng)子位點(diǎn)進(jìn)行了功能鑒定,發(fā)現(xiàn)3個(gè)新的增強(qiáng)子序列對(duì)于小鼠神經(jīng)板前后體軸的發(fā)育是必須的。通過(guò)分析motif,發(fā)現(xiàn)屬于Smad蛋白家族成員的motif序列[11]。轉(zhuǎn)錄因子信號(hào)轉(zhuǎn)導(dǎo)和轉(zhuǎn)錄激活因子-3(signal transducer and activator of transcription factor-3,STAT3)參與很多基因的表達(dá)與調(diào)控,并與其他轉(zhuǎn)錄因子形成復(fù)雜的網(wǎng)絡(luò)調(diào)控。Fujitani等[12]發(fā)現(xiàn)在哺乳動(dòng)物前腦發(fā)育時(shí)期即有JAT/STAT蛋白表達(dá),進(jìn)一步檢測(cè)發(fā)現(xiàn)在妊娠14.0~18.0 d大鼠胚胎的大腦皮質(zhì)、紋狀體、基底前腦和海馬都有STAT3的表達(dá),而STAT3敲除的鼠胚胎發(fā)育至妊娠6.5 d就退化,提示STAT3對(duì)于胚胎早期的發(fā)育是必要的。對(duì)小鼠胚胎的研究發(fā)現(xiàn),妊娠9.5 d時(shí),STAT3在腦區(qū)有高水平的表達(dá),此時(shí)間點(diǎn)恰好為神經(jīng)系統(tǒng)發(fā)育的重要時(shí)期。推辭STAT3可能參與神經(jīng)管閉合的關(guān)鍵信號(hào)通路調(diào)節(jié)[13]。ATAC-seq研究揭示STAT3通過(guò)結(jié)合染色質(zhì)開(kāi)放區(qū)域調(diào)控位點(diǎn)能夠與KLF6基因啟動(dòng)子區(qū)形成loop環(huán)狀結(jié)構(gòu),協(xié)同促進(jìn)神經(jīng)突觸的發(fā)育與生長(zhǎng),決定中樞神經(jīng)系統(tǒng)神經(jīng)前體細(xì)胞的分化命運(yùn)[14]。Fullard等[15]通過(guò)ATAC-seq技術(shù)建立了成人大腦(神經(jīng)元,非神經(jīng)元)的可接近性染色質(zhì)圖譜,繪制了5個(gè)個(gè)體14個(gè)不同大腦區(qū)域的染色質(zhì)開(kāi)放性結(jié)構(gòu)域,神經(jīng)元較非神經(jīng)元具有更高的染色質(zhì)開(kāi)放區(qū),意味著此處有更多的順式調(diào)控元件存在,參與基因表達(dá)調(diào)控。紋狀體神經(jīng)元會(huì)存在特殊的染色質(zhì)開(kāi)放區(qū)域,具有識(shí)別分子途徑和生物功能差異。通過(guò)motif分析,鑒定出大腦區(qū)域特異性蛋白編碼序列及長(zhǎng)鏈非編碼RNA。本研究ATAC-seq證實(shí)葉酸代謝障礙下的mESC染色質(zhì)可接近性與正常葉酸培養(yǎng)相比,其開(kāi)放程度呈下降趨勢(shì),提示調(diào)控因子結(jié)合位點(diǎn)發(fā)生改變,可能影響早期胚胎發(fā)育進(jìn)程重編程。因此我們推測(cè)葉酸缺乏可能通過(guò)改變?nèi)旧|(zhì)可接近性影響組織器官命運(yùn)分化,決定細(xì)胞命運(yùn)分化,但其具體調(diào)控機(jī)制尚待進(jìn)一步研究探討。