何超,沈文龍,李平,張彥,曾晶,殷作明,趙志虎
?
Alu元件在染色質(zhì)三維結(jié)構(gòu)層次上的生物信息學(xué)分析
何超1,2,沈文龍2,李平2,張彥2,曾晶1,殷作明1,趙志虎2
1. 西藏軍區(qū)總醫(yī)院,拉薩 850000 2. 軍事科學(xué)院軍事醫(yī)學(xué)研究院生物工程研究所,北京 100071
染色質(zhì)在細(xì)胞核內(nèi)三維高級(jí)結(jié)構(gòu)包括最底層的核小體、核小體組成的“串珠”結(jié)構(gòu)、螺線管纖維結(jié)構(gòu)、染色質(zhì)/DNA環(huán)結(jié)構(gòu)(chromatin/DNA loop)、拓?fù)浣Y(jié)構(gòu)域(topologically associated domain, TAD)等多層次結(jié)構(gòu)。其中,TAD因在不同的細(xì)胞類型中相對(duì)穩(wěn)定且保守,被認(rèn)為是染色質(zhì)三維結(jié)構(gòu)的基本單元。Alu元件是一種哺乳動(dòng)物基因組中占據(jù)了較大比例的短散在重復(fù)元件,其廣泛存在且種類繁多,目前關(guān)于Alu元件功能上的研究尚不透徹。本研究對(duì)Alu元件與染色質(zhì)三維結(jié)構(gòu)的關(guān)系進(jìn)行研究,分析了Alu元件在染色質(zhì)三維結(jié)構(gòu)形成中的作用,并通過染色質(zhì)三維結(jié)構(gòu)上的距離關(guān)系對(duì)Alu元件子族的演化流程進(jìn)行了探索。結(jié)果發(fā)現(xiàn),Alu元件參與的染色質(zhì)間相互作用在高強(qiáng)度的染色質(zhì)相互作用中的比例隨著強(qiáng)度增加而逐漸增高,表明Alu在染色質(zhì)三維結(jié)構(gòu)構(gòu)建的過程中發(fā)揮了重要的作用。同時(shí),研究還發(fā)現(xiàn)Alu元件在染色質(zhì)上相互作用的強(qiáng)度與進(jìn)化上的關(guān)系存在著一定的正相關(guān)性,表現(xiàn)在一維序列進(jìn)化距離上比較接近的Alu元件在染色質(zhì)的三維結(jié)構(gòu)上也會(huì)彼此相互靠近。
染色質(zhì)三維結(jié)構(gòu);Alu元件;生物信息;進(jìn)化樹
短散在元件(short interspersed elements, SINEs)是以散在方式分布于基因組中的較短的重復(fù)序列,其單元長度通常在50 bp以下。Alu序列是哺乳動(dòng)物的短散在元件中所占比例最多的一種重復(fù)元件[1]。Alu序列的左右兩端各分布著一個(gè)不等長的、包含一個(gè)RNA聚合酶Ⅲ啟動(dòng)子序列的單體[2],左側(cè)單體比右側(cè)單體短31 bp且只有左側(cè)單體的RNA聚合酶Ⅲ啟動(dòng)子具有活性。研究表明,在Alu元件附近往往富集著長非編碼RNA (long non-coding RNAs, lncRNAs),可輔助lncRNAs在細(xì)胞核內(nèi)進(jìn)行定位[3],而且還能在基因組轉(zhuǎn)錄過程中能夠充當(dāng)剪接受體,抑制mRNA的翻譯并導(dǎo)致基因組不穩(wěn)定[4]。此外,還有研究發(fā)現(xiàn)Alu元件在基因組中與增強(qiáng)子(enhancer)廣泛相互作用[5~7]。
染色質(zhì)在細(xì)胞核內(nèi)的結(jié)構(gòu)與蛋白質(zhì)的三維高級(jí)結(jié)構(gòu)相似,包括基礎(chǔ)的核小體、核小體組成的“串珠”結(jié)構(gòu)、螺線管纖維結(jié)構(gòu)、染色質(zhì)/DNA環(huán)結(jié)構(gòu)(chromatin/DNA loop)、拓?fù)浣Y(jié)構(gòu)域(topological associated domain, TAD)等多層次結(jié)構(gòu)[8,9]。其中,TAD因在不同的細(xì)胞類型中相對(duì)穩(wěn)定且保守,被認(rèn)為是染色質(zhì)三維結(jié)構(gòu)的基本單元[10]。目前對(duì)于染色質(zhì)三維結(jié)構(gòu)的研究主要基于近距離連接反應(yīng)的染色體構(gòu)象捕獲技術(shù)、基于圖譜技術(shù)根據(jù)多聚物聚合等原理進(jìn)行計(jì)算機(jī)建模、基于CRISPR的DNA片段編輯等的遺傳學(xué)技術(shù),以及基因光譜反射的顯微鏡技術(shù)。迄今為止,對(duì)染色質(zhì)結(jié)構(gòu)的直接觀測(cè)受到技術(shù)的限制,難以直接在高分辨率下觀測(cè)染色質(zhì)的動(dòng)態(tài)變化,因此研究者們采用先將染色質(zhì)內(nèi)的相互作用固定下來,通過分子生物學(xué)手段進(jìn)行分析,從而推斷生理?xiàng)l件下真實(shí)的染色質(zhì)動(dòng)態(tài)結(jié)構(gòu)。目前對(duì)染色質(zhì)三維結(jié)構(gòu)的研究方法主要包括研究點(diǎn)與點(diǎn)之間距離水平的3C技術(shù)[11]、研究一點(diǎn)到基因組范圍內(nèi)其他位點(diǎn)距離水平的4C技術(shù)[12]、研究已知范圍內(nèi)多點(diǎn)到多點(diǎn)間相互作用的5C技術(shù)[13]、全基因組內(nèi)染色質(zhì)相互作用的Hi-C技術(shù)[14,15]及進(jìn)一步衍生出的DNase Hi-C[16]、Micro-C[17]、Capture Hi-C[18]、COLA[19]、C-walk[20]等技術(shù)[21,22]。本研究通過生物信息學(xué)方法,結(jié)合Hi-C實(shí)驗(yàn)數(shù)據(jù),在染色質(zhì)三維結(jié)構(gòu)層次上對(duì)Alu元件在染色質(zhì)三維結(jié)構(gòu)形成中發(fā)揮的作用進(jìn)行探索,并根據(jù)染色質(zhì)三維折疊數(shù)據(jù)對(duì)Alu元件的相關(guān)功能進(jìn)行分析。
Hi-C實(shí)驗(yàn)數(shù)據(jù)來源于Rao等[19]所公開的數(shù)據(jù)集,包括GM12878、IMR90和K562 3個(gè)細(xì)胞系,均可在最高5 kb分辨率下開展研究。Alu元件數(shù)據(jù)來自UCSC genome browser repeat masker,包含了Alu元件不同子類在基因組上所在位點(diǎn)的信息[23]。參考基因組選取為人類參考基因組hg19版本。
目前已經(jīng)有較多處理Hi-C數(shù)據(jù)的比較成熟的軟件,如GenomicInteractions[24]、HiCPlotter[25]、HiC-Pro[26]等,其中GenomicInteractions可用于分析特殊位點(diǎn)間相互作用網(wǎng)絡(luò),然而這一軟件并不能整合多組學(xué)數(shù)據(jù),也不能夠進(jìn)行后續(xù)的功能挖掘等分析[24];HiCPlotter側(cè)重于將Hi-C相互作用熱圖與相應(yīng)的包括組蛋白修飾等表觀遺傳特征的結(jié)合,但并未關(guān)注染色質(zhì)上特殊序列間的相互作用[25]。利用HiC-Pro軟件對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理,因Hi-C數(shù)據(jù)是包含相互作用的兩個(gè)基因組片段的整合序列,通過將原始測(cè)序序列比對(duì)到基因組上,得到發(fā)生相互作用的兩個(gè)基因組位點(diǎn)。過濾掉自連接或未連接的無用、冗余相互作用對(duì),將剩余相互作用對(duì)進(jìn)行整合匯總,以便后續(xù)分析處理。
利用開源的R語言及附屬軟件包對(duì)Alu元件不同子類相互作用頻率分布進(jìn)行分析。將不同位點(diǎn)的全部相互作用匯總,設(shè)定相互作用上下閾值,超過上限閾值認(rèn)為其過度連接,低于下線閾值認(rèn)為其為染色質(zhì)內(nèi)隨機(jī)連接。根據(jù)上下閾值進(jìn)行過濾后,按照相互作用頻率強(qiáng)度將所有位點(diǎn)的相互作用分成若干子集。根據(jù)Alu元件所在的位置生成隨機(jī)位點(diǎn)組成隨機(jī)組,將每一組內(nèi)的相互作用數(shù)據(jù)與隨機(jī)組數(shù)據(jù)相比較,從而幫助用戶判斷特殊位點(diǎn)的相互作用在生物學(xué)上是否顯著,以及是否與染色質(zhì)三維結(jié)構(gòu)相關(guān)。
將Alu元件子族參與的相互作用從全局染色質(zhì)間與染色質(zhì)內(nèi)相互作用中提取出來,并根據(jù)Alu元件不同子族進(jìn)行分類。然后根據(jù)不同Alu元件子族間的平均相互作用強(qiáng)度,推算三維結(jié)構(gòu)上的距離關(guān)系,并與已知的Alu元件進(jìn)化樹相比較,從而判斷這些元件之間是否存在關(guān)聯(lián)。
首先使用bowtie2軟件對(duì)數(shù)據(jù)集進(jìn)行序列比對(duì),通過比對(duì)后得到染色質(zhì)相互作用序列對(duì)。將全部相互作用序列對(duì)進(jìn)行統(tǒng)計(jì),得到不同位點(diǎn)間相互作用頻率,根據(jù)上下閾值進(jìn)行過濾,然后按照相互作用頻率大小分成若干子集,將每一組內(nèi)的相互作用數(shù)據(jù)與隨機(jī)組數(shù)據(jù)相比較,從而判斷Alu元件的相互作用在生物學(xué)上是否顯著,以及是否與染色質(zhì)三維結(jié)構(gòu)相關(guān)。為了判斷差異是否真實(shí)存在,根據(jù)相應(yīng)Alu元件的位置信息,生成了與之對(duì)應(yīng)的隨機(jī)對(duì)照組進(jìn)行比較[27]。
經(jīng)計(jì)算發(fā)現(xiàn),在不同細(xì)胞系中Alu元件所參與的相互作用比例結(jié)果顯示均具有較高的一致性,Pearson相關(guān)系數(shù)均在0.997以上,說明Alu元件參與相互作用的比例在不同細(xì)胞系中是相對(duì)一致的,這些結(jié)果提示在不同細(xì)胞系中,Alu元件可能對(duì)染 色質(zhì)三維結(jié)構(gòu)的構(gòu)建、傳遞和維持發(fā)揮著重要的 作用。
根據(jù)UCSC上Repeat Masker數(shù)據(jù)集中Alu的位點(diǎn)信息,對(duì)其在不同強(qiáng)度的染色質(zhì)相互作用中所占的比例進(jìn)行了分析,因Hi-C實(shí)驗(yàn)數(shù)據(jù)是若干條序列,其中每條序列為染色質(zhì)上兩段相互靠近的不同位點(diǎn)連接形成,通過序列雙端比對(duì)即可獲取全基因組范圍內(nèi)的染色質(zhì)相互作用水平[28],將全部相互作用根據(jù)上下閾值進(jìn)行過濾,按照相互作用頻率大小分成若干子集,根據(jù)Alu元件的位點(diǎn)信息,將Alu元件參與的相互作用從全局相互作用中提取出來,進(jìn)一步計(jì)算其在不同子集中所占的比例。
結(jié)果發(fā)現(xiàn),Alu元件在高強(qiáng)度的相互作用中所占比例隨著強(qiáng)度增加而逐漸增高,這表明Alu在染色質(zhì)三維結(jié)構(gòu)構(gòu)建過程中發(fā)揮了重要的作用(圖1)。之前的研究也表明,Alu富集的區(qū)域會(huì)使序列有更高的GC含量,從而也會(huì)有更多的CpG島與甲基化水平,這些使序列和轉(zhuǎn)錄調(diào)控變得更加靈活,也就更有可能富集著較多的染色質(zhì)相互作用。同時(shí)Alu序列經(jīng)常在細(xì)胞中發(fā)揮增強(qiáng)子的作用,這也可能是其廣泛參與高強(qiáng)度染色質(zhì)相互作用的原因[29]。
圖1 Alu元件參與的染色質(zhì)相互作用分布
本研究從染色質(zhì)三維結(jié)構(gòu)層面上對(duì)Alu元件家族中不同子類之間的分布進(jìn)行了分析與驗(yàn)證。通過計(jì)算不同子類之間的相互作用強(qiáng)度,即染色質(zhì)三維結(jié)構(gòu)層次上的平均距離,結(jié)果見圖2。顏色越深表明兩種元件在染色質(zhì)三維結(jié)構(gòu)層面上平均距離越近,可以看出AluJ與AluS子家族呈現(xiàn)出一個(gè)局部的熱區(qū),而AluY子家族則與其余子家族間相互作用強(qiáng)度都較低。
為排除細(xì)胞類型特異性因素的影響,對(duì)GM12878、K562和IMR90 3個(gè)細(xì)胞系中Alu家族所有二級(jí)子類所參與的相互作用強(qiáng)度進(jìn)行了一致性檢驗(yàn)。結(jié)果發(fā)現(xiàn),3個(gè)細(xì)胞系的分析結(jié)果均具有相對(duì)較高的一致性,尤其是GM12878與K562,Pearson相關(guān)系數(shù)可以達(dá)到0.827,說明不同Alu子類參與的相互作用強(qiáng)度水平并不是細(xì)胞類型特異的,而是普遍存在且相對(duì)一致的。
從上面的研究中可以發(fā)現(xiàn),Alu的3個(gè)子家族AluJ、AluS和AluY在相互作用強(qiáng)度上存在著差異,因此對(duì)這3個(gè)子家族的相互作用強(qiáng)度進(jìn)行了進(jìn)一步的觀察,并根據(jù)三者之間相互作用強(qiáng)度繪制了熱圖(圖3),結(jié)果發(fā)現(xiàn)AluJ和AluS都是與自身相互作用最強(qiáng),與相鄰的子家族次強(qiáng),與距離最遠(yuǎn)的子家族相互作用強(qiáng)度最弱,也就是說,AluJ與AluS、AluS與AluY在染色質(zhì)三維結(jié)構(gòu)上距離較近,而AluJ與AluY距離較遠(yuǎn)。這一發(fā)現(xiàn)與之前文獻(xiàn)中報(bào)道的僅僅根據(jù)一維核酸序列分析得到的Alu家族進(jìn)化樹(圖4)相一致[30,31],AluY自身作用強(qiáng)度較弱,這也許與其較近年代才產(chǎn)生有關(guān),相對(duì)于AluJ (21 575個(gè))、AluS (16 536個(gè))而言,AluY的數(shù)量較少,只有1731個(gè),分布也較為分散,相互作用強(qiáng)度較弱。因此推測(cè),在進(jìn)一步的進(jìn)化過程中,當(dāng)Alu繼續(xù)衍生出新的子家族,AluY數(shù)量在人類基因組中逐漸增多時(shí),其參與的相互作用的強(qiáng)度也會(huì)隨之增加。根據(jù)相互作用強(qiáng)度做了層次聚類,發(fā)現(xiàn)與上面的推測(cè)也基本一致(圖5)。
圖2 Alu元件子族間相互作用強(qiáng)度分布
橫縱坐標(biāo)代表相應(yīng)的Alu元件子類。
圖3 Alu元件3個(gè)子族間相互作用強(qiáng)度分布
基于上述結(jié)果,推斷Alu元件在染色質(zhì)相互作用的強(qiáng)度與進(jìn)化上的關(guān)系是存在著一定的正相關(guān)性,也就是說一維序列進(jìn)化距離上比較接近的Alu元件在染色質(zhì)的三維結(jié)構(gòu)上也會(huì)彼此相互靠近。至于是因?yàn)樗鼈冞M(jìn)化上首先隨機(jī)跳躍擴(kuò)展到基因組中的不同區(qū)域,但是由于一維序列比較類似因而結(jié)合類似的、共同的調(diào)控因子從而導(dǎo)致所在區(qū)域染色質(zhì)三維結(jié)構(gòu)相互聚集,還是因?yàn)樵驹谌旧|(zhì)三維構(gòu)象上,原始的序列位點(diǎn)就比較接近,在進(jìn)一步的演化過程中,新出現(xiàn)的元件優(yōu)先擴(kuò)展到三維距離上更近的區(qū)域最終使得所有這些同族的Alu子族在三維分布上也比較接近,還需要后續(xù)更多的實(shí)驗(yàn)驗(yàn)證。
細(xì)胞核是真核生物獨(dú)有的一種細(xì)胞器,具有高度不均一、嚴(yán)格區(qū)室化、亞結(jié)構(gòu)相對(duì)獨(dú)立等特點(diǎn),可以從外至內(nèi)分為核被膜、核纖層、核基質(zhì)、染色質(zhì)及核仁層結(jié)構(gòu),其中核纖層、核基質(zhì)、核仁3者相互連接,構(gòu)成細(xì)胞核內(nèi)的骨架及支撐結(jié)構(gòu),染色質(zhì)圍繞這一骨架以復(fù)雜而精致的三維形態(tài)高度折疊,這一折疊能夠維持著相對(duì)穩(wěn)定且高度動(dòng)態(tài)變化的結(jié)構(gòu),在DNA復(fù)制、重排、重組、修復(fù)以及基因轉(zhuǎn)錄調(diào)控等方面發(fā)揮重要的功能[16,32,33]。
圖4 Alu元件進(jìn)化樹
圖5 Alu元件相互作用強(qiáng)度層次聚類圖
隨著技術(shù)的發(fā)展,人們逐漸發(fā)現(xiàn)染色質(zhì)與蛋白質(zhì)的多級(jí)折疊結(jié)構(gòu)相似,可以分成若干個(gè)不同的層級(jí)。DNA雙螺旋鏈通過纏繞形成核小體,核小體通過連接DNA形成核小體“串珠”結(jié)構(gòu),進(jìn)一步轉(zhuǎn)曲折疊形成螺線管顯微結(jié)構(gòu)。共定位、共表達(dá)的染色質(zhì)位點(diǎn)又在染色質(zhì)內(nèi)相互靠近,形成染色質(zhì)或DNA環(huán)結(jié)構(gòu)。染色質(zhì)環(huán)又進(jìn)一步根據(jù)相互作用折疊成拓?fù)浣Y(jié)構(gòu)域(TAD)[28,34]。經(jīng)研究發(fā)現(xiàn)同一TAD內(nèi)染色質(zhì)會(huì)存在較強(qiáng)的相互作用,TAD間的則相對(duì)較弱,且TAD的邊界在不同物種、不同類型的細(xì)胞系中會(huì)相對(duì)穩(wěn)定,因此TAD被認(rèn)為是染色質(zhì)三維構(gòu)象的結(jié)構(gòu)和功能基本單元。近期Bing等[35]整合比較了21種人類不同類型細(xì)胞的染色質(zhì)相互作用,進(jìn)一步證實(shí)TAD邊界在不同類型細(xì)胞相對(duì)保守,且發(fā)現(xiàn)了局部相互作用高度富集的染色質(zhì)活躍區(qū)域(frequently interacting regions, FIREs)與超級(jí)增強(qiáng)子部分重疊,表明染色質(zhì)三維折疊與細(xì)胞生命活動(dòng)緊密相關(guān)。
在哺乳動(dòng)物基因組中,一半以上都是各類重復(fù)元件序列。重復(fù)元件根據(jù)結(jié)構(gòu)和復(fù)制形式,可分為串聯(lián)重復(fù)序列(tandem repeat)和轉(zhuǎn)座元件(transpos-able elements)。轉(zhuǎn)座元件又可分為長散在重復(fù)元件(long interspersed nuclear elements, LINE)與短散在重復(fù)元件(short interspersed nuclear elements, SINE)等[36]。短散在重復(fù)元件又根據(jù)結(jié)構(gòu)等可分為Alu元件與Mir元件等不同子類。其中Alu元件在哺乳動(dòng)物尤其是靈長類動(dòng)物基因組中廣泛存在且比例較高,然而對(duì)其功能上的研究卻一直進(jìn)展緩慢,早起甚至被認(rèn)為是垃圾序列[1,37]。最近的一些研究才發(fā)現(xiàn)Alu元件在基因組的結(jié)構(gòu)及基因表達(dá)調(diào)控等方面發(fā)揮了一些功能[38,39]。
本研究發(fā)現(xiàn)Alu元件在染色質(zhì)三維構(gòu)象的動(dòng)態(tài)折疊過程中發(fā)揮了重要的作用,在不同種類的細(xì)胞系中均參與了較多高強(qiáng)度的染色質(zhì)間相互作用。且目前多有研究發(fā)現(xiàn),Alu元件與染色質(zhì)內(nèi)的增強(qiáng)子有強(qiáng)烈的相互作用。這些都表明Alu元件可能在染色質(zhì)三維結(jié)構(gòu)的構(gòu)建、傳遞和維持中發(fā)揮著作用。染色質(zhì)在細(xì)胞核內(nèi)維持著動(dòng)態(tài)平衡、永不纏繞的結(jié)構(gòu)狀態(tài),有著相對(duì)穩(wěn)定的結(jié)構(gòu),而這樣的結(jié)構(gòu)需要一定的網(wǎng)絡(luò)節(jié)點(diǎn)加以固定,因此認(rèn)為Alu元件在其中可能就發(fā)揮著高強(qiáng)度的相互作用網(wǎng)絡(luò)中心固定節(jié)點(diǎn)的作用,從而維持著染色質(zhì)動(dòng)態(tài)結(jié)構(gòu)的穩(wěn)定。
Alu元件在短散在重復(fù)序列中廣泛分布,且種類繁多[40],目前已有較多根據(jù)序列層面分析Alu家族演化過程的研究,但尚未有人從其在染色質(zhì)三維結(jié)構(gòu)上的分布來分析其演化過程。本研究基于染色質(zhì)三維結(jié)構(gòu)的數(shù)據(jù),對(duì)Alu元件的演化歷程進(jìn)行了分析,證明了一維序列演化關(guān)系上相對(duì)靠近的子類,在染色質(zhì)三維結(jié)構(gòu)中的相互作用強(qiáng)度也會(huì)較高,并用層次聚類的方式得到了基于染色質(zhì)相互作用強(qiáng)度的進(jìn)化樹。這些工作表明,Alu元件在染色質(zhì)上相互作用的強(qiáng)度與進(jìn)化上的關(guān)系存在著一定的正相關(guān),可目前的工作尚無法對(duì)這一現(xiàn)象的原因進(jìn)行證實(shí)。一方面有可能是因?yàn)樵谶M(jìn)化過程中,Alu元件初代子族隨機(jī)跳躍擴(kuò)展到基因組內(nèi),某些調(diào)控因子對(duì)這些初代子族進(jìn)行調(diào)控,使得這些子族所在的染色質(zhì)位點(diǎn)相互靠攏,對(duì)染色質(zhì)的三維構(gòu)象進(jìn)行改變;另一方面有可能在進(jìn)化過程中,Alu元件的初代子族本身就分布在空間距離比較接近的染色質(zhì)位點(diǎn),隨著基因組的演化,新產(chǎn)生的Alu元件子族也逐漸跳躍擴(kuò)展到三維距離相近的染色質(zhì)位點(diǎn)上,從而使得相同的Alu子族在染色質(zhì)三維分布上比較靠近。兩方面共同作用,從而使得Alu元件的演化與染色質(zhì)的三維構(gòu)象緊密相關(guān)。
[1] Makalowski W, Genomics. Not junk after all, 2003, 300(5623): 1246–1247.
[2] Wang W, Wang YP. Roles of alu family in human genome., 2007, 29(05): 641–645.王偉, 王亞平. Alu家族在人類基因組中的作用細(xì)胞生物學(xué)雜志, 2007, 29(05): 641–645.
[3] Lubelsky Y, Ulitsky I. Sequences enriched in alu repeats drive nuclear localization of long rnas in human cells, 2018. 555(7694): 107–111.
[4] Akta? T, Av?ar Il?k I, Maticzka D, Bhardwaj V, Pessoa Rodrigues C, Mittler G, Manke T, Backofen R, Akhtar A. Dhx9 suppresses rna processing defects originating from the alu invasion of the human genome, 2017, 544(7648): 115–119.
[5] Su M, Han D, Boyd-Kirkup J, Yu X, Han JD. Evolution of alu elements toward enhancers, 2014, 7(2): 376–385.
[6] Elbarbary RA, Maquat LE. Distinct mechanisms obviate the potentially toxic effects of Inverted-Repeat alu elements on cellular rna metabolism, 2017, 24(6): 496–498.
[7] Nakama M, Otsuka H, Ago Y, Sasai H, Abdelkreem E, Aoyama Y, Fukao T. Intronic antisense alu elements have a negative splicing effect on the inclusion of adjacent downstream exons, 2018, 664: 84–89.
[8] Dixon JR, Selvaraj S, Yue F, Kim A, Li Y, Shen Y, Hu M, Liu JS, Ren B. Topological domains in mammalian genomes identified by analysis of chromatin interactions, 2012, 485(7398): 376–380.
[9] He C, Li P, Zhang Y, Shi ML, Zhang XY, Xie DJ, Shen WL, Zhao ZH. Bioinformatics analysis of MARs’extensive involvement of forming genome 3D structure., 2017, 33(6): 638–644.何超, 李平, 張彥, 師明磊, 張香媛, 謝德建, 沈文龍, 趙志虎. 核基質(zhì)附著區(qū)廣泛參與基因組三維結(jié)構(gòu)折疊的生物信息學(xué)分析中國生物化學(xué)與分子生物學(xué)報(bào), 2017,33(6): 638–644.
[10] Pope BD, Ryba T, Dileep V, Yue F, Wu W, Denas O, Vera DL, Wang Y, Hansen RS, Canfield TK, Thurman RE, Cheng Y, Gülsoy G, Dennis JH, Snyder MP, Stamatoyannopoulos JA, Taylor J, Hardison RC, Kahveci T, Ren B, Gilbert DM. Topologically associating domains are stable units of Replication-Timing regulation, 2014, 515(7527): 402–405.
[11] Dekker J, Rippe K, Dekker M, Kleckner N. Capturing chromosome conformation, 2002, 295(5558): 1306–1311.
[12] Zhao Z, Tavoosidana G, Sj?linder M, G?nd?r A, Mariano P, Wang S, Kanduri C, Lezcano M, Sandhu KS, Singh U, Pant V, Tiwari V, Kurukuti S, Ohlsson R. Circular chromosome conformation capture (4c) uncovers extensive networks of epigenetically regulated Intra- and interchromosomal interactions, 2006, 38(11): 1341–1347.
[13] Dostie J, Richmond TA, Arnaout RA, Selzer RR, Lee WL, Honan TA, Rubio ED, Krumm A, Lamb J, Nusbaum C, Green RD, Dekker J. Chromosome conformation capture carbon copy (5c): a massively parallel solution for mapping interactions between genomic elements, 2006, 16(10): 1299–1309.
[14] Lieberman-Aiden E, van Berkum NL, Williams L, Imakaev M, Ragoczy T, Telling A, Amit I, Lajoie BR, Sabo PJ, Dorschner MO, Sandstrom R, Bernstein B, Bender MA, Groudine M, Gnirke A, Stamatoyannopoulos J, Mirny LA, Lander ES, Dekker J. Comprehensive mapping of Long-Range interactions reveals folding principles of the human genome, 2009, 326(5950): 289–293.
[15] Zhang XY, He C, Ye BY, Xie DJ, Shi ML, Zhang Y, Shen WL, Li P, Zhao ZH. Optimization and quality control of genome-wide Hi-C library preparation(), 2017, 39(9): 847–855.張香媛, 何超, 葉丙雨, 謝德建, 師明磊, 張彥, 沈文龍, 李平, 趙志虎. 全基因組染色質(zhì)相互作用Hi-C 文庫制備的優(yōu)化及其質(zhì)量控制. 遺傳, 2017, 39(9): 847–855.
[16] Ma W, Ay F, Lee C, Gulsoy G, Deng X, Cook S, Hesson J, Cavanaugh C, Ware CB, Krumm A, Shendure J, Blau CA, Disteche CM, Noble WS, Duan Z. Fine-Scale chromatin interaction maps reveal the Cis-Regulatory landscape of human lincrna genes, 2015, 12(1): 71–78.
[17] Hsieh TH, Weiner A, Lajoie B, Dekker J, Friedman N, Rando OJ. Mapping nucleosome resolution chromosome folding in yeast by Micro-C, 2015, 162(1): 108–119.
[18] Dryden NH, Broome LR, Dudbridge F, Johnson N, Orr N, Schoenfelder S, Nagano T, Andrews S, Wingett S, Kozarewa I, Assiotis I, Fenwick K, Maguire SL, Campbell J, Natrajan R, Lambros M, Perrakis E, Ashworth A, Fraser P, Fletcher O. Unbiased analysis of potential targets of breast cancer susceptibility loci by capture Hi-C, 2014, 24(11): 1854–1868.
[19] Rao SS, Huntley MH, Durand NC, Stamenova EK, Bochkov ID, Robinson JT, Sanborn AL, Machol I, Omer AD, Lander ES, Aiden EL. A 3d map of the human genome at kilobase resolution reveals principles of chromatin looping, 2014, 159(7): 1665–1680.
[20] Olivares-Chauvet P, Mukamel Z, Lifshitz A, Schwartzman O, Elkayam NO, Lubling Y, Deikus G, Sebra RP, Tanay A. Capturing pairwise and Multi-Way chromosomal conformations using chromosomal walks, 2016, 540(7632): 296–300.
[21] Denker A, de Laat W. The second decade of 3c technologies: detailed insights into nuclear organization, 2016, 30(12): 1357–1382.
[22] Dekker J, Belmont AS, Guttman M, Leshyk VO, Lis JT, Lomvardas S, Mirny LA, O'Shea CC, Park PJ, Ren B, Politz JCR, Shendure J, Zhong S, 4D Nucleome Network. The 4d nucleome project, 2017, 549(7671): 219–226.
[23] Chen N. Using repeatmasker to identify repetitive elements in genomic sequences, 2004, Chapter 4: Unit 4. 10.
[24] Harmston N, Ing-Simmons E, Perry M, Bare?i? A, Lenhard B. Genomicinteractions: an R/Bioconductor package for manipulating and investigating chromatin interaction data, 2015, 16: 963.
[25] Akdemir KC, Chin L. Hicplotter integrates genomic data with interaction matrices, 2015, 16: 198.
[26] Servant N, Varoquaux N, Lajoie BR, Viara E, Chen CJ, Vert JP, Heard E, Dekker J, Barillot E. Hic-Pro: an optimized and flexible pipeline for Hi-C data processing, 2015, 16: 259.
[27] Lajoie BR, Dekker J, Kaplan N. The hitchhiker's guide to Hi-C analysis: practical guidelines, 2015, 72: 65–75.
[28] Cremer T, Cremer M, Cremer C. The 4d Nucleome: genome compartmentalization in an evolutionary context, 2018, 83(4): 313–325.
[29] Cournac A, Koszul R, Mozziconacci J. The 3d folding of metazoan genomes correlates with the association of sImilarrepetitive elements, 2016, 44(1): 245–255.
[30] Kapitonov V, Jurka J. The age of alu subfamilies, 1996, 42(1): 59–65.
[31] Price AL, Eskin E, Pevzner PA. Whole-Genome analysis of alu repeat elements reveals complex evolutionary history, 2004, 14(11): 2245–2252.
[32] Xie DJ, Shi ML, Zhang Y, Wang TY, Shen WL, Ye BY, Li P, He C, Zhang XY, Zhao ZH. Construction of ctcf degradation cell line by Crispr/Cas9 mediated genome editing, 2016, 38(7): 651–657.謝德建, 師明磊, 張彥, 王天藝, 沈文龍, 葉丙雨, 李平, 何超, 張香媛, 趙志虎. 利用CRISPR/Cas9 技術(shù)構(gòu)建CTCF 蛋白降解細(xì)胞系. 遺傳, 2016, 38(7): 651–657.
[33] Beagrie RA, Scialdone A, Schueler M, Kraemer DC, Chotalia M, Xie SQ, Barbieri M, de Santiago I, Lavitas LM, Branco MR, Fraser J, Dostie J, Game L, Dillon N, Edwards PA, Nicodemi M, Pombo A. Complex Multi-Enhancer contacts captured by genome architecture mapping, 2017, 543(7646): 519–524.
[34] Marti-Renom MA, Almouzni G, Bickmore WA, Bystricky K, Cavalli G, Fraser P, Gasser SM, Giorgetti L, Heard E, Nicodemi M, Nollmann M, Orozco M, Pombo A, Torres-Padilla ME. Challenges and guidelines toward 4d nucleome data and model standards, 2018, 50(10): 1352–1358.
[35] Schmitt AD, Hu M, Jung I, Xu Z, Qiu Y, Tan CL, Li Y, Lin S, Lin Y, Barr CL, Ren B. A compendium of chromatin contact maps reveals spatially active regions in the human genome, 2016, 17(8): 2042–2059.
[36] Chuong EB, Elde NC, Feschotte C. Regulatory activities of transposable elements: from conflicts to benefits, 2017, 18(2): 71–86.
[37] Ge SX. Exploratory bioinformatics investigation reveals importance of "Junk" DNA in early embryo development, 2017, 18(1): 200.
[38] Padeken J, Zeller P, Gasser SM. Repeat DNA in genome organization and stability, 2015, 31: 12–19.
[39] Gu Z, Jin K, Crabbe MJC, Zhang Y, Liu X, Huang Y, Hua M, Nan P, Zhang Z, Zhong Y. Enrichment analysis of alu elements with different spatial chromatin proximity in the human genome, 2016, 7(4): 250–266.
[40] Tang LM, Pu WY, Xiao L, Li K, Guo ZF, Research progress of a component., 2014, (08): 1–2.湯麗夢(mèng), 浦汪洋, 肖莉, 李凱, 郭紫芬. Alu元件研究進(jìn)展生物技術(shù)世界, 2014, (08): 1–2.
Bioinformatics analysis of Alu components at the level of genome 3D structure
Chao He1,2, Wenlong Shen2, Ping Li2, Yan Zhang2, Jing Zeng1, Zuoming Yin1, Zhihu Zhao2
The interphase chromatin is folded in the nucleus in a hierarchical manner, including the nucleosome, the "beads on a string" structure composed of nucleosomes, the solenoid fiber structure, the chromatin/DNA loop structure (chromatin/DNA loop), and the topologically associated domain (TAD). Among them, TAD is considered to be the basic unit of the 3D structure of chromatin because it is relatively stable and conserved in different cell types. Alu elements occupy a large proportion in the mammalian genomes. There are a wide variety of Alu elements, but their functional characterizations are limited to date. This study investigates the role of Alu elements in the assembly of 3D chromatin conformation. The evolutionary process of the Alu subfamily was explored by the distance relationship of the 3D structure of chromatin. We found that the proportion of Alu elements in high-density chromatin interaction increased with higher similarity, indicating that Alu plays an important role in the construction of chromatin 3D structure. There is a certain positive correlation between the strength of the upper interaction and the evolutionary relationship. In sum, the Alu elements with relatively close distances in the 1D sequence will also be close to each other in the 3D structure of chromatin.
genome 3D structure;Alu component;bioinformatics;evolutionary tree
2018-10-30;
2019-01-01
國家自然科學(xué)基金項(xiàng)目(編號(hào):31370762,31030026,31272416,81372218)資助[Supported by the National Natural Science Foundation of China (Nos. 31370762, 31030026, 31272416, 81372218)]
何超,碩士,工程師,研究方向:生物信息學(xué)。E-mail: hechao2010@tsinghua.org.cn
殷作明,西藏軍區(qū)總醫(yī)院院長,研究方向:高原病、戰(zhàn)創(chuàng)傷。E-mail: yinzuoming@163.com趙志虎,軍事科學(xué)院軍事醫(yī)學(xué)研究院研究員,研究方向:染色質(zhì)三維結(jié)構(gòu)。E-mail: zhaozh@bmi.ac.cn
10.16288/j.yczz.18-296
2019/1/14 13:15:30
URI: http://kns.cnki.net/kcms/detail/11.1913.R.20190114.1315.011.html
(責(zé)任編委: 吳強(qiáng))