郭亞,吳強(qiáng)上海交通大學(xué)系統(tǒng)生物醫(yī)學(xué)研究院比較生物醫(yī)學(xué)研究中心,系統(tǒng)生物醫(yī)學(xué)教育部重點(diǎn)實(shí)驗(yàn)室,上海 200240
采用DNA片段編輯技術(shù)反轉(zhuǎn)CTCF結(jié)合位點(diǎn)改變基因組拓?fù)浣Y(jié)構(gòu)和增強(qiáng)子與啟動(dòng)子功能
郭亞,吳強(qiáng)
上海交通大學(xué)系統(tǒng)生物醫(yī)學(xué)研究院比較生物醫(yī)學(xué)研究中心,系統(tǒng)生物醫(yī)學(xué)教育部重點(diǎn)實(shí)驗(yàn)室,上海 200240
郭亞(博士研究生)
人類的祖先很早就觀察到生物性狀的遺傳現(xiàn)象,但是直到19世紀(jì)60年代孟德?tīng)柊l(fā)現(xiàn)遺傳因子的分離定律和自由組合定律,遺傳學(xué)才真正建立并快速發(fā)展起來(lái)。盡管人類很快有了基因的概念,并認(rèn)識(shí)了核酸和蛋白質(zhì),但直到1953年沃森和克里克闡明了DNA的雙螺旋結(jié)構(gòu)之后,人類對(duì)基因才有了本質(zhì)的認(rèn)識(shí),從而開(kāi)啟了分子遺傳學(xué)時(shí)代。隨著人類基因組計(jì)劃測(cè)序工作的完成以及最近大規(guī)模測(cè)序技術(shù)的突破,越來(lái)越多的研究發(fā)現(xiàn)很多遺傳疾病相關(guān)位點(diǎn)不僅位于啟動(dòng)子和基因編碼區(qū),而且也大量地存在于調(diào)控組織發(fā)育基因表達(dá)的增強(qiáng)子中。更多的遺傳疾病相關(guān)位點(diǎn)則位于功能未知的基因組區(qū)域。近年研究發(fā)現(xiàn)這些遺傳疾病相關(guān)位點(diǎn)可能與三維基因組(3D genome)息息相關(guān)并通過(guò)染色體高級(jí)拓?fù)浼軜?gòu) (Higher-order topological chromosome architecture)起作用。
在細(xì)胞分裂間期,人類大約兩米長(zhǎng)的30億DNA堿基對(duì)在核酸和蛋白質(zhì)相互作用下高度有機(jī)折疊在約5~10 μm的細(xì)胞核內(nèi),形成復(fù)雜的三維基因組。這種三維基因組隨著時(shí)間的推移不斷變化形成所謂的四維細(xì)胞核組 (4D nucleome),提供了細(xì)胞核發(fā)揮各種生物學(xué)功能的物質(zhì)基礎(chǔ),包括在生命發(fā)育過(guò)程中實(shí)現(xiàn)精準(zhǔn)的組織和細(xì)胞特異性基因表達(dá)調(diào)控。在細(xì)胞核中,不同染色體占據(jù)不同的區(qū)域,被稱為“染色體領(lǐng)地” (Chromosome territory),染色體領(lǐng)地內(nèi)又包含很多相對(duì)穩(wěn)定的染色質(zhì)拓?fù)浣Y(jié)構(gòu)域 (Topological chromatin domain)。在染色質(zhì)拓?fù)浣Y(jié)構(gòu)域內(nèi)存在著各種特異性的長(zhǎng)距離DNA間相互作用,如增強(qiáng)子、沉默子、絕緣子和啟動(dòng)子等DNA功能元件之間的相互作用。近年研究發(fā)現(xiàn)哺乳動(dòng)物基因組中增強(qiáng)子數(shù)量遠(yuǎn)大于啟動(dòng)子的數(shù)量,并且基因表達(dá)可能受到多個(gè)啟動(dòng)子的調(diào)控,這種特異性的增強(qiáng)子-啟動(dòng)子相互作用依賴于特定 DNA元件之間的三維高級(jí)空間構(gòu)象。絕緣子元件在形成特異性DNA間相互作用中扮演著重要的角色,但是其分子機(jī)制還不清楚。
人類原鈣粘蛋白 (Protocadherin, Pcdh) 基因座包括Pcdhα、Pcdhβ和Pcdhγ在內(nèi)的3個(gè)基因簇,在腦發(fā)育和腦認(rèn)知中起到重要作用,原鈣粘蛋白的突變與自閉癥和精神分裂癥等復(fù)雜精神疾病相關(guān)。除原鈣粘蛋白αc2、β1、γc4和γc5啟動(dòng)子外的每一個(gè)原鈣粘蛋白基因啟動(dòng)子區(qū)都包括CBS位點(diǎn)。這些啟動(dòng)子 CBS位點(diǎn)都是正向的;此外增強(qiáng)子區(qū)也包括CBS位點(diǎn),但增強(qiáng)子CBS位點(diǎn)卻是反向的。CTCF蛋白能夠特異性地介導(dǎo)原鈣粘蛋白α增強(qiáng)子與啟動(dòng)子之間的長(zhǎng)距離染色質(zhì)環(huán)化,而且CBS位點(diǎn)位于染色質(zhì)環(huán)的錨定點(diǎn) (Anchor point) 并相互靠近且呈現(xiàn)相反的方向。原鈣粘蛋白增強(qiáng)子與啟動(dòng)子特異性染色質(zhì)環(huán)化可以實(shí)現(xiàn)在腦發(fā)育中單個(gè)細(xì)胞中原鈣粘蛋白啟動(dòng)子的選擇性激活和原鈣粘蛋白基因的組合表達(dá)。這種獨(dú)特的CBS位點(diǎn)的方向性可能與其介導(dǎo)的特異性增強(qiáng)子與啟動(dòng)子環(huán)化相關(guān)并在神經(jīng)發(fā)育中具有重要的基因調(diào)控功能。該研究結(jié)果于 2012年 12月發(fā)表于Proc Natl Acad Sci USA (DOI:10.1073/pnas. 1219280110)。
本研究團(tuán)隊(duì)通過(guò)多種基于染色質(zhì)構(gòu)象捕獲技術(shù)的方法進(jìn)一步發(fā)現(xiàn),原鈣粘蛋白β和γ基因簇具有共同的調(diào)控區(qū)域,其調(diào)控區(qū)域與原鈣粘蛋白 β和 γ基因的啟動(dòng)子形成染色質(zhì)環(huán)化,這些相互重疊的染色質(zhì)環(huán)具有特定的方向性,形成一個(gè)CTCF/Cohesin介導(dǎo)的原鈣粘蛋白 β和 γ染色質(zhì)拓?fù)浣Y(jié)構(gòu)域(CTCF/Cohesin-mediated chromatin domain: CCD);但是原鈣粘蛋白α具有相對(duì)獨(dú)立的調(diào)控區(qū),其與原鈣粘蛋白α基因形成染色質(zhì)環(huán)化,這些染色質(zhì)環(huán)同樣具有方向性并形成原鈣粘蛋白α染色質(zhì)拓?fù)浣Y(jié)構(gòu)域。所以原鈣粘蛋白基因簇包含兩個(gè)相對(duì)獨(dú)立的CTCF/Cohesin介導(dǎo)的染色質(zhì)拓?fù)浣Y(jié)構(gòu)域 (CCD),而且原鈣粘蛋白基因簇內(nèi)CTCF介導(dǎo)的相互作用總是在正向-負(fù)向CBS位點(diǎn)之間建立。為闡明這種CBS位點(diǎn)的排列方向與長(zhǎng)距離染色質(zhì)相互作用的關(guān)系,本研究團(tuán)隊(duì)在CRISPR技術(shù)基礎(chǔ)上利用Cas9核酸酶和一對(duì)sgRNA建立了一種高效的原位DNA片段編輯方法,該方法于2015年3月發(fā)表于J Mol Cell Biol (DOI: 10.1093/jmcb/ mjv016),詳見(jiàn)本期“基因組編輯技術(shù)”專刊中綜述文章《CRISPR/Cas9 系統(tǒng)在基因組DNA片段編輯中的應(yīng)用》對(duì)該方法的介紹。
通過(guò)原位DNA片段編輯方法,本研究團(tuán)隊(duì)反轉(zhuǎn)了包含CBS位點(diǎn)增強(qiáng)子并進(jìn)一步研究發(fā)現(xiàn)增強(qiáng)子反轉(zhuǎn)后其與上游Pcdhα啟動(dòng)子的相互作用顯著降低,但產(chǎn)生了與下游Pcdhβ和Pcdhγ啟動(dòng)子的新的相互作用,也就是說(shuō)反轉(zhuǎn)引起染色質(zhì)高級(jí)拓?fù)浼軜?gòu)改變。因此CBS位點(diǎn)的方向性決定了染色質(zhì)環(huán)化的方向性從而決定了染色質(zhì)拓?fù)浣Y(jié)構(gòu)的形成。通過(guò) RNA-seq實(shí)驗(yàn)發(fā)現(xiàn),增強(qiáng)子反轉(zhuǎn)造成多個(gè) Pcdhα、Pcdhβ和Pcdhγ基因顯著降低。這些結(jié)果表明反轉(zhuǎn)增強(qiáng)子能夠改變?cè)}粘蛋白范圍內(nèi)的增強(qiáng)子與啟動(dòng)子間的相互作用,并引起原鈣粘蛋白基因表達(dá)的改變。利用計(jì)算生物學(xué)方法進(jìn)一步驗(yàn)證了CBS位點(diǎn)排列方向與其相互作用形成染色質(zhì)環(huán)化的方向密切相關(guān),即大多數(shù)CTCF和Cohesin介導(dǎo)的染色質(zhì)相互作用都是在正向-負(fù)向CBS位點(diǎn)之間建立的,少量CTCF和Cohesin介導(dǎo)的相互作用是在同向的CBS位點(diǎn)之間建立的。最后,通過(guò) CRISPR技術(shù)在 β珠蛋白(β-globin) 基因簇區(qū)域敲除或反轉(zhuǎn)CBS位點(diǎn)進(jìn)一步驗(yàn)證了該規(guī)律的普適性。因此,基因組中至少一部分含有CBS的增強(qiáng)子是以方向依賴性的方式調(diào)控其靶向基因,而不是通常認(rèn)為的增強(qiáng)子調(diào)控基因表達(dá)不具有方向性。該研究結(jié)果揭示了三維DNA結(jié)構(gòu)是如何由一維的DNA序列所“編碼”,因而闡明了DNA遺傳信息在三維基因組結(jié)構(gòu)建立與形成中的重要作用 (圖 1),對(duì)于從三維基因組角度認(rèn)識(shí)各種遺傳性疾病的根本病因以及腫瘤的發(fā)生發(fā)展機(jī)理具有重要意義。該項(xiàng)研究結(jié)果于2015年8月發(fā)表于Cell(DOI: 10.1016/j.cell.2015. 07.038)。
圖1 基因組范圍內(nèi)CTCF結(jié)合位點(diǎn)(CBS)的一維DNA序列信息參與決定三維DNA結(jié)構(gòu)