染色質轉座酶可及性測序研究進展

2020-04-21 02:32:18吳杰全建平葉勇吳珍芳楊杰楊明鄭恩琴

遺傳 2020年4期

關鍵詞：轉座子染色質基因組

吳杰，全建平，葉勇，吳珍芳，楊杰，楊明，鄭恩琴

綜述

染色質轉座酶可及性測序研究進展

吳杰1，全建平1，葉勇1，吳珍芳1，楊杰1，楊明2，鄭恩琴1

1. 華南農業(yè)大學動物科學學院，國家生豬種業(yè)工程技術研究中心，廣州 510642 2. 仲愷農業(yè)工程學院，動物科技學院，廣州 510225

染色質轉座酶可及性測序(assay for transposase-accessible chromatin with high-throughput sequencing, ATAC-seq)誕生于2013年，具有比脫氧核糖核酸酶I超敏感位點測序(deoxyribonuclease I hypersensitive site sequencing, DNase-seq)和微球菌核酸酶敏感位點測序(micrococcal nuclease sequencing, MNase-seq)更快速、靈敏、簡便的優(yōu)點，是目前分析全基因組范圍染色質開放區(qū)域的熱點技術。通過該技術能獲得染色質開放區(qū)域的相關信息，從而映射出轉錄因子等調控蛋白的結合區(qū)域和核小體定位等信息，對于研究表觀遺傳分子機制具有重要意義。本文比較了5種獲取染色質開放區(qū)域技術的優(yōu)缺點，重點介紹了ATAC-seq的原理和主要流程，描述了利用ATAC-seq技術研究染色質開放區(qū)域的發(fā)展概況以及ATAC-seq的相關應用，期望對真核生物全基因組水平的染色質開放區(qū)域研究、順式調控元件鑒定以及遺傳調控網絡的解析等提供借鑒。

染色質轉座酶可及性測序；染色質開放區(qū)域；Tn5轉座酶；表觀遺傳修飾；轉錄因子

自然界中的生物根據其細胞核類型可以分為原核生物和真核生物，其中原核生物的細胞核無核膜包被，其遺傳物質DNA裸露在外；而真核生物細胞的細胞核DNA并非裸露，而是以左旋超螺旋的方式(約147 bp)繞八聚體結構的組蛋白1.67圈，進而形成核小體[1,2]。相鄰核小體的連接區(qū)由10~80 bp的游離DNA與組蛋白H1共同構成；核小體通過連接區(qū)的連接形成串珠式結構，這種串聯(lián)結構進一步折疊、凝聚，形成染色質；最終多條染色質以高度螺旋化狀態(tài)包裹于細胞核中[3]。研究顯示，染色質開放區(qū)域的基因組占總DNA序列的2%~3%，且超過90%的開放區(qū)域均與轉錄因子(transcription factor, TF)的結合相關[4]。以TF為代表的調控因子可與其他染色質結合蛋白相互作用，從而動態(tài)調控和維持染色質穩(wěn)態(tài)，在發(fā)育過程的調控中發(fā)揮著不可替代的作用[5~7]。在DNA復制或轉錄過程中，DNA的折疊結構被打開，一些染色質區(qū)域處于開放狀態(tài)，調控因子(如轉錄因子)會與這些裸露的無核小體結合的DNA部位結合，進而調控DNA的復制或轉錄過程[8]。此外，有研究表明，DNA折疊、凝聚形成的染色質物理結構并不是一成不變的，仍然能夠發(fā)生動態(tài)的表觀遺傳修飾，如DNA甲基化、組蛋白修飾、染色質重塑等[8~11]。因此，通過了解相關獲取染色質開放信息的技術，學習技術原理和應用，明確了這些技術對于基因組調控元件的鑒定、轉錄因子結合位點的識別及轉錄調控機制等研究均具有重要意義。本文主要綜述了染色質可及性研究技術的發(fā)展概況、以及染色質轉座酶可及性測序(assay for transposase acces-sible chromatin with high-throughput sequencing, ATAC-seq)技術的原理和應用，以期為表觀遺傳學研究提供重要的參考。

1 染色質開放區(qū)域研究技術的發(fā)展歷程

染色質開放區(qū)域的研究源于人們發(fā)現某些染色質特定位點表現出對DNase I酶切的高度敏感性[12~15]。后期研究表明，這些DNase I敏感位點(deoxyribonuclease I hypersensitive site, DHS)通常是順式調控元件所在區(qū)域[16]，其染色質裸露、結構疏松，可與轉錄因子結合，從而便于DNase I與之結合并剪切，進而表現出高度敏感性[17]?；谏鲜鲈?，染色質開放區(qū)域的鑒定工作也隨之展開。最先開展的是DHS鑒定分析工作，該分析依賴DNase I高度敏感性特點，并與 Southern 雜交技術結合，不過很快發(fā)現該方法的靈敏性和精確性都較低，并且耗時費力[18,19]。隨著高通量測序技術(high-throug-hput sequencing, HTS)的發(fā)展及測序成本不斷降低，衍生出一系列研究染色質開放區(qū)域的技術與方法，如脫氧核糖核酸酶I超敏感位點測序(deoxyribonu-clease I hypersensitive site sequencing, DNase-seq)[20]、微球菌核酸酶敏感位點測序(micrococcal nuclease sequencing, MNase-seq)[11]、甲醛輔助性調控元件分離測序(formaldehyde-assisted isolation of regulatory elements followed by sequencing, FAIRE-seq)[21]、核小體定位和甲基化組測序(nucleosome occupancy and methylome sequencing, NOMe-seq)[22]和ATAC-seq。在上述5種技術中，獲取染色質開放信息的方式分為3種：DNase-seq、MNase-seq以及ATAC-seq采用酶切法；FAIRE-seq采用物理斷裂法；NOMe-seq技術則利用甲基化修飾。5種技術的具體信息見表1。ATAC-seq與其他4種技術相比表現出更為簡便和高效的優(yōu)勢，一經發(fā)明就被廣泛采用，成為當前染色質開放區(qū)域獲取的前沿技術。下面將對上述染色質開放區(qū)域獲取技術的發(fā)展歷程、作用機理以及研究進程進行描述。

表1 5種染色質可及性研究技術介紹

1.1 DNase-seq及其衍生技術

早在2006年，DNase-seq技術便被用于DHS區(qū)域的探究。該技術過程可簡單概括為：先通過裂解劑裂解細胞釋放細胞核，選用最佳濃度DNase I消化細胞核并包埋于低熔點凝膠瓊脂糖塞中，以減少額外的隨機剪切；隨后，將DNA片段平末端化并在兩端連接上接頭，通過PCR擴增目的片段完成測序文庫構建[20]。DNase-seq鑒定大多數轉錄因子的結合位點的精確性主要取決于酶切片段大小，其中短片段(<100 bp)比較長片段效果更佳[23]。DNase-seq技術的建立使得DHS的分析鑒定變得更簡便，但存在細胞量需要量大(1,000,000~10,000,000)、樣品制備過程復雜且耗時、最優(yōu)酶濃度確定過程繁瑣等缺點[24]。2015年，Cumbie等[25]發(fā)現使用傳統(tǒng)DNase-seq技術消化擬南芥()時，無法獲得足夠的DNA量用于建庫測序。其主要原因在于植物細胞碎片及根毛等雜質占據了凝膠瓊脂糖塞，從而導致DNA產量過低。因此，他們在傳統(tǒng)DNase-seq基礎上建立了DNase I-SIM (for simplified in-nucleus method)技術。該技術在DNase I消化細胞核前，先采用Percoll層析液對細胞核進行初步純化；經DNase I消化后，在T4 DNA聚合酶的作用下，DNA片段的雙鏈形成平末端，而不包埋于瓊脂糖塞中。這種改進的DNase I-SIM技術的優(yōu)點在于，Percoll梯度純化后的細胞核及T4 DNA聚合酶處理后的DNA片段依然具備高度完整性，在極大縮減DNase- seq文庫制備時間的同時，有效提升了DNA片段的回收效率。

1.2 MNase-seq技術

MNase-seq技術發(fā)明于2008年，其原理與DNase-seq大體相似，不同之處在于，該技術采用的是微球菌核酸酶替代DNase I酶，進而對細胞核中的DNA進行切割。該技術可通過揭示由核小體和其他調節(jié)因子占據的基因組區(qū)域，從而間接探測染色質可及性并繪制核小體圖譜[26]。與DNase-seq相比，MNase-seq具有操作簡單、后期數據處理更方便等優(yōu)點。然而，MNase-seq技術仍存在一些技術弊端。首先，其靈敏度同樣受到細胞樣本數量(1,000,000~ 10,000,000)、酶濃度和切割溫度等因素的影響[27]；其次，微球菌核酸酶對A/T堿基序列存在切割傾向性[28]，從而無法精確切割核小體邊界[29]。

1.3 FAIRE-seq及其衍生技術

2007年，Giresi等[21]開發(fā)了一種物理打斷DNA雙鏈的技術，即FAIRE-seq技術，其過程相較DNase-seq更為簡便。該技術是利用超聲波打斷已用甲醛交聯(lián)的DNA序列，在未解交聯(lián)的條件下，通過酚-氯仿抽提，提取位于水相中的游離DNA并測序，最終獲得相應的染色質開放區(qū)域信息[21]。FAIRE-seq具有不需要酶、不需要分離出細胞核、不受細胞類型限制、沒有序列切割特異性[30]、以及在增強子區(qū)域具有更高的覆蓋率等優(yōu)點[31]，但同樣面臨著樣品需求量大的限制(需要100,000~10,000,000的細胞)[24]。值得注意的是，該技術難以確定甲醛最佳交聯(lián)程度，從而成為限制該技術應用的最大瓶頸。究其原因在于，DNA與甲醛過度交聯(lián)或不充分交聯(lián)，均會影響到最終的測序結果[32]。2009年，Auerbach等[33]在此基礎上創(chuàng)建了超聲處理交聯(lián)染色質測序(sonication of cross-linked chromatin sequencing, Sono-seq)技術，其原理與FAIRE-seq相同，其主要區(qū)別在于，FAIRE- seq是在酚-氯仿抽提之后進行大小分級，選擇特定大小范圍如100~350 bp范圍進行建庫測序。由于存在大小分級選擇這一關鍵步驟，Sono-seq與FARIRE- seq各自所鑒定的Peaks存在明顯的區(qū)別。

1.4 NOMe-seq技術

NOMe-seq技術由Kelly等[22]于2012年發(fā)明，該技術利用GpC甲基轉移酶(M.CviPI)通過甲基化修飾的方式處理開放區(qū)域的GpC二核苷酸。因為GpCm不存在于人類基因組中，M.CviPI使GpC甲基化為無內源背景的GpCm。隨后，經過亞硫酸氫鹽處理和全基因組測序，可同時獲得含GpC和CpG二核苷酸的相關信息，從而能在全基因組范圍內確定核小體的位置，同時還能獲得內源DNA甲基化的信息[22,34]。NOMe-seq需要的細胞量為1,000,000個，材料處理因為不需要使DNA斷裂，因此不會產生富集偏差，從而可降低假陽性的概率。但由于NOMe-seq不是基于先富集目的片段，然后再測序的方法，因此需要大量的測序讀長數據以獲得足夠的深度及基因組覆蓋率，從而獲取整個基因組的開放性水平[35]。

1.5 ATAC-seq技術

以上4種技術雖然都能應用于染色質開放性的表觀基因組學研究，但通病是通常需要幾萬至數百萬個細胞作為輸入材料用以平均細胞群體的異質性，涉及到復雜、耗時的樣品制備過程，且不能同時探究核小體定位、染色質可接近性和TF結合的相互作用。而多數情況下，很多重要且稀少的細胞亞型可能很難提供足夠的樣品量進行全基因組染色質可及性分析。2013年，Buenrostro等[36]建立了材料需求量少、過程更為簡便、效率更高的ATAC-seq技術。該技術僅需兩步就能從500~50,000個細胞捕獲染色質開放區(qū)域[36,37]。與其他技術方法不同的是，ATAC-seq利用高度活躍的Tn5轉座酶代替DNase I核酸酶、微球菌核酸酶MNase等分析染色質易接近性，能夠將目的DNA片段化、末端修復和加上測序所需的接頭(adaptor)一步完成，從而使建庫步驟變得極為簡便，達到投入量更低、通量更高的建庫效果。Tn5轉座子的深入研究以及高通量技術的快速發(fā)展使得ATAC-seq技術能夠成功建立并廣泛應用，ATAC-seq技術以及其衍生技術如轉座子超敏位點測序(transposome hypersensitive sites sequencing, THS-seq)、Omni-ATAC技術使染色質開放區(qū)域的獲取更加精準、高效，必將成為染色質開放區(qū)獲取的主流技術之一。

2 ATAC-seq作用機理和過程

2.1 Tn5轉座酶的發(fā)現及作用機理

20世紀40年代，美國遺傳學家Barbara Mc-Clintock發(fā)現了轉座子(transposon)[39]。轉座子也叫跳躍基因或轉座因子，是一段可以改變其在基因組中的位置的DNA序列。轉座因子幾乎存在于所有真核生物的基因組中，其衍生物構成了基因組的很大一部分，從而在基因組功能和進化過程中發(fā)揮著重要作用[40]。根據轉座子的結構特點和轉座方式可將其分為I型和II型。I型轉座子，也稱作RNA轉座子(即反轉錄轉座子)，轉座方式為“復制–粘貼”型，即轉座時先將自身轉錄獲得RNA，再反轉錄回DNA，增加自身一倍的拷貝數，增加的DNA再轉座至新的位置。II型轉座子，也稱作DNA轉座子，直接以“剪切?粘貼”的方式剪切下自身的DNA序列插入到新的位置，不會增加拷貝數。

Tn5轉座子是一種細菌轉座子，屬于II型轉座子的一種[41]，最早是在中被發(fā)現。Tn5由編碼卡那霉素(kanamycin, KAN)、新霉素(neomycin, NEO)、鏈霉素(streptomycin, STR)3種抗生素的核心序列和位于側翼的兩個高度同源且倒置的 IS50(insertion sequence, IS)序列組成，該DNA序列全長5818 bp[42~45]。其中，IS50序列可編碼參與轉座的蛋白：轉座酶(transposase, Tnp)和轉座阻遏蛋白(transposase inhibitor, Inh)。但由于左側末端的IS50L序列的第1442位堿基處T/A堿基對被C/G堿基對取代發(fā)生突變，導致翻譯提前終止，因此僅有IS50R能夠表達正常有活性的Tnp和Inh[43]。每個IS50序列具有兩個19 bp的倒置末端：外末端(outside end, OE)和內末端(inside end, IE)。兩倒置末端有7個bp不同，該末端是Tnp的結合位點[46~48]。

轉座發(fā)生過程大致分為3個步驟：(1)形成轉座復合體。Tnp分子的兩個N末端結構域分別結合到Tn5轉座子的兩個OE末端，形成兩個Tnp-OE復合體[49]；隨后以末端第2位序列為中心彎曲約36°~ 48°[50]，兩個復合體發(fā)生聯(lián)會，Tnp的C末端結構域相互作用而二聚體化，形成一個二聚體蛋白與兩分子DNA組成的Tn5轉座復合體[51,52]；(2) Tnp切割。形成轉座復合體結構后，Tnp便具備了切割DNA的活性[53]，且正因為上述轉座復合體結構，結合在左末端的Tnp便會催化右末端的磷酸二酯鍵水解，而結合在右末端的Tnp負責催化左末端的磷酸二酯鍵水解，以此有效防止Tnp只對轉座子DNA鏈的一端進行切割[54,55]；(3)插入靶序列。Tnp通過活化水分子水解DNA鏈，使Tn5兩末端分別形成3?-OH親核基團，該親核基團對DNA互補鏈進行親核攻擊，形成發(fā)夾結構，另一活化的水分子水解發(fā)夾結構，使Tn5的兩端均變?yōu)槠侥┒?，此時整個轉座復合體離開供體DNA，向靶序列結合[56]；轉座子的3'-OH基團以交錯的方式攻擊靶序列中的磷酸二酯鍵，使轉座子插入位點間形成9 bp的粘性末端，通過其3'-OH端同靶序列的5?-P之間形成共價鍵，插入到靶DNA中[57,58]，隨后在DNA聚合酶的作用下，Tn5的兩側翼形成9 bp的正向重復序列補齊缺口[59]。至此，整個轉座過程完成。

通過上述轉座過程不難看出，體外Tn5轉座過程僅需4個條件便能完成：Mg2+、轉座子末端序列、Tnp和靶DNA[60]。ATAC-seq過程中使用的就是簡化后的二聚體轉座復合物。復合物僅含有3個部分：轉座酶、末端序列和測序接頭[61]，能夠保證在切割DNA的同時連接上接頭以便后續(xù)的測序工作。同時，簡化復合物的Tnp在Tn5主鏈上攜帶了特異的點突變體，使Tnp具有了更高的活性[60,62]。另外，之所以需要Mg2+，是由于Mg2+在轉座過程中能協(xié)同親核基團，在Mg2+的作用下，轉座酶上催化轉座子運動的DDE基序(天冬氨酸和谷氨酸)與Mg2+配位發(fā) 生突變，使原本不活躍的轉座酶變成高度活躍狀態(tài)[63,64]，是完成轉座必不可少的因子之一。目前，Tn5轉座子以其轉座的隨機性好、穩(wěn)定性高、插入位點容易測序等特點，已經成為分子遺傳學研究的熱門工具[65,66]。隨著高通量測序技術的發(fā)展和實驗通量的不斷增加，Tn5轉座酶因其優(yōu)勢被應用得越來越廣泛。其中，極速建庫、長讀長測序技術(single tube long fragment read, stLFR)、單細胞測序、 Mate Pair文庫構建、染色質轉座酶可及性可視化分析(assay of transposase-acce-ssible chromatin with visualization, ATAC-see)，以及近幾年發(fā)現的Tn5家族對于蛋白結合區(qū)域、互作基因片段等研究的幫助都顯示Tn5轉座酶擁有不可估量的應用潛力[67~69]。Buenrostro等[36]建立的ATAC-seq技術，正是充分利用了Tn5酶在測序建庫中的巨大優(yōu)勢，能高效、精準的從基因組水平鑒別出染色質開放區(qū)域，在生命科學領域的遺傳學研究中發(fā)揮著至關重要的作用。

2.2 ATAC-seq主要過程

ATAC-seq涉及3個主要的步驟[36,38]：(1)獲取細胞核。使用冷裂解緩沖液裂解細胞；(2)轉座和純化(圖1A)。細胞核提取后立即將沉淀重懸于轉座酶反應混合物中，轉座后使用Qiagen MinElute PCR Purification Kit純化樣品；(3) PCR擴增(圖1B)。純化后，進行qPCR定量分析以及PCR擴增。上述過程大概需要3 h，幾處細節(jié)的處理尤為重要：(1)為減小PCR中的片段大小和GC偏差影響，需要通過qPCR來確定PCR后續(xù)的循環(huán)數，在飽和前停止擴增，以此保證轉座后片段大小在40 bp~1 kb范圍而不需要進行大小選擇，維持較高的庫復雜性；(2)因轉座過程產生了9 bp的空隙，因此PCR的第一步需要72℃反應5 min以填補該空隙，且所用的PCR酶是具有鏈置換功能的非熱啟動酶；(3)對于一個DNA片段而言，兩端接頭連接是隨機的。Tn5酶切后會出現3類產物：單端接頭1、單端接頭2以及雙端接頭1–接頭2，只有連接不同接頭的片段可用于富集擴增及測序。

圖1 轉座及擴增過程示意圖

A：轉座過程；B：擴增過程。

2.3 數據分析

ATAC-seq的數據分析過程大概可分為4個階段[24]：第一階段的數據預處理主要包括了過濾、比對和數據質量檢測，利用軟件CASAVA(Illumina)獲得FASTQ文件后過濾掉低質量片段，由于相鄰轉座的最小間隔為38 bp，通常38 bp以下的片段直接刪除[61]，并用Bowtie與參考基因組進行比對，隨后利用SAMtools去除重復的以及細胞器的reads；第二階段是質控、數據可視化和peak calling，第二次的質控標準包括線粒體基因組所占比例高低和插入物大小分布圖，使用軟件IGV可對數據進行可視化處理，峰可以用軟件macs2、Hotspot或者ZINBA尋找；第三階段是peak注釋，以獲取基因組中peak的位置信息；最后一步為模體(motif)注釋和差異peaks分析，將峰對應序列進行注釋以間接確定轉錄因子信息，同時，利用diffbind、DESeq2等工具分析如不同的實驗條件、多個時間節(jié)點、不同的發(fā)育時期等的差異區(qū)域，最終獲得轉錄因子結合位點的染色質可接近性狀態(tài)信息。

2.4 ATAC-seq優(yōu)缺點分析

開展染色質開放區(qū)域的表觀基因組學研究具有巨大的生物學意義，但過去的研究方法受到了復雜工作流程和大量細胞需求量的限制，從而導致該領域進展相對緩慢。直到ATAC-seq的出現，為注釋開放染色質的基因組位置、DNA結合蛋白、轉錄因子結合位點等基因組功能元件提供了新的契機。ATAC-seq技術擺脫了像DNase-seq需要精確控制酶量以及FAIRE-seq需要確定甲醛交聯(lián)時長等條件的限制，但依然存在影響其精確性的因素，如線粒體及植物細胞中葉綠體DNA的干擾、冷凍組織細胞DNA提取效率低、接頭連接的隨機性造成DNA片段的損失，以及大量酶切后的DNA 片段過大而無法富集等[24,36,38,70]。針對上述缺陷，同樣產生了一系列改進措施。例如，Lu等[71]開發(fā)的FANS-ATAC-seq (fluorescent activated nuclei sorting, FANS)、Roger等[72]開發(fā)的與細胞核基因組序列比對能達90%以上的INTACT (isolation of nuclei tagged in specific cell types)系統(tǒng)，以及與INTACT有相似結果的蔗糖沉淀法(crude)確保了在測定中使用高質量的完整細胞核的同時，能最大限度地減少線粒體和葉綠體中DNA的污染[73]。Corces等[74]發(fā)明的Omni-ATAC，提高了ATAC-seq對困難細胞系、稀少的原代細胞和臨床上相關的冷凍組織中的應用普遍性。此外，針對接頭的隨機性和剪切后片段過大的問題，Sos等[75]開發(fā)了THS-seq技術，具有比傳統(tǒng)EzTn5轉座酶活性更高的新型Tn5超突變體(Tn5059)以及更優(yōu)化的反應溶液和條件。同時設計T7啟動子加轉錄引物替換原Tn5轉座復合物中的Adapter 1和2。通過轉錄生成單鏈RNA，利用與RNA測序相同的原理獲得cDNA并加上銜接子，最終完成建庫。該技術避免了接頭的隨機連接，大大提高了轉座效率，使得測序數據更為完整。隨著ATAC-seq技術被不斷改進，ATAC-seq已逐漸成為目前染色質可及性分析的主流實驗方法。

3 ATAC-seq的應用和拓展

3.1 ATAC-seq的應用

自ATAC-seq技術誕生起，該技術憑借其穩(wěn)定性和高靈敏度已廣泛應用于表觀基因組學研究。除了能用來確定功能基因組調控區(qū)域信息、找出組織特異基因以及預測潛在結合蛋白外，還能跟其他分析技術聯(lián)合，如RNA-seq、ChIP-seq(chromatin immuno-precipitation followed by high throughput sequencing)以及Hi-C (high-through chromosome conformation ca-pture)等，用以發(fā)現潛在的關鍵調控元件、轉錄因子和理解控制體內復雜過程的基因調控網絡。其應用包括如下方面：

(1) DNA調控功能元件注釋。ATAC-seq最直接的功能就是用來研究各種調控因子如TF、啟動子、增強子等的結合區(qū)域的開放狀態(tài)以及對核小體進行定位，如對啟動子區(qū)域開放狀態(tài)的研究。Tan等[76]為探究壽命長且癌癥發(fā)病率極低的裸鼴鼠的遺傳機制，用ATAC-seq探測其染色質開放區(qū)域，結果顯示裸鼴鼠的重編程基因的啟動子區(qū)域更多的是處于關閉狀態(tài)。通過對啟動子區(qū)域開放狀態(tài)后進行SV40 LT (large tantigen, LT)抗原處理，發(fā)現LT可以抑制抑癌基因，從而提高重編程效率；而LT處理后，啟動子區(qū)可接近性較處理前更高。上述結果表明裸鼴鼠細胞具有更穩(wěn)定的表觀基因組，提示可以利用這種穩(wěn)定性為人類癌癥預防和治療提供新見解。同樣，還有對轉錄因子結合區(qū)域開放性的研究。Scharer等[77]為深入了解系統(tǒng)性紅斑狼瘡(systemic lupus erythematosus, SLE)的表觀遺傳調控過程，對來自SLE和健康對照的CD19+幼稚B細胞進行ATAC-seq分析。他們發(fā)現與健康對照相比，參與B細胞活化的基因周圍的基因座，以及調節(jié)B細胞活化和分化的TF的結合位點在SLE細胞中可接近性更高，該結果驗證了與B細胞活化相關的區(qū)域的開放狀態(tài)，為進一步研究SLE疾病機制打下基礎，充分體現了ATAC-seq確定染色質開放區(qū)域和鑒定順式調控元件的能力。Kristofer等[78]利用ATAC-seq比較了致癌蛋白RasV12誘導的癌組織在早期腫瘤、晚期腫瘤與正常組織間染色質開放區(qū)域的狀態(tài)。他們發(fā)現與正常組織比，腫瘤在發(fā)展過程中有數千個更容易接近的區(qū)域，從這些區(qū)域篩選并鑒定了在Ras依賴性腫瘤發(fā)生過程中異?；钴S的調節(jié)區(qū)域，并結合motif分析確定出了結合這些區(qū)域的關鍵轉錄因子AP-1和Stat92E。后期通過引入突變使Stat92E喪失功能后，發(fā)現腫瘤的嚴重程度降低，證明了轉錄因子Stat92E在腫瘤治療發(fā)展中重要意義，也對Ras依賴性腫瘤的發(fā)展有了新的認知。上述基于ATAC-seq和motif分析的成功案例表明，ATAC-seq可作為一種研究功能基因組調控區(qū)域和了解體內復雜基因調控網絡的有效方式。另外，轉錄過程中，轉錄因子與核小體競爭結合DNA序列，轉錄因子結合處的核小體水平也因此較低[79]。所以，獲取核小體定位信息，對于了解轉錄調控、DNA復制和修復等過程也很重要。Quillien等[80]為鑒定整個斑馬魚基因組中的細胞特異性增強子，對來自Tg (fli1a: egfp)y1轉基因胚胎的內皮細胞的細胞核進行ATAC-seq分析；在FANS技術的輔助下，用綠色熒光蛋白標記內皮細胞，通過熒光分離出細胞核獲得高質量的ATAC-seq數據；后續(xù)通過分析短DNA片段(<100 bp)和長片段(180~247 bp)分別獲得無核小體區(qū)及核小體結合區(qū)，以此定位核小體的位置。該研究揭示了整個基因組中轉錄起始位點的核小體定位模式以及與組蛋白修飾間的關聯(lián)，還提供了在胚胎發(fā)育過程中控制基因表達的全基因組范圍轉錄調控網絡的動態(tài)信息。

(2) ATAC-seq與RNA-seq、ChIP-seq等多組學數據的聯(lián)合分析。ATAC-seq技術更為巧妙的應用是將其獲得的數據與其他表觀遺傳信息相結合，用以增強對科學問題的進一步解釋。許多研究表明，通過聯(lián)合ATAC-seq與RNA-seq數據進行分析，可發(fā)現潛在的特異性基因。Ackermann等[81]使用ATAC- seq對純化的人α和β細胞中的開放染色質區(qū)進行了首次分析。通過與RNA-seq數據整合，進一步鑒定了兩種細胞中已知的胰島細胞轉錄因子的結合位點和已發(fā)現的II型糖尿病易感基因座的單核苷酸多態(tài)性(single nucleotide polymorphism, SNP)。更重要的是，發(fā)現了這兩種細胞類型的新型特征基因，“組特異性蛋白質”(group specific protein)即維生素D結合蛋白僅存在于α細胞，而軟骨素(chondrolectin)的免疫反應性僅存在于β細胞中。ATAC-seq與RNA-seq的聯(lián)合分析具備鑒定轉錄因子結合位點和發(fā)現潛在特異性基因的作用。2016年，Garcia等[82]通過ATAC-seq比對分析了經典食道癌細胞系(OE33)、一種新發(fā)現的食管癌細胞系(MFD-1)、以及正常細胞系(HET1A)三種細胞系的特異染色質開放位點。他們發(fā)現和正常對照組相比，MFD-1特異的染色質開放位點顯著富集著CTCF、NFY、Meis3、Nrf2的motif，且這些位點附近基因富集在和食道癌及消化道腫瘤相關的功能基因區(qū)域內。后續(xù)結合全基因組測序和RNA-seq技術，發(fā)現了MFD-1的基因表達特性，進一步表明了MFD-1作為食管腺癌的臨床疾病模型的可行性。同樣，通過ATAC-seq與RNA-seq技術聯(lián)合，可驗證基因表達量與ATAC-seq信號的相關性，從而找出對應的轉錄因子。Ho等[83]為了找出特異表征間充質干細胞(mesenchymal stem cells, MSCs)的分子特征，從8周齡小鼠的四個組織(股骨和椎骨的骨髓、脂肪、肺)中分離出MSCs進行ATAC-seq和RNA-seq聯(lián)合分析。首先，得出了ATAC-seq比轉錄組分析更加適合用來研究細胞特異性的結論，隨后鑒定出可能有助于區(qū)分具有不同特征的MSCs的潛在轉錄因子，并推測這種通過研究染色質可及性來分析MSCs的方法，也可用于表征人類的MSCs和人類MSCs的臨床應用。值得注意的是，雖然啟動子可訪問性和基因表達之間呈正相關，但也有許多研究表明，低表達或表達降低并不總是由于缺乏可訪問區(qū)導致[84,85]。因此，Starks等[86]再一次聯(lián)合使用ATAC-seq和RNA-seq技術，探索染色質開放性與基因表達間的關聯(lián)。試驗通過分析妊娠中期小鼠胎盤的表達水平和啟動子覆蓋率將基因分成3組：高啟動子覆蓋率和高表達的基因組(HA-HE)、中低覆蓋率和高表達的基因組(HA-ME)、低覆蓋率和低表達的基因組(MA-ME)。結果發(fā)現HA-HE組基因可能是管家基因，而HA-ME組基因可能是組織特異性基因。隨后，他們通過motif富集分析鑒定出了抑制HA-ME組基因的潛在轉錄因子，并發(fā)現HA-ME組的基因與胎盤的功能密切相關。該試驗證明了ATAC-seq和RNA-seq的聯(lián)合分析可用于小鼠和人的多種組織和細胞類型，用以鑒定活性抑制因子和組織特異性基因。

ATAC-seq與ChIP-seq的聯(lián)合使用常用于驗證轉錄因子與目標開放區(qū)域的結合。2018年，Rajb-handari等[87]聯(lián)合ATAC-seq、ChIP-seq和RNA-seq揭示了抗炎癥因子IL-10的作用機理。為探究IL-10抑制脂肪細胞產熱和能量輸出的潛在機制，他們先利用ATAC-seq和RNA-seq，驗證了IL-10能改變脂肪細胞的染色質開放狀態(tài)和降低產熱相關基因的表達量。最后利用ChIP-seq揭示了IL-10通過抑制產熱轉錄因子ATF和C/EBP β向增強子區(qū)域募集進而達到抗炎作用的機制。Denny等[88]為探究小細胞肺癌的轉移機制，聯(lián)合ATAC-seq、ChIP-seq與RNA-seq對肺原發(fā)癌和肝臟轉移癌進行比較分析。ATAC-seq分析發(fā)現轉移癌中的染色質開放性普遍增高，且差異的染色質開放性區(qū)域主要在基因遠端調控元件上。隨后通過motif富集分析、RNA-seq和ChIP-seq，發(fā)現顯著富集的基因在轉移癌中表達量增高，其ChIP信號與開放信號正相關，從而最終鎖定關鍵基因。

此外，還有聯(lián)合Hi-C分析尋找調控元件如增強子。2018年，Wang等[89]利用ATAC-seq和Hi-C研究多倍體棉花的三維基因組結構和轉錄調控之間的關系。他們發(fā)現一些由DNase-seq數據獲得的DHSs與啟動子之間存在互作，并推測這些處于開放狀態(tài)的區(qū)域是潛在增強子，與RNA-seq數據整合進一步確認這些關鍵候選增強子具有轉錄活性。Mas等[90]聯(lián)合Hi-C、ATAC-seq、ChIP-seq和RNA-seq四種技術，研究敲除甲基轉移酶復合體亞基基因后對基因組三維結構、染色質可接近性、組蛋白修飾以及表達水平的影響。首先利用ChIP-seq和reChIP-seq檢測二價修飾，鑒定二價啟動子。再通過Hi-C分析發(fā)現的敲除會引起二價基因轉錄起始位點與上下游互作模式的改變。隨后ATAC-seq研究發(fā)現敲除引起二價啟動子區(qū)的可接近性減少。最終揭示了通過作用于二價啟動子，維持相對集中的二價基因間互作，可接近性狀態(tài)和轉錄水平正常的作用。總之，ATAC-seq能夠與各種組學構建不同的關聯(lián)模式，從不同的分析思路獲取表觀遺傳信息或是探究轉錄調控機制，充分展現了其巨大的應用前景和無限的可能性。

3.2 單細胞ATAC-seq測序技術

染色質狀態(tài)是以細胞類型特異性的方式動態(tài)調節(jié)的[91]。雖然DNase-seq、ATAC-seq等技術用于測定全基因組水平染色質特定區(qū)域的可接近性，但測量獲得的是群體細胞平均染色質狀態(tài)，掩蓋了細胞類型間和細胞內的異質性。因此，基于單細胞測序的ATAC-seq (single-cell assay for transposase-acces-sible chromatin, scATAC-seq)被用于探測單細胞水平的染色質可及性[92]。scATAC-seq可應用于分析細胞亞群的基因調控網絡、研究細胞異質性、發(fā)現生物標志物、研究單細胞表觀基因組學等[93,94]。

目前scATAC-seq主要通過兩種技術手段來高效獲取單細胞全基因組范圍染色質開放信息，分別為微流控技術[92]和ATAC-seq組合標簽方法(single-cell combinatorial indexed ATAC-seq, sciATAC- seq)[95]。單細胞ATAC-seq目前最常用的平臺為 10× Genomics。其核心的微流控技術原理是將帶有barcode信息的凝膠珠與轉座酶處理后的細胞核混合，包裹在油滴中形成GEMs(Gel Beads-in- emulsion)。一個特定barcode序列標記一個細胞核的所有序列以此區(qū)別各個細胞。單細胞 ATAC-Seq微流控技術因其捕獲率高、容納量大和價格相對較低等優(yōu)點，被廣泛應用于探索由表觀遺傳變化引起的細胞異質性、探索生物標志物、了解基因表達上游的基因調控網絡等方面[93]。另外，2015年，華盛頓大學的Jay Shendure團隊開發(fā)了ATAC-seq組合標簽技術sciATAC-seq[95]。該方法不必依賴微流控平臺，而是利用細胞標簽技術對細胞核進行分子標記，通過兩次稀釋標記-混勻-再稀釋標記-再混勻，使單個細胞能夠被唯一標記而無需物理分離細胞。以此獲得大量單細胞的染色質開放信息。該技術與微流控scATAC-seq相比，每個實驗可共同測定數百萬個單細胞，獲得更多的單細胞信息。sciATAC-seq的局限性是由于數據的稀疏性導致產生的數據集難以分析，無法獲得較高的精確性[96,97]。不過，相信隨著數據集分析工具的不斷改進，能夠有效地提高分析精確性。如最新的分析工具Scasat可將開放的染色質信息作為二進制數據進行處理，并在保持數據的二進制特性的同時校正批次效應，使得該工具在分析scATAC-seq數據方面優(yōu)于其他工具[98]。sciATAC-seq常用于獲取單細胞的染色質調控信息以研究轉錄調控機制[99,100]。

單細胞測序也同樣發(fā)展到了單細胞水平的多組學整合分析，這對于準確解析細胞群中的細胞間差異至關重要。通過單細胞多組學聯(lián)合分析，如通過聯(lián)合scATAC-seq和RNA-seq技術，同時獲得單細胞的表觀基因組和轉錄組學信息，能夠鑒定引起這些不同細胞表型的致病的順式和反式作用元件，揭示基因表達調控特異性。如用于研究腫瘤異質性[93]、揭示造血系統(tǒng)異質性[101]等。Cusanovich等[94]為深入研究細胞亞群的基因表達調控機制，應用組合標簽技術sciATAC-seq分析13個成年小鼠組織的10萬個單細胞的基因組范圍內染色質的可接近性，采用了一種label-transfer的方法，整合RNA-seq和ATAC-seq數據對細胞進行聚類分析，共鑒定出30個主要細胞亞群，隨后確定出85種不同的染色質可接近性模式，以及近40萬個差異可接近性元件。并使用這些數據將調節(jié)元件與其靶基因建立聯(lián)系，鑒定出了許多組織特異性的轉錄因子。之后，通過將小鼠染色質開放性與人類全基因組相關聯(lián)，揭示了部分人類遺傳病與開放染色質間的潛在關系，拓展了該研究的意義。整個實驗為組織結構，發(fā)育和分化，各組織器官的調控網絡的研究提供了豐富的參考。scATAC-seq組合標簽的方式進一步提高了單細胞ATAC-seq的通量，標簽組合作為單細胞基因組學的一種推廣策略[102]，sciATAC-seq具有不可估量的發(fā)展?jié)撃堋？傊瑔渭毎嘟M學聯(lián)合分析無論是在疾病研究還是了解基因組功能等領域上都有廣泛的應用前景。

4 結語與展望

鑒定染色質開放區(qū)域并對其進行精確定位，對表觀遺傳學的研究具備重要意義。隨著高通量測序技術的不斷發(fā)展，以ATAC-seq為代表的染色質開放區(qū)域獲取技術，將能系統(tǒng)發(fā)掘全基因組上的啟動子、增強子、絕緣子和轉錄因子等重要調控元件的結合位點，對深入了解整個基因調控網絡具有重要意義。除了應用于尋找組織特異基因、定位核小體外，將ATAC-seq的染色質開放信息進一步整合基因組、轉錄組、甲基化組等多組學數據，可更加立體、直觀地了解復雜基因之間的相互作用及其對表型的影響效應。

當前，ATAC-seq技術已成為研究表觀遺傳調控的重要手段，其更加簡便的操作過程和更易滿足的實驗材料，已在染色質開放區(qū)獲取方面展現出無可比擬的優(yōu)勢和應用潛能。盡管該技術目前的數據分析工具還不夠成熟，但不容質疑的是，其已成為表觀遺傳學研究的突破性技術。隨著相應實驗技術的進一步提高，可以預期，ATAC-seq將成為復雜性狀遺傳解析的研究利器之一，從而進一步推動人類、小鼠及其他動植物等生命科學領域的穩(wěn)步向前發(fā)展。

[1] Kornberg RD. Chromatin structure: a repeating unit of histones and DNA., 1974, 184(4139): 868–871.

[2] Richmond TJ, Finch JT, Rushton B, Rhodes D, Klug A. Structure of the nucleosome core particle at 7 A resolution., 1984, 311(5986): 532–537.

[3] Zhou YB, Gerchman SE, Ramakrishnan V, Travers A, Muyldermans S. Position and orientation of the globular domain of linker histone H5 on the nucleosome., 1998, 395(6700): 402–405.

[4] Thurman RE, Rynes E, Humbert R, Vierstra J, Maurano MT, Haugen E, Sheffield NC, Stergachis AB, Wang H, Vernot B, Garg K, John S, Sandstrom R, Bates D, Boatman L, Canfield TK, Diegel M, Dunn D, Ebersol AK, Frum T, Giste E, Johnson AK, Johnson EM, Kutyavin T, Lajoie B, Lee BK, Lee K, London D, Lotakis D, Neph S, Neri F, Nguyen ED, Qu H, Reynolds AP, Roach V, Safi A, Sanchez ME, Sanyal A, Shafer A, Simon JM, Song L, Vong S, Weaver M, Yan Y, Zhang Z, Zhang Z, Lenhard B, Tewari M, Dorschner MO, Hansen RS, Navas PA, Stamatoyannopoulos G, Iyer VR, Lieb JD, Sunyaev SR, Akey JM, Sabo PJ, Kaul R, Furey TS, Dekker J, Crawford GE, Stamatoyannopoulos JA. The accessible chromatin landscape of the human genome., 2012, 489(7414): 75–82.

[5] Poirier MG, Bussiek M, Langowski J, Widom J. Spontaneous access to DNA target sites in folded chromatin fibers., 2008, 379(4): 772–786.

[6] Fedor MJ. Chromatin structure and gene expression., 1996, 4(18): 9384–9388.

[7] John S, Sabo PJ, Thurman RE, Sung MH, Biddie SC, Johnson TA, Hager GL, Stamatoyannopoulos JA. Chromatin accessibility pre-determines glucocorticoid receptor binding patterns., 2011, 43(3): 264– 268.

[8] Bell O, Tiwari VK, Thom? NH, Schübeler D. Determinants and dynamics of genome accessibility., 2011, 12(8): 554–564.

[9] Kouzarides T. Chromatin modifications and their function., 2007, 128(4): 693–705.

[10] Jiang C, Pugh BF. Nucleosome positioning and gene regulation: advances through genomics., 2009, 10(3): 161–172.

[11] Schones DE, Cui K, Cuddapah S, Roh TY, Barski A, Wang ZB, Wei G, Zhao KJ. Dynamic regulation of nucleosome positioning in the human genome., 2008, 132(5): 887–898.

[12] Hewish DR, Burgoyne LA. Chromatin sub-structure. The digestion of chromatin DNA at regularly spaced sites by a nuclear deoxyribonuclease., 1973, 52(2): 504–510.

[13] Scott WA, Wigmore DJ. Sites in simian virus 40 chromatin which are preferentially cleaved by endonucleases., 1978, 15(4): 1511–1518.

[14] Wu C, Bingham PM, Livak KJ, Holmgren R, Elgin SCR. The chromatin structure of specific genes: I. Evidence for higher order domains of defined DNA sequence., 1979, 16(4): 797–806.

[15] Stalder J, Larsen A, Engel JD, Dolan M, Groudine M, Weintraub H. Tissue-specific DNA cleavages in the globin chromatin domain introduced by DNase I., 1980, 20(2): 451–460.

[16] Mcghee JD, Wood WI, Dolan M, Engel JD, Felsenfeld G. A 200 base pair region at the 5’ end of the chicken adult β-globin gene is accessible to nuclease digestion., 1981, 27(1, Part 2): 45–55.

[17] Gross DS, Garrard WT. Nuclease hypersensitive sites in chromatin., 2003, 57(57): 159–197.

[18] Wu C. The 5’ ends ofheat shock genes in chromatin are hypersensitive to DNase I., 1980, 286(5776): 854–860.

[19] Crawford GE, Holt IE, Mullikin JC, Tai D, Blakesley R, Bouffard G, Young A, Masiello C, Green ED, Wolfsberg TG, Collins FS. Identifying gene regulatory elements by genome-wide recovery of DNase hypersensitive sites ., 2004, 101(4): 992–997.

[20] Boyle AP, Davis S, Shulha HP, Meltzer P, Margulies EH, Weng Z, Furey TS, Crawford GE. High-resolution mapping and characterization of open chromatin across the genome., 2008, 132(2): 311–322.

[21] Giresi PG, Kim J, Mcdaniell RM, Iyer VR, Lieb JD. FAIRE (Formaldehyde-Assisted Isolation of Regulatory Elements) isolates active regulatory elements from human chromatin., 2007, 17(6): 877–885.

[22] Kelly TK, Liu YP, Lay FD, Liang GN, Berman BP, Jones PA. Genome-wide mapping of nucleosome positioning and DNA methylation within individual DNA molecules., 2012, 22(12): 2497– 2506.

[23] He HH, Meyer CA, Hu SS, Chen MW, Zang C, Liu Y, Rao PK, Fei T, Xu H, Long H, Liu XS, Brown M. Refined DNase-seq protocol and data analysis reveals intrinsic bias in transcription factor footprint identification., 2014, 11(1): 73–78.

[24] Tsompana M, Buck MJ. Chromatin accessibility: a window into the genome., 2014, 7(1): 33.

[25] Cumbie JS, Filichkin SA, Megraw M. Improved DNase-seq protocol facilitates high resolution mapping of DNase I hypersensitive sites in roots in., 2015, 11(1): 42.

[26] Rizzo JM, Sinha S. Analyzing the global chromatin structure of keratinocytes by MNase-seq., 2014, 1195: 49–59.

[27] Telford DJ, Stewart BW. Micrococcal nuclease: its specificity and use for chromatin analysis., 1989, 21(2): 127–137.

[28] Chung HR, Dunkel I, Heise F, Linke C, Krobitsch S, Ehrenhofer-Murray AE, Sperling SR, Vingron M. The effect of micrococcal nuclease digestion on nucleosome positioning data., 2010, 5(12): e15754.

[29] Clark DJ. Nucleosome Positioning, Nucleosome spacing and the nucleosome code., 2010, 27(6): 781–793.

[30] Zentner GE, Henikoff S. Surveying the epigenomic landscape, one base at a time., 2012, 13(10): 250.

[31] Kumar V, Muratani M, Rayan NA, Kraus P, Lufkin T, Ng HH, Prabhakar S. Uniform, optimal signal processing of mapped deep-sequencing data., 2013, 31(7): 615–622.

[32] Simon JM, Giresi PG, Davis IJ, Lieb JD. Using formaldehyde-assisted isolation of regulatory elements (FAIRE) to isolate active regulatory DNA., 2012, 7(2): 256–267.

[33] Auerbach RK, Euskirchen G, Rozowsky J, Lamarre- Vincent N, Moqtaderi Z, Lefrancois P, Struhl K, Gerstein M, Snyder M. Mapping accessible chromatin regions using Sono-Seq., 2009, 106(35): 14926–14931.

[34] Rhie SK, Schreiner S, Farnham PJ. Defining regulatory elements in the human genome using nucleosome occupancy and methylome sequencing (NOMe-Seq)., 2018, 1766: 209–229.

[35] Klemm SL, Shipony Z, Greenleaf WJ. Chromatin accessibility and the regulatory epigenome., 2019, 20(4): 207–220.

[36] Buenrostro JD, Giresi PG, Zaba LC, Chang HY, Greenleaf WJ. Transposition of native chromatin for fast and sensitive epigenomic profiling of open chromatin, DNA-binding proteins and nucleosome position., 2013, 10(12): 1213–1218.

[37] Wu JY, Huang B, Chen H, Yin QZ, Liu Y, Xiang YL, Zhang BJ, Liu BF, Wang QJ, Xia WK, Li WZ, Li YY, Ma J, Peng X, Zheng H, Ming J, Zhang WH, Zhang J, Tian G, Xu F, Chang Z, Na J, Yang XR, Xie W. The landscape of accessible chromatin in mammalian preimplantation embryos., 2016, 534(7609): 652–657.

[38] Buenrostro JD, Wu B, Chang HY, Greenleaf WJ. ATAC-seq: A method for assaying chromatin accessibility genome-wide., 2015, 109: 21–29.

[39] Mcclintock B. The origin and behavior of mutable loci in maize., 1950, 36(6): 344– 355.

[40] Bucher E, Reinders J, Mirouze M. Epigenetic control of transposon transcription and mobility in., 2012, 15(5): 503–510.

[41] Huang CR, Burns KH, Boeke JD. Active transposition in genomes., 2012, 46: 651–675.

[42] Berg DE, Davies J, Allet B, Rochaix JD. Transposition of R factor genes to bacteriophage lambda., 1975, 72(9): 3628–3632.

[43] Rothstein SJ, Jorgensen RA, Postle K, Reznikoff WS. The inverted repeats of Tn5 are functionally different., 1980, 19(3): 795–805.

[44] Lovell S, Goryshin IY, Reznikoff WR, Rayment I. Two-metal active site binding of a Tn5 transposase synaptic complex., 2002, 9(4): 278–281.

[45] Auerswald EA, Ludwig G, Schaller H. Structural analysis of Tn5., 1981, 45 Pt 1: 107.

[46] Berg DE. Julian Davies and the discovery of kanamycin resistance transposon Tn5., 2017, 70(4): 339–346.

[47] Reznikoff WS. The TN5 transposon., 1993, 47(1): 945–963.

[48] Reznikoff WS, Bhasin A, Davies DR, Goryshin IY, Mahnke LA, Naumann T, Rayment I, Steiniger-White M, Twining SS. Tn5: A molecular window on transposition., 1999, 266(3): 729–734.

[49] Zhou M, Reznikoff WS. Tn5 transposase mutants that alter DNA binding specificity., 1997, 271(3): 362–373.

[50] York D, Reznikoff WS. DNA binding and phasing analyses of Tn5 transposase and a monomeric variant., 1997, 25(11): 2153–2160.

[51] Steiniger-White M, Reznikoff WS. The C-terminal alpha helix of Tn5 transposase is required for synaptic complex formation., 2000, 275(30): 23127–23133.

[52] Bhasin A, Goryshin IY, Steiniger-White M, York D, Reznikoff WS. Characterization of a Tn5 pre-cleavage synaptic complex., 2000, 302(1): 49–63.

[53] Kale SB, Landree MA, Roth DB. Conditional RAG-1 mutants block the hairpin formation step of V(D)J recombination., 2001, 21(2): 459–466.

[54] Naumann TA, Reznikoff WS. Trans catalysis in Tn5 transposition., 2000, 97(16): 8944–8949.

[55] Lisa AMB, Goryshin IY, Reznikoff WS. A mechanism for Tn5 inhibition., 1999, 274(1): 86.

[56] Bhasin A, Goryshin IY, Reznikoff WS. Hairpin formation in Tn5 transposition., 1999, 274(52): 37021–37029.

[57] Mizuuchi K, Adzuma K. Inversion of the phosphate chirality at the target site of Mu DNA strand transfer: Evidence for a one-step transesterification mechanism., 1991, 66(1): 129–140.

[58] Mizuuchi K. Transpositional recombination: mechanistic insights from studies of mu and other elements., 1992, 61: 1011–1051.

[59] Crellin P, Chalmers R. Protein-DNA contacts and conformational changes in the Tn10 transpososome during assembly and activation for cleavage., 2001, 20(14): 3882–3891.

[60] Goryshin IY, Reznikoff WS. Tn5transposition., 1998, 273(13): 7367–7374.

[61] Adey A, Morrison HG, Asan, Xun X, Kitzman JO, Turner EH, Stackhouse B, Mackenzie AP, Caruccio NC, Zhang X, Shendure J. Rapid, low-input, low-bias construction of shotgun fragment libraries by high- densitytransposition., 2010, 11(12): R119.

[62] Reznikoff WS. Transposon Tn5., 2008, 42: 269–286.

[63] Davies DR, Mahnke Braam L, Reznikoff WS, Rayment I. The three-dimensional structure of a Tn5 transposase- related protein determined to 2.9-A resolution., 1999, 274(17): 11904–11913.

[64] Peterson G, Reznikoff W. Tn5 transposase active site mutations suggest position of donor backbone DNA in synaptic complex., 2003, 278(3): 1904– 1909.

[65] Reznikoff WS. Tn5 as a model for understanding DNA transposition., 2003, 47(5): 1199–1206.

[66] Sakamoto H, Thiberge S, Akerman S, Janse CJ, Carvalho TG, Ménard R. Towards systematic identification of Plasmodium essential genes by transposon shuttle mutagenesis., 2005, 33(20): e174.

[67] Caruccio N. Preparation of next-generation sequencing libraries using NexteraTMtechnology: simultaneous DNA fragmentation and adaptor tagging by in vitro transposition., 2011, 733: 241–255.

[68] Chen CY, Xing D, Tan LZ, Li H, Zhou GY, Huang L, Xie XS. Single-cell whole-genome analyses by linear amplification via transposon insertion (LIANTI)., 2017, 356(6334): 189–194.

[69] Chen XQ, Shen Y, Draper W, Buenrostro JD, Litzenburger U, Cho SW, Satpathy AT, Carter AC, Ghosh RP, East-Seletsky A, Doudna JA, Greenleaf WJ, Liphardt JT, Chang HY. ATAC-see reveals the accessible genome by transposase-mediated imaging and sequencing., 2016, 13(12): 1013–1020.

[70] Buenrostro JD Giresi PG Zaba LC, Chang HY, Greenleat W. Transposition of native chromatin for multimodal regulatory analysis and personal epigenomics., 2013, 10(12): 1213–1218.

[71] Lu Z, Hofmeister BT, Vollmers C, Dubois RM, Schmitz RJ. Combining ATAC-seq with nuclei sorting for discovery of cis-regulatory regions in plant genomes., 2017, 45(6): e41.

[72] Deal RB, Henikoff S. A simple method for gene expression and chromatin profiling of individual cell types within a tissue., 2010, 18(6): 1030–1040.

[73] Maher KA, Bajic M, Kajala K, Reynoso M, Pauluzzi G, West DA, Zumstein K, Woodhouse M, Bubb K, Dorrity MW, Queitsch C, Bailey-Serres J, Sinha N, Brady SM, Deal RB. Profiling of accessible chromatin regions across multiple plant species and cell types reveals common gene regulatory principles and new control modules., 2018, 30(1): 15–36.

[74] Corces MR, Trevino AE, Hamilton EG, Greenside PG, Sinnott-Armstrong NA, Vesuna S, Satpathy AT, Rubin AJ, Montine KS, Wu B, Kathiria A, Cho SW, Mumbach MR, Carter AC, Kasowski M, Orloff LA, Risca VI, Kundaje A, Khavari PA, Montine TJ, Greenleaf WJ, Chang HY. An improved ATAC-seq protocol reduces background and enables interrogation of frozen tissues., 2017, 14(10): 959–962.

[75] Sos BC, Fung HL, Gao DR, Osothprarop TF, Kia A, He MM, Zhang K. Characterization of chromatin accessibility with a transposome hypersensitive sites sequencing (THS-seq) assay., 2016, 17(1): 20.

[76] Tan L, Ke Z, Tombline G, Macoretta N, Hayes K, Tian X, Lv R, Ablaeva J, Gilbert M, Bhanu NV, Yuan Z F, Garcia BA, Shi YG, Shi Y, Seluanov A, Gorbunova V. Naked mole rat cells have a stable epigenome that resists iPSC reprogramming., 2017, 9(5): 1721–1734.

[77] Scharer CD, Blalock EL, Barwick BG, Haines RR, Wei C, Sanz I, Boss JM. ATAC-seq on biobanked specimens defines a unique chromatin accessibility structure in na?ve SLE B cells., 2016, 6(1): 27030.

[78] Davie K, Jacobs J, Atkins M, Potier D, Christiaens V, Halder G, Aerts S. Discovery of transcription factors and regulatory regions driving in vivo tumor develop-ment by ATAC-seq and FAIRE-seq open chromatin profiling., 2015, 11(2): e1004994.

[79] Liu YJ, Zhang F, Liu HD, Sun X. The application of next-generation sequencing techniques in studying transcriptional regulation in embryonic stem cells., 2017, 39(8): 717–725.劉亞軍, 張峰, 劉宏德, 孫嘯. 下一代測序技術在干細胞轉錄調控研究中的應用. 遺傳, 2017, 39(8): 717–725.

[80] Quillien A, Abdalla M, Yu J, Ou JH, Zhu LJ, Lawson ND. Robust identification of developmentally active endothelial enhancers in zebrafish using FANS-assisted ATAC-Seq., 2017, 20(3): 709–720.

[81] Ackermann AM, Wang ZP, Schug J, Naji A, Kaestner KH. Integration of ATAC-seq and RNA-seq identifies human alpha cell and beta cell signature genes., 2016, 5(3): 233–244.

[82] Garcia E, Hayden A, Birts C, Britton E, Cowie A, Pickard K, Mellone M, Choh C, Derouet M, Duriez P, Noble F, White MJ, Primrose JN, Strefford JC, Rose-Zerilli M, Thomas GJ, Ang Y, Sharrocks AD, Fitzgerald RC, Underwood TJ. Authentication and characterisation of a new oesophageal adenocarcinoma cell line: MFD-1., 2016, 6: 32417.

[83] Ho YT, Shimbo T, Wijaya E, Ouchi Y, Takaki E, Yamamoto R, Kikuchi Y, Kaneda Y, Tamai K. Chromatin accessibility identifies diversity in mesenchymal stem cells from different tissue origins., 2018, 8(1): 17765.

[84] Nelson AC, Mould AW, Bikoff EK, Robertson EJ. Mapping the chromatin landscape and Blimp1 trans-criptional targets that regulate trophoblast differentiation., 2017, 7(1): 6715–6793.

[85] Scott-Browne JP, López-Moyado IF, Trifari S, Wong V, Chavez L, Rao A, Pereira RM. Dynamic changes in chromatin accessibility occur in CD8+T cells responding to viral infection., 2016, 45(6): 1327–1340.

[86] Starks RR, Biswas A, Jain A, Tuteja G. Combined analysis of dissimilar promoter accessibility and gene expression profiles identifies tissue-specific genes and actively repressed networks., 2019, 12(1): 16.

[87] Rajbhandari P, Thomas B J, Feng A, Hong C, Wang JX, Vergnes L, Sallam T, Wang B, Sandhu J, Seldin M M, Lusis AJ, Fong LG, Katz M, Lee R, Young SG, Reue K, Smale ST, Tontonoz P. IL-10 signaling remodels adipose chromatin architecture to limit thermogenesis and energy expenditure., 2018, 172(1–2): 218– 233.e17.

[88] Denny SK, Yang D, Chuang CH, Brady JJ, Lim JS, Grüner BM, Chiou S, Schep AN, Baral J, Hamard C, Antoine M, Wislez M, Kong CS, Connolly AJ, Park K, Sage J, Greenleaf WJ, Winslow MM. Nfib promotes metastasis through a widespread increase in chromatin accessibility., 2016, 166(2): 328–342.

[89] Wang MJ, Wang PC, Lin M, Ye ZX, Li GL, Tu LL, Shen C, Li JY, Yang QY, Zhang XL. Evolutionary dynamics of 3D genome architecture following polyp-loidization in cotton., 2018, 4(2): 90–97.

[90] Mas G, Blanco E, Ballaré C, Sansó M, Spill YG, Hu D, Aoi Y, Le Dily F, Shilatifard A, Marti-Renom MA, Di Croce L. Promoter bivalency favors an open chromatin architecture in embryonic stem cells., 2018, 50(10): 1452–1462.

[91] Stergachis AB, Neph S, Reynolds A, Humbert R, Miller B, Paige SL, Vernot B, Cheng JB, Thurman RE, Sandstrom R, Haugen E, Heimfeld S, Murry CE, Akey JM, Stamatoyannopoulos JA. Developmental fate and cellular maturity encoded in human regulatory DNA landscapes., 2013, 154(4): 888–903.

[92] Buenrostro JD, Wu B, Litzenburger UM, Ruff D, Gonzales ML, Snyder MP, Chang HY, Greenleaf WJ. Single-cell chromatin accessibility reveals principles of regulatory variation., 2015, 523(7561): 486–490.

[93] Liu LQ, Liu YC, Quintero A, Wu L, Yuan Y, Wang MY, Cheng MN, Leng LZ, Xu LQ, Dong GY, Li R, Liu Y, Wei XY, Xu JS, Chen XW, Lu HR, Chen DS, Wang QL, Zhou Q, Lin XX, Li GB, Liu SP, Wang Q, Wang HR, Fink JL, Gao ZL, Liu X, Hou Y, Zhu SD, Yang HM, Ye YM, Lin G, Chen F, Herrmann C, Eils R, Shang ZC, Xu X. Deconvolution of single-cell multi-omics layers reveals regulatory heterogeneity., 2019, 10(1): 470.

[94] Cusanovich DA, Hill AJ, Aghamirzaie D, Daza RM, Pliner HA, Berletch JB, Filippova GN, Huang X, Christiansen L, Dewitt WS, Lee C, Regalado SG, Read DF, Steemers FJ, Disteche CM, Trapnell C, Shendure J. A single-cell atlas ofmammalian chromatin accessibility., 2018, 174(5): 1309–1324.

[95] Cusanovich DA, Daza R, Adey A, Pliner HA, Christiansen L, Gunderson KL, Steemers FJ, Trapnell C, Shendure J. Multiplex single cell profiling of chromatin accessibility by combinatorial cellular indexing., 2015, 348(6237): 910–914.

[96] Zamanighomi M, Lin ZL, Daley T, Chen X, Duren Z, Schep A, Greenleaf WJ, Wong WH. Unsupervised clustering and epigenetic classification of single cells., 2018, 9(1): 2410.

[97] Schep AN, Wu BJ, Buenrostro JD, Greenleaf WJ. chromVAR: inferring transcription-factor-associated accessibility from single-cell epigenomic data., 2017, 14(10): 975–978.

[98] Baker SM, Rogerson C, Hayes A, Sharrocks AD, Rattray M. Classifying cells with Scasat, a single-cell ATAC-seq analysis tool., 2019, 47(2): e10.

[99] Preissl S, Fang RX, Huang H, Zhao Y, Raviram R, Gorkin DU, Zhang YX, Sos BC, Afzal V, Dickel DE, Kuan S, Visel A, Pennacchio LA, Zhang K, Ren B. Single-nucleus analysis of accessible chromatin in developing mouse forebrain reveals cell-type-specific transcriptional regulation., 2018, 21(3): 432–439.

[100] Cusanovich DA, Reddington JP, Garfield DA, Daza RM, Aghamirzaie D, Marco-Ferreres R, Pliner HA, Christiansen L, Qiu X, Steemers FJ, Trapnell C, Shendure J, Furlong EEM. The cis-regulatory dynamics of embryonic development at single-cell resolution., 2018, 555(7697): 538–542.

[101] Buenrostro JD, Corces MR, Lareau CA, Wu B, Schep AN, Aryee MJ, Majeti R, Chang HY, Greenleaf WJ. Integrated single-cell analysis maps the continuous regulatory landscape of human hematopoietic differe-ntiation., 2018, 173(6): 1535–1548.

[102] Ramani V, Deng X, Qiu R, Gunderson KL, Steemers FJ, Disteche CM, Noble WS, Duan Z, Shendure J. Massively multiplex single-cell Hi-C., 2017, 14(3): 263–266.

Advances in assay for transposase-accessible chromatin with high-throughput sequencing

Jie Wu1, Jianping Quan1, Yong Ye1, ZhenFang Wu1, Jie Yang1, Ming Yang2, Enqin Zheng1

Assay for transposase accessible chromatin with high-throughput sequencing (ATAC-seq) was developed in 2013. It has the advantages of more convenient operation andhigher efficiency for DNA recovery than DNase I hypersensitive site sequencing (DNase-seq) and micrococcal nuclease sequencing (MNase-seq). ATAC-seq currently is the most popular technique of genome-wide mapping for chromatin accessibility. It provides information on binding regions of transcription factors and nucleosome localization on the chromatin. Thus, ATAC-seq is of great significance for studying the epigenetics and molecular mechanisms in chromatin structure. In this review, we compare the advantages and disadvantages of multiple techniques for profiling chromatin accessibility, and summarize the principles, main process, development and applications of ATAC-seq. We hope this review will provide a reference for study of genome-wide mapping for chromatin accessibility, identification of cis-regulatory elements, and dissection of the epigenetic and genetic regulatory networks using the ATAC-seq technology in eukaryotes.

assay for transposase-accessible chromatin with high-throughput sequencing; open chromatin regions; Tn5 transposase; epigenetic modification; transcription factor

2019-11-14;

2020-01-29

廣東省“揚帆計劃”引進創(chuàng)新創(chuàng)業(yè)團隊項目(編號：2016YT03H062)，廣東省現代農業(yè)產業(yè)技術體系生豬創(chuàng)新團隊項目(編號：2019KJ126)和廣東省自然科學基金項目(編號：2017A030313213)資助[Supported by Guangdong YangFan Innovative and Entre-preneurial Research Team Program (No. 2016YT03H062), Guangdong Modern Agricultural Industry Technology System Pig Innovation Team Project (No. 2019KJ126) and Guangdong Natural Science Foundation (No. 2017A030313213)]

吳杰，碩士研究生，專業(yè)方向：分子遺傳與動物育種。E-mail: wujiezi163@163.com

楊明，博士，高級畜牧師，研究方向：動物遺傳育種。E-mail: yangming@zhku.edu.cn

鄭恩琴，碩士，高級實驗師，研究方向：遺傳育種。E-mail: eqzheng@scau.edu.cn

10.16288/j.yczz.19-279

2020/2/29 8:47:16

URI: http://kns.cnki.net/kcms/detail/11.1913.R.20200228.0936.002.html

(責任編委: 朱衛(wèi)國)

99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

染色質轉座酶可及性測序研究進展

1 染色質開放區(qū)域研究技術的發(fā)展歷程

1.1 DNase-seq及其衍生技術

1.2 MNase-seq技術

1.3 FAIRE-seq及其衍生技術

1.4 NOMe-seq技術

1.5 ATAC-seq技術

2 ATAC-seq作用機理和過程

2.1 Tn5轉座酶的發(fā)現及作用機理

2.2 ATAC-seq主要過程

2.3 數據分析

2.4 ATAC-seq優(yōu)缺點分析

3 ATAC-seq的應用和拓展

3.1 ATAC-seq的應用

3.2 單細胞ATAC-seq測序技術

4 結語與展望