• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于染色質交互數據的基因組組裝方法

      2015-09-14 12:47:12陶婧芬謝婷鄭覺非楊慶勇張紅雨
      生物技術通報 2015年11期
      關鍵詞:染色質文庫染色體

      陶婧芬 謝婷 鄭覺非 楊慶勇 張紅雨

      DNA是生物體遺傳信息的主要載體,高質量的基因組參考序列是現代遺傳學、分子生物學等現代生物學科的重要基礎。因此,基因組測序對探索與認識生命本質等基礎生物科學研究、人類重要遺傳病防治及動植物遺傳育種等應用性研究均具有十分重要的意義。

      1 Scaffolds錨位逐漸成為制約高質量全基因組序列獲得的主要挑戰(zhàn)

      基于二代測序技術,又稱下一代測序技術(Next generation sequencing,NGS)的全基因組測序工程一般包含兩個部分:拼接和組裝,前者是將二代測序技術產生的DNA測序片段(Reads)拼接成小的重疊群(Contigs)的過程,后者是將拼接階段產生的重疊群組裝成長序列片段(Scaffolds),以及將長序列片段定位到染色體上的過程。伴隨著DNA測序技術的不斷推陳出新[1]和單位測序成本的大幅度降低[2],如何準確、高效、快速地將scaffolds定位到染色體上逐漸成為高質量全基因組序列獲得的主要挑戰(zhàn)。

      1.1 基因組測序現狀

      得益于DNA測序技術飛速發(fā)展,不斷有新的物種基因組被測序,繼而由測序的片段組裝出相對完整的基因組序列?,F有的基因組測序工程主要借助于全基因組鳥槍法(Whole genome shotgun,WGS)的策略[3],其原理是將基因組打斷成小片段,隨后將片段克隆到載體上組建重組克隆群并測序以獲得用于組裝的序列。這種方法克服了大片段克隆分別測序(Clone-by-clone,CBC)策略難以分離并克隆著絲粒等區(qū)域的缺陷。隨著高通量測序技術的發(fā)展,WGS策略以更低的成本以及更高的效率成為近年來大多數測序工程的首選。截止到現在,GenBank中采用WGS方法進行測序組裝的項目已有42 925個(http://www.ncbi.nlm.nih.gov/assembly/,統(tǒng)計日期:2015年7月20日)。

      盡管在測序和拼接技術日趨完善的今天,絕大多數物種的組裝結果仍然不夠完整且存在不少組裝錯誤[4],并且很多已被測序物種的參考序列信息仍以零散的序列片段的形式存在。NCBI中的數據統(tǒng)計顯示(http://www.ncbi.nlm.nih.gov/assembly/,統(tǒng)計日期:2015年7月27日),僅有26.6%的植物、12.0%的動物和15.4%的真菌基因組完成了染色體水平的組裝(表1)。由此可見,基因組組裝大多僅僅停留在長序列片段(BAC和/或scaffolds,下文統(tǒng)稱為scaffolds)的水平,而確定scaffolds在染色體上的具體位置逐漸成為染色體水平的參考序列獲得的限制環(huán)節(jié)。

      表1 植物、動物、真菌中基因組組裝情況

      1.2 傳統(tǒng)scaffolds錨位方法存在的主要困難

      傳統(tǒng)的scaffolds錨位方法主要分為兩個大類,基于物理圖譜的方法和基于遺傳圖譜的方法。前者是通過序列或序列特征的重疊關系來確定DNA片段的位置,后者是利用減數分裂時期的姊妹染色單體聯(lián)會后不同DNA片段共交換的頻率來判斷DNA片段的相對位置。由于這兩類方法都包含大規(guī)模文庫或群體構建、篩選等一系列復雜的實驗過程,其所需成本、結果的精度、準確性等在很大程度取決于實驗的設計和實施,在實際的scaffolds錨位的過程中主要存在以下難點。

      1.2.1 大片段文庫構建難度大 構建大片段的BAC文庫是基于物理圖譜錨位scaffolds方法的限制性環(huán)節(jié)。而傳統(tǒng)的基于遺傳圖譜錨位scaffolds的方法對片段長度(如scaffolds N50)要求較高,為了提高scaffolds的長度,一般需要構建大片段mate pair測序文庫。大片段文庫構建的整個操作流程相比普通實驗更復雜且對實驗經驗的要求更高[5]。在文庫構建過程中將基因組片段插入載體中,不同物種基因組的重復度高低等指標會影響大片段文庫插入片段長度的目標值;而插入片段越長、連接率越低、構建成功率則越低;再者,隨著插入片段的增大,文庫冗余率的升高等均會影響大片段文庫最終有效數據的產出。因此,對于大部分分子生物學實驗室,都不具備構建高質量、低冗余率大片段文庫的技術條件,目前該系列實驗仍存在諸多困難。

      1.2.2 成本較高 一方面,傳統(tǒng)的scaffolds錨位方法通常需要構建遺傳群體或者基因組文庫。對于植物來說,其生長周期一般都超過3個月甚至更長,并且經常受制于種植季節(jié),構建作圖群體一般就需要1-2年,整個過程將會消耗更多的時間。另一方面,傳統(tǒng)的組裝方法在前期進行大規(guī)模的實驗,這需要消耗大量的人力成本和物力成本來建立遺傳分離群體和標記基因型分析。特別是為了提高定位精度,需要進一步提高有效標記密度時(即獲得更多的交換單株),隨著作圖遺傳群體的擴大,需要消耗大量的人力物力[6]。

      1.2.3 誤差偏高 傳統(tǒng)的scaffolds錨位方法一般涉及大規(guī)模田間種植和分子生物學實驗,在復雜繁瑣的實驗過程中,多個環(huán)節(jié)實驗不可避免地導致實驗誤差和隨機偏差的積累,同時也更容易引入人為誤差和系統(tǒng)誤差。

      2 高通量染色質構象捕獲技術為scaffolds快速錨位提供了契機

      2.1 染色質構象捕獲技術

      染色質構象捕獲(Chromosome conformation capture,3C)技術原本用于研究基因表達時染色質的空間構象[7]。該技術利用了連接反應傾向于發(fā)生在物理上相互靠近的DNA片段之間(即鄰近連接原則),然后利用PCR對模板數量的敏感性,迅速準確地抓出與目標區(qū)域相互靠近的DNA片段。

      Hi-C(High-throughput chromosome conformation capture)技術是由3C[6]技術發(fā)展而來,結合了生物素標記篩選和二代測序技術,通過交聯(lián)、酶切、連接等步驟,實現全基因組范圍內染色質交互的高通量檢測。2009年,Job Dekker的研究小組在3C技術的基礎上開發(fā)出全基因組范圍的染色質構象捕獲技術(Hi-C),獲得了分辨率為1 Mb的交互圖譜并模建出核內染色質的三維立體模型[8]。研究人員通過化學手段固定住蛋白與核酸或蛋白與蛋白之間的接觸。隨后將DNA片段化,并將相互聯(lián)系的DNA連接在一起。最終對所有區(qū)域間的接觸次數進行統(tǒng)計,繪制出交互矩陣,便可估算出三維狀態(tài)下任意兩個區(qū)域相隔距離。

      目前,染色質交互數據在酵母、人類、小鼠、果蠅和擬南芥等物種中均有過報道。其中人類的染色質交互數據達到了1 kb的分辨率[9],精細程度深入到了單基因水平。

      2.2 染色質構象捕獲用于基因組組裝研究的現狀

      Hi-C技術傳統(tǒng)應用于研究與特定蛋白質因子作用的染色質組和全基因組范圍內染色質組的互作[10]。同時,Hi-C產生了大量的染色質交互數據,根據這些染色質交互數據,可以重建染色質的三維結構[11]。真核生物的基因組在細胞核中以染色質的形式存在,基因組的復制、轉錄、調控、DNA突變、長鏈非編碼RNA的傳播和胚胎發(fā)育等生物功能與其三維結構密切相關[12]。三維結構的重建,為我們更加系統(tǒng)地了解染色質的調控功能提供結構依據[13]。

      此外,Hi-C技術所揭示的染色質片段間的交互強度呈現出隨距離衰減的規(guī)律[8]。正是這一規(guī)律,催生出了“基于Hi-C技術組裝基因組”這一新的研究領域。與傳統(tǒng)的遺傳定律相類似,這一規(guī)律可以用來判斷scaffolds的分群及相鄰關系。具體而言,“染色體內交互高于染色體間交互”可以指導核酸片段的染色質分群,“同一染色體上近程交互高于遠程交互”則可以引導核酸片段的排序和定向。

      目前Hi-C技術應用于基因組組裝的物種主要包括人類、小鼠、果蠅、擬南芥、酵母以及其他微生物和微生物群落。2013年,Job Dekker等人[14]通過整合Hi-C數據、鳥槍法測序序列以及短序配對(Short jump mate-pair)文庫序列定位了人類基因組中65個尚未錨定到染色體上的重疊群,與其他方法得出的結果有83.78%相吻合。其中掛載到染色體的準確率為99.80%。Burton等[15]將這種方法應用到了人、小鼠和果蠅的全基因組de novo組裝當中,占人類和小鼠序列總長超過98%的scaffolds被用于分組、排序和定向,正確率達到90%以上。在果蠅中,雖然原始鳥槍法得到的scaffolds 質量與人類和小鼠相比較差,分組和排序的scaffolds利用率能達到81.2%和82.0%,scaffolds定向的正確率高達93.9%。Marie-Nelly等[16]用這種方法填補釀酒酵母基因組組裝中的缺口(gap),隨后又用它來組裝里氏木霉菌基因組。Burton小組[17]將Hi-C技術與宏基因組學相結合,在微生物群落的物種鑒別以及單個物種基因組組裝上都取得了很好的效果。而Putnam等[3]利用體外模擬體內DNA互作獲取的染色質信息組裝美國短吻鱷基因組,其中,在人類中68.9%測序讀長的比對質量超過了20;在美國短吻鱷中1298個測序讀長覆蓋度達到90%,一致性達到95%,都取得了較好的應用(表2)。

      本課題組利用此方法來組裝擬南芥基因組。利用有效的Hi-C交互數據,將總長度為112.61 Mb的 1705個 scaffolds[18]進行分群,其中 1350個scaffolds(占總長的97.12%)能夠被準確地分配到其相應的染色體上。基于染色體局部交互信息,對551個的scaffolds進行了排序和方向確定,其中516個(占總長的92.29%)scaffolds能夠被準確排序和確定方向[19]。

      表2 Hi-C數據從頭組裝基因組結果匯總

      3 基于體內染色質交互數據組裝基因組的主要流程

      3.1 實驗操作

      現有的獲取染色質體內交互數據的技術有很多,都是基于染色質構象捕獲技術(3C)發(fā)展而來,而應用于組裝最多的是Hi-C技術。Hi-C實驗主要的原理是甲醛能在常溫下與氨基或羥基發(fā)生化學反應,將蛋白與DNA或蛋白與蛋白之間的物理接觸“固定”下來。Hi-C技術的大致流程為:通過甲醛交聯(lián)固定,將細胞內由蛋白質介導的空間上鄰近的染色質片段進行共價連接。甲醛交聯(lián)后加入特定的限制性內切酶進行酶切。酶切后的黏性末端利用核苷酸補平,用于補平的其中一種核苷酸(如C)用生物素標記。之后在非常稀釋的環(huán)境中,加入連接酶連接平末端形成分子內連接,原有的酶切位點丟失,取而代之的是新的酶切位點。最后將連接的DNA進行純化后超聲破碎,并用生物素親和層析將生物素化的DNA片段分離出來,加上接頭通過高通量雙末端測序檢測交互的 DNA片段[8]。

      圖1 Hi-C測定染色質交互的基本原理及技術流程[8]

      3.2 數據分析

      3.2.1 數據的比對、去噪和校正 Hi-C實驗得到的原始染色體交互數據中具有大量的噪聲,因此,在基因組組裝前必須對原始數據進行處理。通過測序平臺獲得的原始交互數據是雙端測序數據,即pairend reads。與其他二代測序實驗一樣,必須先檢測測序的質量。因為實驗操作中可能因為條件控制而導致實驗差錯,對于建庫測序的結果,需要用相關的測序數據質量控制軟件(如FastQC)衡量數據的可利用性。

      在確定獲取的數據質量之后,需要將雙端測序結果比對到參考基因組上??芍苯邮褂枚绦蛄斜葘浖O置相關參數進行比對,也可以運用迭代增加mapping reads長度的比對算法[20],以便最大限度增加數據的利用率。

      最后,Hi-C實驗的各個操作步驟會引入各種各樣的噪聲,包括PCR重復、隨機打斷、自連接、隨機連接等[20-22],所以必須根據數據特征對這些噪聲進行過濾。同時,序列本身的特征如GC含量、酶切位點頻率[20,21]等都會對交互數據產生影響,因此通常還要對得到的原始交互數據進行迭代校正(Iterative correction and eigenvector decomposition,ICE)[20]。通過上述質量控制步驟后,我們可獲得用于基因組組裝的Hi-C交互數據。

      3.2.2 構建交互矩陣和掛載scaffolds 利用去噪校正之后的交互數據,構建染色質交互矩陣。如果有兩個以上技術重復,還需要檢驗交互矩陣的皮爾森相關性。

      針對其染色質三維空間結構特征,選取合適的聚類模型將未定位scaffolds錨定到染色體上,并采用相應的排序算法確定掛載scaffolds的正確順序和方向,組裝出染色體水平的全基因組序列(圖2)。目前基于染色質交互數據進行基因組組裝的幾個軟件都是按染色質三維空間交互規(guī)律開發(fā)的(表3),每個軟件在分組、排序和定向中采用的算法不同,使得不同軟件的參數設置也有所區(qū)別。研究者在基因組組裝過程中需要根據自身研究目標和數據特征來選擇不同的組裝軟件。

      4 染色質構象捕獲用于基因組組裝研究的主要優(yōu)缺點

      與傳統(tǒng)的組裝方法相比,基于染色質交互數據確定scaffolds在染色質上的具體位置具有以下三個方面的優(yōu)勢:

      圖2 利用染色質交互組裝基因組示意圖(以LACHESIS軟件為例[15],有改動)

      表3 基因組裝的相關軟件對比

      (1)利用染色質交互的reads分布來判定scaffolds的相對位置,具有更高覆蓋率和特異性。基于染色質交互的組裝方法的reads長度是一般遺傳標記的4-5倍,這使得其具有更高的位點特異性。此外,利用全局染色質捕獲技術能獲取所有的scaffolds片段的交互信息,因此絕大部分scaffolds都能被組裝。

      (2)基于單一株系染色質交互規(guī)律的組裝方法,是利用scaffolds在體內染色質相互作用的分布特征來判定染色體片段之間的鄰接關系,比利用親本后代遺傳連鎖交互的組裝方法更為直接和可靠。同時,它避免了繁瑣的群體構建工作,在極大程度上減少了實驗誤差、系統(tǒng)偏差及機械混雜等不可控因素的干擾。

      (3)基于染色質交互的組裝方法要求的基礎數據為進行基因組測序材料的單一株系Hi-C交互數據,整個過程無需構建龐大的遺傳群體和進行大規(guī)模的基因型分型工作。相比之下,Hi-C技術實驗周期短、實驗規(guī)模小,節(jié)約了時間和成本。

      由于Hi-C技術是以二代測序為基礎的,在基于交互組裝基因組的過程中,二代測序技術中存在的偏好和問題很有可能被引入到基因組組裝過程中。首先,位于著絲粒和端粒附近的序列往往是高度重復的,二代測序從根本上是無法確定其具體的序列信息的,也就很難對其完成組裝。也就是說基于交互組裝基因組只能在原有的基礎上提高基因組組裝的正確率和完成率,而無法使其達到100%。其次,由于Hi-C技術本身分辨率的限制,使得組裝無法更加精細,這一缺點有望在原位Hi-C中得到改進。再者,基于染色質交互組裝基因組方法的主要理論基礎是“近程交互高于遠程交互”這個一般性、全局性的規(guī)律,而事實上在特定的小區(qū)域(如著絲粒、斷離及拓撲相關結構域(Topologically associating domain,TAD)等,這一規(guī)律并不總是成立[23]。綜上所述,在scaffolds片段較?。ǎ?5 kb)、高度重復序列區(qū)域等因素都可能直接導致scaffolds錨位準確性和覆蓋率降低。

      5 基于染色質交互組裝基因組的應用前景和展望

      染色質構象捕獲技術表明,高等生物細胞核內染色質片段間的交互不是隨機、雜亂無章的,而是遵循著“染色體內交互高于染色體間交互,近程交互高于遠程交互”這一基本規(guī)律的。從生物學意義上講,這一規(guī)律反映了高等生物染色體三維結構形成的內在模式;在本文中我們展現了將這一規(guī)律應用于基因組組裝的潛力?;贖i-C技術進行基因組組裝的方法具有實驗操作簡單、周期短、成本低的優(yōu)點,能夠在有限的人力物力條件下獲得高覆蓋率和準確率的參考基因組。即使與目前正在興起的三代測序相比,該方法在成本上仍然具有相當的優(yōu)勢。

      相比傳統(tǒng)的基因組組裝的方法,以染色質相互作用為基礎的組裝擁有較高的特異性和不依賴于遺傳群體等特點,可能更適合復雜的基因組組裝。同時,Hi-C實驗簡單并且有較短的時間周期和較低的成本,這使得基于染色質交互的組裝方法有望獲得更廣泛的應用。因此,基于染色質交互組裝的方法在實驗設計、測序策略及算法等層面都存在較大的發(fā)展空間。

      5.1 應用前景

      基于染色質交互的組裝方法從DNA片段交互頻率與染色體內部結構之間的關系出發(fā),避免了群體規(guī)模和交換頻率這兩個問題,可以與遺傳圖譜方法互相補充,并且極大地節(jié)省了時間和成本。與經典可靠的物理圖譜組裝方法相比,基于交互數據組裝基因組在實驗規(guī)模、時間消耗和人力物力等方面均遠遠小于物理圖譜方法。結合該方法的優(yōu)勢,我們認為基于染色質交互數據的組裝方法可在以下四個方面獲得較大應用前景。

      第一,測序基因組的進一步完善。目前最為常用的是使用遺傳連鎖圖來掛載和確定contigs/scaffolds的染色體位置,但受限于物種群體規(guī)模和交換頻率,仍然有許多contigs/scaffolds不能確定染色體位置,因此,繼續(xù)使用遺傳圖譜方法來確定這部分序列將會花費巨大人力和物力。而利用基于染色質交互數據的方法,可用于掛載未掛載到染色體上的scaffolds的錨位和方向確定,從而提高已測序完成的基因組參考序列的完整性。

      第二,高度雜合的植物基因組從頭組裝和完善。由于多年生物種的雜合度高,群體的構建具有很大的困難,這就限制了基于遺傳連鎖圖譜掛載scaffolds的可行性、精度和準確性。而基于染色質交互組裝的方法不依賴于遺傳群體,僅需測序親本的少量組織樣品即可開展。因此,我們認為這種不依賴遺傳群體的方法能應用于雜合度較高的植物基因組組裝和完善中,并能獲得更加真實和完整的參考序列。

      第三,多倍體物種基因組的進一步完善。經典的基于遺傳圖譜掛載染色體的方法主要是通過SSR或SNP探針等遺傳標記來反映同源染色體之間的遺傳交換,然后利用標記之間的遺傳連鎖關系來判斷染色體片段的相鄰關系。而基于Hi-C的方法是利用reads之間交互的強弱來判斷其染色體片段的相鄰關系。相比前者,基于Hi-C的方法的reads長度是SSR、SNP等遺傳標記的4-5倍,這使得其具有更高的位點特異性。因此,我們認為這種高特異性的方法應用在基因組相對復雜,多倍體現象十分普遍的物種、尤其是植物中具有更大的優(yōu)勢。

      第四,具有重要科研、生態(tài)價值或區(qū)域特色的小眾物種的基因組從頭組裝和完善??紤]到小眾物種的科研群體較小、可用于全基因組測序的科研經費有限,而基于染色質交互組裝的方法成本較低,該方法的應用可節(jié)約高密度遺傳連鎖圖譜構建的成本。

      5.2 技術的優(yōu)化、整合和展望

      由于基于染色質交互組裝基因組的研究尚處于起步階段,目前僅限于少數模式物種中。因此要充分發(fā)揮該方法在基因組組裝的作用,需要從以下三個方面著手,進一步優(yōu)化、整合和完善組裝方法。

      第一,高分辨率、高質量染色質交互數據的獲取。染色質交互數據是該組裝方法的基礎,其質量的好壞、精度的高低直接制約著基因組組裝的準確性和覆蓋率。因此,針對特定物種,應該在染色質空間構象捕獲實驗的準確性、精度等多個層面進行努力。如最近發(fā)表在Cell雜志上的通過一種名為原位Hi-C(in situ Hi-C)的方法,測定了人類淋巴母細胞株(GM12878)的全局染色質交互,分辨率高達1 kb[9]。這種原位的方法,使DNA在連接期間仍保留在細胞核內,而不是被釋放到溶液中,顯著降低了DNA片段隨機連接的可能性[9]。

      第二,與傳統(tǒng)及新興的大片段文庫構建技術、第三代測序相結合,獲取高質量的長片段scaffolds。這不僅能提高染色質交互數據的精度,還能提高基因組組裝的完整性,同時可減少組裝錯誤。例如,將基于染色質互作的組裝方法與大片段文庫構建的策略,如雙末端測序、最近發(fā)展的CPT-Seq(Contiguity preserving transposase sequencing)[24]或新的測序技術(如第三代測序)相結合以獲得高質量的組裝結果。

      第三,與傳統(tǒng)遺傳圖譜信息相結合,相互補充。不管是以物種染色體片段遺傳交換為基礎的圖譜組裝法,還是以染色質交互為基礎的Hi-C組裝法,其都可能存在系統(tǒng)偏好性、甚至錯誤。因此,在基因組測序工作開展時,可綜合兩種方法進行基因組組裝,實現優(yōu)勢互補,從而獲得更加完整準確的參考基因組序列。

      [1]https://en. wikipedia. org/wiki/DNA_sequencing. com /.

      [2]http://www. genome. gov/sequencingcosts. com /.

      [3]Putnam NH, O’Connell B, Stites JC, et al. Chromosomescale shotgun assembly using an in vitro method for long-range linkage[J]. ArXiv, 2015, Available online at:http://arxiv.org/abs/1502. 05331.

      [4]Treangen TJ, Salzberg SL. Repetitive DNA and next-generation sequencing:computational challenges and solutions[J]. Nature Reviews Genetics, 2012, 13(1):36-46.

      [5]馬艷玲, 鄧海, 劉中來, 等. 海洋放線菌Streptomyces sp. 大片段DNA基因組文庫的構建[J]. 生物技術, 2010(5):1-3.

      [6]Claros MG, Bautista R, Guerrero-Fernández D, et al. Why assembling plant genome sequences is so challenging[J]. Biology, 2012, 1(2):439-459.

      [7]Dekker J, Rippe K, Dekker M, et al. Capturing chromosome conformation[J]. Science, 2002, 295(5558):1306-1311.

      [8]Lieberman-Aiden E, van Berkum NL, Williams L, et al.Comprehensive mapping of long-range interactions reveals folding principles of the human genome[J]. Science, 2009, 326(5950):289-293.

      [9]Rao SSP, Huntley MH, Durand NC, et al. A 3D map of the human genome at kilobase resolution reveals principles of chromatin looping[J]. Cell, 2014, 159(7):1665-1680.

      [10]翟侃, 武治印, 于典科. 染色質構象捕獲及其衍生技術[J].生物化學與生物物理進展, 2010, 37(9):939-944.

      [11]Dekker J, Marti-Renom MA, Mirny LA. Exploring the threedimensional organization of genomes:interpreting chromatin interaction data[J]. Nat Rev Genet, 2013, 14:390-403.

      [12]彭城, 李國亮, 張紅雨, 阮一駿. 染色質三維結構重建及其生物學意義[J]. 中國科學:生命科學, 2014, 44(8):794-802.

      [13]李國亮, 阮一駿, 谷瑞升, 等. 起航三維基因組學研究[J].科學通報, 2014, 59:1165-1172.

      [14]Kaplan N, Dekker J. High-throughput genome scaffolding from in vivo DNA interaction frequency[J]. Nature Biotechnology, 2013,31(12):1143-1147.

      [15]Burton JN, Adey A, Patwardhan RP, et al. Chromosome-scale scaffolding of de novo genome assemblies based on chromatin interactions[J]. Nature Biotechnology, 2013, 31(12):1119-1125.

      [16]Marie-Nelly H, Marbouty M, Cournac A, et al. High-quality genome(re)assembly using chromosomal contact data[J]. Nature Communications, 2014, 5:5695.

      [17]Burton JN, Liachko I, Dunham MJ, et al. Species-Level deconvolution of metagenome assemblies with Hi-C Based contact probability maps[J]. G3:Genes/Genomes/Genetics, 2014, 4(7):1339-1346.

      [18]Schneeberger K, Ossowski S, Ott F, et al. Reference-guided assembly of four diverse Arabidopsis thaliana genomes[J]. Proc Natl Acad SciUSA, 2011, 108(25):10249-10254.

      [19]Xie T, Zheng JF, Liu S, et al. De novo plant genome assembly based on chromatin interactions:A case study of Arabidopsis thaliana[J]. Molecular Plant, 2015, 8(3):489-492.

      [20]Imakaev M, Fudenberg G, McCord RP, et al. Iterative correction of Hi-C data reveals hallmarks of chromosome organization[J].Nature Methods, 2012, 9(10):999-1003.

      [21]Yaffe E, Tanay A. Probabilistic modeling of Hi-C contact maps eliminates systematic biases to characterize global chromosomal architecture[J]. Nature Genetics, 2011, 43(11):1059-1065.

      [22]Xie T, Fu LY, Yang QY, et al. Spatial features for Escherichia coli genome organization[J]. BMC Genomics, 2015, 16(1):37.

      [23]Dixon JR, Selvaraj S, Yue F, et al. Topological domains in mammalian genomes identified by analysis of chromatin interactions[J]. Nature, 2012, 485(7398):376-380.

      [24]Adey A, Kitzman JO, Burton JN, et al. In vitro, long-range sequence information for de novo genome assembly via transposase contiguity[J]. Genome Research, 2014, 24(12):2041-2049.

      猜你喜歡
      染色質文庫染色體
      染色質開放性與動物胚胎發(fā)育關系的研究進展
      哺乳動物合子基因組激活過程中的染色質重塑
      專家文庫
      優(yōu)秀傳統(tǒng)文化啟蒙文庫
      幽默大師(2020年10期)2020-11-10 09:07:22
      關于推薦《當代詩壇百家文庫》入選詩家的啟事
      中華詩詞(2019年1期)2019-11-14 23:33:56
      染色質可接近性在前列腺癌研究中的作用
      “哺乳動物卵母細胞生發(fā)泡染色質構型的研究進展”一文附圖
      生物學通報(2019年2期)2019-06-15 01:33:42
      多一條X染色體,壽命會更長
      科學之謎(2019年3期)2019-03-28 10:29:44
      為什么男性要有一條X染色體?
      科學之謎(2018年8期)2018-09-29 11:06:46
      專家文庫
      鹿泉市| 延边| 伊通| 蒲城县| 新绛县| 金堂县| 开原市| 武强县| 璧山县| 定南县| 南江县| 石景山区| 辰溪县| 桃江县| 沐川县| 平利县| 白水县| 驻马店市| 华坪县| 九寨沟县| 罗定市| 汉中市| 平昌县| 赣榆县| 阳高县| 敦煌市| 来宾市| 黄平县| 娄底市| 苍溪县| 上饶市| 陵川县| 马边| 岳阳县| 辛集市| 佛山市| 钟祥市| 隆安县| 潼关县| 逊克县| 三江|