胡惠芳
(湖北輕工職業(yè)技術(shù)學(xué)院湖北武漢430200)
基因組拷貝數(shù)變異及其突變機理分析
胡惠芳
(湖北輕工職業(yè)技術(shù)學(xué)院湖北武漢430200)
拷貝數(shù)變異能夠?qū)е鲁拭系聽栠z傳的單基因病和罕見疾病,同時與復(fù)雜疾病相關(guān)。目前用來進行全基因組范圍的拷貝數(shù)變異研究方法有很多,包括單核苷酸多態(tài)性分型芯片技術(shù)、基于芯片的比較基因組雜交技術(shù)和新一代測序技術(shù)??截悢?shù)變異的形成機制也有很多種,總的來說可以概括為DNA重組和DNA錯誤復(fù)制兩大類。本文對基因組拷貝數(shù)變異進行簡單介紹,并詳細(xì)分析了其突變機理。
基因組;拷貝數(shù)變異;發(fā)現(xiàn);突變機理
顧名思義,“拷貝數(shù)變異”就是會產(chǎn)生拷貝數(shù)的量變。準(zhǔn)確來說,拷貝數(shù)變異通常是指長度超過1kb的基因組大片段的拷貝數(shù)減少或者增加,主要表現(xiàn)為亞顯微水平的重復(fù)和缺失??截悢?shù)變異是由基因組發(fā)生重排而導(dǎo)致的,是基因組結(jié)構(gòu)變異的重要組成部分。
2004年是拷貝數(shù)變異研究中具有重大意義的一年。利用新的能夠覆蓋整個人類基因組的先進研究技術(shù),有兩個研究小組差不多同時發(fā)現(xiàn)了大片段的拷貝數(shù)變異,這種大片段的拷貝數(shù)變異不僅能夠?qū)е鲁錾毕莸戎卮蠹膊?,而且能夠作為一種遺傳多態(tài)性而廣泛分布于人類基因組之中。目前,被報道的基因組結(jié)構(gòu)變異已經(jīng)超過了66000個,其中主要是拷貝數(shù)變異。
那么,人類基因組上大量的拷貝數(shù)變異究竟是如何產(chǎn)生的呢?DNA重組是其中一類已知的機制,包括非同源末端連接和非等位同源重組等。最近研究發(fā)現(xiàn)的“復(fù)制叉停滯與模板交換”(Fork stalling and template switching,F(xiàn)oSTeS)模型是一種新的基于DNA錯誤復(fù)制的機制。此種機制可以解釋那些不符合非等位同源重組和非同源末端連接等突變機制的具有復(fù)雜結(jié)構(gòu)的拷貝數(shù)變異。
2004年,某研究小組應(yīng)用寡核酸微陣列分析技術(shù),使用85000個平均間隔為35kb的探針對20例正常個體的基因組DNA片段的拷貝數(shù)情況進行了分析,鑒定出其中76個位點上存在的221個長度超過100kb的拷貝數(shù)變異。同時,有人利用基于細(xì)菌人工染色體探針的分辨率為1Mb的比較基因組雜交芯片,對55例個體的大片段拷貝數(shù)變異情況進行了分析,發(fā)現(xiàn)了255個重復(fù)和缺失。
“基因組變異數(shù)據(jù)庫”對已經(jīng)被報道的拷貝數(shù)變異進行了收錄和數(shù)據(jù)整理?!盎蚪M變異數(shù)據(jù)庫”中的所有拷貝數(shù)變異所覆蓋的基因組片段占人類基因組的29.7%,但是實際上這個比例要更低一點。此外,根據(jù)研究數(shù)據(jù)估計,人類基因組上有5~10%的區(qū)域存在拷貝數(shù)變異,比其他遺傳變異形式要高很多。
事實證明,拷貝數(shù)變異研究具有重大的臨床價值和科學(xué)意義,因此全球范圍內(nèi)開展拷貝數(shù)變異研究項目的研究中心越來越多,例如千人基因組計劃和人類基因組結(jié)構(gòu)變異研究組等。千人基因組計劃已經(jīng)獲得了初步數(shù)據(jù),包括2萬個拷貝數(shù)變異,100萬個短的插入或缺失以及1500萬個單核苷酸多態(tài)性的位點,其中絕大部分都是新的發(fā)現(xiàn)。
3.1 非等位同源重組主要發(fā)生在減數(shù)分裂中,可導(dǎo)致倒位、重復(fù)和缺失
等位同源重組是生物遺傳多樣性的來源,是指在減數(shù)分裂過程中,基因組上同一位點的DNA序列與其同源序列發(fā)生的重組。
非等位同源重組是由兩條同源的、但在基因組不同位置重復(fù)出現(xiàn)的、高度相似性的DNA序列配對并發(fā)生序列交換造成的。非等位同源重組若發(fā)生在相同染色體上的同向重復(fù)序列間則會造成缺失或重復(fù),若發(fā)生在相同染色體上的反向重復(fù)序列間則會造成倒位。若非等位同源重組發(fā)生在不同染色體上的重復(fù)序列間則可能會導(dǎo)致染色體易位。
非等位同源重組的底物通常是長度超過10kb,序列相似度大于95%的SD序列。除了SD序列之外,非等位同源重組的底物還包括可以反轉(zhuǎn)錄轉(zhuǎn)座的L1元件、Alu等較短的重復(fù)序列。由于檢測手段的局限性,此類機理導(dǎo)致的拷貝數(shù)變異通常會低估。
同源重組(包括非等位同源重組和等位同源重組)是存在重組熱點的,即重組發(fā)生的位點存在著一定的序列傾向性,而不是隨機分布于基因組之上。一個順式作用基序“CCNCCNTNNCCNC”富集的現(xiàn)象在等位同源重組和非等位同源重組的重組熱點中都有被發(fā)現(xiàn),這不僅說明等位同源重組和非等位同源重組是共享重組熱點的,并具有類似分子機理,同時也提示了該段特征序列是某些或者某一重組相關(guān)蛋白識別位點的可能性。
非等位同源重組主要發(fā)生在減數(shù)分裂中,造成不平衡交換,形成攜帶有拷貝數(shù)變異的配子,進而傳遞給后代。在有絲分裂中也可以發(fā)生較少的非等位同源重組事件,在體細(xì)胞中形成攜帶拷貝數(shù)變異或者其它結(jié)構(gòu)變異的嵌合型。
基于非等位同源重組機理發(fā)生的拷貝數(shù)變異具有較高的突變率。某研究小組采用精子分型技術(shù),分析了幾名4個基于非等位同源重組機理產(chǎn)生的拷貝數(shù)變異,源自5名正常男性的精液樣本。這些拷貝數(shù)變異包括:Potocki-Lupski綜合征重復(fù)突變與Smith-Magenis綜合征缺失突變,腓骨肌萎縮癥重復(fù)突變與遺傳性壓力敏感性神經(jīng)病缺失突變,無精子癥因子a缺失突變及其相對的重復(fù)突變,7q11.23重復(fù)突變和Williams-Beuren綜合征缺失突變。
3.2 一些結(jié)構(gòu)簡單的拷貝數(shù)變異可以源自非同源末端連接
非同源末端連接是在人類細(xì)胞中進行生理性的V(D)J重組的,此外還可以修復(fù)由氧化反應(yīng)或者輻射引起的DNA雙鏈斷裂。如前面所述,非等位同源重組需要具有同源性的DNA片段作為重組底物,而非同源末端連接則是不需要的;另外,非同源末端連接產(chǎn)生以后能夠在連接部位插進若干個堿基。同其他突變機理相比,這兩點是非同源末端連接的主要特征。
某些基于非同源末端連接的拷貝數(shù)變異的斷點傾向于落在重復(fù)序列內(nèi)或者其周圍;此外,某些DNA基序可以引起DNA彎曲或?qū)е翫NA雙鏈斷裂,如TTTAAA,因此基于非同源末端連接產(chǎn)生的拷貝數(shù)變異容易出現(xiàn)在此類位點附近。
3.3 基于DNA錯誤復(fù)制的FoSTeS機理可以產(chǎn)生含復(fù)雜結(jié)構(gòu)的拷貝數(shù)變異
高密度比較基因組雜交芯片技術(shù)的發(fā)展促進了對拷貝數(shù)變異的研究,眾多具有復(fù)雜重排結(jié)構(gòu)的拷貝數(shù)變異被發(fā)現(xiàn),并且無法被前述的基于DNA重組的機理模型所解釋。為此,有人提出了一種解釋拷貝數(shù)變異突變和一些異常人類基因組重排的新機理。
根據(jù)“復(fù)制叉停滯與模板交換”模型,在DNA復(fù)制叉停滯的同時,滯后鏈從模板上脫落,通過微同源序列轉(zhuǎn)移到另一個復(fù)制叉上,然后開始重新合成DNA。兩個要產(chǎn)生模板轉(zhuǎn)換的復(fù)制叉會在空間上接近彼此。新復(fù)制叉上錯誤的結(jié)合片段最終是正向還是反向出現(xiàn),這取決于復(fù)制叉的方向以及新復(fù)制叉中的作為模板是引導(dǎo)鏈還是滯后鏈。除此之外,模板轉(zhuǎn)換的結(jié)果是重復(fù)還是缺失,取決于新的復(fù)制叉是在起始復(fù)制叉的上游還是下游。
研究表明,由于DNA復(fù)制錯誤而產(chǎn)生的拷貝數(shù)變異在SMS綜合征或PTLS綜合征、佩梅病、LIS1、MECP2等位點上都有被發(fā)現(xiàn)。通過“復(fù)制叉停滯與模板交換”機理不但可以產(chǎn)生長度高達數(shù)Mb的拷貝數(shù)變異,還能夠引起單個外顯子水平和基因水平的重排并產(chǎn)生拷貝數(shù)變異?!皬?fù)制叉停滯與模板交換”可以導(dǎo)致基因的重復(fù)和外顯子混編,這些過程是驅(qū)動基因和基因組進化的主要機制。
拷貝數(shù)變異是產(chǎn)生人類遺傳多樣性和個體間遺傳差異的一個重要來源。與單核苷酸多態(tài)性相比,拷貝數(shù)變異涉及更多的人類基因組序列,具有更高的突變率?;贒NA重組機制(例如非等位同源重組和等位同源重組)與DNA錯誤復(fù)制機制(例如“復(fù)制叉停滯與模板交換”)的基因組重排可以產(chǎn)生多種類型的拷貝數(shù)變異??截悢?shù)變異與人類復(fù)雜疾病相關(guān),也可以導(dǎo)致呈孟德爾遺傳的單基因疾病。但是,由于當(dāng)前基因組覆蓋率和拷貝數(shù)變異研究方法的分辨率的限制,人類基因組中沒有被發(fā)現(xiàn)的拷貝數(shù)變異還有很多。今后,對拷貝數(shù)變異相關(guān)疾病以及人類基因組的系統(tǒng)研究,可以使我們對拷貝數(shù)變異的形成、分布、進化、生物學(xué)效應(yīng)以及自然選擇等問題產(chǎn)生更加全面認(rèn)識。
[1]吳志俊,金瑋.拷貝數(shù)變異:基因組多樣性的新形式.遺傳,2014,31(4):339~347.
[2]何陽花,俞英,張沅.拷貝數(shù)變異與疾病的關(guān)系及其在動物抗病育種中的應(yīng)用前景.遺傳,2013,30(11):1385~1391.
[3]杜仁騫,金力,張鋒.基因組拷貝數(shù)變異及其突變機理與人類疾病.遺傳,2015,33(8):857~869.
R394
A
1004-7344(2016)30-0296-02
2016-10-9
胡惠芳(1982-),女,碩士,主要從事生物、化學(xué)等相關(guān)工作。