摘 要:基因組編輯技術是一種能精確靶向修飾生物基因組,實現(xiàn)對基因定點敲除和外源基因定點整合的技術。新出現(xiàn)的鋅指核酸酶(ZFN)、轉錄激活子樣效應因子核酸酶(TALEN)和規(guī)律性重復短回文序列簇與Cas9蛋白(CRISPRs/Cas9)系統(tǒng)3種新型的基因組編輯技術通過特異性結構識別靶位點,核酸酶發(fā)揮切割作用對靶位點進行定點編輯。3種新型基因編輯技術因具有高效準確、制作簡單、耗時短等特點而在生命科學研究中得到廣泛應用。論文對目前三種新型的基因組定點編輯技術的特點、結構原理、構建方法以及在傳統(tǒng)生物模型、功能基因篩選、人類遺傳病基因治療等方面中的應用做一綜述。
文獻標識碼:A
文章編號:1007-5038(2015)10-0100-06
收稿日期:2015-04-21
基金項目:國家自然科學基金項目(31172304)
作者簡介:韓 勇(1990-),男,山東濟寧人,碩士研究生,主要從事分子免疫學研究。*通訊作者
近年來隨著人類基因組測序的完成和全基因組測序技術的不斷發(fā)展,復雜基因組中未知基因功能的探索對生物學的定點研究、臨床醫(yī)學及基因治療都有著不可替代的作用。長期以來,基于同源重組機制的基因敲除技術已在基因功能研究中被廣泛采用,但是該技術在實際工作中存在著效率太低、費時費力,而且有可能導致基因突變等問題,使基因功能的研究變得困難。隨著生物技術的發(fā)展,基因組編輯技術經(jīng)歷了三代技術的發(fā)展,即鋅指核酸酶(zinc finger nucleases,ZFNs)、轉錄激活子樣效應因子核酸酶(transcription activator-like effector nucleases,TALENs)和規(guī)律性重復短回文序列簇與Cas9蛋白(clustered regularly interspaced short palindromicrepeats,CRISPR/Cas9)。這三種技術都能夠根據(jù)人工設計在基因組的特定位置造成DNA雙鍵斷裂。細胞會通過DNA同源重組或者非同源末端連接機制修復雙鏈斷裂。在同源序列(外源引入或同源染色體)存在的情況下,同源重組修復(homologous recombination repair,HDR)可實現(xiàn)外源基因的插入或基因的靶向修復;在沒有同源序列的情況下,細胞趨向于利用非同源的末端連接(non homologous end joining,NHEJ)進行DNA的修復,它可能引入或刪除一個或多個堿基從而造成基因移碼突變,使相關基因被敲除。
1 鋅指核酸酶基因編輯技術
1.1 鋅指核酸酶的結構及作用原理
鋅指核酸酶(zinc finger nucleases,ZFNs)由鋅指蛋白結構域和能識別特異性DNA鏈的切割結構域連接形成并發(fā)揮切割DNA的作用。ZFN由3~4鋅指蛋白組成,可以結合9個~12個核苷酸,每個鋅指蛋白可以識別3bp DNA,當兩個鋅指蛋白模塊結合時可以最有效的結合特異性位點,且每個鋅指模塊可以識別6bp DNA。Ⅱ型限制性內切酶FokⅠ催化DNA雙鏈斷裂,當切割結構域發(fā)生二聚化體時才會斷裂DNA。所以兩個相鄰的ZFN對必須保持合適的距離,才能發(fā)生二聚體化。ZFN可以結合并切割一段DNA序列,并產生DNA雙鏈斷裂。ZFN誘導的雙鏈斷裂可以通過NHEJ和HDR兩種修復方式,NHEJ會在靶位點隨機的引入基因或刪除基因,HDR通過外源性模板在靶位點進行修復 [1]。此外,F(xiàn)okⅠ突變體需要異源二聚化得到發(fā)展,這可以極大提高對特異性序列的識別并減少對靶點外的位點的切割。DNA分子可以和鋅指蛋白結合,產生鄰近序列效應并與相鄰的結構域相互作用,這既增加了結合物的特異性,也為結合物的設計帶來了挑戰(zhàn)。
1.2 ZFN的構建
當前存在3種不同ZFNs構建方法,即模塊組裝法(modular assembly),寡池工程法(oligomerized pool engineering,OPEN)和由Sangamo Biosciences公司開發(fā)的方法。模塊組裝法通過標準的DNA重組技術將預選的ZF組裝成多鋅指的ZF組合模塊。OPEN法是通過ZF庫獲得識別3bp DNA位點的ZF池。Sangamo Biosciences公司開創(chuàng)的方法則可將鋅指結構組裝成更長的ZF組合模塊。
1.3 ZFN技術的應用
基因編碼的ZFN的表達與對內源性基因位點的斷裂得到廣泛的應用。包括人、斑馬魚、倉鼠、小鼠、豬、青蛙、昆蟲、蛔蟲和瘧原蟲。2010年Osakabe K等 [2]將帶有熱休克蛋白啟動子的ZFN基因,穩(wěn)定導入擬南芥中,并成功敲除AB14基因。2011年Li H等 [3]利用ZFN結合未突變的功能基因共轉染,治愈血友病B型家鼠,試驗充分展現(xiàn)了ZFN的巨大潛力。更為重要的是他們將治療引入體內,為基因疾病的治療提供了一個可行的方案。近幾年,ZFN技術在農業(yè)中得到廣泛應用,通過ZFN進行突變育種可以改變植物構造、花期和成熟期,并獲得了3 000多種新型品種 [4]。ZFN可用于內源性基因的改變,2014年Chen L等 [5]證明通過特定基因中序列突變實現(xiàn)的反向遺傳法可用于高通量基因組分析。
2 TALEN技術
2.1 TALEN的結構及作用原理
轉錄激活子樣效應因子核酸酶(transcription activator-like effector nuclease,TALEN)系統(tǒng)的發(fā)現(xiàn)來自于對黃桿菌屬的研究,黃桿菌屬分泌的效應蛋白(TALE)可以效仿真核轉錄因子與DNA結合并催化靶向DNA表達。TALE蛋白由DNA結合結構域,核定位信號和靶基因轉錄催化結構域組成。
DNA結合結構域由多個單體組成,每個單體可以與一個靶位點的核苷酸結合。每個單體是34個氨基酸殘基串聯(lián)重復組成,第12和13位氨基酸高度特異(RVD),決定了對特異性核苷酸的識別,如Asn和Ile(NI)識別A,Asn和Gly(NG)識別T,2個Asn(NN)識別G,His和Asp(HD)識別C,第1個氨基酸殘基用于穩(wěn)定空間構象,第2位氨基酸識別核苷酸,通過NH或NK識別G可以減少脫靶效率。不同的RVD結合DNA的效率不同。人工構建的TALEN系統(tǒng)由核定位信號,TALE蛋白,半重復片段,N-末端結構域和FokⅠ催化結構域組成。TALENs系統(tǒng)識別兩條反向的DNA位點,兩位點由12bp~25bp DNA片段隔開,并在雙氨基酸殘基(NN、HD、NI、NG)的識別作用下與靶序列結合,F(xiàn)okⅠ配對二聚體化,使DNA雙鏈斷裂 [6]。DNA結合結構域不能與所有識別的位點結合,只有在打靶序列5′端存在T堿基才會結合。雙鏈斷裂(double-strand breaks,DSB)誘發(fā)DNA損傷修復機制,細胞主要通過兩種途徑來修復,即NHEJ和HDR。當沒有外源的同源序列加入時,細胞就會啟動NHEJ修復機制,將斷開的DNA末端重新結合在一起,但是這種修復機制是一種存在缺陷的修復過程,往往會引入新的突變,因此也就達到了進行基因敲除的目的。如果此時加入外源的同源堿基序列就可以啟動第二種修復機制HDR,利用同源修復機制,可以幫助我們實現(xiàn)基因敲進和基因修復。即使外源的同源序列存在缺陷,同樣可以達到基因敲除的效果。
2.2 TALEN表達載體的構建
TALEN表達載體的構建技術為全序列人工合成法,包括Golden Gate法,REAL法,單元組裝法。Golden Gate法是通過IIS型限制性核酸內切酶介導的克隆方法,該方法是目前在TALEN載體構建中應用最廣泛的方式之一。REAL(restriction enzyme and ligation)法是一種基于反復酶切-連接-轉化 -篩選的組裝法,由Sander等 [7]的實驗室發(fā)明。單元組裝法是Huang P等 [8]發(fā)明的另一種基于酶切-連接的TALE結構域組裝法。
2.3 TALEN技術的應用
自2014年以來,TALEN已成功地在犬、小鼠、海鞘、人和大麥生物中進行了基因組定點編輯。Tokuda S等 [9]利用TALEN技術成功敲除犬腎細胞中的ZO-1基因,并證明了該基因的敲除使細胞接觸之間的肌球蛋白組織發(fā)生改變,而且緊密連接蛋白的位點遭到破壞,從而揭示了ZO-1基因在犬腎細胞之間的連接所擔任的角色。Chen K等 [10]通過TALEN技術成功敲除了大麥中的grf基因,達到了很高的效率,而且該敲除基因可以穩(wěn)定地遺傳給后代。以此證明了TALEN可用于檢測基因功能,改變大麥表型并可用于其他作物物種。Liu Y等 [11]開發(fā)了一種新的策略,通過被雙熒光標記TALEN敲除了純合子小鼠中的Ttc36基因,并且用單側腎切技術檢驗表型,最后證明了新開發(fā)的TALEN策略與單側腎切技術結合可以更好地用于腎臟發(fā)育和腎臟疾病方面的研究。Park C Y等 [12]用TALEN技術使人類多能干細胞中F8基因顛倒,用來構建血友病細胞系模型,表明只有正常連接的F8基因才能正常轉錄mRNA,證明了TALEN可用來建立與染色體重排有關的疾病細胞模型,也可以用于改變染色體顛倒帶來的缺陷,為血友病的治療和其他基因疾病的治療提供了理論依據(jù)。Liu J等 [13]通過優(yōu)化TALEN的復合結構,極大地提高了轉染效率,并成功敲除了女性干細胞中HPRT1基因,使敲除效率達到了15%。Treen N等 [14]通過電轉染將TALEN載體轉入海鞘特異性組織中并達到了很高的轉染效率,并成功敲除了Hox12和Fgf3基因,并通過此方法揭示了海鞘中Fgf3基因功能。
3 CRISPR/Cas系統(tǒng)介導的基因編輯技術
3.1 CRISPR/Cas系統(tǒng)的結構及作用原理
規(guī)律性重復短回文序列簇(clustered regularlyinterspaced short palindromic repeats,CRISPR/Cas)系統(tǒng)是細菌和古生菌中以RNA為基礎的免疫系統(tǒng) [15],CRISPPR/Cas系統(tǒng)中含有一個編碼Cas9核酸酶基因和兩個編碼導向RNA的基因,即反式激活crRNA(tracrRNA)和前導crRNA(precrRNA)。precr RNA位點包括一系列的重復序列(30bp~40bp)和間隔序列。crRNA和tracrRNA (trans-activating crRNA)配對與Cas9蛋白形成核酸復合物(RNP),并識別攜帶PAM標記的DNA序列,通過Cas9蛋白中的RuvC和HNH切割結構域發(fā)揮打靶作用。以化膿鏈球菌中Ⅱ型CRISPR系統(tǒng)應用最為廣泛,Cas9蛋白作為該系統(tǒng)的主要特征,它參與Pre-RNA加工為成熟的crRNA,以及對外源DNA的靶向切割 [16]。Cas9蛋白包含N端RuvC和中間的HNH兩個活性位點。Pre-RNA作為導向序列被直接重復序列隔開,經(jīng)過加工成熟與tracrRNA結合,也可以被一個導向RNA(gRNA)替換。Cas9蛋白結合靶向DNA的特異性由gRNA-DNA對和PAM決定,PAM作為靶序列上核苷酸標志,不同的CRISPR/Cas系統(tǒng)識別的PAM的不同。
對于CRISPR/Cas的作用機理以Ⅱ型CRISPR/Cas系統(tǒng)為例,可以分為三個階段。第一階段,當外源DNA入侵時,核酸中的一小段DNA序列被整合到宿主菌的基因組,整合的位置位于CRISPR的5′端的兩個重復序列之間(repeats),從而在5′端的富含AT的重復序列之間形成間隔序列。第二階段,CRISPR基因座轉錄成Pre-crRNA,Pre-crRNA在Cas9蛋白作用下加工成熟為crRNA,由一個間隔序列和部分重復序列組成。第三階段,外源DNA入侵時CRISPR的表達很快被誘導上調,發(fā)揮定點編輯作用,即crRNA與tracrRNA形成導向的雙鏈RNA(sgRNA),對入侵的外源核酸進行靶向的定位并介導Cas9核酸酶對外源核酸進行切割降解。
3.2 CRISPRs系統(tǒng)的構建
CRISPR系統(tǒng)體外構建的一般步驟:①定向雙鏈RNA(guide RNA,sgRNA)的設計。crRNA與tracrRNA形成的雙鏈RNA(guide RNA,sgRNA)介導雙鏈DNA剪切,sgRNA中導向序列決定了Cas9核酸酶的特異性。CRISPRs系統(tǒng)中,靶序列必須在5′-NGG PAM的前面,序列堿基與靶序列配對并調節(jié)Cas9在PAM上游約3bp處切割。需要指出的是,PAM序列必須在靶DNA位點之后,而不是在sgRNA中引導序列的一部分。②sgRNA的構建與遞呈。根據(jù)靶序列sgRNA可以通過含有表達原件的PCR擴增子或sgRNA表達質粒的形式遞呈?;赑CR擴增子的sgRNA遞呈在擴增時模板鏈必須帶一個U6啟動子。將擴增子與Cas9表達質粒pSpoCas9共轉染細胞可以高效地獲得所需sgRNA,并且可以很快地對細胞進行功能檢測。通過sgRNA表達質粒遞呈sgRNA也是一種簡單、高效的方法,該方法只需要一些互補引物對sgRNA表達質粒進行單一的克隆。③修復模板設計。傳統(tǒng)上靶DNA的修飾需要以含有同源雙臂的質粒作為修復模板,每個位點上的同源臂的長度超過500bp。這種方法主要用于產生大的修飾基因。最新的ssODNs已經(jīng)取代打靶修復質粒,可以用于短的修飾基因,作為特定靶位點修復模版,并獲得很高的HDR效率。④篩選單克隆細胞系。轉染后通過流式細胞儀或連續(xù)稀釋分離單個細胞便可得到,隨后在細胞克隆期建立一個新的細胞系。⑤功能檢測。對設計好的sgRNA進行活性檢測以獲得突變效率較高的sgRNA以用于后期的實驗。目前主要采用的方法有限制性內切酶法、非配對內切酶法和SSA活性檢測等方法。
3.3 與其他基因組編輯技術的比較
近幾年出現(xiàn)了許多基因組編輯技術,包括鋅指核酸酶(ZFN)、TALEN及RNA指導的CRISPR/Cas核酸酶系統(tǒng)。前兩種技術應用限制核酸內切酶催化結構域的策略來模塊化DNA結合蛋白,并進一步誘導在特定基因組位點上目的DNA雙螺旋的斷裂(DSB)。與其他知名的核酸酶技術,例如:與ZFN、TALEN一樣,Cas9能夠刺激哺乳動物基因組中靶DNA在特定位點發(fā)生雙鏈斷裂及通過NHEJ 和HDR刺激基因組編輯。與ZFN和TALEN技術相比較,Cas9具有幾個潛在的優(yōu)勢:易于定制、更高的打靶效率和促進基因組多重編輯的能力。由于傳統(tǒng)的ZFN通常很難設計,我們將主要比較Cas9和TALEN。①易于定制。通過簡單地購買一對寡核苷酸編碼的20nt的一道序列,Cas9可以重新打靶新的DNA序列。與之相比,TALEN重新打靶新的DNA序列需要重新構建兩個新的TALEN基因。雖然有很多的TALEN構建方案,但實際上構建一對新的TALEN需要更多的操作時間;②劈裂模式。化膿鏈球菌(S.pyogenes)Cas9在靶基因序列第17和18個堿基之間(PAM3bp5′)低效率的切割,使Cas9中RuvC或HNH其中的一個核酸酶結構域突變,可以使酶轉化為DNA切割酶。與之相比,TALEN非特異性的切開一對TALEN之間12bp~24bp處的單體連接位點;③編輯效率。在多種不同類型的細胞核有機體中Cas9和TALEN均展現(xiàn)出促進基因組編輯效率的作用。然而這要歸功于容易打靶,但Cas9可用于同時打靶多個基因組位點。
3.4 Cas9系統(tǒng)的局限性
Cas9可通過sgRNA上20nt的引導序列打靶特定的基因組位點。Cas9打靶位點選擇的唯一要求是PAM序列3′端20bp的靶序列的存在。每個Cas9直接同源,都含有唯一的PAM序列。例如,Cas9需要一段5′-NGG PAM序列,這種PAM的要求在人類基因組中并沒有很嚴格的限制打靶的范圍,這種打靶位點平均每8bp~12bp就會發(fā)現(xiàn)。除了打靶的范圍,其他可能的限制是潛在的脫靶突變。3.5 CRISPR/Cas9系統(tǒng)在基因組編輯中的應用
通過CRISPR/Cas9的特異性切割,可以對DNA分子進行定點編輯。自2014年以來,CRISPR/Cas9系統(tǒng)的開發(fā)和應用已成為分子生物學的熱點。CRISPR/Cas9技術已在細菌、果蠅、哺乳動物、斑馬魚和人多能干細胞(human pluripotent stem cell,hPSC)基因的功能性研究中得到應用。Zhang C等 [17]用CRISPR/Cas9對瘧原蟲基因進行了修飾,并介紹了一種對P.yoelii基因進行高效、準確敲除的方法。Gokcezade G等 [18]證明了在果蠅中通過雙順反的Cas9/sgRNA表達載體介導的CRISPR基因編輯是一種高效通用的方法,并通過單一質粒注射可以很大程度節(jié)省時間。Ho T T等 [19]通過敲除人體不同細胞中的非編碼RNA,如mir-1,mir-29a,IncRNA-21A,UCA1和AK023948。證明了通過CRISPR/Cas9可以成功敲除人類細胞系中非編碼的基因。Sasaki H等 [20]通過顯微注射或電穿孔注射CRISPR/Cas9表達載體,成功敲除海鞘內源性基因。Endo M等 [21]為了驗證CRISPR/Cas9是否可以敲除大米的旁系同源基因,通過同型sgRNA靶向誘變大米中的CDKA2、CDKB1和CDKB2。結果證實同型sgRNA可以靶向誘變單倍體,二倍體和三倍體中的CDKA2、CDKB1和CDKB2基因。Wei W等 [22]通過向蠶胚胎中顯微注射特異性的sgRNA和Cas9-mRNA介導Bm-ck,BmKMO,BmTH和Bmtam的突變,并通過帶有Bmok基因飛蛾與野生型和兩種帶有Bmok基因相互雜交,檢測其后代突變率達到了93.6%,證明了CRISPR/Cas9在家蠶中介導的基因編輯是可以遺傳的。Fan Z等 [23]通過合成5個sgRNA(其中3個靶向識別不同的編碼序列,一個識別KCNQ1,另一個識別PPP1R12C),證明了CRISPR/Cas9系統(tǒng)在介導倉鼠體細胞特定位點的突變中達到高效而準確的效果,并通過子核和胞質注射法對STAT2基因上的第4外顯子進行了編輯。Straub C等 [24]利用CRISPR/Cas9成功敲除了Grin1基因,該基因編碼NMDA受體,基本單位GLuN1,在鼠神經(jīng)細胞中很少存在。并證明了CRISPR/Cas9可以介導體內神經(jīng)元的斷裂,為研究神經(jīng)傳導過程中的特異蛋白功能提供了有利的方法。
隨著CRISPR/Cas9技術日漸成熟,為基因疾病的治療提供了更方便、高效的工具。Lin S R等 [25]為證明CRISPR/Cas9系統(tǒng)是否能斷裂乙型肝炎病毒(HBV)基因組,他們設計8個可識別A基因型HBV的gRNA,伴隨gRNA的CRISPR/Cas9系統(tǒng)可以減少HBV的核心復制和蛋白質的合成,其中一個gRNA可以打靶不同基因型的HBV病毒,最后通過感染的HBV小鼠模型,更加證明了系統(tǒng)可以清除體內HBV,結果可以降低血清中抗原水平。
自第1只基因敲除小鼠模型的產生,科研工作者致力于模型生物的構建,但傳統(tǒng)的構建方法費時費力,程序繁瑣,新一代的CRISPR/Cas9技術為構建模式生物提供了新的平臺。Edvardsen R B等 [26]在大西洋鮭魚中通過CRISPR/Cas9系統(tǒng)靶向修飾tyr和slc45a2基因,第一次成功地在冷水海洋物種中運用CRISPR/Cas9成功靶向誘變,并成功獲得突變的等位基因,證明了F0代可用于大西洋鮭魚的功能性研究。Irion U等 [27]在斑馬魚中成功利用CRISPR/Cas9獲得功能缺失的等位基因。通過CRISPR/Cas9高效而且準確的靶向識別修飾alb基因上的終止密碼子,突變率達到50%并可以通過生殖細胞遺傳給下一代,為遺傳研究提供了生物模型。該研究也證明了通過CRISPR/Cas9系統(tǒng)可以為脊索動物的內源性基因的研究提供合適的模式生物。Ni W等 [28]利用CRISPR/Cas9系統(tǒng)成功敲除山羊的成纖維細胞基因,并通過核移植獲得了一代基因突變山羊。Xing H L等 [29]人開發(fā)出一種基于PCAMNIA或PGreen載體的CRISPR/Cas9雙運載體和sgRNA模式載體作為一種植物多基因編輯工具。這種載體可以瞬時穩(wěn)定地使CRISPR/Cas9系統(tǒng)表達并在植物中進行高效率的靶向突變。
4 展望
隨著人類基因組測序的完成和全基因組測序技術的不斷發(fā)展,復雜基因組中未知基因功能的探索已成為后基因時代的熱點。與傳統(tǒng)的基因打靶技術相比,新一代的人工核酸酶ZFN、TALEN和細菌獲得性免疫系統(tǒng)CRISPR可以應用于更多的物種,且定向修飾更加精確,效率更高,所需時間更短,得到的突變可以通過種系遺傳。但是新一代的基因編輯技術還處于初級階段,還存在細胞毒性、構建復雜、價格昂貴和脫靶效應等問題??偠灾?,新一輪基因組編輯技術雖然處于研究的初期階段,但其在基因編輯方面已表現(xiàn)出巨大的潛力和廣闊的應用前景,在未來的發(fā)展中,基因編輯技術必將成為生命科學和生物醫(yī)學等領域研究與應用的重要工具。