王 霞汪興澤
(1 泰興市西城中學(xué)教育集團(tuán) 江蘇泰州 225400 2 泰興市教師發(fā)展中心 江蘇泰州 225400)
2020年,諾貝爾化學(xué)獎授予法國科學(xué)家沙爾龐捷(Charpentier)和美國科學(xué)家道德納(Doudna),以表彰她們發(fā)明了CRISPR/Cas9 介導(dǎo)的基因編輯技術(shù)。本文從該技術(shù)的發(fā)現(xiàn)、原理等方面作一簡要概述。
原核生物無論古細(xì)菌還是真細(xì)菌,都可能因噬菌體的侵染而死亡。顯然,擁有防御噬菌體侵染能力的原核生物能獲得更好的生存機(jī)會。原核生物如何防御噬菌體的侵染?DNA 是有機(jī)大分子,復(fù)雜而脆弱,易受損傷。損傷類型有多種,例如,胞嘧啶的脫氨基、鳥嘌呤氧化等。其中,DNA 雙鏈斷裂在所有類型的損傷中危害最大,易導(dǎo)致DNA 的復(fù)制受阻,進(jìn)而遏制子代的形成[1]。古細(xì)菌或真細(xì)菌如果能識別并切斷外源DNA(或RNA),就具有一定防御噬菌體侵染的能力。
廣泛應(yīng)用的“分子手術(shù)刀”——限制性核酸內(nèi)切酶(簡稱限制酶),已發(fā)現(xiàn)數(shù)千種。大多數(shù)限制酶的識別序列由6 個(gè)核苷酸組成,少數(shù)限制酶的識別序列由4、5 或8 個(gè)核苷酸組成,能在特定的位點(diǎn)上剪切雙鏈DNA 分子并使之?dāng)嗔?,從而抑制外源DNA 的復(fù)制,阻斷子代噬菌體形成。限制酶的識別序列相對固定,對新型病毒缺乏適應(yīng)性防御能力。可見,原核生物利用限制酶對噬菌體的防御類似于高等動物的固有免疫。
1987年,日本學(xué)者石野良純團(tuán)隊(duì)偶然發(fā)現(xiàn)大腸埃希氏菌(Escherichia coli)堿性磷酸酶基因編碼區(qū)附近存在一段特殊的DNA 序列:在簡單重復(fù)序列(repeated sequences)之間插有間隔序列(spacer DNA)[2]。隨后發(fā)現(xiàn)這種序列在古細(xì)菌或真細(xì)菌中廣泛存在。2002年,這種特殊序列被正式命名為成簇的規(guī)律間隔的短回文重復(fù)序列(clustered regularly inter-spaced short palindromic repeats,CRISPR),并對Cas(CRISPR associated sequence)基因作出定義[3]。CRISPR 序列中重復(fù)序列與間隔序列交錯相連,末端通常是一條長約500 bp 的前導(dǎo)序列。重復(fù)序列高度保守,長度為21~48 bp;間隔序列長度26~72 bp,堿基排列順序差異顯著。大量的間隔序列與已知的噬菌體或質(zhì)粒的序列完全一致。據(jù)此推測,這些間隔序列可能與原核生物抵御外源核酸進(jìn)入細(xì)胞的特異性防御機(jī)制有關(guān)。2005年,Bolotin 等[4]利用特定的噬菌體侵染細(xì)菌,發(fā)現(xiàn)抗性細(xì)菌細(xì)胞的CRISPR 中的間隔序列有來自噬菌體DNA 的序列。隨后,研究通過增加或去除序列可控制噬菌體獲得或失去抗性。此外,利用特定的噬菌體侵染細(xì)菌,隨著從噬菌體中獲得了越來越多的間隔序列,細(xì)菌的抗性譜系越來越強(qiáng)。有力地證明了CRISPR 在獲得性免疫中發(fā)揮作用[1]。
2008年,馬拉菲妮(Marraffini)等[5]研究發(fā)現(xiàn)Cas 核酸酶(CRISPR-associated nuclease)的DNA 靶點(diǎn)活性,并通過實(shí)驗(yàn)驗(yàn)證了CRISPR/Cas 系統(tǒng)的功能,由此揭開了CRISPR/Cas 系統(tǒng)作用機(jī)制及應(yīng)用的研究序幕。2010年,首次確定Cas9 核酸酶在CRISPR/Cas9 系統(tǒng)中是唯一參與切割靶DNA 的酶[6]。2011年,馬卡洛夫(Makarova)等[7]根據(jù)Cas基因的差異及CRISPR 基因簇中重復(fù)序列的差異,將CRISPR/Cas 系統(tǒng)分為3 種類型:Ⅰ型系統(tǒng)分布于真細(xì)菌和古細(xì)菌中,Ⅱ型系統(tǒng)主要分布于真細(xì)菌中,Ⅲ型系統(tǒng)主要分布于古細(xì)菌中。Ⅰ、Ⅲ型系統(tǒng)運(yùn)行復(fù)雜,需要Cas3、Cas6、Cas10 等蛋白質(zhì)復(fù)合物才能行使功能。CRISPR/Cas9 屬于Ⅱ型系統(tǒng),僅需唯一的Cas9 核酸酶,構(gòu)成簡單,適用于基因編輯。同年,沙爾龐捷在釀膿鏈球菌(Streptococcus pyogenes)CRISPR/Cas 中發(fā)現(xiàn)反式激活crRNA(trans actvating crRNA,tracrRNA)分子。2012年,沙爾龐捷和道德納組成團(tuán)隊(duì),純化了Cas9 蛋白,發(fā)現(xiàn)它是RNA 異二聚體引導(dǎo)下的DNA內(nèi)切酶,并首次在體外證明CRISPR/Cas9 系統(tǒng)可切割DNA[8]。RNA 異二聚體由成熟的crRNA(由長的前體crRNA 逐步剪切、加工而成,含保守序列和間隔序列)和tracrRNA 通過堿基配對聚合而成。通過增加一個(gè)合適長度的接頭,可將RNA 異二聚體融合成單一的向?qū)NA(single guide RNA,sgRNA),從而便于使用。
CRISPR/Cas9 基因編輯技術(shù)的大致流程如下:人工合成編碼crRNA 和tracrRNA 的DNA 序列,該序列能在細(xì)胞內(nèi)經(jīng)轉(zhuǎn)錄、加工后得到的成熟crRNA,其5′端與待剪切的特定DNA 靶序列互補(bǔ),3′端與tracrRNA 互補(bǔ)?;蛟O(shè)計(jì)出增加合適接頭的、編碼sgRNA 序列的DNA,與Cas9基因置于適當(dāng)?shù)谋磉_(dá)元件控制下并導(dǎo)入靶細(xì)胞中。由靶細(xì)胞成功表達(dá)出的sgRNA 識別并結(jié)合特定的互補(bǔ)DNA 序列,并與互補(bǔ)鏈雜交,非互補(bǔ)鏈保持游離的單鏈狀態(tài)。Cas9 核酸酶含有RuvC 和HNH 2 個(gè)核酸酶催化結(jié)構(gòu)域,其中的HNH 活性位點(diǎn)剪切互補(bǔ)DNA 鏈,RuvC 活性位點(diǎn)剪切非互補(bǔ)鏈,最終導(dǎo)致DNA 雙鏈斷裂。
“基因打靶”或“基因敲除”技術(shù)的創(chuàng)始人卡佩奇形象地比喻,要想了解某個(gè)基因的功能,先人為地讓該基因缺失,失去功能。猶如某一天沒有人掃地了,大家才會想到清潔工的存在[9]。如何才能讓某個(gè)基因人為缺失?
自然界存在的電離輻射、DNA 復(fù)制時(shí)模板鏈上的損傷等都可能導(dǎo)致DNA 雙鏈的斷裂。生命的進(jìn)化使得細(xì)胞擁有多種修復(fù)機(jī)制(例如,直接逆轉(zhuǎn)、堿基切除修復(fù)等)可將多數(shù)損傷修復(fù),并恢復(fù)到原始的DNA 序列,維護(hù)DNA 的相對穩(wěn)定。非同源性末端連接和同源重組修復(fù)是DNA 雙鏈斷裂修復(fù)的2 種主要途徑。細(xì)胞內(nèi)有2 套遺傳物質(zhì)時(shí),細(xì)胞可能利用1 份DNA 為模板修復(fù)受損傷的DNA。這種使損傷的DNA 恢復(fù)到原始序列的機(jī)制稱為同源重組修復(fù)。
非同源性末端連接修復(fù)的大致過程是通過斷裂末端突出的單鏈之間錯排配對,將斷裂DNA 的2 個(gè)末端直接相互連接。錯排配對通過不同片段的堿基互補(bǔ)完成,單鏈尾巴由核酸酶去除,缺口依賴DNA 聚合酶填補(bǔ)。如此,斷裂末端的部分序列將會丟失,因而常導(dǎo)致DNA 片段的缺失,甚至出現(xiàn)倒位而致突變[1]。如果能高度特異性地切割目的DNA,利用細(xì)胞自帶的非同源性末端連接修復(fù)系統(tǒng),就能高效率使目的基因缺失,從而為研究目的基因的功能提供了可能。
傳統(tǒng)的卡佩奇“基因敲除”技術(shù)采取的策略,是用含有一定已知序列的DNA 片段與受體細(xì)胞基因組中序列相同或相近的基因發(fā)生同源重組,從而代替受體細(xì)胞基因組中的相關(guān)序列,可產(chǎn)生精確的基因突變。但由于高等動物細(xì)胞內(nèi)同源重組的頻率極低,需要構(gòu)建復(fù)雜的打靶載體、篩選ES 細(xì)胞、選育嵌合體小鼠等一系列步驟,使得該技術(shù)流程繁瑣,費(fèi)用大,耗時(shí)長。通過人工設(shè)計(jì)sgRNA,足以引導(dǎo)Cas9 對雙鏈DNA 進(jìn)行定點(diǎn)切割,導(dǎo)致特定位點(diǎn)基因的突變。因易于操作,CRISPR/Cas9 基因編輯技術(shù)逐漸成為一種可靠、高效、快速的構(gòu)建“基因敲除”生物模型的新方法,得到了廣泛的應(yīng)用。
Cas9 核酸酶含有的2 個(gè)核酸酶催化結(jié)構(gòu)域分別剪切雙鏈DNA 的一條單鏈,并產(chǎn)生平末端的DNA 雙鏈斷裂。非同源性末端連接的修復(fù)可能導(dǎo)致靶基因突變,但同源重組修復(fù)又可能使得雙鏈斷裂的DNA 恢復(fù)原始序列而導(dǎo)致脫靶。如何降低脫靶效應(yīng)?如果在基因水平上將其中一個(gè)催化結(jié)構(gòu)域滅活,可形成使DNA 單鏈斷裂的缺口酶版本nCas9。2 種nCas9 與帶有合適序列的sgRNA 串聯(lián)體配合使用,能在DNA 分子上產(chǎn)生單鏈交錯缺口的裂解形式,增加靶點(diǎn)識別的序列長度,從而降低突變的脫靶率。
既然CRISPR/Cas9 系統(tǒng)能依靠sgRNA 特異性識別DNA,將Cas9 中的2個(gè)核酸酶功能域全部刪除,形成滅活型版本dCas9,并將之與其他功能蛋白相融合,可進(jìn)一步擴(kuò)展CRISPR/Cas 系統(tǒng)的功能。例如,dCas9 與轉(zhuǎn)錄阻遏因子相融合,依靠sgRNA 的靶向作用選擇性關(guān)閉特定基因譜的轉(zhuǎn)錄啟動。相反,將dCas9 與合適的轉(zhuǎn)錄激活因子(例如,VP64 或KRAB)相融合,能以基因功能獲得型方式了解基因的功能。此外,dCas9 與各種熒光蛋白相融合,可實(shí)現(xiàn)活細(xì)胞或組織中特定DNA 區(qū)域附近的動態(tài)染色質(zhì)表觀修飾過程可視化等[10]。
CRISPR/Cas9 技術(shù)在基因編輯方面不斷展現(xiàn)出巨大潛力。與ZEN 和TALEN 等編輯工具相比,CRISPR/Cas9 系統(tǒng)具有簡單、高效、安全、精確等優(yōu)點(diǎn)。此外,CRISPR/Cas9 系統(tǒng)還可同時(shí)編輯同一細(xì)胞中的多個(gè)基因位點(diǎn),在構(gòu)建疾病動物模型及基因表達(dá)調(diào)控機(jī)制的研究中發(fā)揮重要作用。作為一種革命性的技術(shù),CRISPR/Cas9 基因編輯技術(shù)仍存在著不足,例如,脫靶效應(yīng)。進(jìn)一步降低脫靶效應(yīng),實(shí)現(xiàn)高度特異性基因編輯的臨床應(yīng)用仍任重道遠(yuǎn)。
由于CRISPR/Cas9 技術(shù)的門檻較低,倫理學(xué)家始終擔(dān)心快速涌現(xiàn)的基因編輯研究是否會被應(yīng)用于人類基因的編輯,改變?nèi)祟惖倪z傳特性。禁止在人類生殖細(xì)胞水平濫用基因編輯技術(shù)是對生命和科學(xué)的敬畏,但利用基因編輯技術(shù)治療人類疾病也是醫(yī)學(xué)研究領(lǐng)域的重要方向,如何保障二者平衡是人類面臨的挑戰(zhàn)[11]。