賴昕彤 王柯嵐 由雨欣 譚俊杰
(南京農(nóng)業(yè)大學農(nóng)學院 江蘇省植物基因編輯工程研究中心,南京 210095)
基因編輯是一種新興的能對特定基因組進行插入、刪除、替換等各種修飾的基因工程技術(shù)。CRISPR/Cas系統(tǒng)[1],跟傳統(tǒng)基因編輯工具如鋅指核酸酶(zinc finger nucleases,ZFNs)[2]和類轉(zhuǎn)錄激活因子效應物核酸酶(transcription activator-like effector nucleases,TALENs)[3]等相比,具有設(shè)計簡單、成本低、效率高等優(yōu)點,已成為當下基因組編輯主導技術(shù),推動了各行各業(yè)的發(fā)展。
CRISPR/Cas是細菌和古細菌進化出來的用來抵御噬菌體及外源DNA的適應性免疫系統(tǒng)[4]。目前使用最廣泛且技術(shù)開發(fā)最成熟的是來源于化膿性鏈球菌(Streptococcus pyogenes)并經(jīng)過改造的CRISPR/Cas9系統(tǒng)。該系統(tǒng)主要包括單向?qū)NA(single guide RNA,sgRNA)及Cas9兩 個 元 件。CRISPR/Cas9完成基因編輯主要分為兩步(圖1):(1)Cas9核酸酶在sgRNA的引導下利用其包含的兩個核酸酶結(jié)構(gòu)域RuvC和HNH分別對靶向DNA的兩條鏈在距離PAM(protospacer adjacent motif)上游大約3 bp處進行剪斷,引起DNA雙鏈斷裂(doublestrand break,DSB);(2)DSB內(nèi)源修復。其修復途徑主要包括非同源末端連接(non-homologous end joining,NHEJ)[5]和同源重組修復(homology-directed repair,HDR)[6]。前者介導的DSB修復簡單、高效,是大部分細胞修復DSB的最主要方式,但其出錯率高,往往引發(fā)難以預測的核苷酸插入或刪除(insertions and deletions,indels),導致靶基因功能喪失;HDR方式保真度高,但是依賴于外部提供的修復模板,且在大部分細胞中效率極低。因此,雖然CRISPR/Cas9介導的基因編輯簡單高效,但因其對DSB的高度依賴,缺乏對編輯結(jié)果的控制,可能導致被編輯后的細胞產(chǎn)生無法預測的紊亂[7-8]。實現(xiàn)高效且不依賴DSB的精準編輯將是未來基因編輯的發(fā)展趨勢。
圖1 CRISPR/Cas9介導的基因編輯Fig. 1 CRISPR/Cas9-mediated gene editing
點突變是自然界中最常見的基因突變類型。根據(jù)人類基因組變異數(shù)據(jù)庫ClinVar分析,超過半數(shù)的人類遺傳疾病是由點突變引起[9]。在作物遺傳育種上,點突變也是許多重要農(nóng)藝性狀遺傳變異的基礎(chǔ)。將高效、精準的核苷酸替換應用于基因治療,可以從根本上治愈點突變引起的人類遺傳疾病;應用于作物育種,可以簡化并加快育種進程,可見開發(fā)高效精準的堿基替換工具十分重要。
2016年,哈佛大學David R. Liu團隊在原有CRISPR/Cas9基礎(chǔ)上首次開發(fā)了實現(xiàn)單堿基替換的新系統(tǒng)-堿基編輯器(base editor,BE)[10]。其將無催化活性的Cas9(catalytically inactive Cas9,dCas9)或者Cas9切口酶(Cas9 nickase,nCas9)與胞嘧啶脫氨酶APOBEC1以及尿嘧啶糖基化酶抑制劑 (uracil glycosylase inhibitor,UGI)進行融合,通過sgRNA將融合蛋白帶至靶位點,從而在不引入DSB的前提下,實現(xiàn)對單個堿基的精準替換(圖 2)。跟原有CRISPR/Cas9相比,堿基編輯器既不引入DSB,也無需提供外源修復模板即可進行高效精準的基因編輯。該工具的開發(fā)使CRISPR/Cas系統(tǒng)從切割特異DNA的分子“剪刀”變成可以重寫堿基的“修正器”,打開了精準基因編輯的大門。
由于基于胞嘧啶脫氨酶的堿基編輯器(cytosine base editor,CBE)只能催化C到T的轉(zhuǎn)變,為了擴展編輯類型,該團隊隨后嘗試將自然界中的各種腺嘌呤脫氨酶與nCas9融合,基于CBE類似工作原理,腺嘌呤脫氨酶可以將腺嘌呤(A)轉(zhuǎn)變?yōu)榇吸S嘌呤(I),其在DNA復制中常被識別為鳥嘌呤(G),因此,I與胸腺嘧啶(T)產(chǎn)生I∶T錯配后,通過DNA修復途徑或細胞復制,完成A到G的轉(zhuǎn)變(圖 2)。考慮到自然界中腺嘌呤脫氨酶只能以RNA為底物,該團隊隨后將大腸桿菌中tRNA腺嘌呤脫氨酶(tRNAspecific adenosine deaminase,TadA)與Cas9切口酶 融合,并進行多輪人工進化,最終獲得了編輯效率最高的腺嘌呤堿基編輯器(adenine base editor,ABE)ABE7.10[11](圖 2)。
圖2 CBE和ABE介導的堿基編輯Fig. 2 CBE and ABE-mediated base editing
CBE和ABE能實現(xiàn)全部單堿基轉(zhuǎn)換(base transition),但不能有效實現(xiàn)單堿基之間的顛換(base conversion)。隨后研究人員也在積極探索除CBE和ABE之外的可以實現(xiàn)其他類別的堿基編輯技術(shù)。2020年,張學禮和J. Keith Joung兩團隊首次獨立報道了能實現(xiàn)堿基顛換的新型堿基編輯器 GBEs(glycosylase base editors) 和CGBE1(C-to-G base editors)[12-13]。其工作原理和CBE很接近,都是首先將胞嘧啶轉(zhuǎn)換成尿嘧啶,不同的是,GBE接下來直接用融合在nCas9另一端的尿嘧啶 DNA 糖基化酶(uracil DNA N-glycosylase,UNG)將U移除,并引發(fā)堿基切除修復,提供C堿基向其他堿基突變的機會,在大腸桿菌中主要是C→A,而在哺乳動物細胞中主要是C→G[12]。為了在大多數(shù)位點上實現(xiàn)高效、高純度的C→G堿基編輯,David R. Liu團隊通過CRISPRi篩選、靶點數(shù)據(jù)庫分析并聯(lián)合機器學習開發(fā)了更加有應用前景的新型CGBE[14]。
這些DNA堿基編輯工具目前已成功應用于動物[15-17]、植物[18-20]和微生物[21],在點突變引起的人類疾病治療和作物精準育種上有巨大的應用 潛能[22]。
第一版堿基編輯器(BE1)通過將大鼠的胞嘧啶脫氨酶rAPOBEC1簡單地融合到dCas9的氨基端,并用一段16 aa的XTEN蛋白基序連接。雖然APOBEC1可以催化C到U的轉(zhuǎn)變,但由于細胞內(nèi)存在尿嘧啶糖基化酶UNG,會不斷去除脫氨后產(chǎn)生的U,從而導致C→T轉(zhuǎn)換效率低下。針對此問題,第二版堿基編輯器(BE2)通過融入尿嘧啶糖基化酶抑制劑UGI,從而保護U不被移除,使在人體內(nèi)的編輯效率提高了3倍。第三版堿基編輯器(BE3)主要是用Cas9切口酶替代dCas9,通過在非編輯鏈引入切口,從而激活堿基錯配修復(mismatch repair,MMR)機制,并以編輯鏈為模板進行修復,促進了編輯產(chǎn)物的形成,該策略將編輯效率提高了2-6倍,平均編輯效率達到37%,同時indel的產(chǎn)生比例僅有約1.1%[10]。第四版堿基編輯器BE4主要是通過融入更多的UGI,最大程度的減少了編輯副產(chǎn)物,提高了C→T突變的效率[23]。此外,通過在編輯器兩端融入密碼子優(yōu)化的雙分型核定位信號(bipartite NLS,bpNLS),產(chǎn)生了編輯效率最大化的BE4max以及ABEmax[24]。在腺嘌呤堿基編輯器ABE7.10的基礎(chǔ)上,研究人員利用腺苷脫氨酶變體庫對其進行了進一步的優(yōu)化,獲得效率更高的ABE8版本,與ABE7.10相比,其在A5-A7處的編輯效率提高了約1.5倍,A3-A4和A8-A10處約3.2倍,非NGG PAM變體的總體目標編輯效率提高約4.2倍[25]。David R. Liu團隊對ABE7.10進行多輪定向進化,獲得了ABE8e,與ABE7.10相比,該版本在TadA上引入了8個額外突變,活性更是提高了590倍,且能與各種Cas9 或Cas12同源蛋白廣泛兼容[26],ABE8e的晶體結(jié)構(gòu)解析表明,其催化 DNA 脫氨的速度比早期的ABEs快約1 100 倍[27]。除了哺乳動物,ABE8e在編輯其它物種上同樣具有超高的編輯效率,比如多個研究團隊幾乎同時報道ABE8e在編輯水稻基因組上比原來ABEmax表現(xiàn)出更高的編輯效率,在諸多靶位點的編輯效率更是達到了幾乎100%[28-29]。此外,周煥斌團隊通過比較分析ABE8.17、ABE8.20以及ABE8e,開發(fā)了全新版本ABE9,其編輯水稻基因組的能力甚至高于ABE8e,尤其是對于原來難以編輯的位點,ABE9表現(xiàn)出更佳的編輯能力[28]。
其它的效率優(yōu)化策略還包括在脫氨酶與Cas蛋白之間插入非特異的單鏈DNA結(jié)合蛋白基序,增強脫氨酶與底物的互作[30]。這些策略極大提高了堿基編輯器在哺乳動物以及植物細胞中的編輯效率,推動了其進一步的應用。
Cas9-sgRNA復合體與目標DNA鏈結(jié)合后,隨后與互補的DNA序列退火形成“R-loop” 結(jié)構(gòu)[31],其中暴露的單鏈DNA即為脫氨酶的底物。堿基編輯器在單鏈DNA上具有一定靶向范圍,該范圍內(nèi)的堿基均能被脫氨酶有效脫氨,該編輯范圍稱為堿基編輯器的編輯窗口或活性窗口[10]。由于融合蛋白與目標DNA序列結(jié)合后掩蓋了PAM相鄰的核苷酸,因此BE的活性窗口通常位于PAM的遠端[10,32-33]。例如,BE3的活性窗口為遠離PAM端的第4-8位堿基(C4-C8)。
編輯窗口的寬度受多種因素的影響,包括脫氨酶與Cas蛋白的類型、堿基編輯器的空間構(gòu)造 等[10-11,15,33-35]。表1 總結(jié)了目前主要的堿基編輯器及其編輯窗口寬度、序列偏向等特征。
表1 主要堿基編輯器及其特征Table 1 Major base editors and their characteristics
靶向堿基的編輯依賴于脫氨酶和底物之間的互作,因此不同種類的脫氨酶會影響活性窗口寬度[34]。例如,通過把BE3中的APOBEC1替換為源于海鰻(Petromyzon marinus)的脫氨酶CDA1,構(gòu)建出新的堿基編輯器CDA1-BE3,其編輯窗口變?yōu)镃1-C7。研究學者利用不同種類的胞嘧啶脫氨酶構(gòu)建了多樣化的堿基編輯編輯器,主要包括哺乳動物APOBEC家 族 蛋 白,如AID[36-37]、APOBEC1和APOBEC3(A3A-H)[38-42],以及七鰓鰻CDA1家族蛋白,如CDA1[33-35,43-45]。另外,改變脫氨酶的催化或結(jié)合活性也會影響編輯窗口的寬度。例如,通過突變rAPOBEC1中與底物結(jié)合或催化相關(guān)的氨基酸殘基,產(chǎn)生一系列BE3變體YE1/YE2/YEE-BE3,大大縮小了堿基編輯窗口寬度[46]。在APOBEC3A中引入點突變N57G,產(chǎn)生工程化的eA3A-BE3,增強了對TCR基序的偏好性,間接縮短了編輯窗口寬度[38]。將F148A突變引入人工進化的TadA*,所組成的ABE7.10F148A也大大縮小了編輯窗口[47]。此外,通過同時融合多個相同或不同的脫氨酶,使R-loop中底物核苷酸在局部高濃度脫氨酶的環(huán)境中更易暴露,從而達到拓寬編輯窗口的目的[48],還可使編輯產(chǎn)物多樣化或提高編輯效率[49-52]。大多數(shù)脫氨酶對其底物DNA的序列表現(xiàn)出一定的偏好,這也間接影響著編輯窗口的寬度。例如,APOBEC1對底物序列的偏好 性 為TC≥CC≥AC>GC[10],而APOBEC3G偏好CC基序中的第2個C[41-42]。目前,包含CDA1、AID或A3A脫氨酶的堿基編輯器對底物DNA序列的依賴性較小,可能是因為這些脫氨酶的活性相對較高[33,37-40,53]。
自然界天然存在或人工進化的Cas變體可以識別不同的PAM基序,且其組成的堿基編輯器可能擁有不同的編輯窗口。例如SaCas9介導的堿基編輯器支持更寬的編輯窗口:其介導的CBE編輯窗口為C3-C12,ABE編輯窗口為A4-A12[46];基于Cfp1/Cas12a的堿基編輯窗口為C8-C13[54];由微型Cas12f變體(CasMINI)衍生的ABE具有A3-A4的窄窗口[55];而由環(huán)狀排列的Cas9變體(Cas9-CP)組成的CBE和ABE改變了脫氨酶在R-loop中的定位,從而在更寬的編輯窗口中實現(xiàn)了更有效的靶向堿基[56-57]。
堿基編輯器內(nèi)部構(gòu)象也會影響編輯窗口寬度,包括脫氨酶與Cas蛋白的融合位點、連接兩者的接頭類型和長度等。例如,將PmCDA1分別融合到Cas9切口酶的兩端,形成n/cCDA1-BE3,兩者呈現(xiàn)出不同的編輯窗口(nCDA1-BE3,C1-C7;cCDA1-BE3,C2-C5)[34]。對于nCas9介導的堿基編輯器,將脫氨酶融合在N端通常會比融合在C端產(chǎn)生更寬的編輯窗口[10,34,44],這可能是由于N端融合會使脫氨酶更易接近R-loop內(nèi)的ssDNA。除在兩端融合之外,最近還報道了脫氨酶可以嵌入Cas9中,所產(chǎn)生的一系列堿基編輯器擁有獨特的活性窗口,其寬度取決于它們在Cas9中的插入位點[58-59]。此外,堿基編輯器中Cas9和脫氨酶的連接長度也會影響編輯窗口寬度。例如,適當縮短Cas9與CDA1之間的連接長度,甚至去掉脫氨酶C端不必要的序列,可以很大程度的縮小編輯窗口寬度至1-2 nt[34]。
總之,堿基編輯窗口的多樣化可以滿足堿基編輯器不同的應用需求,從而推動其進一步的發(fā)展和應用。
堿基編輯需要靶位點包含PAM,比如基于SpCas9的堿基編輯器識別的PAM序列為NGG,這種特定的PAM要求限制了可編輯的區(qū)域,嚴重阻礙了其廣泛應用。為了擴大堿基編輯的范圍,常采用的方式是利用識別不同PAM的天然Cas蛋白或人工改造的Cas9變體。比如,陳佳團隊使用Cas12a (Cpf1)開發(fā)了新型的CBE系統(tǒng),識別的PAM 序列為TTTV(V可以是A、C或G),這一系統(tǒng)適用于富含T的基因組DNA[54]。David R. Liu團隊利用來自金葡菌(Staphylococcus aureus)的Cas9蛋白,構(gòu)建了靶向包含NNGRRT的PAM序列的堿基編輯器SaBE3[46]。此外,通過Cas變體的替換,獲得了各種PAM松弛型的堿基編輯變體,如VQRBE3(NGA)、VRER-BE3(NGCG)、SaBE3-KKH(NNNRRT)[46]。尤其是利用Nureki實驗室開發(fā)的SpCas9-NG(NGN)[60]以及Kleinstiver實驗室開發(fā)的SpG(NGN)和SpRY(NRN 或NYN)[61]等Cas9變體所獲得的堿基編輯器,幾乎能夠突破PAM的限制,靶向所有NNN的位點。值得注意的是,盡管這些變體的利用拓展了堿基編輯器的編輯范圍,但卻大大降低了其編輯效率,也增加了對靶位點的依賴性。因此,如何在維持松弛型PAM的識別下進一步提高堿基編輯器的效率值得進一步的研究。此外,這些PAM松弛型的堿基編輯變體的應用具有一定的自編輯活性,尤其是基于SpRY的CBE和ABE,其能夠識別sgRNA骨架上與靶序列相連的GTT PAM 序列,因此會對自身的sgRNA進行編輯,從而一方面降低其編輯效率,另一方面改變的sgRNA可能會產(chǎn)生非靶向編輯,導致脫靶效應[62-64]。如何減少自編輯活性仍是基因編輯領(lǐng)域目前亟待解決的難題之一。
在細胞中應用堿基編輯器時,會出現(xiàn)DNA及RNA水平上的脫靶。其中DNA水平上的脫靶分為sgRNA依賴型和非sgRNA依賴型。前者是由于sgRNA錯誤地引導了Cas蛋白,使之與相似的DNA序列相結(jié)合[65-67]。研究表明,使用工程化的高保真Cas變體[68-71]或截短的sgRNA[72-73],或遞送堿基編輯器與sgRNA形成的核糖核蛋白復合體(ribonucleoproteins,RNPs)[74]等策略均可以降低此類脫靶效應;而后者是由于脫氨酶的過度表達,使全基因組特別是基因富集區(qū)域發(fā)生了隨機點突變。值得注意的是,這類脫靶只出現(xiàn)在CBEs中,在ABEs中并未發(fā)生,其原因可能是ABE中的脫氨酶來源于RNA特異性編輯的腺嘌呤脫氨酶,經(jīng)人工進化改造后表現(xiàn)出了較高的特異性,從而未表現(xiàn)出過度的DNA堿基編輯[75-76]。大量研究表明,通過工程化改造脫氨酶可以減少這類脫靶現(xiàn)象。例如,利用人工改造的rAPOBEC1變體YE1建立YE1-BE3堿基編輯系統(tǒng),可以大大減少非sgRNA依賴型的脫靶[77-78]。通過篩選153種胞嘧啶脫氨酶,并進一步優(yōu)化其靶標位點和非靶標位點的編輯,研究人員發(fā)現(xiàn)其中4種脫氨酶變體(AmAPOBEC1,PpAPOBEC1,RrA3F,SsAPOBEC3B)顯示出最小的非sgRNA依賴型的DNA脫靶活性[79]。另有研究表明,將脫氨酶精準嵌入Cas蛋白結(jié)構(gòu)中,也可以減少全基因組范圍的DNA和RNA脫靶[58-59]。擁有較窄編輯窗口的堿基編輯器一般伴隨著較少的脫靶現(xiàn)象,因為這種情況下,無論是目標還是非目標區(qū)域能編輯的堿基都變少了,從而導致脫靶也變少或消失[35,77]。
除了DNA脫靶,由于CBE和ABE所使用的均是能作用于RNA的脫氨酶,因此兩者還會出現(xiàn)全基因組范圍內(nèi)的RNA脫靶[47,80-82]。盡管RNA脫靶突變存在的時間很短,但是如果持續(xù)誘導,仍存在很高的風險,特別是在遺傳疾病治療上。與非sgRNA依賴的DNA脫靶類似,目前消除此類RNA脫靶效應的策略是在CBE和ABE中設(shè)計合適的脫氨酶變體。例如,通過工程化改造脫氨酶,獲得了3個高 保 真 的CBE變 體(BE3W90Y/R126E,A3AR128A-BE3,A3AY130F-BE3)和一個ABE變體(ABE7.10F148A),它們不僅可以高效地靶向目標DNA,還能有效減少RNA的脫靶編輯[47]。另有研究人員通過篩選一系列BE3和ABE變體,發(fā)現(xiàn)兩個BE3變體(rAPOBEC1;R33A,R33A/K34A)和 兩 個ABE變 體(TadA*;K20A/R21A,V82G)具有較低的RNA編輯活性[80-81]。而且,他們還發(fā)現(xiàn)含有eA3A(eA3A-BE3)、hAID(hAID-BE3)和CDA1(target-AID)的CBE可以減少RNA脫靶。此外,通過V106W的替換或R153的缺失突變,獲得了工程化改造的TadA*變體,該變體構(gòu)成的ABE大大減少了RNA脫靶[82-83]。
除了在DNA和RNA水平上發(fā)生非預期的脫氨,當編輯窗口內(nèi)含有多個非目標堿基C時,目標堿基C被編輯的同時也伴隨著非目標堿基C的編輯,從而產(chǎn)生大量的編輯副產(chǎn)物,給堿基編輯尤其是基因治療上的應用帶來了潛在的風險。此外,在植物堿基編輯方面,盡管發(fā)生旁側(cè)編輯的植株可以在后期中篩掉,但大量的編輯副產(chǎn)物不僅會使后續(xù)的篩選工作更加繁瑣,還導致了對前期轉(zhuǎn)化編輯效率的過度依賴。因此,縮小堿基編輯器的編輯窗口,提高其編輯精度,變得尤為重要。大量相關(guān)研究表明,縮小堿基編輯窗口的策略主要有以下3種:(1)通過突變堿基編輯器的脫氨酶,適當降低其催化和結(jié)合活性。比如,通過突變脫氨酶APOBEC1催化及結(jié)合相關(guān)的關(guān)鍵氨基酸殘基W90Y、R126E或R132E,開發(fā)一系列縮小堿基編輯窗口的BE3變體YE1/YE2/YEE-BE3[46]。雖然這3個變體的編輯窗口均有縮小,但其編輯效率也隨之降低,尤其是編輯窗口最窄的YEE-BE3,在許多位點缺乏編輯活性。(2)通過突變脫氨酶,增強其對底物的偏好性。比如,通過在人類APOBEC3A引入N57G突變,構(gòu)建工程化的堿基編輯器eA3A-BE3,實現(xiàn)選擇性的識別TCR底物基序[38]。相似的,通過工程化產(chǎn)生的eA3G-BE3,增強對CC底物基序識別的偏好性[41-42]。該方法雖然在包含特定基序的編輯位點上使編輯窗口變窄,但縮小程度有限且極大依賴于底物序列。(3)調(diào)整堿基編輯器的內(nèi)部空間構(gòu)造。比如,通過降低脫氨酶與Cas9之間的接頭長度,改變堿基編輯器的空間構(gòu)造,從而讓脫氨酶的活性區(qū)域在靶向DNA上維持于一個更加精準的定位[34-35]。而且該策略不改變氨基酸的催化及結(jié)合活性,只是讓脫氨酶在非靶堿基處“英雄無用武之地”。盡管該方法目前只測試了少數(shù)脫氨酶及其構(gòu)成的堿基編輯器,但由于該策略產(chǎn)生的堿基編輯器在大大縮短編輯窗口的同時并未降低目標堿基的催化活性,因此值得進一步的研究和發(fā)展。
根據(jù)人類基因組變異數(shù)據(jù)庫ClinVar分析,超過半數(shù)的人類遺傳疾病是由點突變引起[9]。而堿基編輯器能夠高效實現(xiàn)單個堿基的替換,因此其主要的潛在應用之一是用來糾正點突變引起的人類遺傳疾病。例如,把BE3轉(zhuǎn)入小鼠星形膠質(zhì)細胞,可以將與阿爾茨海默病相關(guān)的等位基因APOE4轉(zhuǎn)變?yōu)榈惋L險的APOE3r,也可以糾正乳腺癌細胞中與癌癥相關(guān)的p53基因突變(Y163C)[10]。利用ABE將與鐮狀細胞?。⊿CD)相關(guān)的致病基因型HBBS轉(zhuǎn)化為造血干細胞中的良性等位基因型HBBG,并成功將鐮狀細胞病小鼠的血液學參數(shù)恢復到接近正常水平[84]。利用脂質(zhì)納米顆粒將ABE遞送到食蟹猴肝臟細胞中,并對PCSK9基因?qū)崿F(xiàn)堿基突變,將其體內(nèi)的壞膽固醇含量降低約60%[85]。其他應用堿基編輯治療的疾病包括Duchenne肌營養(yǎng)不良癥[86]、白化?。?6]、Hutchinson-Gilford早衰綜合征[87]和其他代謝疾病[88-89]。
與傳統(tǒng)育種相比,堿基編輯器能夠快速高效地對植物基因組進行精準修飾,加速了作物育種進程。近年來,許多植物研究者通過密碼子優(yōu)化,構(gòu)建了適用于植物的堿基編輯系統(tǒng),由此實現(xiàn)了對水稻、小麥等主要農(nóng)作物的重要農(nóng)藝性狀相關(guān)基因定點突變,快速獲得改良品種。例如,Zong等[90]構(gòu)建了植物BE系統(tǒng)PBE(Plant base editor),并在原生質(zhì)體和再生的水稻、小麥和玉米植株中,實現(xiàn)了C3-C9位點的堿基編輯,效率高達43.48%。隨后他們又通過融合nCas9和人類APOBEC3A構(gòu)建了A3A-PBE,并成功在小麥、水稻和馬鈴薯中產(chǎn)生高效C→T的靶向突變。A3A-PBE實現(xiàn)了在17 nt的編輯窗口內(nèi)對內(nèi)源基因組位點和不同序列的高效堿基替換[40]。此外,Hua等[91]利用人工進化的SpCas9和SaCas9變體,并構(gòu)建了相應BE變體,在水稻中大大擴展了編輯范圍。ABE和CBE在改變作物株型、提高作物抗性和養(yǎng)分吸收效率方面均發(fā)揮重要作用。Lu等[92]利用大鼠APOBEC1基因開發(fā)了水稻堿基編輯系統(tǒng),并有效編輯了水稻的兩個重要基因NRT1.1B和SLR1,編輯效率分別為3.7%和13.3%。SLR1編碼DELLA蛋白,其TVHYNP基序及其附近的氨基酸發(fā)生置換,導致植株高度降低,獲得了半矮稈型材料。Li等[93]將nCas9、胞苷脫氨酶和UGI進行融 合,在水稻中產(chǎn)生目標點突變,成功在OsPDS(編碼一種植物烯去飽和酶),OsSBEIIb(編碼水稻淀粉分支酶IIb)的3個目標位點上引入了精準編輯。
值得注意的是,BE 在人類和作物上的應用有所不同,作物基因編輯上強調(diào)特異性外,也強調(diào)多樣化,產(chǎn)生更多的變異。該特征通常用于植物內(nèi)源基因定向進化,通過對靶基因區(qū)域進行堿基編輯,產(chǎn)生大量和多樣化的突變,隨后進行人工篩選獲得提高農(nóng)藝性狀的目標變異。最顯著的例子是植物抗除草劑位點的發(fā)掘,例如通過合用CBE和ABE,以及針對靶基因的sgRNA文庫,在水稻中對除草劑內(nèi)源靶標基因OsALS1進行近乎飽和突變,從而成功鑒定出OsALS1抗除草劑新位點,并創(chuàng)制出具有除草劑抗性的水稻新種質(zhì)[94]。高彩霞團隊通過同時融合兩種不同類型脫氨酶設(shè)計了雙堿基編輯器STEMEs,并利用STEME-1和STEME-NG對水稻OsACC基因進行定向進化,獲得了抗除草劑的水稻新種質(zhì)[50]。為了提高定向進化效率,未來堿基編輯器需要擁有更寬的活性窗口、更大的編輯范圍和更多堿基轉(zhuǎn)換類型,從而為后續(xù)的人工篩選產(chǎn)生更加多樣化的編輯產(chǎn)物。
CBE可以通過C→T單堿基轉(zhuǎn)換,將4種密碼子(正義鏈上的CAA、CAG、CGA和反義鏈上的TGG)轉(zhuǎn)換為終止密碼子(TGA、TAG、TAA),實現(xiàn)在不引入DSB的情況下,在目標位點處提前引入終止密碼子來敲除蛋白質(zhì)編碼基因。Jin Soo Kim團隊率先利用BE3在小鼠胚胎中實現(xiàn)了對靶基因Dmd或Tyr的高效終止密碼子引入,并成功在小鼠中建立了肌營養(yǎng)不良以及白化病的相關(guān)疾病模型[86]。此外,利用BE3引入無義突變的原理,Adli團隊以及Ciccia團隊分別建立了使基因失活的CRISPRStop[95]和iSTOP[96]系統(tǒng),后者同時在包括人類、小鼠和擬南芥等8個物種建立了sgRNA文庫用于配合BE3使用,可在全基因組范圍內(nèi)失活真核基因,并模擬癌癥相關(guān)的無義突變。
與CRISPR介導的移碼突變相比,基于CBE終止密碼子引入方法的最大優(yōu)點是無需產(chǎn)生DSB。作為最嚴重的細胞損傷,DSB會激活廣泛的細胞損傷修復機制或者細胞應激甚至死亡,相比之下,CBE介導的基因失活策略更加溫和、安全。為了更深入了解二者的差別,Dang等[97]針對腫瘤抑制基因,設(shè)計了兩個靶向TP53位點的sgRNA,利用BE3介導的iSTOP和傳統(tǒng)的CRISPR/ Cas9對其進行敲除。實驗表明,BE3產(chǎn)生的基因型更少,對染色體結(jié)構(gòu)和鄰近基因影響不大。此外二者對于兩個相鄰基因的雙敲除效率存在差異,BE3介導的基因敲除對相鄰基因的副作用更小,更能安全、有效地敲除兩個近距離的基因。
此外,該策略形成的編輯結(jié)果精準可控,利用該策略在第一代獲得純合突變體的概率也會更高。將其應用于在植物中,可以加速獲得純合突變體,從而應用于反向遺傳或作物育種過程。Ren等[98]開發(fā)了高效的A3A/Y130F-CBE_V01系統(tǒng),并用于植物的多重編輯。他們在多個控制種子形狀相關(guān)的基因中提前引入終止密碼子,成功敲除OsGS3、OsGW2等基因,并快速獲得純合的多突變體,有效增加籽粒的長度和寬度。
總之,堿基編輯器在動、植物中已獲得了廣泛的應用,除了上述主要應用外,隨著人們對堿基編輯器的深入了解,其更多的未知應用將被逐一挖掘。
堿基編輯器由于其設(shè)計簡單、高效、結(jié)果可預測等優(yōu)點,在基因治療以及作物精準育種上有著無限的應用潛能。本文初步概括了DNA堿基編輯的研究進展。這些研究進展一方面為堿基編輯器進一步的發(fā)展奠基了基礎(chǔ);另一方面對堿基編輯的未來發(fā)展提出了新的問題和挑戰(zhàn):(1)如何進一步提高堿基編輯器的精度以及在維持堿基編輯器的高精度下,如何進一步平衡編輯范圍、效率以及特異性。盡管目前許多研究報道了提高堿基編輯器精度的方法,但目前仍然沒有辦法僅僅編輯單個堿基而不影響旁側(cè)同類堿基。此外,編輯精度的提高也伴隨靶向區(qū)域減小,以及對PAM依賴的增加。隨著各種Cas9變體的開發(fā),尤其是較少依賴PAM的Cas9-NG、Cas9-SpRY等的出現(xiàn),維持編輯精度且突破靶向范圍變得可能,但Cas9變體的引入犧牲了部分的編輯效率,此外,隨著精準堿基編輯范圍的擴展,其特異性是否受到影響仍待評估。其背后的科學問題,比如堿基編輯器中脫氨酶脫氨的結(jié)構(gòu)機理、sgRNA識別Cas9的分子機理以及堿基編輯器脫靶的分子機制等值得進一步的探究,解決這些技術(shù)瓶頸背后的科學問題,為研發(fā)高效、廣適性和特異性的精準堿基編輯工具提供堅實的理論依據(jù)。(2)如何進一步拓寬能夠被編輯的堿基類型。目前的堿基編輯器主要實現(xiàn)堿基轉(zhuǎn)換而不能進行堿基顛換,雖已有少量報道C到G(或A)的堿基編輯器,但其編輯產(chǎn)物依賴被編輯的細胞類型,且會使indel出現(xiàn)的頻率增加,因此還需要進一步的優(yōu)化。(3)如何開發(fā)更強大的基于堿基編輯器的人工定向進化工具。堿基編輯器可以模擬自然界在設(shè)定的靶向DNA區(qū)域內(nèi)隨機產(chǎn)生大量的點突變,后續(xù)利用適當?shù)暮Y選壓力鑒定出所需的有益變異。擴增編輯窗口寬度、拓展可同時編輯的堿基類型以及提高編輯效率都是未來優(yōu)化的方向。