• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      計算機輔助CRISPR向導RNA設計

      2017-11-21 00:48:22王遠立啜國暉閆繼芳石雷劉琦
      生物工程學報 2017年10期
      關鍵詞:研究者基因組位點

      王遠立,啜國暉,閆繼芳,石雷,劉琦

      ?

      計算機輔助CRISPR向導RNA設計

      王遠立2*,啜國暉1*,閆繼芳1,石雷2,劉琦1

      1 同濟附屬第十人民醫(yī)院同濟大學生命科學與技術學院生物信息學系,上海 200092 2 合肥工業(yè)大學計算機與信息學院,安徽合肥 230009

      王遠立,啜國暉, 閆繼芳, 等. 計算機輔助CRISPR向導RNA設計. 生物工程學報, 2017, 33(10): 1744–1756.Wang YL, ChuaiGH, Yan JF, et al. In silico CRISPR-based sgRNA design. Chin J Biotech, 2017, 33(10): 1744–1756.

      基于CRISPR/Cas9系統(tǒng)的基因編輯已被成功應用于多種細胞類型中。計算機輔助的向導RNA (Guide RNA) 設計是使用CRISPR系統(tǒng)成功進行基因編輯的關鍵步驟之一。目前的計算工作主要致力于利用計算模型來提高sgRNA的打靶效率并降低其脫靶。文中對于目前存在的sgRNA設計工具進行綜述,并且說明可以通過建立高效的計算模型,對當前的異質基因編輯數據進行整合挖掘,以獲得無偏差的sgRNA設計規(guī)則,并預測影響sgRNA設計的關鍵特征。筆者認為,對于sgRNA打靶和脫靶效果的系統(tǒng)總結和評價,將有助于使用CRISPR系統(tǒng)進行更加精準的基因編輯和基因治療。

      CRISPR,基因編輯,計算機輔助向導RNA設計,脫靶

      1 CRISPR基因編輯系統(tǒng)

      基于CRISPR系統(tǒng)的基因編輯已經被廣泛應用于各種類型的細胞和生物體中[1-5]。該技術主要包括以下類型的基因定點修飾技術:基因敲除(Gene knockout,KO)、基因敲入(Gene knockin,KI)和對基因表達的抑制或激活(CRISPRi/a)[4,6]。在將CRISPR/Cas9核酸內切酶系統(tǒng)應用到各種基因定點修飾技術的過程中,主要的挑戰(zhàn)之一是需要設計高效的sgRNA,并且降低其脫靶風險。合適的外源sgRNA可以通過定位前間區(qū)序列鄰近基序(Protospacer adjacent motif,PAM) 來引導Cas9蛋白到達靶特異性的DNA位點進行切割,其類型由所使用的特定Cas9蛋白質確定(圖1)[5-6]。目前最常用的Cas9是具有PAM NGG的化膿性鏈球菌(SpyCas9)。同時,根據不同的Cas9物種或變體,研究者先后鑒別出了一些其他種類的PAM序列(圖1)[6-8]。基于CRISPR的基因切割是通過使用針對目標基因敲除的非同源末端連接(Nonhomologous end-joining,NHEJ) DNA修復來引入突變,或是通過使用外源DNA供體模板來觸發(fā)基因敲入的內生的同源介導雙鏈DNA修復(Homology-directed repair,HDR)來實現的[2]。

      隨著CRISPR技術的迅速發(fā)展,研究者積累了大量的基因組編輯數據,若干具有挑戰(zhàn)性的計算問題也由此產生。計算機輔助的sgRNA設計已成為基因編輯實驗中的關鍵問題。目前OMIC Tools工具庫已經包含多種可用于CRISPR基因編輯的計算工具(http://omictools.com/crispr- cas9-category)[9],但在該領域并沒有對現有計算工具的系統(tǒng)總結。因此,本綜述將幫助研究者了解和掌握該領域的CRISPR計算工具和計算資源。

      2 計算機輔助的CRISPR sgRNA打靶設計

      CRISPR系統(tǒng)的KO效率主要取決于PAM位置、sgRNA和靶基因位點之間的特異性堿基配對以及隨后由NHEJ產生的基因組插入和缺失。此外,DNA序列信息和染色質特征也會對sgRNA的靶向切割產生影響[10-11]。微同源特性與框內移碼突變(In-frame mutations) 相關,因而可用于預測sgRNA打靶效率。這是因為基于CRISPR的KO通常會產生保留功能性的框內移碼突變,從而降低了KO的效率[12]。Bae等率先研究了通過預測微同源特性來提高人體細胞系中CRISPR的KO效率的方法,并通過計算機選擇靶位點以減少框內移碼突變[12]。在人和小鼠細胞系中,在高效的sgRNA設計中,鳥嘌呤應優(yōu)先出現在PAM序列最接近的–1和–2位置,這些位置在Cas9初始化時和序列的特性緊密相關[11,13];而胸腺嘧啶避免存在于靠近PAM的+4/–4位置上[11,14]。間隔目標下游的DNA的組分也被證明會顯著影響sgRNA的效率,而上游的序列核苷酸組分對其沒有顯著的影響[11,15]。此外,最近的研究工作同時表明,sgRNA的KO效率和若干表觀遺傳參數緊密相關[16]。

      CRISPR系統(tǒng)同樣可以用于下游靶基因的轉錄抑制(CRISPRi)或激活(CRISPRa)[17]。然而,我們對于序列特征影響CRISPRi/a中sgRNA功效的機制還了解甚少。CRISPRi/a主要靶向基因啟動子,其序列特征與編碼區(qū)不同,這使得sgRNA設計的選定特征與CRISPR KO系統(tǒng)存在差異。與CRISPR/Cas9 KO類似,CRISPRi/a系統(tǒng)更青睞間隔區(qū)中占大多數的核苷酸的嘌呤。而二者最重要的差異在于,在用于sgRNA設計的CRISPRi/a系統(tǒng)第3位上沒有胞嘧啶富集。此外,與CRISPR/Cas9系統(tǒng)相比,蛋白效應結構域(Protein domain) 在CRISPRi/a中是獨一無二的,這些結構域在基因定點修飾中起到了關鍵的作用[11,18]。到目前為止,只有少量的計算工具可以用于CRISPRi/a系統(tǒng)的sgRNA設計,如CRISPR-ERA[19]和SSC[11],其原因主要是目前CRISPRi/a數據還不足以產生具有魯棒性的sgRNA設計準則。該領域還需要對可能有助于提高該特定系統(tǒng)中sgRNA功效的特征進行系統(tǒng)的分析。

      目前研究者已經開發(fā)了用于sgRNA靶向設計的sgRNA設計規(guī)則和工具?;谥皩ΜF有資源的總結[6],我們對36個目標sgRNA設計工具進行了全面比較,結果如表1所示。

      我們將這些工具分為3種類型(圖1):1) 基于序列比對的方法(Alignment-based),即sgRNA的選擇僅由PAM的位置決定。2) 基于假設先驗的方法(Hypothesis-driven),即綜合考慮多個特定的因素(例如GC含量、外顯子位置等) 對sgRNA打靶效率的影響進行打分。3) 基于學習的方法(Learning-based),即利用一個綜合考慮不同特征的訓練好的模型對sgRNA切割效率預測。我們的基準測試表明,后兩種類型的工具比基于序列比對的工具效果更好,因為它們考慮了不同的順序和染色質特征,而且整合了最新的機器學習模型進行預測。另外,我們建議對于不同的sgRNA設計場景選擇不同的計算工具:當用戶僅需要基于PAM進行sgRNA設計的時候,建議使用CRISPRseek[20]和Cas-Offinder[21],這兩種工具也支持除傳統(tǒng)NGG以外的其他PAM類型。此外,對于需要優(yōu)先選擇最優(yōu)預測性能的高效sgRNA設計的場景,推薦使用基于學習的工具,如sgRNA-designer[10]、CRISPR MultiTargeter[22]、WU-CRISPR[23]、sgRNA Scorer[16]和SSC[11]。其中需要注意的是,sgRNA-designer[10]在其原始版本[15]上使用了基于更新設計規(guī)則的logistic回歸模型,這在人和小鼠細胞系中表現最好。一些其他的工具,包括E-CRISPR (快速)[24]、CRISPR-ERA (適應于CRISPRi/a)[19]、Protospacer Workbench (適應所有基因組)[25]和CRISPR Library Designer (CLD,適應于CRISPR篩選庫設計),也提供了獨特且具有吸引力的功能,這使得它們可被應用于不同的sgRNA設計任務。在這些工具中,E-CRISPR具有簡單易用的特點,并且能快速識別sgRNA。而Protospacer Workbench擁有友好的圖形界面,并且可以適用于除人類和老鼠外的其他基因組。有些sgRNA設計工具是適用于特定物種的,如CRISPR-P適用于植物的基因編輯[26],flyCRISPR適用于果蠅[27],EuPaGDT適用于病原體[28]。因此,在對相應的物種進行基因組編輯實驗時,應當首選這些工具。

      目前,尚不明確這些sgRNA靶向設計工具在不同細胞類型中的預測結果,因為它們中的大多數設計規(guī)則是來源于人和小鼠細胞的。MacPherson等最近設計了CRISPR Software Matchmaker,這是一個基于Excel的程序。它描述了幾種sgRNA設計工具的功能,以幫助用戶選擇合適的工具。然而,目前仍缺乏對于這些工具在不同物種和細胞上的sgRNA預測效果的系統(tǒng)評測。

      3 計算機輔助的CRISPR sgRNA脫靶設計

      對CRISPR系統(tǒng)的研究表明,并不是sgRNA中的每個堿基位點都會匹配目標DNA[6],而這種不匹配或部分匹配常常導致脫靶效應[29]。此外,由結合在特定位點的sgRNA引導的Cas9不一定會導致雙鏈斷裂(DSB),除此之外,結合或切割也可能無法產生任何功能性的結果(如框內移碼突變)[12]。因此,如何準確和定量地檢測真實的功能性切割位點,是基于CRISPR的脫靶分析中的關鍵問題[30]。目前已經產生了若干種基于實驗和測序的技術來檢測整個基因組層面sgRNA的脫靶情況。這些技術涵蓋了從蛋白質結合位點捕獲到DSB捕獲[29],而所有這些技術都需要整合全基因組測序和后驗數據分析來鑒定其各自的位點。不同的技術會產生不同的sgRNA的脫靶特性。例如,染色質免疫沉淀測序(ChIP-seq) 技術主要描述dCas9結合位點,其結果表明,與sgRNA核心或“種子”匹配的sgRNA近端一半的PAM同源就足以啟動Cas9結合[6]。然而,實際的裂解還需要在靶位點產生更廣泛的堿基配對,以及出現在NHEJ后的插入缺失突變。因此,ChIP-seq技術通常僅捕獲dCas9結合位點,而不是真正的DNA切割事件[6,14,31-33]。目前,研究者已經借助Digenome-seq[34]和其他DSB捕獲技術,例如Guide-seq[35]、IDLV捕獲[36]、HTGTS (高通量全基因組轉座測序)[37]和BLESS (直接原位斷裂標記)[38]等技術,對脫靶效率進行了進一步探究。

      計算機輔助的sgRNA脫靶預測也可以通過使用表1中列出的若干種工具來實現。幾乎所有的現有工具都使用簡單的序列匹配技術,通過對錯配計數來搜索脫靶位點。然而對于可能影響脫靶的序列和染色質特征,目前的研究成果還很少。迄今還沒有工具可以準確預測脫靶位點。研究者們最近進行了兩項比較研究:一項是將Guide-seq[35]生成的實驗性脫靶位點與計算機輔助脫靶預測的MIT CRISPR和E-CRISP進行比較,另一項是將COSMID (一個較高級的CRISPR脫靶位點數據庫) 與其他幾個脫靶預測工具[29]進行比較。兩項比較都顯示出,對于不同的工具,預測位點和實際位點都有大量差異。產生這些差異的可能原因在于:1)不同工具之間的堿基錯配偏差閾值不同,因此會產生不同的脫靶預測結果。一個可以改善預測結果的方法是通過對不同工具的結果進行整合來獲得較為一致的結果。2) 僅基于堿基錯配來識別脫靶位點,是無法完整刻畫固有的脫靶機制的。例如,像染色質特征等因素也會影響Cas9結合,然而現有工具對其還沒有深入的研究。

      為了改善脫靶預測性能,需要更好地了解基因和染色質的特征,以及核酸酶DNA結合和切割的機制。最近開發(fā)的脫靶預測和鑒定工具(CROP-IT) 首次嘗試通過整合來自現有Cas9結合和切割數據集的全基因組信息來改善脫靶結合和切割位點預測[39]。然而,與大量的打靶基因組編輯數據訓練集相比,脫靶數據集還很少。從模型訓練的角度來看,對脫靶預測效果進行改良的另一個關鍵點在于積累由上述實驗和測序技術獲得的脫靶基準數據。

      4 對CRISPR基因編輯的實驗后測序數據分析

      對CRISPR基因編輯系統(tǒng)的實驗后測序數據進行分析也是一個十分重要的課題。它主要涉及CRISPR篩選分析(CRISPR screen analysis) 和由NHEJ/HDR產生的基因組插入缺失突變分析。

      目前在功能基因組研究中,一個非常重要的問題是鑒定涉及特定生物過程的重要基因。其常規(guī)的方法是基于正向遺傳學篩選鑒定這些基因,通過高通量的基因定點修飾和基因敲除,將基因功能與特定表型相關聯。為此,基于CRISPR的遺傳篩選對于研究潛在遺傳因素未知的疾病或表型特別有用。通常,基于CRISPR的遺傳篩選的目標是使用用于KO或KI的慢病毒CRISPR庫,來產生具有多種基因突變的大量細胞群,以鑒定導致特定表現型的基因定點修飾[3]。靶向102至104個基因的常規(guī)GeCKO庫可以對哺乳動物細胞系進行陰性和陽性選擇篩選[11]。最近研究者又開發(fā)了兩個新的人類和小鼠全基因組庫Brunello和Brie。我們將其與傳統(tǒng)的庫進行了比較[10]。這兩個庫是通過更新的sgRNA設計規(guī)則(規(guī)則集2) 設計的,用以最大化目標sgRNA的切割效率,并最小化具有較高切割頻率分數的脫靶位點,從而改進了現有的CRISPR篩選庫[10]。為了進一步進行CRISPR篩選的數據分析,研究者開發(fā)了兩種工具,即MAGeCK[40]和caRpools[41](表1),它們涉及正向/負向的選擇。通過對CRISPR篩選后的高通量測序數據應用統(tǒng)計分析,來檢測顯著選擇的基因以及它們的功能。

      另外,研究者還開發(fā)了用于分析CRISPR實驗結果的工具。CRISPR-GA[42]是評估基因組編輯實驗質量的計算平臺。它基于實驗后測序數據,對在預期靶向位點的插入、缺失和同源重組進行了量化分析和表征。CRISP-Resso提供了一套計算工具,用于對目標基因位點易受深度測序影響的基因編輯實驗結果進行定性和定量評估[43]。另外還有若干種工具,如Microhomology- Predictor[12],利用實驗后測序數據來預測高效sgRNA打靶位點。表1最后列出了7個基于CRISPR實驗后測序數據的基因編輯分析工具。

      5 CRISPR計算領域的若干重要開放問題

      5.1 對計算機輔助CRISPR sgRNA設計工具的基準分析

      如上所述,盡管已經有多種可用于高效的sgRNA打靶和脫靶設計的工具,但仍需要通過基準實驗數據來比較它們的sgRNA預測效果,需要仔細設計基準數據和測試過程,以確保整個過程是無偏的。另外,目前尚不確定是否可在不同的sgRNA庫、細胞類型和生物體上應用一套普適的sgRNA設計規(guī)則。我們近期的初步工作表明,基于學習的工具的結果優(yōu)于基于假設和基于序列比對的sgRNA設計工具[44]?,F有的研究工作應用了若干種學習模型(如線性回歸、logistic回歸、增強回歸樹、隨機森林、支持向量機(SVM) 等),并對其在特定數據集中的sgRNA功效預測進行了比較[10],但是仍然不知道它們在不同數據集上的普適預測性能。未來仍然需要通過開發(fā)新的計算模型來改善sgRNA預測,以及應用更多的特征選擇技術來進行研究,以揭示能增強sgRNA功效的最顯著特征。

      5.2 sgRNA設計規(guī)則的不一致性

      目前尚不確定是否可在不同的sgRNA庫、細胞類型或生物體內重復利用之前研究中發(fā)現的序列特征和設計規(guī)則。例如在Xu等的研究中,面向HL60和mESC細胞的有效sgRNA設計特征并不相同[11]。他們還認識到,在該研究中可能會遺漏一些細胞特異性序列偏好[11]。而在另一個在bioRxiv上刊登的研究中,研究者在兩個不同的數據集上比較了不同的sgRNA KO效率預測模型。其中,sgRNA KO是使用流式細胞術和抗性檢驗監(jiān)測的[45]。他們觀察到,在流式細胞術數據上,不同模型的預測性能總是比在抗性檢驗數據上好。這表明在sgRNA KO效率的不同實驗測量中,存在大量的批次效應和異質性[45]。盡管在人類CRISPR基因敲除中,微同源特性可用來預測框內移碼突變的發(fā)生[12],然而當sgRNA效率預測與其他特征相結合時,它被證實是冗余的[10]。我們的研究還表明,微同源特性可能不能作為在多種細胞系中檢測框內移碼突變的關鍵指標[46]??偠灾?,除了PAM識別和堿基配對之外,其他基因組特征,如核苷酸特性、GC含量和微同源序列模式等,都影響著sgRNA打靶效應。然而,研究者們還沒有深入探究染色質特征和sgRNA結構。目前的sgRNA設計規(guī)則很可能是不完整的或者是有偏的,仍需要大量數據的整合分析。

      5.3 對CRISPR脫靶的高估/低估

      雖然已經進行了各種研究,但是研究者們仍然難以確定控制sgRNA靶向特異性的規(guī)則,特別是控制功能切割位點和突變產生的規(guī)則。此外,研究者們仍不清楚除堿基錯配之外的其他影響脫靶的因素。目前的證據表明,大部分被ChIP-seq捕獲的Cas9脫靶結合事件都是短暫的,功能影響很小。這表明目標結合位點檢測技術高估了CRISPR脫靶的效果[47]。與早期技術相比,其他DSB捕獲技術可以檢測到較少的脫靶事件[48],然而這還需在涵蓋了不同sgRNA庫和細胞類型的大規(guī)模數據集上進一步進行實驗證實。目前研究者已經通過各種技術成功地增加了CRISPR特異性,例如在最新的研究中,人們考慮了雙切口系統(tǒng)的設計[49],gRNA截短和gRNA延伸[34,50],采用新型Cas9直系同源物[7],以及對現有Cas9蛋白的改造等[5,51]。

      5.4 個性化的計算機輔助sgRNA設計

      對于不同細胞類型,不同工具會產生不同的sgRNA KO功效預測結果。而目前所有現有的工具都是針對普適的sgRNA設計而提出的,并沒有考慮細胞型異質性。其原因之一是,研究者們還沒有深入探究可能影響CRISPR系統(tǒng)的表觀遺傳和染色質特征,而這些因素是高度細胞類型特異性的。目前,只有很少的計算機輔助打靶/脫靶預測工具對表觀遺傳學特征進行了全面的探究,盡管如此,它們也未能改善在特定細胞類型的預測性能。來自我們課題組內部評估的一個示例表明,基于學習的sgRNA打靶功效預測工具CRISPRscan[52],在基于人體細胞的基準數據中的表現比其他基于學習的工具更差。對這項工具的后續(xù)調研顯示,其sgRNA設計規(guī)則是來自斑馬魚數據,因此它在人類細胞中的預測效果較差。這表明了細胞類型異質性對功效預測的影響。未來的sgRNA設計應該考慮細胞型異質性,考慮不同細胞類型的表觀遺傳環(huán)境,并為特定的細胞類型輸出個性化的sgRNA設計規(guī)則,以獲得更好的sgRNA設計效果。

      6 總結與展望

      CRISPR/Cas9技術已經迅速發(fā)展成為用于功能基因組編輯研究的最新技術。該技術具有諸如易用、高效、特異性和多功能性等巨大優(yōu)點。計算機輔助的sgRNA設計為CRISPR系統(tǒng)的發(fā)展邁出了關鍵的一步,并推動了生物信息學和計算技術在CRISPR研究中的應用。不過,研究者仍需要繼續(xù)改進計算機輔助的sgRNA設計,以提高打靶效率,并減少脫靶。需要注意的是:1) 用戶應為其特定設計目的選擇合適的工具。同時仍需要通過仔細設計的基準來評價其在不同基準數據集中的性能。2) 需要設計高效的模型來整合當前的異質基因組編輯數據,以獲得無偏的sgRNA設計規(guī)則,并確定與sgRNA打靶和脫靶有關的關鍵特征。目前所有的工具都是針對普適的sgRNA設計提出的,并未考慮細胞類型的異質性。個性化的sgRNA設計是計算機輔助sgRNA設計的重要發(fā)展方向。3) 最后,可利用各種脫靶檢測測定和高通量測序技術,對CRISPR系統(tǒng)中的脫靶進行仔細檢測,以避免對其低估或高估??傊嬎銠C輔助的sgRNA設計,將促進更精準的基因組編輯和基因治療,并減少脫靶。

      表1 36個sgRNA打靶設計工具和7個基于CRISPR的基因編輯分析工具

      圖1 計算機輔助的sgRNA設計系統(tǒng)可以被大致分為3種類型[69]. (1)基于序列比對的方法; (2) 基于假設先驗的方法; (3) 基于學習的方法. 圖的上半部分列舉了被不同種類Cas9識別的特定類型的PAM

      說明:本論文主要內容來自于筆者英文發(fā)表論文[69],中文版本有少量更新,其目的是將原英文論文進行翻譯,面向中文的讀者群體。該中文翻譯版本已經獲得了原論文出版機構Elisvier的授權,同意在《生物工程學報》進行發(fā)表,特此說明。

      [1] Cong L, Ran FA, Cox D, et al. Multiplex genome engineering using CRISPR/Cas systems. Science, 2013, 339(6121): 819–823.

      [2] Doudna JA, Charpentier E. The new frontier of genome engineering with CRISPR-Cas9. Science, 2014, 346(6213): 1258096.

      [3] Hartenian E, Doench JG. Genetic screens and functional genomics using CRISPR/Cas9 technology. FEBS J, 2015, 282(8): 1383–1393.

      [4] Sander JD, Joung JK. CRISPR-Cas systems for editing, regulating and targeting genomes. Nat Biotechnol, 2014, 32(4): 347–355.

      [5] Slaymaker IM, Gao LY, Zetsche B, et al. Rationally engineered Cas9 nucleases with improved specificity. Science, 2016, 351(6268): 84–88.

      [6] Graham DB, Root DE. Resources for the design of CRISPR gene editing experiments. Genome Biol, 2015, 16: 260.

      [7] Shmakov S, Abudayyeh OO, Makarova KS, et al. Discovery and functional characterization of diverse class 2 CRISPR-Cas systems. Mol Cell, 2015, 60(3): 385–397.

      [8] Zetsche B, Gootenberg JS, Abudayyeh OO, et al. Cpf1 is a single RNA-guided endonuclease of a class 2 CRISPR-Cas system. Cell, 2015, 163(3): 759–771.

      [9] Henry VJ, Bandrowski AE, Pepin AS, et al. OMICtools: an informative directory for multi-omic data analysis. Database, 2014, 2014: bau069.

      [10] Doench JG, FusiN, Sullender M, et al. Optimized sgRNA design to maximize activity and minimize off-target effects of CRISPR-Cas9. Nat Biotechnol, 2016, 34(2): 184–191.

      [11] Xu H, Xiao TF, Chen CH, et al. Sequence determinants of improved CRISPR sgRNA design. Genome Res, 2015, 25: 1147–1157.

      [12] Bae S, Kweon J, Kim HS, et al. Microhomology- based choice of Cas9 nuclease target sites. Nat Methods, 2014, 11(7): 705–706.

      [13] Wang T, Wei JJ, Sabatini DM, et al. Genetic screens in human cells using the CRISPR-Cas9 system. Science, 2014, 343(6166): 80–84.

      [14] Wu XB, Scott DA, Kriz AJ, et al. Genome-wide binding of the CRISPR endonuclease Cas9 in mammalian cells. Nat Biotechnol, 2014, 32(7): 670–676.

      [15] Doench JG, Hartenian E, Graham DB, et al. Rational design of highly active sgRNAs for CRISPR-Cas9-mediated gene inactivation. Nat Biotechnol, 2014, 32(12): 1262–1267.

      [16] Chari R, Mali P, Moosburner M, et al. Unraveling CRISPR-Cas9 genome engineering parameters via a library-on-library approach. Nat Methods, 2015, 12(9): 823–826.

      [17] Qi LS, Larson MH, Gilbert LA, et al. Repurposing CRISPR as an RNA-guided platform for sequence- specific control of gene expression. Cell, 2013, 152(5): 1173–1183.

      [18] Chen BH, Gilbert LA, Cimini BA, et al. Dynamic imaging of genomic loci in living human cells by an optimized CRISPR/Cas system. Cell, 2013, 155(7): 1479–1491.

      [19] Liu HL, Wei Z, Dominguez A, et al. CRISPR-ERA: a comprehensive design tool for CRISPR-mediated gene editing, repression and activation. Bioinformatics, 2015, 31(22): 3676–3678.

      [20] Zhu LJ, Holmes BR, Aronin N, et al. CRISPRseek: a bioconductor package to identify target-specific guide RNAs for CRISPR-Cas9 genome-editing systems. PLoS ONE, 2014, 9(9): e108424.

      [21] Bae S, Park J, Kim JS. Cas-OFFinder: a fast and versatile algorithm that searches for potential off-target sites of Cas9 RNA-guided endonucleases. Bioinformatics, 2014, 30(10): 1473–1475.

      [22] Prykhozhij SV, Rajan V, Gaston D, et al. CRISPR multitargeter: a web tool to find common and unique CRISPR single guide RNA targets in a set of similar sequences. PLoS ONE, 2015, 10(3): e0119372.

      [23] Wong N, Liu WJ, Wang XW. WU-CRISPR: characteristics of functional guide RNAs for the CRISPR/Cas9 system. Genome Biol, 2015, 16: 218.

      [24] Heigwer F, Kerr G, Boutros M. E-CRISP: fast CRISPR target site identification. Nat Methods, 2014, 11(2): 122–123.

      [25] MacPherson CR, Scherf A. Flexible guide-RNA design for CRISPR applications using Protospacer Workbench. Nat Biotechnol, 2015, 33(8): 805–806.

      [26] Lei Y, Lu L, Liu HY, et al. CRISPR-P: a web tool for synthetic single-guide RNA design of CRISPR-system in plants. Mol Plant, 2014, 7(9): 1494–1496.

      [27] Gratz SJ, Ukken FP, Rubinstein CD, et al. Highly specific and efficient CRISPR/Cas9-catalyzed homology-directed repair in Drosophila. Genetics, 2014, 196(4): 961–971.

      [28] Peng D, Tarleton R. EuPaGDT: a web tool tailored to design CRISPR guide RNAs for eukaryotic pathogens. Microb Genom, 2015, 1(4): e000033.

      [29] Lee CM, Cradick TJ, Fine EJ, et al. Nuclease target site selection for maximizing on-target activity and minimizing off-target effects in genome editing. Mol Ther, 2016, 24(3): 475–487.

      [30] Hendel A, Fine EJ, Bao G, et al. Quantifying on-and off-target genome editing. Trends Biotechnol, 2015, 33(2): 132–140.

      [31] Duan JZ, Lu GQ, Xie Z, et al. Genome-wide identification of CRISPR/Cas9 off-targets in human genome. Cell Res, 2014, 24(8): 1009–1012.

      [32] O’Geen H, Henry IM, Bhakta MS, et al. A genome-wide analysis of Cas9 binding specificity using ChIP-seq and targeted sequence capture. Nucleic Acids Res, 2015, 43(6): 3389–3404.

      [33] Kuscu C, Arslan S, Singh R, et al. Genome-wide analysis reveals characteristics of off-target sites bound by the Cas9 endonuclease. Nat Biotechnol, 2014, 32(7): 677–683.

      [34] Kim D, Bae S, Park J, et al. Digenome-seq: genome-wide profiling of CRISPR-Cas9 off-target effects in human cells. Nat Methods, 2015, 12(3): 237–243.

      [35] Tsai SQ, Zheng ZL, Nguyen NT, et al. GUIDE-Seq enables genome-wide profiling of off-target cleavage by CRISPR-Cas nucleases. Nat Biotechnol, 2015, 33(2): 187–197.

      [36] Wang XL, Wang YB, Wu XW, et al. Unbiased detection of off-target cleavage by CRISPR-Cas9 and TALENs using integrase-defective lentiviral vectors. Nat Biotechnol, 2015, 33(2): 175–178.

      [37] Frock RL, Hu JZ, Meyers RM, et al. Genome-wide detection of DNA double-stranded breaks induced by engineered nucleases. Nat Biotechnol, 2015, 33(2): 179–186.

      [38] Crosetto N, Mitra A, Silva MJ, et al. Nucleotide- resolution DNA double-strand break mapping by next-generation sequencing. Nat Methods, 2013, 10(4): 361–365.

      [39] Singh R, Kuscu C, Quinlan A, et al. Cas9-chromatin binding information enables more accurate CRISPR off-target prediction. Nucleic Acids Res, 2015, 43(18): e118.

      [40] Li W, Xu H, Xiao TF, et al. MAGeCK enables robust identification of essential genes from genome-scale CRISPR/Cas9 knockout screens. Genome Biol, 2014, 15(12): 554.

      [41] Winter J, Breinig M, Heigwer F, et al. caRpools: an R package for exploratory data analysis and documentation of pooled CRISPR/Cas9 screens. Bioinformatics, 2016, 32(4): 632–634.

      [42] Güell M, Yang LH, Church GM. Genome editing assessment using CRISPR Genome Analyzer (CRISPR-GA). Bioinformatics, 2014, 30(20): 2968–2970.

      [43] Pinello L, Canver MC, Hoban MD, et al. CRISPResso: sequencing analysis toolbox for CRISPR-Cas9 genome editing. bioRxiv, 2015, doi: 10.1101/031203.

      [44] Yan JF, Chuai GH, Zhou C, et al. Benchmarking CRISPR on-target sgRNA design. Brief Bioinform, 2017, doi: 10.1093/bib/bbx001.

      [45] Fusi N, Smith I, Doench J, et al.predictive modeling of CRISPR/Cas9 guide efficiency. bioRxiv, 2015, doi: 10.1101/021568.

      [46] Chuai GH, Yang FU, Yan JF, et al. Deciphering relationship between microhomology and in-frame mutation occurrence in human CRISPR-based gene knockout. Mol Ther Nucleic Acids, 2016, 5: e323.

      [47] Wu XB, Kriz AJ, Sharp PA. Target specificity of the CRISPR-Cas9 system. Quant Biol, 2014, 2(2): 59–70.

      [48] Kim D, Kim S, Kim S, et al. Genome-wide target specificities of CRISPR-Cas9 nucleases revealed by multiplex Digenome-seq. Genome Res, 2016, 26(3): 406–415.

      [49] Ran FA, Hsu PD, Lin CY, et al. Double nicking by RNA-guided CRISPR Cas9 for enhanced genome editing specificity. Cell, 2013, 154(6): 1380–1389.

      [50] Arribere JA, Bell RT, Fu BX, et al. Efficient marker-free recovery of custom genetic modifications with CRISPR/Cas9 in. Genetics, 2014, 198(3): 837–846.

      [51] Kleinstiver BP, Pattanayak V, Prew MS, et al. High-fidelity CRISPR-Cas9 nucleases with no detectable genome-wide off-target effects. Nature, 2016, 529(7587): 490–495.

      [52] Moreno-Mateos MA, Vejnar CE, Beaudoin JD, et al. CRISPRscan: designing highly efficient sgRNAs for CRISPR-Cas9 targeting. Nat Methods, 2015, 12(10): 982–988.

      [53] Xie SS, Shen B, Zhang CB, et al. sgRNAcas9: a software package for designing CRISPR sgRNA and evaluating potential off-target cleavage sites. PLoS ONE, 2014, 9(6): e100448.

      [54] Mali P, Yang LH, Esvelt KM, et al. RNA-guided human genome engineering via Cas9. Science, 2013, 339(6121): 823–826.

      [55] O’Brien A, Bailey TL. GT-Scan: identifying unique genomic targets. Bioinformatics, 2014, 30(18): 2673–2675.

      [56] Naito Y, Hino K, Bono H, et al. CRISPRdirect: software for designing CRISPR/Cas guide RNA with reduced off-target sites. Bioinformatics, 2015, 31(7): 1120–1123.

      [57] Stemmer M, Thumberger T, Del Sol Keyer M, et al. CCTop: an intuitive, flexible and reliable CRISPR/Cas9 target prediction tool. PLoS ONE, 2015, 10(4): e0124633.

      [58] Upadhyay SK, Sharma S. SSFinder: high throughput CRISPR-Cas target sites prediction tool. Biomed Res Int, 2014, 2014: 742482.

      [59] Aach J, Mali P, Church GM. CasFinder: flexible algorithm for identifying specific Cas9 targets in genomes. bioRxiv, 2014, doi: 10.1101/005074.

      [60] Biswas A, Gagnon JN, Brouns SJ, et al. CRISPRTarget: bioinformatic prediction and analysis of crRNA targets. RNA Biol, 2013, 10(5): 817–827.

      [61] Grissa I, Vergnaud G, Pourcel C. CRISPRFinder: a web tool to identify clustered regularly interspaced short palindromic repeats. Nucleic Acids Res, 2007, 35(S2): W52–W57.

      [62] Hodgkins A, Farne A, Perera S, et al. WGE: a CRISPR database for genome engineering. Bioinformatics, 2015, 31(18): 3078–3080.

      [63] Hsu PD, Scott DA, Weinstein JA, et al. DNA targeting specificity of RNA-guided Cas9 nucleases. Nat Biotechnol, 2013, 31(9): 827–832.

      [64] Montague TG, Cruz JM, Gagnon JA, et al. CHOPCHOP: a CRISPR/Cas9 and TALEN web tool for genome editing. Nucleic Acids Res, 2014, 42(W1): W401–W407.

      [65] Ma M, Ye AY, Zheng WG, et al. A guide RNA sequence design platform for the CRISPR/Cas9 system for model organism genomes. Biomed Res Int, 2013, 2013: 270805.

      [66] Park J, Bae S, Kim JS. Cas-Designer: a web-based tool for choice of CRISPR-Cas9 target sites. Bioinformatics, 2015, 31(24): 4014–4016.

      [67] Li W, K?ster J, Xu H, et al. Quality control, modeling, and visualization of CRISPR screens with MAGeCK-VISPR. Genome Biol, 2015, 16: 281.

      [68] Lindsay H, Burger A, Biyong B, et al. CrispRVariants: precisely charting the mutation spectrum in genome engineering experiments. bioRxiv, 2016, doi: 10.1101/034140.

      [69] Chuai GH, Wang QL, Liu Q.meets in: towards computational CRISPR-based sgRNA design. Trends Biotechnol, 2017, 35(1): 12–21.

      (本文責編 郝麗芳)

      CRISPR-based sgRNA design

      Yuanli Wang2*, Guohui Chuai1*, Jifang Yan1, Lei Shi2, and Qi Liu1

      1 Shanghai Tenth People's Hospital, Department of Bioinformatics, School of Life Sciences and Technology, Tongji University, Shanghai 200092, China 2 School of Computer and Information, Hefei University of Technology, Hefei 230009, Anhui, China

      CRISPR-based genome editing has been widely implemented in various cell types.single guide RNA (sgRNA) design is a key step for successful gene editing using CRISPR system. Continuing efforts are made to refinesgRNA design with high on-target efficacy and reduced off-target effects. In this paper, we summarize the present sgRNA design tools, and show that efficientmodels can be built that integrate current heterogeneous genome-editing data to derive unbiased sgRNA design rules and identify key features for improving sgRNA design. Our review shows that systematic comparisons and evaluation of on-target and off-target effects of sgRNA will allow more precise genome editing and gene therapies using the CRISPR system.

      CRISPR, genome editing,sgRNA design, off-target

      May 5, 2017;

      July 21, 2017

      Qi Liu. Tel: +86-21-65982200; E-mail: qiliu@#edu.cn

      *These authors contributed equally to this study.

      劉琦 同濟大學生物信息學系教授,博士生導師,上海市啟明星人才,浦江人才。致力于應用不斷發(fā)展的人工智能及機器學習技術來挖掘高通量生物數據及藥物數據。目前關注于藥物信息學、腫瘤基因組學以及基因編輯的小RNA設計研究等。主持863重點項目以及國家自然科學基金項目等多項,開發(fā)生物智能計算分析平臺及數據庫15項。任科技部國家重點研發(fā)計劃精準醫(yī)學方向及生物安全-遺傳資源庫建設方向評審專家等。

      猜你喜歡
      研究者基因組位點
      鎳基單晶高溫合金多組元置換的第一性原理研究
      上海金屬(2021年6期)2021-12-02 10:47:20
      牛參考基因組中發(fā)現被忽視基因
      CLOCK基因rs4580704多態(tài)性位點與2型糖尿病和睡眠質量的相關性
      高等教育中的學生成為研究者及其啟示
      研究者稱,經CRISPR技術編輯過的雙胞胎已出生??茖W將如何回應?
      英語文摘(2019年2期)2019-03-30 01:48:40
      二項式通項公式在遺傳學計算中的運用*
      生物學通報(2019年3期)2019-02-17 18:03:58
      研究者調查數據統(tǒng)計
      中華手工(2018年6期)2018-07-17 10:37:42
      醫(yī)生注定是研究者
      基因組DNA甲基化及組蛋白甲基化
      遺傳(2014年3期)2014-02-28 20:58:49
      有趣的植物基因組
      世界科學(2014年8期)2014-02-28 14:58:31
      农安县| 隆德县| 油尖旺区| 舟山市| 江阴市| 奉节县| 卓资县| 雅江县| 鄂托克前旗| 正宁县| 雅江县| 徐水县| 洱源县| 浠水县| 天全县| 涡阳县| 兴和县| 衡南县| 夏河县| 亳州市| 太和县| 长武县| 禹城市| 伊吾县| 庆阳市| 行唐县| 曲阳县| 江陵县| 巴彦县| 靖江市| 紫金县| 邢台市| 通榆县| 峨山| 高邑县| 富平县| 乌苏市| 谷城县| 台北市| 台湾省| 大方县|