張皓博,樊曉旭,劉蒙達,遲慶安,2,劉婷婷,亓 菲,3,孫淑芳,范偉興
(1.中國動物衛(wèi)生與流行病學中心,國家動物結核病參考實驗室,山東青島 266032;2.海南省動物疫病預防控制中心,海南???571100;3.青島農業(yè)大學動物醫(yī)學院,山東青島 266109)
納米孔測序技術(nanopore sequencing)為近幾年興起的第三代測序技術,由牛津納米孔技術公司(Oxford Nanopore Technologies,ONT)開發(fā)。納米孔測序技術與以往的測序方法不同,當長的單鏈DNA穿過穩(wěn)定在電阻聚合物膜中的蛋白質納米孔時,就可以直接檢測核苷酸,無需進行主動的DNA合成。通過在電阻聚合物膜中設置電壓,傳感器可以實時檢測到隨著DNA分子穿過孔的離子電流變化,從而判定核苷酸的類別及修飾情況[1]。ONT還開發(fā)了MinION納米孔測序儀。MinION是一款大小與手機相當?shù)腢SB設備,可對病原進行現(xiàn)場快速測序[2],極大提高了分析質量和速度,有助于實現(xiàn)疾病的“早干預、早處置”。
利用納米孔測序技術,人們可將DNA或RNA序列,通過納米孔進行實時單分子測序。該技術高通量、實時、靈活、超長讀長、低成本,可直接測序DNA或RNA,無需PCR擴增和樣品化學標記,極大簡化了測序試驗流程[3]。該技術不受實驗室環(huán)境限制,可應用于野外環(huán)境,如高山、叢林、北極和空間站等[4]。本文就納米孔測序技術的原理、應用及在疾病檢測中的優(yōu)勢及未來發(fā)展進行綜述。
納米孔測序技術,以插入在聚合物膜中的生物納米孔為基礎,將膜浸沒在電解質溶液中以生成高電阻,再加以適當電壓,使離子僅能通過納米孔以形成電位差,從而產生電流。當單個核苷酸進入納米孔時,會導致電流發(fā)生特征性擾動。這種擾動與核苷酸堿基大小和化學性質相關,因而通過檢測這種擾動,可實現(xiàn)對DNA或RNA序列的測定。在MinION設備核心部分,DNA解旋酶將DNA解開,使一條鏈穿過蛋白質孔,而每個DNA堿基的獨特構象都會引起電流的特征性擾動,從而讀出序列(圖1-A)。
納米孔起源于庫爾特計數(shù)和離子通道的發(fā)現(xiàn),在外部施加電壓的情況下,尺寸略小于孔徑的顆??梢源┻^納米孔。納米孔可以嵌入生物聚合物膜中,將含有電解質的反應器分隔為順式和反式隔室(圖1-B)。在偏置電壓下,溶液中的電解質例子通過電泳穿過納米孔,從而產生例子電流信號,根據(jù)信號擾動,實現(xiàn)納米孔測序。
圖1 納米孔測序原理示意圖[3,5]
試驗[6]表明,可以通過施加適當電勢來引導單鏈DNA片段穿過納米孔,但必須對DNA片段和納米孔進行輕微修飾,以實現(xiàn)DNA通過生物聚合物納米孔的過程可控,從而確保信號可測量。為了使DNA片段到達納米孔并控制片段通過納米孔的速度,首先需要將片段化的DNA轉化為5'磷酸化和3'dA尾平末端修復的DNA,實現(xiàn)對DNA片段的修飾,然后通過DNA片段A和T突出端與測序所需的引導接頭Y連接。引導接頭載有一個運動蛋白,可以控制DNA穿過納米孔以及與后續(xù)核苷酸序列相結合,這是DNA片段附著到電阻聚合物膜上和在納米孔中移動所必需的,從而使DNA捕獲靈敏度提高了20 000倍。
目前,ONT提供了3種測序讀取方式。不同方式的讀取會影響測序的可信度。最簡單的方法是單向讀取[one-directional(1-D)read],無論樣品是單鏈還是雙鏈,都僅讀取1條鏈(模板鏈)。
如果是雙向讀取[two-directional(2-D)read],則樣品必須在文庫制備過程中為雙鏈或變?yōu)殡p鏈。與1-D僅讀取模板鏈的堿基相比,2-D方式中,使用發(fā)卡接頭將其連接到雙鏈DNA互補鏈,測序時緊接著模板鏈通過納米孔,因此互補鏈的堿基也被讀取,從而能夠在1次讀取期間對兩條鏈進行測序。通過發(fā)卡接頭引起的電流特征性擾動,使用適當?shù)纳镄畔W和數(shù)據(jù)處理技術,使讀取結果可以在生物信息上實現(xiàn)正向和反向閱讀。
1-D和2-D的組合讀取方式稱為“1-D2”。與2-D讀取方式相同,在1-D2方式中,樣品也必須是雙鏈或變成雙鏈的,需要1-D2接頭和引導接頭,但不需要發(fā)卡接頭。測序時,先讀取模板鏈,然后將運動蛋白直接連接到互補鏈的反向1-D2接頭上,直接進行反向讀取。與1-D相比,由于兩條鏈的堿基都被讀取且利用生物信息學進行了比較,因此2-D和1-D2讀取方式增加了測序的可靠性[7]。
2007年,ONT公司獲得了納米孔測序專利許可,并于2010年開始進行DNA測序工作。在2012年基因組生物技術進展會議上,ONT公布了第一款商用的納米孔測序設備MinION(圖2)。MinION是一款僅為90 g的便攜式設備,芯片多達2 048個納米孔,通過專用集成電路(ASIC)將其分成512組,測序可在數(shù)分鐘內完成,儀器價格低至1 000美元。作為納米孔測序的主要測序儀,人們對其寄予了極大的希望和關注。2014年以來,ONT憑借MAP(MinION access programme)項目,將MinION應用于多個領域[8]。目前,ONT又發(fā)布了新的MinION Mk1設備和試劑。該設備結合了MinION的實時、快速、便攜等優(yōu)點,并具有更高通量、更強大的集成計算以及高分辨率的觸摸屏,提供了一個可在任何地方進行DNA和RNA測序的分析解決方案。
圖2 MinION和MinION Mk1C測序儀
許多研究已表明,納米孔測序具有良好的通用性和適用性。MinION不僅可以直接在實驗室使用,也可以在實驗室外的多種環(huán)境中廣泛使用。研究人員已將MinION帶到北極,研究多年凍土冰楔中微生物群落的基因組特征[9],以及在位于加拿大阿爾伯塔省的北約反恐技術中心的軍事訓練場檢測生物制劑[10],甚至在國際空間站利用病毒、細菌和小鼠DNA來研究評價MinION在太空中表現(xiàn)[4]。
MinION也已用于許多與細菌相關的傳染病研究。研究人員利用MinION對16S rRNA和ITS基因進行測序,成功鑒定了臨床分離的細菌和真菌菌株[11],使用9.5版的芯片能夠獲得99%的準確性,這意味著在臨床實驗室,可采用MinION進行靶向測序。在一項研究[12]中,利用MinION從腦膜炎患者的血液培養(yǎng)物中分離樣品,進行16S rRNA的靶向測序,分類分析證實,傳染源是一種很少引起人類腦膜炎的人獸共患病原體——胎兒彎曲桿菌。此外,納米孔測序還能夠檢測細菌導致免疫逃避的突變位點,這已在百日咳桿菌全基因組測序研究[13]中得到證實。
納米孔測序也應用于鑒定臨床病例中難以確定傳染源的病原菌。在一項研究[14]中,從被診斷為感染性心內膜炎患者的心臟瓣膜組織中,提取了7種DNA分離物進行納米孔全基因組測序,結果在所有樣品中均能檢測到鏈球菌、Q熱柯克斯體和巴爾通體,而通過傳統(tǒng)微生物學檢測均為陰性。
納米孔測序通常以覆蓋整個基因組的檢測方式來鑒定臨床病毒感染。在2015年的一項研究[15]中,早期版本的MinION(錯誤率約為30%)成功鑒定出了3種痘病毒株。另一項研究[16]報道了利用納米孔測序,從血液樣本中檢測到基孔肯雅病毒、埃博拉病毒和丙型肝炎病毒,從樣本收集到得出報告整個過程僅耗時6 h。在埃博拉疫情期間,西非使用了MinION儀器現(xiàn)場對病毒進行基因組測序,實現(xiàn)了實時監(jiān)測疫情[17]。雖然埃博拉病毒變異較快,但納米孔測序技術可以在醫(yī)療條件較差的地區(qū)幫助醫(yī)療人員鑒定病原體,監(jiān)測患者對疫苗和治療的反應。同樣,在南美利用MinION測序分析了寨卡病毒的起源和傳播[18],從而為研究寨卡病毒感染提供了幫助。同樣,如果對流感病毒的整個基因組進行納米孔測序,追蹤新型流感毒株,也可為制備更有效的疫苗提供基礎。
在臨床診斷中,不僅要鑒定病原體,還要快速準確判斷病原微生物的耐藥性,以提高抗菌治療效果。超長讀長的納米孔測序可以識別抗性基因的存在,從中分析測定細菌的耐藥型。一項研究[19]利用納米孔測序實時分析方法,鑒定了40例肺炎克雷伯菌血液分離株的抗生素耐藥型,發(fā)現(xiàn)納米孔實時分析方法與傳統(tǒng)鑒定方法的一致性為77%,重要的是,如果將這種實時方法用于臨床患者治療,則使用抗菌藥物的治療時間中位數(shù)相比傳統(tǒng)方法縮短了約20 h。其他臨床研究[20]已闡明:抗生素耐藥基因在埃希氏菌、沙門氏菌、克雷伯菌和腸球菌中具有廣泛的特征性;傳統(tǒng)的測序平臺(二代測序)讀長較短,需要通過后期拼接組裝完成完整的質粒序列測定,而納米孔測序平臺可直接對這些質粒進行測定解析。納米孔測序產生的長序列還可以檢測大腸桿菌多重耐藥菌株中可移動的耐藥元件。在2015年的一項研究[21]中,研究人員使用早期版本的MinION來檢測腸桿菌、鮑曼不動桿菌和金黃色葡萄球菌的耐藥元件,盡管存在一定的錯誤率,但納米孔測序可以在整個基因組中準確發(fā)現(xiàn)存在的耐藥元件。此外,由于納米孔測序可以實現(xiàn)較長的讀長,因此鑒定抗生素耐藥基因相比二代測序所需的讀數(shù)閾值更低。
與人類醫(yī)學研究相比,納米孔測序在動物疫病檢測中的應用處于起步階段,目前主要用于快速診斷和疫病溯源。例如,在非洲豬瘟(ASF)檢測中,O'Donnell等[22]在MinION儀器上,開發(fā)了ASF病毒測序快速分析工具ASF-FAST,使用ASF-FAST可捕獲足夠的病毒序列,在測序10 min內完成解析192 kb基因組[23]。ASF-FAST工具展示了MinION實時測序功能的優(yōu)勢,并進一步擴展應用于仔豬病毒性腸道疾病的準確鑒定和診斷[24]。MinION不僅可以用于快速診斷禽霍亂病原,還可以實時鑒別LPS結構以進行準確的靶向疫苗接種,確保免疫效果[25]。牛呼吸道疾病(BRD)通常是由自身免疫力下降及暴露于多種病原共同誘導的,目前是北美和澳大利亞養(yǎng)殖場中牛死亡的最常見原因。僅在北美,BRD導致的產業(yè)損失超過10億美元。McCabe等[26]利用MinION,在10 min內完成文庫制備,在測序的第一個小時內產生了足夠的讀數(shù),能夠鑒定引起B(yǎng)RD的3種病毒;此外,McCabe等還發(fā)現(xiàn),MinION具有在環(huán)境中快速診斷病毒的潛力。
雖然納米孔測序已成功應用于病原及抗生素耐藥性檢測,但是必須承認,在實際應用中還存在一些瓶頸問題。問題之一是,DNA移位速度過快(約1~3 μs/堿基),這限制了納米孔測序對單個核苷酸堿基的識別,從而影響測序精度[6]。過去幾年,已研究開發(fā)出各種方法來減慢移位速度。其中:修飾方法包括用鏈霉親和素修飾以固定多核苷酸[27]以及分子接頭β-CD與修飾的α-HL通道通過二硫鍵偶聯(lián),能夠成功捕獲和鑒定4個單核苷酸堿基[28];物理方法包括降低電壓[29]、降低溶液溫度[30]、提高黏度[30]和提高鹽濃度[31]。目前,將納米孔測序和其他短讀測序結合起來也是一種潛在的解決方案,可以幫助獲得更高質量的基因組信息[32]。然而,通過納米孔從DNA長鏈中讀取單核苷酸信息仍然是一個挑戰(zhàn)。
納米孔測序應用面臨的另一個重要問題是,盡管人們開發(fā)了許多微生物核酸提取方法,但樣品制備過程仍需要優(yōu)化。由于臨床樣品成分非常復雜,宿主中核酸污染的比例很高,導致微小的微生物種群可能被覆蓋和干擾[33]。因此,需要進一步改進和優(yōu)化樣品收集、核酸提取、文庫制備以及測序和數(shù)據(jù)處理方案,同時需要設置外部的質量控制措施。
天然DNA分子可能帶有不同類型的堿基修飾(如甲基化)。第二代測序技術(next-generation sequencing,NGS)因在文庫制備過程中使用PCR擴增,所以無法檢測到修飾信息,不能直接檢測天然DNA中的堿基修飾,而納米孔測序技術可對天然DNA和RNA進行單分子測序,從而可以直接檢測堿基修飾。Wescoe等[34]證明了單通道納米孔可以區(qū)分胞嘧啶的所有5種修飾情況,包括胞嘧啶(C)、5-甲基胞嘧啶(5-mC)、5-羥基胞嘧啶、5-甲酰基胞嘧啶(5-fC)和5-羧基胞嘧啶(5-caC),準確率高達92%~98%。這種方法已被用于在較小的基因組中繪制表觀遺傳圖譜,如結核菌株的甲基化模式,以檢測疾病發(fā)展進程。納米孔測序技術用于檢測人類基因組DNA堿基修飾仍在試驗中。Euskirchen等[35]研究表明,表觀遺傳學信息可能具有直接的臨床疾病檢測價值。在研究中,他們已使用堿基修飾和序列數(shù)據(jù)來區(qū)分不同類型的腦腫瘤。此外,納米孔測序還提供了檢測RNA表觀修飾的平臺。表觀遺傳修飾不僅影響DNA,還影響RNA,從而對轉錄和翻譯產生功能性作用。
納米孔測序的讀長遠遠超過了NGS平臺。在大腸桿菌中,1-D的讀長可以超過300 kb,而2-D的讀長也高達60 kb。由于超長的讀長,使其比NGS具有更高的分辨率。Jain等[36]利用MinION解決了人類Xq24參考序列中50 kb的缺口。之前這個序列中的缺口是無法確定的,因為它包含一段4.8 kb的串聯(lián)重復序列。最近一項研究[37],對人關節(jié)感染的超聲處理樣品進行NGS和納米孔全基因組測序,結果納米孔測序比NGS可發(fā)現(xiàn)更多的病原。當研究人類基因組鑒定結構變異時,尤其是檢測癌癥[38],存在很多拷貝數(shù)變異以及基因重復、缺失、插入、倒位和易位等情況,短讀長的NGS在裝配時會出現(xiàn)很多錯誤,需要百萬次讀取來校正,而平均讀長為8 kb的納米孔測序,只需要幾百次就能可靠地檢測結構變異。在RNA表達分析方面,NGS的讀長較短,需要將cDNA組裝成長的轉錄本,這對于鑒定同工型的轉錄本存在困難,而納米孔測序通過測到全長的cDNA,就避免了此問題。例如,Bolisetty等[39]使用MinION來檢測果蠅Dscam1基因中的RNA剪接變體。該基因是自然界中最復雜的可變剪接基因,具有18 612種可能的同工型,長度從1 806 bp到1 860 bp。該研究使用MinION檢測到了7 000多個Dscam1異構體,比對一致性大于90%,而平均讀長為450 bp的NGS,不能鑒定出這些同工型,表明納米孔測序具有更高的分辨率。
目前,除了納米孔測序,沒有其他平臺可以進行實時分析。對于臨床或現(xiàn)場檢測而言,相比NGS和Sanger測序,納米孔測序具有明顯的優(yōu)勢,可在數(shù)小時或更短的時間內獲取和分析DNA或RNA序列。此外,納米孔測序的文庫制備更加簡單,不受環(huán)境限制,便于攜帶,這進一步加快了檢測時間,有助于迅速診斷疾病并及時進行針對性治療。目前,這種優(yōu)勢主要用于研究,雖然還未完全應用于常規(guī)臨床診斷,但未來可對每個患者樣本進行測序,并以標準品為對照。這些信息將有助于更好地了解人類疾病的潛在機制,并最終幫助提供個性化的治療方案。
ONT提供了許多生物信息工具進行數(shù)據(jù)分析,以優(yōu)化MinION測序結果的準確性。對于具有生物信息學專業(yè)知識的用戶來說,可以下載Guppy工具包,并通過計算機上的命令行界面處理FAST5文件,將其轉換為FASTQ。Guppy可以為用戶提供幾種用于堿基調用的算法,可以將原始讀取精度提高3%以上。Guppy工具包還包括下游分析組件,如多線操作、接頭的修整和對齊等。除了簡單的分類之外,在Github(面向開源及私有軟件項目的托管平臺)上,還有很多更復雜性的工具供用戶使用,包括medaka、Tombo、Pomoxis和nanopolish,它們分別用于序列校正,從原始測序數(shù)據(jù)中識別修飾的核苷酸,基因組裝配和基因組裝配中的錯誤校正[40]。
ONT的目標是能夠在任何環(huán)境下,可由任何人對任何生物進行分析。為了支持該目標,ONT創(chuàng)建了Metrichor公司。該公司開發(fā)了圖形用戶界面工具,作為其EPI2ME平臺的一部分,供生物信息學知識有限的用戶使用。EPI2ME中的應用程序允許用戶進行許多不同的分析,包括微生物樣本的系統(tǒng)分類、抗性基因ID的注釋以及與參考基因組的比對等??傮w而言,ONT的這些應用程序無需通過輸入命令行運行軟件,而其他平臺尚不提供這種功能。另一種簡便的平臺是One Codex。它是一個在線平臺,可為任何基于微生物的樣品提供分類學分析、抗性基因預測和基因組比對[41]。One Codex數(shù)據(jù)庫包括61 000個細菌、48 000個病毒、1 800個真菌、1 900個古細菌和200個原生動物基因組。它提供了針對16S、5S、23S、gyrB、rpoB、18S、28S和ITS基因分析的數(shù)據(jù)庫??股啬退幉糠职?00個基因,可分析每個基因的同源性、覆蓋率和讀取深度。對于不想為微生物分類投入太多時間或資源的實驗室而言,One Codex是一種進行快速、安全分析的最佳選擇。
目前,納米孔測序仍面臨許多挑戰(zhàn)。與NGS相比,納米孔測序最大的局限性是讀取精度相對較低,因此在單核苷酸變異(SNV)檢測中,納米孔測序并不是最佳方案。有研究將納米孔測序用于SNV基因分型,但仍需要較高的覆蓋度。納米孔測序盡管測序精度不如NGS,但為全基因組測序診斷傳染病提供了許多解決方案,已成功用于人類和動物病原體檢測、抗生素耐藥基因檢測和混合微生物群落鑒定。隨著準確性的提高和性能的不斷改進,加之在成本、測序時間和生物信息學分析方面的明顯優(yōu)勢,納米孔測序有望在臨床實驗室成為疾病檢測的重要選擇。