凌 曦,王 璐,張澤文,劉禮榮,戴江紅,李凡卡
(1. 新疆醫(yī)科大學(xué)公共衛(wèi)生學(xué)院,新疆 烏魯木齊 830011;2. 新疆生產(chǎn)建設(shè)兵團(tuán)疾病預(yù)防控制中心,新疆 烏魯木齊 830002)
結(jié)核病由結(jié)核分枝桿菌(Mycobacteriumtuberculosis, MTB)引起,其致死率、致殘率已超過艾滋病,高居全球第一。隨著感染者中耐藥比例的增加,問題將更加嚴(yán)峻。MTB的基因分型技術(shù)是以分子生物學(xué)為基礎(chǔ),利用基因序列的多樣性,區(qū)分結(jié)核分枝桿菌之間的差異,把握病原的變化、疾病的傳播情況,分析流行病學(xué)事件,研究結(jié)核病患者的耐藥性原因,對預(yù)防、控制和治療結(jié)核病具有重要意義[1]。
近年來,生物研究進(jìn)入大數(shù)據(jù)時代,全基因組測序技術(shù)(whole genome sequencing,WGS)被引入結(jié)核病分子流行病學(xué)研究中,帶來了新的機(jī)遇與挑戰(zhàn)。WGS是以DNA為基礎(chǔ),以計算機(jī)技術(shù)為輔助,用于測量未知基因組序列分布的技術(shù)?,F(xiàn)階段的WGS包括第二代測序技術(shù)和第三代測序技術(shù),具有高通量、準(zhǔn)確度高和方便易行等優(yōu)點(diǎn),可以獲得結(jié)核分枝桿菌的全基因組序列信息,不僅可以鑒定菌種,還可以分析MTB間的系統(tǒng)進(jìn)化關(guān)系,感染源以及個體間的傳播過程[2]。
在MTB分型技術(shù)中IS6110-RFLP最早成熟[3]。IS6110是MTB DNA重復(fù)序列片段,存在于基因組中,由于不同菌株中其位置及其序列復(fù)制數(shù)是獨(dú)特的,IS6110-RFLP技術(shù)即利用此點(diǎn)區(qū)分不同菌株的類型。間隔區(qū)寡核苷酸基因分型(spoligotyping)是PCR技術(shù),染色體直接重復(fù)區(qū)DR (direct repeat) 存在于MTB復(fù)合群中,MTB DR序列中包含的間隔序列的位置及個數(shù)各不相同,spoligotyping可以按照識別間隔序列對菌株進(jìn)行分類??勺兇?lián)重復(fù)序列技術(shù)(variable number tandem repeat, VNTR)是基于PCR的另一種技術(shù)。該方法建立在H37Rv基因組的11個串聯(lián)重復(fù)區(qū)上,通過基于11個區(qū)設(shè)計引物并比較PCR產(chǎn)物每個區(qū)域串聯(lián)重復(fù)序列的拷貝數(shù)量來區(qū)分不同的菌種。MTB的基因組中分布著許多的重復(fù)單位(Mycobacterial interspersed repetitive unit, MIRU),不同菌株的重復(fù)序列拷貝數(shù)量各異[4]。目前,常結(jié)合VNTR與MIRU對MTB進(jìn)行分型,稱VNTR-MIRU法,該分型方法常用的組合位點(diǎn)有12、15、24位點(diǎn)等[5-6]。
IS6110-RFLP鑒別的能力良好,是MTB基因分型的金標(biāo)準(zhǔn)[7]。但I(xiàn)S6110-RFLP需要大量純化的DNA,由于MTB的生長周期長,往往需要較長的培養(yǎng)時間。Spoligotyping可直接應(yīng)用于臨床標(biāo)本[8],快速、經(jīng)濟(jì),但鑒別能力低于IS6110-RFLP。VNTR-MIRU法與IS6110-RFLP的檢測一致性較高,達(dá)78%~85%。以上常見的MTB分型技術(shù)能夠鑒別的基因組信息量常不足全基因組的1%,信息量很小,對于一些具有細(xì)微差異的菌株,常常無法分辨。具有細(xì)微差異的菌株可能屬于不同株系,也可能屬于同一株系,經(jīng)變異而來。WGS利用DNA測序平臺構(gòu)建出具有細(xì)微差異的菌株基因組的完整DNA序列,發(fā)現(xiàn)有許多單核苷酸多態(tài)位點(diǎn)(single-nucleotide polymorphism, SNP)存在。目前認(rèn)為,如果兩個分離株之間的SNP差異數(shù)不超過5個,則菌株具有相同或相似的基因型,屬于同一株系;如果SNP差異數(shù)大于12個,則菌株的基因型不相同,親緣關(guān)系較遠(yuǎn),屬于不同株系[9-10]。
此外,為實(shí)現(xiàn)結(jié)核病防控,接觸者追蹤是十分重要的策略。既可以對密接者提供預(yù)防性治療,也可以防止傳播范圍進(jìn)一步擴(kuò)大。然而,流行病學(xué)調(diào)查是漫長而費(fèi)力的,且發(fā)現(xiàn)患者通過暫時或短期接觸而建立的流行病學(xué)聯(lián)系并不容易。而分子流行病學(xué)將分子分型結(jié)果與現(xiàn)有的流行病學(xué)數(shù)據(jù)相整合,在研究結(jié)核病的傳播鏈中起著極其重要的作用。WGS能夠通過SNP鑒定疾病傳播方向和傳播鏈,比傳統(tǒng)的基因分型方法更有效地解決了大規(guī)模、縱向的結(jié)核病流行病學(xué)相關(guān)問題,更適合接觸者的數(shù)據(jù)追蹤及疫情的時空分布研究。
MTB全基因組測定首先要提取MTB的基因組DNA,然后按照所需長度隨機(jī)切斷經(jīng)電泳檢測合格的DNA樣本。加工這些片段,包括末端修復(fù)、加測序接頭、純化等,完成基因組DNA文庫的構(gòu)筑。隨后,檢測文庫的插入片段(insert size),庫檢合格后進(jìn)行上機(jī)測序,對測定出的原始數(shù)據(jù)(raw data)中的一部分低質(zhì)量數(shù)據(jù)進(jìn)行過濾。對最終獲得的有效數(shù)據(jù)(clean data)進(jìn)行數(shù)據(jù)分析。基準(zhǔn)株H37Rv作為標(biāo)準(zhǔn)序列,獲取核心基因組SNV(single nucleotide variation),分析MTB的譜系或亞譜系,或者預(yù)測其耐藥性。
全基因組第一代測序技術(shù)是Sanger法,經(jīng)過三十多年,已經(jīng)發(fā)展至第三代。目前全球測序市場中,第二代占有絕對優(yōu)勢。第二代測序的讀長短,常用的測序平臺有:基于焦磷酸測序原理的Roche 454平臺,基于可逆鏈終止物和合成測序原理的Illumina平臺,以及基于連接測序原理的ABI/Solid平臺。與前兩代測序技術(shù)比較,第三代技術(shù)的最大特征是能夠?qū)崟r測定單分子,是基于納米孔單分子讀取技術(shù)的方法。在第三代測序時,無需進(jìn)行PCR擴(kuò)增,超長讀長。第三代測序技術(shù)主要是Pacific Bioscience開發(fā)的SMRT技術(shù)、Helicos開發(fā)的遺傳信息分析系統(tǒng)(Heliscope/Helicos Genetic Analysis System),以及Oxford Nanopore Technologies納米孔單分子測序技術(shù)[11]。雖然第三代測序無需進(jìn)行PCR,但目前技術(shù)尚不成熟,且相對于第二代測序,成本較高。
4.1 WGS在疫情追蹤中的應(yīng)用 感染MTB后的健康人,只有約5%將在兩年內(nèi)發(fā)病,稱為近期感染(recent infection)。另外95%為潛伏感染,且無癥狀表現(xiàn)。在潛伏感染者中5%在今后幾到幾十年間發(fā)展成為活動性結(jié)核病的情況被稱為內(nèi)因復(fù)燃(reactivation)[12]。在疫情中,當(dāng)?shù)氐慕诟腥静±龜?shù)量與最近傳播率呈正比。近期傳播率越高,則該地區(qū)結(jié)核病傳播程度越嚴(yán)重。全基因組測序通過菌株間SNP的差異鑒定基因型的差異,從而判斷結(jié)核病發(fā)病模式是否為近期感染,為相關(guān)部門提供參考,以適時調(diào)整防控力度。由于鑒別能力高于MIRU-VNTR,MIRU-VNTR定義的簇常常被WGS進(jìn)一步分割成子簇[13]。在低發(fā)病率國家瑞士最近的一項結(jié)核病傳播的研究[14]中,MIRU-VNTR定義的聚類比率為17%,高于WGS定義的聚類比率8%,易導(dǎo)致結(jié)核病傳播力度被高估。澳大利亞的一項研究使用WGS對曾經(jīng)已被VNTR技術(shù)分型的菌株進(jìn)行再次驗證,發(fā)現(xiàn)近期傳播率非常有限,然而當(dāng)時VNTR技術(shù)定義的聚集率卻超過20%[15]。WGS由于分辨率高,還能夠用以識別超級傳播者(super spreader,即能將自身毒株傳染給其他多個人的傳染性極強(qiáng)的個體),識別可能的傳染源以及確定傳播鏈。在加拿大的一次結(jié)核病暴發(fā)中,按照MIRU-VNTR分析確定了1例初始病例以及1條傳播鏈,但隨后采用WGS后判定此次疫情的主要分支有兩個,且存在兩條不同的傳播鏈,為采用WGS追蹤結(jié)核病暴發(fā)疫情提供了范例[16]。
4.2 WGS在MTB耐藥研究中的應(yīng)用 2015年,結(jié)核病治療總體成功率為83%,耐多藥結(jié)核病、耐利福平結(jié)核病治療的成功率為54%,而廣泛耐藥結(jié)核病治療的成功率僅為30%。耐藥結(jié)核病已經(jīng)成為重要的公共衛(wèi)生問題[17-18]。感染者是否耐藥與其自身治療成本、治療效果緊密相關(guān),同時也影響著當(dāng)?shù)氐陌l(fā)病率和死亡率等[19],研究耐藥結(jié)核病的耐藥機(jī)制及其流行情況十分必要。
MTB產(chǎn)生耐藥可能是兩種機(jī)制造成的:一是感染耐藥MTB的原發(fā)耐藥;二是獲得性耐藥,由治療不足導(dǎo)致。WGS可將兩者區(qū)分開來[20]。如上海一項全基因組測序聯(lián)合VNTR分型技術(shù)研究檢測結(jié)果表明,當(dāng)?shù)亟Y(jié)核病患者耐藥主要是由傳播造成的原發(fā)耐藥[21],結(jié)果可以為當(dāng)?shù)刈钄嗄退幗Y(jié)核病的傳播以及制定政策提供依據(jù)。結(jié)果也符合之前相關(guān)研究[22-26]獲得的結(jié)論,即在低發(fā)病率高收入的流行地區(qū)中,大多數(shù)耐多藥結(jié)核病病例是由于耐藥菌株的傳播,而非治療不足。
WGS能夠用于精確MTB中耐藥的特定突變基因。有些已在臨床分離菌株中成功驗證,如利福平耐藥由rpoB和rpoC基因突變導(dǎo)致,異煙肼耐藥因katG和inhA基因突變導(dǎo)致等。氯法齊明和苯達(dá)喹啉的耐藥已被WGS確認(rèn)由藥物外排泵導(dǎo)致[27-29],在抗結(jié)核病藥物開發(fā)過程中,這仍作為耐藥機(jī)制鑒定的主要策略[30]。
全基因組關(guān)聯(lián)分析(GWAS)方法最初用于人類基因組數(shù)據(jù),如今已被引入MTB等微生物領(lǐng)域,并證實(shí)了一些耐藥相關(guān)基因[31]。Desjardins等[32]研究在來自南非和中國的498個基因組中發(fā)現(xiàn),編碼丙氨酸脫氫酶的ald基因突變增加了臨床分離株對環(huán)絲氨酸的耐藥性。環(huán)絲氨酸是治療耐多藥結(jié)核病和廣泛耐藥結(jié)核病的一種關(guān)鍵藥物,具有嚴(yán)重的精神和中樞神經(jīng)系統(tǒng)毒性。此外,一些已開發(fā)的數(shù)據(jù)網(wǎng)絡(luò)工具能從WGS數(shù)據(jù)網(wǎng)絡(luò)中推斷結(jié)核病耐藥性,包括CASTB、KVarQ、Mykrobe Predictor TB、PhyResSE、TBProfiler和TGS-TB。研究比較了這些工具在預(yù)測耐藥性方面的靈敏度和特異度[33-35],發(fā)現(xiàn)其在一線藥物中表現(xiàn)良好,在二線藥物中表現(xiàn)不佳。
4.3 WGS在MTB微進(jìn)化中的應(yīng)用 臨床上,同一患者體內(nèi)分離的MTB樣本同時存在敏感和耐藥菌株的情況比較復(fù)雜,尚未完全研究清楚,主要包括兩種情況:一種是混合感染,也就是說宿主同時被兩種菌株感染;另一種情況是MTB在被感染的宿主體內(nèi)進(jìn)行了微進(jìn)化。MTB感染中的微進(jìn)化使得傳播鏈的推斷復(fù)雜化,也為制定患者的治療方案增加了難度。根據(jù)目前的研究,WGS區(qū)分微進(jìn)化及混合感染的方式如下[36]:若兩種MTB擁有的遺傳背景相差明顯,比例特殊,可以由差異SNP處堿基種類和比例來區(qū)分;第二,如果用現(xiàn)有SNP構(gòu)建進(jìn)化樹,在不同譜系或兩個不同的進(jìn)化過程中發(fā)現(xiàn)菌株,即是混合感染;第三,由SNP差異數(shù)判別,同一患者某次化痰時培養(yǎng)的若干菌株或者同一個患者先后相繼化痰培養(yǎng)菌株的SNP數(shù)差不到11個,被認(rèn)為是微進(jìn)化,超過475個SNP即列為混合感染。
全基因組測序起源于一項基礎(chǔ)科研技術(shù),現(xiàn)在慢慢成為現(xiàn)代臨床微生物學(xué)實(shí)驗室的一部分。WGS也存在不足之處,由于依賴MTB的培養(yǎng),因此速度緩慢。具有設(shè)備昂貴、數(shù)據(jù)分析量大、技術(shù)專業(yè)方面要求標(biāo)準(zhǔn)化等特點(diǎn)[37]。盡管如此,與目前用于結(jié)核病診斷和流行病學(xué)監(jiān)測的技術(shù)相比,WGS仍具有多項優(yōu)勢。隨著高通量測序技術(shù)的發(fā)展,有望為結(jié)核病的公共衛(wèi)生監(jiān)測和防控提供更準(zhǔn)確的依據(jù),成為檢測新標(biāo)準(zhǔn)[38-39]。
利益沖突:所有作者均聲明不存在利益沖突。