楊鵬鵬, 羅娟秀, 宋玉竹, 李曉非, 夏雪山*, 張阿梅*
(1)昆明理工大學(xué) 生命科學(xué)與技術(shù)學(xué)院 分子病毒實驗室,昆明 650500;2)昆明市第三人民醫(yī)院,臨床檢驗科,昆明 650041)
結(jié)核病(tuberculosis,TB)是由結(jié)核分枝桿菌(Mycobacteriumtuberculosis,MTB)引起的傳染性疾病,也是單一病原菌感染導(dǎo)致死亡的首位原因。2018年,全球約1/4人口感染了結(jié)核分枝桿菌,大約1 000萬人(從900萬到1 110萬不等)發(fā)展為活動性結(jié)核病[1]。盡管多種抗結(jié)核藥物已在臨床上大量應(yīng)用,但一線抗結(jié)核藥物仍是主要治療藥物。然而抗結(jié)核藥物的廣泛使用帶來了不可忽視的問題,例如耐藥結(jié)核(drug-resistant TB,DR-TB)患者的增加。2018年,有484 000例結(jié)核病患者被診斷為利福平耐藥結(jié)核病(rifampicin-resistant TB,RR-TB),78%的RR-TB患者屬于耐多藥結(jié)核病(multidrug-resistant TB,MDR-TB)患者。印度(27%)、中國(14%)和俄羅斯聯(lián)邦(9%)的耐藥結(jié)核患者約占全球耐藥結(jié)核患者的一半[2]。據(jù)統(tǒng)計,2018年只有139 114例MDR-TB患者得到了有效的診斷和治療[2]。而未被及時診斷和治療的耐藥患者中有43%存在于印度或中國,因此,對一線耐藥結(jié)核患者進(jìn)行快速準(zhǔn)確的診斷是提高治愈率和降低死亡率的有效措施之一[2]。
及時準(zhǔn)確的診斷是成功治療的關(guān)鍵,但是臨床應(yīng)用的診斷技術(shù)和方法仍然存在一些問題[3-4]。藥物敏感性試驗(drug-susceptibility testing,DST)是判斷耐藥結(jié)核菌株的金標(biāo)準(zhǔn),但該技術(shù)存在操作復(fù)雜、培養(yǎng)時間長等缺點(diǎn)[5]。分子診斷是目前常用的臨床診斷方法之一,也是控制耐藥結(jié)核病流行、傳播和治療的關(guān)鍵因素之一[6]。可以使用一代測序方法來鑒定耐藥基因的突變,但它的缺點(diǎn)是通量較低且價格昂貴[7-8]。中等通量方法,例如基因芯片,但其在提高檢測速度的同時卻降低了準(zhǔn)確性和靈敏度[9-10]?;诙鷾y序技術(shù)發(fā)展的擴(kuò)增子測序是一種高通量、靈敏且準(zhǔn)確的檢測方法。目前,二代測序技術(shù)已被廣泛用于診斷疾病、研究病因和致病機(jī)制等方面[11-13],但在耐藥結(jié)核菌的突變檢測中應(yīng)用較少。
本文建立了一種快速、準(zhǔn)確、靈敏且覆蓋范圍廣的擴(kuò)增子測序方法,用以篩選結(jié)核耐藥菌株的17個一線耐藥基因的突變。
由昆明市第三人民醫(yī)院檢驗科的醫(yī)生使用羅氏培養(yǎng)基培養(yǎng)26個臨床結(jié)核分枝桿菌菌株,1個對藥物敏感的結(jié)核分枝桿菌臨床分離菌株作為陰性對照。使用一線抗結(jié)核藥物和相對應(yīng)的濃度對所有收集的結(jié)核菌株進(jìn)行藥物敏感性檢測:異煙肼(0.2 mg/L);利福平(40 mg/L);鏈霉素(4.0 mg/L);乙胺丁醇(2.0 mg/L);吡嗪酰胺(100 mg/L)。該研究得到昆明理工大學(xué)醫(yī)學(xué)倫理委員會的批準(zhǔn)。
用G +細(xì)菌基因組DNA小量提取試劑盒(莊盟生物,中國)提取結(jié)核分枝桿菌菌株的基因組DNA。根據(jù)結(jié)核分枝桿菌菌株H37Rv的基因組序列設(shè)計引物(GenBank登錄號:CP003248.2)。共設(shè)計了16對引物,用于擴(kuò)增5種一線抗結(jié)核藥物的17種耐藥基因??巩悷熾碌幕虬╧atG、sigI、ahpC、oxyR、kasA、ndh、nat和mshA基因;抗利福平的基因包括rpoA、rpoB和rpoC基因;抗乙胺丁醇的基因包括embA、embB和embC基因;抗吡嗪酰胺的基因包括pncA和rpsA基因;抗鏈霉素的基因為rpsL基因。擴(kuò)增引物見Table2。
PCR反應(yīng)體系為50 μL,其中包含25 μL 2×Phanta?Turbo Master Mix(Vazyme,中國),30 ng 結(jié)核分枝桿菌基因組DNA和0.2 μL正向/反向引物。PCR條件如下:95 ℃預(yù)變性3 min,95 ℃變性15 s,65 ℃退火15 s,72 ℃延伸(延伸時間見Table 1),重復(fù)35個循環(huán),72 ℃延伸5 min。通過使用瓊脂糖凝膠DNA回收試劑盒(TIANGEN,中國)純化擴(kuò)增產(chǎn)物。
Table 1 The information of target fragment amplification primers and barcode evaluation
1.3.1 構(gòu)建擴(kuò)增子文庫 根據(jù)說明書,使用Ion XpressTMPlus Fragment Library Kit(Thermo Fisher Scientific,美國)將PCR擴(kuò)增子構(gòu)建到文庫中。使用Qubit?dsDNA HS Assay Kit(Thermo Fisher Scientific,美國),將每個文庫的濃度歸一化至100 pmol/L,以進(jìn)行下一步研究。
1.3.2 乳液PCR 根據(jù)Ion PGMTMTemplate OT2 Reactions 400 Kit(Thermo Fisher Scientific,美國)的說明書,在Ion OneTouchTM2 Instrument上初始化擴(kuò)增子。再使用文庫DNA模板進(jìn)行乳液PCR。通過使用Ion OneTouchTMES(Life Technologies,美國)富集乳液PCR擴(kuò)增子。
1.3.3 Ion TorrenTM PGM 測序 使用Ion 314TMChip Kit v2和Ion Personal Genome Machine?(PGMTM)System(Life Technology,美國)對富集的乳液PCR擴(kuò)增子進(jìn)行測序。
用Ion Torrent Variant Caller軟件分析測序結(jié)果,首先刪除了低質(zhì)量的(<50個reads)或潛在錯誤的數(shù)據(jù)。所有測定序列以H37Rv菌株作為參考序列進(jìn)行分析。通過一代測序進(jìn)一步驗證了由二代測序鑒定出的突變,并在數(shù)據(jù)庫(https://tbdreamdb.ki.se/Info/)中檢索檢測到的突變,初步分析這些突變是否已被報道。對檢測到的新突變在9種分枝桿菌中進(jìn)行保守性分析:結(jié)核分枝桿菌、非洲分枝桿菌、亞洲分枝桿菌、鳥分枝桿菌、牛分枝桿菌、卡氏分枝桿菌、胃分枝桿菌、堪薩斯分枝桿菌和猿分枝桿菌。從GenBank下載參考序列進(jìn)行突變的保守性分析:WP_036362533.1、WP_003876960.1、WP_015294659.1、ORV60366.1、WP_023368850.1、KAA1250968.1、AMQ40394.1、KFW49971.1和NP_218311.1 用于分析embA基因;WP_051545718.1、WP_062908845.1、WP_015304020.1、WP_036411168.1、WP_152343010.1、KAA1250969.1、PRI02116.1、ALE45293.1和NP_218312.1用于分析embB基因;YP_009361183.1、WP_036362533.1、WP_010948786.1、WP_015304018.1、WP_036411191.1、WP_023368851.1、KAA1250966.1、NP_218310.1和KBF93337.1用于分析embC基因;NP_216424.1、CAA58266.1、WP_036359980.1、WP_019733604.1、WP_015290248.1、WP_036416255.1、WP_023364424.1、WP_044506092.1和KBI31267.1 用于分析katG基因;OBK93179.1、AYJ06713.1、ORV80661.1、EP43955.1、ORJ60792.1、NP_217974.1、AMQ40106.1、PHO98980.1和CCK65673.1用于分析rpoA基因;WP_051544984.1、WP_121035721.1、WP_015292360.1、WP_084293527.1、KEP43840.1、WP_084949953.1、NP_215181.1、AMQ37657.1和AKO23650.1用于分析rpoB基因;NP_215182.1、WP_036352589.1、WP_062899648.1、WP_014000349.1、ORV79512.1、ORB85546.1、ORJ60893.1、PRH95962.1和YP_009358020.1用于分析rpoC基因;WP_036355980.1、AYJ04498.1、WP_015303118.1、ORV74789.1、KZS77521.1、ORJ57881.1、NP_216146.1、PRH99054.1和KFW56032.1用于分析rpsA基因。用SWISS-MODEL(https://swissmodel.expasy.org/)預(yù)測蛋白質(zhì)的局部結(jié)構(gòu)是否發(fā)生變化。
通過藥物敏感性實驗將26株臨床菌株確認(rèn)為耐藥結(jié)核菌株,包括11株單耐藥菌株和15株多耐藥菌株。單耐藥菌株分別為:5株吡嗪酰胺耐藥株(45.5%),4株利福平耐藥株(36.4%),乙胺丁醇和鏈霉素耐藥株各1株,未發(fā)現(xiàn)針對異煙肼的單耐藥菌株。26株臨床耐藥結(jié)核株中,耐異煙肼、利福平、鏈霉素、乙胺丁醇和吡嗪酰胺的比例分別為53.8%(14/26),61.5%(16/26),50.0%(13/26),26.9%(7/26)和 46.2%(12/26)(Table 2)。
Table 2 Summary of DST results and mutations of each sample
每張Ion 314TM芯片可以檢測10株結(jié)核分枝桿菌臨床株。每張芯片最終獲得71.1 M數(shù)據(jù),覆蓋率達(dá)到70%(Fig.1A),負(fù)荷率為49%(Fig.1B)。共獲得622 597個reads。篩除無模板的reads(占總reads的1%),多克隆reads(占總reads的19%),低質(zhì)量reads(占總reads的14%),測試片段(占總reads的9%)和銜接子二聚體reads(占總reads的1%),有效reads的數(shù)目為376 086。有效reads的擴(kuò)增長度在100 bp至300 bp之間,平均長度為189 bp(Fig.1C)。67.6 M數(shù)據(jù)(約97%)成功匹配,平均覆蓋深度為1 565.7X(Fig.1D)。當(dāng)平均讀取長度為1X時,精度達(dá)到99.2%(Fig.1E)。
Fig.1 Report of the Ion PGMTM System (A)Total bases and ISP density;(B)Total reads and ISP summary;(C)Read length;(D)Total alignment bases and average coverage depth;(E)Mean raw accuracy
僅在10個基因(包括katG、rpoA、rpoB、rpoC、embA、embB、embC、pncA、rpsA和rpsL基因)中檢測到耐藥突變的存在,共鑒定出65個突變位點(diǎn),所有突變均經(jīng)過一代測序驗證,新發(fā)現(xiàn)的突變測序圖見Fig.2,另外7個基因(kasA、mshA、nat、oxyR-ahpC、sigI和ndh基因)中未檢測到突變。檢測到的65個突變可分為38種類型,其中熱點(diǎn)突變占總突變的50.8%(33/65),包括embB基因的c.916A>T/G和c.918G>A,katG的c.944G>C和c.1388G>T,rpoB基因的c.1592C>T,rpsL基因的c.128A>G和c.263A>G。9個稀有突變分別為embA基因的c.-12C>T,embB基因c.3070G>A,katG基因的c.1388G>A和c505G>A,rpoC基因的c.1448T>A、c.-12T>C、c.-7T> C和c.211C> T,pncA基因的c.233G> A。
Fig.2 Sanger sequencing peak map of newly discovered mutation sites The mutation sites identified by the red characters are complementary to the reference sequence due to the use of reverse primers for sequencing
與結(jié)核病耐藥抗性突變數(shù)據(jù)庫檢索對比后,發(fā)現(xiàn)23個檢測到的突變未被報道,分屬于21個突變類型。新突變分別為embA基因的c.2853G>T和c.250G>T,embB基因的c.1091T>C、c.1687A>C、c.2018T>C、c.2035G>A和c.3005A>G,embC基因的c.1873G>T、c.1991C>A和c.2920G>T,katG基因的c.2111T>C,rpoA基因的c.544C>T和c.1009G>A,ropB基因的c.-6T>C和c.238T>C,rpoC基因的c.1247A>G、c.1450T>G和c.2829C>A,rpsA基因的c.-55C>A,c.-132G> A和c.193G>A。
在5個臨床耐藥結(jié)核菌株(包括3個單耐藥菌株和2個耐多藥菌株)中未檢測到任何突變,在9個結(jié)核菌株中發(fā)現(xiàn)了同一耐藥基因的2個共存突變(Table 2),分別存在于katG(5個)、embB(2個)、rpoB(1個)和pncA基因(1個)。katG基因的所有5個共存突變中均包含突變c.1388G>T。突變數(shù)量最多的菌株(樣品#535)中共檢測到10個耐藥突變。
保守性分析結(jié)果顯示14個新突變具有高度保守性(Fig.3),分別是embA基因的p.A84S(c.250G>T)和p.E951D(c.2853G>T);embB基因的p.L364P(c.1091T>C)、p.I563L(c.1687A>C)、p.A679T(c.2035G>A)、p.V727A(c.2018T>C)和p.H1002R(c.3005A>G);katG基因的p.L704S(c.2111T>C);rpsA基因的p.A65T(c.193G>A);rpoA基因的p.R182W(c.544C>T)和p.D337N(c.1009G>A);rpoC基因的p.N416S(c.1247A>G)、p.W484G(c.1450T>G)和p.D943E(c.2829C>A)。用SWISS-MODEL對這些保守突變的結(jié)構(gòu)進(jìn)行預(yù)測(Fig.4)。結(jié)果表明,除rpoA基因的突變p.D337N(該突變未能準(zhǔn)確預(yù)測),所有錯義突變均導(dǎo)致氨基酸發(fā)生改變,進(jìn)而改變蛋白質(zhì)的空間結(jié)構(gòu),因此這些突變可能導(dǎo)致其蛋白質(zhì)功能的改變。
Fig.3 Evolutionary conservation analysis of the amino acid changes with eighteen novel missense mutations Nine Mycobacterium species(Mycobacterium tuberculosis, Mycobacterium africanum, Mycobacterium asiaticum, Mycobacterium avium, Mycobacterium bovis, Mycobacterium canettii, Mycobacterium gastri, Mycobacterium kansasii, and Mycobacterium simiae)were used in this analysis
Fig.4 Partial structures prediction with missense mutation of 13 conserved mutations (A)Partial structure predictions with missense mutations in the embA gene;(B)Partial structure predictions with missense mutations in the katG gene;(C)Partial structure predictions with missense mutations in the embB gene;(D)Partial structure predictions with missense mutations in the rpsA gene;(E)Partial structure predictions with missense mutations in the rpoA gene;(F)Partial structure predictions with missense mutations in the rpoC gene
耐藥結(jié)核病是亟待解決嚴(yán)重的社會和健康問題之一,對耐藥結(jié)核病患者的快速準(zhǔn)確診斷在標(biāo)準(zhǔn)化治療中發(fā)揮重要作用[14]。目前檢測耐藥結(jié)核菌株的技術(shù)分為基于表型和基因型的檢測方法[15-16]。盡管基于表型的藥物敏感性實驗是診斷耐藥結(jié)核的“金標(biāo)準(zhǔn)”,但由于其實驗條件嚴(yán)苛、耗費(fèi)時間長、易污染等缺點(diǎn),臨床上應(yīng)用效果不盡理想。分子診斷方法已廣泛用于臨床和實驗室中檢測結(jié)核菌的耐藥突變,主要包括TaqMan探針法,Gene Xpert MTB/RIF 和基因芯片等[17-20]。但是,這些分子檢測方法主要檢測熱點(diǎn)耐藥基因的熱點(diǎn)突變區(qū)域,導(dǎo)致一些稀有突變或新突變不能被發(fā)現(xiàn),從而延誤耐藥結(jié)核患者的治療。因此通過擴(kuò)增一線抗結(jié)核藥物相關(guān)所有基因進(jìn)行測序分析,才能解決無法檢測到稀有突變和新突變位點(diǎn)的問題。Sanger 測序法具有測定序列較長和準(zhǔn)確性高等優(yōu)點(diǎn),曾在人類基因組計劃中發(fā)揮了關(guān)鍵的作用,并應(yīng)用于腫瘤學(xué)、遺傳學(xué)和微生物學(xué)等多種學(xué)科的研究。但其檢測成本高,檢測通量低,無法滿足大規(guī)模測序的需求。二代測序降低了檢測成本,在保證準(zhǔn)確性的同時縮短測序時間,因此已廣泛的應(yīng)用于全基因組分析、外顯子組分析、轉(zhuǎn)錄組分析、宏基因組分析和基因分型等方面[21]。本文構(gòu)建了擴(kuò)增子測序的檢測方法,可同時檢測10株臨床結(jié)核菌株的17個一線耐藥基因。在26個耐藥結(jié)核菌株中檢測到21種新突變,這表明使用該方法可以有效地檢測到耐藥結(jié)核菌株的新突變,從而對臨床患者是否耐藥進(jìn)行診斷。此外,在7個選定的基因中均未發(fā)現(xiàn)突變,這表明熱點(diǎn)候選基因依然是結(jié)核菌的耐藥突變的重點(diǎn)檢測對象。
云南省耐藥結(jié)核菌株中,單耐藥結(jié)核和多耐藥結(jié)核分別占42.3%和57.7%。Hu等人[22]的研究中多耐藥結(jié)核病發(fā)生率為79.51%,明顯高于本研究中的多耐藥結(jié)核頻率(P= 0.036)??赡苁侨巳翰町惡蜆颖玖康牟煌瑢?dǎo)致多耐藥比例存在差異。而耐藥基因發(fā)生突變的頻率在我國不同地區(qū)同樣存在差異,這些差異可能是由于檢測方法的差異所致,本研究中耐藥基因突變頻率高于文獻(xiàn)報道的湖南省耐藥突變頻率[23]。這些結(jié)果提示,需要建立更全面的檢測方法以便發(fā)現(xiàn)更多的耐藥突變位點(diǎn)。
本研究中5個藥敏試驗確定的表型耐藥菌株(包括3個單耐藥菌株和2個耐多藥菌株)未在17個耐藥基因中檢測到突變,而且一些表型耐藥菌株的藥敏試驗結(jié)果和基因型不完全一致。該結(jié)果與一些報道具有相似性,Ko等人分析了36個表型耐藥菌株的8個耐藥相關(guān)基因,結(jié)果發(fā)現(xiàn),基因型與表型的耐藥分析不一致,不同耐藥基因發(fā)生突變對耐藥表型的預(yù)測值在44%~100%之間[24]。而辜吉秀等人的研究中耐藥基因突變對耐藥表型的預(yù)測值在54.55%~100%之間[25]。由此可見,耐藥突變的基因型與表型之間存在一定的差異,且不同藥物的差異度存在較大區(qū)別,可能是由以下原因引起這種差異:(1)耐藥菌株中可能存在一些未被發(fā)現(xiàn)的耐藥基因;(2)已知的針對某種藥物的耐藥基因突變也影響了其他藥物的耐藥性;(3)盡管在治療藥物相對應(yīng)的耐藥基因中未發(fā)現(xiàn)突變,但其他耐藥基因突變的協(xié)同作用可能是多耐藥的原因。本研究檢測的120號菌株中,未在已知的17個耐藥基因中檢測到耐藥突變,這一結(jié)果也提示以上推測的可能性。這些推測是否可以解釋耐藥菌株表型和基因型之間的矛盾結(jié)果,需要進(jìn)一步研究。
總之,本研究構(gòu)建了一種基于二代測序技術(shù)的擴(kuò)增子測序方法,用以篩選已知一線抗結(jié)核藥物耐藥基因的所有潛在突變,該方法有望用于臨床,為耐藥結(jié)核患者的臨床快速準(zhǔn)確診斷和有效治療提供技術(shù)依據(jù)。