呂 冰,高守一,萬康林
自從1882年科赫發(fā)現(xiàn)結(jié)核病由結(jié)核分枝桿菌感染引起以來,結(jié)核病一直是人類想要攻克的傳染病之一。但是,經(jīng)過百年來人們的努力,結(jié)核病仍然是影響人類健康的重要傳染病之一。在上世紀九十年代,以分子分型技術(shù)為基礎的分子流行病學,給研究結(jié)核病病原特征、感染傳播和致病機制等提供了新的手段。尤其是結(jié)核分枝桿菌H37Rv全基因組序列測序完成后,結(jié)核分枝桿菌的分子分型研究取得飛速的發(fā)展,進入了一個全新的領域,也進而使結(jié)核病流行病學的研究取得了很大的進展。建立在基因序列基礎上的分子分型技術(shù)可以了解病例間的相互關系,使得流行病學研究中對病例的追溯更加直觀,易于了解結(jié)核病病原在人群中的傳播動態(tài)特征。本文將介紹近年來國內(nèi)外經(jīng)常應用的及新建立的結(jié)核分支桿菌分子分型研究的主要方法,包括插入序列6110限制性片段長度多態(tài)性分析、寡核苷酸多態(tài)性分析、長片段多態(tài)性分析、富GC含量多態(tài)性、多位點可變數(shù)目重復片段多態(tài)性分析、以及單核苷酸多態(tài)性分析等。
插入序列(Insert sequence,IS)是一種比較簡單的轉(zhuǎn)座元件,通常小于2.5kb,并且廣泛分布于大多數(shù)細菌的基因組中〔1〕。插入序列一般不會攜帶表型基因,而只帶有一些與其轉(zhuǎn)座作用有關的基因,當它們轉(zhuǎn)座到某一基因中使該基因失活或產(chǎn)生極性效應時才會被發(fā)現(xiàn)。插入序列位置的置換經(jīng)常會使基因斷裂,影響相鄰基因活性或是改變其表達〔1-2〕。從進化的角度看,插入序列在基因組中的作用目前有兩種假設。其一是插入序列作為基因組中的“寄生者”,是對宿主的一種危害〔3〕;而另一種認為插入序列是在細菌的進化中起著重要的作用,保存宿主菌在自然選擇中產(chǎn)生的有利的變異〔4〕。
在結(jié)核分枝桿菌基因組中,作為分型應用的插入序列包括IS6110和IS1081等,其中IS1081曾應用到牛結(jié)核分支桿菌分型,而IS6110是最為重要和獨特的。Thierry等人最初報道IS6110序列為1355bp,隸屬于IS3家族,并且只存在于結(jié)核分枝桿菌基因組中〔5〕。這種插入序列廣泛分布于結(jié)核分枝桿菌的基因組中,在不同的臨床分離株中其重復次數(shù)也比較寬泛,為0-26個重復〔6-7〕,也有些文獻報道為0-25個重復〔8〕。不過,IS6110片段在基因組中的分布并不是隨機的,有研究表明基因組中分布了一些IS6110插入的“熱點”〔6〕。IS6110插入位置和重復次數(shù)在不同菌株基因組中的多態(tài)性具有地域分布特點,并且這種“標識物”具有足夠的分辨力來區(qū)分不同的菌株。所以以IS6110分子分型為基礎的分子流行病研究被廣泛的應用〔9〕。1993年,Van Embden等人介紹了IS6110限制性片段長度多態(tài)性(restriction fragmentlength polymorphism,RFLP)(IS6110-RFLP)分型法的標準操作方法〔10〕,現(xiàn)已廣泛應用于結(jié)核病分子流行病學的研究領域中。該標準方法對實驗操作中的內(nèi)切酶應用、分子量標準對照等細節(jié)進行了明確的規(guī)范。試驗方法的標準化使得到的結(jié)果在實驗室間比對成為可能,世界范圍內(nèi)的菌株追溯也成為可能。由于分型分辨率比較高,IS6110-RFLP方法目前依然被認為是結(jié)核分枝桿菌基因分型的“金標準”。中國疾病預防控制中心傳染病所結(jié)核研究室也曾對IS6110-RFLP方法進行標準化應用的探討〔12〕。但是這種方法存在一定的局限性,如對IS6110低拷貝(拷貝數(shù)小于5)的菌株難以分型、操做技術(shù)繁瑣、雜交帶識讀困難等。
實驗方法為:選用限制性內(nèi)切酶PvuⅡ酶切菌株全基因組,經(jīng)瓊脂糖凝膠分離酶切后的基因組片段,轉(zhuǎn)至尼龍膜上,再由標記過的探針雜交,放射自顯影技術(shù)檢測結(jié)果。為了實驗室間的比對及實驗室內(nèi)部的質(zhì)控,必須應用內(nèi)對照及外對照。外對照選用Lambda/HindⅢ和PhiX174/HaeⅢ,內(nèi)對照選用Super Coiled Ladder DNA與PhiX174/HaeⅢ兩個核苷酸相對分子量標準,二者同被檢菌株一同用PvuⅡ酶切,外對照作為Marker單獨加樣,而內(nèi)對照與被檢的結(jié)核分枝桿菌DNA混合后一起電泳,內(nèi)對照與被檢DNA采用各自的探針分別雜交(即雙雜交技術(shù))。該實驗得到的結(jié)果以 TIFF圖片格式儲存,用Bionumerics軟件分析結(jié)果〔10,12〕。
在結(jié)核分枝桿菌基因組中有一種36bp大小的DNA片段,在基因組中重復出現(xiàn),被稱為直接重復片段(DR,Direct repeats),這些片段被35-41bp大小的間隔區(qū)分隔開,每個重復片段間的間隔區(qū)是唯一的,而且其順序在所有菌株幾乎是相同的,一個直接重復片段加上一個間隔區(qū)稱為一個DVR(direct variant repeats),整個DR區(qū)是由多個DVR片段組成〔13〕。不同菌株會發(fā)生某一間隔區(qū)的插入或缺失,并且能穩(wěn)定傳代,針對檢測該間隔區(qū)的存在或缺失,利用間隔寡核苷酸分型(spacer oligonucleotide typing,Spoligotyping)方法就可以對結(jié)核分枝桿菌進行分型鑒定。目前國際已有該方法的數(shù)據(jù)庫(SploDB4),該數(shù)據(jù)庫已經(jīng)收錄了全世界122個國家的39295株結(jié)核分枝桿菌臨床分離株的Soligotyping分型數(shù)據(jù)〔14〕,在中國疾病預防控制中心傳染病所結(jié)核病研究室也建立了中國Spoligotyping數(shù)據(jù)庫,并收錄全國2千多株臨床分離株的Soligotyping分型數(shù)據(jù)(論文待發(fā)表)。
結(jié)核分枝桿菌間隔區(qū)寡核苷酸分型方法是一種獨特的以PCR為基礎的分子分型方法〔15-16〕。這種方法目前已經(jīng)有標準操作,中國疾控中心傳染病所結(jié)核研究室也有關于此方法的標準化應用探討〔17〕。該方法選取結(jié)核分枝桿菌基因組DR序列間的間隔區(qū)序列,設計各自特異的寡核苷酸探針,并固定在Biodyne C膜上,用生物素標記的引物PCR擴增被檢菌株的間隔區(qū)序列,將帶有標記的擴增產(chǎn)物與膜上結(jié)合的寡核苷酸探針雜交,再通過ECL增強化學發(fā)光法檢測〔18〕,得到較為特異的結(jié)果。結(jié)果判斷雜交陽性即間隔區(qū)存在用“1”表示,陰性即間隔區(qū)缺失用“0”表示,這樣每間隔區(qū)的檢測結(jié)果就獲得0或1的數(shù)字編碼,用 BioNumerics軟件進行結(jié)果分析〔17〕。
該方法同IS6110-RFLP相比有兩個優(yōu)點,一是不需大量的菌株DNA,二是結(jié)果為數(shù)字編碼,便于分析。但是缺點也不容忽視,即該方法的分辨率比較低〔19〕,尤其是對北京家族菌株。
可變數(shù)目串聯(lián)重復序列(variable number tandem repeats,VNTR),又稱為分枝桿菌分散重復單元(mycobacterial interspersed repetitive units,MIRU),廣泛存在于原核和真核生物的基因組中。近似于哺乳動物基因組中的微衛(wèi)星區(qū)域〔20〕。在已完成全基因組測序分析的結(jié)核分枝桿菌 H37Rv、CDC1551、和AF2122/97菌株基因組中均富含VNT R,并且許多臨床分離菌株的研究中證實,不同VNTR位點在同一菌株中、同一VNTR位點在不同菌株間,其重復單元的拷貝數(shù)不同,即存在明顯的多態(tài)性〔21-24〕,但其側(cè)翼序列具有高度保守性。自1998年Forthingham和Meeker等人報道結(jié)核分枝桿菌基因組中的VNT R位點,并且發(fā)現(xiàn)了11個具有基因多態(tài)性的位點(5個MPT R及6個ETR位點)〔25〕之后,更多關于VNTR 的研究被陸續(xù)的報道出來。被檢測的菌株根據(jù)不同位點的VNTR重復單元的拷貝數(shù)的多少來進行數(shù)字化編碼,然后利用相關軟件通過計算機來對這些菌株進行聚類分析〔25〕?;静僮鞣椒ㄊ?常規(guī)培養(yǎng)菌株,水煮法制備樣品DNA,PCR擴增選取的位點片段,瓊脂糖凝膠電泳確定PCR產(chǎn)物的大小,確定位點的串聯(lián)序列重復次數(shù),所有位點的重復序列次數(shù)可成為該菌株的數(shù)字編碼,用 BioNumerics軟件聚類分析〔26〕。2000年Supply等人確認了41個VNTR位點,經(jīng)過研究分析選擇了其中的12個位點,用該方法分型結(jié)果每株菌株以12個數(shù)字標記,采用數(shù)字化結(jié)果進行細菌的分子分型〔20〕。目前Supply等人又建立了VNTR(MIRU)分析網(wǎng)站,在該網(wǎng)站中全世界菌株的VNTR位點數(shù)據(jù)都可進行比對〔27〕。
多個VNT R位點組合的分型技術(shù)稱為多位點VNTR分析(Multiple Loci VNT R Ananlisis,MLVA)。MLVA的分辨率取決于所選擇的位點及位點數(shù)量。一般來說當選擇12個位點時,分型分辨率較IS6110低,但是12個位點與 Spoligotyping合并分型,或是應用 15個位點,其分型分辨率較IS6110 高〔28〕。
該方法操作簡單,分辨率高,結(jié)果容易分析,具有很高的可重復性,在實驗室內(nèi)和實驗室間具有非常好的可比性,并能提供數(shù)字化的分型信息,適宜于進行大量樣本和網(wǎng)絡化分析〔29〕。這種結(jié)果數(shù)字化的特點,更有利于分析及實驗室間比對及實驗室內(nèi)的質(zhì)控。同IS6110-RFLP方法相比有著很大的優(yōu)勢,在以后很有可能取代IS6110-RFLP方法成為新的金標準〔30〕。美國疾病控制中心已建議作為結(jié)核分枝桿菌基因型分型的首選方法〔31〕。中國疾病預防控制中心傳染病所結(jié)核病研究室通過對VNT R位點分析,對北京、安徽、福建、西藏各省市自治區(qū)的菌株進行分型研究〔21-24〕,確定了15個位點的ML-VA分型操作作為中國結(jié)核分枝桿菌MLVA分型的標準化操作〔26〕。
隨著全基因組序列分析技術(shù)的快速發(fā)展,結(jié)核分枝桿菌基因組間的比對也成為了可能。在核酸水平的基因多態(tài)性使研究者發(fā)現(xiàn)要研究不同臨床分離株的進化差異,單核苷酸的變異也可以成為新的基因標志物。單核苷酸多態(tài)性(single nucleotide polymorphism,SNP)包括非同義SNP,和同義 SNP。非同義SNP是指核酸的改變引起了氨基酸的變化,可能是細菌適應內(nèi)外環(huán)境選擇壓力產(chǎn)生的變異,例如耐藥相關位點的突變;同義SNP是指核酸的改變沒有產(chǎn)生氨基酸的改變,這種中性的變異尤其是發(fā)生在結(jié)構(gòu)相關基因或是管家基因,能夠為菌株間的進化相關研究提供基礎數(shù)據(jù)。Sreevatsan等人發(fā)現(xiàn)DNA促旋酶亞基的編碼基因上第95密碼子和一種過氧化物酶觸酶編碼基因的463密碼子的非同義SNP可以使結(jié)核分枝桿菌分至3種主要的基因群(PGGs)中〔32〕。
多位點序列分型(Multiple locus sequence typing,MLST)是基于病原微生物管家基因位點上的SNP建立的分型方法,通過確定管家基因并且直接測定這些管家基因的核苷酸序列,發(fā)現(xiàn)不同菌株在這些序列上的差異進行分型研究?,F(xiàn)在已經(jīng)有MLST數(shù)據(jù)庫網(wǎng)站(www.mlst.net),建立了十幾種病原的MLST數(shù)據(jù),但是尚沒有結(jié)核分枝桿菌MLST數(shù)據(jù)庫,亟待研究工作者的完善。
對基因組的比對分析除了得到基因組間SNP差異以外,也揭示了基因組間的長片段多態(tài)性(large-sequence polymorphisms,LSP)。LSP的產(chǎn)生可能是由于基因組大片段的基因缺失或重排,而不是由于基因間的水平轉(zhuǎn)移〔33〕。已經(jīng)發(fā)現(xiàn)臨床分離株基因組中大約 4.2%基因會發(fā)生缺失〔34〕。Brosch等人發(fā)現(xiàn)大片段的缺失一旦出現(xiàn),絕大多數(shù)會遺傳到子代基因組中。所以特定的LSP也會成為研究菌株分型進化的基因標識物,目前對LSP的研究主要集中于分枝桿菌的進化研究。例如 TbD1片段的缺失可以確定結(jié)核分枝桿菌的現(xiàn)代型,同樣擁有這一片段的菌株被稱為是結(jié)核分枝桿菌的古典型〔35〕。LSP并不是隨機發(fā)生在全基因組,而是有聚集傾向,也就是說一些位點可以是DNA缺失的“熱點”。而且有些熱點同插入序列的轉(zhuǎn)移有關系〔34〕。
一些LSP對于疫苗及結(jié)核感染檢測的研究具有重要的作用,例如M.bovis、BCG基因組中一些片段的缺失可以成為疫苗研究的突破口,而一些片段包含分泌蛋白的編碼基因,這樣的片段缺失可以提示我們菌株的毒力或引起的機體免疫能力產(chǎn)生差異。
表1 幾種分型方法優(yōu)缺點比較
結(jié)核病分子流行病研究是一個很大的范疇,包括分子生物學、臨床醫(yī)學、統(tǒng)計學及流行病學幾種學科的聯(lián)合應用,是從基因水平了解菌株親緣關系,研究結(jié)核病的病原分子特征、遺傳變異機制、人群中傳播規(guī)律及危險因素等。其核心技術(shù)是分子分型技術(shù)。在過去的近十年里,分子分型技術(shù)在不同地區(qū)的結(jié)核病流行研究中起到了重要的作用,使研究者對于結(jié)核病流行動態(tài)特征的了解、對于各地區(qū)疾病流行趨勢的掌控、從而起到了對結(jié)核病預防控制的作用。近年來結(jié)核病流行病學研究中又有新的問題出現(xiàn),HIV合并感染、耐藥及多耐藥菌株的出現(xiàn),使得研究工作者的任務更加艱巨。
在各種分型方法中,目前IS6110-RFLP、Spoligotyping及MLVA三種方法是在國際上流行病研究實際工作中最經(jīng)常使用的方法,并且在各國的疾控工作中起到了重要的作用,也已經(jīng)有相應的標準操作方法發(fā)表,而且Spoligotyping和MLVA方法都有國際數(shù)據(jù)庫網(wǎng)站,有利于各個國家研究者發(fā)布或比對數(shù)據(jù)。理想的分型方法應具有快速、分辨率高、重復性好、容易操作、費用低廉等特征,但是現(xiàn)有的方法沒有一種能完全符合以上條件,都是各具有自己的優(yōu)點,又各自有其不足之處(表1是幾種分型方法優(yōu)缺點比較)。在研究工作中我們無法提供一種完美的分型方法,但是不同種方法的聯(lián)合應用可以盡可能達到我們要求的結(jié)果,IS6110-RFLP方法耗時長,不適于大流行中樣本的快速鑒定,而Spoligotyping和MLVA方法快速簡便,適用于大量樣本的快速鑒定,所以這兩種方法聯(lián)合應用比較多見。在我國北京、安徽、福建、西藏各省市自治區(qū)的菌株的分型研究中都有應用〔21-24〕。
〔1〕馮作化.醫(yī)學分子生物學〔J〕.北京:人民衛(wèi)生出版社,2008:6928.
〔2〕Safi H,Barnes PF,Lakey DL,et al.IS6110 functions as a mobile,monocyte-activated promoter in Mycobacterium tuberculosis〔J〕.M ol Microbiol,2004.52(4):999-1012.
〔3〕Charlesworth B,Sniegowski P,Stephan W.et al.The evolutionary dynamics of repetitive DNA in eukaryotes〔J〕.Nature,1994,371(6494):215-220.
〔4〕Blot M.Transposable elements and adaptation of host bacteria〔J〕.Genetica,1994;93(1-3):5-12.
〔5〕Thierry D,Cave M D,Eisenach K D,et al.IS6110,an IS-like element of Mycobacterium tuberculosis complex〔J〕.Nucleic Acids Res,1990.18(1):188.
〔6〕Kurepina NE,Sreevatsan S,Plikaytis BB,et al.Characterization of the phylogenetic distribution and chromosomal insertion sites of five IS6110 elements in Mycobacteriumtuberculosis:nonrandom integration in the dnaA-dnaN region〔J〕.Tuber Lung Dis.1998.79(1):31-42.
〔7〕M cHugh TD,Gillespie SH.Nonrandom association of IS6110 and Mycobacterium tuberculosis:implications for molecular epidemiological studies〔J〕.J Clin Microbiol,1998,36(5):1410-1413.
〔8〕van Soolingen D,Hermans PW,de Haas PE,et al.Occurrence and stability of insertion sequences in Mycobacterium tuberculosis complex strains:evaluation of an insertion sequencedependent DNA polymorphism as a tool in the epidemiology of tuberculosis〔J〕.J Clin Microbiol,1991,29(11):2578-86.
〔9〕van Soolingen D.Molecular epidemiology of tuberculosis and other mycobacterial infections:main methodologies and achievements〔J〕.J Intern Med,2001;249(1):1-26.
〔10〕Van Embden JD,Cave MD,Crawford JT,et al.Strain Identification of My cobacterium tuberculosis by DNA Fingerprinting:Recommendations for a Standardized Methodology〔J〕.Journal of Clinical Microbiology,1993;31(2):406-409.
〔11〕Murray M,Nardell E.Molecular epidemiology of tuberculosis:achievements and challenges to current knowledge〔J〕.Bulletin of the World Health Organization,2002,80(6):477-482.
〔12〕劉敬華,Kristin Kremer,Christine Pourcel,等.IS6110限制性片段多態(tài)性分析標準方法的建立及其在結(jié)核分枝桿菌分子分型中的應用〔J〕.中華流行病學雜志,2008,29(8):801.
〔13〕van Embden JD,van Gorkom T,Kremer K,et al.Genetic variation and evolutionary origin of the direct repeat locus of Mycobacterium tuberculosis complex bacteria〔J〕.J Bacteriol,2000;182(9):2393-401.
〔14〕Karine Brudey,Jeffrey R Driscoll,Leen Rigouts,et al.Mycobacterium tuberculosis complex genetic diversity:mining the fourth international spoligotyping database(SpolDB4)for classification,population genetics and epidemiology〔J〕.BMC Microbiology,2006,6:23.
〔15〕Groenen PM,Bunschoten AE,Van Soolingen D,et al.Nature of DNA polymo rphism in the direct repeat cluster of Mycobacterium tuberculosis;application for strain differentiation by a novel typing method〔J〕.Mol Microbiol,1993,10(5):1057-1065.
〔16〕Kamerbeek J,Schouls L,Kolk A,et al.Simultaneous detection and strain differentiation of Mycobacterium tuberculosis for diagnosis and epidemiology〔J〕.J Clin Microbiol,1997,35:907-914.
〔17〕董海燕,呂冰,張媛媛,等.中國結(jié)核分枝桿菌間隔區(qū)寡核苷酸分型方法標準化操作程序的探討〔J〕.中華流行病學雜志,2009,30(4):384-387.
〔18〕Hemans PWM,Van Soolingen D,Bik EM,et al.Insertion element IS987 from Mycobacteriumtuberculosis bovis BCG is located in a hot-spot integration region fo rinsertion elements in Mycobacterium tuberculosis complex strains〔J〕.Infect Immun,1991,59:2695-2705.
〔19〕Kremer K,van Soolingen D,Frothingham R,et al.Comparison of M ethods Based on Different M olecular Epidemiological Markers for Typing of Mycobacterium tuberculosis Complex Strains:Interlaborato ry Study of Discriminato ry Power and Reproducibility〔J〕.Journal of Clinical Microbiology,1999,37(8):2607-2618.
〔20〕Supply P,Mazars E,Lesjean S,et al.Variable human minisatellite-like regions in the My cobacterium tuberculosis genome〔J〕.Mol Microbiol,2000,36(3):762-771.
〔21〕石荔,楊敏,Christine Pourcel,等.M LVA 和 Spoligotyping用于西藏地區(qū)216株結(jié)核分枝桿菌臨床分離株的基因分型研究〔J〕.中華微生物學和免疫學雜志,2007,27(8):711-718.
〔22〕闞曉宏,萬康林,金玉蓮,等.DNA數(shù)目可變串聯(lián)重復序列用于結(jié)核分枝桿菌分型研究〔J〕.中國防癆雜志,2005,27(2):77-81.
〔23〕曹曉慧,劉志廣,趙秀芹,等.220株結(jié)核分枝桿菌北京臨床分離株的基因分型研究〔J〕.中國人獸共患病學報,2008,24(5):412-417.
〔24〕曹曉慧,蔣毅,張媛媛,等.13個VN TR位點用于113株結(jié)核分枝桿菌基因分型的研究〔J〕.中華流行病學雜志,2006,27(8):705-708.
〔25〕Frothingham R,Meeker-O'Connell WA.Genetic diversity in the My cobacterium tuberculosis complex based on variable numbers of tandem DNA repeats〔J〕.Microbiology,1998.144:1189-1196.
〔26〕呂冰,Pourcel C,劉敬華,等.結(jié)核分枝桿菌多位點可變數(shù)目重復序列分型方法標準化程序的建立〔J〕.中華流行病學雜志,2008,29(9):919-924.
〔27〕Supply P,Lesjean S,Savine E,et al.Automated highthroughput genotyping for study of global epidemiology of Mycobacterium tuberculosis based on mycobacterial interspersed repetitive units〔J〕.J Clin Microbiol,2001;39(10):3563-71.
〔28〕M athema B,Kurepina N E,Bifani PJ,et al.Molecular Epidemiology of Tuberculosis:Current Insights〔J〕.Clincal Microbiology Reviews,2006,19(4):658-685.
〔29〕劉敬華,萬康林,成詩明.結(jié)核分枝桿菌株水平鑒定技術(shù)及其研究進展〔J〕.中華流行病學雜志,2003,24(12):1153-1157.
〔30〕Peter F.Barnes,M.D.,and M.Donald Cave.M olecular Epidemiology of T uberculosis〔J〕.The New England Journal of Medicine,2003,349(12):1149-1156.
〔31〕Crawford J T.Genotyping in contact investigations:a CDC perspective〔J〕.Int J Tuberc Lung Dis,2003,7(12):S453-S457.
〔32〕Sreevatsan S,Pan X,Stockbauer KE,et al.Restricted structural gene polymorphism in the Mycobacterium tuberculosis complex indicates evolutionarily recent global disseminationJ T.Proc Natl Acad Sci USA,1997,94:9869-9874.
〔33〕Brosch R,Pym AS,Gordon SV,et al.The evolution of mycobacterial pathogenicity:clues from comparative genomics〔J〕.T rends Microbiol,2001,9(9):452-458.
〔34〕T solaki AG,Hirsh AE,DeRiemer K,et al.Functional and evolutionary genomics of Mycobacterium tuberculosis:insights from genomic deletions in 100 strains〔J〕.Proc Natl Acad Sci USA,2004,101(14):4865-4870.
〔35〕Sun YJ,Bellamy R,Lee AS,et al.Use of mycobacterial interspersed repetitive unit-variable-number tandem repeat typing to examine genetic diversity of My cobacterium tuberculosis in Singapo re〔J〕.J Clin Microbiol,2004.42(5):1986-1993.