白 云,萬康林
分子生物學(xué)技術(shù)的不斷成熟和生物信息學(xué)技術(shù)的廣泛應(yīng)用使生物的分子進(jìn)化研究取得了迅猛進(jìn)展。結(jié)核分枝桿菌的分子進(jìn)化研究為結(jié)核分枝桿菌的溯源、致病機(jī)理研究、耐藥性研究及毒力基因相關(guān)研究奠定了堅(jiān)實(shí)的理論基礎(chǔ),同時(shí)也為結(jié)核病的預(yù)防控制提供重要依據(jù)。特對(duì)近年來國(guó)內(nèi)外用于結(jié)核分枝桿菌分子進(jìn)化研究進(jìn)行綜述。
1.1 結(jié)核分枝桿菌分類學(xué)地位 分枝桿菌屬主要包括結(jié)核分枝桿菌復(fù)合群(Mycobacterium tuberculosis complex,MTBC)、麻風(fēng)分枝桿菌(M.leprae)和非結(jié)核分枝桿菌(Non-tuberculous Mycobacteria,NTM)。MTBC主要包括結(jié)核分枝桿菌(M.tuberculosis,MTB)、牛分枝桿菌(M.bovis)、非洲分枝桿菌(M.a(chǎn)fricanum)和田鼠分枝桿菌(M.microti)等。其中結(jié)核分枝桿菌、牛分枝桿菌和非洲分枝桿菌均可感染人類并引發(fā)結(jié)核病。目前,發(fā)現(xiàn)的非結(jié)核分枝桿菌約有160種,其中37種已有病例報(bào)告[1]。常見的引起人類疾病的非結(jié)核分枝桿菌主要包括鳥分枝桿菌復(fù)合群(M.a(chǎn)vium complex,MAC)、膿腫分枝桿菌(M.a(chǎn)bscessus)和堪薩斯分枝桿菌(M.kansasii)等。
1.2 結(jié)核分枝桿菌起源 分枝桿菌屬的祖先可能為一種自由生物體。與海洋生物發(fā)生長(zhǎng)期、持續(xù)性聯(lián)系的分枝桿菌,位于分枝桿菌進(jìn)化樹的根部,故海分枝桿菌可能相對(duì)最為古老。結(jié)核分枝桿菌與MTBC的其他成員,在表型、宿主范圍及致病力方面存在較大差異,但是具有較高的遺傳同質(zhì)性,其基因組水平的序列相似性在99.95%以上,同義核苷酸變異率僅有0.01%~0.03%,并且基因水平轉(zhuǎn)移也很少發(fā)生,所以有科學(xué)家認(rèn)為:MTBC是由同一祖先進(jìn)化而來,最近的進(jìn)化瓶頸時(shí)期發(fā)生在2萬到3.5萬 年 前[2-4]。Cole 等[5]認(rèn) 為 H37Rv中 含 有20種帶有單加氧酶的細(xì)胞色素P450,這種酶可以催化疏水化合物的氧化,這也是與土壤腐生生物相關(guān)的特性之一,所以結(jié)核分枝桿菌的祖先可能為一種土壤內(nèi)的分枝桿菌。Fabre等[6]認(rèn)為在非洲發(fā)現(xiàn)的卡耐提分枝桿菌(M.canettii)可能是MTBC中最古老的譜系。Gutierrez等[7]最近的進(jìn)化研究發(fā)現(xiàn):結(jié)核分枝桿菌的進(jìn)化與人類相似,可以追溯到3百萬年前的非洲大陸,并認(rèn)為結(jié)核分枝桿菌的進(jìn)化與人類的遷徙和進(jìn)化相關(guān),即:結(jié)核分枝桿菌隨著人類的遷徙由非洲逐漸傳播到世界各地從而形成了目前這種不同基因型的全球分布形式。
2.1 插入序列(insertion sequences,IS)插入序列是廣泛存在于細(xì)菌基因組中的一種轉(zhuǎn)座元件。結(jié)核分枝桿菌研究中,常用的插入序列主要包括IS6110、IS1081等。IS6110隸屬于IS3家族,序列長(zhǎng)度為1.36kb,僅存在于 MTBC中[8]。包括結(jié)核分枝桿菌在內(nèi)的幾乎所有的MTBC的菌株在直接重復(fù)區(qū)都有一個(gè)IS6110元件,且此插入位點(diǎn)被認(rèn)為是MTBC進(jìn)化過程中最早的插入位點(diǎn)[9]。McEvoy等[10]認(rèn)為結(jié)核分枝桿菌的進(jìn)化能力絕大部分可能依賴于IS6110的轉(zhuǎn)座,含有IS6110高拷貝數(shù)的菌株與低拷貝數(shù)的菌株相比具有更高的進(jìn)化率和更多的進(jìn)化優(yōu)勢(shì)。
2.2 單核苷酸多態(tài)性(Single nucleotide polymorphisms,SNP) SNP是指由單個(gè)核苷酸變異引起的基因組序列多態(tài)性。SNP分為同義(synonymous)SNP和非同義(nonsynonymous)SNP。同義SNP是指核酸的改變未造成基因編碼的氨基酸序列改變。非同義SNP是指核酸的改變引起了氨基酸序列的改變。非同義突變可能是種群內(nèi)在因素或者外部環(huán)境壓力引起的趨同進(jìn)化的結(jié)果。而同義SNP與其他的進(jìn)化標(biāo)識(shí)相比更少的受到選擇壓力的影響,屬于中性突變,因此,被科學(xué)家認(rèn)為是用于結(jié)核分枝桿菌進(jìn)化研究理想的分子生物學(xué)標(biāo)識(shí)。
2.3 大 片 段 多 態(tài) 性 (Large-sequence polymor-phisms,LSP) LSP是發(fā)生在基因組中容易產(chǎn)生插入-缺失位置的大片段的多態(tài)性。IS6110的重組及其它具有相似序列的基因重組和缺失可能是LSP產(chǎn)生的兩個(gè)重要機(jī)制[11]。分枝桿菌基因組中的LSP大小一般為105bp到11 985bp。LSP很可能是MTBC大程度遺傳變異與表型變異的重要原因之一。目前LSP是作為進(jìn)化研究的主要分子標(biāo)識(shí)。Alland 等[11]將 Fleischmann等[12]通過基因組 比對(duì)分析所確定的17個(gè)LSP劃分為3組,并認(rèn)為其中包括4個(gè) LSP(LSP 1、9、13、16)的 A 組是用于結(jié)核分枝桿菌進(jìn)化研究較好的分子標(biāo)識(shí)。
2.4 直接重復(fù)片段 (Direct repeats,DR) 直接重復(fù)片段是僅出現(xiàn)于結(jié)核分枝桿菌復(fù)合群中,大小為36bp的DNA片段,被35~41bp的間隔區(qū)(spacer)分隔開。一個(gè)直接重復(fù)片段和一個(gè)間隔區(qū)共同組成了一個(gè)直接可變重復(fù)單元(direct variant repeats,DVR),多個(gè) DVR組成整個(gè) DR 區(qū)[13]。DR區(qū)被認(rèn)為是結(jié)核分枝桿菌進(jìn)化研究的重要染色體結(jié)構(gòu)域。Fang等[9]認(rèn)為DR區(qū)的進(jìn)化主要是由DVR的缺失及IS6110引起的突變等介導(dǎo)。
2.5 可變數(shù)目串聯(lián)重復(fù)序列(Variable number tandem repeat,VNTR) 可變數(shù)目串聯(lián)重復(fù)序列是存在于基因組中大小為40~100bp的串聯(lián)重復(fù)序列。VNTR屬于小衛(wèi)星序列,由中間的核心區(qū)和外圍的側(cè)翼區(qū)兩部分組成,其側(cè)翼序列具有高度的保守性[14]。不同的VNTR在不同的結(jié)核分枝桿菌中重復(fù)單元的拷貝數(shù)存在差異,具有高度的多態(tài)性。目前已發(fā)現(xiàn)48個(gè)VNTR位點(diǎn),其中有明顯多態(tài)性的位點(diǎn)有12個(gè)[15]。Smittipat等[15]對(duì)其研究的48個(gè)VNTR位點(diǎn)分析后發(fā)現(xiàn),大多數(shù)VNTR都出現(xiàn)于結(jié)核分枝桿菌的非編碼區(qū)或基因間隔區(qū),有趣的是編碼區(qū)的串聯(lián)重復(fù)序列都多變,并編碼多態(tài)性蛋白,這種多態(tài)性蛋白可能在結(jié)核分枝桿菌逃避宿主免疫屏障過程中發(fā)揮重要的作用。
3.1 單核苷酸多態(tài)性分析
3.1.1 管家基因SNP分析 管家基因的變異能夠?yàn)樯镞M(jìn)化提供重要信息。管家基因SNP相關(guān)進(jìn)化研究是一種PCR與DNA測(cè)序相結(jié)合的方法,利用PCR擴(kuò)增管家基因片段,應(yīng)用DNA測(cè)序儀確定并驗(yàn)證不同菌株管家基因中的SNP,進(jìn)而針對(duì)不同結(jié)核分枝桿菌管家基因的SNP應(yīng)用生物信息學(xué)軟件進(jìn)行相關(guān)進(jìn)化分析。這種方法相對(duì)省時(shí)、省力、較為經(jīng)濟(jì),但是由于管家基因高度保守,提供的變異信息較為有限,因此這種進(jìn)化分析結(jié)果不夠全面。
3.1.2 全基因組多SNP位點(diǎn)分析 隨著基因組測(cè)序技術(shù)的發(fā)展,人類獲得越來越多微生物的全基因組序列,基因組序列比對(duì)分析提示出更全面的SNP信息。針對(duì)新的SNP信息,科學(xué)家開始了基于基因組內(nèi)多個(gè)SNP位點(diǎn)的進(jìn)化分析。如:Filliol和Gutacker等[16-17]選擇來自于不同國(guó)家地區(qū)的實(shí)驗(yàn)菌株,通過比較基因組學(xué)及分子生物學(xué)的方法確定并驗(yàn)證用于進(jìn)化分析的SNP,根據(jù)不同菌株SNP的信息,應(yīng)用生物信息軟件開展進(jìn)化分析。這種方法不僅可以迅速、明確地將處于系統(tǒng)發(fā)育樹不同位置的菌株劃分為不同基因簇,并且為其毒力、感染性等生物醫(yī)學(xué)相關(guān)的特性構(gòu)建了基因框架。
3.2 基因缺失分析 基因缺失分析即應(yīng)用PCR或自動(dòng)基因芯片技術(shù)及DNA測(cè)序相結(jié)合的方法以確定并驗(yàn)證不同菌株的基因組某一區(qū)域缺失情況,并利用分子生物學(xué)軟件進(jìn)行相應(yīng)分析?;蛉笔Х治瞿壳笆墙Y(jié)核分枝桿菌進(jìn)化研究的主要方法之一。常用于缺失分析的區(qū)域?yàn)樽儺悈^(qū)(regions of difference,RD)區(qū)。除RD區(qū)外,重復(fù)序列的缺失分析也是結(jié)核分枝桿菌分子進(jìn)化研究的方法之一。如:Arnold等[18]根據(jù)VNTR及DR區(qū)spacer的缺失情況并結(jié)合katG、gyrA和gyrB基因的SNP分析結(jié)果繪制了結(jié)核分枝桿菌遺傳事件發(fā)生的時(shí)間表,清晰的顯示了MTBC各成員如何從共同祖先進(jìn)化而來。
3.3 IS6110-熒光標(biāo)記擴(kuò)增片段長(zhǎng)度多態(tài)性分析曾被認(rèn)為是結(jié)核分枝桿菌分子分型金標(biāo)準(zhǔn)的方法是IS6110限制性片斷長(zhǎng)度多態(tài)性[IS6110-RFLP(restriction fragment length polymorphism)]分析,但因影響IS6110轉(zhuǎn)座的因素較復(fù)雜、數(shù)據(jù)分析較繁瑣等原因,使IS6110-RFLP在結(jié)核分枝桿菌的進(jìn)化研究中一直受到限制。最近Thorne等[19]的研究表明以IS6110-targetting PCR為基礎(chǔ)的一種優(yōu)于IS6110-RFLP的分型方法,IS6110-熒光標(biāo)記擴(kuò)增片段長(zhǎng)度多態(tài)性[IS6110-fAFLP (fluorescent amplified fragment length polymorphism)]分析可以用于現(xiàn)代結(jié)核分枝桿菌菌株的系統(tǒng)發(fā)育研究。IS6110-fAFLP基本操作方法為:首先,選用限制性內(nèi)切酶MseⅠ、TaqⅠ等將菌株全基因組酶切消化;然后,將消化后DNA加入到含有TaqⅠ特異性接頭的連接液中進(jìn)行連接反應(yīng);連接反應(yīng)結(jié)束后進(jìn)行特異的PCR擴(kuò)增。擴(kuò)增后的特異片段加樣于ABi 3130xl基因分析儀中并應(yīng)用GeneMapper v4.0進(jìn)行分析。分析后的片段作為有效數(shù)據(jù)并運(yùn)用BioN-umerics version 4.5構(gòu)建系統(tǒng)發(fā)育樹[19-20]。這種方法對(duì)Haarlem、LAM、X、T、S等不同基因型都有較好的分辨能力。但不適用于IS6110低拷貝數(shù)的古典型菌株。
3.4 間隔寡核苷酸分型和多位點(diǎn)數(shù)目可變串聯(lián)重復(fù)序列分析 間隔寡核苷酸分型(spacer oligonucleotide typing,Spoligotyping)和多位點(diǎn)數(shù)目可變串聯(lián)重復(fù)序列分析(multiple locus VNTR analysis,MLVA)是目前國(guó)際上用于結(jié)核分枝桿菌快速分型的兩種方法,在結(jié)核分枝桿菌的分子進(jìn)化研究中常作為輔助方法與其他分子進(jìn)化研究方法聯(lián)合應(yīng)用以提供實(shí)驗(yàn)菌株的基因分型信息并豐富進(jìn)化研究結(jié)果。如:Gutacker 等[17]將 Spoligotyping、MLVA、IS6110分析與基于SNP的系統(tǒng)發(fā)育分析結(jié)合起來,不僅將結(jié)核分枝桿菌劃分為9大基因簇,并且揭示了結(jié)核分枝桿菌穩(wěn)固的種群結(jié)構(gòu)。
4.1 結(jié)核分枝桿菌與牛分枝桿菌的進(jìn)化關(guān)系 結(jié)核分枝桿菌與牛分枝桿菌是引起人類結(jié)核病的兩大病原菌,二者的進(jìn)化關(guān)系一直是科學(xué)家爭(zhēng)論的焦點(diǎn)。Stead等[21]曾認(rèn)為結(jié)核分枝桿菌是由牛分枝桿菌進(jìn)化而來的。然而,比較基因組學(xué)分析表明,結(jié)核分枝桿菌不可能直接來源于牛分枝桿菌[22],Brosch等[4]開展的系統(tǒng)發(fā)育研究較深入的構(gòu)建了MTBC的進(jìn)化結(jié)構(gòu),他推測(cè):牛分枝桿菌、田鼠分枝桿菌及非洲分枝桿菌在TbD1出現(xiàn)之前就從現(xiàn)代結(jié)核分枝桿菌的祖先中分化了出來,牛分枝桿菌與結(jié)核分枝桿菌相比,存在更多的缺失基因,進(jìn)一步證實(shí)牛分枝桿菌是比結(jié)核分枝桿菌更為年輕的致病菌。
4.2 結(jié)核分枝桿菌的年齡 在結(jié)核分枝桿菌的研究中,許多科學(xué)家試圖應(yīng)用分子鐘去追溯結(jié)核分枝桿菌的年齡,但結(jié)核分枝桿菌存在著多態(tài)性的進(jìn)化標(biāo)識(shí)物,如插入序列、SNP等,各自有著不同的進(jìn)化速度。所以,基于不同分子鐘的進(jìn)化研究常得出不同的結(jié)論。如:Hughes等[23]認(rèn)為 H37Rv和CDC1551的共同祖先可能有著3.4萬~3.8萬年的歷史。但Kapur等[24]認(rèn)為結(jié)核分枝桿菌約有1.5萬年的歷史。Smith等[25]認(rèn)為應(yīng)用分子鐘最重要的是區(qū)分突變、多態(tài)性和置換的概念。在最近的共同祖先出現(xiàn)之前,結(jié)核分枝桿菌已感染人類千百年,甚至更長(zhǎng)時(shí)間,但是一些古老譜系已從現(xiàn)代種群中消失,因此分子水平的年代推定并不能夠提示結(jié)核分枝桿菌與人類共同進(jìn)化的時(shí)間。
4.3 三大基因群的劃分 Sreevatsan等[2]進(jìn)行的基于katG463和gyrA95兩個(gè)管家基因SNP情況的進(jìn)化研究是結(jié)核分枝桿菌較為重要的進(jìn)化研究之一。這項(xiàng)研究將MTBC劃分為3大基因群:group1、2和3。其中,group1中除了包括部分結(jié)核分枝桿菌外,還包括了牛分枝桿菌、田鼠分枝桿菌和非洲分枝桿菌。Sreevatsan等[2]認(rèn)為group1內(nèi)的菌株與group2和3內(nèi)的菌株相比具有更高水平的基因變異,可能經(jīng)歷了更長(zhǎng)時(shí)間的進(jìn)化過程,即更為古老。
4.4 六大SNP聚集群(SNP cluster groups,SCGs)的劃分 Filliol等[16]基于SNP的分析,將結(jié)核分枝桿菌分為六大SNP聚集群即SCG-1、SCG-2、SCG-3、SCG-4、SCG-5和 SCG-6六大深支,并將SCG-3和 SCG-6進(jìn)一步劃分為 SCG-3a、SCG-3b、SCG-3c、SCG-6a和SCG-6b五個(gè)亞群。這一結(jié)果有力地支持了Sreevatsan等人提出的3大基因群的觀點(diǎn)。Spoligotyping分型確定的主要基因型的分布情況如下:EAI基因型主要分布于SCG-1;Beijing基因型主要分布于SCG-2;CAS(Central Asian)基因型部分分布于SCG-3a;X基因型主要分布于SCG-3c和SCG-4。
近年來國(guó)內(nèi)外已經(jīng)開展了許多有關(guān)結(jié)核分枝桿菌及MTBC分子進(jìn)化方面的研究。在結(jié)核分枝桿菌分子標(biāo)識(shí)的進(jìn)化方式、菌株進(jìn)化模式和種群劃分等方面取得了不俗的研究成果。通過這些研究不僅使我們了解了不同結(jié)核分枝桿菌菌株間毒力差異機(jī)制,為抗結(jié)核藥物和疫苗的研發(fā)提供了理論支持;在流行病學(xué)方面,也提供了傳播模式和感染模式的信息,為結(jié)核病預(yù)防、控制策略的制定與實(shí)施提供了重要參考。盡管如此,尋求更為穩(wěn)定的進(jìn)化標(biāo)識(shí)、高致病性菌株北京基因型的溯源、毒力進(jìn)化研究、進(jìn)化與免疫機(jī)制關(guān)聯(lián)研究都是我們未來需要努力的方向。
[1]王睿,李聰然,梁蓓蓓,等.非結(jié)核分枝桿菌感染特點(diǎn)與藥物選擇研究進(jìn)展[J].國(guó)際呼吸雜志,2006,26(4):280-282.
[2]Sreevatsan S,Pan X,Stockbauer KE,et al.Restricted structural gene polymorphism in the Mycobacterium tuberculosis complex indicates evolutionarily recent global dissemination[J].Proc Natl Acad Sci U S A,1997,94(18):9869-9874.
[3]Gutacker MM,Smoot JC,Migliaccio CA,et al.Genome-wide analysis of synonymous single nucleotide polymorphisms in Mycobacterium tuberculosis complex organisms:resolution of genetic relationships among closely related microbial strains[J].Genetics,2002,162(4):1533-1543.
[4]Brosch R,Gordon SV,Marmiesse M,et al.A new evolutionary scenario for the Mycobacterium tuberculosis complex[J].Proc Natl Acad Sci U S A,2002,99(6):3684-3689.
[5]Cole ST.Learning from the genome sequence of Mycobacterium tuberculosis H37Rv[J].FEBS Lett,1999,452(1-2):7-10.
[6]Fabre M,Koeck JL,Le Fleche P,et al.High genetic diversity revealed by variable-number tandem repeat genotyping and analysis of hsp65gene polymorphism in a large collection of"Mycobacterium canettii"strains indicates that the M.tuberculosis complex is a recently emerged clone of"M.canettii"[J].J Clin Microbiol,2004,42(7):3248-3255.
[7]Gutierrez MC,Brisse S,Brosch R,et al.Ancient origin and gene mosaicism of the progenitor of Mycobacterium tuberculosis[J].PLoS Pathog,2005,1(1):e5.
[8]Thierry D,Brisson-Noel A,Vincent-Levy-Frebault V,et al.Characterization of a Mycobacterium tuberculosis insertion sequence,IS6110,and its application in diagnosis[J].J Clin Microbiol,1990,28(12):2668-2673.
[9]Fang Z,Morrison N,Watt B,et al.IS6110transposition and evolutionary scenario of the direct repeat locus in a group of closely related Mycobacterium tuberculosis strains[J].J Bacteriol,1998,180(8):2102-2109.
[10]McEvoy CR,F(xiàn)almer AA,Gey van Pittius NC,et al.The role of IS6110in the evolution of Mycobacterium tuberculosis[J].Tuberculosis(Edinb),2007,87(5):393-404.
[11]Alland D,Lacher DW,Hazbon MH,et al.Role of large sequence polymorphisms(LSPs)in generating genomic diversity among clinical isolates of Mycobacterium tuberculosis and the utility of LSPs in phylogenetic analysis[J].J Clin Microbiol,2007,45(1):39-46.
[12]Fleischmann RD,Alland D,Eisen JA,et al.Whole-genome comparison of Mycobacterium tuberculosis clinical and laboratory strains[J].J Bacteriol,2002,184(19):5479-5490.
[13]van Embden JD,van Gorkom T,Kremer K,et al.Genetic variation and evolutionary origin of the direct repeat locus of Mycobacterium tuberculosis complex bacteria[J].J Bacteriol,2000,182(9):2393-2401.
[14]Supply P,Mazars E,Lesjean S,et al.Variable human minisatellite-like regions in the Mycobacterium tuberculosis genome[J].Mol Microbiol,2000,36(3):762-771.
[15]Smittipat N,Billamas P,Palittapongarnpim M,et al.Polymorphism of variable-number tandem repeats at multiple loci in Mycobacterium tuberculosis[J].J Clin Microbiol,2005,43(10):5034-5043.
[16]Filliol I,Motiwala AS,Cavatore M,et al.Global phylogeny of Mycobacterium tuberculosis based on single nucleotide polymorphism (SNP)analysis:insights into tuberculosis evolution,phylogenetic accuracy of other DNA fingerprinting systems,and recommendations for a minimal standard SNP set[J].J Bacteriol,2006,188(2):759-772.
[17]Gutacker MM,Mathema B,Soini H,et al.Single-nucleotide polymorphism-based population genetic analysis of Mycobacterium tuberculosis strains from 4geographic sites[J].J Infect Dis,2006,193(1):121-128.
[18]Arnold C,Thorne N,Underwood A,et al.Evolution of short sequence repeats in Mycobacterium tuberculosis[J].FEMS Microbiol Lett,2006,256(2):340-346.
[19]Thorne N,Borrell S,Evans J,et al.IS6110-based global phylogeny of Mycobacterium tuberculosis[J].Infect Genet Evol,2011,11(1):132-138.
[20]Thorne N,Evans JT,Smith EG,et al.An IS6110-targeting fluorescent amplified fragment length polymorphism alternative to IS6110restriction fragment length polymorphism analysis for Mycobacterium tuberculosis DNA fingerprinting[J].Clin Microbiol Infect,2007,13(10):964-970.
[21]Stead WW.The origin and erratic global spread of tuberculosis.How the past explains the present and is the key to the future[J].Clin Chest Med,1997,18(1):65-77.
[22]Gordon SV,Brosch R,Billault A,et al.Identification of variable regions in the genomes of tubercle bacilli using bacterial artificial chromosome arrays[J].Mol Microbiol,1999,32(3):643-655.
[23]Hughes AL,F(xiàn)riedman R,Murray M.Genomewide pattern of synonymous nucleotide substitution in two complete genomes of Mycobacterium tuberculosis[J].Emerg Infect Dis,2002,8(11):1342-1346.
[24]Kapur V,Whittam TS,Musser JM.Is Mycobacterium tuberculosis 15,000years old?[J].J Infect Dis,1994,170(5):1348-1349.
[25]Smith NH,Hewinson RG,Kremer K,et al.Myths and misconceptions:the origin and evolution of Mycobacterium tuberculosis[J].Nat Rev Microbiol,2009,7(7):537-544.