,,,,
近年來學者對于棘球絳蟲的分類做了大量研究,由于棘球絳蟲具有獨特的繁殖方式:成蟲雌雄同體,以自體受精為主;中絳期為無性繁殖。這種雙向發(fā)育和繁殖模式造就了棘球絳蟲的生物多樣性,加速了遺傳一致性種群的形成[1],目前至少有10種亞種的報道,學者們通過分析細粒棘球絳蟲mtDNA全基因組序列,將細粒棘球絳蟲 G1-G3基因型歸為狹義細粒棘球絳蟲(Echinococcusgranulosussensustricto)、G4基因型歸為馬棘球絳蟲(Echinococcusequinus、G5基因型歸為奧式棘球絳蟲(Echinococcusortleppi)、G6-G10基因型歸為加拿大棘球絳蟲(Echinococcuscanadensis)及細粒棘球絳蟲獅子株歸為獅棘球絳蟲(Echinococcusfelidis)[2]。但不少亞種能否單獨存在尚存在爭議。線粒體基因是典型的母性遺傳,因其具有結構簡單穩(wěn)定、無重組、易分離純化、由于受到線粒體內氧化環(huán)境的影響而容易發(fā)生突變,因此其進化速率快,是研究寄生蟲分子進化的理想工具。在構建親緣關系相近物種的進化樹時比使用核 DNA序列更有優(yōu)勢。利用不同蟲株(基因型)在幼蟲形態(tài)、致病性、宿主范圍、流行病學意義等方面存在的差異,通過分析線粒體基因的種類和數(shù)量、遺傳密碼子進化、同義密碼子使用、RNA轉錄成熟機制及堿基組成的偏向性、基因重疊及重排現(xiàn)象等問題[3],能反映寄生蟲的不同進化路線,因而被廣泛用于生物間系統(tǒng)起源、演化、分類及親緣關系的研究[4]。同時對疫苗、診斷試劑及抗蟲藥物的研制和開發(fā)具有重要意義[5-6]。本研究通過分析棘球屬絳蟲線粒體基因組序列的基因結構、堿基組成、遺傳密碼子及分子系統(tǒng)發(fā)育,以期為種系鑒定提供理論參考。
1.1序列獲取 從NCBI GenBank數(shù)據(jù)庫下載棘球屬絳蟲線粒體基因組DNA全序列,包括多房棘球絳蟲(Echinococcusmultilocularis,Em)、福氏棘球絳蟲(Echinococcusvogeli,Ev)、少節(jié)棘球絳蟲(Echinococcusoligarthrus,Eo)、獅棘球絳蟲(Echinococcusfelidis,Ef)、石渠棘球絳蟲(Echinococcusshiquicus,Es)及細粒棘球絳蟲(Echinococcusgranulosus,Eg)多個蟲株(G1、EchinococcusequinusG4、EchinococcusortleppiG5、EchinococcuscanadensisG6、EchinococcuscanadensisG7、EchinococcuscanadensisG8、EchinococcuscanadensisG10),并以豬帶絳蟲(Taenia solium,Ts)作為外類群。
1.2mtDNA的組成及排列使用OGDRAW(https://chlorobox.mpimp-golm.mpg.de/OGDraw.html)在線分析網站及Vector NTI Express軟件。
1.3序列分析及分子進化樹的構建 用Clust-X軟件對多個相似序列進行多重序列比對分析。使用Mega4.0軟件選擇鄰接法(Neighbor-joining method,NJ)構建進化樹,并做Bootstrap檢驗,重復次數(shù)設置為10000,選擇Bootstrap檢驗。密碼子使用情況使用Mega4.0軟件分析。
1.4核糖體基因分析及二級結構預測 l-rRNA和s-rRNA二級結構預測使用RNAfold在線預測網站(http://rna.tbi.univie.ac.at//cgibin/RNAWebSuite/RNAfold.cgi),選擇minimum free energy (MFE) and partition function算法。
2.1線粒體基因組基因的組成及排列 除Eg G1外,棘球絳蟲屬線粒體基因組有36個編碼基因,包括22個轉運RNA基因、12個蛋白基因、2個核糖體RNA基因。其中Eo、Es、Ev、Eg G1、Eg G4、Ef線粒體ND4L-ND4基因基因序列存在2-30 bp序列的重疊?;蚺帕写涡驗椋簍rnY-trnL-trnS-trnL-trnR-ND5-trnG-COX3-trnH-CYTB-ND4L-ND4-trnQ-trnF-trnM-ATP6-ND2-trnV-trnA-trnD-ND1-trnN-trnP-trnI-trnK-ND3-trnS-trnW-COX1-trnT-rrnL-trnC-rrnS-COX2-trnE-ND6。但Eg G1線粒體基因組最小,只有30個編碼基因,在起始編碼區(qū)缺少6個編碼轉運RNA(trnY-trnL-trnS-trnL-trnR-trnG)的基因。且第一個編碼基因不是ND5,而是COX3,ND5變?yōu)樽詈笠粋€。Em、EgG1 mtDNA全序列見圖1、圖2。
圖1 多房棘球絳蟲線粒體基因組全基因組序列Fig.1 Echinococcus multilocularis mitochondrion, complete genome
2.2棘球屬絳蟲線粒體基因組的蛋白基因核苷酸序列變異位點分析 12種棘球屬絳蟲線粒體基因組的蛋白基因核苷酸序列變異位點分析結果顯示,蛋白基因核苷酸序列變異率為27.9%~42.7%,其中COX1最為保守,這也是在棘球屬種系鑒定中常選擇COX1基因作為分子標記物的原因之一,其次為ND3、COX2變異率分別為27.9%、29.7%,另外ND4、ATP6、ND6、ND5基因進化速率較快,其中以ND5變異率最大達到42.7%,因此,ND4、ATP6、ND6、ND5基因也可以作為COX1基因的輔助分子標記(表1)。
表1 棘球屬絳蟲線粒體基因組的蛋白編碼基因核苷酸序列變異位點分析Tab.1 Nucleotide sequence variation of protein-coding genes in mitochondrial genome of Echinococcus genus
2.3轉錄密碼子使用情況 與大多數(shù)真核生物一樣,棘球屬線蟲線粒體蛋白基因起始密碼子主要為atg,但也有一些蛋白質以gtg作為起始密碼子,COX2在12種棘球屬絳蟲中均以gtg作為起始密碼子,有些蛋白質只在部分蟲株中以gtg作為起始密碼,例如ND4L、ND4、ND2、ND1。終止密碼子以taa和tag常見,但也有以ttt作為終止密碼子(表2)。
表2 棘球屬絳蟲線粒體編碼蛋白基因起始密碼子和終止密碼子Tab.2 Initiation codon and termination codon of mitochondrial protein gene in Echinococcus genus
2.4蛋白翻譯密碼子使用情況 棘球絳蟲屬使用的密碼子為棘皮類和扁形蟲線粒體密碼(transl_table=9),與標準密碼子表的區(qū)別為:在標準密碼子表中AAA編碼Lys,AGA、AGG編碼Arg,UGA為終止密碼子,而棘球屬絳蟲中AAA編碼Asn,AGA、AGG編碼Ser,UGA編碼Trp。在棘球屬絳蟲中編碼氨基酸的密碼子使用頻率最高的是UUG(2.72%),頻率最低的是CUC(1%)、CGC(1%),編碼亮氨酸 L(UUA、UUG、CUU、CUC、CUA、CUG)、精氨酸R(CGU、CGC、CGA、CGG、AGA、AGG)的密碼子最多達6個,編碼甲硫氨酸M(AUG)、色氨酸W(UGG)最少只有1個。亮氨酸 L也是棘球屬絳蟲最偏好的氨基酸達到6%(表3)。
表3 蛋白編碼密碼子使用情況Tab.3 Protein coding codon usage
2.5核糖體(rRNA)基因的二級結構 棘球屬絳蟲核糖體基因有兩個分別為l-rRNA及s-rRNA,長度大小分別為977~985 bp、700~727 bp,兩個基因的位置十分靠近中間只隔一個trnC基因。通過RNAfold在線預測網站預測棘球絳蟲rRNA結構類似,形成較多的莖環(huán)結構。多房棘球絳蟲rRNA結構見圖3。
s-rRNAl-rRNA
2.6線粒體基因組序列系統(tǒng)進化分析 基于12種棘球絳蟲線粒體基因組全序列,以T.s作為外類群,使用鄰接法構建系統(tǒng)進化樹。由圖5可以看出Ev、Eo單獨為一枝,Em、Es及Eg G1、Ef形成姐妹枝。細粒棘球絳蟲G4、G5、G6、G7、G8、G10亞型聚為一枝,進化距離較近(見圖4)。
圖4 棘球屬絳蟲系統(tǒng)發(fā)育樹Fig.4 Phylogenetic tree of Echinococcus genus
目前棘球屬絳蟲種及亞種的分類存在著爭議,自從多房棘球絳蟲、少節(jié)棘球絳蟲、福氏棘球絳蟲立為獨立種之后,爭論漸趨平息,目前比較公認的棘球屬絳蟲共有4種,但近年,我國學者肖寧等先后從高原鼠兔(Ochotonacurzoniae)和藏狐(Vulpesferrilata)分離出一種棘球絳蟲,其成蟲和幼蟲形態(tài)、分子遺傳特點、寄生宿主范圍和地理分布、物種進化等方面與其他棘球屬絳蟲存在較大差異,具備種間差異條件,并以其首次發(fā)現(xiàn)地——四川石渠縣命名為石渠棘球絳蟲[7-8]。但其能否作為新的種還存在許多疑點,石渠棘球絳蟲是否為細粒棘球絳蟲或多房棘球絳蟲在非適宜宿主中適應性的改變不得而知。由于棘球屬絳蟲特別是細粒棘球絳蟲種內變異現(xiàn)象非常普遍[9],根據(jù)線粒體COX1和NAD1基因部分序列的差異,細粒棘球絳蟲分為G1-G10 10種不同基因型[1,10-12]。
隨著新的寄生宿主[13]及生物學特征[14]被發(fā)現(xiàn),這樣的分類依然不盡完善,因此本研究通過分析12種報道的棘球屬絳蟲的線粒體基因組序列,為深入了解棘球屬絳蟲,本文從棘球屬絳蟲線粒體基因組序列堿基組成、基因結構與排列、密碼子使用及偏好、系統(tǒng)發(fā)育等進行分析。通過分析發(fā)現(xiàn)棘球屬線粒體主要有三部分組成包括22個轉運RNA基因、12個蛋白基因、2個核糖體RNA基因,但E.g G1 線粒體基因組發(fā)生了重排,只有30個編碼基因,且第一個編碼基因不是ND5,而是COX3,ND5變?yōu)樽詈笠粋€,重排是種系進化中的稀有事件,重排的規(guī)律性可為重建物種演化歷史提供重要信息。且E.g G1缺少6個編碼轉運RNA,無法轉運酪氨酸、亮氨酸、絲氨酸、精氨酸、甘氨酸,這些氨基酸可能有其他轉運RNA轉運或由宿主提供。
目前對于棘球屬絳蟲基因型分類常用的工具包括核基因和mtDNA,核基因主要包括核糖體DNA第一、二內轉錄間隔區(qū)基因ITSl、ITS2,肌動蛋白III,延長因子1A,轉化生長因子,硫氧還蛋白過氧化物酶,鈣網蛋白,疏水性類彈性蛋白,抗原B 1,Eg9和Eg16等,而線粒體基因主要有cox1、nad1、nad2,nad3、cytb、ATP6、12s rRNA和16s rRNA等[15-16],一般認為線粒體基因序列進化較快,種系發(fā)育關系分析方面比核基因更有效,隨著近年來學者們對于棘球屬線粒體基因測序數(shù)據(jù)的不斷積累,棘球絳蟲mtDNA數(shù)據(jù)庫較核基因更完善,在棘球屬絳蟲分類中更具有優(yōu)勢[17]。本研究通過多序列比較也發(fā)現(xiàn),12個線粒體基因編碼的基因中COXⅠ最為保守,ND5變異率最大達到42.7%,另外ND4、ATP6、ND6基因進化速率較快,提示除COXⅠ基因外,ND4、ATP6、ND6、ND5也可輔助作為棘球絳蟲鑒定的分子標記。
同時,棘球絳蟲屬寄生蟲缺少高等生物擁有的ATP8基因,這可能是棘球屬絳蟲在寄生的環(huán)境中丟棄了部分“無用”的基因[18],進化為更高級的生存方式,這一點在多房棘球絳蟲生長特性中表現(xiàn)得更為明顯,因為在中間宿主人中無法找到蟲體,僅有一層叫生發(fā)層的細胞即可實現(xiàn)無限增殖,在寄生蟲疾病中極為罕見[19];起始密碼中除以atg作為起始密碼外,一些進化較快的基因例如COX2及ND部分亞基還以gtg作為起始密碼,終止密碼子中甚至有以ttt作為終止密碼的。如此一個基因的終止密碼中的堿基也可能是另一個基因的起始密碼中的堿基,使得線粒體堿基的利用度達到最大,結構更為緊湊。棘球絳蟲屬使用頻率最高的蛋白編碼密碼子是UUG,頻率最低的是CUC和CGC,編碼亮氨酸、精氨酸的密碼子最多達6個,而編碼甲硫氨酸(AUG)、色氨酸(UGG)最少只有1個。亮氨酸也是棘球屬絳蟲最偏好的氨基酸達到6%,這也反映出棘球屬絳蟲對于氨基酸具有明顯的偏好性。
使用鄰接法構建系統(tǒng)進化樹可以看出E.v、E.o單獨為一枝,E.m、E.s及E.g G1、E.f形成姐妹枝,細粒棘球絳蟲G4、G5、G6、G7、G8、G10亞型聚為一枝,進化距離較近,這與Wassermann M等人的研究結果較為一致[20]。在發(fā)現(xiàn)石渠棘球絳蟲前,因其形態(tài)學上與Em相近似,則被誤認為是多房棘球絳蟲的變異種,由線粒體進化距離上看兩者親緣關系也較近??傊?,利用線粒體基因研究棘球絳蟲系統(tǒng)起源、演化、分類及親緣關系,離不開對于線粒體基因的充分了解,通過本文分析期望能為進一步認識棘球屬線粒體基因組提供一定的參考。