王奇惠,時永強,祝 宇,張賽飛,朱立力,曲偉杰
(云南農(nóng)業(yè)大學(xué)動物科學(xué)技術(shù)學(xué)院,云南昆明 650201)
?
一株金黃色葡萄球菌小菌落突變株全基因組測序分析
王奇惠,時永強,祝 宇,張賽飛,朱立力,曲偉杰*
(云南農(nóng)業(yè)大學(xué)動物科學(xué)技術(shù)學(xué)院,云南昆明 650201)
對金黃色葡萄球菌小菌落突變株(small colony mutant strainsStaphylococcusaureus,SASCVs)和CP000253.1基因組差異進行了研究,為后續(xù)研究金葡菌分泌抗藥物相關(guān)物質(zhì)能力提供數(shù)據(jù)支持。對一株金葡菌小菌落突變株進行全基因組測序,并與CP000253.1參考序列進行序列比較。結(jié)果顯示,金葡菌SCVs的文庫插入片段為350 bp,測序讀長為150 bp,SCVs的原始數(shù)據(jù)量為551 Mb,SCVs的堿基含量分布在處理前后有所不同,通過重測序,存在單核苷酸多態(tài)性(SNP)的數(shù)量較大。金葡菌SCVs與CP000253.1參考序列之間存在明顯的序列差異,該數(shù)據(jù)為研究金葡菌感染奶牛乳房炎提供了一定的序列依據(jù)。
金葡菌小菌落突變株;基因序列差異;全基因組測序;單核苷酸多態(tài)性
奶牛乳房炎是奶牛最常見的疾病之一[1-2]。由金黃色葡萄球菌(Staphylococcusaureus)所引起的奶牛慢性乳房炎一直制約著我國奶牛養(yǎng)殖業(yè)的發(fā)展。細(xì)菌小菌落突變株(small colony variants,SCVs)于1910年首次被報道,當(dāng)時分離的一株SCVs被認(rèn)為是一種異常傷寒菌,后來被證實這株SCVs屬于腸傷寒沙門菌。在臨床上,SCVs 比相應(yīng)的野生株更能持續(xù)存在于哺乳動物的細(xì)胞中,并且對抗生素不敏感,當(dāng)宿主細(xì)胞形成應(yīng)急保護性的環(huán)境時,SCVs會引起隱性或者復(fù)發(fā)性感染。在許多細(xì)菌種屬中都發(fā)現(xiàn)有SCVs,但葡萄球菌SCVs研究的相對較少,尤其是金黃色葡萄球菌(簡稱金葡菌)。金葡菌 SCVs 的獨特表型與持續(xù)復(fù)發(fā)性感染之間的聯(lián)系在20世紀(jì)90年代中期才被認(rèn)知[3-7]。近幾年來,金葡菌SCVs可致人和動物嚴(yán)重感染。國內(nèi)外相繼報道了一類具有特殊表型的金葡菌小菌落突變株[4](small colony mutant strainsStaphylococcusaureus,SASCVs),并證明了它們與金葡菌感染所致奶牛慢性乳房炎的關(guān)系非常密切,這無疑為研究該病的詳細(xì)致病機制提供了新的思路[5-6]。
全基因組測序是對已經(jīng)公布了其基因組序列的物種進行其他個體的基因組測序,并在此基礎(chǔ)上針對個體或群體進行差異性等分析[7]。全基因組測序的個體,通過把其測序的短序列比對到已知的基因組上,檢測出全基因組上大量的單核苷酸多態(tài)性位點(SNP,插入缺失位點(In Del、結(jié)構(gòu)變異位點(SV)位點等[8-9]?;谧儺愇稽c數(shù)據(jù),通過生物信息手段,分析不同個體或群體基因組間的結(jié)構(gòu)差異,同時完成注釋[11-13]。
為了研究金葡菌SCVs的基因組序列情況,應(yīng)用第2代測序方法[10]對1株金葡菌SCVs的基因組序列進行了全基因組測序,并比較其與CP000253.1參考序列差異,旨在發(fā)現(xiàn)金葡菌SCVs菌株特有的序列特征,為研究不同來源金葡菌之間功能的差異提供基礎(chǔ)[14]。
1.1 材料
金葡菌SCVs分離自無菌采集的患病奶牛的奶樣中,由本實驗室保存。營養(yǎng)瓊脂(10 g/L的胰蛋白酶,5 g/L的酵母粉,5 g/L的NaCl,15 g/L的瓊脂)培養(yǎng)基37℃有氧培養(yǎng)18 h~24 h。
1.2 方法
1.2.1 基因組DNA提取及測序 基因組DNA用Ge-nomic-Tip500/G試劑盒(Qiagen Inc.,Valencia,CA,USA)試劑盒提取,10 mmol/L Tris-鹽酸(pH8.5)重懸保存?zhèn)溆?,?jīng)超聲波破碎儀(Diageno-de SA,Liège,Belgium)處理(工作15 s,間隔90 s,重復(fù)3次),得到 DNA片段。使用Tru Seq DNA Sample Preparation試劑盒(Illumina Inc.,San Diego,CA,USA)構(gòu)建基因組文庫。
1.2.2 序列的比對和SNP分析 首先對原始數(shù)據(jù)進行過濾,提取高質(zhì)量的數(shù)據(jù)(clean data)與參考序列進行比對,其次根據(jù)比對情況檢測樣品的SNP,并對SNP結(jié)果注釋。
1.2.3 信息分析 數(shù)據(jù)處理,此步驟過濾測序質(zhì)量值低的reads,保留高質(zhì)量reads,過濾后的數(shù)據(jù)稱為clean data;然后與參考基因組進行比對,通過序列比對的方法,將得到的clean data與參考基因組進行序列比對分析;再進行SNP分析,根據(jù)比對情況檢測金葡菌SCVs的SNP,并對SNP結(jié)果注釋。
2.1 金葡菌SCVs菌株的全基因組測序結(jié)果
本研究利用第2代測序技術(shù),使用Hiseq PE150測序平臺對樣品進行測序,各樣品的數(shù)據(jù)經(jīng)過數(shù)據(jù)質(zhì)控,過濾低質(zhì)量的序列片段。詳細(xì)的質(zhì)控測序統(tǒng)計信息結(jié)果如下:SCVs的文庫插入片段(insert size)大小是350 bp(base pair,堿基對),測序長度(reads length)是150 bp:150 bp(冒號前后分別為read1和read2的長度)。SCVs的原始數(shù)據(jù)Raw data的數(shù)據(jù)量為551 Mb(Mega base pair,百萬堿基對),其中被過濾掉的reads占raw data總reads的2.05%,clean data的數(shù)據(jù)量為504 Mb,其中有效數(shù)據(jù)的GC含量為34.55%,有效數(shù)據(jù)的Q20值為97.35%,有效數(shù)據(jù)的Q30值為93.1%,有效數(shù)據(jù)的堿基含量分布情況見圖1。從SCVs的堿基含量分布圖中可以看出,處理前堿基含量分布和處理后堿基含量分布并沒有太大的差別。將雜質(zhì)處理掉后,圖中沒有明顯的變化,只有稍微些許變化。
應(yīng)用SAMtools軟件,以CP000253.1作為參考基因組,依照SNP和基因之間的位置關(guān)系及相互作用,對SNP功能進行注釋。通過對SCVs的SNP注釋結(jié)果統(tǒng)計(圖2),通過與CP000253.1參考序列進行比對,在SCVs中發(fā)現(xiàn)一共有16 946個SNP,其中位于CDs區(qū)域的非同義突變SNP為4 154個,同義突變SNP為9 854個(圖2A);而位于基因間區(qū)的SNP為2 938個。金葡菌SCVs中80%以上的SNP位于蛋白編碼區(qū)。相同的SNP中,有14 008個SNP位于編碼蛋白基因的區(qū)域,位于基因間區(qū)的SNP為2 938個(圖2B)。
比較金葡菌SCVs和CP000253.1參考序列前200個錯義突變頻率相對較高的基因發(fā)現(xiàn),有66個基因是完全相同的。前200個同義突變密度較高的基因中,有47個是完全相同的。然而,在同一個菌株中,前200個錯義突變顯著的基因和前200個同義突變顯著的基因間并沒有重疊。
A.處理前堿基含量分布;B.處理后堿基含量分布A.Base content distribution before processing ;B.Base content distribution after processing
2.4 相關(guān)基因的SNP分析
單核苷酸多態(tài)性(SNP)主要是指在基因組水平上由單個核苷酸的變異所引起的DNA序列多態(tài)性,包括單個堿基的轉(zhuǎn)換、顛換等。如表3中顯示,與CP000253.1參考序列基因組相比,金葡菌SCVs中和耐藥能力相關(guān)的氨基糖苷類耐藥基因的操縱子基因發(fā)生了明顯的序列變化,該操縱子的aac(6′)、aph(2″)、aph(3′)-Ⅲ基因發(fā)生較高頻率的錯義突變(都屬于前200的高錯義突變基因)。在金葡菌SCVs菌株中,aph(3′)-Ⅲ的錯義突變頻率在所有基因中最為顯著,約為1.59每100 bp,同義突變頻率為0.51每100 bp。
A.金葡菌SCVs菌株在編碼蛋白基因區(qū)域的分布情況;B.金葡菌SCVs菌株在不同基因組功能區(qū)域的分布情況;#Non_syn.位于CDS區(qū)域,非同義突變的SNP個數(shù);#Syn.位于CDS區(qū)域,非義突變的SNP個數(shù);#Intergenic.位于基因間區(qū)的SNP個數(shù)
編碼β-內(nèi)酞胺類耐藥基因的主要基因mecA的錯義突變頻率為0.40,qacA基因只發(fā)生了同義突變。金葡菌SCVs中另外一些與耐藥能力相關(guān)的基因aac(6′)和aph(2″) 也發(fā)生了顯著的錯義突變。進一步分析耐藥相關(guān)基因的轉(zhuǎn)錄因子基因ermB、nucA和ypbH序列變化情況,均未發(fā)現(xiàn)顯著的錯義改變(表1) 。
表1 金葡菌SCVs耐藥相關(guān)基因的SNP頻率(每100 bp)
通過采用SAMTOOLS進行個體SNP的檢測,全基因組及編碼區(qū)的轉(zhuǎn)換(transitions)和顛換(transversions)比例、雜合比率及SNP數(shù)目的統(tǒng)計結(jié)果是,與CP000253.1的參考序列進行比對,SNP檢測結(jié)果中,SCVs中轉(zhuǎn)換(ts)SNP為10 968個,顛換(tv)SNP為5 978個,SNP的轉(zhuǎn)換顛換率為1.83。所有的16 946個SNP中,雜合(Het)SNP為308,占參考序列基因組的0.01%,純合(Hom)SNP為16 638個,SNP在參考序列基因組上的密度(density)為6.01/Kb。
通過對金葡菌SCVs菌株的全基因組測序分析,表明金葡菌SCVs菌其基因組序列與實驗室菌株CP000253.1相比有很大的差異。研究發(fā)現(xiàn),與CP000253.1菌株相比,野生的金葡菌SCVs菌株在耐藥活性、生物膜形成[15]方面都有明顯不同。金葡菌SCVs相對于CP000253.1的基因突變率較高,尤其是錯義突變基因,暗示在基因組的水平上野生型的菌株相對于馴化的菌株有一些差異,這些差異可能導(dǎo)致了其功能上的差異。另外,跟馴化菌株相比,其耐藥的相關(guān)基因有十分明顯的序列的改變,這些改變可能影響蛋白質(zhì)的功能,進而有可能影響野生型菌株的耐藥能力。在自然的條件下,野生的菌株很難進行轉(zhuǎn)化,很多研究致力于提高野生菌株的轉(zhuǎn)化能力,比較野生型菌株與馴化菌株基因序列上的變化能為更好理解金葡菌SCVs菌株轉(zhuǎn)化能力提供了一種新的途徑[1]。同時,這些基因組的差異數(shù)據(jù)為后續(xù)研究金葡菌SCVs的相關(guān)物質(zhì)能力,提高奶牛乳房炎的治療方面的應(yīng)用提供更多的數(shù)據(jù)支持。參考文獻:
[1] 王 林,梅 力,韋海濤,等.北京地區(qū)奶牛隱性乳房炎金黃色葡萄球菌的分離鑒定及藥敏試驗[J].動物醫(yī)學(xué)進展,2015,36(4):124-127.
[2] 楊 峰,王 玲,王旭榮,等.金黃色葡萄球菌性奶牛乳房炎研究的知識圖譜分析[J].動物醫(yī)學(xué)進展,2016,37(2):38-44.
[3] Fan L,Bo S,Chen H,et al.Genome sequence ofBacillussubtilissubsp.spizizeniigtP20b,isolated from the Indian ocean[J].J Bacteriol,2011,193(5):1276
[4] 喻 鋼,田萬紅,董思國,等.2株枯草芽胞桿菌全基因組重測序分析[J].藥物分析雜志,2014,34(10):1907-1911.
[5] 吳三玲.半野生大豆(Glycine gracilis)基因組深度測序及其進化分析[D].浙江杭州:浙江大學(xué),2013.
[6] 張志斌,鄧映明,熊瑤瑤,等.東鄉(xiāng)野生稻內(nèi)生放線菌分離及菌株S123 次級代謝產(chǎn)物分析[J].微生物學(xué)通報,2015,42(9):1662-1670.
[7] 王琴翠.多粘類芽胞桿菌SC2的全基因組測序[D].山東濟南:山東農(nóng)業(yè)大學(xué),2011.
[8] 何偉明.基于重測序數(shù)據(jù)的群體SNP位點檢測及基因型判斷[D].廣東廣州:華南理工大學(xué),2013.
[9] 程廷才,林 平,金盛凱,等.家蠶黑胸敗血芽胞桿菌基因組測序及結(jié)構(gòu)分析和功能注釋[J].蠶業(yè)科學(xué),2014,40(6):1036-1043.
[10] 韓海格.馬銅綠假單胞菌全基因組重測序研究[D].內(nèi)蒙古呼和浩特:內(nèi)蒙古農(nóng)業(yè)大學(xué),2014.
[11] 劉 超,蘇龍翔,方向群,等.銅綠假單胞菌LCT-PA220菌株全基因組序列測定與分析[J].解放軍醫(yī)學(xué)院學(xué)報,2014,35(7):738-740.
[12] 李澤鋒.一個中國南方野生大豆基因組深度測序及其分析[D].浙江杭州:浙江大學(xué),2012.
[13] 陳 重,李多云,程 航,等.一株腸致病性大腸桿菌的全基因組序列分析[J].中國熱帶醫(yī)學(xué),2015,15(5):525-528.
[14] 曹德民.一株糖蜜乙醇高產(chǎn)酵母的全基因組重測序研究[D].廣西南寧:廣西大學(xué),2014.
[15] 魏 武,丁國徽,王曉婧,等.豬鏈球菌全基因組序列比較分析[J].科學(xué)通報,2016,51(7):808-815.
[16] 韓 笑,刀筱芳,張煥容,等.奶牛隱性乳房炎主要病原菌分離鑒定及耐藥性分析[J].動物醫(yī)學(xué)進展,2015,36(7):131-134.
Whole Genome Sequencing Analysis of a Small Colony Mutant Strain ofStaphylococcusaureus
WANG Qi-hui,SHI Yong-qiang,ZHU Yu,ZHANG Sai-fei,ZHU Li-li,QU Wei-jie
(FacultyofAnimalScienceandTechnology,YunnanAgriculturalUniversity,Kunming,Yunnan,650201,China)
To study on the genome difference between the small colony mutant strains ofStaphylococcusaureus(SASCVs) and the CP000253.1 for providing data to support subsequent research on the capacity ofS.aureusbacteria secrete of drug related materials.We did a research on a whole genome sequencing of the small colony mutant strains ofStaphylococcusaureus,and compared with those of sequence of CP000253.1 reference sequence.The results revealed that the library into fragments of the small colony mutant strains ofStaphylococcusaureusis 350 bp.The sequencing read long is 150 bp.The amount of raw data of SCVs is 551 Mb.The base content of SCVs distribution is different before and after processing.By sequencing weight,the number of SNP is larger.There is an obvious sequence difference between the small colony mutant strains ofStaphylococcusaureusand the CP000253.1 genome.The data provided the basis in a certain sequence for the study of dairy cow mastitisS.aureusinfection.
S.aureussmall colony mutant strain; difference of gene sequence; whole genome sequencing; SNP
2016-05-13
國家自然科學(xué)基金項目(31260629)
王奇惠(1990-),女,山東煙臺人,碩士,主要從事動物營養(yǎng)代謝病研究。*通訊作者
S852.611
A
1007-5038(2017)05-0077-04