林 琦 黃枝妙 福建省疾病預(yù)防控制中心,福建省人獸共患病研究重點實驗室(福建,福州,350001)
王宇平 鄭 暉 翁育偉(通訊作者) 福州國際旅行衛(wèi)生保健中心(福建,福州,350001)
新型冠狀病毒(SARS-CoV-2)是單股正鏈RNA病毒(Riboviria),屬于有包膜的β 屬冠狀病毒,是目前已知的第7 種可以感染人類的冠狀病毒[1],基因組全長約為30 kb。 SARS-CoV-2 感染患者和無癥狀感染者均可通過呼吸道飛沫、密切接觸等途徑將SARS-CoV-2 病毒傳播給易感人群[2]。 截至2021 年4 月19 日,全球范圍內(nèi)由SARS-CoV-2 感染導(dǎo)致的肺炎確診病例共計141 057 106 例, 死亡病例高達3 015 043 例[3],已造成全球性大流行。
福建省自2020 年2 月26 日本地新冠病例清零后,截至2021 年4 月19 日共確診境外輸入新冠病例290 例。 為了探索并構(gòu)建SARS-CoV-2 病例標(biāo)本直接高通量測序的方法(不經(jīng)過病毒分離培養(yǎng)的病毒全基因組測序方法),本研究選取1 例病毒載量較低的輸入性SARS-CoV-2 無癥狀感染病例咽拭子標(biāo)本進行病毒全基因組二代測序和生物信息學(xué)分析, 為今后快速掌握輸入性SARS-CoV-2 病毒的基因組特征、追溯病毒潛在來源、追蹤病毒變異變遷規(guī)律提供有力的技術(shù)支撐, 從分子流行病學(xué)角度為我省新冠肺炎疫情的溯源和防控工作提供科學(xué)依據(jù)。
患者女,31 歲,于2021 年1 月8 日從日本回到福建省福州市,福州機場海關(guān)對其采集鼻咽拭子進行SARS-CoV-2 核酸檢測, 檢測結(jié)果為SARSCoV-2 核酸陽性。 次日凌晨起被送至定點醫(yī)院隔離觀察,隔離觀察期間無明顯臨床癥狀,后被確診為無癥狀感染者。 福州市海關(guān)將該陽性標(biāo)本(標(biāo)本號:TH-H210159)于1 月13 日送至福建省疾病預(yù)防控制中心進行SARS-CoV-2 全基因組測序。
取陽性標(biāo)本液200 μL,采用病毒核酸提取試劑(西安天隆,磁珠法),按試劑盒說明書和自動核酸提取儀的操作說明進行病毒核酸(RNA)提取。 利用新冠病毒核酸檢測試劑(達安基因)對所獲病毒核酸進行SARS-CoV-2 檢測,經(jīng)復(fù)核,該病例核酸中的ORF1ab 基因Ct 值為35.50,N 基因Ct 值為33.38。
以提取的病毒RNA 作為模板, 按照Ion AmpliSeq SARS-CoV-2 Research Panel(ThermoFisher Scientific,美國)使用說明進行新型冠狀病毒全基因組擴增及測序文庫構(gòu)建。(1)使用SuperScript VILO cDNA Synthesis Kit(ThermoFisher Scientific,美國)對病毒RNA 進行反轉(zhuǎn)錄,合成第一鏈cDNA;(2)使用SARS-CoV-2 全基因組擴增引物(ThermoFisher Scientific, 美國) 和Ion AmpliSeq Library Kit Plus(ThermoFisher Scientific,美國)進行病毒全基因組擴增及測序文庫構(gòu)建;(3)采用Ion chef 系統(tǒng)及其配套試劑(ThermoFisher Scientific,美國)來制備高通量測序模板;(4)最后,使用Ion Torrent GeneStudio S5 二代測序系統(tǒng)、Ion 530 芯片及配套試劑(ThermoFisher Scientific,美國)對病毒全基因組進行測序。
利用Ion Torrent 服務(wù)器內(nèi)置的IRMA(the iterative refinement meta-assembler)插件完成測序數(shù)據(jù)優(yōu)化、SARS-CoV-2 全基因組序列拼接及核苷酸突變分析等,利用IGV(version 2.8.13)查看并確認(rèn)可疑突變位點,剔除非可信變異位點后最終確定病毒全基因序列。
根據(jù)IRMA 插件分析得到的核苷酸和氨基酸突變位點來確定病毒在中國分型法和GISAID 分型法中的對應(yīng)型別;分別利用在線工具Pangolin(https://pangolin.cog -uk.io/) 和 Nextclade (https://clades.nextstrain.org/) 進行Pangolin 分型和Nextstrain 分型[4]。 根據(jù)全基因分型結(jié)果,從GISAID 上篩選并下載參比序列,采用在線的MAFFT version 7 軟件(https://mafft.cbrc.jp/alignment/server/) 進行序列比對, 最后使用MEGA 6.0 軟件的鄰接法(Neighbor-Joing,NJ)構(gòu)建系統(tǒng)進化樹,用bootstrap 抽樣1 000次來評估進化樹的可靠性。
測序下機數(shù)據(jù)經(jīng)分析,該病例標(biāo)本此次測序共獲得有效reads 為4 305 361 條,平均讀長為187 bp;經(jīng)Ion Torrent 服務(wù)器內(nèi)置插件IRMA 拼接獲得一條全長為29 883 bp 的病毒全基因組序列(GISAID序列號:EPI_ISL_1663017);Coverage Analysis 插件分析結(jié)果顯示, 以 SARS -CoV -2 武漢株(EPI_ISL_402125)為參考基因組,本次測序有效reads 中有4 243 271 條reads(有效率為98.56%)能夠比對到參考基因組上,測序平均深度為25 762×,基因組覆蓋度(完整度)為98.61%,覆蓋均一度較好,詳見圖1。
圖1 SARS-CoV-2 全基因組二代測序深度及覆蓋度分析
Variant Caller(突變分析插件)分析結(jié)果顯示,該SARS-CoV-2 病毒基因組序列同武漢參考株(EPI_ISL_402125)序列相比,共存在18 處核苷酸突變,突變類型包含17 個SNP(單核苷酸多態(tài)性)和1處MNP(多核苷酸多態(tài)性),分別來自1 個非編碼區(qū)(ORF1ab 上游基因) 和5 個基因編碼區(qū) (包括:ORF1ab、S、ORF3a、ORF8、N), 編碼區(qū)中11 個突變位點來自O(shè)RF1ab 基因、1 個來自S 基因(D614G)[x]、1 個來自O(shè)RF3a、1 個來自O(shè)RF8 基因、3 個來自N 基因;氨基酸突變類型包括7 個同義突變和10 個非同義突變。 該SARS-CoV-2 病毒全基因組序列突變情況見表1。在所有突變中,未見潛在的可導(dǎo)致毒株傳播力或致病性增強的氨基酸變異位點。
應(yīng)用中國分型法、Pangolin 分型法、Nextstrain分型法及GISAID 分型法等4 種不同的新冠病毒全基因分型方法對該病毒進行分型, 分型結(jié)果顯示:該輸入性新冠病毒在中國分型法中屬于L 基因型歐洲家系分支,處于Pangolin 譜系中的B.1.1.214 進化分支上,Nextstrain 分型為20B,GISAID 分型為GR 型。 不同分型結(jié)果及依據(jù)見表2。
根據(jù)該SARS-CoV-2 病毒全基因組的分型結(jié)果, 從GISAID 上篩選并下載了43 條參比序列,包含了Pangolin 進化分支A 和B 及其子分支(B.1、B.1.1.214、B.1.1.7 英國變異株分支、B.1.351 南非變異株分支、P.1 巴西變異株分支等)。
將該SARS-CoV-2 病毒全基因組與所有參比序列構(gòu)建系統(tǒng)進化樹(圖2),結(jié)果顯示該SARS-CoV-2病毒基因組序列與來自日本的參考株聚成一簇,共同處于進化分支B.1.1.214 上,且與其中一株來自日本大阪(Japan/Osaka)的SARS-CoV-2 序列最接近;該病毒基因序列與我國本土流行的SARS-CoV-2 毒株(武漢1-3 月份流行株)屬于不同的基因型,提示該病毒為輸入性,而非本土新冠病毒的持續(xù)傳播;此外,該病毒序列與英國變異株(B.1.1.7 分支)、南非變異株(B.1.351分支)及巴西變異株(P.1 分支)處于不同分支上,無明顯相關(guān)性。 進化分析結(jié)果證實該SARS-CoV-2 病毒來源于日本,且很可能來源于日本大阪地區(qū)。
圖2 SARS-CoV-2 病毒全基因組進化樹
本研究采用SARS-CoV-2 全基因組靶向擴增結(jié)合Ion S5 高通量二代測序技術(shù),成功地從1 例病毒載量較低(ORF1ab 基因Ct 值為35.50,N 基因Ct值為33.38) 的境外輸入新冠病例標(biāo)本中獲得一條全長為29 883 bp 的病毒全基因組序列, 平均測序深度為25 762×,基因組覆蓋度達到98.61%,高質(zhì)量的測序結(jié)果為后續(xù)病毒全基因組突變位點分析、病毒分型及進化分析等溯源工作提供了可靠的數(shù)據(jù)支撐。
既往研究表明,病毒的變異可能導(dǎo)致病毒的傳播力、致病力發(fā)生改變[5-7],因此快速測定病毒基因組并識別關(guān)鍵突變,是開展病例管理和疫情處置的關(guān)鍵。 靶向擴增結(jié)合高通量測序的技術(shù)方法,能夠跳過病毒分離培養(yǎng)環(huán)節(jié),直接從病毒載量較低的臨床標(biāo)本中靶向擴增SARS-CoV-2 全基因組序列,再利用二代測序的高通量優(yōu)勢,在一次測序中獲得大量數(shù)據(jù),這些數(shù)據(jù)為拼接出完整的SARS-CoV-2 全基因組序列提供了可能性,也為后續(xù)的基因突變分析提供了足夠的測序深度, 因此該技術(shù)方法在SARS-CoV-2 的快速診斷、 變異分析和分子流行病學(xué)研究等工作中發(fā)揮了巨大作用。
本研究測序得到的SARS-CoV-2 病毒的中國分型為L 基因型歐洲家系, Pangolin 分型為B.1.1.214,Nextstrain 分型為20B,GISAID 分型為GR型。 進化分析顯示,該SARS-CoV-2 病毒與來自日本的參考株共同處于進化分支B.1.1.214 上,與其中一株來自日本大阪(Japan/Osaka)的病毒序列最接近, 并不與我國本土流行的毒株處于同一分支上,結(jié)果證實了該病毒確實為日本輸入,且很可能來自日本大阪。 此外,該SARS-CoV-2 序列的N 蛋白含有GGG28881-28883AAC 突變, 有研究統(tǒng)計發(fā)現(xiàn)28881-28883 這3 個位點的堿基突變發(fā)生率大于5%,可能導(dǎo)致核酸檢測試劑盒對N 蛋白基因的檢測靈敏度降低[8-9]。由于中國疾病預(yù)防控制中心早期公開的檢測引物及靶標(biāo)序列位置中N 基因的上游引物序列包含了28881-28883 這3 個核苷酸位點[10],所以需要對N 基因引物靶向區(qū)的核苷酸突變情況做持續(xù)監(jiān)測,以及時評估試劑的靈敏度和準(zhǔn)確性。