李健雄,施勇,劉師文,徐剛,龔甜,周珺,肖芳,劉曉慶,張艷妮,肖大瑾,冉鑫,熊英
(江西省疾病預(yù)防控制中心,江西 南昌 330029)
2020 年初,新型冠狀病毒肺炎(Corona Virus Disease 2019,COVID-19)[1](簡稱” 新冠肺炎” )迅速蔓延,席卷全世界,對全球的經(jīng)濟、社會造成了巨大的沖擊。目前,全球確診病例超1.8億例,死亡破400萬例,新冠肺炎疫情防控形式十分嚴峻。
SARS-CoV-2為線性單股正鏈的RNA病毒,屬于β屬的冠狀病毒,有包膜。其基因組長約為29.8 Kb,基因特征與SARS-CoV和MERS-CoV有明顯區(qū)別[2]。COVID-19患者和無癥狀感染者均可能通過呼吸道飛沫、密切接觸等途徑將SARSCoV-2傳播給易感人群[3]。由于病毒的復(fù)制過程易出錯特性,特別是RNA病毒,隨著時間的推移積累突變將導(dǎo)致序列的改變多樣性。文獻報道[4],目前SARS-CoV-2的核苷酸突變率估計約為2.5個核苷酸/月,其基因組變異可能會對其傳播力、致病力產(chǎn)生影響。因此,快速、準確的進行SARS-CoV-2基因組測序,掌握基因組特征,對疫情防控具有非常重要意義。
2020年1 至3月,江西省共發(fā)現(xiàn)930例新冠肺炎確證病例,是除湖北省以外疫情較為嚴重的幾個省份之一。后期,在外防輸入階段,我省共發(fā)現(xiàn)5例境外輸入病例。為了了解江西省病毒基因變異情況,建立江西省本土新冠病毒基因庫,為后續(xù)新冠疫情的溯源提供參考依據(jù),本研究于2020年1月、2020年2月和2020年9月,分別建立了新冠肺炎病例臨床樣本的二代和三代基因組測序技術(shù),并應(yīng)用于新冠肺炎確證病例臨床樣本的SARS-CoV-2全基因組測序,現(xiàn)將研究結(jié)果報道如下。
1.1 樣本來源 樣本來源為2020年江西省新冠肺炎確診病例的咽拭子和痰液等呼吸道樣本。
1.2 核酸提取 采用Qiagen RNeasy Mini Kit(Qiagen,Cat No:74104)對38份新冠肺炎病例的咽拭子和痰液等呼吸道臨床樣本進行病毒核酸提取,具體操作步驟參照試劑盒說明書。
1.3 文庫構(gòu)建及全基因組測序
1.3.1 基于Ion Torrent S5平臺的二代宏基因組測序 建立基于Ion Torrent S5平臺的新冠二代宏基因組測序方法,采用Nugen OvationRNA-Seq System、Ion XpressTM Plus Fragment kit或 者Ion total RNA-Seq Kit等試劑盒構(gòu)建測序文庫。采用Ion OneTouch2系統(tǒng)構(gòu)建測序模板。使用Thermofisher測序平臺的Ion Torrent S5測序儀和Ion530芯片進行全基因組深度測序。以SARSCoV-2 Wuhan-Hu-1(NC_045512)基因組作為參考序列,使用CLC Genomics Workbench(Version 21.0)軟件對測序原始下機數(shù)據(jù)進行序列拼接。
1.3.2 基于Ion Torrent S5平臺的二代靶向測序建立基于Ion Torrent S5平臺的新冠二代靶向測序方法,采用Thermofisher提供的新型冠狀病毒全基因組捕獲引物(242對引物)和SuperScript IV VILO Master Mix試劑盒(Thermofisher,美國)對提取的病毒RNA進行全基因組特異性擴增,擴增得到250-350bp大小不等的基因片段。擴增產(chǎn)物經(jīng)回收后,按照Ion Torrent AmpliSeq Library Kit Plus(Thermofisher,美國)操作步驟構(gòu)建測序文庫,采用Ion OneTouch2系統(tǒng)構(gòu)建測序模板。使用Thermofisher測序平臺的 Ion Torrent S5測序儀和Ion530芯片進行全基因組深度測序。以SARSCoV-2 Wuhan-Hu-1(NC_045512)基因組作為參考序列,使用CLC Genomics Workbench(Version 21.0)軟件對測序原始下機數(shù)據(jù)進行序列拼接。
1.3.3 基于MinION平臺的三代靶向測序 建立基于MinION平臺的新冠三代靶向測序方法,對提取的核酸使用針對SARS-CoV-2特異性引物(109對引物)進行靶向擴增,富集病毒基因組核苷酸序列片段,產(chǎn)物采用Agencourt AMPure XP磁珠進行純化。使用Qubit3.0及Qubit dsDNA HS Assay Kit對純化后DNA進行核酸濃度測定。利用連接法建庫試劑盒對純化后的核酸進行建庫,并使用英國牛津Nanopore公司的MinION測序儀及R9.4.1 Flowcell測序芯片進行測序。使用Nanopore公司提供的artic-ncov2019分析軟件對序列進行拼接。
1.4 全基因組序列分析 使用DNAstar軟件對全基因組序列進行分析,與GISAID數(shù)據(jù)庫中序列進行同源性比對,使用Mega軟件對序列進行比對,并基于最大似然法構(gòu)建系統(tǒng)進化樹,參比序列來源于GISAID數(shù)據(jù)庫和GenBank數(shù)據(jù)庫。
2.1 新冠肺炎病例的基本情況 本研究中的新冠肺炎病例分別為疫情初期間(2020年1月至2月)和外防輸入期間(2020年3月至10月)的相關(guān)病例,其中疫情期間的病例為湖北輸入及本地續(xù)發(fā)病例,共33例,來自江西省10個設(shè)區(qū)市,外防輸入期間均為境外輸入病例,共5例,分別來自美國、俄羅斯、菲律賓和剛果金等4個國家。38例病例年齡為18~79歲,男女分別為22人和16人。
2.2 全基因組測序 成功建立了SARS-CoV-2二代宏基因組測序、SARS-CoV-2二代和三代靶向測序方法,見表1。共獲得所有病例共38條新冠肺炎確診病例的臨床樣本全基因組,新冠全基因組序列長度為29867bp。所有序列均上傳至GISAID和GWH數(shù)據(jù)庫,序列號為EPI_ISL_421237-EPI_ISL_421254,EPI_ISL_421256-EPI_ISL_42126 2,EPI_ISL_455460-EPI_ISL_455467,WGS001712,WGS001721,WGS001722,WGS020746,WGS0189 64。
表1 三種方法比較
2.3 SARS-CoV-2病毒全基因組特征 通過構(gòu)建的SARS-CoV-2病毒全基因組進化樹發(fā)現(xiàn),我省新冠病毒基因分屬兩個不同分支,分別為S型/A分支和L型/B分支,其中湖北輸入及本地病例中有18例屬于S型,15例屬于L型,而境外輸入病例均屬于L型/B分支,經(jīng)“Pangolin”分型分析,hCoV-19/China/Nanchang/JX216/2020為B.1分支,hCoV-19/China/Jiujiang/JX221/2020為B.1.1分支,hCoV-19/China/Nanchang/JX222/2020為 B.1.1.95分支,hCoV-19/Nanchang/JX554/2020為B.1.1.63分支,hCoV-19/China/Yingtan/JX572/2020為B.1.1.306分支。Blast比對顯示,分別與hCoV-19/USA/NYNYUMC879/2020、hCoV -19/Switzerland/BS0914/2020、hCoV-19/USA/WA-UW138/2020、hCoV-19/Hong Kong/HKU-200723-102/2020、hCoV-19/Israel/CVL-n-6051/2020同源性最高。
以Wuhan-Hu-1(NC_045512.2)為參考基因組,對疫情期間的湖北輸入及本地病例SARS-CoV-2核苷酸和氨基酸分析發(fā)現(xiàn),33株SARS-CoV-2核酸變異數(shù)在1~6個之間,共檢測到變異位點40個,除C8782T和T28144C連鎖突變外,其余突變位點均只出現(xiàn)在1~3個病毒中,對應(yīng)于6個編碼區(qū)的39個氨基酸位點,其中ORF1ab編碼區(qū)24個(61.54%),S編碼區(qū)7個(17.95%),N編碼區(qū)5個(12.82%),ORF3a、M、ORF8編 碼 區(qū) 各 1個(2.56%);存在25個非同義突變(62.5%),其中S蛋白(刺突蛋白)存在6個非同義突變,見表2。未發(fā)現(xiàn)插入及缺失變異。
表2 湖北輸入及本地病例新冠病毒氨基酸及核苷酸變異情況
圖1 SARS-CoV-2全基因組核苷酸序列系統(tǒng)發(fā)育樹
以Wuhan-Hu-1(NC_045512.2)為參考基因組,對外防輸入時期的SARS-CoV-2核苷酸和氨基酸分析發(fā)現(xiàn),5例病例基因組核苷酸變異數(shù)為7~15個,見表3。共檢測到變異位點29個。其中ORF1ab編碼區(qū)20個(51.28),S編碼區(qū)2個(5.13%),N編碼區(qū)5個(12.82%),非編碼區(qū)2個(5.13%)。對應(yīng)的氨基酸突變類型包括9個同義突變,18個非同義突變,見表4。和我省早期湖北輸入及本地病例無相同變異位點。
表3 境外輸入病例新冠病毒核苷酸變異位點
表4 境外輸入病例新冠病毒氨基酸及核苷酸變異情況
新型冠狀肺炎為新發(fā)傳染病,SARS-CoV-2易發(fā)生變異,快速準確鑒定和分析SARS-CoV-2來源和基因變異特征,對于疫情防控具有重要意義。二代、三代測序技術(shù)在新型病毒的基因變異研究、病毒溯源等方面中具有巨大作用,無論是系統(tǒng)發(fā)育分析還是重要功能蛋白突變位點的識別都需要基于精準的全基因組序列信息[5]。本實驗室在疫情初期通過建立了SARS-CoV-2二代宏基因組測序方法,對江西省第一例新冠肺炎病例的咽拭子樣進行了全基因組測序,于2020年1月18日即獲得了第一個新冠全基因組序列。由于宏基因組測序方法對樣本中的所有核酸序列進行測序,因此獲得的SARS-CoV-2基因數(shù)據(jù)不多,不僅測序時間長(36個小時),而且測序覆蓋度較低,不適用于對SARS-CoV-2的精準測序。為了更精準和快速的對SARS-CoV-2進行基因組測序,本實驗室在2020年2月和9月相繼建立了基于Ion Torrent S5平臺的新冠肺炎病例臨床樣本的二代SARS-CoV-2靶向全基因組測序方法和基于MinION平臺的三代SARS-CoV-2靶向全基因組測序方法,獲得全基因組測序最短時間為12 h,在外防輸入期間江西省新冠肺炎病例的確診和溯源工作中發(fā)揮非常重要的作用,為疫情防控爭取了非常寶貴的時間,為江西省保持489 d(截止2021年6月30日)無新增本地確診病例報告提供了實驗室證據(jù)[13]。
對疫情期間臨床樣本的SARS-CoV-2的全基因組分析結(jié)果顯示,發(fā)現(xiàn)江西省的新冠病毒全基因組序列與在Genbank數(shù)據(jù)庫公布的第一條SARS-CoV-2參考基因組(NC_045512.2)的序列相比,變異數(shù)最多僅6個,且變異位置分散,提示疫情初期,江西省SARS-CoV-2基因相對穩(wěn)定,變異率較低[6]。根據(jù)Tang等[7]早期提出根據(jù)C8782 T(ORF1ab:C8517T)和28144(ORF8:T251C)突變可將的SARS-CoV-2分為S型和L型兩個型,2020年1月7日之前主要為S型,1月7日后,L型約占70%,S型占30%。根據(jù)該分型方法,本研究的33例病例有18株為S型,15株為L型,在疫情比較嚴重的設(shè)區(qū)市(南昌市、上饒市和新余市)均存在兩種型別,推斷我省疫情早期多為湖北輸入及輸入相關(guān)病例,與流行病學(xué)調(diào)查信息一致。
通過深入分析發(fā)現(xiàn)疫情期間刺突蛋白(S蛋白)上發(fā)生了6個非同義突變,S蛋白是介導(dǎo)病毒與宿主細胞膜發(fā)生融合并實現(xiàn)傳播的表面糖蛋白,具有多個引起機體免疫反應(yīng)線性抗原表位,是影響病毒傳播及其致病性的重要蛋白[8-9]。根據(jù)國家基因組科學(xué)數(shù)據(jù)中心2019新型冠狀病毒信息庫對SARS-CoV-2基因組的變異注釋,本研究中出現(xiàn)的6個位點變異的群體發(fā)生率均小于0.05,為較溫和的突變[10],推測這些位點的變異對其傳播性影響較小,并非可穩(wěn)定遺傳的變異,SARS-CoV-2在江西省內(nèi)并未發(fā)生本地的廣泛流行。
對境外輸入病例全基因組分析結(jié)果顯示,5例病例與我省早期病例變異位點并不相同,經(jīng)blast比對,與國外同時期的病例同源性較高,與流行病調(diào)查結(jié)論一致,顯示均為境外輸入。根據(jù)” Pangolin” 分型法[11-12],5例病例的SARS-CoV-2分別屬于B.1、B.1.1、B.1.1.63、B.1.1.95、B.1.1.306,不是世衛(wèi)組織確定“關(guān)切變異株(VOC)”和“關(guān)注變異株(VOI)”。
綜上所述,本實驗室建立的三種臨床樣本的SARS-CoV-2全基因組測序技術(shù),在新冠肺炎疫情不同階段的防控工作中發(fā)揮了重要作用。在疫情初期階段,證實了有效的公共衛(wèi)生防控舉措可以減少病毒的基因變異;在內(nèi)防輸入階段,將檢測周期縮短至12 h,在全基因組層面證實新冠肺炎確診病例均為境外輸入病例,及時為本土病例零增長、減少民眾恐慌和維護社會和諧提供可靠的實驗室證據(jù)。