(中國水產科學研究院黑龍江水產研究所,黑龍江 哈爾濱 150070)
傳染性造血器官壞死病(infectious hematopoietic necrosis,IHN)是嚴重威脅野生和人工養(yǎng)殖鮭鱒的急性、全身性傳染病[1,2]。根據(jù)感染宿主、病毒株和鮭鱒魚養(yǎng)殖環(huán)境的不同,IHN 造成的死亡率超過90%[3,4]。20 世紀50年代,美國華盛頓和俄勒岡州的紅鮭Oncorhynchus nerka 養(yǎng)殖場首次報道了該病,并迅速沿太平洋海岸擴散至北加州及愛達荷州[5]。隨著魚苗及成魚的貿易流通,目前IHN 已經蔓延到全世界多個國家,如日本[6]、伊朗[7]、加拿大[8]、韓國[9]、俄羅斯[10]、荷蘭[11]等。1985年我國遼寧省的一個虹鱒魚幼仔孵化場首次發(fā)現(xiàn)IHN 疫情,目前已經擴散至多個鮭鱒主養(yǎng)區(qū),給我國的鮭鱒養(yǎng)殖造成了嚴重的經濟損失[12]。
IHN 的病原為傳染性造血器官壞死病毒(infectious hematopoietic necrosis virus,IHNV)。它由不分節(jié)段的單股負鏈RNA 組成,歸屬于彈狀病毒科Rhabdoviridae,鮭科諾拉彈狀病毒屬Salmonid Novirhabdovirus[5,13]。IHNV 全基因組大小約為11100 nts,共編碼6 個病毒蛋白,分別為5 個結構蛋白:核蛋白(N)、磷蛋白(P)、基質蛋白(M)、表面糖蛋白(G)、聚合酶蛋白(L),以及1 個非結構蛋白(NV)[14]。病毒基因組與核蛋白N 緊密連接,形成病毒粒子的核心結構后與磷蛋白P 和聚合酶蛋白L 一起參與病毒的復制[15]。目前,世界各地發(fā)現(xiàn)的IHNV 分別以N、G、NV 基因的部分或全部核苷酸序列,進行詳細的系統(tǒng)進化分析[5,16,17]。
本課題組于2012年從中國東部的某虹鱒養(yǎng)殖場分離得到IHNV-Sn1203 病毒株,對其進行了大量研究,包括疫苗、致病機理和免疫學研究等。為了更好地了解該病毒株的分子生物學特征,對IHNV-Sn1203 病毒株的全基因組序列進行克隆及測序,并結合生物信息學分析該毒株的全基因組序列、基因組編碼蛋白、基因組末端和未翻譯序列、以及病毒基因同源性和系統(tǒng)發(fā)育,以期為我國IHNV病毒株的分子生物學特性及分子進化研究提供參考。
自中國東部某虹鱒養(yǎng)殖場分離的IHNV-Sn1203 病毒株(GenBank No:KC660147.1)經分離鑒定后保存于本實驗室。實驗用鯉上皮瘤細胞(epithelium papulosum cyprini,EPC)由中國水產科學研究院長江水產研究所魚類病害教研室曾令兵教授惠贈。
用DNAMAN 軟件,比對GenBank 中收錄的IHNV 基因組全序列信息。根據(jù)比對結果,利用Primer Premier version 5 軟件,在IHNV-HLJ09 株(Accession number JX649101)全基因組序列的基礎上,設計覆蓋全基因組序列的重疊引物,用于IHNV-Sn1203 病毒株全基因組序列克隆。所有引物均由吉林省庫美生物科技有限公司合成(表1)。
表1 IHNV-Sn1203 基因組克隆所用引物Tab.1 Primers sequences used in IHNV-Sn1203 genomic sequence clone
本研究將IHNV-Sn1203 基因組序列分成5 個片段進行克隆。使用GenEluteTM總RNA 提取試劑盒(Sigma 公司),從細胞培養(yǎng)上清中提取IHNV-Sn1203 病毒株總RNA。以病毒總RNA 為模板,利用SuperScript III One-Step RT-PCR Platinum Taq HiFi Kit 試劑盒,及表1 中引物分段克隆IHNV-Sn1203 全基因組序列。為了保證IHNV-Sn1203基因組末端序列的準確性,采用SMARTTMRACE 試劑盒(Takara,Dalian)克隆IHNV-Sn1203 基因組序列的5’和3’末端序列??寺∷卯a物經0.8%瓊脂糖凝膠電泳檢測后,利用凝膠回收試劑盒(Omega)純化回收目的片段。膠回收產物連接至pMD18-T simple 載體后,送吉林省庫美生物科技有限公司進行測序。
IHNV-Sn1203 基因組分段克隆片段中,每個片段至少隨機選擇3 個陽性克隆進行測序。測序結果采用SeqBuilder 軟件進行正向序列和反向序列的裝配驗證。利用Lasergene、MEGA 5.0 軟件,采用ClustalW 多重比對法和鄰位相連法(Neighbor-Joining method),分析IHNV-Sn 1203 株的全基因組序列、基因組編碼蛋白、基因組末端和未翻譯序列、以及病毒基因同源性和系統(tǒng)發(fā)育,并構建系統(tǒng)進化樹。
IHNV-Sn1203 株的基因組全長11131 nts,共編碼6 個病毒蛋白,依次為核蛋白(N)、磷蛋白(P)、基質蛋白(M)、表面糖蛋白(G)、非結構蛋白(NV)和聚合酶蛋白(L),其基因組結構與已經發(fā)表的彈狀病毒及IHNV 病毒基因組結構組成相似。表2 列出了IHNV-Sn1203 株的基因組特征及預測蛋白信息,IHNV-Sn1203 的所有蛋白編碼基因均被稱為基因連接區(qū)的非翻譯序列(UTR)分隔開(圖1)。
IHNV-Sn1203 株編碼的六個基因及其組成如表2 所示。其中,N 基因的開放閱讀框全長1176nts,位于基因組的175~1350nts 之間,包含391 個氨基酸殘基,編碼蛋白大小約為42.36kDa。N 基因的兩端分別含有112nts(63~174) 的5' 非翻譯區(qū),及80nts(1351~1430)的3' 非翻譯區(qū)(表2)。N 基因轉錄起始位點位于保守轉錄起始序列(CGUG,63~66nts)的下游,轉錄終止序列位于1415~1430nts處,其中包含推測的多腺化信號(UCUUUUUUU)。
P 基因的開放閱讀框全長693nts,位于基因組的1466~2158nts 之間,包含230 個氨基酸殘基,編碼蛋白大小約為25.99kDa。P 基因的兩端分別含有33nts(1433~1465)的5' 非翻譯區(qū),及41nts(2159~2199)的3' 非翻譯區(qū)。P 基因轉錄起始序列位于1433~1436nts,轉錄終止序列位于2184~2199nts 處。
M 基因的開放閱讀框全長588nts,位于基因組的2255~2842nts 之間,包含195 個氨基酸殘基,編碼蛋白大小約為21.86kDa。M基因的兩端分別含有53nts(2202~2254)的5' 非翻譯區(qū)和103nts(2843~2945)的3' 非翻譯區(qū)。M 基因轉錄起始序列位于2202~2205nts,轉錄終止序列位于2930~2945nts。
表2 IHNV-Sn1203 株的基因組特征和蛋白預測Tab.2 Genomic characteristics and protein prediction of IHNV-Sn1203
G 基因的開放閱讀框全長1527nts,位于基因組的2948~2998nts 之間,包含508 個氨基酸殘基,編碼蛋白大小約為56.37kDa。G 基因的兩端分別含有51nts(2948~2998)的5' 非翻譯區(qū)和42nts(4526~4567)的3' 非翻譯區(qū)。G 基因轉錄起始序列位于4552~4567nts,轉錄終止序列位于2930~2945nts 處。
NV 基因的開放閱讀框全長336nts,位于基因組的4596~4931nts 之間,包含111 個氨基酸殘基,編碼蛋白大小約為13.30kDa。NV 基因的兩端分別含有26nts(4570~4595) 的5' 非翻譯區(qū)和7nts(4932~4938)的3'非翻譯區(qū)。NV 基因轉錄起始序列位于4570~4573nts,轉錄終止序列位于4923~4938nts處,與NV 基因的開放閱讀框有9nts(4923~4931)重疊。
L 基因的開放閱讀框全長5961nts,位于基因組的5016~10976nts 之間,包含1986 個氨基酸殘基,編碼蛋白大小約為224.73kDa。L 基因的兩端分別含有75nts(4941~5015) 的5' 非翻譯區(qū)和54nts(10977~11030)的3' 非翻譯區(qū)。L 基因轉錄起始序列位于 4941~4944nts,轉錄終止序列位于11015~11030nts 處。
為了實現(xiàn)病毒蛋白的最佳翻譯,彈狀病毒的開放閱讀框之間都含有非常保守的非翻譯區(qū)域。這些區(qū)域通常以一個假定的轉錄停止/聚腺苷酸化基序[UCUA/GUCU7]開始,通過U 序列的重復復制向mRNA 加入poly(A)尾巴。這一序列后緊連著一個非轉錄的基因間二核苷酸AC 或GC 和一個保守的假定轉錄起始信號CGUG。圖2-A 為IHNV-Sn1203株基因間的保守UTR 結構,各基因間均含有保守的基因終止序列(Geneend,GE)、基因間序列(Intergenicregions,IG)和基因起始序列(Genestar,GS)。IHNV-Sn1203 基因組的6 個基因間的基因連接長度不同,分別為:N-P (115nts)、P-M(96nts)、M-G(156nts)、G-NV(70nts)和NV-L(84nts)。研究發(fā)現(xiàn),NV 基因的終止密碼子重疊在其非翻譯區(qū)的GE 中,這一結果未發(fā)于其他病毒,且其具體的作用也未闡明。IHNV-Sn1203 基因組的3'leader 序列長60nt,A/T 含量為68.3%,5'trailer 序列長99nt,A/T 含量為56.6%。同其他彈狀病毒類似,IHNV-Sn1203 基因組RNA 的3'端,前16 個核苷酸均與5'端核苷酸互補(如圖2-B 所示),而已報道的病毒株220-90 和Ch20101008 中分別有15 個和13 個互補,這種基因組末端的互補性質對彈狀病毒的復制至關重要。
已有報道表明,Kozak 序列對保證真核生物基因的轉錄和翻譯效率至關重要,特別是起始密碼前-3 位的A 堿基[18]。本文分析了IHNV-Sn1203 基因組中的Kozak 序列(圖3)。結果發(fā)現(xiàn):IHNV-Sn1203株6 個病毒基因的起始密碼子前面均含有嚴格的Kozak 序列,其-3 位堿基均為A。這一結果與已報道的IHNV 220-90 株的N 基因不同(-3 位堿基為G)。
2.4.1 全基因組進化分析
本研究首先分析了IHNV 同其他彈狀病毒全基因組的進化關系,結果顯示IHNV 與HIRRV(Hirame rhabdovirus,HIRRV)進化關系最近,其次為SHRV(Snakehead rhabdovirus,SHRV)、VHSV(Viral hemorrhagic septicemia virus,VHSV)和SVCV(Spring viraemia of carp virus,SVCV)。IHNV-Sn1203 株同Ch20101008、BJSY 和HLJ-09 聚為一簇(圖4),其核苷酸同源性分別為99.67%、99.52%和99.76%;同BjLL、220-90、WRAC、lambda ZAPII 聚為一簇,同Sn1203 株的核苷酸同源性分別為96.34%、94.89%、95.41%和95.88%。(表3)
表3 IHNV-Sn1203 基因組序列同源性分析(%)Tab.3 Homology analysis of IHNV-Sn1203 genome sequence(%)
2.4.2 Sn1203 株病毒糖蛋白(Glycoprotein,G)基因進化分析
IHNV 病毒糖蛋白G 基因序列的變異系數(shù)小,又與病毒的毒力強弱直接相關,目前IHNV 的基因分型及進化分析多以G 蛋白序列為主。本研究對包括IHNV-Sn1203 株在內的100 株IHNV 的G 基因進行了系統(tǒng)進化分析。結果表明:IHNV 主要分為5個基因型,即E、U、M、L 和J,其中J 基因型又包含J Nagano 和J Shizuoka 兩個基因亞型。系統(tǒng)進化分析結果表明,Sn1203 株同我國已報道的SD-12、YN-13、CJ-13、Ch20101008 和HLJ-09 等聚為一簇,共同歸屬于J Nagano 基因亞型,并且Sn1203 株與CJ-13 株的親緣關系較近(圖5)。
2.4.3 Sn1203 株各病毒基因進化分析
本研究同時利用GenBank 中IHNV 病毒株N基因、P 基因的全序列及L 基因、M基因和NV 基因的部分序列構建了系統(tǒng)進化樹,如圖6 所示。N 基因全序列的系統(tǒng)進化分析發(fā)現(xiàn),Sn1203 株同LQN131107、CJ-13、zyx、HLJ-09 和Ch20101008 聚為一簇(圖6-A),核苷酸同源性分別為99.32%、99.49%、99.66%、99.83%和99.83%;而中國分離株BjLL 則與美國株RB-76 及Round Butte 1 等聚為一簇,與Sn1203 株的核苷酸同源性為95.75%。P 基因全序列的系統(tǒng)進化分析發(fā)現(xiàn),Sn1203 株同CJ-43、HLJ-09、Ch20101008 和BJSY 聚為一簇(圖6-B),與HLJ-09 親緣關系最近,其核苷酸同源性為99.86%,與BjLL 中國分離株親緣關系最遠,核苷酸同源性為94.37%。L 基因部分序列的系統(tǒng)進化分析發(fā)現(xiàn),Sn1203 株同HLJ-09、Ch20101008 和BJSY 聚為一簇(圖6-C),與HLJ-09 親緣關系最近,其核苷酸同源性為99.80%,與BjLL 中國分離株親緣關系最遠,核苷酸同源性為97.30%。M基因及NV 基因部分序列的系統(tǒng)進化分析發(fā)現(xiàn),Sn1203 株同CJ-13、HLJ-09、Ch20101008 和BJSY 聚為一簇(圖6-D、圖6-E),與HLJ-09 及Ch20101008 親緣關系最近,M 基因核苷酸同源性均為99.49%,NV 基因核苷酸同源性分別為99.70%和99.40%,與BjLL 中國分離株親緣關系最遠。以上結果表明:Sn1203 株與HLJ-09 株及Ch20101008 的親緣關系最近,而與中國分離株BjLL 親緣關系最遠。
1985年我國東北部某虹鱒魚養(yǎng)殖場首次暴發(fā)了IHN 疫情,次年IHN 暴發(fā)15d 就導致該養(yǎng)殖場60 萬尾虹鱒死亡,從此IHN 成為嚴重威脅我國鮭鱒養(yǎng)殖的主要疫病[12,19]。2012年本課題組分離得到IHNV-Sn1203 病毒株,以該病毒株為對象開展了大量的研究工作,包括疫苗、致病機理及免疫學研究等[1,13,20,21],但未詳細分析IHNV-Sn1203 病毒株的基因組成、分子生物學特征等。為更清楚地了解該病毒株的分子生物學特性,本研究克隆了IHNV-Sn1203 病毒株的全基因組序列,分析了其全基因組序列、基因組編碼蛋白、基因組末端和未翻譯序列、以及病毒基因同源性和系統(tǒng)發(fā)育。
IHNV-Sn1203 病毒株全基因組長度為11131 nts,與其他諾拉彈狀病毒屬病毒的比對發(fā)現(xiàn),在其基因組的3' 末端和5' 末端均含有與其他諾拉彈狀病毒屬病毒相同的保守序列:3' 末端為CAUAU,5'末端為GUAUA。在其基因組的3'末端的前16 個核苷酸均與5' 末端核苷酸互補,與已報道的220-90病毒株及Ch20101008 病毒株不同(220-90 有15 個互補,Ch20101008 有13 個互補)。所有諾拉彈狀病毒屬病毒基因組3' 末端的核苷酸長度基本保持一致(51~60nts),但5' 末端核苷酸長度卻呈高度可變性(42~116nts)。已有的研究認為,病毒基因組3'末端和5' 末端核苷酸序列的互補性,及5' 末端均具有一定的功能意義,可能與病毒的復制密切相關,但具體機制尚不清楚[22]。對IHNV-Sn1203 病毒株各蛋白編碼基因前后序列的分析發(fā)現(xiàn),所有蛋白編碼基因前均含有一段長度為4 個核苷酸的保守基因啟動序列(CGUG,GS),蛋白編碼基因后均含有一段長度為16 個核苷酸的保守基因終止序列(G/UGG/UUCUA/GUCU7,GE),所有的基因均以7個尿嘧啶(U)殘基引入聚腺苷酸化信號的方式終止。在7 個尿嘧啶殘基后,有2 個不參加轉錄的核苷酸(A/GC,IG),作為兩個基因間的間隔序列。聚合酶跳過這兩個核苷酸序列,進入下一個基因啟動序列,開始轉錄下一個基因。本研究發(fā)現(xiàn),IHNV 病毒株的6 個基因中,N、P、M、G 和L 基因前后均含有完整的基因啟動序列和基因終止序列,而NV 基因后的基因終止序列與其編碼序列有9nts(4923~4931)重疊(表2),目前關于這種序列重疊現(xiàn)象的功能仍未有相關報道。
對IHNV-Sn1203 病毒株全基因組系統(tǒng)進化分析發(fā)現(xiàn),除BjLL 外,中國毒株Ch20101008、BJSY、HLJ-09 和Sn1203 均聚為一簇。IHNV-Sn1203 病毒株N 基因、P 基因的全序列及L 基因、M基因和NV基因的部分序列系統(tǒng)進化分析表明,Sn1203 株與中國株HLJ-09 親緣關系最近,各核苷酸的同源性依次為99.83%、99.86%、99.80%、99.49%和99.70%。
G 基因作為病毒表面主要抗原蛋白基因,與病毒的毒力強弱直接相關[23]。目前IHNV 的基因分型及進化分析多以G 基因序列為主,本研究分析了G基因的系統(tǒng)進化發(fā)現(xiàn),現(xiàn)有的IHNV 病毒株主要分為5 個基因型,即E、U、M、L、J,其中J 基因型又包含J Nagano 和J Shizuoka 兩個基因亞型。其中廣泛研究的毒株220-90 和WRAC 屬于M基因型,Baker Lake 94 屬于U 基因型,strain K 屬于E 基因型,LR-73、Col-85 屬于L 基因型。Sn1203 株同我國已報道的 SD-12、YN-13、CJ-13、Ch20101008 和HLJ-09 等聚為一簇,共同歸屬于J Nagano 基因亞型;Sn1203 株與CJ-13 株的親緣關系較近。由G 基因的進化分析發(fā)現(xiàn),J 基因型的病毒與U 基因型親緣關系最近,猜測IHNV 病毒最初可能是通過進口魚卵的方式由U 基因型引入,隨時間的推移逐漸進化為J 基因型。因此,對進口魚卵的監(jiān)控是做好外源病毒防控的關鍵手段。
綜上所述,本研究結果表明:Sn1203 株同我國已報道的SD-12、YN-13、CJ-13、Ch20101008 和HLJ-09 病毒株等聚為一簇,共同歸屬于J 基因型中的Nagano 基因亞型。本研究可為我國IHNV 病毒株的分子生物學特性研究及分子進化研究提供重要參考。