吳運譜
(遼寧省動物疫病預(yù)防控制中心,遼寧 沈陽 110164)
流感病毒作為一種全球性的、重要的公共衛(wèi)生安全威脅。根據(jù)世界衛(wèi)生組織估計,全球每年約有300萬~500萬流感患者,并導(dǎo)致了大約29萬~66萬人死亡。基于Web查詢,IRD可以免費使用,可為流感病毒數(shù)據(jù)和分析提供一站式服務(wù),并促進關(guān)于流感病毒傳播、毒力、宿主范圍和致病性及其新的診斷策略、預(yù)防和治療干預(yù)措施等方面的發(fā)展。
IRD的數(shù)據(jù)由來源于GenBank(http://www.ncbi.nlm.nih.gov/genbank/)和UniProt(http://www.uniprot.org)序列數(shù)據(jù)和序列注釋數(shù)據(jù)和免疫表位數(shù)據(jù)庫(IEDB;http://www.iedb.org)的免疫表位數(shù)據(jù)和蛋白質(zhì)數(shù)據(jù)庫 (PDB;http://www.rcsb.org/pdb)的蛋白質(zhì)三維結(jié)構(gòu)數(shù)據(jù)等方面數(shù)據(jù)組成。臨床監(jiān)測和宿主因素的數(shù)據(jù)來源于直接提交和治療時抗病毒藥物來自于藥物數(shù)據(jù)庫(http://www.drugbank.ca)。
包括多序列比對、進化樹重構(gòu)、變異序列確認、適宜于序列元數(shù)據(jù)的序列比較分析工具(meta-CATS)、BLAST比較、短肽鑒定、PCR引物設(shè)計、基因序列注釋、序列特征和表型變異型注釋(Phenotypic Variant Type,PVT)、HA分支分類、HA亞型間的編號換算、檢測數(shù)據(jù)的可視化和蛋白結(jié)構(gòu)的可視化和宿主因子數(shù)據(jù)富集分析。
個人數(shù)據(jù)存儲空間的推出和使用極大地吸引了用對該數(shù)據(jù)庫的使用,IRD對流感研究重要性的正在逐漸增加,其使用量的穩(wěn)步增加是很好證明。據(jù)《流感和其他呼吸道病原》雜志也報道了IRD數(shù)據(jù)庫論文是該雜志2014年度的應(yīng)用中排名第一。
IRD允許用戶使用進化樹查看器對基于序列關(guān)聯(lián)元數(shù)據(jù)的進化樹節(jié)點進行著色,包括對地理分布、宿主種類、分離株年份和季度、HA和NA亞型、在特定蛋白質(zhì)位置上出現(xiàn)的特定氨基酸等特征進行著色標記。用戶利用該工具可提交序列的原始數(shù)據(jù),也可使用FASTA格式序列文件或在一個單獨元數(shù)據(jù)表,結(jié)合IRD中的數(shù)據(jù),應(yīng)用IRD中的工具進行分析。用戶利用Archaeopteryx-js進化樹查看器對構(gòu)建的進化樹進行可視化和修飾,也可通過meta-CATS對序列進行比較而對元數(shù)據(jù)進行分組。
近年來,流感病毒的一些新蛋白如 PB1-F2蛋白、PB1-N40、PA-N155和PA-N182得到了確認。為了分析這些新發(fā)現(xiàn)的蛋白,IRD團隊開發(fā)了一種注釋算法以預(yù)測ORF和PB1-N40、PA-N155、PA-N182等新蛋白的序列。IRD已經(jīng)注釋了具有變異蛋白的流感片段序列,用戶可以通過核苷酸序列和蛋白質(zhì)序列檢索頁面圖檢索到,并能轉(zhuǎn)換為適用于IRD分析工具的形式下載下來。
早期IRD開發(fā)了一種用于研究基因型與表型間的工具——序列特征型變異組件(Sequence Feature Variant Type,SFVT)。該組件整和了流感病毒序列特征(Sequence Features,SFs),SF用于具有特殊結(jié)構(gòu)或功能的蛋白區(qū)域的分析。目前SFVT組件已經(jīng)擴展到突出變異類型,與已知的、重要的表型特征有關(guān)的信息。為應(yīng)對高致病性H5N1亞型禽流感的暴發(fā),并考慮到宿主范圍、地理區(qū)域,IRD完成了H5N1基因變異方面的探索,以有助于對可能造成的潛在大流行的H5N1毒株的識別。此次研究包括對毒株序列標記相關(guān)的表型功能如毒力確定、組織噬性、臨床癥狀、復(fù)制能力、聚合酶活性、活化PH值、傳播能力、宿主適應(yīng)能力、抗病毒藥物活性、敏感溫度等方面的內(nèi)容。
IRD開發(fā)了一種可以對豬流感病毒HA(H1)序列系統(tǒng)進化進行分類的算法。該算法構(gòu)建HA參考進化樹,應(yīng)用pplacer方法將查詢序列置于參考進化樹,從而確定查詢序列最密切相關(guān)的譜系。在IRD中所有相關(guān)的豬H1序列都已經(jīng)應(yīng)用這種方法制定了分支。該工具還可以為對用戶提供的序列進行H1分支預(yù)測。鑒于H5N1流感病毒的人畜共患風(fēng)險及大流行潛力,IRD開發(fā)了H5分支分類工具,以對高致病性和低致病性的H5 HA序列進行分類。
為了比較不同亞型間流感病毒HA蛋白的氨基酸替換、與表型和功能變化相關(guān)的位點替代、交叉免疫表位識別等內(nèi)容,人們對比較不同HA亞型間氨基酸替代的需求不斷增加。但是基于序列進行不同亞型間的殘基間的比較,一直以來都是人們所面臨難題之一。Burke和Smith提出了一個跨亞型的HA編號方案,其針對A、B型流感病毒共18種亞型,結(jié)合HA序列和結(jié)構(gòu)數(shù)據(jù),提出了不同亞型間的位置功能對等理論。IRD基于此編號方案開發(fā)了HA亞型編碼轉(zhuǎn)換工具,其允許用戶將一種HA蛋白序列的坐標轉(zhuǎn)換為基于其他任何亞型HA蛋白序列的相應(yīng)坐標。該編號轉(zhuǎn)換工具也與IRD中的其他分析工具如序列變異分析工具和meta-CATS進行了集成,其能夠?qū)⒎治鼋Y(jié)果中的坐標轉(zhuǎn)換成一個不同的坐標系的坐標結(jié)果,極大地提升了比對效果。