黃蔚虹,陳永杰,孫彥闊,孫衛(wèi)東
(1 南京農(nóng)業(yè)大學(xué) 動(dòng)物醫(yī)學(xué)院,江蘇 南京 210095; 2 廣東省動(dòng)物源性人獸共患病預(yù)防與控制重點(diǎn)實(shí)驗(yàn)室/華南農(nóng)業(yè)大學(xué) 獸醫(yī)學(xué)院,廣東 廣州 510642)
H9N2 禽流感在1994 年首次暴發(fā)于我國廣東省,引起蛋雞產(chǎn)蛋率降低(14%~75%)和肉雞死亡(10%~40%)[1]。在過去20 多年中,H9N2 禽流感病毒(Avian influenza virus,AIV)迅速蔓延傳播,成為我國流行最為廣泛的AIV 亞型[2]。H9N2 AIV 與細(xì)菌、病毒等病原體共感染時(shí),可造成家禽死亡率大幅升高,對(duì)家禽養(yǎng)殖業(yè)構(gòu)成嚴(yán)重威脅。同時(shí),H9N2亞型禽流感已出現(xiàn)跨種傳播的現(xiàn)象,廣東、香港、湖南和安徽均出現(xiàn)人感染H9N2 AIV 的病例[2]。
同義密碼子的使用具有某種傾向性,并非是一個(gè)隨機(jī)的過程。在蛋白質(zhì)翻譯過程中,部分同義密碼子會(huì)比其他密碼子使用度更高,這被稱為密碼子使用偏好性(Codon usage bias)[3]。若病毒在同一宿主長時(shí)間循環(huán),則該病毒的密碼子使用模式將趨同于宿主的密碼子使用模式(即病毒使用與宿主相同的同義密碼子以翻譯某一氨基酸),以便更好地利用宿主細(xì)胞資源進(jìn)行病毒復(fù)制、繁殖[4]。研究密碼子使用模式有助于解釋病毒在基因進(jìn)化過程中所發(fā)生的適應(yīng)性變化,進(jìn)一步認(rèn)識(shí)病毒的基因表達(dá)調(diào)控,有助于病毒疫苗的研制[5-6]。H9N2 AIV 對(duì)家禽養(yǎng)殖和人類健康的威脅日益加劇,但目前對(duì)H9N2 AIV 密碼子使用模式的研究較少。
為了探討近年來H9N2 AIV 的密碼子使用偏好性及其影響因素,本研究選取90 株2010—2018 年H9N2 AIV 的全基因組為研究對(duì)象,分析其堿基組成特性、最優(yōu)密碼子、密碼子使用偏好性的影響因素以及病毒對(duì)宿主密碼子使用模式的適應(yīng)性,以期為H9N2 AIV 基因進(jìn)化、已有疫苗密碼子的優(yōu)化和新型疫苗(密碼子去優(yōu)化疫苗)研制提供理論依據(jù)。
利用NCBI 數(shù)據(jù)庫(http://www.ncbi.nlm.nih.gov/genomes/FLU/FLU.html)檢索獲取2010—2018 年中國H9N2 AIV 全基因組(內(nèi)含8 個(gè)節(jié)段的完整編碼序列),根據(jù)遺傳進(jìn)化分析結(jié)果,從中選取90 個(gè)H9N2 AIV 流行毒株的全基因組。每株病毒的編碼序列按PB2+PB1+PA+HA+NP+NA+M+NS 順序進(jìn)行拼接。
利用CodonW 1.4.4 軟件計(jì)算H9N2 AIV 基因組的密碼子使用偏好性參數(shù),包括同義密碼子第3 位各堿基(A3S、U3S、C3S和G3S)含量,同義密碼子第3 位的GC(GC3S)含量,有效密碼子數(shù)(Effective number of codons,ENC),總平均親水性(General average hydropathicity)和芳香性(Aromaticity)。用Puigbò等[7]的方法計(jì)算各堿基(A、U、C 和G)含量,GC 含量,密碼子第3 位各堿基(A3、U3、C3和G3)含量,密碼子第3 位的GC(GC3)含量,密碼子第1、2 位的GC(GC12)平均含量,同義密碼子相對(duì)使用度(Relative synonymous codon usage)和密碼子適應(yīng)指數(shù)(Codon adaptation index)。宿主雞Gallus gallus 和人Homo sapiens 的密碼子使用模式獲取自密碼子使用數(shù)據(jù)庫(http://www.kazusa.or.jp/codon/)[8]。
ENC 為20~60,與密碼子使用偏好性呈負(fù)相關(guān),ENC≤35 說明密碼子使用偏好性高,ENC>50 說明密碼子使用偏好性低[9]。ENC 繪圖是以ENC 為縱坐標(biāo)、GC3S含量為橫坐標(biāo)繪制的二維散點(diǎn)圖,若基因組位于標(biāo)準(zhǔn)曲線(即ENC期望與GC3S含量的函數(shù)關(guān)系)上或其附近,表明密碼子使用偏好性僅受突變壓力影響;若基因組位于標(biāo)準(zhǔn)曲線下方較遠(yuǎn)的位置,表明密碼子使用偏好性受其他因素(如自然選擇)影響。ENC期望與GC3S含量的函數(shù)關(guān)系為:
式中,s 為GC3S含量[9]。
采用中性繪圖[w(GC3)為橫坐標(biāo)、w(GC12)為縱坐標(biāo)]分析突變壓力和自然選擇對(duì)密碼子使用偏好性的影響程度。若回歸曲線斜率接近1,即基因組幾乎沿對(duì)角線分布,表示密碼子使用偏好性僅受突變壓力影響;隨著斜率逐漸減小,甚至減小為0,自然選擇對(duì)密碼子使用偏好性的作用逐漸增大[5]。
以w(A3)/w(A3+U3)為縱坐標(biāo)、w(G3)/w(G3+C3)為橫坐標(biāo)繪制二維散點(diǎn)圖,若w(A3)=w(U3) 且w(C3)=w(G3),基因組均勻分布于圖中心(橫、縱坐標(biāo)均為0.5),表明突變壓力和選擇率(替代率)對(duì)密碼子使用的作用相等;反之,兩者作用存在差異[5]。
密碼子適應(yīng)指數(shù)為0~1,值越高,病毒對(duì)宿主的適應(yīng)性越強(qiáng)[10]。密碼子適應(yīng)指數(shù)和ENC 之間的相關(guān)性分析可確定突變壓力和自然選擇對(duì)密碼子使用偏好性的相對(duì)影響。若自然選擇優(yōu)于突變壓力,則密碼子適應(yīng)指數(shù)和ENC 之間的相關(guān)性高,相關(guān)系數(shù)(r)趨向于-1;相反,若突變壓力更為重要,則r 應(yīng)接近0,密碼子適應(yīng)指數(shù)和ENC 之間無相關(guān)性[11]。
同義密碼子相對(duì)使用度是其實(shí)際使用頻率與期望頻率(某一特定氨基酸的所有同義密碼子能被均等使用的情況下該密碼子的使用頻率)的比率。同義密碼子相對(duì)使用度等于1 代表對(duì)應(yīng)氨基酸無密碼子使用偏好性,大于1 代表對(duì)應(yīng)氨基酸對(duì)該密碼子的使用較多,小于1 代表對(duì)該密碼子的使用較少。對(duì)應(yīng)性分析(Correspondence analysis)是常用于研究密碼子使用模式的多元統(tǒng)計(jì)分析方法,基于各基因組的同義密碼子相對(duì)使用度,將每個(gè)基因組依密碼子使用頻率在1 個(gè)59 維的向量空間內(nèi)表示[12]。
各基因組的ENC 從高到低依次排序,從上限區(qū)域和下限區(qū)域各取10%的基因組作為高、低表達(dá)組,使用t 檢驗(yàn)分析兩組之間密碼子使用的差異顯著性。比較兩組的同義密碼子相對(duì)使用度,若差異≥0.0 8,并且高表達(dá)組顯著高于低表達(dá)組(P<0.01),則該密碼子被定義為最佳密碼子[9,13]。
使用CodonW 1.4.4 軟件對(duì)同義密碼子相對(duì)使用度進(jìn)行對(duì)應(yīng)性分析,通過SPSS 23.0 軟件完成t 檢驗(yàn)和Spearman 相關(guān)性分析,使用SigmaPlot 12.5 軟件繪圖。
由2010—2018 年H9N2 AIV 基因組的堿基組成分析結(jié)果(表1) 可知,各堿基含量為A(32.92%~33.03%)>G(24.65%~24.72%)>U(22.88%~22.90%)>C(19.41%~19.49%)。2010—2018 年GC 含量整體呈下降趨勢,且均少于50%,提示H9N2 AIV 基因組中AU 含量多于GC 含量,堿基組成更傾向于使用AU,隨著時(shí)間推移,該傾向性逐漸加大。同義密碼子第3 位堿基含量為A3S(41.42%~41.80%)>U3S(30.76%~30.95%)>G3S(27.74%~28.11%)>C3S(26.51%~26.73%),GC3S含量變化與GC 相同,說明以A 或U 作為末位堿基的同義密碼子的使用度較大,隨著時(shí)間推移,其使用度將逐漸增大。
表 1 H9N2 禽流感病毒基因組的堿基組成分析1)Table 1 Base composition analysis of H9N2 avian influenza virus genomes %
以ENC 為依據(jù)形成的高、低表達(dá)組數(shù)據(jù)如表2所示,大部分同義密碼子相對(duì)使用度差異較小且無顯著性差異,僅有10 個(gè)密碼子(UUU、GUU、GUA、GCU、GCC、GAU、CGU、CGA、GGU 和GGC)滿足相對(duì)使用度差異≥0.08 且高表達(dá)組相對(duì)使用度顯著高于低表達(dá)組(P<0.01)的條件,因此這10 個(gè)密碼子可判定為最優(yōu)密碼子。其中有8 個(gè)最優(yōu)密碼子均以A 或U 結(jié)尾,僅有2 個(gè)以C 結(jié)尾,說明最優(yōu)密碼子的形成可能主要受到堿基組成限制,可能存在突變壓力影響密碼子使用偏好性。
2010—2018 年H9N2 AIV 的ENC 為51.90~55.01,平均值52.86,標(biāo)準(zhǔn)差0.64,說明H9N2 AIV 的密碼子使用偏好性較低。在ENC 繪圖(圖1)分析中,所有點(diǎn)均聚集于標(biāo)準(zhǔn)曲線的下方,說明H9N2 AIV 密碼子使用偏好性的主導(dǎo)因素并非突變壓力,而是其他影響因素如自然選擇。
PR2 繪圖分析結(jié)果(圖2)顯示,2010—2018 年H9N2 AIV 基因組主要聚集于圖中心(橫、縱坐標(biāo)均為0.5)的右上方,基因組對(duì)AU 的使用度大于GC,其中w(A3)>w(U3)且w(G3)>w(C3),這表明密碼子使用偏好性可能由突變壓力和其他因素(如自然選擇)共同決定,但兩者作用存在差異。
圖 2 不同年份H9N2 禽流感病毒的PR2 繪圖分析Fig. 2 PR2 plot analysis of H9N2 avian influenza virus in different years
圖 3 不同年份H9N2 禽流感病毒的對(duì)應(yīng)性分析Fig. 3 Correspondence analysis of H9N2 avian influenza virus in different years
2.3.1 H9N2 禽流感病毒密碼子使用偏好性受突變壓力的影響 對(duì)2010—2018 年H9N2 AIV 進(jìn)行對(duì)應(yīng)性分析(圖3),結(jié)果顯示第1、2 軸分別解釋34.65%和21.34%的變異,大部分基因組都聚集在原點(diǎn)(橫、縱坐標(biāo)均為0)周圍,彼此之間不存在太大差異,這提示各基因組間的密碼子使用偏好性差異相對(duì)較小。第1、2 軸與堿基組成指數(shù)進(jìn)行相關(guān)性分析(表3),結(jié)果顯示第1、2 軸與ENC 均呈極顯著正相關(guān)(r=0.633、0.216,P<0.001);第1、2 軸與大部分堿基組成指數(shù)呈顯著相關(guān),其中第1 軸與GC 含量呈極顯著正相關(guān)(r=0.510,P<0.001),第2 軸與G3S含量呈極顯著負(fù)相關(guān)(r=-0.717,P<0.001)。這提示堿基組成對(duì)密碼子使用偏好性產(chǎn)生影響。
2.3.2 H9N2 禽流感病毒密碼子使用偏好性受自然選擇的影響 第1、2 軸與總平均親水性、芳香性進(jìn)行相關(guān)性分析(表3),結(jié)果顯示第1、2 軸與總平均親水性、芳香性均存在顯著相關(guān)性,這說明氨基酸的疏水性和芳香性均顯著影響密碼子使用偏好性。此外,對(duì)2010—2018 年H9N2 AIV 進(jìn)行密碼子適應(yīng)指數(shù)分析(表4),結(jié)果顯示H9N2 對(duì)宿主的密碼子適應(yīng)指數(shù)平均值隨時(shí)間變化不大,但H9N2 AIV 對(duì)雞的密碼子適應(yīng)指數(shù)平均值(0.766~0.768)均高于對(duì)人的(0.739~0.741)。同時(shí),密碼子適應(yīng)指數(shù)與ENC 相關(guān)性分析發(fā)現(xiàn),除了2013—2015 年H9N2 AIV 對(duì)人的密碼子適應(yīng)指數(shù)與ENC 相關(guān)性不顯著(r=-0.223,P=0.237),其余密碼子適應(yīng)指數(shù)均與ENC 呈顯著負(fù)相關(guān),說明自然選擇對(duì)H9N2 AIV 的密碼子使用偏好性產(chǎn)生重要影響,但r≠-1,所以也存在突變壓力產(chǎn)生影響。
表 3 前兩主軸對(duì)應(yīng)性分析及與密碼子使用偏好性主要參數(shù)的相關(guān)性分析Table 3 Correspondence analyses of the first two principle axes and correlation analyses between the first two principle axes and main parameters of codon usage bias
表 4 H9N2 禽流感病毒基因組的密碼子適應(yīng)指數(shù)分析1)Table 4 Codon adaptation index analysis of H9N2 avian influenza virus genomes
2.3.3 突變壓力和自然選擇對(duì)密碼子使用偏好性的相對(duì)作用比例 由中性繪圖分析和GC12含量與GC3含量相關(guān)性分析(圖4)可知,2010—2012、2013—2015 和2016—2018 年的GC12含量與GC3含量均呈極顯著負(fù)相關(guān)(r=-0.720、-0.826、-0.595,P<0.001),提示密碼子的這3 個(gè)位置均受到突變壓力的影響。對(duì)2010—2012、2013—2015 和2016—2018 年的GC12含量與GC3含量進(jìn)行線性回歸分析發(fā)現(xiàn),斜率分別為-0.238 5、-0.382 1 和-0.346 4,表明突變壓力對(duì)H9N2 AIV 密碼子使用偏好性的影響分別為23.85%(2010—2012 年)、38.21%(2013—2015 年) 和34.64%(2016—2018 年),所以自然選擇對(duì)密碼子使用偏好性的影響較大,分別為76.15%(2010—2012 年)、61.79%(2013—2015 年) 和65.36%(2016—2018 年)。
圖 4 不同年份H9N2 禽流感病毒的中性繪圖分析Fig. 4 Neutrality plot analysis of H9N2 avian influenza virus in different years
H9N2 AIV 全基因組的堿基組成特性和最優(yōu)密碼子結(jié)果顯示,基因組中AU 含量較多且偏好使用以A 或U 為末位堿基的同義密碼子,這提示密碼子使用偏好性可能對(duì)H9N2 AIV 的進(jìn)化產(chǎn)生影響。ENC 與密碼子使用偏好性呈負(fù)相關(guān),密碼子使用偏好性大小可通過ENC 值來進(jìn)行評(píng)估,本研究發(fā)現(xiàn)H9N2 AIV 的ENC 平均值為52.86,說明不同序列間的基因組組成保守且相對(duì)穩(wěn)定,H9N2 AIV 的密碼子使用偏好性較低,這與其他A 型流感病毒和一些RNA 病毒相似,如H3N8(ENC=52.09)[14]、H5N1(ENC=50.91)[15]、H1N1pdm(ENC=52.5)[16]、H3N2(ENC=53.05)[3]、寨卡病毒(ENC=53.93)[17]和馬爾堡病毒(ENC=54.2)[5]。低密碼子使用偏好性病毒與宿主的合成競爭較低,可在與其密碼子使用模式不相同的宿主細(xì)胞內(nèi)進(jìn)行有效的復(fù)制,從而在宿主體內(nèi)維持其存活周期[5,16]。密碼子使用偏好性可能會(huì)受到突變壓力、自然選擇、基因長度、GC 含量、基因表達(dá)水平和RNA 結(jié)構(gòu)等因素的影響,其中突變壓力和自然選擇為主要影響因素[18-19]。
為了確定突變壓力對(duì)密碼子使用偏好性的作用,對(duì)應(yīng)性分析的第1、2 軸與堿基組成指數(shù)的相關(guān)性分析結(jié)果顯示第1、2 軸與大部分堿基組成指數(shù)呈顯著性相關(guān),提示堿基組成對(duì)密碼子使用偏好性產(chǎn)生影響,即突變壓力為H9N2 AIV 密碼子使用偏好性的主要影響因素之一。但當(dāng)病毒試圖適應(yīng)宿主細(xì)胞時(shí),密碼子使用偏好性往往會(huì)受到自然選擇而降低[19]。對(duì)應(yīng)性分析的第1、2 軸與總平均親水性、芳香性之間均呈現(xiàn)顯著相關(guān)性,這說明氨基酸的疏水性和芳香性均顯著影響著密碼子使用偏好性,自然選擇作用于H9N2 AIV 的密碼子使用偏好性。PR2 繪圖分析發(fā)現(xiàn)基因組對(duì)AU 的使用度大于GC,揭示H9N2 AIV 密碼子使用偏好性可能由突變壓力和其他因素(如自然選擇)共同決定,但兩者作用不相同。綜合對(duì)應(yīng)性分析、PR2 繪圖和相關(guān)性分析結(jié)果,可得出結(jié)論:突變壓力和自然選擇為主要影響因素,共同作用于H9N2 AIV 密碼子使用偏好性;兩者作用的相對(duì)大小仍為未知。
為了衡量突變壓力和自然選擇對(duì)密碼子使用偏好性作用的相對(duì)大小,ENC 繪圖分析發(fā)現(xiàn)所有基因組均聚集于標(biāo)準(zhǔn)曲線的下方,提示突變壓力并非是H9N2 AIV 密碼子使用偏好性的主導(dǎo)因素,而是其他影響因素(如自然選擇)起主導(dǎo)作用。但有報(bào)道[11]指出突變壓力和自然選擇可能影響ENC,使其不能有效評(píng)估突變壓力和自然選擇對(duì)密碼子使用偏好性的相對(duì)作用;此外,基因組為AU 偏向的物種,其密碼子使用偏好性將與基因組為GC 偏向的存在差異,因此ENC 繪圖分析可能具有誤導(dǎo)性。
密碼子適應(yīng)指數(shù)是研究自然選擇影響密碼子使用偏好性的不二選擇,可用于評(píng)估病毒對(duì)宿主的適應(yīng)性,所以利用ENC 和密碼子適應(yīng)指數(shù)之間的相關(guān)性來研究突變壓力和自然選擇對(duì)密碼子使用偏好性的影響[20]。H9N2 AIV 對(duì)雞和人的密碼子適應(yīng)指數(shù)平均值偏高,提示H9N2 AIV 已適應(yīng)雞和人的密碼子使用模式,能夠更好地利用宿主細(xì)胞資源進(jìn)行病毒復(fù)制和繁殖,有利于病毒在宿主內(nèi)存活和進(jìn)化;而且H9N2 AIV 可能會(huì)發(fā)展為對(duì)人類有致病性的病毒,已有多例H9N2 AIV 感染人類事件發(fā)生[2,21],隨著H9N2 AIV 逐漸適應(yīng)人類密碼子使用模式,對(duì)人類的致病性將逐漸增強(qiáng),因此需要密切監(jiān)測密碼子適應(yīng)指數(shù)變化。同時(shí),密碼子適應(yīng)指數(shù)與ENC 相關(guān)性分析發(fā)現(xiàn)大部分密碼子適應(yīng)指數(shù)與ENC 均呈顯著負(fù)相關(guān)且r≠-1,這說明自然選擇對(duì)密碼子使用偏好性的作用大于突變壓力,但突變壓力的作用也不能忽視。
進(jìn)行中性繪圖分析以揭示兩者作用比例,從GC12含量與GC3含量的線性回歸分析發(fā)現(xiàn),突變壓力對(duì)H9N2 禽流感病毒密碼子使用偏好性的作用分別為23.85%(2010—2012 年)、38.21%(2013—2015 年)和34.64%(2016—2018 年),而自然選擇對(duì)密碼子使用偏好性的作用較大,分別為76.15%(2010—2012年)、61.79%(2013—2015 年) 和65.36%(2016—2018 年)。中性繪圖分析、ENC 繪圖分析、密碼子適應(yīng)指數(shù)及其相關(guān)性結(jié)果揭示,在H9N2 AIV 密碼子使用偏好性中,自然選擇為主導(dǎo)作用(所占比例為61.79%~76.15%),而突變壓力為次要作用(所占比例為23.85%~38.21%)。與H9N2 同為A 型流感病毒的H3N2[3]和H3N8[22]的密碼子使用偏好性也是以自然選擇為主要影響因素。
綜上所述,H9N2 AIV 全基因組為AU 偏向且最優(yōu)密碼子多以A 或U 結(jié)尾,而且H9N2 AIV 基因組的密碼子使用偏好性較低,主要受到突變壓力和自然選擇的共同作用,其中自然選擇為主導(dǎo)作用(所占比例為61.79%~76.15%),而突變壓力為次要作用(所占比例為23.85%~38.21%)。H9N2 AIV 已適應(yīng)人類的密碼子使用模式,可能對(duì)人類有致病性且致病性在逐漸增強(qiáng)。