張 貝,孟 婕,周澤宇,張夕霏,張傳生,耿立英,李祥龍
(河北科技師范學院,河北省特色動物種質(zhì)資源挖掘與創(chuàng)新重點實驗室,河北秦皇島 066004)
干擾素誘導跨膜(IFITM)蛋白家族是JAK-STAT抗病毒通路的重要免疫家族,在病毒的侵入階段發(fā)揮著重要作用。家族主要存在5 個成員,其中和不受干擾素所誘導,而和都是受干擾素所誘導的免疫基因。家族成員對病毒抑制能力存在差異:對冠狀病毒和絲狀病毒的抑制效果更顯著;而對流感病毒的抑制效果最為顯著;和高度同源,但抗病毒效果沒有顯著。前人研究表明,禽類對禽流感病毒具有顯著的抑制作用。
單核苷酸多態(tài)性(SNPs)是基因組中最為豐富的一種遺傳變異類型,也是生物進化的一種原材料。研究發(fā)現(xiàn),基因rs12252 位點的多態(tài)性與各類流感病毒的重癥感染存在關(guān)聯(lián)。Kim 等發(fā)現(xiàn)基因的rs4986790 位點多態(tài)性與人類免疫缺陷病毒的感染存在強關(guān)聯(lián),該位點為錯義突變位點(nsSNPs)。進化是遺傳多樣性與物種多樣性的基礎(chǔ),選擇則是物種進化的主要動力,選擇壓力分析則是進化分析的重要組成部分。Saitou提出堿基的突變大多數(shù)是隨機,然而部分位點在外界選擇壓力下,其突變存在一定的方向。因此,本研究對雞基因SNP 多態(tài)性和nsSNP 功能性進行分析,并分析基因的選擇壓力;挖掘潛在免疫功能性位點,為地方雞種的遺傳資源開發(fā)和優(yōu)良雞種的選育提供理論基礎(chǔ)。
1.1 實驗材料 本研究選取3 個雞種共90 只個體為實驗材料,壩上長尾雞(BS)30 只、北京油雞(BY)30 只、來航雞(LH)30 只,每個品種公母各半。BS 采自張家口市綠色田園禽業(yè)科技有限公司,BY 采自中國農(nóng)業(yè)科學院北京畜牧獸醫(yī)研究所北京油雞資源保種場,LH 采自上海新楊家禽育種中心。進行翅靜脈采血,采用酚-氯仿抽提法提取雞基因組DNA,樣品-20℃冰箱保存?zhèn)溆谩?/p>
1.2 引物設(shè)計、PCR 擴增及測序 根據(jù)NCBI 數(shù)據(jù)庫原雞()基因(NC_052536.1)序列,對基因2 個外顯子使用不同的體系分段PCR擴增。引物序列信息見表1,引物由北京諾賽基因有限公司合成。
表1 雞IFITM3 基因引物信息
Exon1 的PCR 擴增反應(yīng)體系為:TaKaRa(R044A)2×PrimeSTAR GC Buffer 12.5 μL,PrimeSTAR HS DNA Polymerase 0.25 μL,dNTP Mixture 2 μL,上、下游引物(10 pmol/μL)各1 μL,DNA 模 板(10 ng/μL)1 μL,ddHO 7.25 μL,共25 μL。反應(yīng)條件:98℃變性10 s,60 ℃退火5 s,72 ℃延伸50 s,共30 個循環(huán)。Exon2的PCR 擴增反應(yīng)體系為:2×Taq PCR Mix(CWBIOCW2849M)12.5 μL,上、下游引物(10 pmol/μL)各1 μL,DNA 模板(10 ng/μL)1 μL,ddHO 9.5 μL,共25 μL。反應(yīng)程序為:94℃預(yù)變性5 min;94℃變性30 s,57℃退火30 s,72℃延伸1 min,共30 個循環(huán);72℃延伸5 min;4℃保存。使用1.5%瓊脂糖凝膠進行電泳檢測,將與目的條帶一致的樣品分別送北京諾賽基因有限公司和北京華大基因有限公司進行Sanger 測序。
1.3 IFITM3 蛋白的生物信息學分析 利用多種在線網(wǎng)站及軟件對IFITM3 蛋白序列的理化性質(zhì)、信號肽、跨膜結(jié)構(gòu)、磷酸化、棕櫚?;透呒壗Y(jié)構(gòu)等進行分析,相關(guān)信息見表2。
1.4基因的多態(tài)性分析 利用DNAMAN V6進行序列的比對拼接,獲得雞完整的編碼區(qū)(Coding Sequences,CDS)序列。利用Chromas1.62和MEGA X 查看測序圖譜,統(tǒng)計分析測序結(jié)果。利用Popgen32 分析基因中SNP 位點的遺傳多態(tài)性,利用PIC_CALC 計算SNP 位點的多態(tài)信息含量(Polymorp hism Information Content,PIC)。
1.5基因nsSNP 的生物信息學分析 利用SIFT、PolyPhen-2、PROVEN 和SNAP 對nsSNPs 位點的有害性進行分析;利用I-MUTANT3.0 對nsSNPs位點蛋白的穩(wěn)定性進行分析。同時利用ConSurf 對nsSNPs 位點的保守性進行預(yù)測分析。本研究使用trRosetta 對蛋白進行從頭計算建模,構(gòu)建蛋白的高級結(jié)構(gòu)模型。利用Pymol2.5 展示蛋白高級結(jié)構(gòu)模型,并對nsSNPs 突變位點的氫鍵變化進行分析。相關(guān)網(wǎng)址信息見表2。
表2 雞IFITM3 基因生物信息學分析的相關(guān)網(wǎng)址
1.6基因的選擇壓力分析 利用EasyCodeML1.4對基因進行選擇壓力分析,可檢測基因編碼區(qū)的正選擇位點。常用=Ka/Ks 值來判定位點是否受到了正選擇壓力,其中>1 表示位點受正選擇壓力,=1 表示位點受中性選擇,<1 則受純化選擇(也稱負選擇)壓力。EasyCodeML1.4 有多種模型計算方式,M1a 和M7 模型是被設(shè)置為序列只有保守位點和中性位點,即位點0<≤1;而M2a 和M8 模型增加了正選位點的計算,即值可大于1。從NCBI 數(shù)據(jù)庫下載紅原雞(NM_001350061)、綠頭鴨(KX811739)、鴻雁(KX594327.1)、朱鹮(XM_009463652)、褐背擬地鴉(XM_005529103)、加那利雀(XM_018907951)、阿德利企鵝(XM_009334087)和白喉帶鹀(XM_00549 4829)的CDS 序列,和測序雞種的序列整合成一個文檔,進行禽類基因的選擇壓力分析。本研究將測序雞種分為地方雞種(BS 和BY)和商業(yè)雞種(LH)2 個群體,利用LOSITAN 對2 個群體的編碼區(qū)SNP 位點進行群體選擇壓力分析。
2.1 雞基因編碼區(qū)的PCR 擴增及序列分析 分析發(fā)現(xiàn)雞基因的2 個外顯子序列的GC 含量存在差異,則使用不同的PCR 體系進行分段擴增。由圖1 可知,擴增條帶特異清晰,擴增片段與目標條帶相符,可進行下一步實驗。
圖1 雞IFITM3 基因編碼區(qū)PCR 結(jié)果
2.2 雞IFITM3 蛋白的生物信息學分析
2.2.1 雞IFITM3 蛋白質(zhì)理化性質(zhì)分析 分析表明,雞基因編碼區(qū)大小為414 bp,共編碼137 個氨基酸,其蛋白質(zhì)的分子式為CHNOS,原子總數(shù)2 122,相對分子質(zhì)量14 961.49,哺乳動物機體外的估計半衰期為30 h,其不穩(wěn)定指數(shù)為 37.19,屬于穩(wěn)定蛋白;由20 種氨基酸組成,其中亮氨酸含量最高,為10.9%,色氨酸含量最低,為0.7%。該蛋白質(zhì)理論等電點6.89,為偏酸性蛋白;脂溶系數(shù)為103.87,總平均親水系數(shù)為0.302。利用ProtScale 對蛋白的疏水性進行分析;橫坐標表示氨基酸位置,縱坐標表示疏水大小得分(Score),Score<0 表示親水,Score >0 表示疏水。結(jié)果表明,親水性得分最高為肽鏈的128Q(-2.522),疏水性得分最高為109I(3.933);肽鏈上的疏水性氨基酸多于親水性氨基酸,該蛋白質(zhì)為疏水性蛋白(圖2A)。
2.2.2 IFITM3 蛋白高級結(jié)構(gòu)預(yù)測分析 由圖2B 可知,氨基酸二級結(jié)構(gòu)由-螺旋(41.61%),無規(guī)則卷曲(37.23%),延伸鏈(13.87%),轉(zhuǎn)角(7.30%)所構(gòu)成,可見此蛋白質(zhì)主要由-螺旋和無規(guī)則卷曲構(gòu)成。且雞IFITM3 蛋白的三級結(jié)構(gòu)預(yù)測結(jié)果與二級結(jié)構(gòu)分析結(jié)果相一致(圖3)。使用InterPro 分析發(fā)現(xiàn):蛋白質(zhì)的功能域為CD255,位于41~108 氨基酸區(qū)間。分析可知,V103I位點在突變前后,其氫鍵的連接種類和數(shù)目未發(fā)生改變(圖3)。H126P 位點在突變后失去了4 個氫鍵,即該位點變異前和4 個氨基酸(123I、122N、129Q、130H)發(fā)生4 個氫鍵連接;突變后無氫鍵連接,只和相鄰氨基酸發(fā)生肽鍵連接。進一步分析發(fā)現(xiàn)V103I 位點位于跨膜螺旋區(qū)(TMhelix2),H126P 位于膜外區(qū)(圖2C)。
圖3 雞 IFITM3 基因nsSNPs 氫鍵變化結(jié)果
2.2.3 IFITM3 蛋白信號肽、跨膜區(qū)及修飾位點的預(yù)測分析 雞IFITM3 蛋白的信號肽預(yù)測表明,Singal Peptide預(yù)測值為0.002,Other 預(yù)測值為0.998;即該蛋白質(zhì)不具有信號肽,屬于非分泌型蛋白??缒^(qū)域預(yù)測結(jié)果顯示,該蛋白存在2 個跨膜區(qū)域:TMhelix1 區(qū)域為46~68,TMhelix2 區(qū)域為101~123;即 雞IFITM3 蛋 白為跨膜蛋白(圖2C)。磷酸化位點預(yù)測結(jié)果顯示,該蛋白具有6 個絲氨酸(7、29、49、69、86 和89)、5 個蘇氨酸(30、36、52、53 和90)、3 個酪氨酸(55、81和93)的磷酸化位點。糖基化位點預(yù)測結(jié)果表明,只預(yù)測到1 個N 型糖基化修飾位點(95)和4 個O 型糖基化修飾位點(7、29、30 和33)。棕櫚酰化位點預(yù)測結(jié)果顯示,該蛋白具有2 個棕櫚酰化位點(59 和60)。
圖2 雞 IFITM3 蛋白分析結(jié)果
2.3基因多態(tài)性分析
2.3.1基因SNP 位點的篩查 由圖4 可知,雞基因存在5 個SNP 位點:SNP1(g.330G>T)、SNP2(g.867T>G)、SNP3(g.893T>C)、SNP4(g.991A>G)和SNP5(g.1177C>A)(以外顯子1 的起始位點為+1)。檢測到的SNP 位點數(shù)目較少,其中SNP3 為可變剪切位點,SNP4 為錯義突變位點。
圖4 雞 IFITM3 基因SNP 突變位點
2.3.2基因SNP 的多態(tài)性分析 由表3 和表4可知,SNP1 在原雞為T,在測序的雞種中都為G,基因型皆為GG。這表明在測序雞種群體中其位點已固定,不具有多態(tài)性。SNP3 屬于可變剪切位點,優(yōu)勢基因C,主要基因型為CC。然而,依據(jù)Ensemble 數(shù)據(jù)庫的紅原雞基因信息(ENSGALG00000026970)分析發(fā)現(xiàn),雞基因不存在多個轉(zhuǎn)錄本。這表明SNP3 突變不影響蛋白的正常剪切,該位點極可能是中性突變。SNP4 為錯義突變(V103I),其優(yōu)勢基因A,主要的基因型為AA。多態(tài)性分析發(fā)現(xiàn),SNP2 在3 個雞種的PIC 值都小于0.25,為低度多態(tài)性;SNP3 只在BS 群體中PIC 值為0.255,具有中度多態(tài)性;其他群體為低度多態(tài)性。SNP4 在BY 和LH 群體的PIC 值大于0.25,具有中度多態(tài)性。SNP5 在3 個群體的PIC 值都大于0.25,都具有中度多態(tài)性。并且PIC 值的結(jié)果與觀測雜合度和期望雜合度的分析相符合,即SNP3、SNP4、SNP5 位點的遺傳豐度較高。
表3 雞 IFITM3 基因的SNP 等位基因頻率信息
表4 雞 IFITM3 基因SNP 位點多態(tài)性信息
2.4基因nsSNPs 的生物信息學分析
2.4.1 nsSNPs 的功能性預(yù)測結(jié)果 由圖5 可知,此次測序發(fā)現(xiàn)的nsSNPs 只有SNP4。將測序結(jié)果與Ensemble數(shù)據(jù)庫比對發(fā)現(xiàn),基因還存在一個nsSNPs 未檢測到,則將其補充為SNP6(g.1061C>A)。由表5 可知,V103I 位點被5 種軟件預(yù)測為中性/良性;而H126P 除被SNAP 軟件預(yù)測有影響,其余4 種也預(yù)測為中性/良性。功能性預(yù)測分析只是nsSNPs 預(yù)測分析的一類方式,要充分研究nsSNPs 突變對蛋白的影響還需更深入分析。
表5 雞IFITM3 基因nsSNPs 有害性結(jié)果
2.4.2 基因nsSNPs 的保守性分析 利用ConSurf 預(yù)測IFITM3 蛋白的進化保守位點,對2 個nsSNPs 位點進行分析,結(jié)果可見圖5。得分7~9 分才被認為是保守性位點,其余得分為非保守性位點。V103I 和H126P 位點的保守性得分皆低于6,屬于非保守位點。
圖5 雞 IFITM3 的nsSNPs 保守性結(jié)果
2.5基因的選擇壓力分析
2.5.1 禽類正選擇位點檢測 由表6 可知,M7vs.M8 比對模型值小于0.05,檢測到具有顯著性的正選擇位點。分析發(fā)現(xiàn),正選擇位點只有120V,其定位參照紅原雞IFITM3 蛋白序列。生物信息學分析發(fā)現(xiàn),該位點為可變位點,位于蛋白質(zhì)的跨膜螺旋(TMhelix2)中,其抗病毒的重要程度可能更高。
表6 禽類IFITM3 基因正選擇分析結(jié)果
2.5.2 雞基因SNP 的群體選擇壓力分析 商業(yè)雞種過于關(guān)注雞肉生長速度和產(chǎn)蛋等商業(yè)性狀,自身的免疫能力存在不足;地方雞種通常存在比較豐富的SNP變異,其遺傳的多樣性能提升機體抗病原的能力。免疫基因的SNP 位點很可能在2 種類型的群體中存在分化,即對測序3 個雞種分類為地方雞種和商業(yè)雞種。由圖6 可知,本研究測序發(fā)現(xiàn)的基因5 個SNP位點,除SNP1 位點已經(jīng)固定,其余4 個SNP 位點都被預(yù)測為中性突變。這表明雞IFITM3 蛋白序列在種內(nèi)的進化十分保守。
圖6 雞 IFITM3 基因SNPs 的群體選擇壓力結(jié)果
基因家族是一類具有廣譜性抗病毒功能的免疫分子,在調(diào)控機體免疫、炎癥效應(yīng)及抗增殖等過程中發(fā)揮著重要作用。其中,是家族的重要免疫成員之一,在禽類的抗病毒通路中發(fā)揮著顯著作用。潘陽等發(fā)現(xiàn)的rs12252 位點CC 基因型與新冠肺炎重癥感染存在強關(guān)聯(lián);這與Kim 等發(fā)現(xiàn)的結(jié)果相印證。近些年,基因的SNP 多態(tài)性的研究逐漸熱門,主要集中在哺乳動物特別是人類中,在禽類物種的研究相對較少。
本研究得到了雞基因的CDS 區(qū)為414 bp,共編碼137 個氨基酸。分析發(fā)現(xiàn),該蛋白具有的CD225結(jié)構(gòu)域和2 個TMhelix 區(qū)域都與先前研究相印證,表明雞IFITM3 蛋白具有較高的保守性。Yount 等發(fā)現(xiàn)人IFITM3 蛋白半胱氨酸位點的棕櫚酰化能增強蛋白與脂膜的親和力,提高蛋白的抗病毒活性。本研究預(yù)測發(fā)現(xiàn)2 個棕櫚?;稽c,推測該位點可能影響蛋白的抗病毒功能。本研究對雞IFTM3 的nsSNPs 位點進行生物信息學分析,發(fā)現(xiàn)V103I 預(yù)測為中性的非保守位點,且突變前后氫鍵數(shù)目和種類無改變;這說明此位點的突變對蛋白結(jié)構(gòu)的影響較低。H126P 位點位于胞外區(qū)屬于非保守性位點,被SNAP 軟件預(yù)測為有害性;且其突變導致該位點失去4 個氫鍵。丁吉勇研究發(fā)現(xiàn)p53蛋白的Y220C 突變會導致分子內(nèi)氫鍵數(shù)目減少,降低Y220C 簇的穩(wěn)定性,破壞蛋白原有的Beta-折疊結(jié)構(gòu)。這暗示著H126P 位點的突變極有可能減弱該位點分子間的作用力,降低蛋白質(zhì)空間結(jié)構(gòu)的穩(wěn)定性。有趣的是,126 位點在測序3 個雞種群體中都為突變前的組氨酸,這可能是優(yōu)勢基因型的累積效應(yīng)造成的結(jié)果。
禽類的選擇壓力分析中,只檢測到120V 正選擇位點,位于跨膜螺旋區(qū);測序雞種內(nèi)的選擇壓力分析中,位點都位于中性進化壓力下。這表明的編碼區(qū)序列相當保守,受到強烈的負選擇壓力;也有可能是本研究選擇的雞種和序列樣本量不夠豐富,導致正選位點被淹沒在常見的負選擇和中性選擇位點中,但具體機制有待于進一步探索。
本研究發(fā)現(xiàn)雞的nsSNPs 和正選擇位點數(shù)量較少,序列在種間/種內(nèi)的進化水平都十分保守,蛋白受到強烈的負選擇壓力。本研究可為地方雞種遺傳資源的開發(fā)提供理論基礎(chǔ),分析發(fā)現(xiàn)H126P 位點可作為優(yōu)良雞種免疫分子選育的標記位點。