趙隆麒,王心倩,孫 妍,占衛(wèi)紅,吳啟航,李海波,余曉麗
(武漢輕工大學(xué) 生物與制藥工程學(xué)院,湖北 武漢 430023)
Rv3457c基因及其編碼蛋白基本特性及抗原表位的生物信息學(xué)分析
趙隆麒,王心倩,孫 妍,占衛(wèi)紅,吳啟航,李海波,余曉麗
(武漢輕工大學(xué) 生物與制藥工程學(xué)院,湖北 武漢 430023)
運用生物信息學(xué)對Rv3457c基因編碼蛋白的主要特征進(jìn)行分析,同時預(yù)測并篩選其T/B細(xì)胞表位。運用ProtParam、SingnalP、TMHMM來分析基因編碼蛋白的理化性質(zhì)、信號肽區(qū)、跨膜區(qū);運用NetMHC、Bimas、NetCTL和SYFPEITHI對其T、B細(xì)胞進(jìn)行細(xì)胞表位分析預(yù)測。得到該基因編碼蛋白由1 044個氨基酸組成,原子數(shù)為10 498,理論分子式為C2980H4918N1044O1216S340,分子質(zhì)量為85.7284 KD,等電點的理論值為4.99,半衰期估計值4.4 h,不穩(wěn)定系數(shù)52.31,平均親水性0.938,脂肪系數(shù)20.11;含有潛在T細(xì)胞表位和B細(xì)胞表位。得出至少含有一個T細(xì)胞和一個B細(xì)胞表位,可作為疫苗的研制提供基礎(chǔ)。
Rv3457c;生物信息學(xué);細(xì)胞表位
結(jié)核病是一種由結(jié)核分枝桿菌(Mycobacteriumtuberculosis)造成的危害性極大的慢性傳染病,通常感染肺部和淋巴系統(tǒng),但對身體的其他器官及系統(tǒng)(如腦,循環(huán)系統(tǒng),中樞神經(jīng)系統(tǒng))也會造成感染。結(jié)核分枝桿菌對肺部的感染通常造成肺結(jié)核,主要癥狀為發(fā)熱、咳痰、咳血、胸痛和呼吸困難?;忌辖Y(jié)核病會對人體的活動能力有很大的影響。
我國是結(jié)核病高負(fù)擔(dān)國家,全國的結(jié)核菌感染者超過5億,結(jié)核病確診患者多達(dá)500萬,每年感染結(jié)核病的人數(shù)約為130萬,結(jié)核病感染人數(shù)居于全球第二[1]。我國的結(jié)核疫情存在地區(qū)差異,西部地區(qū)結(jié)核病患病率為中部的1.7倍;農(nóng)村地區(qū)為城市的1.6倍[2]。從二十世紀(jì)四十年代起,隨著鏈霉素的問世,開啟了結(jié)核病的藥物治療時代。隨后氨基水楊酸,乙胺丁醇,異煙肼,利福平相繼出現(xiàn),為結(jié)核病的治療提供更強有力的保障[2]。但是藥物的出現(xiàn)也同樣造成了耐藥菌的出現(xiàn),結(jié)核病也出現(xiàn)了耐多藥結(jié)核病(MDR-TB)和廣泛耐藥結(jié)核病(XDR-TB),這使得結(jié)核病疫情又變得嚴(yán)峻起來。21世紀(jì)以來隨著各項技術(shù)的發(fā)展成熟,人們開始尋找新的靶細(xì)胞位點,以尋求對耐藥結(jié)核病的有效治療??乖砦患纯乖瓫Q定簇,是指位于抗原表面可決定抗原特異性的特定化學(xué)基團(tuán)??乖砦坏拇嬖谑箍乖芎蚑、B淋巴細(xì)胞上的抗原受體進(jìn)行特異性的結(jié)合,從而引起機(jī)體T、B淋巴細(xì)胞發(fā)生免疫應(yīng)答反應(yīng)。人們通過對結(jié)核分枝桿菌的研究,試圖通過其抗原表位特異性的特點來找到合適的靶細(xì)胞藥物,作為結(jié)核病一種新的診斷和治療制劑。
H37RV一直以來作為結(jié)核分枝桿菌研究的標(biāo)準(zhǔn)株,在1998年得到其全基因組后,人們對其基因進(jìn)行了一系列的分析研究,以尋求對結(jié)核病的防治方法。Rv3457c是H37RV標(biāo)準(zhǔn)株上的一段基因序列,筆者通過對其進(jìn)行一系列的生物信息學(xué)分析,來預(yù)測該段基因編碼的蛋白是否具有合適的抗原表位以及可否用于結(jié)核病的診斷。
運用生物信息學(xué)方法對Rv3457c的理化性質(zhì)、信號肽區(qū)、跨膜區(qū)和T、B細(xì)胞表位進(jìn)行分析和預(yù)測。
2.1 Rv3457c理化性質(zhì)分析
運用ExPASy-Protparam(http://web.expasy.org/protparam/)程序測定基因編碼蛋白的氨基酸組成、分子質(zhì)量和等電點等理化性質(zhì)。
2.2 Rv3457c信號肽結(jié)構(gòu)預(yù)測
利用SingnalP(http://www.cbs.dtu.dk/services/SignalP/)在線程序分析該基因編碼蛋白是否含有信號肽及切割位點。
2.3 Rv3457c跨膜區(qū)結(jié)構(gòu)預(yù)測
采用TMHMM(http://www.cbs.dtu.dk/services/TMHMM/)在線分析軟件對其是否存在跨膜區(qū)進(jìn)行分析。
2.4 Rv3457c T細(xì)胞表位預(yù)測
2.4.1 Rv3457c CD4+T細(xì)胞表位預(yù)測
主要組織相容性復(fù)合體II(MHCII)分布于B細(xì)胞、單核/巨噬細(xì)胞、樹突狀細(xì)胞及其他抗原遞呈細(xì)胞(APC)上,將外源性抗原遞呈給CD4+T細(xì)胞。人類的MHCII分子主要包括HLA-DP、HLA-DQ、HLA-DR、HLA-N、HLA-O、HLA-M等基因位點編碼的所有膜抗原。在這里我們選用HLA-DR來進(jìn)行預(yù)測,打開NetMHC(http://www.cbs.dtu.dk/services/NetMHCIIpan/)網(wǎng)站,將Rv3457c的氨基酸序列輸入,設(shè)定氨基酸長度為15[3],選擇等位基因(Select Allele)設(shè)定為DRB1_0101、DRB1_0301、DRB1_0401、DRB1_0701、DRBA_0802、DRB1_0901、DRB1_1101、DRB1_1302、DRB1_1501,將排列方式選擇為按親和值(Affinity)排列,開始分析預(yù)測。
2.4.2 Rv3457c CD8+T細(xì)胞表位預(yù)測
打開網(wǎng)站NetMHC(http://www.cbs.dtu.dk/services/NetMHC/), 打開NetMHC登陸界面,此軟件可分析多種HLA類的MHC分子。與HLA強結(jié)合的肽段數(shù)通常為9個,因此將氨基酸長度設(shè)定為9,同時選擇HLA-A 0201和HLA-A 0301,即A2和A3作為限制條件[4]。選擇以親和值(Affinity)大小排序,然后輸入氨基酸序列開始分析。
進(jìn)入Bimas網(wǎng)站(http://www-bimas.cit.nih.gov/molbio/hla_bind/),選擇同上的MHC分子類型,9個氨基酸,輸入序列開始分析。
打開NetCTL的網(wǎng)址(http://www.cbs.dtu.dk/services/NetCTL/),選擇同上MHC分子類型,選擇分類標(biāo)準(zhǔn)為Combined score,輸入氨基酸序列開始分析。
打開SYFPEITHI網(wǎng)站(http://www.syfpeithi.de/#userconsent#),同樣選擇HLA-A 0201和HLA-A 0301為MHC類型,氨基酸長度為9個,輸入序列,開始分析。
2.5 Rv3457c B細(xì)胞表位預(yù)測
IEDB對B細(xì)胞表位進(jìn)行預(yù)測提供了5種參數(shù),選取Chou&Fasman法預(yù)測氨基酸編碼蛋白質(zhì)的β轉(zhuǎn)角(β-Turn);選取Emini法預(yù)測其表面可及性(Accessibility);選取Karplus&Schulz法預(yù)測其柔韌性(Flexibility);運用Kolaskar&Tongaonkar法預(yù)測其抗原性(Antigenicity);Parker用來預(yù)測其親水性(Hydrophilicity)。打開網(wǎng)站IEDB(http://tools.immuneepitope.org/main/bcell/),輸入氨基酸序列,并分別選擇這5種方法分別進(jìn)行分析。
Bcepred對B細(xì)胞表位預(yù)測提供了7種參數(shù),分別為采用Parker法預(yù)測其親水性;Karplus法預(yù)測其柔韌性;Emini法預(yù)測其表面可及性;Pellequer法預(yù)測β轉(zhuǎn)角;Janin法預(yù)測其暴露表面(Exposed Surface);Ponnuswamy法預(yù)測其極性(Polarity);Kolaskar法預(yù)測其抗原傾向性(Antegenic Propensity)。打開網(wǎng)站Bcepred(http://www.imtech.res.in/raghava/bcepred/bcepred_submission.html),輸入氨基酸序列,選定這7種參數(shù),然后運行。
3.1 Rv3457c理化性質(zhì)分析
經(jīng)ExPASy-Protparam在線軟件分析,Rv3457c編碼蛋白1 044個氨基酸組成,原子數(shù)為10 498,理論的分子式為C2980H4918N1044O1216S340,分子質(zhì)量單位為85.728 4 KD,等電點的理論值為4.99,半衰期估計值4.4 h,不穩(wěn)定系數(shù)52.31,平均親水性0.938,脂肪系數(shù)20.11。
3.2 Rv3457c信號肽結(jié)構(gòu)預(yù)測
采用SignalP程序預(yù)測該基因的信號肽,結(jié)果顯示該基因信號肽的切割位點在第21和第22之間。
3.3 Rv3457c跨膜區(qū)結(jié)構(gòu)預(yù)測
采用TMHMM程序預(yù)測該基因的跨膜區(qū),結(jié)果顯示該基因不存在跨膜區(qū)結(jié)構(gòu)。蛋白質(zhì)在細(xì)胞外。
3.4 Rv3457c T細(xì)胞表位預(yù)測
3.4.1 Rv3457c CD4+T細(xì)胞表位預(yù)測
將預(yù)測結(jié)果匯總?cè)氡?。由表中數(shù)據(jù)可知,DBR1_0301中肽段的結(jié)合數(shù)及強結(jié)合肽段數(shù)都是最多的,在此之中肽段的可選性比較強,故從DRB1_0301中來選其中強結(jié)合的11個肽段72-86VTEIILNLKSLVVSS,71-84DVTEIILNLKSLVVS,50-64VTSIRIDGVLHEFTT,49-63AVTSIRIDGVLHEFT,73-87TEIILNLKSLVVSSE,70-84EDVTEIILNLKSLVV,51-65TSIRIDGVLHEFTTV,48-62AAVTSIRIDGVLHEF,74-88EIILNLKSLVVSSEE,52-66SIRIDGVLHEFTTVP,69-83KEDVTEIILNLKSLV。
表1 Rv3457c與HLA分子結(jié)合總肽段數(shù)匯總
人類白細(xì)胞抗原(HLA)分子亞型Rv3457c的總肽段數(shù)為339強結(jié)合肽段數(shù)弱結(jié)合肽段數(shù)DRB1_0101915DRB1_03011116DRB1_0401118DRB1_0701520DRB1_0802018DRB1_090198DRB1_1101014DRB1_1302517DRB1_1501511
3.4.2 Rv3457c CD8+T細(xì)胞表位預(yù)測
將四個軟件預(yù)測的得分較高的序列進(jìn)行整理匯總,如表2所示。
表2 CD8+T細(xì)胞表位預(yù)測結(jié)果匯總
序列序號序列序列得分NetMHC(Affinity)Bimas(Score)NetCTLSYFPEITHI(Score)76―84IILNLKSLV306.6360.1540.806023300―308KLHQLGLSL337.4374.7681.047125166―174SIYSPVLKV106.0770.3871.0839291―9MLISQRPTL62.6236.3161.039125
結(jié)合表1和表2可知重復(fù)的肽段為76—84 IILNLKSLV,故T細(xì)胞的預(yù)測表位為76—84 IILNLKSLV。
3.5 Rv3457c B細(xì)胞表位預(yù)測
根據(jù)軟件預(yù)測得出的數(shù)據(jù)選取其中綜合得分較高的幾項,分別標(biāo)號為1,2,3,4。1表示序列86—92 SSEEDEP,2表示序列98—104 RKQGPGE,3表示序列309—315 KDSPPSF,4表示序列337—343 DEQDYAE。統(tǒng)計的各個序列得分情況如表3所示。由表3中數(shù)據(jù)可知,序列86—92 SSEEDEP在IEDB和Bcepred中的綜合得分更加高一些,因此更加適合做B細(xì)胞表位。
表3 B細(xì)胞表位預(yù)測結(jié)果匯總
參考參數(shù)IEDB得分Bcepred得分12341234Hyd6.9295.3143.3865.9712.0411.3601.2902.240Access4.6893.4632.4174.4641.9541.9101.9462.319Fle1.0891.1101.0671.0530.8711.4031.5180.556Anti0.9300.9261.0060.9531.0460.9351.391-0.276Turn1.1511.1891.2811.026-0.083-1.4231.290-2.066Polarity----1.7331.1630.9551.756Exp----1.5631.7301.8042.013
注:IEDB不含有參數(shù)Polarity 和Exposed Surface的預(yù)測;Bcepred得分取7個氨基酸的平均值四舍五入。
在多年的研究中,人們已經(jīng)發(fā)現(xiàn)了關(guān)于結(jié)核的很多特異性抗原[4],以這些結(jié)核抗原作為對象進(jìn)行分析研究,為結(jié)核疫苗的研究提供了基礎(chǔ)。同時還有很多的細(xì)胞位點沒有被發(fā)現(xiàn),這些潛在的細(xì)胞位點很可能成為結(jié)核病快速診斷的一種方法。機(jī)體產(chǎn)生免疫反應(yīng)的因素不僅僅只在于其含有編碼抗體的基因,更重要的是其有與抗體結(jié)合的空間,能夠結(jié)合在相應(yīng)的位置等因素。
人體免疫的特異性免疫過程主要為細(xì)胞免疫,即T細(xì)胞免疫和B細(xì)胞免疫。這兩個免疫過程需要一套完整的免疫應(yīng)答過程才能完成。從抗原入侵到細(xì)胞呈遞最后到產(chǎn)生抗體,只有經(jīng)過這一系列的步驟才是一套完整的免疫過程。已有的研究證明,CD4+T細(xì)胞所產(chǎn)生的細(xì)胞因子IFN-γ可以對小鼠的結(jié)核模具產(chǎn)生保護(hù)作用[5],而且當(dāng)CD4+T細(xì)胞有損壞時,艾滋病患者更易患上結(jié)核[6]。同時,對小鼠模具的研究表明CD8+T細(xì)胞對其有保護(hù)作用[7]。此類實驗證明CD4+T細(xì)胞和CD8+T細(xì)胞對于結(jié)核病有一定的特異性反應(yīng)。筆者所研究的結(jié)核分枝桿菌基因Rv3457c尚未有人進(jìn)行研究,生物信息學(xué)進(jìn)行的分析在某些方面只作為理論參考,還需要進(jìn)一步的實驗來證明其是否適合作為抗原表位。
筆者采用一系列的生物信息學(xué)方法,對Rv3457c基因做了基礎(chǔ)分析,并預(yù)測了其T、B細(xì)胞抗原表位。在使用NetMHCIIpan3.1 Server對其CD4+T細(xì)胞進(jìn)行預(yù)測時,選取肽段結(jié)合數(shù)最多的DBR1_0301中的強結(jié)合肽段作為備選,然后使用NetMHC、Bimas、NetCTL和SYFPEITHI四個軟件對其CD8+T細(xì)胞進(jìn)行預(yù)測,綜合選擇四個軟件中得分較高的肽段,再與CD4+T細(xì)胞的強結(jié)合肽段進(jìn)行對比,綜合選取重復(fù)片段即為預(yù)測的可能性較高的抗原表位。蛋白質(zhì)的理化性質(zhì)決定其是否具有此類空間即表位供抗體結(jié)合,因此對于蛋白質(zhì)理化性質(zhì)的分析至關(guān)重要。據(jù)研究發(fā)現(xiàn)可以通過利用蛋白質(zhì)的理化性質(zhì)來預(yù)測其B細(xì)胞表位。現(xiàn)在已被公認(rèn)的預(yù)測單參數(shù)方案有6種,親水性方案(Hydrophilicity)、表面可及性方案(Surface Accessibility)、柔韌性方案(Flexibility)、抗原性方案(Antigenicity)、二級結(jié)構(gòu)預(yù)測方案(Secondary structure)、抗原指數(shù)方案(Antigenivity Index)。這些方案有較好的預(yù)測效果。這里我們根據(jù)IEDB和Bcepred里面的數(shù)據(jù)來選擇進(jìn)行分析。
[1] 馬麥卷. 結(jié)核免疫應(yīng)答相關(guān)基因多態(tài)性與肺結(jié)核易感性的關(guān)聯(lián)研究[D].北京:中國人民解放軍軍事醫(yī)學(xué)科學(xué)院,2012.
[2] 唐神結(jié),肖和平.結(jié)核病流行趨勢及治療未來展望[J].中國實用內(nèi)科雜志,2012(8):565-568.
[3] 王心倩,孫妍,占衛(wèi)紅,等. 結(jié)核分枝桿菌Rv3607c T細(xì)胞表位分布情況預(yù)測及分析[J]. 武漢輕工大學(xué)學(xué)報,2016(2):36-39.
[4] 葉娟,張舒林,劉文第. 結(jié)核分枝桿菌RD12區(qū)T細(xì)胞表位分布情況預(yù)測及分析[J].上海交通大學(xué)學(xué)報(醫(yī)學(xué)版),2014(1):7-12.
[5] Rosa Daniela Santoro,Ribeiro Susan Pereira,Cunha-Neto Edecio. CD4+T cell epitope discovery and rational vaccine design[J]. Archivum Immunologiae et Therapiae Experimentalis,2010,58(2) : 121-130.
[6] Oldstone M B.The role of cytotoxic T lymphocytes in infectious disease: history,criteria,and state of the art[J].Curr Top Microbiol Immunol,1994,189: 1-8.
[7] Wang Xinjing,Cao Zhihong,Jiang Jing,et al. Elevated expression of Tim-3 on CD8 T cells correlates with disease severity of pulmonary tuberculosis[J]. Journal of Infection,2011,62(4): 292-300.
[8] 南文龍,金寧一,魯會軍,等. H5N1亞型禽流感病毒血凝素Th和B細(xì)胞表位預(yù)測及抗原性分析[J].中國免疫學(xué)雜志,2009(7):630-633,637.
[9] 劉海燦. 結(jié)核分枝桿菌八種蛋白抗原中人T/B細(xì)胞抗原表位多態(tài)性研究[D].北京:中國疾病預(yù)防控制中心,2014.
[10] Nobuhiro Nakamoto,David E Kaplan,Jennifer Coleclough,et al. Functional Restoration of HCV -Specific CD8 T Cells by PD-1 Blockade Is Defined by PD-1 Expression and Compartmentalization[J].Gastroenterology,2008 (7) :927-1937.
[11] Li Fan,Yang Di,Wang Yi-qin,et al.Identification and modification of an HLA-A* 0201-restricted cytotoxic T lymphocyte epitope from Ran antigen[J].Cancer Immunology,Immunotherapy,2009(12):2039-2049.
[12] Grotzke J E,Lewinsohn D M.Role of CD8+T lymphocytes in control of Mycobacterium tuberculosis infection[J]. Microbes Infect,2005,7(4) : 776-788.
[13] Mommaas B,Kamp J,Drijfhout JW,et al.Identification of a novel HLA- B60- restricted T cell epitope of the minor histocompatibility antigen HA-1 locus[J]. J Immunol,2002,169 (6) :3131-3136.
Bioinformatics analysis to characteristics and antigen epitopes of Rv3457c
ZHAO Long-qi,WANG Xin-qian,SUN Yan,ZHAN Wei-hong,WU Qi-hang,LI Hai-bo,YU Xiao-li
(School of Biology and Pharmaceutical Engineering,Wuhan Polytechnic University,Wuhan 430023,China)
Analyzing main features of gene Rv3457c by using bioinformatics,predicting and screening its T/B cell epitope.Using ProtParam,SingnalP,TMHMM to analyze physical and chemical properties, signal peptide and transmembrane region of the protein coded by the gene. NetMHC,Bimas,NetCTL and SYFPEITHI are used to predict its T and B cell epitope.The protein coded by the gene consists of 1044 amino acid,an atomic number of 10498,a theoretical molecular formula of C2980H4918N1044O1216S340,a molecular mass of 85.7284KD,a theoretical isoelectric point of 4.99,an estimated half-life of 4.4h,an instability index of 52.31,an average hydrophilicity of 0.938,an aliphatic index of 20.11.The gene has potential T and B cell epitope.There is one B and T cell epitope at least,which can be the basics of vaccine development.
Rv3457c;bioinformatics;cell epitope
2016-10-18.
趙隆麒(19 -),男,碩士研究生,E-mail:q304451487@vip.qq.com.
余曉麗(1963-),女,教授,E-mail:yxll268@126.com.
2095-7386(2016)04-0026-05
10.3969/j.issn.2095-7386.2016.04.005
Q 93
A