李亞萍,鄒余糧,張 琳,黃 新,秦 勇
(1.西安市中心醫(yī)院婦產(chǎn)科;陜西 西安 710003;2.西安交通大學第一附屬醫(yī)院婦產(chǎn)科,陜西 西安 710061;3.西安市中心醫(yī)院神經(jīng)內(nèi)科;陜西 西安 710003;4.西安市中心醫(yī)院普通外科;陜西 西安 710003)
卵巢癌診斷新基因HELQ的生物信息學分析
李亞萍1,鄒余糧2,張 琳3,黃 新4,秦 勇4
(1.西安市中心醫(yī)院婦產(chǎn)科;陜西 西安 710003;2.西安交通大學第一附屬醫(yī)院婦產(chǎn)科,陜西 西安 710061;3.西安市中心醫(yī)院神經(jīng)內(nèi)科;陜西 西安 710003;4.西安市中心醫(yī)院普通外科;陜西 西安 710003)
目的 本研究擬采用生物信息學工具分析卵巢癌易感基因HELQ所編碼蛋白的結構及結構與功能的關系,并初步探討其對腫瘤發(fā)生的影響。方法 采用ExPASy服務器中的工具分析HELQ蛋白的理化特征;分別采用PSORTⅡ和TMHMM預測HELQ蛋白的亞細胞定位和跨膜拓撲結構;采用SignalP 4.0預測HELQ的信號肽;采用ScanProsite和SMART分析HELQ的功能結構域以及結構域分區(qū),采用PSIPRED和I-TASSER預測HELQ蛋白的二級和三級結構以及配體結合位點;最后采用STRING 10.0預測HELQ與其他蛋白質(zhì)的交互作用。結果 HELQ主要定位在細胞核(47.8%)和細胞質(zhì)(39.1%)中,有4個保守結構域DEXDc、HELICc、HHH_5和PRK02362,并包含解旋酶ATP結合區(qū)和解旋酶C端結合區(qū)兩個功能結構域;成功建立了HELQ的二級和三級結構模型,其中二級結構中α螺旋、無規(guī)則卷曲及折疊結構比例分別為54.0%、31.0%和6.0%。三維配體結構分析結果可見,HELQ包含一個酶活性中心位點His341,催化Ile333、Lys335、Tyr337、Gln340、Pro360、Thr361、Ser362、Gly363、Gly364、Lys365、Thr366、Leu367、Glu464和Ala711等結合位點與配體ATP結合。交聯(lián)蛋白質(zhì)分析發(fā)現(xiàn)HELQ可能與RAD51、POLA1、PLON、FANCD2、DHX8等蛋白存在交互作用。結論 HELQ具有ATP依賴性解旋酶活性,參與DNA損傷的修復過程,可能是其低表達時引起卵巢癌等惡性腫瘤發(fā)生的機制。
HELQ;腫瘤;結構;功能;生物信息學。
卵巢癌是女性常見癌癥的第二大殺手,早期難以診斷,且預后效果較差,5年生存率約37%[1]。因此,對卵巢癌發(fā)生的相關基因的研究,能夠更好地為早期診斷和靶向治療提供理論依據(jù)。HELQ基因是2013年在小鼠體內(nèi)發(fā)現(xiàn)的抑制卵巢癌的新基因,該基因缺失時會增加小鼠患卵巢癌的風險。研究發(fā)現(xiàn),小鼠體內(nèi)HELQ基因的缺失,不僅影響小鼠的生殖,同時增加小鼠發(fā)生惡性腫瘤的風險,HELQ基因的拷貝數(shù)減少一個,致使卵巢癌發(fā)生的風險提高2倍[2]。已有研究表明,HELQ基因可以修復細胞增殖時DNA復制過程中發(fā)生的DNA損傷,如果該基因發(fā)生缺陷或缺失,DNA錯誤復制的可能性會增加,從而提高惡性腫瘤發(fā)生的幾率[3]。因而作者推測,如果HELQ基因在人類和小鼠中的作用一致,未來或可通過篩查HELQ基因來診斷和治療女性卵巢癌。但縱觀國內(nèi)外研究,關于該基因的研究尚不夠成熟,該基因表達蛋白的結構及功能也尚未明確,因此,本研究利用生物信息學工具分析和預測HELQ蛋白的結構特征及其構效關系,并探討該基因增加卵巢癌發(fā)病風險的分子機制,以期為卵巢癌的診斷和治療開發(fā)新的途徑。
1.1 基因序列
NCBI數(shù)據(jù)庫中獲取HELQ基因的核苷酸序列,其Genbank序號為AF436845.1,Gene ID:113510,定位于染色體4q21上。HELQ基因又稱HEL308,全長3 591bp,ORF finder分析HELQ基因序列包含17個開放閱讀框,其中ORF3編碼基因的全長,共1 101個氨基酸。
1.2 生物信息學分析
利用ExPASy服務器[4]中的ProtParam、Compute pI/Mw和ProtScale軟件預測HELQ蛋白的理化性質(zhì):氨基酸組成、分子質(zhì)量、等電點、疏水性/親水性、不穩(wěn)定系數(shù)及脂肪系數(shù)等;采用PSORTⅡ(http://www.genscript.com/psort.html)預測HELQ蛋白的亞細胞定位;TMHMM軟件分析HELQ的跨膜拓撲結構;SignalP 4.0 Server預測HELQ的信號肽[5];利用Scan Prosite分析HELQ蛋白的功能結構域[6];使用NCBI保守結構域數(shù)據(jù)庫分析蛋白序列的保守結構域[7];利用PSIPRED序列分析分析HELQ蛋白的二級結構[8],利用蛋白質(zhì)結構建模工具I-TASSER預測HELQ的三維結構模型,并分析其配體結合位點及其配體[9-11];使用STRING 10.0分析HELQ蛋白質(zhì)與其他蛋白質(zhì)交聯(lián)的相互作用[12]。
2.1 HELQ的理化性質(zhì)分析
Prot Param計算HELQ蛋白的分子量約為124 175.3Da,理論等電點為6.12,氨基酸組成分布見表1,其中酸性氨基酸多于堿性氨基酸,且亮氨酸(Leu)比例最高(12.4%);不穩(wěn)定指數(shù)為45.55,故推測HELQ應為不穩(wěn)定的酸性蛋白。ProtScale軟件對HELQ進行疏水性分析結果如圖1所示,并計算出其疏水性指數(shù)平均值為-0.317,脂肪族指數(shù)為92.34,說明其為親脂性蛋白。
圖1 氨基酸疏水性直觀圖(以0為界限,正值表示疏水性,負值表示親水性)
Fig. 1 Pictorial diagram of hydrophobicity of amino acids (Bounded to 0, hydrophobicity was represented by positive number, and hydrophilicity was represented by negative value)
表1 氨基酸組成分布
Table 1 Distribution of amino acids
氨基酸組成(%)氨基酸組成(%)Ala(A)57(5.2)Phe(F)37(3.4)Arg(R)46(4.2)Pro(P)39(3.5)Asn(N)51(4.6)Ser(S)86(7.8)Asp(D)50(4.5)Thr(T)66(6.0)Cys(C)22(2.0)Trp(W)9(0.5)Gln(Q)44(4.0)Tyr(Y)42(3.8)Glu(E)95(8.6)Val(V)66(6.0)Gly(G)64(5.8)Pyl(O)0(0.0)His(H)23(2.1)Sec(U)0Ile(I)61(5.5)Lys(K)87(7.9)Leu(L)136(12.4)Met(M)23(2.1)
2.2 亞細胞定位及結構域分析
PSORTⅡ軟件對HELQ蛋白的亞細胞定位分析表明:HELQ最大可能分布在細胞核(47.8%)和細胞質(zhì)(39.1%)中,另外也可能出現(xiàn)在線粒體及囊泡分泌系統(tǒng)(高爾基體、內(nèi)質(zhì)網(wǎng)等結構)中(見表2),因而-NN給出的預測結論為HELQ應定位于細胞核中。TMHMM和SignalP4.0的預測結果發(fā)現(xiàn),HELQ蛋白沒有跨膜結構域及信號肽,說明該蛋白可能不是跨膜蛋白及內(nèi)分泌蛋白,而可能是代謝調(diào)控蛋白或轉(zhuǎn)錄因子。
采用ScanProsite軟件預測HELQ蛋白的功能結構域(圖2A),預測結果顯示HELQ包含兩個功能結構域,分別是Helicase_ATP-Bind_1(解旋酶ATP結合區(qū)A)和Helicase_Cter(解旋酶C端結合區(qū)),其功能分別是結合和水解ATP。通過查找NCBI 保守結構域數(shù)據(jù)庫,發(fā)現(xiàn)HELQ序列有4個保守結構域(圖2B),分別是DEAD(解旋酶家族成員之一)、HELICc(解旋酶C端超級結構域)、HHH-5(復合螺旋結構域)和PRK02362(ski2_like結構域),其中DEAD參與各種RNA代謝,包括核轉(zhuǎn)錄、前信使RNA剪接、核糖體合成、核質(zhì)運輸、翻譯、RNA衰變及細胞器基因的表達。
圖2 結構域的預測(A:ScanProsite預測HELQ蛋白的功能結構域,B:NCBI保守結構域數(shù)據(jù)庫中預測HELQ的保守結構域)
表2 HELQ蛋白的亞細胞定位預測結果
Table 2 Predicted results of subcellular localization of HELQ protein
2.3 HELQ蛋白結構分析
利用PSIPRED預測HELQ蛋白的二級結構(見圖3),結果顯示HELQ蛋白結構主要由α-螺旋(54.0%)和無規(guī)則卷曲(31.0%)、β-折疊(6.0%)組成。采用I-TASSER對HELQ蛋白的三維結構進行建模結果如圖4所示。同時利用3DLigandsite建立HELQ蛋白三維配體結合模型,發(fā)現(xiàn)其可能結合的配體為ATP,結合位點為Ile333、Lys335、Tyr337、Gln340、360Pro、361Thr 、Ser362、Gly363、Gly364、Lys365、Thr366、Leu367、464Glu、711Ala,且主要分布在Helicase_ATP-Bind_1功能結構域;另外,結合位點中心區(qū)域的His341為HELQ蛋白的酶活性中心位點(圖5),因此,推測HELQ的活性依賴于與ATP結合從而提供的能量。
圖3 二級結構預測
Fig. 3 Prediction of secondary structure
圖4 HELQ三維空間結構
Fig. 4 Three-dimensional structure of HELQ protein
圖5 三維空間配體結合位點及活性中心預測模型(A:HELQ配體結合位點模型,B:HELQ活性中心預測模型)
Fig. 5 Prediction models of ligand binding site and active center in three-dimensional space (A: model of ligand binding sites of HELQ, B: prediction models of active center of HELQ)
2.4 HELQ-蛋白交聯(lián)網(wǎng)絡
利用STRING 10.0交互式數(shù)據(jù)庫進行蛋白質(zhì)交聯(lián)分析,發(fā)現(xiàn)與HELQ相互作用的蛋白質(zhì)主要有RAD51、POLA1、PLON、FANCD2、DHX8 等(見圖6 )。其中RAD51具有DNA依賴的ATP酶活性,參與同源重組和雙鏈斷裂時的DNA損傷修復的激活;PLON是一種DNA聚合酶;FANCD2參與DNA雙鏈斷裂的修復過程,維持染色體的穩(wěn)定。而HELQ與這些蛋白存在交互作用,因此推測HELQ的功能作用與這些蛋白相似,也與DNA復制有關,即可能參與修復細胞增殖時DNA復制過程中所發(fā)生的的DNA損傷。
圖6 HELQ蛋白的交聯(lián)作用
Fig. 6 Cross-linked action HELQ protein
3.1 HELQ蛋白結構域及其空間結構的分析
DNA修復是細胞對DNA損傷后的一種反應,可使DNA結構恢復、重新執(zhí)行原來的功能。若DNA的損傷未被完全消除,且細胞能夠耐受這種損傷繼續(xù)生存,那么該DNA損傷有很大幾率會在適合的條件下顯示出來,如導致細胞癌變。因此,DNA損傷修復與腫瘤的發(fā)生密切相關。DNA解旋酶可以修復核苷酸的錯配,雙鏈斷裂及同源重組交叉反應等DNA損傷,對于維持機體基因及染色體的穩(wěn)定至關重要。不同的解旋酶如RuvAB、RecBCD、RecQ1等,修復不同的DNA損傷[13-14]。HELQ也是DNA解旋酶之一,編碼解旋酶蛋白HEL308。Moldovan等[15]研究發(fā)現(xiàn),人的HEL308缺失可以引起DNA復制過程受阻,且其他研究也進一步證實HEL308是一種依賴ATP的酶,具有3′-5′的DNA解旋酶活性,參與細胞的增殖過程,是一種癌癥相關基因[16]。
本研究在此基礎上對HELQ的結構及其功能進行了分析預測,結果表明:HELQ包含Helicase_ATP_Bind 1和 Helicase_Cter兩個中心位置,功能分別是結合和水解ATP,行使解旋酶的活性;NCBI 保守結構域數(shù)據(jù)庫也發(fā)現(xiàn)HELQ包含與DNA雙螺旋結合的HHH-5(復合螺旋結構域)、解旋酶家族特征結構域DEAD以及解旋酶C端超級結構域HELICc,同樣證實了HELQ具有解旋酶功能。HELQ蛋白三級結構及三維配體結合模型構建結果表明,其結合的配體為ATP, 且結合位點及酶活性中心位點均位于Helicase_ATP-Bind_1功能結構域中,進一步證實了HELQ的解旋酶功能,且其酶活性依賴于ATP供能,而后參與DNA的損傷修復。
3.2 HELQ-蛋白交聯(lián)分析
蛋白質(zhì)交聯(lián)網(wǎng)絡分析發(fā)現(xiàn)與HELQ相互交聯(lián)的蛋白均具有修復DNA損傷的功能,其中RAD51協(xié)同同系產(chǎn)物(如RAD51B、RAD51D)在DNA損傷的末端形成核蛋白絲,催化斷裂的DNA雙鏈與同源DNA姐妹鏈進行鏈間重組交換,從而維持基因的穩(wěn)定性[17]。RAD51是DNA 同源重組修復過程中的關鍵酶,與BRCA1、BRCA2相互協(xié)作,干擾DNA損傷修復,引起基因組的不穩(wěn)定性,誘導乳腺癌等多種腫瘤的發(fā)生[18-19]。PLON是由POLH基因編碼的DNA聚合酶ν,修復紫外輻射導致的DNA嘧啶二聚體,使DNA的復制正常進行[16]。FANCD2在應對DNA損傷時第561位的賴氨酸單泛素化,在核中特定位點與FA通路下游相關修復蛋白共定位,修復損傷DNA。FANCD2基因是FA通路的關鍵基因,若缺失則導致DNA損傷修復功能障礙,引發(fā)癌癥[20-21]。HDX8是一種依賴ATP的RNA解旋酶。因此推測HELQ 也具有解旋酶的功能。
3.3 HELQ與卵巢癌發(fā)生的相關性
已有研究表明人類HELQ基因在卵巢、精巢、心臟及骨骼肌均表達,且HELQ與生殖細胞的發(fā)育密切相關。HELQ基因發(fā)生突變后,可以引起男性出現(xiàn)少精、唯支持細胞綜合癥、女性卵巢功能不全而不孕等[22-23]。越來越多的研究集中于對HELQ功能與DNA復制相關性的探索,Ward等[24]研究發(fā)現(xiàn)HELQ聯(lián)合RAD51修復減數(shù)分裂時DNA雙鏈的斷裂;Luebben等[25]研究發(fā)現(xiàn)哺乳動物的HELQ具有維持基因穩(wěn)定的功能,但HELQ與腫瘤發(fā)生發(fā)展的關系需進一步確證。Liu等[26]研究發(fā)現(xiàn)HELQ可以激活與DNA損傷相關的CHK1-RAD51,抑制骨肉瘤的生長;敲除HELQ基因?qū)е鹿侨饬龅脑鲋澈瓦w移能力增強,但其機制尚不明確。本研究通過生物信息學分析發(fā)現(xiàn)HELQ具有依賴ATP的DNA解旋酶活性,參與DNA的損傷修復,因此推測人類HELQ的缺失,可能引起DNA損傷修復功能障礙,因此導致惡性腫瘤尤其是生殖系統(tǒng)腫瘤如卵巢癌的發(fā)生。
本研究對HELQ蛋白的結構及功能進行了分析,初步推測其可能參與腫瘤發(fā)生發(fā)展過程中的DNA損傷修復過程,從而影響惡性腫瘤細胞的增殖以及腫瘤治療過程中的敏感性。因此推測該基因可能是卵巢癌等腫瘤的易感基因之一,并對其發(fā)生機制甚至治療均起著關鍵作用,可以作為進一步研究卵巢癌等惡性腫瘤的實驗對象之一。
[1]Wagener J, Seybold U.MRSA-hygiene management, diagnostics and treatment[J].Dtsch Med Wochenschr, 2014,139(13):643-651.
[2]Adelman C A, Lolo R L, Birkbak N J,etal. HELQ promotes RAD51 paralogue-dependent repair to avert germ cell loss and tumorigenesis[J]. Nature, 2013, 502(7471): 381-384.
[3]Dolgova E V, Alyamkina E A, Efremov Y R,etal. Identification of cancer stem cells and a strategy for their elimination[J]. Cancer Biol Ther, 2014, 15(10): 1378-1394.
[4]Artimo P, Jonnalagedda M, Arnold K,etal. ExPASy: SIB bioinformatics resource portal[J].Nucleic Acids Res, 2012,40(W1):W597-W603.
[5]Petersen T N, Brunak S, von Heijne G,etal. SignalP 4.0: discriminating signal peptides from transmembrane regions[J]. Nat Methods, 2011, 8(10): 785-786.
[6]Sigrist C J, de Castro E, Cerutti L,etal. New and continuing developments at PROSITE[J].Nucleic Acids Res, 2012, 41(D1): D334-D347.
[7]Marchler-Bauer A, Bo Y, Han L,etal. CDD/SPARCLE: functional classification of proteins via subfamily domain architectures[J]. Nucleic Acids Res, 2017,45(D1):D200-D203.
[8]Buchan D W, Minneci F, Nugent T C,etal. Scalable web services for the PSIPRED Protein Analysis Workbench[J]. Nucleic Acids Res, 2013, 41(W1): W349-W357.
[9]Yang J, Yan R, Roy A,etal. The I-TASSER Suite: protein structure and function prediction[J]. Nat methods, 2015, 12(1): 7-8.
[10]Yang J, Zhang Y. I-TASSER server: new development for protein structure and function predictions[J]. Nucleic Acids Res, 2015, 43(W1): W174-W181.
[11]Roy A, Kucukural A, Zhang Y. I-TASSER: a unified platform for automated protein structure and function prediction[J]. Nat protoc, 2010, 5(4): 725-738.
[12]Szklarczyk D, Franceschini A, Wyder S,etal. STRING v10: protein-protein interaction networks, integrated over the tree of life[J]. Nucleic Acids Res, 2014,43(D1):D447-D452.
[13]Spies M.DNA helicases and DNA motor proteins[M].Advances in experimental medicine and biology:v.767.New York:Springer, 2013:973:V-VII.
[15]Moldovan G L, Madhavan M V, Mirchandani K D,etal. DNA polymerase POLN participates in cross-link repair and homologous recombination[J]. Mol Cell Biol, 2010, 30(4): 1088-1096.
[16]Tafel A A, Wu L, McHugh P J. Human HEL308 localizes to damaged replication forks and unwinds lagging strand structures[J]. J Biol Chem, 2011, 286(18): 15832-15840.
[17]Wang A T, Kim T, Wagner J E,etal. A dominant mutation in human RAD51 reveals its function in DNA interstrand crosslink repair independent of homologous recombination[J]. Mol Cell, 2015, 59(3): 478-490.
[18]彭亞婷, 梅金紅. Rad51 與腫瘤關系的研究進展[J]. 臨床與實驗病理學雜志, 2011, 27(1): 86-89.
[19]高麗麗, 朱長樂. 乳腺癌中 Chk2, p53 和 Rad51 的表達及意義[J]. 臨床與實驗病理學雜志, 2014, 30(3): 308-311.
[20]劉超, 高軍麗, 樂貽軍, 等. FANCD2 在結直腸癌中的表達及其與預后的關系[J]. 胃腸病學, 2014, 19(7): 404-407.
[21]Lambert M W, Sridharan D, Zhang P. FANCF, a Fanconi anemia core complex protein involved in monoubiquitination of FANCD2, also has a role with nuclear alpha spectrin in DNA interstrand crosslink repair[J]. Cancer Res,2016;76(14 Suppl):Abstract nr 2758.
[22]Wang W, Zhao S, Zhuang L,etal. The screening of HELQ gene in Chinese patients with premature ovarian failure[J]. Reprod Biomed Online, 2015, 31(4): 573-576.
[23]Pelttari L M, Kinnunen L, Kiiski J I,etal. Screening of HELQ in breast and ovarian cancer families[J].Fam Cancer, 2016,15(1):19-23.
[24]Ward J D, Muzzini D M, Petalcorin M I,etal. Overlapping mechanisms promote postsynaptic RAD-51 filament disassembly during meiotic double-strand break repair[J]. Mol Cell, 2010, 37(2): 259-272.
[25]Luebben S W, Kawabata T, Akre M K,etal. Helq acts in parallel to Fancc to suppress replication-associated genome instability[J]. Nucleic Acids Res, 2013, 41(22): 10283-10297.
[26]Liu D N, Zhou Y F, Peng A F,etal. HELQ reverses the malignant phenotype of osteosarcoma cells via CHK1-RAD51 signaling pathway[J]. Oncol Rep, 2017,37(2):1107-1113.
[專業(yè)責任編輯:呂淑蘭]
Bioinformatics analysis of a new diagnostic marker of ovarian cancer HELQ
LI Ya-ping1, ZOU Yu-liang2, ZHANG Lin3, HUANG Xin4, QIN Yong4
(1.Department of Gynecology and Obstetrics, Xi’an Central Hospital, Shaanxi Xi’an 710003, China; 2.Department of Obstetrics and Gynecology, First Affiliated Hospital of Xi'an Jiaotong University, Shaanxi Xi’an 710061, China;3.Department of Neurology, Xi’an Central Hospital, Shaanxi Xi’an 710003, China;4.Department of General Surgery, Xi’an Central Hospital, Shaanxi Xi’an 710003, China)
Objective To analyze the structure of protein encoded by ovarian cancer susceptibility gene HELQ and relationship between the structure and function by using bioinformatics tools and to discuss its effect on occurrence of tumors. Methods Tools of ExPASy Server were employed to analyze the physicochemical properties of HELQ protein. Its subcellular localization and transmembrane topology were predicted by PSORTⅡand TMHMM, respectively. Signal peptide of HELQ was predicted by SignalP 4.0. ScanProsite and SMART were used to analyze function domain and domain partition of HELQ. PSIPRED and I-TASSER were employed to predict secondary structure and three-dimensional model and find ligandbinding sites of HELQ protein. And STRING 10.0 was used to predict the interaction of HELQ with other proteins. Results HELQ protein was mainly located in nucleus (47.8%) and cytoplasm (39.1%). HELQ had 4 conserved domains, consisting of DEXDc, HELICc, HHH_5 and PRK02362, and contained 2 function domains, helicase_ATP binding and helicase_C terminal binding. Secondary structure and three-dimensional model were constructed. In secondary structure, proportion of α helix, random coils and β-structure was 54.0%, 31.0% and 6.0%, respectively. Results of three-dimensional model analysis found that HELQ had an enzyme activity site His341, catalyzing binding of binding sites appeared in Ile333, Lys335, Tyr337, Gln340, Pro360, Thr361, Ser362, Gly363, Gly364, Lys365, Thr366, Leu367, Glu464 and Ala711 and ligand ATP. Result of cross-linked protein analysis discovered that HELQ might have interaction with RAD51, POLA1, PLON, FANCD2 and DHX8. Conclusion HELQ possesses ATP dependent helicase activity and participate in DNA repair process. Its low expression is possible pathogenic mechanism of ovarian cancer or other malignant tumor.
HELQ; tumor; structure; function; bioinformatics
2017-05-11
李亞萍(1974-),女,副主任醫(yī)師,在讀博士,主要從事婦科腫瘤研究。
鄒余糧,主任醫(yī)師。
10.3969/j.issn.1673-5293.2017.07.010
R711.7
A
1673-5293(2017)07-0781-05