韓廣弢,李皓桓
·論著·
基于生物信息學分析尤文肉瘤的差異基因表達及功能預測
韓廣弢,李皓桓
430060 武漢大學人民醫(yī)院骨科
基于生物信息學分析尤文肉瘤的基因差異表達及功能預測,為尤文肉瘤的治療提供幫助。通過GEO 數據庫尋找RNA 數據集,通過limma 包尋找差異基因并尋求可視化,對其進行信號通路分析和GO 富集分析,最后進行基因互作網絡的分析。在尤文肉瘤組織中共篩選出312 個基因具有差異,其中192 個上調基因,120 個下調基因。通過細胞組成的研究,細胞外區(qū)域組分、細胞外區(qū)域、細胞外小泡、細胞外細胞器、細胞外泌體對尤文肉瘤影響較大。通過對生物進程的分析,細胞分化、系統(tǒng)發(fā)育、解剖結構、細胞發(fā)育、細胞發(fā)育過程影響較大。通過對分子功能的研究,蛋白結合、細胞黏附結合、蛋白質二聚體結合、胰島素II 受體結合、細胞外基質結合影響較大。通過基因互作網絡發(fā)現,ANXA2 和S100A10,ANXA2和S100A4,GRP 和CCK,LAMA5 和ITGA3,SCNN1A 和SG1C1 互作關系較為密切。ANXA2 和S100A10,ANXA2 和S100A4,GRP 和CCK,LAMA5 和ITGA3,SCNN1A 和SG1C1 互作關系較為密切,這些相互作用的基因編碼蛋白可能調控尤文肉瘤的產生。
生物信息學; 尤文肉瘤; GEO
尤文肉瘤是兒童和年輕人中第二常見的惡性骨腫瘤,占所有原發(fā)性骨腫瘤的10% ~15%。發(fā)病年齡通常發(fā)生在10 ~ 20 歲之間[1]。尤文肉瘤最常見于骨骼,但不到10% 的腫瘤起源于軟組織,并且有15% ~ 25% 的患者出現明顯的轉移[2]。沒有臨床轉移灶的患者可能會發(fā)生微轉移,因為在沒有全身化療的情況下,大多數患者會在手術切除后因遠處轉移性疾病復發(fā)[3]。這種傳播的傾向導致尤文肉瘤患者的預后較差,因此對尤文肉瘤的研究迫在眉睫。本文將基于生物信息學分析尤文肉瘤的基因差異表達及功能預測,對尤文肉瘤的治療提供幫助。
GSE93075 數據集是從Gene Expression Omnibus(GEO)數據庫獲取,通過pubmed 進入,由NCBI 提供。此數據集由Nirmalya S 發(fā)布,我們通過搜索關鍵詞“Ewing sarcoma”得到此數據集。此數據集由6 個尤文肉瘤患者的組織以及6 個非尤文肉瘤患者的組織組成。
1.2.1 篩選差異基因 我們對芯片數據進行背景校正、標準化、匯總和探針質量控制。通過GEO 網站下載注釋包,進行ID 轉換,提取表達矩陣。對limma 包進行安裝并加載,以< 0.05,|logFC| ≥ 1.5 為標準篩選差異基因,繪制熱圖和火山圖。
1.2.2 利用DAVID 進行功能富集分析 DAVID 是生物信息數據庫,其整合了生物學數據和分析工具,為大規(guī)模的基因或蛋白列表,并主要用于基因的功能富集,富集內容包括生物過程、細胞組成和分子功能三個部分。
1.2.3 蛋白質互作網絡的構建 蛋白質互作網絡通過PPI 應用10.5 版STRING 數據庫分析。PPI 網絡圖中綜合得分> 0.4 的蛋白具有統(tǒng)計學意義。用 Cytoscape 插件 MCODE 篩選出有意義的 PPI 模塊,篩選標準為:MCODE 得分> 3,網絡節(jié)點> 4。對篩選出的模塊中的差異基因進行通路富集分析,< 0.05 具有統(tǒng)計學意義。
通過limma 包對尤文肉瘤組織和非尤文肉瘤組織的基因進行篩選,共篩選出312 個差異基因,其中192 個上調基因,120 個下調基因,具體如圖1 所示。
通過DAVID 數據庫,我們進行功能富集。通過細胞組成的研究,我們根據差異大小進行排列,前5 個分別為:細胞外區(qū)域組分、細胞外區(qū)域、細胞外小泡、細胞外細胞器、細胞外泌體。通過對生物進程的分析,我們根據差異大小進行排列,前5 個分別為:細胞分化、系統(tǒng)發(fā)育、解剖結構、細胞發(fā)育、細胞發(fā)育過程。通過對分子功能的研究,根據差異大小進行排列,前 5 個分別為:蛋白結合、細胞黏附分子結合、蛋白質二聚體結合、胰島素II 受體結合、細胞外基質結合。具體如圖2 所示。
通過string 數據庫進行PPI 網絡圖的繪制,我們得出此網絡有243 個節(jié)點,152 條邊。其中ANXA2 和S100A10,ANXA2 和S100A4,GRP 和CCK,LAMA5 和ITGA3,SCNN1A 和SG1C1 互作關系較為密切,這些相互作用的基因編碼蛋白可能調控尤文肉瘤的產生。具體如圖3 所示。
A
Figure 1 Volcano (A) and heatmap (B) of differential miRNA in Ewing sarcoma and normal tissues (Green: down-regulated miRNA; Red: up-regulated miRNA)
細胞外泌體Cell exosomes細胞外細胞器Extracellular organelles細胞外小泡Extracellular vesicles細胞外區(qū)域Extracellular region細胞外區(qū)域組分Extracellular domain components 0 2 4 6 8 10 12 14 富集分數[-log10 (P-value)]Enrichment of scores [-log10 (P-value)]A
Figure 2 Cell composition (A), biological process (B) and molecular function (C) analyzed by GO and KEGG
生物信息學的產生對于解釋一些疾病的產生、發(fā)展與轉歸具有重要作用[4]。尤文肉瘤是僅次于骨肉瘤的第二常見的骨惡性腫瘤,在兒童和年輕人中發(fā)病,發(fā)病年齡在 15 歲時達到峰值[5]。盡管大多數尤文肉瘤都發(fā)生在骨骼中,尤其是骨盆,長骨的骨干區(qū)和胸壁的骨骼,但 15% 的原發(fā)性尤文肉瘤可能發(fā)生在各種骨外部位,包括深部軟椎旁、胸廓和近端肢體組織、腎臟、膀胱、肺、前列腺和腦膜[6]。目前,尤文肉瘤可通過外科手術,放射療法和化學療法相結合的方法進行治療,但是存活率仍然很差[7-10]。
細胞分化在尤文肉瘤的產生中起著重要作用。研究指出,尤文肉瘤具有神經分化潛能[11-12]。其與ETS 基因融合,分化成永生化的NIH3T3 成纖維細胞,從而增加其侵襲性,對預后產生不良影響[13]。細胞外區(qū)域對尤文肉瘤的產生起促進作用。研究指出,尤文肉瘤的結構中有許多FasL,此物質具有一個氨基末端胞質和一個羧基末端胞外區(qū),可以促進尤文肉瘤的遷移[14]。蛋白結合在尤文肉瘤的產生和發(fā)展中具有很大的作用。尤文肉瘤中含有DNA 和RNA 結合蛋白,促進尤文肉瘤的突變,從而對尤文肉瘤的產生造成影響[15]。
圖 3 基因互作網絡
Figure 3 PPI of the RNA
本研究發(fā)現ANXA2 和S100A10,ANXA2 和S100A4,GRP 和CCK,LAMA5 和ITGA3,SCNN1A 和SG1C1 互作關系較為密切,這些相互作用的基因編碼蛋白可能調控尤文肉瘤的產生。隨著RNA 研究技術的發(fā)展,對尤文肉瘤中的信號通路、表觀遺傳調控以及發(fā)病機制的進一步深入研究,部分差異表達的血清基因可以作為尤文肉瘤早期診斷潛在的生物標志物已經得到證實,恢復差異基因的生理水平可能為尤文肉瘤治療的新策略。雖然缺乏大量臨床標本證實這一觀點,但仍為研究尤文肉瘤的治療提供了新的方向。
[1] Gaspar N, Hawkins DS, Dirksen U, et al. Ewing sarcoma: current management and future approaches through collaboration. J Clin Oncol, 2016, 33(27):3036-3046.
[2] Riff AJ, Gross CE, Foucher KC, et al. Acetabular osteoarticular allograft after ewing sarcoma resection: a 15-year follow-up: a case report. JBJS Case Connect, 2016, 6(4):e89.
[3] Murthy SS, Gundimeda SD, Challa S, et al. FISH for EWSR1 in Ewing's sarcoma family of tumors: Experience from a tertiary care cancer center. Indian J Pathol Microbiol, 2021, 64(1):96-101.
[4] Huang DW, Sherman BT, Lempicki RA. Bioinformatics enrichment tools: paths toward the comprehensive functional analysis of large gene lists. Nucleic Acids Res, 2009, 37(1):1-13.
[5] Theisen ER, Pishas KI, Saund RS, et al. Therapeutic opportunities in Ewing sarcoma: EWS-FLI inhibition via LSD1 targeting. Oncotarget, 2016, 7(14):17616-17630.
[6] Pishas KI, Lessnick SL. Recent advances in targeted therapy for Ewing sarcoma. F1000Res, 2016, 5:F1000 Faculty Rev-2077.
[7] Reynolds A, Leake D, Boese Q, et al. Rational siRNA design for RNA interference. Nat Biotechnol, 2004, 22(3):326-330.
[8] Whitehead KA, Langer R, Anderson DG. Knocking down barriers: advances in siRNA delivery. Nat Rev Drug Discov, 2009, 8(2):129- 138.
[9] Flisiak R, Jaroszewicz J, ?ucejko M. siRNA drug development against hepatitis B virus infection. Expert Opin Biol Ther, 2018, 18(6):609- 617.
[10] Fang T, Huang H, Li X, et al. Effects of siRNA silencing of TUG1 and LCAL6 long non-coding RNAs on patient-derived xenograft of non-small cell lung cancer. Anticancer Res, 2018, 38(1):179-186.
[11] Terashima T, Ogawa N, Nakae Y, et al. Gene therapy for neuropathic pain through siRNA-IRF5 gene delivery with homing peptides to microglia. Mol Ther Nucleic Acids, 2018, 11(C):203-215.
[12] Li S, Yang Q, Wang H, et al. Prognostic significance of serum lactate dehydrogenase levels in Ewing's sarcoma: a meta analysis. Mol Clin Oncol, 2016, 5(6):832-838.
[13] Gardiner JD, Abegglen LM, Huang X, et al. C/EBPβ-1 promotes transformation and chemoresistance in Ewing sarcoma cells. Oncotarget, 2017, 8(16):26013-26026.
[14] Von Heyking K, Roth L, Ertl M, et al. The posterior HOXD locus: Its contribution to phenotype and malignancy of Ewing sarcoma. Oncotarget, 2016, 7(27):41767-41780.
[15] Spaulding SL, Xing MH, Seo GT, et al. Extraskeletal Ewing sarcoma of the buccal space. Clin Imaging, 2020, 73:108-110.
Analysis of differential expression and functional prediction of genes in Ewing's sarcoma based on bioinformatics
HAN Guang-tao, LI Hao-huan
Department of Orthopedics, People's Hospital of Wuhan University, Hubei 430060, China
To analyze the differential expression and functional prediction of genes in Ewing's sarcoma based on bioinformatics, providing help for the treatment of Ewing sarcoma.The RNA data set was searched through GEO database, the differential genes were searched by limma package and visualized, the signal pathway analysis and GO enrichment analysis were performed, and the gene interaction network was finally analyzed.A total of 312 mRNA samples were selected from Ewing's sarcoma, among which 192 were up-regulated and 120 were down-regulated. Through the study of cell composition, the components of extracellular regions, extracellular regions, extracellular vesicles, extracellular organelles and exosomes had great influence on Ewing’s sarcoma. Through the analysis of biological processes, cell differentiation, phylogeny, anatomical structure, cell development, cell development process had a greater impact. Through the study of molecular functions, protein binding, cell adhesion binding, protein dimer binding, insulin II receptor binding and extracellular matrix binding had great influence. Through the gene interaction network, we found that ANXA2 and S100A10, ANXA2 and S100A4, GRP and CCK, LAMA5 and ITGA3, SCNN1A and SG1C1 closely interacted.ANXA2 and S100A10, ANXA2 and S100A4, GRP and CCK, LAMA5 and ITGA3, SCNN1A and SG1C1 closely interact, and these interacting gene-coding proteins may be responsible for Ewing's sarcoma.
bioinformatics; Ewing sarcoma; GEO
LI Hao-huan, Email: 1055891745@qq.com
國家自然科學基金(81171760)
李皓桓,Email:1055891745@qq.com
2020-08-25
10.3969/j.issn.1673-713X.2021.01.006