隋英麗 盧坤 傅琳
摘要:肝細(xì)胞癌是一種高死亡率的原發(fā)性肝癌,其有限治療和較低的化療敏感性,使得迫切需要尋找潛在的臨床治療靶點(diǎn)和預(yù)后判斷的生物標(biāo)志物.為此,采用生物信息學(xué)方法對(duì)肝細(xì)胞癌發(fā)生發(fā)展的關(guān)鍵基因進(jìn)行挖掘.從基因表達(dá)數(shù)據(jù)庫(GEO)中下載數(shù)據(jù)集,并篩選差異表達(dá)基因,使用在線數(shù)據(jù)庫DAVID68對(duì)篩選到的DEGs進(jìn)行基因本體(GO)富集分析和京都基因與基因百科全書(KEGG)通路分析,使用在線數(shù)據(jù)庫STRING構(gòu)建蛋白質(zhì)-蛋白質(zhì)相互作用網(wǎng)絡(luò)(PPI),利用Cytoscape軟件篩選核心DEGs,并進(jìn)行GO和KEGG富集分析,使用UALCAN和KaplanGMeierplotter在線數(shù)據(jù)庫篩選并驗(yàn)證關(guān)鍵基因的表達(dá)以及生存預(yù)后.研究結(jié)果表明,篩選出6個(gè)關(guān)鍵基因RAD51AP1、FANCI、SMC2、POLE2、CENPN、WDHD1,與HCC的發(fā)生發(fā)展以及生存預(yù)后顯著相關(guān),可能是HCC的潛在治療靶點(diǎn),可能為HCC的內(nèi)在機(jī)制的探究提供理論依據(jù).
關(guān)鍵詞:生物信息學(xué);差異表達(dá)基因;蛋白質(zhì)-蛋白質(zhì)相互作用網(wǎng)絡(luò);肝細(xì)胞癌;富集分析
中圖分類號(hào):R735.7文獻(xiàn)標(biāo)志碼:A
近年來,生物信息學(xué)分析結(jié)合基因芯片技術(shù)已經(jīng)廣泛應(yīng)用于基因相關(guān)腫瘤的研究當(dāng)中.基因芯片可以高通量地完成基因篩選與分析,在醫(yī)學(xué)研究領(lǐng)域占據(jù)重要位置.肝細(xì)胞癌(HepatocellularCarcinoma,HCC)是全球最常見的癌癥之一[1],分為原發(fā)性和繼發(fā)性兩大類,是與癌癥相關(guān)死亡的第二大主要原因,也是世界范圍內(nèi)的主要公共衛(wèi)生問題[2],近年來發(fā)病率仍然呈現(xiàn)不斷上升趨勢(shì).HCC的發(fā)生發(fā)展是涉及多種因素的復(fù)雜過程,其主要危險(xiǎn)因素與丙型肝炎后的持續(xù)病毒學(xué)反應(yīng)、治療期間抑制的乙型肝炎病毒以及酒精性和非酒精性脂肪性肝病相關(guān)[3].早期肝細(xì)胞癌癥狀無特異性,且缺乏客觀的診斷標(biāo)準(zhǔn)[4],中晚期肝癌的癥狀則較多,但是當(dāng)HCC患者診斷時(shí),大多已經(jīng)發(fā)展成中晚期等治療困難的階段,肝癌的有限治療和較低的化療敏感性[5],使得迫切需要尋找潛在的臨床治療靶點(diǎn)以及早期診斷和預(yù)后判斷的生物標(biāo)志物.本研究基于生物信息學(xué)方法,從基因表達(dá)數(shù)據(jù)庫(GeneExpressionOmnibus,GEO)中下載了大量的HCC芯片數(shù)據(jù),包含HCC癌組織和癌旁正常組織,運(yùn)用生物信息學(xué)方法篩選差異表達(dá)基因(DifferentiallyExpressedGenes,DEGs),對(duì)DEGs進(jìn)行基因本體GeneDntology,GO)富集分析和KEGG(KyotoEncyclopediaofGenesandGenomes)通路分析,構(gòu)建蛋白質(zhì)—蛋白質(zhì)相互作用網(wǎng)絡(luò)(ProteinGProteinInteractionnetwork,PPI)篩選出6個(gè)HCC發(fā)生發(fā)展相關(guān)的關(guān)鍵基因,并進(jìn)一步對(duì)這些關(guān)鍵基因進(jìn)行了表達(dá)和生存分析的驗(yàn)證,在多個(gè)在線數(shù)據(jù)庫中進(jìn)行了全面系統(tǒng)的分析.本研究可能為HCC尋找潛在的臨床治療靶點(diǎn)、探究HCC發(fā)生發(fā)展的內(nèi)在機(jī)制提供理論基礎(chǔ).
1材料與方法
1.1數(shù)據(jù)來源
從GEO數(shù)據(jù)庫(http://www.ncbi.nlm.nih.gov/GEO/)檢索并下載HCC相關(guān)數(shù)據(jù)集GSE60502[6]和GSE84402[7].其中GSE60502數(shù)據(jù)集對(duì)應(yīng)的檢測平臺(tái)GPL96,GSE84402數(shù)據(jù)集對(duì)應(yīng)的檢測平臺(tái)名稱為GPL570.選擇每個(gè)數(shù)據(jù)集中的HCC樣本數(shù)據(jù)及其匹配的正常樣本數(shù)據(jù)進(jìn)行分析.其中GSE60502數(shù)據(jù)集包含腫瘤樣本18個(gè)和正常樣本18個(gè),GSE84402數(shù)據(jù)集包含腫瘤樣本14個(gè)和正常樣本14個(gè).
1.2數(shù)據(jù)的處理
利用GEO2R(http://www.ncbi.nlm.nih.gov/geo/geo2r)在線分析,導(dǎo)出結(jié)果并匯總,初步篩選后,刪除沒有基因名稱或探針以及同一個(gè)基因名稱對(duì)應(yīng)多個(gè)基因探針的重復(fù)數(shù)據(jù).最后對(duì)篩選的DEGs進(jìn)行火山圖形式的可視化分析.
1.3數(shù)據(jù)的篩選
對(duì)數(shù)據(jù)再次篩選,篩選標(biāo)準(zhǔn):P<001,差異倍數(shù)logFC>1或logFC<-1.將2個(gè)數(shù)據(jù)集中的上調(diào)基因或下調(diào)基因分別導(dǎo)入在線網(wǎng)站Bioinformatics&EvolutionaryGenomic(http://bioinformaticspsb.ugent.be/webtools/Venn/)中,取2個(gè)數(shù)據(jù)集中上調(diào)基因或下調(diào)基因的交集.
1.4GO分析和KEGG富集分析
利用DAVID6.8在線數(shù)據(jù)庫[8](https://david.ncifcrf.gov/)分析組學(xué)和相關(guān)數(shù)據(jù)[9].GO用于分析大量注釋基因的生物學(xué)過程,分為生物學(xué)過程(BiologicalProcess,BP)、分子功能(MolecularFunction,MF)以及細(xì)胞組成(CellularComponent,CC).KEGG分析數(shù)據(jù)庫是系統(tǒng)分析基因產(chǎn)物在細(xì)胞中的代謝途徑以
p及這些基因產(chǎn)物功能的數(shù)據(jù)庫,在分子和更高水平上為基因和基因組分配功能性含義[10].將2個(gè)數(shù)據(jù)集中上調(diào)基因或下調(diào)基因的交集導(dǎo)入DAVID68中,將結(jié)果導(dǎo)出至Excel表格中進(jìn)行篩選,篩選標(biāo)準(zhǔn):P<001,count≥5,將篩選后的結(jié)果導(dǎo)入在線工具imageGP(http://www.ehbio.com/ImageGP/index.php/
Home/Index/index.html)中,可視化分析,P<005被認(rèn)為有統(tǒng)計(jì)學(xué)意義.
1.5PPI網(wǎng)絡(luò)的構(gòu)建及關(guān)鍵基因的篩選
STRING數(shù)據(jù)庫旨在通過合并大量生物體的已知和預(yù)測的蛋白質(zhì)———蛋白質(zhì)關(guān)聯(lián)數(shù)據(jù)來收集和整合信息[11],其目標(biāo)是建立一個(gè)全面,客觀的全球網(wǎng)絡(luò),包括直接(物理)和間接(功能)交互[12].使用STRING數(shù)據(jù)庫(http://stringGdb.org)分析蛋白質(zhì)之間的相互作用關(guān)系,將上調(diào)基因和下調(diào)基因DEGs全部導(dǎo)入
STRING數(shù)據(jù)庫,認(rèn)為置信度≥04為PPI顯著.分析結(jié)果導(dǎo)入Cytoscape3.6.1軟件中進(jìn)行可視化分析[13].利用cytoHubba插件并選擇degree[14]算法,從PPI網(wǎng)絡(luò)中篩選核心基因,選擇degree≥85的79個(gè)DEGs作為核心基因.
1.6關(guān)鍵基因的表達(dá)與生存預(yù)后分析
使用在線工具UALCAN[15](http://UALCAN.path.uab.edu)分析并驗(yàn)證核心DEGs的表達(dá),及KapGlanGMeierplotter(http://kmplot.com/analysis/)在線數(shù)據(jù)庫分析核心DEGs的生存預(yù)后.篩選出表達(dá)與生存預(yù)后相符合的關(guān)鍵基因,利用在線工具UALCAN分析關(guān)鍵基因的表達(dá)與HCC不同腫瘤分期關(guān)系.參數(shù)設(shè)置為默認(rèn),P<005被認(rèn)為有統(tǒng)計(jì)學(xué)意義.
2結(jié)果
2.1DEGs的篩選
從GSE60502數(shù)據(jù)集和GSE84402數(shù)據(jù)集(表1,HCC:肝細(xì)胞癌;GEO:基因表達(dá)數(shù)據(jù)庫)中分別獲取21156和22188個(gè)基因,結(jié)果通過火山圖展示(圖1(a)),其中,紅色代表上調(diào)表達(dá)基因,綠色代表下調(diào)表達(dá)基因,黑色代表數(shù)據(jù)集中差異基因的表達(dá)水平不顯著的基因).通過Bioinformatics&EvolutionaryGenomics在線網(wǎng)站對(duì)GSE60502數(shù)據(jù)集和GSE84402數(shù)據(jù)集的上調(diào)基因和下調(diào)基因分別取交集,獲得這2個(gè)數(shù)據(jù)集中相同的DEGs.通過Venn圖可視化分析,發(fā)現(xiàn)這2個(gè)數(shù)據(jù)集的DEGs共同具有上調(diào)基因340個(gè)(logFC>1,P<001)和下調(diào)基因469個(gè)(logFC<-1,P<001)(圖1(b)).
2.2DEGs的GO分析和KEGG富集分析
生物過程中,上調(diào)的DEGs主要參與DNA復(fù)制起始、以DNA為模板的轉(zhuǎn)錄負(fù)調(diào)控、基于微管的運(yùn)動(dòng)、細(xì)胞增殖以及細(xì)胞分裂過程的調(diào)控;下調(diào)的DEGs參與氧化還原過程、炎癥反應(yīng)、凝血、蛋白水解以及免疫反應(yīng)的調(diào)節(jié)(圖2(a)).在細(xì)胞成分上,上調(diào)的DEGs主要參與構(gòu)成細(xì)胞質(zhì)、細(xì)胞核、核膜、核仁以及核漿的組成成分;下調(diào)的DEGs則主要參與構(gòu)成外泌體、線粒體等細(xì)胞外區(qū)域(圖2(b)).在分子功能上,上調(diào)的DEGs一般具有ATP結(jié)合能力、ATP依賴性微管運(yùn)動(dòng)活性、單鏈DNA結(jié)合能力以及DNA復(fù)制的起點(diǎn)結(jié)合能力;下調(diào)的DEGs一般具有鈣離子結(jié)合能力,鐵離子結(jié)合能力,血紅素結(jié)合能力,絲氨酸型內(nèi)肽酶活性以
及與受體結(jié)合的能力(圖2(c)).在KEGG途徑上,上調(diào)的DEGs多數(shù)參與細(xì)胞周期、DNA復(fù)制、卵母細(xì)胞減數(shù)分裂以及p53信號(hào)通路;下調(diào)的DEGs主要參與代謝途徑、抗生素的生物合成、補(bǔ)體和凝血級(jí)聯(lián)、碳代謝以及甾體激素的生物合成信號(hào)通路(圖2(d)).
2.3PPI網(wǎng)絡(luò)的構(gòu)建及核心基因的篩選
為了進(jìn)一步篩選核心的DEGs,使用STRING在線數(shù)據(jù)庫分析得到2個(gè)數(shù)據(jù)集的340個(gè)上調(diào)基因和469個(gè)下調(diào)基因的蛋白調(diào)控網(wǎng)絡(luò).通過Cytoscape軟件中的cytoHubba插件進(jìn)一步篩選出79個(gè)核心基因(degree>85)(圖3(a),表2),且均為上調(diào)基因.接下來對(duì)這79個(gè)核心DGEs進(jìn)行GO分析和KEGG富集
分析,在生物學(xué)過程中,核心DEGs主要參與DNA復(fù)制起始染色體分離以及有絲分裂染色質(zhì)濃縮過程(圖3(b)).在細(xì)胞成分上,核心DEGs主要構(gòu)成細(xì)胞質(zhì)、細(xì)胞核以及細(xì)胞膜的組成成分(圖3(c)).在分子功能上,核心DEGs一般具有ATP結(jié)合的能力.在KEGG途徑上,核心DEGs主要參與細(xì)胞周期、DNA復(fù)制以及卵母細(xì)胞減數(shù)分裂途徑(圖3(d)).
2.4關(guān)鍵基因的表達(dá)、生存預(yù)后以及與不同腫瘤分期的關(guān)系
使用UALCAN以及KaplanMeierGplotter網(wǎng)站進(jìn)行表達(dá)和生存預(yù)后分析,篩選到6個(gè)高表達(dá)的基因(圖4,?P<0.05,??P<0.01,???P<0.001),且在HCC中有顯著預(yù)后差異(圖5),分別為:
RAD51AP1(r=1.88,P<0.05)、FANCI(r=1.98,P<0.05)、SMC2(r=1.67,P<0.05)、POLE2(r=1.6,P
<0.05)、CENPN(r=1.69,P<0.05)、WDHD1(r=1.78,P<0.05),這些上調(diào)基因的預(yù)后生存分析結(jié)果表明,高表達(dá)的關(guān)鍵基因會(huì)顯著降低HCC患者的生存率,且與不同腫瘤分期(正常,一級(jí),二級(jí),三級(jí)和四級(jí))Grade1G3呈現(xiàn)正相關(guān)趨勢(shì)(圖6,?P<0.05,??P<0.01,???P<0.001)).
3討論
隨著大數(shù)據(jù)時(shí)代正式到來,產(chǎn)生了大量的共享生物數(shù)據(jù),大數(shù)據(jù)應(yīng)用的關(guān)鍵在于挖掘其中的重要信息并進(jìn)行分析解釋[16].HCC是常見的惡性腫瘤,通常在慢性肝病的背景下出現(xiàn).手術(shù)切除和移植是早期肝細(xì)胞癌治療的基礎(chǔ)[17].不幸的是,肝癌患者通常被診斷為晚期[18],采用現(xiàn)代治療方法,晚期肝細(xì)胞癌患者治療選擇很少,并且預(yù)后很差,中位生存率低,HCC的全球負(fù)擔(dān)正在增加,可能會(huì)超過每年100萬例的發(fā)病率[19],因此,HCC潛在治療靶點(diǎn)的探究顯得格外重要.
本研究使用生物信息學(xué)的方法,對(duì)2個(gè)GEO數(shù)據(jù)集進(jìn)行分析,篩選出HCC中癌組織和癌旁正常組織中的809個(gè)DEGs,包括340個(gè)上調(diào)DEGs,469個(gè)下調(diào)DEGs;GO和KEGG富集分析顯示,上調(diào)的DEGs主要作為細(xì)胞質(zhì)的組成成分,與ATP結(jié)合和DNA復(fù)制過程有關(guān),參與細(xì)胞周期的調(diào)控;下調(diào)的DEGs是細(xì)胞
外泌體的主要組成成分,與鈣離子結(jié)合和氧化還原過程有關(guān),參與細(xì)胞代謝的調(diào)控.提示HCC的發(fā)生發(fā)展以及早期診斷和預(yù)后生存可能與調(diào)控細(xì)胞周期和DNA復(fù)制的DEGs有關(guān).通過PPI網(wǎng)絡(luò)分析、表達(dá)分析以及預(yù)后生存分析進(jìn)一步篩選出了與HCC進(jìn)展高度相關(guān)的6個(gè)新的關(guān)鍵基因,分別為RAD51AP1、FANGCI、SMC2、POLE2、CENPN、WDHD1.RAD51AP1是端粒選擇性延長的重要介質(zhì)[20],端粒延長與DNA復(fù)制和細(xì)胞周期密切相關(guān)[21G22],端粒的伸長受到細(xì)胞周期的調(diào)節(jié),并在S期與DNA復(fù)制相關(guān)[23].有報(bào)道表明,RAD51AP1是神經(jīng)膠質(zhì)瘤中的促癌基因[24],沉默RAD51AP1可抑制非小細(xì)胞肺癌上皮—間質(zhì)轉(zhuǎn)化和轉(zhuǎn)移[25].FANCI是Akt激活的負(fù)調(diào)節(jié)劑[26],在核糖體生物發(fā)生中也起作用[27].SMC2是膀胱癌的癌基因[28],POLE2可以參與調(diào)控肺腺癌[29].CENPN是著絲粒蛋白家族的重要成員,對(duì)于動(dòng)粒組裝和染色體分離至關(guān)重要,通過調(diào)控細(xì)胞周期調(diào)控口腔癌,CENPN還參與人間期細(xì)胞核質(zhì)復(fù)合體的形成,WDHD1參與調(diào)控肺腺癌,并與膽管癌的上皮—間質(zhì)轉(zhuǎn)化,腫瘤生長和轉(zhuǎn)移相關(guān)[30].這6個(gè)基因多數(shù)在不同腫瘤中作為癌基因發(fā)揮作用,調(diào)控細(xì)胞周期和DNA復(fù)制過程,與本研究的生物信息學(xué)分析的結(jié)果一致.
4結(jié)論
本研究通過運(yùn)用生物信息學(xué)方法對(duì)2個(gè)GEO數(shù)據(jù)集GSE60502和GSE84402進(jìn)行全面系統(tǒng)分析,最終篩選出6個(gè)新的可能與HCC密切相關(guān)的關(guān)鍵基因RAD51AP1、FANCI、SMC2、POLE2、CENPN、WDHD1,這些基因可能是HCC潛在的治療靶點(diǎn),有望為HCC的內(nèi)在機(jī)制的探究提供理論依據(jù).隨著大數(shù)據(jù)共享以及生物信息學(xué)技術(shù)的不斷進(jìn)步,生物信息學(xué)在基因芯片研究的基礎(chǔ)上,能全面系統(tǒng)地為疾病的研究提供更可靠的理論基礎(chǔ).
參考文獻(xiàn)
[1]STEFANODEF,CHACONE,TURCIOSL,etal.Novelbiomarkersinhepatocellularcarcinoma[J].DigLiverDis,2018;50(11):1115G1123.
[2]JIANGHY,CHENJ,XIACC,etal.Noninvasiveimagingofhepatocellularcarcinoma:Fromdiagnosistoprognosis[J].WorldJGastroGenterol,2018;24(22):2348G2362.
[3]KULIKL,ELGSERAGHB.Epidemiologyandmanagementofhepatocellularcarcinoma[J].Gastroenterology,2019;156(2):477G491.e471.
[4]李海強(qiáng),趙希梅,魏賓,等.基于多特征融合和ELM的肝病多分類識(shí)別[J].青島大學(xué)學(xué)報(bào)(自然科學(xué)版),2018;31(4):42G48.
[5]LIUFF,LIUYN,CHENZ.TimG3expressionanditsroleinhepatocellularcarcinoma[J].JournalofHematologyOncology,2018,11(1):126.doi:10.1186/s13045G018G0667G4.
[6]WANGYH,CHENGTY,CHENTY,etal.Plasmalemmalvesicleassociatedprotein(PLVAP)asatherapeutictargetfortreatmentofhepatocellularcarcinoma[J].BMCCancer,2014,14:815.doi:10.1186/1471G2407G14G815
[7]WANGH,HUOX,YANGXR,etal.STAT3GmediatedupregulationoflncRNAHOXDGAS1asaceRNAfacilitateslivercancermetastaGsisbyregulatingSOX4[J].MolCancer,2017,16(1):136.doi:10.1186/s12943G017G0680G1
[8]DENNISJRG,SHERMANBT,HOSACKDA,etal.DAVID:Databaseforannotation,visualization,andintegrateddiscovery[J].GeGnomeBiol,2003,4(9):R60.
[9]KANEHISAM,F(xiàn)URUMICHIM,TANABEM,etal.Expansionofthegeneontologyknowledgebaseandresources[J].NucleicAcidsRes,2017,45(D1):D331GD338.
[10]KANEHISAM,F(xiàn)URUMICHIM,TANABEM,etal.KEGG:Newperspectivesongenomes,pathways,diseasesanddrugs[J].NucleicAcidsRes,2017,45(D1):D353GD361.
[11]SZKLARCZYKD,MORRISJH,COOKH,etal.TheSTRINGdatabasein2017:QualityGcontrolledproteinGproteinassociationnetGworks,madebroadlyaccessible[J].NucleicAcidsRes,2017,45(D1):D362GD368.
[12]SZKLARCZYKD,GABLEAL,LYOND,etal.STRINGv11:proteinGproteinassociationnetworkswithincreasedcoverage,supportingfunctionaldiscoveryingenomeGwideexperimentaldatasets[J].NucleicAcidsRes,2019,47(D1):D607GD613.
[13]DONCHEVANT,MORRISJH,GORODKINJ,etal.CytoscapestringApp:Networkanalysisandvisualizationofproteomicsdata[J].JProteomeRes,2019,18(2):623G632.
[16]易曙光,孟昕,李詠沙.基于大數(shù)據(jù)的檔案管理及挑戰(zhàn)[J].青島大學(xué)學(xué)報(bào)(自然科學(xué)版),2019;32(3):44G48.
[17]GRANDHIMS,KIMAK,RONNEKLEIVGKELLYSM,etal.Hepatocellularcarcinoma:Fromdiagnosistotreatment[J].SurgOnGcol,2016,25(2):74G85.
[18]OGUNWOBIOO,HARRICHARRANT,HUAMANJ,etal.Mechanismsofhepatocellularcarcinomaprogression[J].WorldJGastroGenterol,2019,25(19):2279G2293.
[19]LLOVETJM,MONTALR,SIAD,etal.Moleculartherapiesandprecisionmedicineforhepatocellularcarcinoma[J].NatRevClinOnGcol,2018,15(10):599G616.
[20]BARROSOGGONZLEZJ,GARCAGEXPSITOL,HOANGSM,etal.RAD51AP1isanessentialmediatorofalternativelengtheningoftelomeres[J].MolCell,2019,76(1):11G26.e17.
[21]HASEGAWAY,YAMAMOTOM,MIYAMORIJ,etal.TelomereDNAlengthGdependentregulationofDNAreplicationtimingatinGternallatereplicationorigins[J].SciRep,2019,9(1):9946.
[22]POOLELA,ZHAOR,GLICKGG,etal.SMARCAL1maintainstelomereintegrityduringDNAreplication[J].ProcNatlAcadSciUSA,2015,112(48):14864G14869.
[23]LIS.CellGcycleGdependenttelomereelongationbytelomeraseinbuddingyeast[J].BiosciRep,2011,31(3):169G177.
[24]WANGQ,TANY,F(xiàn)ANGC,etal.SingleGcellRNAGseqrevealsRAD51AP1asapotentmediatorofEGFRvIIIinhumanglioblastomas[J].Aging(AlbanyNY),2019,11(18):7707G7722.
[25]WUY,WANGH,QIAOL,etal.SilencingofRAD51AP1suppressesepithelialGmesenchymaltransitionandmetastasisinnonGsmallcelllungcancer[J].ThoracCancer,2019,10(9):1748G1763.
[26]ZHANGX,LUX,AKHTERS,etal.FANCIisanegativeregulatorofAktactivation[J].CellCycle,2016,15(8):1134G1143.[27]SONDALLESB,LONGERICHS,OGAWALM,etal.FanconianemiaproteinFANCIfunctionsinribosomebiogenesis[J].ProcNatlAcadSciUSA,2019,116(7):2561G2570.
[28]HANYH,WANY,XIONGH,etal.Structuralmaintenanceofchromosomes2isidentifiedasanoncogeneinbladdercancerinvitroandinvivo[J].Neoplasma,2020,67(2):364G370.
[29]LIJ,WANGJ,YUJ,etal.KnockdownofPOLE2expressionsuppresseslungadenocarcinomacellmalignantphenotypesinvitro[J].OnGcolRep,2018,40(5):2477G2486.
[30]LIUB,HUY,QINL,etal.MicroRNAG494GdependentWDHDIinhibitionsuppressesepithelialGesenchymaltransition,tumorgrowthandmetastasisincholangiocarcinoma[J].DigLiverDis,2019,51(3):397G411.BioinformaticsAnalysisofKeyGenesinHepatocellularCarcinoma
SUIYingGli,LUKun,F(xiàn)ULin
(InstituteofChronicDiseases,SchoolofBasicMedicine,DepartmentofMedicine,
QingdaoUniversity,Qingdao266071,China)
Abstract:HepatocellularCarcinoma(HCC)isaprimaryhepatocellularcarcinomawithhighmortality.Duetoitslimitedtreatmentandlowchemotherapeuticsensitivity,itisurgenttofindpotentialclinicaltheraGpeutictargetsandbiomarkersforprognosis.Therefore,bioinformaticsmethodwasusedtominethekeygenesintheoccurrenceanddevelopmentofHCC.DatasetsweredownloadedfromGeneExpressionOmniGbus(GEO)andDifferentiallyExpressedGenes(DEGs)werescreened.OnlinedatabaseDAVID6.8wasusedforGeneOntology(GO)enrichmentanalysisandKEGGpathwayanalysis.OnlinedatabaseSTRINGwasusedtoconstructProteinGProteinInteractionnetwork(PPI),CytoscapsoftwarewasusedtoscreencoreDEGs,andGOandKEGGenrichmentanalysiswasperformed,UALCANandKaplanGMeierplotter
onlinedatabaseswereusedtoscreenandverifytheexpressionofkeygenesandsurvivalprognosis.ThereGsultsshowedthatsixkeygenesRAD51AP1、FANCI、SMC2、POLE2、CENPN、WDHD1werescreenedout,whichweresignificantlyrelatedtotheoccurrence,developmentandsurvivalprognosisofHCC.TheymaybepotentialtherapeutictargetsforHCCandprovidetheoreticalbasisfortheexplorationoftheinternalmechanismofHCC.
Keywords:bioinformatics;differentiallyexpressedgenes;proteinGproteininteractionnetwork;hepatocelGlularcarcinoma;enrichmentanalysi