王麗萍 董進(jìn)中 王志宇
肝纖維化的發(fā)病率及死亡率均較高[1]。肝纖維化的本質(zhì)是細(xì)胞外基質(zhì)(ECM)合成與降解不平衡而導(dǎo)致ECM過度沉積,是肝硬化的前兆,多發(fā)生于病毒感染、酗酒或非酒精性脂肪性肝炎等引起的慢性肝損傷后[2-3]。肝星狀細(xì)胞(HSC)是導(dǎo)致肝纖維化的關(guān)鍵細(xì)胞,肝臟受損后HSC被激活,基質(zhì)金屬蛋白酶(MMP)/MMP組織抑制劑(TIMP)表達(dá)失衡,從而抑制ECM降解,而過多的ECM會(huì)破壞肝細(xì)胞結(jié)構(gòu),肝纖維化持續(xù)進(jìn)展最終導(dǎo)致肝硬化或肝癌。及時(shí)、有效的治療可以逆轉(zhuǎn)肝纖維化的進(jìn)展,但是目前缺少有效的治療方法。因此,了解肝纖維化的發(fā)生、發(fā)展機(jī)制并開發(fā)有效的抗纖維化制劑至關(guān)重要[4-5]。隨著分子生物學(xué)的快速發(fā)展,高通量基因芯片技術(shù)已用于一些疾病基因表達(dá)譜的分析和疾病特異分子標(biāo)志物的發(fā)現(xiàn),如何從中挖掘與疾病發(fā)病機(jī)制有關(guān)的信息是當(dāng)今研究的一個(gè)熱點(diǎn)[6]。本研究通過高通量基因表達(dá)(gene expression omnibus,GEO)數(shù)據(jù)庫對(duì) HSC 相關(guān)表達(dá)基因進(jìn)行篩選,對(duì)差異表達(dá)基因進(jìn)行生物學(xué)功能和信號(hào)通路分析,并探討差異表達(dá)基因的相互作用規(guī)律,了解肝纖維化發(fā)生的機(jī)制、標(biāo)志物的篩選及藥物靶點(diǎn)選擇,為預(yù)防肝硬化和肝癌的發(fā)生、發(fā)展提供理論依據(jù)。
1.1 材料 在GEO Datasets搜索框中輸入檢索詞“l(fā)iver fibrosis”,獲得Krizhanovsky等提交的GSE11954芯片數(shù)據(jù)。該研究采用商業(yè)化的離子通道芯片平臺(tái)GPL570:[HG-U133_Plus_2]Affymetrix Human Genome U133 Plus 2.0 Array。該芯片數(shù)據(jù)包括2例HSC活化組、2例HSC抑制組的基因表達(dá)陣列數(shù)據(jù)。
1.2 差異表達(dá)基因篩選 采用GEO2R分析GEO數(shù)據(jù)庫中的數(shù)據(jù),統(tǒng)計(jì)方法采用兩獨(dú)立樣本t檢驗(yàn)。差異表達(dá)基因需同時(shí)滿足以下篩選條件:差異倍數(shù)(fold change,F(xiàn)C)的對(duì)數(shù)值(logFC)>1或<-1和 P<0.05。
1.3 差異表達(dá)基因的生物信息學(xué)分析 將上述兩組樣本篩選出的差異表達(dá)基因上傳至DAVID進(jìn)行基因本體(gene ontology,GO)分析[包括分子功能(MF)、生物學(xué)過程(BP)和細(xì)胞組分(CC)3個(gè)部分]、京都基因與基因組百科全書(Kyotoencyclopediaofgenesandgenomes,KEGG)通路的富集分析[7-8]。
1.4 蛋白質(zhì)互作網(wǎng)絡(luò)構(gòu)建 將上述兩組樣本篩選出的差異表達(dá)基因上傳至String10.0在線分析工具(http://string-db.org),通過對(duì)HSC差異表達(dá)基因進(jìn)行蛋白-蛋白相互作用(protein-protein interaction,PPI)網(wǎng)絡(luò)分析,并利用Cytoscape軟件(version 3.4.0)構(gòu)建PPI網(wǎng)絡(luò),通過MCC算法獲取連接度最高的前10個(gè)基因作為關(guān)鍵基因。
2.1 差異表達(dá)基因篩選結(jié)果 通過對(duì)HSC活化組與HSC抑制組數(shù)據(jù)的差異表達(dá)基因篩選,共獲得1 176個(gè)差異表達(dá)基因,其中上調(diào)基因616個(gè),下調(diào)基因560個(gè),見圖1(插頁)。
圖1 HSC差異表達(dá)基因火山圖(紅色表示上調(diào),綠色表示下調(diào))
2.2 差異表達(dá)基因GO分析 將上述兩組樣本篩選出的差異表達(dá)基因上傳至DAVID并進(jìn)行GO分析。上調(diào)基因主要涉及細(xì)胞周期、細(xì)胞增殖、結(jié)合蛋白及細(xì)胞骨架等細(xì)胞增殖調(diào)控及ECM等生物學(xué)過程;下調(diào)基因主要涉及體外刺激調(diào)控反應(yīng)、炎癥反應(yīng)、細(xì)胞增殖調(diào)控及ECM等生物學(xué)過程,前5位的功能富集類別見表1~2。
2.3 差異表達(dá)基因通路富集分析 差異表達(dá)基因主要涉及ECM受體相互作用通路、黏著斑信號(hào)通路、致心律失常性右室心肌病通路、細(xì)胞周期通路及p53信號(hào)通路等,差異表達(dá)基因顯著富集通路見表3。
2.4 差異表達(dá)基因PPI分析結(jié)果 采用STRING10.0、Cytoscape軟件分析上述差異表達(dá)基因,通過MCC算法列出前10個(gè)蛋白互作網(wǎng)絡(luò)的中心節(jié)點(diǎn)(即核心基因):有絲分裂檢查點(diǎn)絲氨酸/蘇氨酸激酶B(mitotic checkpoint serine/threonine kinase B,BUB1B)、細(xì)胞周期蛋白依賴性激酶 1(cell dependent kinase 1,CDKl)、細(xì)胞周期蛋白A2(cyclin A2,CCNA2)、有絲分裂阻滯缺陷 2樣蛋白 1(mitotic arrest deficient 2 like 1,MAD2L1)、細(xì)胞周期蛋白 B2(cyclin B2,CCNB2)、有絲分裂檢查點(diǎn)絲氨酸/蘇氨酸激酶(mitotic checkpoint serine/threonine kinase,BUB1)、細(xì)胞分裂周期蛋白8(cell division cycle sssociated 8,CDCA8)、Aurora激酶 B(aurora kinase B,AURKB)、Ndc80 復(fù)合體(component of NDC80 kinetochore complex,NUF2)、驅(qū)動(dòng)蛋白家族成員 2C(kinesin family member 2C,KIF2C),見圖 2。
表1 HSC上調(diào)差異表達(dá)基因的分子生物學(xué)功能
表2 HSC下調(diào)差異表達(dá)基因的分子生物學(xué)功能
表3 HSC相關(guān)差異表達(dá)基因的KEGG通路分析
圖2 前10個(gè)蛋白互作網(wǎng)絡(luò)的中心節(jié)點(diǎn)
隨著生物信息學(xué)快速發(fā)展,高通量基因芯片及轉(zhuǎn)錄組測(cè)序技術(shù)已廣泛用于人類疾病基因表達(dá)譜分析、基因克隆和尋找疾病特異分子標(biāo)志物,從分子水平探索人類疾病治療新靶點(diǎn),對(duì)疾病診斷標(biāo)志物的研究和新藥研發(fā)具有重要意義。目前,雖然肝纖維化相關(guān)研究不斷開展中,但對(duì)分子機(jī)制的探討仍然有限。故本文旨在進(jìn)一步深入探討肝纖維化發(fā)生、發(fā)展的分子機(jī)制,為篩選肝纖維化的關(guān)鍵基因和藥物治療靶點(diǎn)提供一定的理論基礎(chǔ)。筆者主要通過利用生物信息學(xué)技術(shù)對(duì)GSE11954芯片數(shù)據(jù)進(jìn)行分析,共篩選出1 176個(gè)差異表達(dá)基因,其中上調(diào)基因616個(gè)、下調(diào)基因560個(gè),并通過DAVID、STRING進(jìn)行富集分析、通路分析和蛋白質(zhì)相互作用網(wǎng)絡(luò)分析,結(jié)果顯示上調(diào)基因主要涉及細(xì)胞周期、細(xì)胞增殖、結(jié)合蛋白及細(xì)胞骨架等細(xì)胞增殖調(diào)控及ECM等生物學(xué)過程;下調(diào)基因主要涉及體外刺激調(diào)控反應(yīng)、炎癥反應(yīng)、細(xì)胞增殖調(diào)控及ECM等生物學(xué)過程。在KEGG信號(hào)通路富集分析中,筆者發(fā)現(xiàn)差異表達(dá)基因主要涉及ECM受體相互作用通路、黏著斑信號(hào)通路、致心律失常性右室心肌病、細(xì)胞周期、p53信號(hào)通路等信號(hào)通路。
目前ECM-受體相互作用信號(hào)通路及黏著斑信號(hào)通路已被證實(shí)參與肝纖維化的發(fā)生、發(fā)展過程[9-10]。Kumar等[11]研究也發(fā)現(xiàn),通過抑制活化HSC的黏附復(fù)合體可以逆轉(zhuǎn)肝纖維化的進(jìn)展。因此,探索對(duì)HSC增殖和ECM過量產(chǎn)生的分子機(jī)制,有望進(jìn)一步找到治療肝纖維化的新靶點(diǎn)。此外,細(xì)胞周期信號(hào)通路及p53信號(hào)通路也與HSC增殖有關(guān)。Kim等[12]發(fā)現(xiàn)在二甲基亞硝胺誘導(dǎo)的大鼠肝纖維化模型中,分離HSC后發(fā)現(xiàn)實(shí)驗(yàn)組細(xì)胞周期蛋白(cyclin A、cyclin B、cyclin D1)和 HSC 的活性較對(duì)照組明顯增加,表明這些蛋白可能在二甲基亞硝胺處理后促進(jìn)了HSC的活性增殖。Nishizawa等[13]發(fā)現(xiàn)重組人胰島素樣生長因子-I可誘導(dǎo)HSC衰老、失活,從而改善肝纖維化;但在缺乏衰老調(diào)節(jié)因子p53的小鼠肝纖維化模型中,重組人胰島素樣生長因子-I則無法誘導(dǎo)HSC衰老。因此,調(diào)節(jié)因子p53與HSC的增殖密切相關(guān)。
除參與上述信號(hào)通路外,本研究從String數(shù)據(jù)庫和Cytoscape軟件分析結(jié)果顯示10個(gè)蛋白互作網(wǎng)絡(luò)的中心節(jié)點(diǎn),通過文獻(xiàn)挖掘發(fā)現(xiàn)上述基因與疾病纖維化的發(fā)生、發(fā)展密切相關(guān)。Konishi等[14]研究發(fā)現(xiàn),CCNA2在特發(fā)性肺纖維化組織中高表達(dá),而內(nèi)皮細(xì)胞大量凋亡,推測(cè)CCNA2可能通過介導(dǎo)肺內(nèi)皮細(xì)胞凋亡參與特發(fā)性肺纖維化的發(fā)生、發(fā)展。Sai等[15]發(fā)現(xiàn)抑制CDK1后,可抑制心臟成纖維細(xì)胞的分化和粘連(FA)復(fù)合物的形成,從而改善心肌纖維化。Madejon等[16]發(fā)現(xiàn)敲除AURKB基因后,可增加丙型肝炎病毒的感染;當(dāng)AURKB基因過表達(dá)時(shí),丙型肝炎病毒感染性降低,這證實(shí)AURKB基因可能通過調(diào)節(jié)炎癥通路影響丙型肝炎病毒的活性。由此推測(cè),上述基因可能與肝纖維化的發(fā)生、發(fā)展亦密切相關(guān),可為肝纖維化的治療提供新方向。
綜上所述,本研究通過采用生物信息學(xué)方法篩選HSC活化組與抑制組差異表達(dá)基因,同時(shí)探索其分子生物學(xué)功能,結(jié)果發(fā)現(xiàn)HSC差異表達(dá)基因可能主要通過ECM受體相互作用通路、黏著斑信號(hào)通路、細(xì)胞周期通路、p53信號(hào)通路來調(diào)控肝纖維化的發(fā)生、發(fā)展,但仍需通過體內(nèi)外實(shí)驗(yàn)和臨床研究作進(jìn)一步分子驗(yàn)證。