宋宜來(lái),劉中國(guó)
山西醫(yī)科大學(xué)第一醫(yī)院,山西太原 030001
多發(fā)性骨髓瘤(multiple myeloma,MM)是一種血液惡性腫瘤,其特征為骨髓中B淋巴細(xì)胞的克隆增殖,因此多發(fā)性骨髓瘤是一種B淋巴細(xì)胞淋巴瘤的血液系統(tǒng)疾病。近年來(lái)間充質(zhì)干細(xì)胞(MSC)作為血液系統(tǒng)腫瘤治療的新型方法得到了廣泛的關(guān)注[1-4]。但是隨著對(duì)MSC研究的不斷深入,有人發(fā)現(xiàn)與源自正常供體(ND-hMSC)的MSC相比,MM患者來(lái)源的MSC(MM-hMSC)在遺傳和功能上是不同的,自體MM骨髓間質(zhì)細(xì)胞的移植不能解決間充質(zhì)干細(xì)胞的來(lái)源問(wèn)題[5]。為進(jìn)一步探索間充質(zhì)干細(xì)胞的來(lái)源問(wèn)題,明確是否自體來(lái)源的脂肪間充質(zhì)干細(xì)胞是一種理想的細(xì)胞來(lái)源,我們對(duì)健康人與MM患者的脂肪基質(zhì)細(xì)胞進(jìn)行了比較,為脂肪基質(zhì)細(xì)胞的來(lái)源提供參考依據(jù)。
1 材料 GSE133346微陣列芯片數(shù)據(jù)包以及其平臺(tái)文件GPL570-55999來(lái)自基因表達(dá)數(shù)據(jù)庫(kù)(NCBI-GeneExpression Omnibus GEO)數(shù)據(jù)庫(kù),以“多發(fā)性骨髓瘤和脂肪基質(zhì)細(xì)胞”為關(guān)鍵詞搜索而來(lái),包含樣本24個(gè),共分2組,分別為健康人和MM患者的脂肪基質(zhì)細(xì)胞,每組12個(gè)人類樣本。R語(yǔ)言軟件以及操作指令代碼來(lái)自在線平臺(tái) (Bioconductor http://www.bioconductor.org)。 蛋白質(zhì)互作網(wǎng)絡(luò)圖(PPI)利用蛋白功能關(guān)系網(wǎng)絡(luò)數(shù)據(jù)庫(kù)STRING(http://string-db.org)構(gòu)建后下載,并通過(guò)軟件Cytoscape二次構(gòu)建。注釋、可視化和集成數(shù)據(jù)庫(kù)在線數(shù)據(jù)平臺(tái)(DAVID https://david.ncifcrf.gov)對(duì)差異基因進(jìn)行基因聚類分析(GO聚類分析和KEGG通路分析)。腫瘤關(guān)鍵基因的生存預(yù)后分析由癌癥數(shù)據(jù)在線分析、挖掘網(wǎng)站(UALCAN http://www.ualcan.path.edu/index.html)在線分析而得。
2 健康和MM患者脂肪基質(zhì)細(xì)胞差異基因的篩選下載GSE133346微陣列芯片數(shù)據(jù)包,通過(guò)R語(yǔ)言軟件對(duì)芯片進(jìn)行質(zhì)量監(jiān)控,在確認(rèn)芯片質(zhì)量的情況下對(duì)芯片數(shù)據(jù)RMA法矯正。平臺(tái)文件GPL570-55999對(duì)矯正后數(shù)據(jù)轉(zhuǎn)換基因ID至國(guó)際通用名稱。R軟件包用于處理下載的文件以及轉(zhuǎn)換和拒絕不合格的數(shù)據(jù)。對(duì)GSE133346數(shù)據(jù)進(jìn)行背景校準(zhǔn)、標(biāo)準(zhǔn)化以及l(fā)og2轉(zhuǎn)換。R語(yǔ)言軟件篩選健康人和MM患者的差異基因,利用Limma數(shù)據(jù)包代碼設(shè)置|log fold change (FC)|>1.5篩選出病患與健康人脂肪基質(zhì)細(xì)胞上的差異基因。
3 差異基因的GO富集分析以及KEGG途徑分析利用DAVID在線分析平臺(tái)對(duì)篩選后的差異基因進(jìn)行功能和通路上的富集分析[6]。由DAVID對(duì)GO富集功能進(jìn)行注釋,并對(duì)KEGG通路進(jìn)行注釋,分析后以TXT格式輸出分析。在對(duì)差異基因的富集分析過(guò)程中,在富集內(nèi)容條件允許下選取了前20個(gè)GO以及KEGG富集內(nèi)容。
4 蛋白質(zhì)互作網(wǎng)路分析篩選關(guān)鍵差異基因 篩選出差異基因輸入STRING在線數(shù)據(jù)庫(kù)[7],利用STRING預(yù)測(cè)蛋白相互作用,從STRING下載輸出后輸入Cytoscape離線軟件,分析蛋白互作關(guān)系。中心節(jié)點(diǎn)(Degree)值取中位數(shù),取Degree值大于中位數(shù)的基因。Degree值較高的基因是具有重要生理調(diào)節(jié)功能的關(guān)鍵的候選基因,并利用Cytoscape離線軟件構(gòu)建蛋白質(zhì)互作網(wǎng)絡(luò)。
5 MM脂肪基質(zhì)細(xì)胞關(guān)鍵基因的生存分析驗(yàn)證利用癌癥數(shù)據(jù)在線分析、挖掘網(wǎng)站(UALCAN http://www.ualcan.path.edu/index.html)對(duì)篩選出的關(guān)鍵基因進(jìn)行驗(yàn)證[8]。在健康人和MM患者脂肪基質(zhì)細(xì)胞中篩選出關(guān)鍵差異基因后,輸入在線工具UALCAN分析關(guān)鍵基因的生存預(yù)后。關(guān)鍵基因輸入U(xiǎn)ALCAN數(shù)據(jù)庫(kù)后選取較健康來(lái)源脂肪間充質(zhì)干細(xì)胞有明顯差異的關(guān)鍵差異基因(P<0.05)。
6 統(tǒng)計(jì)學(xué)分析 利用R軟件對(duì)基因資料做統(tǒng)計(jì)分析。以穩(wěn)健的多陣列平均值(RMA)處理樣本,最近鄰居法(KNN)法尋找與有缺失值基因的表達(dá)譜相似的其他基因,并填充缺失值。P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
1 健康人和MM患者脂肪基質(zhì)細(xì)胞差異基因的篩選 通過(guò)R語(yǔ)言軟件Limma包從20 458個(gè)基因中,以|log fold change (FC)|>1.5以及較健康人來(lái)源脂肪間充質(zhì)干細(xì)胞有明顯差異的關(guān)鍵差異基因(P<0.05)為標(biāo)準(zhǔn)篩選。差異基因148個(gè),其中上調(diào)47個(gè),下調(diào)101個(gè)(表1、圖1)。
2 差異基因的GO功能和KEGG通路富集分析對(duì)篩選出的差異基因通過(guò)在線功能和通路分析軟件DAVID分析,選取前20以內(nèi)的功能富集內(nèi)容(表2,表3,表4)。內(nèi)容包括生物過(guò)程(biological processes,BP)、 細(xì) 胞 成 分 (cellular components,CC)及分子功能(molecular functions,MF)三個(gè)方面(圖2)。生物過(guò)程相關(guān)的前5位內(nèi)容分別是白細(xì)胞遷移、細(xì)胞黏附、細(xì)胞對(duì)成纖維細(xì)胞生長(zhǎng)因子刺激的反應(yīng)、口感發(fā)展以及細(xì)胞外基質(zhì)組織。細(xì)胞成分相關(guān)的分別是細(xì)胞外泌體、內(nèi)質(zhì)網(wǎng)腔、細(xì)胞外區(qū)域、細(xì)胞表面以及質(zhì)膜。分子功能相關(guān)的分別是膠原結(jié)合、肌動(dòng)蛋白結(jié)合、血小板衍生生長(zhǎng)因子受體結(jié)合、細(xì)胞外基質(zhì)結(jié)構(gòu)成分以及微管蛋白結(jié)合。差異基因的KEGG通路富集,分別有黏著力、調(diào)節(jié)肌動(dòng)蛋白細(xì)胞骨架、ECM-受體相互作用、癌癥中的膽堿代謝以及PI3K-Akt信號(hào)通路(圖2、表 5)。
圖1 健康人和多發(fā)性骨髓瘤患者脂肪基質(zhì)細(xì)胞之間的差異基因表達(dá)情況[紅色標(biāo)記點(diǎn)表示基于倍數(shù)變化大于log2(1.5)的差異基因,并且同時(shí)P<0.05。綠色標(biāo)記點(diǎn)表示基于倍數(shù)變化小于-log2(1.5),且P<0.05的下調(diào)的差異基因,灰色標(biāo)記點(diǎn)表示無(wú)顯著差異的基因]Fig. 1 Differential gene expression of adipose stromal cells in healthy controls and multiple myeloma patients (red dots indicate differential genes based on fold change greater than log2[1.5], with P<0.05. Green dots indicate down-regulated differential genes less than fold change based on -log2[1.5],with P<0.05, gray marked dots indicate genes without signif i cant differences)
表1 健康人和多發(fā)性骨髓瘤患者脂肪基質(zhì)細(xì)胞的差異基因Tab.1 Differentially expressed genes in adipose stromal cells in the healthy controls and the multiple myeloma patients
表2 健康人和多發(fā)性骨髓瘤患者脂肪基質(zhì)細(xì)胞差異基因的生物過(guò)程相關(guān)的GO富集分析Tab. 2 Analysis of GO enrichment related to biological processes of differentially expressed genes in adipose stromal cells from the healthy controls and the multiple myeloma patients
圖2 健康人和多發(fā)性骨髓瘤患者脂肪基質(zhì)細(xì)胞差異基因的GO功能富集以及KEGG途徑富集A:生物過(guò)程; B:細(xì)胞成分; C:分子功能; D:KEGG途徑;圖中圓圈顏色指示P值的變化,大小表示差異基因的富集數(shù)量Fig. 2 GO function enrichment and KEGG pathway enrichment of differentially expressed genes in adipose stromal cells from healthy controls and multiple myeloma patientsA : biological process ; B: cellular components; C : molecular function; D : KEGG pathway; circled color indication P value change, the size indicates the enrichment amount of the differential genes
表3 健康人和多發(fā)性骨髓瘤患者脂肪基質(zhì)細(xì)胞差異基因與細(xì)胞成分相關(guān)的GO富集分析Tab. 3 GO enrichment analysis of differentially expressed genes and cell components in adipose stromal cells in the healthy controls and the multiple myeloma patients
表4 健康人和多發(fā)性骨髓瘤患者脂肪基質(zhì)細(xì)胞差異基因與分子功能相關(guān)的GO富集分析Tab. 4 GO enrichment analysis of differentially expressed gene and molecular function in adipose stromal cells in the healthy controls and the multiple myeloma patients
表5 健康人和多發(fā)性骨髓瘤患者脂肪基質(zhì)細(xì)胞差異基因的KEGG 通路富集分析Tab. 5 KEGG pathway enrichment analysis of differentially expressed genes in adipose stromal cells in the healthy controls and the multiple myeloma patients
3 蛋白質(zhì)互作網(wǎng)絡(luò)分析關(guān)鍵差異基因 在篩選過(guò)程中,導(dǎo)出基因Degree值>3的基因,被認(rèn)為是關(guān)鍵基因。關(guān)鍵基因30個(gè),其中上調(diào)基因14個(gè),下調(diào)基因16個(gè)。軟件Cytoscape構(gòu)建30個(gè)關(guān)鍵差異基因的蛋白質(zhì)互相作用網(wǎng)絡(luò)(圖3)。通過(guò)R-heatmap軟件繪制經(jīng)拓?fù)鋵W(xué)分析后共30個(gè)上調(diào)以及下調(diào)基因(圖4)。
4 關(guān)鍵差異基因與腫瘤的關(guān)系 關(guān)鍵差異基因?qū)氚┌Y數(shù)據(jù)在線分析、挖掘網(wǎng)站(UALCAN http://www.ualcan.path.edu/index.html),選取與健康人來(lái)源脂肪間充質(zhì)干細(xì)胞有明顯差異的關(guān)鍵差異基因 (P< 0.05)。發(fā)現(xiàn)基因 CSRP1、FSTL3、FYN、LAMB1、MYLK、PRRX1與MM發(fā) 展 相 關(guān)。 其中CSRP1、FYN和MYLK與MM發(fā)展正相關(guān),而FSTL3、LAMB1、PRRX1與MM發(fā)展負(fù)相關(guān)(圖5)。
MMBD目前的治療是使用雙膦酸鹽,或在某種程度上配合使用靶向藥物治療[9]。雖然可以在一定程度上改善MM的臨床癥狀,但是療效并不理想。因此開(kāi)發(fā)新的治療策略來(lái)對(duì)抗MM顯得尤為重要。關(guān)于多發(fā)性骨髓瘤的治療當(dāng)前干細(xì)胞是一大熱點(diǎn),干細(xì)胞來(lái)源有骨髓、脂肪等,干細(xì)胞能否通過(guò)自體移植的方式治療腫瘤也是當(dāng)前研究的一個(gè)方向[10]。自體來(lái)源的骨髓干細(xì)胞作為便利的細(xì)胞來(lái)源得到了人們的關(guān)注,但是在實(shí)驗(yàn)中發(fā)現(xiàn)骨髓來(lái)源的干細(xì)胞有促進(jìn)腫瘤發(fā)展的作用[11]。
CSRP1是一種骨架蛋白,與細(xì)胞基質(zhì)降解有關(guān)。并且在前列腺癌和腎癌中作為標(biāo)志物,且在腫瘤的發(fā)生中出現(xiàn)表達(dá)改變。FSTL1是一種具有多種生物學(xué)調(diào)節(jié)功能的分泌型糖蛋白,近年來(lái)相關(guān)的文獻(xiàn)報(bào)道主要集中在炎癥、自身免疫性疾病、改善缺血/再灌注損傷和免疫調(diào)節(jié)等方向,發(fā)現(xiàn)通過(guò)TGFβ1-Smad2/3信號(hào)通路可影響FSTL1在結(jié)直腸癌中表達(dá)[12-13]。FSTL1上調(diào)與腫瘤浸潤(rùn)深度、淋巴結(jié)轉(zhuǎn)移及不良預(yù)后相關(guān)。FYN是Src激酶家族的59 kU成員,在最近的研究中發(fā)現(xiàn)FYN的抑制導(dǎo)致大腸癌細(xì)胞的選擇性細(xì)胞死亡[14]。LAMB1在大腸癌患者血清樣品中水平顯著升高,為腫瘤的明顯標(biāo)記物[15-16]。MYLK可能通過(guò)激活VEGFA/VEGFR2和下游Ras/ERK信號(hào)通路促進(jìn)膀胱癌的發(fā)展[17]。PRRX1的表達(dá)降低會(huì)刺激SDF-1/CXCR4信號(hào)傳導(dǎo),并與肝細(xì)胞癌中血液循環(huán)腫瘤細(xì)胞相關(guān)[18-19]。
圖3 蛋白質(zhì)相互作用網(wǎng)絡(luò)圖(方塊尺寸大小代表蛋白的向關(guān)聯(lián)數(shù)目,顏色的深度代表了不同基因的P值)Fig. 3 Protein interaction network diagram (The size of the square represents the number of related proteins, and the depth of the color represents the P value of different genes)
圖4 篩選后的30個(gè)差異基因熱圖[基于以變化倍數(shù)大于log2(1.5)且P<0.05,同時(shí)Degree值>3]Fig. 4 Heat map of 30 differentially expressed genes after screening based on fold change greater than 1.5 and P<0.05,while degree value>3
圖5 多發(fā)性骨髓瘤患者脂肪基質(zhì)細(xì)胞中CRSP1, FSTL3, FYN, LAMB1, MYLK, RRX1表達(dá)水平對(duì)預(yù)后的影響Fig. 5 Effect of CSRP1, FSTL3, FYN, LAMB1, MYLK, PRRX1 expression levels in adipose stromal cells on prognosis of patients with multiple myeloma
在本文中,我們利用生物信息學(xué)分析的方法對(duì)自體脂肪基質(zhì)細(xì)胞治療MM的方案進(jìn)一步研究挖掘了自體脂肪干細(xì)胞的相關(guān)基因改變。我們共尋找到6個(gè)相關(guān)的關(guān)鍵基因,并用在線數(shù)據(jù)庫(kù)做了相應(yīng)的驗(yàn)證。但是仍需相關(guān)患者標(biāo)本的進(jìn)一步實(shí)驗(yàn)驗(yàn)證。本數(shù)據(jù)庫(kù)一共包括24個(gè)樣本,其中12個(gè)為正常人,12個(gè)為MM患者。雖然樣本量已滿足分析要求,仍然需要其他數(shù)據(jù)庫(kù)的分析后進(jìn)一步驗(yàn)證。當(dāng)前干細(xì)胞自體移植治療MM是一種新的方案,MSC在MM治療中的應(yīng)用仍處于較為基礎(chǔ)階段。
本文中,我們通過(guò)對(duì)多發(fā)性骨髓瘤患者與健康人脂肪基質(zhì)細(xì)胞微陣列數(shù)據(jù)的分析,得到了差異基因的生物功能相關(guān)的特征,并篩選出脂肪基質(zhì)細(xì)胞與腫瘤相關(guān)的關(guān)鍵差異基因。關(guān)鍵差異基因可以為臨床上自體脂肪基質(zhì)細(xì)胞治療MM提供相關(guān)的分子生物靶標(biāo)參考。