尤斯涵 郭春燕
河北北方學(xué)院藥學(xué)系,張家口,075000,中國(guó)
乳腺癌(breast cancer,BC)是指發(fā)生在乳腺上皮組織的惡性腫瘤,其病因復(fù)雜,易受環(huán)境和遺傳因素的影響[1]。盡管目前有了很多治療BC 的方法,比如放射治療和手術(shù)、激素阻斷劑的給藥、化學(xué)療法和單克隆抗體,但是仍有許多患者在治療后出現(xiàn)乳腺癌復(fù)發(fā)等不良結(jié)果[2]。臍帶間充質(zhì)干細(xì)胞(umbilical cord mesenchymal stem cells,UC-MSCs)是一種存在于新生兒臍帶組織中的多功能干細(xì)胞[3]。UC-MSCs 具有易于獲得、擴(kuò)增等多個(gè)優(yōu)點(diǎn)[4];由于UC-MSCs 的表面抗原不突出,對(duì)移植細(xì)胞的免疫排斥反應(yīng)不明顯,配型要求不嚴(yán)格,便于移植[5-6]。至今,已有多項(xiàng)試驗(yàn)評(píng)估了UC-MSCs 治療惡性腫瘤(malignant tumor)的療效,如乳腺癌、前列腺癌、肺癌等[7-8]。
網(wǎng)絡(luò)藥理學(xué)旨在研究靶點(diǎn)、藥物、疾病和通路之間復(fù)雜多變的關(guān)系,為藥物發(fā)現(xiàn)提供了一種新方法[9]。目前,生物信息學(xué)已成為通過(guò)處理大量原始數(shù)據(jù)來(lái)研究系統(tǒng)特性的新工具。因此,網(wǎng)絡(luò)藥理學(xué)和生物信息學(xué)的方法不僅幫助我們獲取治療疾病的差異基因,還能給出與疾病相關(guān)的生物學(xué)通路等信息?;诖朔N背景,本研究將通過(guò)采用GEO 數(shù)據(jù)庫(kù)利用網(wǎng)絡(luò)藥理學(xué)和生物信息學(xué)的方法對(duì)所選臨床實(shí)驗(yàn)數(shù)據(jù)進(jìn)行分析,研究UC-MSCs 治療BC 的核心靶點(diǎn)及差異基因,初步探索它們的作用與功能,希望能為治療BC 提供新的方向。
進(jìn)入NCBI(www.ncbi.com.cn)選擇GEO 數(shù)據(jù)庫(kù)以“Human umbilical cord”、“Homo sapiens”為關(guān)鍵詞進(jìn)行檢索,得到了Naomi Ohta 等[10]提供的芯片數(shù)據(jù)GSE64827,下載UC-MSCs 細(xì)胞治療的原始數(shù)據(jù)。
1.2.1 差異基因的獲取
通過(guò)檢索Pubmed、Embase、Cochrane Library 和Web of Science 數(shù)據(jù)庫(kù),搜索UC-MSCs 抑制和促進(jìn)腫瘤的文獻(xiàn)。進(jìn)入 NCBI(www.ncbi.com.cn)的首頁(yè)界面,選擇 GEO 數(shù)據(jù)庫(kù)(https://www.ncbi.nlm.nih.gov/gds/?term=)進(jìn)行搜索。依據(jù)參考文獻(xiàn)與病例信息,利用數(shù)據(jù)庫(kù)預(yù)置芯片數(shù)據(jù),下載UC-MSCs 細(xì)胞治療的原始數(shù)據(jù)。
通過(guò)使用R 軟件對(duì)所得的原始數(shù)據(jù)進(jìn)行R 算法的原始數(shù)據(jù)處理分析(四分位數(shù)數(shù)據(jù)進(jìn)行歸一化處理)。即將數(shù)據(jù)中的探針I(yè)D 轉(zhuǎn)換為基因名,通過(guò)R 軟件進(jìn)行跑圖,得到UC-MSCs 細(xì)胞治療前后的差異基因,并將所得的結(jié)果以火山圖的形式展現(xiàn)出來(lái)。
1.2.2 蛋白質(zhì)-蛋白質(zhì)相互作用(protein-protein interaction,PPI)網(wǎng)絡(luò)分析
從STRING 數(shù)據(jù)庫(kù)[11]中找出這些差異基因的相關(guān)基因并進(jìn)行整理,從中選取置信度值在0.7 以上(包含0.7)的差異基因及相關(guān)基因。利用Cytoscape3.2.1軟件進(jìn)行渲染作圖分析,做出篩選差異基因及其相關(guān)基因的相互作用關(guān)系。運(yùn)用Cytoscape3.2.1 軟件中“Network Analyzer”得出平均自由度以及最大自由度值,對(duì)篩選的差異基因及其相關(guān)基因相互作用進(jìn)行拓?fù)浜Y選得到其PPI 網(wǎng)絡(luò)圖。
1.2.3 GO 和KEGG 分析
利用生信分析檢索引擎DAVID[12](https://david.ncifcrf.gov/tools.jsp)和R 軟件對(duì)實(shí)驗(yàn)數(shù)據(jù)中的差異基因進(jìn)行GO 富集分析和KEGG 通路分析。
Naomi Ohta 等提供的芯片數(shù)據(jù)GSE64827 中一共含有6 個(gè)樣本,其中有3 例是UC-MSCs 的對(duì)照樣本,剩余的3 例是UC-MSCs 與乳腺癌細(xì)胞(MDA-231 細(xì)胞)共培養(yǎng)的樣本。利用R 軟件進(jìn)行數(shù)據(jù)信息標(biāo)準(zhǔn)化處理(Fig.1),通過(guò)分析得到了11 個(gè)上調(diào)的差異基因(Tab.1),并繪制出火山圖(Fig.2)。
Fig.2 Volcano plot of differential genes
Tab.1 Differential genes
Fig.1 Data GSE64827 sample normalization correction
在基因蛋白-基因蛋白相互作用中,選取置信度大于等于 0.7 的基因并通過(guò)Cytoscape3.2.1 軟件對(duì)11 個(gè)差異基因及其相關(guān)基因的相互作用關(guān)系作圖(Fig.3),得到與10 個(gè)差異基因相互作用的基因有68 個(gè),通過(guò)274條邊進(jìn)行相互作用。在Cytoscape3.2.1 軟件“Network Analyzer”得出平均自由度7.026 以及最大自由度19,對(duì)Fig.3 進(jìn)行拓?fù)浜Y選得到其PPI 網(wǎng)絡(luò)圖(Fig.4),得出42 個(gè)節(jié)點(diǎn)基因,并通過(guò)179 條邊進(jìn)行相互作用,其中顏色由紅到黃代表重要程度依次降低。經(jīng)拓?fù)浜Y選出PPI 網(wǎng)絡(luò)中關(guān)聯(lián)度高(基因間相互作用多)的差異基因(Tab.2)。
Tab.2 Four differential genes with high correlation in the post-topology PPI network
Fig.3 Interaction relationship between 11 differential genes and their related genes
Fig.4 10 differential genes and their related genes PPI network(topology)
通過(guò)DAVID 在線分析工具和R 軟件得出GO 功能的富集分析結(jié)果(Fig.5),其中GO 分析注釋得到了3 條生物過(guò)程,分別是果糖代謝過(guò)程、糖酵解過(guò)程和缺氧反應(yīng)過(guò)程。GO 分析涉及的主要基因?yàn)镻FKFB4、ALDOC、DDIT4、CA9。
Fig.5 GO enrichment analysis
利用DAVID 在線分析工具和R 語(yǔ)言軟件得出KEGG 通路圖(Fig.6),從Fig.6B 中可以看出,紅色區(qū)域(3.1.3.46 和4.1.2.13)可能含有11 個(gè)差異基因。進(jìn)KEGG 數(shù)據(jù)庫(kù)查詢得出3.1.3.46 中含有差異基因醛縮酶C(aldolase fructose-bisphosphate C,ALDOC),4.1.2.13 中含有差異基因PFKFB4。對(duì)11 個(gè)差異基因進(jìn)行R 分析,將得出的KEGG 通路結(jié)果數(shù)據(jù)做氣泡圖(Fig.7)。從Fig.7 中可以看出其只出現(xiàn)了一條通路,即果糖和甘露糖代謝。
Fig.6 KEGG pathway analysis
Fig.7 The bubble chart of KEGG pathway
網(wǎng)絡(luò)藥理學(xué)能夠通過(guò)大數(shù)據(jù)集來(lái)分析預(yù)測(cè)活性生物物質(zhì)的可能機(jī)制,從而確定藥物在癌癥等疾病治療中的效應(yīng)。生物信息學(xué)是生物研究的最新領(lǐng)域之一,主要通過(guò)使用數(shù)學(xué)、統(tǒng)計(jì)和計(jì)算等方法來(lái)處理和分析生物數(shù)據(jù)。因此本文利用這兩種方法來(lái)研究UC-MSCs治療BC 的核心靶點(diǎn)及差異基因。
本文通過(guò)利用R 軟件對(duì)NCBI(www.ncbi.com.cn)中的GEO 數(shù)據(jù)庫(kù)搜索UC-MSCs 治療BC 的原始數(shù)據(jù)集GSE64827 進(jìn)行處理,篩出得出11 個(gè)差異基因,即PFKFB4、ALDOC、DNA 損傷誘導(dǎo)轉(zhuǎn)錄轉(zhuǎn)錄物4(DNA damage-inducible transcript 4,DDIT4)、碳酸酐酶9(carbonic anhydrase 9,CA9)、胰島素樣生長(zhǎng)因子結(jié)合蛋白-3(IGF-binding proteins 3,IGFBP3)、跨膜蛋白45A(transmembrane protein 45A,TMEM45A)、鋅指蛋白395(zink finger 395,ZNF395)、重組人胞內(nèi)氯離子通道蛋 白3(chloride intracellular channel protein 3,CLIC3)、NDUFA4L2、MGC23985、ANKRD37。
PFKFB4 在癌細(xì)胞糖酵解的調(diào)節(jié)及其增殖和存活中起重要作用[13]。目前,PFKFB4 已被確定為多種癌癥的關(guān)鍵分子[14]。研究表明[15],PFKFB4 通過(guò)以p38信號(hào)通路誘導(dǎo)透明質(zhì)酸合酶2 (hyaluronan synthase 2,HAS2)表達(dá)和產(chǎn)生透明質(zhì)酸來(lái)促進(jìn)乳腺癌細(xì)胞的轉(zhuǎn)移。因此,PFKFB4 基因涉及的相關(guān)通路可能是UCMSCs 治療BC 發(fā)揮療效的機(jī)制之一。醛糖酶家族是參與糖酵解過(guò)程的主要酶之一。ALDOC 屬于醛縮酶家族,存在于正常腦組織中,負(fù)責(zé)修復(fù)受損組織[16]。由于PFKFB4 參與癌細(xì)胞糖酵解的調(diào)節(jié)及其增殖和存活,因此推斷ALDOC 蛋白可能參與BC 糖酵解的調(diào)節(jié)。由DDIT4 編碼的蛋白質(zhì)的主要功能是在壓力條件下抑制mTOR[17]。有研究表明[18],mTOR 信號(hào)傳導(dǎo)在癌癥及腫瘤微環(huán)境中具有重要作用。因此,初步推斷DDIT4 可能是治療BC 的潛在選擇。CA9 是一種腫瘤相關(guān)酶[19],在一些惡性腫瘤中過(guò)度表達(dá)[20]。
IGFBP3 是一種 p53 腫瘤抑制調(diào)節(jié)蛋白[21]。有研究發(fā)現(xiàn),TMEM45A 與腫瘤進(jìn)展和侵襲有關(guān)[22]。在缺氧條件下,ZNF395 水平升高可能通過(guò)激活先天免疫反應(yīng)和癌癥的靶基因來(lái)參與炎癥和癌癥進(jìn)展[23]。CLIC3 是一種存在于細(xì)胞內(nèi)的氯離子通道,其與腫瘤細(xì)胞的凋亡和遷移密切相關(guān)[24]。NDUFA4L2在TRHER2 陽(yáng)性乳腺癌細(xì)胞系中高度表達(dá)[25];MGC23985 等基因雖未找到相關(guān)報(bào)道,但從功能上看其與腫瘤有著密切的聯(lián)系??傊@11 個(gè)差異基因也許可以成為BC 的治療突破口,為治療BC 提供新的方向。
PPI 網(wǎng)絡(luò)是了解細(xì)胞功能、疾病機(jī)制和藥物設(shè)計(jì)或其重新定位的可行工具[26]。在PPI 網(wǎng)絡(luò)中,一般選用節(jié)點(diǎn)的自由度值大小來(lái)表征節(jié)點(diǎn)基因的重要程度,即自由度值越大,節(jié)點(diǎn)基因越重要。一般對(duì)基因進(jìn)行GO富集分析,能夠找出差異基因與哪些生物功能的改變相關(guān)。KEGG 數(shù)據(jù)庫(kù)[27](http://www.kegg.jp/)主要用于進(jìn)一步了解生物學(xué)高級(jí)功能和生物體系,并從分子水平角度進(jìn)行基因的富集分析,找尋其中可能參與疾病發(fā)生和發(fā)展的信號(hào)通路。因此,本文通過(guò)STRING數(shù)據(jù)庫(kù)的拓?fù)浜蟮腜PI 網(wǎng)絡(luò)得到了ALDOC、IGFBP3、DDIT4 和PFKFB4 這4 個(gè)關(guān)聯(lián)度較高的基因。通過(guò)GO 分析,得出涉及的主要基因?yàn)镻FKFB4、ALDOC、DDIT4 和CA9。通過(guò)KEGG 通路分析,得出涉及基因?yàn)锳LDOC,PFKFB4。
綜上,通過(guò)利用網(wǎng)絡(luò)藥理學(xué)和生物信息學(xué)技術(shù)平臺(tái)可以初步預(yù)測(cè)出UC-MSCs 治療乳腺癌核心靶點(diǎn)有ALDOC、PFKFB4 和DDIT4。這些基因靶點(diǎn)為UCMSCs 治療BC 提供了新的作用機(jī)制思路。猜測(cè)UCMSCs 抑制BC 可能與糖代謝通路有關(guān)。未來(lái)采用UC-MSCs 調(diào)節(jié)相關(guān)基因表達(dá)來(lái)參與抑制乳腺癌的發(fā)生是非??赡艿?。但是,由于上述臨床數(shù)據(jù)樣本量小,缺乏大數(shù)據(jù)、大樣本的多中心隨機(jī)對(duì)照的試驗(yàn)進(jìn)行的臨床研究,且有關(guān)UC-MSCs 的治療BC 疾病的機(jī)制仍尚未完全闡明,因此需要更加深入地系統(tǒng)研究其治療的可能性機(jī)制,以確保UC-MSCs 能更好地應(yīng)用于BC的臨床治療中。