周漩,吳韻瑤,鐘兆健
(廣東藥學(xué)院藥科學(xué)院,廣東廣州510006)
乳腺癌轉(zhuǎn)移相關(guān)分子標(biāo)志物的篩選
周漩,吳韻瑤,鐘兆健
(廣東藥學(xué)院藥科學(xué)院,廣東廣州510006)
目的篩選與乳腺癌轉(zhuǎn)移相關(guān)的分子標(biāo)志物,為乳腺癌的早期診斷、預(yù)后評(píng)估以及藥物靶點(diǎn)的研究提供參考。方法從NCBI的GEO數(shù)據(jù)庫(kù)中收集乳腺癌相關(guān)表達(dá)數(shù)據(jù),將未轉(zhuǎn)移與已轉(zhuǎn)移的乳腺癌數(shù)據(jù)進(jìn)行對(duì)比,采用GeneSpring軟件篩選差異表達(dá)基因,并通過(guò)ROC曲線與主成分分析對(duì)得到的差異表達(dá)基因進(jìn)行評(píng)價(jià)。結(jié)果篩選得到40個(gè)差異表達(dá)基因,對(duì)乳腺癌轉(zhuǎn)移與未轉(zhuǎn)移樣本分類(lèi)良好。結(jié)論篩選得到的差異基因可作為乳腺癌轉(zhuǎn)移的分子標(biāo)志物,對(duì)乳腺癌是否轉(zhuǎn)移進(jìn)行預(yù)測(cè)。
乳腺癌;轉(zhuǎn)移;差異表達(dá)基因;分子標(biāo)志物
乳腺癌是女性最常見(jiàn)的惡性腫瘤之一,發(fā)病率和死亡率居?jì)D女各類(lèi)惡性腫瘤之首,嚴(yán)重威脅著女性的身體健康[1]。近年來(lái)乳腺癌的治療手段和診斷方法不斷提高,但乳腺癌患者的死亡率仍然得不到有效的控制。遠(yuǎn)處轉(zhuǎn)移是乳腺癌患者死亡的最主要原因,目前針對(duì)乳腺癌轉(zhuǎn)移的治療尚未有明顯突破。
表觀遺傳學(xué)改變所導(dǎo)致的基因表達(dá)異常是乳腺癌發(fā)生的重要因素?;虮磉_(dá)譜[2]是用作描繪特定細(xì)胞或組織在特定狀態(tài)下的基因表達(dá)種類(lèi)和豐度信息,能夠反映出組織或細(xì)胞在某一特定狀態(tài)下的基因表達(dá)情況。在乳腺癌發(fā)生,發(fā)展和轉(zhuǎn)移的各個(gè)階段,基因表達(dá)譜均會(huì)發(fā)生相應(yīng)的變化。乳腺癌轉(zhuǎn)移早,發(fā)展快,甚至在乳腺癌發(fā)展初期就已出現(xiàn)微小轉(zhuǎn)移灶,因此,如能篩選出與乳腺癌轉(zhuǎn)移相關(guān)的基因作為分子標(biāo)志物,將有利于及時(shí)發(fā)現(xiàn)乳腺癌的轉(zhuǎn)移趨勢(shì),對(duì)患者把握治療時(shí)機(jī)有著重要的意義。
因此,本文采用生物信息學(xué)方法,對(duì)乳腺癌未轉(zhuǎn)移與已轉(zhuǎn)移樣本進(jìn)行差異表達(dá)譜的分析,并從中篩選出乳腺癌轉(zhuǎn)移的分子標(biāo)志物,為乳腺癌的早期診斷,預(yù)后評(píng)估等提供理論依據(jù)。
本文研究所用的乳腺癌基因表達(dá)譜數(shù)據(jù)來(lái)自于NCBI的GEO[3]數(shù)據(jù)庫(kù),包括GSE2603和GSE2034。其中,GSE2603包含了未出現(xiàn)轉(zhuǎn)移的乳腺癌樣本34例,已出現(xiàn)轉(zhuǎn)移的乳腺癌樣本65例;GSE2034包含了未出現(xiàn)轉(zhuǎn)移的乳腺癌樣本180例,已出現(xiàn)轉(zhuǎn)移的乳腺癌樣本106例。
2.1 差異表達(dá)基因譜分析
首先,采用GeneSpringGX11.5軟件對(duì)GSE2603進(jìn)行基因差異表達(dá)分析。將已轉(zhuǎn)移的乳腺癌樣本作為實(shí)驗(yàn)組樣本,未轉(zhuǎn)移的乳腺癌樣本作為對(duì)照組,采用非配對(duì)t檢驗(yàn)方法[4],分析得到差異表達(dá)基因譜。分析中設(shè)置的P值越小,得到的基因差異程度越大,本文將默認(rèn)的P<0.05調(diào)整為P<0.01,共得到475個(gè)差異表達(dá)基因。
2.2 分子標(biāo)志物的篩選
上述篩選得到的差異表達(dá)基因數(shù)量仍然很多,將其全部作為分子標(biāo)志物顯然不合理,也沒(méi)有實(shí)際應(yīng)用意義。一般來(lái)說(shuō),差異程度越大的基因,其作為分子標(biāo)志物的判斷準(zhǔn)確性越高,但選取單個(gè)基因作為標(biāo)志物,由于受到的影響因素很多,也難以實(shí)現(xiàn)準(zhǔn)確判斷。因此,考慮將差異程度大的基因進(jìn)行聯(lián)合作為分子標(biāo)志物,預(yù)測(cè)未知樣本是否發(fā)生轉(zhuǎn)移。
分別取經(jīng)分析得到的差異程度靠前的10、20、30、40、50個(gè)差異表達(dá)基因在數(shù)據(jù)集GSE2034上進(jìn)行驗(yàn)證,考察其作為分子標(biāo)志物預(yù)測(cè)乳腺癌是否轉(zhuǎn)移的準(zhǔn)確性。GSE2034中已轉(zhuǎn)移的乳腺癌樣本設(shè)為樣本組(轉(zhuǎn)移狀態(tài)用“1”表示),未轉(zhuǎn)移的乳腺癌樣本設(shè)為對(duì)照組(轉(zhuǎn)移狀態(tài)用“0”表示),以各組差異表達(dá)基因?yàn)樽宰兞?,樣本的轉(zhuǎn)移狀態(tài)為因變量,進(jìn)行Logistic回歸計(jì)算聯(lián)合預(yù)測(cè)分子[5],構(gòu)建 ROC[6]曲線。經(jīng)試驗(yàn)發(fā)現(xiàn),當(dāng)取前40個(gè)差異基因(見(jiàn)表1)為分子標(biāo)志物時(shí),ROC曲線下的面積為 0.776,對(duì)GSE2034的預(yù)測(cè)效果最佳(見(jiàn)圖1)。
表1 分子標(biāo)志物基因Table 1 Genes of molecular markers
P 2 3 8 1-2圖1 ROC曲線Figure 1 ROC curve
2.3 主成分分析
將篩選出的40個(gè)差異表達(dá)基因?qū)SE2603進(jìn)行主成分分析[7-8]。經(jīng)計(jì)算,40個(gè)差異表達(dá)基因中第一主成分能夠代表原表達(dá)譜數(shù)據(jù)的70.85%,第二主成分能夠代表原表達(dá)譜數(shù)據(jù)的10.21%,第三主成分能夠代表原表達(dá)譜數(shù)據(jù)的10%。對(duì)各樣本的3個(gè)主成分?jǐn)?shù)據(jù)進(jìn)行三維作圖,結(jié)果見(jiàn)圖2。
圖2 GSE2603主成分分析Figure 2 Analysis of GSE2603 principal components
圖中可見(jiàn),未發(fā)生轉(zhuǎn)移的乳腺癌組織和已經(jīng)發(fā)生轉(zhuǎn)移的乳腺癌組織被較好地分為2類(lèi),說(shuō)明篩選出來(lái)的差異基因能有效區(qū)分乳腺癌是否轉(zhuǎn)移。這些差異基因可作為乳腺癌的分子標(biāo)志物,檢測(cè)其在乳腺癌組織中的表達(dá)情況可對(duì)乳腺癌是否轉(zhuǎn)移進(jìn)行預(yù)測(cè),為乳腺癌的預(yù)后評(píng)估提供參考。
本文采用生物信息學(xué)方法,從GEO數(shù)據(jù)庫(kù)中收集并分析乳腺癌表達(dá)譜數(shù)據(jù),對(duì)已轉(zhuǎn)移的乳腺癌樣本和未轉(zhuǎn)移的乳腺癌樣本進(jìn)行分子標(biāo)志物的篩選,得到了40個(gè)差異表達(dá)基因?yàn)槿橄侔┺D(zhuǎn)移相關(guān)的分子標(biāo)志物。這些分子標(biāo)志物對(duì)乳腺癌的早期診斷、預(yù)后評(píng)估以及藥物治療靶點(diǎn)的選擇有重要的意義。
[1]石微.DNA甲基化在乳腺癌早期診斷中的研究進(jìn)展[J].科技信息,2012,32(7):643-644.
[2]WANG X,SPANDIDOS A,WANGK H,et al.PrimerBank: a PCR primer database for quantitative gene expression analysis,2012 update[J].Nucleic Acids Res,2012,40 (Database issue):1144-1149.
[3]余海浪,馬文麗,鄭文嶺.用于基因數(shù)據(jù)挖掘的基因表達(dá)數(shù)據(jù)庫(kù)GEO[J].中國(guó)生物工程雜志,2007,27(8):96-103.
[4]蔣定鋒,潘娟娟,趙耐青.差異表達(dá)基因篩選方法的比較[J].中國(guó)衛(wèi)生統(tǒng)計(jì),2006,23(5):417-420.
[5]陳衛(wèi)中,潘曉平,倪宗瓚.四種與冠心病相關(guān)指標(biāo)聯(lián)合診斷冠心病價(jià)值評(píng)價(jià)[J].現(xiàn)代預(yù)防醫(yī)學(xué),2006,33(5): 723-740.
[6]陳衛(wèi)中,潘曉平,倪宗瓚.Logistic回歸模型在ROC分析中的應(yīng)用[J].中國(guó)衛(wèi)生統(tǒng)計(jì),2007,23(5):112-116.
[7]王強(qiáng),許紅民.主成分分析在基因芯片分析中的應(yīng)用[J].軍醫(yī)進(jìn)修學(xué)院學(xué)報(bào),2005,26(2):145-147.
[8]黃成玉,阮曉鋼,李建更.基于基因表達(dá)譜胃癌特征基因選取研究[J].微計(jì)算機(jī)信息,2009,26(4):254-259.
(責(zé)任編輯:王昌棟)
Screening of the molecular markers associated with breast cancer metastasis
ZHOU Xuan,WU Yunyao,ZHONG Zhaojian
(School of Pharmacy,Guangdong Pharmaceutical University,Guangzhou 510006,China)
ObjectiveTo screen the molecular markers associated with breast cancer metastasis,and provide a reference for early diagnosis,prognosis evaluation and drug target research of breast cancer.MethodsThe gene expression data of breast cancer was collected from the GEO database of NCBI.The non-metastasis and metastasis samples were compared to screen the differential expression genes by Genespring software,and the differential expression genes were evaluated by ROC curves and PCA.ResultsThe screened 40 differential expression genes well classified the non-metastasis and metastasis samples.ConclusionThe screened differential expression genes as the molecular markers associated with breast cancer metastasis provide a prediction tool of breast cancer metastasis.
breast cancer;metastasis;differential expression gene;molecular maker
R737.9
:A
10.3969/j.issn.1006-8783.2015.05.026
1006-8783(2015)05-0676-03
2015-06-08
周漩(1975—),女,博士,副教授,主要從事化學(xué)生物信息學(xué)研究,Email:veego_z@hotmail.com。
時(shí)間:2015-09-18 14:24
http://www.cnki.net/kcms/detail/44.1413.R.20150918.1424.002.html