吳冠朋 王帥 黃偉 劉同海 尹勇 劉毅慧
摘 要 研究針對原發(fā)性肝癌(primary liver carcinoma, PLC)患者精確放療后乙型肝炎病毒(Hepatitis B virus, HBV)再激活分類預(yù)測模型,采用logistic提取關(guān)鍵特征子集,發(fā)現(xiàn)外放邊界、腫瘤分期TNM和HBV DNA水平是HBV再激活的危險因素(P<0.05)。建立BP神經(jīng)網(wǎng)絡(luò)分類預(yù)測模型,對原發(fā)性肝癌初始數(shù)據(jù)集和關(guān)鍵特征子集進(jìn)行HBV再激活分類預(yù)測。實驗結(jié)果表明,BP網(wǎng)絡(luò)對HBV再激活有著良好的分類預(yù)測性能,分類預(yù)測準(zhǔn)確性從73.33%提高到78.89%,關(guān)鍵特征子集分類預(yù)測準(zhǔn)確性高于初始數(shù)據(jù)集分類預(yù)測準(zhǔn)確性,表明了特征提取后的關(guān)鍵特征子集具有優(yōu)秀的類別區(qū)分性。
關(guān)鍵詞 PLC ;HBV再激活;特征提取;BP神經(jīng)網(wǎng)絡(luò)
中圖分類號 TP391 文獻(xiàn)標(biāo)識碼 A
Classification prognosis model of hepatitis B virus reactivation after radiotherapy in patients with primary liver carcinoma based on BP neural network
Wu Guanpeng1, Wang shuai1, Liu Tonghai2, Yin Yong2, Huang Wei2, Liu Yi hui1
(1 School of Information, Qilu University of Technology, Jinan 250353,China;2 Department of Radiation Oncology, Shandong Cancer Hospital, Jinan 250117, China)
Abstract This study aims at the classification prognosis model of hepatitis B virus (HBV) reactivation after precise radiotherapy(RT) in patients with primary liver carcinoma. Using logistic regression methods to extract the key feature subset. Finding the outer margin of RT, TNM of tumor stage and HBV DNA level were the risk factors(P<0.05) of HBV reactivation. Build classification prognosis model of BP neural network, classification prognosis of HBV reactivation for original data subset and the key feature subset in patients with primary liver carcinoma. Experimental results show that BP neural network has a good classification prognosis performance of HBV reactivation, the classification prognosis accuracy increased from 73.33% to 78.89%.The classification prognosis accuracy of the key feature subset is superior to original data subset, and the key feature subset has excellent classification of distinction after feature extraction.
Keywords Primary liver carcinoma; HBV reactivation; feature extraction; BP neural network
0 引 言
原發(fā)性肝癌(primary liver carcinoma, PLC)患者精確放療后可以致使感染乙型肝炎病毒(Hepatitis B virus, HBV)發(fā)生再激活,HBV[1]再激活可達(dá)20-25%左右,這類患者常伴有預(yù)后不良現(xiàn)象,死亡率達(dá)25%。找出HBV再激活的危險因素和建立HBV再激活分類預(yù)測模型對感染HBV的原發(fā)性肝癌患者的抗腫瘤治療具有重要臨床意義。韓國學(xué)者Kim等[2]在2007年對32例經(jīng)三維適形放療(three-dimensional conformal radiotherapy, 3D-CRT)的原發(fā)性肝癌患者進(jìn)行研究,推斷HBV DNA水平可
能是引起HBV再激活的危險因素。無獨有偶,吳曉安等[3-4]也相繼推斷HBV再激活患者死亡原因與HBV DNA復(fù)制活動密切相關(guān)。黃偉等[5]則于2013年通過對69例精確放療的原發(fā)性肝癌患者采用logistic法回歸分析各項指標(biāo)對HBV再激活的影響,發(fā)現(xiàn)基線血清HBV DNA水平是HBV再激活的獨立危險因素。該研究組隨后將精確放療劑量學(xué)參數(shù)引入研究,又相應(yīng)發(fā)現(xiàn)一些劑量學(xué)參數(shù)也是引起HBV再激活的高危因素[6]。綜上所述可知,原發(fā)性肝癌患者精確放療后致HBV再激活的危險因素有待進(jìn)一步研究,相關(guān)預(yù)測模型也隨之步入建立預(yù)期階段。
迄至目前,特征提取已廣泛應(yīng)用于生物醫(yī)學(xué)領(lǐng)域的復(fù)雜數(shù)據(jù)分析,諸如即已應(yīng)用在質(zhì)譜數(shù)據(jù)分析方面[7-8]。與此同時,BP神經(jīng)網(wǎng)絡(luò)也已在各大領(lǐng)域范圍獲得了全面推廣應(yīng)用,例如現(xiàn)已普遍應(yīng)用在膠囊異物缺陷識別[9],紙幣面向識別 [10],車牌字符識別[11],肝臟31P磁共振波譜分析[12,13]和紅細(xì)胞濃度無創(chuàng)檢測[14]等多個熱點研究方向中?;诖?,本文將使用logistic回歸分析檢測分析得出外放邊界、腫瘤分期TNM、HBV DNA 水平是HBV再激活的危險因素(P<0.05),同時建立BP神經(jīng)網(wǎng)絡(luò)分類預(yù)測模型,進(jìn)而分別對初始數(shù)據(jù)集和經(jīng)特征提取后的關(guān)鍵特征子集進(jìn)行HBV再激活分類準(zhǔn)確性預(yù)測。
結(jié)束語
本文針對原發(fā)性肝癌精確放療后致HBV再激活的問題,對于不同數(shù)據(jù)類型的臨床特征采用不同的特征提取方法,將得到顯著性因素再納入logistic回歸分析中,發(fā)現(xiàn)HBV DNA 水平、外放邊界和腫瘤分期TNM是HBV再激活的危險因素,即具有類別區(qū)分性的特征子集。然后對原發(fā)性肝癌患者初始數(shù)據(jù)集以及特征子集建立BP神經(jīng)網(wǎng)絡(luò)分類預(yù)測模型,分類預(yù)測結(jié)果表明:
(1)影響原發(fā)性肝癌患者發(fā)生HBV再激活的危險因素很多,
臨床數(shù)據(jù)量大,傳統(tǒng)方法難以構(gòu)建準(zhǔn)確的預(yù)測模型,不能找出HBV再激活相關(guān)的關(guān)鍵信息。而BP神經(jīng)網(wǎng)絡(luò)有著較強的模式識別能力,特別是特征提取后的關(guān)鍵特征子集在BP神經(jīng)網(wǎng)絡(luò)分類預(yù)測模型中的分類性能更優(yōu),有效降低了數(shù)據(jù)維度,并且提高了HBV再激活的分類預(yù)測準(zhǔn)確性。
(2)BP神經(jīng)網(wǎng)絡(luò)在HBV再激活分類預(yù)測中具有較高的應(yīng)用價值,可對已感染HBV的原發(fā)性肝癌患者采取抗病毒以及肝保護(hù)等治療方法,以提高原發(fā)性肝癌患者的生活質(zhì)量,延長生存周期。今后將繼續(xù)研究其他智能算法模型在HBV再激活研究的應(yīng)用,并致力于提高HBV再激活分類預(yù)測性能。
參 考 文 獻(xiàn)
[1] YEO W, LAM KC, ZEE B, et al. Hepatitis B reactivation in patients with hepatocellular carcinoma undergoing systemic chemotherapy[J]. Annals of Oncology, 2004, 15(7): 1661-1666.
[2] KIM JH, PARK J W, KIM TH, et al. Hepatitis B virus reactivation after three-dimensional conformal radiotherapy in patients with hepatitis B virus-related hepatocellular carcinoma[J]. International Journal of Radiation Oncology Biology Physics, 2007, 69(3): 813–819.
[3] 吳曉安,章志勇,嚴(yán)志彪,等. 原發(fā)性肝癌三維適形放療的臨床研究[J]. 臨床腫瘤學(xué)雜志, 2008, 13 (6): 538-540.
[4] 吳曉安,章志勇,洪節(jié)約,等. 三維適形放療治療86例肝癌的臨床療效分析[J]. 實用癌癥雜志, 2007, 22(4): 373-375.
[5] 黃偉,盧彥達(dá),張煒,等. 原發(fā)性肝癌精確放療致乙型肝炎病毒再激活分析[J]. 中華放射腫瘤學(xué)雜志, 2013, 22(3): 193-197.
[6] HUANG W, ZHANG W, FAN M, et al. Risk factors for hepatitis B virus reactivation after conformal radiotherapy in patients with hepatocellular carcinoma. Cancer science, 2014, 105(6): 697-703.
[7] Liu Y H. Feature extraction and dimensionality reduction for mass spectrometry data [J]. Computers in Biology and Medicine, 2009, 39(9): 818-823.
[8] 李義峰,劉毅慧. 基于遺傳算法的蛋白質(zhì)質(zhì)譜數(shù)據(jù)特征選擇[J]. 計算機工程, 2009, 35(19): 192-197.
[9] 陳毅, 劉曉玉, 劉斌,等. 基于BP神經(jīng)網(wǎng)絡(luò)的膠囊異物缺陷識別[J]. 計算機應(yīng)用與軟件, 2015(3): 196-199.
[10] 劉艷萍, 杜秋晨, 張進(jìn)東. 基于BP神經(jīng)網(wǎng)絡(luò)的紙幣面向識別方法[J]. 計算機應(yīng)用與軟件, 2015, 32(11): 176-179.
[11] 莫林,凌文彪,張福元,孫學(xué)彬. 基于評分模型的車牌字符識別方法[J]. 計算機應(yīng)用與軟件, 2015, 05: 203-206.
[12] 王韶卿,劉毅慧,王麗娟,等.基于反向傳輸神經(jīng)網(wǎng)絡(luò)的肝臟31P磁共振波譜分析[J]. 中國醫(yī)學(xué)影像技術(shù), 2009, 25(10): 1875-1878.
[13] 王韶卿,劉毅慧,付婷婷,等. 肝癌31磷磁共振波譜數(shù)據(jù)的分類[J]. 山東大學(xué)(醫(yī)學(xué)報), 2009, 47(6): 42-47.
[14] 張寶菊,雷晴,李剛,等. 基于BP神經(jīng)網(wǎng)絡(luò)的人體血液中紅細(xì)胞濃度無創(chuàng)檢測[J].光譜學(xué)與光譜分析,2012,32(9):2508-2511.
[15] 申希平,丁建生,李娟生,等. 在SPSS中利用均數(shù)和標(biāo)準(zhǔn)差做兩獨立樣本 檢驗[J]. 現(xiàn)代預(yù)防醫(yī)學(xué), 2007, 34(21): 4066-4067,4069.
[16] 胡文敏,何婷婷,張勇. 基于卡方檢驗的漢語術(shù)語抽取[J]. 計算機應(yīng)用, 2007, 27(12): 3019-3020+3025.
[17] 謝娟英,高紅超. 基于統(tǒng)計相關(guān)性與K-means的區(qū)分基因子集選擇算法[J]. 軟件學(xué)報, 2014(9): 2050-2075.
[18] 米根鎖,王彥快,馬學(xué)霞. BP神經(jīng)網(wǎng)絡(luò)在軌道電路分路不良預(yù)警中的應(yīng)用[J]. 計算機工程與科學(xué), 2013, 35(2): 159-163.
[19] 陳飛彥,田宇馳,胡亮. 物聯(lián)網(wǎng)中基于KNN和BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型的研究[J]. 計算機應(yīng)用與軟件, 2015, 06: 127-129+202.
[20] 邱龍金,賀昌政. 神經(jīng)網(wǎng)絡(luò)穩(wěn)定性的交叉驗證模型[J]. 計算機工程與應(yīng)用, 2010, 46(34): 43-45.