• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      CART算法在原發(fā)性肝癌放療后HBV再激活的應(yīng)用

      2017-11-01 12:33:17吳冠朋劉毅慧
      生物信息學 2017年3期
      關(guān)鍵詞:正確性邊界肝癌

      吳冠朋, 黃 偉, 劉毅慧*

      (1.齊魯工業(yè)大學 信息學院, 濟南 250353; 2. 山東省腫瘤醫(yī)院放療病區(qū), 濟南 250117)

      CART算法在原發(fā)性肝癌放療后HBV再激活的應(yīng)用

      吳冠朋1, 黃 偉2, 劉毅慧1*

      (1.齊魯工業(yè)大學 信息學院, 濟南 250353; 2. 山東省腫瘤醫(yī)院放療病區(qū), 濟南 250117)

      為了建立乙型肝炎病毒(Hepatitis B virus, HBV)再激活的預(yù)測模型,提出CART(classification and regression tree)特征選擇方法應(yīng)用在原發(fā)性肝癌患者精確放療后HBV再激活的危險因素分析中,進而建立基于CART和Bayes算法的HBV再激活預(yù)測模型。實驗結(jié)果顯示:CART算法劃分了多組具有優(yōu)秀分類能力的特征節(jié)點集(危險因素),尤其當特征節(jié)點集為HBV DNA水平、外放邊界、放療總劑量、V20和KPS評分時,在CART和Bayes預(yù)測模型中的分類正確性分別為88.51%和 86.69%,得到HBV再激活正確性貢獻度的排序為KPS評分>全肝平均劑量>V20>放療總劑量>V10;當甲胎蛋白AFP出現(xiàn)時,增加了HBV再激活的預(yù)測正確性。

      CART;特征選擇;乙肝病毒再激活;危險因素;Bayes

      原發(fā)性肝癌[1-3]是全球第5大腫瘤疾病,中國原發(fā)性肝癌(primary liver carcinoma, PLC)患者眾多,近年來精確放療逐步成為治療原發(fā)性肝癌的重要手段。2013年,黃偉等[4]采用logistic回歸分析69例經(jīng)精確放療的PLC患者發(fā)現(xiàn)基線血清HBV DNA 水平是影響HBV再激活的獨立危險因素,精確放療后導(dǎo)致患者發(fā)生乙型肝炎病毒(Hepatitis B virus, HBV)再激活率達25%,發(fā)生再激活的患者死亡率為25%,HBV再激活嚴重影響患者的生活質(zhì)量以及生存周期。2014年,Huang 等[5]又將臨床劑量體積等因素納入研究當中,發(fā)現(xiàn)NLV(正常肝體積),V20,和D-mean(平均劑量)與HBV再激活重要相關(guān)。2014年,汪孟森[6]對山東省腫瘤醫(yī)院治療的53例原發(fā)性肝癌患者進行研究,推測肝功能Child-Pugh分級可能是發(fā)生HBV再激活的危險因素。2015年,張晶晶等[7]研究發(fā)現(xiàn)HBV再激活患者和HBV未激活患者的Child-Pugh分級構(gòu)成和HBV DNA水平差異具有統(tǒng)計學意義。吳冠朋等[8]對90例經(jīng)精確放療的原發(fā)性肝癌患者研究發(fā)現(xiàn)HBV DNA水平、外放邊界和腫瘤分期TNM是致使HBV再激活的危險因素,并建立了基于BP和RBF神經(jīng)網(wǎng)絡(luò)的預(yù)測模型。隨后Wu等[9]使用遺傳算法應(yīng)用在原發(fā)性肝癌患者精確放療后的HBV再激活危險因素特征選擇上,并建立了貝葉斯和支持向量機預(yù)測模型。臨床上對原發(fā)性肝癌放療后導(dǎo)致HBV再激活的危險因素有待進一步探究,且亟需建立更多的HBV再激活預(yù)測模型。

      決策樹算法包括CART、ID3、C4.5等, CART(classification and regression tree)算法是由Breiman等[10]提出的,是決策樹中典型的二叉樹,CART算法有著較強的模式識別能力,并廣泛應(yīng)用在復(fù)雜的生物數(shù)據(jù)分析中。陳磊等[11]將CART算法用在肺癌微陣列數(shù)據(jù)上,并得到優(yōu)秀分類能力的CART樹模型。Kong等[12]將CART算法用在乳腺癌分類上,提高了對乳腺癌的治療質(zhì)量。Gasparoviga-asite等[13]將CART算法用于降低蛋白質(zhì)維度特征,并得到分類任務(wù)中最有效的特征子集。本文把劃分CART樹的特征節(jié)點集作為HBV再激活的危險因素,然后用這些特征節(jié)點集建立基于CART和Bayes的HBV預(yù)測模型,最后得到基于CART和Bayes的HBV再激活預(yù)測結(jié)果。實驗設(shè)計流程如圖1所示。

      圖1 實驗設(shè)計流程Fig.1 Experimental design process

      1 數(shù)據(jù)與相關(guān)原理

      1.1 數(shù)據(jù)

      實驗數(shù)據(jù)來自山東省腫瘤醫(yī)院收治的90例經(jīng)精確放療的原發(fā)性肝癌患者的臨床資料,數(shù)據(jù)包含:年齡、HBV DNA水平、外方邊界、甲胎蛋白AFP和腫瘤分期TNM等28項特征屬性,詳見表1。90例患者中20例發(fā)生了HBV再激活,HBV再激活率達22.22%。對本組數(shù)據(jù)研究的意義在于如何從這些數(shù)據(jù)中找出HBV再激活的危險因素,并建立HBV再激活預(yù)測模型,從而指導(dǎo)個體病人在治療過程中采用抗病毒治療方法,避免發(fā)生HBV再激活,提高病人的生存質(zhì)量及延長病人的生存周期。

      表1 特征節(jié)點及其所代表的特征屬性Table 1 Feature nodes and their attributes

      1.2 CART算法

      1.2.1 構(gòu)建CART 決策樹

      CART[14]算法采用二分遞歸分割方法把數(shù)據(jù)中的特征作為二叉節(jié)點,CART算法可建立帶有特征選擇的分類樹和回歸樹,本文用于判別HBV是否激活,因此本文建立的是帶有特征選擇的分類樹。CART算法把非葉子結(jié)點作為判斷類別的屬性,葉子節(jié)點作為類別的標簽,定義數(shù)據(jù)樣本集I,屬性向量集X和類別向量集Y為

      顯然,本文數(shù)據(jù)中m=28,c=2 。根據(jù)所給數(shù)據(jù)集I建立并劃分一棵二叉樹,CART算法使用GINI指數(shù)[15]劃分一棵二叉樹, 對于一個c類樣本集,用混合度impurity(P)來衡量節(jié)點的純度(只包含同一類別的節(jié)點), GINI指數(shù)定義為

      式中,P=(p1,p2,…,pc),其中p(c)為第c類的概率,則節(jié)點n的混合度為

      當節(jié)點n是“純”時GINI指數(shù)為0,否則為正。對CART樹而言,當節(jié)點n不滿足屬于同一類別或只有一個樣本時,就需要對節(jié)點n進行劃分,而劃分時將混合度最大的進行劃分,則得到最優(yōu)分支。當節(jié)點n被劃分成n1和n2后,則有

      式中:Nn1、Nn2、Nn分別為n1、n2、n的樣本數(shù),劃分后的混合度Δimpurity(P) 為

      Δimpurity(P)=impurity(P)-p(n1)·GINI(n1)-

      p(n2)·GINI(n2).

      其他節(jié)點亦重復(fù)以上劃分過程,當CART樹遇見以下情況時,停止劃分為:

      1)節(jié)點是純的,即節(jié)點包含的樣本屬于同一類別。

      2)屬性集已劃分完畢。

      3)CART樹達到最大深度。

      4)每個節(jié)點已達到允許劃分的最小記錄數(shù)。

      1.2.2 CART決策樹的修剪

      CART決策樹所選擇的特征會影響預(yù)測結(jié)果,為了得到分類性能最好的CART樹,對CART決策樹的特征節(jié)點進行修剪,而修剪的方法包含前剪枝和后剪枝。前剪枝控制樹的深度與葉子限制樹的生長,后剪枝是在樹完全生長后進行葉子與深度的再調(diào)整,較符合樹的完全生長,本文以代價復(fù)雜性作為后修剪的策略,即

      Rα(T)=E(T)+α|NT|.

      式中:Rα(T)為樹T的代價復(fù)雜性;E(T)為樹T的誤分類損失;α為復(fù)雜性系數(shù);|NT|為葉子節(jié)點樹,以代價復(fù)雜性最小選擇出剪枝子樹。

      1.3 Bayes分類模型

      Bayes[16]分類器是基于先驗概率求后驗概率的一種統(tǒng)計分類器。假定總體樣本第i類樣本的先驗概率Pi,樣品x屬于i類樣本的條件函數(shù)為fi(x),則

      式中:Pi為第i個總體的先驗概率;n為樣本類別數(shù)量,顯然本文中樣本類別數(shù)量n為2。

      1.4 Hold-out與K折交叉驗證

      式中,交叉驗證的K設(shè)為10。

      1.5 預(yù)測模型性能評估

      選用3個標準正確性(Accuracy)、靈敏性(Sensitivity)和特異性(Specificity)來評價所選特征的分類性能為:

      Accuracy=(TP+TN)/(TP+TN+FP+FN),

      Sensitivity=TP/(TP+FN),

      Specificity=TN/(TN+FP).

      式中:Accuracy為綜合預(yù)測結(jié)果,作為預(yù)測結(jié)果的主要評判標準;Sensitivity為再激活的預(yù)測結(jié)果;Specificity為正常的預(yù)測結(jié)果。TP、TN、FP、FN分別為真陽性(激活)、真陰性(正常)、假陽性和假陰性樣本的數(shù)量。

      2 結(jié)果與分析

      文獻[9]的正確性已經(jīng)達到82%以上,因此為了保證特征的意義,本文中預(yù)測結(jié)果選取正確性達到80%的特征節(jié)點集,且將正確性達到85%以上的特征節(jié)點集記為具有優(yōu)秀的分類能力。

      2.1Hold-out的p為0.7時CART選擇的特征節(jié)點集及CART預(yù)測結(jié)果

      運行了50次Hold-out(p為0.7)劃分CART樹所選擇的特征節(jié)點集在10折交叉驗證下的CART預(yù)測結(jié)果見表2。

      在CART的特征選擇中,CART構(gòu)建了易于理解的劃分規(guī)則。例如表2第1組特征節(jié)點集:HBV DNA水平(x9),外放邊界(x17),KPS評分(x3),V10(x19)和年齡(x2)的分類規(guī)則如圖2所示,并最終得到激活(reactivation)和正常(normal)兩種預(yù)測結(jié)果,其預(yù)測正確性達到87.55%,靈敏性更是高達98.49%,特異性達到77.61%。

      表2Hold-out的p為0.7時CART所選的特征節(jié)點集及CART預(yù)測結(jié)果

      Table2ThesetoffeaturenodesselectedbyCARTandthepredictionresultofCARTareobtainedwhenthepvalueofHold-outis0.7

      特征節(jié)點集正確性/%靈敏性/%特異性/%HBVDNA水平,外放邊界,KPS評分,V10,年齡87.5598.4977.61HBVDNA水平,外放邊界,KPS評分85.1697.8060.91HBVDNA水平,外放邊界,V20,甲胎蛋白AFP84.1293.5671.92HBVDNA水平,外放邊界,V2083.1892.6571.63HBVDNA水平,外放邊界,V1081.3196.7256.47

      圖2 特征節(jié)點集:HBV DNA水平(x9) ,外放邊界(x17),KPS評分(x3),V10(x19)和年齡(x2)的分類規(guī)則Fig.2 The classification rule of feature nodes set of HBV DNA Level(x9), outer margin of radiotherapy(x17), KPS score(x3),V10(x19) and Age(x2)

      表2第2組特征節(jié)點集:HBV DNA水平(x9),外放邊界(x17)和KPS評分(x3)的正確性為85.16%,其分類規(guī)則如圖3所示。

      表2第3組特征節(jié)點集:HBV DNA水平,外放邊界,V20和甲胎蛋白AFP的正確性為84.12%,表2第4組特征節(jié)點集:HBV DNA水平,外放邊界和V20已在文獻[5]和文獻[8]中證明是影響HBV再激活的危險因素,其正確性為83.18%,即“甲胎蛋白AFP”的加入增加了HBV再激活正確性。

      圖3 特征節(jié)點集:HBV DNA水平(x9) ,外放邊界(x17)和KPS評分(x3)的分類規(guī)則Fig.3 The classification rule of feature nodes set of HBV DNA Level(x9),outer margin of radiotherapy(x17)and KPS score(x3)

      表2第5組特征節(jié)點集:HBV DNA水平,外放邊界和V10的正確性為81.31%。綜合比較表2中的正確性,顯然特征節(jié)點“KPS評分”比特征節(jié)點“V20”和特征節(jié)點“V10”更能提高特征節(jié)點集的HBV再激活正確性,因此判定“KPS評分”是影響HBV再激活的危險因素,且存在對HBV再激活的正確性貢獻度:KPS評分>V20>V10。

      2.2Hold-out的p為0.8時CART選擇的特征節(jié)點集及CART預(yù)測結(jié)果

      運行50次Hold-out(p為0.8)劃分CART樹所選擇的特征節(jié)點集在10折交叉驗證下的CART平均預(yù)測結(jié)果見表3。

      表3Hold-out的p為0.8時CART所選的特征節(jié)點集及CART預(yù)測結(jié)果

      Table3ThesetoffeaturenodesselectedbyCARTandthepredictionresultofCARTareobtainedwhenthepvalueofHold-outis0.8

      特征節(jié)點集正確性/%靈敏性/%特異性/%HBVDNA水平,外放邊界,放療總劑量,V20,KPS評分88.5197.7474.54HBVDNA水平,外放邊界,全肝最大劑量,甲胎蛋白AFP86.7394.5179.86HBVDNA水平,外放邊界,全肝平均劑量84.0192.6174.10

      表3第1組特征節(jié)點集:HBV DNA水平(x9),外放邊界(x17),放療總劑量(x10),V20(x21)和KPS評分(x3)的分類規(guī)則如圖4所示,其正確性為88.51%,靈敏性為97.74%,特異性為74.54%,該組特征節(jié)點集的正確性最好。

      圖4 特征節(jié)點集:HBV DNA水平(x9),外放邊界(x17),放療總劑量(x10),V20(x21)和KPS評分(x3)的分類規(guī)則Fig.4 The classification rule of feature nodes set of HBV DNA Level(x9), outer margin of radiotherapy(x17),total dose of radiotherapy(x10),V20(x21) and KPS score(x3)

      表3第2組特征節(jié)點集:HBV DNA水平,外放邊界,全肝最大劑量和甲胎蛋白AFP的分類正確性為86.73%,表明該特征節(jié)點集也具有優(yōu)秀的分類能力。

      表3第3組特征節(jié)點集:HBV DNA水平,外放邊界和全肝平均劑量的正確性為84.01%,高于表2第4組特征節(jié)點集:HBV DNA水平,外放邊界和V20的正確性,但低于表2第2組特征節(jié)點集:HBV DNA水平,外放邊界,KPS評分的正確性,即存在對HBV再激活的正確性貢獻度:KPS評分>全肝平均劑量>V20。

      2.3Hold-out的p為0.9時CART選擇的特征節(jié)點集及分類預(yù)測結(jié)果

      運行50次Hold-out(p為0.9)劃分CART樹所選擇的特征節(jié)點集,特征節(jié)點集在10折交叉驗證下的CART平均預(yù)測結(jié)果見表4。

      表4Hold-out的p為0.9時CART所選的特征節(jié)點集及CART預(yù)測結(jié)果

      Table4ThesetoffeaturenodesselectedbyCARTandthepredictionresultofCARTareobtainedwhenthepvalueofHold-outis0.9

      特征節(jié)點集和初始特征集正確性/%靈敏性/%特異性/%HBVDNA水平,腫瘤分期TNM,外放邊界,Child-Pugh87.0197.9573.14HBVDNA水平,外放邊界,腫瘤分期TNM,KPS評分86.4796.4073.03HBVDNA水平,外放邊界,放療總劑量81.5296.7964.68

      表4第1組特征節(jié)點集:HBV DNA水平(x9),腫瘤分期TNM(x6),外放邊界(x17),Child-Pugh(x7)的分類規(guī)則如圖5所示,其正確性為87.01%,靈敏性為97.95%,特異性為73.14%。

      圖5 特征節(jié)點集:HBV DNA水平(x9),腫瘤分期TNM(x6),外放邊界(x17),Child-Pugh(x7)的分類規(guī)則Fig.5 The classification rule of feature nodes set of HBV DNA Level(x9),Tumor staging TNM(x6), outer margin of radiotherapy(x17), Child-Pugh(x7)

      表4第2組特征節(jié)點集:HBV DNA水平,外放邊界,腫瘤分期TNM和KPS評分的正確性為86.47%,表明該特征節(jié)點集也具有優(yōu)秀的分類能力。

      表4第3組特征節(jié)點集: HBV DNA水平,外放邊界和放療總劑量的正確性為81.52%。低于表2第4組特征節(jié)點集:HBV DNA水平,外放邊界和V20的正確性,但高于表2第5組特征節(jié)點集: HBV DNA水平,外放邊界和V10的正確性,由此推出:對HBV再激活的正確性貢獻度:V20>放療總劑量>V10。

      綜上所述,得到一組對HBV再激活正確性貢獻度的排序:KPS評分>全肝平均劑量>V20>放療總劑量>V10。

      2.4 特征節(jié)點集的Bayes預(yù)測模型結(jié)果

      Bayes不考慮所選特征節(jié)點的先后順序,因此可用于判定某些特征節(jié)點的加入或者替換對HBV再激活的影響。其初始特征集和特征節(jié)點集的結(jié)果見表5。

      在表5的Bayes預(yù)測模型中,特征節(jié)點集的分類性能相比初始特征集的都得到提高。但在相同特征節(jié)點集條件下,CART的分類性能略優(yōu)于Bayes的分類性能。

      表5第1組特征節(jié)點集:HBV DNA水平,外放邊界,放療總劑量,V20和KPS評分在Bayes模型下的分類性能最好,正確性為86.69%,靈敏性為96.36%,特異性為74.86%,相比初始特征集其正確性,靈敏性和特異性分別提高:16.69%、21.36%和22.36%。并且該組特征節(jié)點集高于已知危險因素:HBV DNA水平,外放邊界和V20的正確性、靈敏性和特異性。證明了特征節(jié)點“放療總劑量”和“KPS評分”的加入提高了HBV再激活分類預(yù)測性能。

      表5 初始特征集和特征節(jié)點集的Bayes預(yù)測結(jié)果Table 5 Bayes predictive results of original feature set and feature nodes set

      表5第2組特征節(jié)點集:HBV DNA水平,外放邊界,KPS評分,V10和年齡的正確性為86.51%。表5第3組特征節(jié)點集:HBV DNA水平,腫瘤分期TNM,外放邊界和Child-Pugh的正確性為85.65%。表5第4組特征節(jié)點集:HBV DNA水平,外放邊界,腫瘤分期TNM和KPS評分的正確性為84.95%。表5中前4組特征節(jié)點集的正確性達到或接近85%,即認為是具有優(yōu)秀分類能力的特征節(jié)點集。

      表5中第4、5組特征節(jié)點集中同時包含個特征節(jié)點:HBV DNA水平,外放邊界和腫瘤分期TNM3時,Child-Pugh比KPS評分更能提升正確性,即存在對HBV再激活的正確性貢獻度:Child-Pugh>KPS評分。

      表5第7組特征節(jié)點集含有“甲胎蛋白AFP”,其正確性略微高于沒有“甲胎蛋白AFP”的第9組;第8組特征節(jié)點集也存在“甲胎蛋白AFP”,其正確性也略高于沒有“甲胎蛋白AFP”的第10組,這證明了“甲胎蛋白AFP”增加了對HBV再激活正確性,與之前CART中的“甲胎蛋白AFP”增加了分類性能結(jié)論一致。

      表5中第6組特征節(jié)點集: HBV DNA水平,外放邊界和KPS評分的正確性為84.24%;第9組特征節(jié)點集: HBV DNA水平,外放邊界和全肝平均劑量的正確性為83.04%;第10組特征節(jié)點集: HBV DNA水平,外放邊界和V20的正確性為82.74%;第11組特征節(jié)點集: HBV DNA水平,外放邊界和放療總劑量的正確性為80.95%;第12組特征節(jié)點集: HBV DNA水平,外放邊界和V10的正確性為80.03%。由此推出對HBV再激活的正確性貢獻度:KPS評分>全肝平均劑量>V20>放療總劑量>V10,這與之前CART得出的正確性貢獻度一致。

      特征節(jié)點KPS評分越高則表明放療后身體所能承受的副作用越強,致使HBV再激活的可能性越低,即預(yù)測結(jié)果表現(xiàn)為正常(Normal),反之為激活(Reactivation)。劑量參數(shù)V20、V10等代表了放療與肝損傷的關(guān)系,V20、V10分別指接受20Gy或10Gy以上放療的體積占全肝體積比例,放射性損傷不僅與受到的肝放射性耐受劑量存在著緊密聯(lián)系,而且與HBV再激活存在緊密聯(lián)系。

      對HBV再激活影響越大的危險因素被CART選作特征節(jié)點的可能性越大,實驗中特征節(jié)點以及出現(xiàn)的次數(shù)見表6。

      表6 特征節(jié)點與出現(xiàn)次數(shù)Table 6 Feature nodes and the number of occurrences

      綜上所述,不同特征節(jié)點集的分類性能不同,得到一個正確性較高的特征節(jié)點集:HBV DNA水平,外放邊界,放療總劑量,V20和KPS評分,并對實驗中特征節(jié)點集的正確性比較后得到一組對HBV再激活正確性貢獻度的排序:KPS評分>全肝平均劑量>V20>放療總劑量>V10。特征節(jié)點“甲胎蛋白AFP”也增加了HBV再激活的正確性。已知的危險因素:HBV DNA水平和外放邊界在所有CART特征節(jié)點中都出現(xiàn),證明了CART算法特征選擇的有效性。

      3 結(jié) 論

      1)本文提出的CART算法應(yīng)用在原發(fā)性肝癌患者精確放療后致HBV再激活的特征節(jié)點集(危險因素)分析中,并建立了CART和Bayes預(yù)測模型。實驗結(jié)果顯示兩種預(yù)測模型對原發(fā)性肝癌患者精確放療后HBV再激活有著較強的模式判別能力,且CART的分類性能優(yōu)于Bayes的分類性能。CART選擇的特征節(jié)點集提高了HBV再激活分類性能,尤其特征節(jié)點集是: HBV DNA水平、外放邊界、放療總劑量、V20和KPS評分時的分類性能達到最優(yōu)。經(jīng)過實驗結(jié)果的比較,得到了對HBV再激活正確性貢獻度的排序:KPS評分>全肝平均劑量>V20>放療總劑量>V10。“甲胎蛋白AFP”也會增加HBV再激活的正確性。已知的危險因素:HBV DNA水平和外放邊界在所有CART特征節(jié)點中都出現(xiàn),證明了CART算法特征選擇的有效性。

      2)CART的劃分規(guī)則、特征節(jié)點的正確性貢獻度、兩種預(yù)測模型以及特征節(jié)點出現(xiàn)次數(shù)都可幫助醫(yī)生對精確放療的肝癌患者進行指導(dǎo)性治療,并配合抗病毒和肝保護藥物,防止HBV發(fā)生再激活,對提高患者的治療效果,甚至防止HBV再激活導(dǎo)致的患者死亡具有重要意義。今后將繼續(xù)研究其他特征選擇方法和分類算法,致力于提高預(yù)測模型準確度。

      References)

      [1]EL-SERAG H B, RUDOLPH K L. Hepatocellular carcinoma: epidemiology and molecular carcinogenesis[J]. Gastroenterology, 2007, 132(7):2557-2576. DOI:10.1053/j.gastro.2007.04.061.

      [2]JUNG J H, YOON S M, KIM S Y, et al. Radiation-induced liver disease after stereotactic body radiotherapy for small hepatocellular carcinoma: clinical and dose-volumetric parameters[J]. Radiation Oncology, 2013, 81(1):1-7. DOI: 10.1186/1748-717X-8-249.

      [3]葉勝龍. 2013年肝癌領(lǐng)域新進展[J]. 中華肝臟病雜志, 2014, 22(1): 2-4. DOI: 10.3760/cma.j.issn.1007-3418.2014.01.002.

      YE Shenglong. New advances in liver cancer research: A review of 2013[J]. Chinese Journal of Hepatology, 2014, 22(1): 2-4. DOI: 10.3760/cma.j.issn.1007-3418.2014.01.002.

      [4]黃偉,盧彥達,張煒,等. 原發(fā)性肝癌精確放療致乙型肝炎病毒再激活分析[J]. 中華放射腫瘤學雜志, 2013, 22(3): 193-196. DOI:10.3760/cma.j.issn.1004-4221.2013.03.006.

      HUANG Wei, LU Yanda, ZHANG Wei, et al. Analysis of hepatitis B virus reactivation induced by precise radiotherapy in patients with primary liver cancer[J]. Chinese Journal of Radiation Oncology, 2013, 22(3): 193-196. DOI:10.3760/cma.j.issn.1004-4221.2013.03.006.

      [5]HUANG Wei, ZHANG Wei, FAN Min, et al. Risk factors for hepatitis B virus reactivation after conformal radiotherapy in patients with hepatocellular carcinoma[J]. Cancer Science, 2014, 105(6): 697-703. DOI:10.1111/CAS.12400.

      [6]汪孟森. 原發(fā)性肝癌三維適形放療致乙型肝炎病毒再激活相關(guān)研究[D]. 濟南:濟南大學, 2014.

      WANG Mengsen.Reactivation of hepatitis B virus following three-dimensional conformal radiotherapy for primary hepatic carcinoma[D]. Jinan: University of Jinan, 2014.

      [7]張晶晶, 曲頌, 余建榮,等. 原發(fā)性肝癌三維適形放療致乙型肝炎病毒再激活相關(guān)研究[J]. 癌癥進展, 2015, 13(2): 183-187. DOI:10.11877/j.issn.1672-1535.2015.13.02.16.

      ZHANG Jingjing, QU Song,YU Jianrong, et al. Related factors of reactivation of hepatitis B virus induced by three dimensional conformal radiotherapy in primary liver cancer[J]. Oncology Progress, 2015, 13(2): 183-187. DOI:10.11877/j.issn.1672-1535.2015.13.02.16.

      [8]吳冠朋, 王帥, 黃偉,等. 基于BP神經(jīng)網(wǎng)絡(luò)的肝癌放療致乙型肝炎病毒再激活分類預(yù)測模型[J]. 智能計算機與應(yīng)用, 2016, 6(2): 43-47. DOI: 10.3969/j.issn.2095-2163.2016.02.014.

      WU Guanpeng, WANG Shuai, HUANG Wei, et al. Classification prognosis model of hepatitis B virus reactivation after radiotherapy in patients with primary liver carcinoma based on BP neural network[J]. Intelligent Computer and Applications, 2016, 6(2): 43-47. DOI: 10.3969/j.issn.2095-2163.2016.02.014.

      [9]WU Guanpeng, LIU Yihui, WANG Shuai, et al. The classification prognosis models of hepatitis b virus reactivation based on Bayes and support vector machine after feature extraction of genetic algorithm[C]//Proceedings of the 12th International Conference on Natural Computation, Fuzzy Systems and Knowledge Discovery (ICNC-FSKD). Changsha: IEEE, 2016: 572-577. DOI: 10.1109/FSKD.2016.7603236.

      [10]BREIMAN L I, FRIEDMAN J H, OLSHEN R A, et al. Classification and Regression Trees (CART)[J]. Biometrics, 1984, 40(3):17-23.DOI: 10.2307/2530946.

      [11]陳磊, 劉毅慧. 基于CART算法的肺癌微陣列數(shù)據(jù)的分類[J]. 生物信息學, 2011, 9(3): 229-234. DOI:10.3969/j.issn1672-5565.2011.03.013.

      CHEN Lei, LIU Yihui. Classification based on CART algorithm for microarray data of lung cancer[J]. China Journal of Bioinformatics, 2011, 9(3): 229-234. DOI:10.3969/j.issn1672-5565.2011.03.013.

      [12]KONG A L, PEZZIN L E, NATTINGER A B. Identifying patterns of breast cancer care provided at high-volume hospitals: a classification and regression tree analysis[J]. Breast Cancer Research & Treatment, 2015,153(3):689-698. DOI: 10.1007/s10549-015-3561-6.

      [13]GASPAROVICA-ASITE M, POLAKA I, ALEKSEYEVA L. The impact of feature selection on the information held in bioinformatics data[J]. Information Technology & Management Science, 2016, 18(1):115-121.DOI: https://doi.org/10.1515/itms-2015-0018.

      [14]RICHETTE P, CLERSON P, BOUéE S, et al. Identification of patients with gout: elaboration of a questionnaire for epidemiological studies[J]. Annals of the Rheumatic Diseases, 2014, 74(9):1684-1690.DOI:10.1136/annrheumdis-2013-204976.

      [15]DAVIS M, ABRAMS M T, WISSOW L S, et al. Identifying young adults at risk of Medicaid enrollment lapses after inpatient mental health treatment[J]. Psychiatric Services, 2014, 65(4):461-468.DOI: 10.1176/appi.ps.201300199.

      [16]HOU Yi, EDARA P, SUN C. Modeling mandatory lane changing using bayes classifier and decision trees[J]. IEEE Transactions on Intelligent Transportation Systems, 2014, 15(2):647-655.DOI: 10.1109/TITS.2013.2285337.

      ApplicationofHBVreactivationinprimarylivercarcinomaafterradiotherapybasedonCARTalgorithm

      WU Guanpeng1, HUANG Wei2, LIU Yihui1*

      (1.SchoolofInformation,QiluUniversityofTechnology,Jinan250353,China; 2.DepartmentofRadiationOncology,ShandongCancerHospital,Jinan250117,China)

      To establish an excellent prediction model for Hepatitis B virus reactivation, the CART (classification and regression tree) feature selection method was applied to analyze the risk factors of Hepatitis B virus(HBV) reactivation in patients with primary liver cancer after precise radiotherapy, and then a prediction model of HBV reactivation was established based on CART and Bayes algorithm. The experimental results show that the CART algorithm split multiple sets of feature nodes(risk factors) with excellent classification ability. Especially when the feature set of nodes includes HBV DNA level, outer margin of radiotherapy, the total dose of radiotherapy, V20 and KPS score, the classification accuracy of CART and Bayes prediction models was 88.51% and 86.69% respectively. The decreasing order of accuracy contribution of HBV reactivation was: KPS score,mean dose of liver,V20, the total dose of radiotherapy and V10. The predictive accuracy of HBV reactivation was increased when the alpha-fetoprotein AFP appeared.

      CART; feature selection; HBV reactivation; Risk factors; Bayes

      impurity(P)=impurity(p1,p2,…,pc).

      TP391

      A

      1672-5565(2017)03-164-07

      10.3969/j.issn.1672-5565.20161223001

      2016-12-23;

      2017-02-18.

      國家自然科學基金(81402538,61375013);山東省自然科學基金(ZR2013FM020).

      吳冠朋, 男,碩士生,研究方向:智能信息及圖像處理技術(shù);E-mail:zbxywgp@163.com.

      *通信作者:劉毅慧,女,博士, 教授,研究方向: 生物計算, 智能信息處理; E-mail: yxl@sdili.edu.cn.

      猜你喜歡
      正確性邊界肝癌
      拓展閱讀的邊界
      一種基于系統(tǒng)穩(wěn)定性和正確性的定位導(dǎo)航方法研究
      LCMT1在肝癌中的表達和預(yù)后的意義
      論中立的幫助行為之可罰邊界
      淺談如何提高水質(zhì)檢測結(jié)果準確性
      microRNA在肝癌發(fā)生發(fā)展及診治中的作用
      Rab27A和Rab27B在4種不同人肝癌細胞株中的表達
      雙口RAM讀寫正確性自動測試的有限狀態(tài)機控制器設(shè)計方法
      microRNA在肝癌診斷、治療和預(yù)后中的作用研究進展
      “偽翻譯”:“翻譯”之邊界行走者
      外語學刊(2014年6期)2014-04-18 09:11:49
      长寿区| 张掖市| 喀喇沁旗| 黑龙江省| 萝北县| 罗山县| 呈贡县| 手机| 海原县| 军事| 庆阳市| 资讯 | 定兴县| 罗田县| 积石山| 通辽市| 亳州市| 萝北县| 青神县| 增城市| 雷波县| 宝兴县| 溧阳市| 卓尼县| 重庆市| 嵩明县| 肇州县| 云阳县| 丰原市| 四川省| 洛川县| 十堰市| 蓬溪县| 鹤庆县| 丰县| 铅山县| 蒙自县| 荣成市| 通辽市| 临西县| 如皋市|