• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      關(guān)聯(lián)規(guī)則及關(guān)鍵特征挖掘在臨床透析時(shí)機(jī)選擇中的應(yīng)用

      2017-04-13 01:34:42費(fèi)海波
      軟件導(dǎo)刊 2017年3期
      關(guān)鍵詞:項(xiàng)集時(shí)機(jī)肌酐

      費(fèi)海波,童 玲,李 智

      (1.四川大學(xué) 電子信息學(xué)院, 四川 成都 610065;2.成都軍區(qū)總醫(yī)院 計(jì)算機(jī)網(wǎng)絡(luò)管理中心,四川 成都 610083)

      關(guān)聯(lián)規(guī)則及關(guān)鍵特征挖掘在臨床透析時(shí)機(jī)選擇中的應(yīng)用

      費(fèi)海波1,童 玲2,李 智1

      (1.四川大學(xué) 電子信息學(xué)院, 四川 成都 610065;2.成都軍區(qū)總醫(yī)院 計(jì)算機(jī)網(wǎng)絡(luò)管理中心,四川 成都 610083)

      近年來(lái),諸多學(xué)者利用數(shù)據(jù)挖掘技術(shù)進(jìn)行了疾病發(fā)展趨勢(shì)預(yù)測(cè),合適的數(shù)據(jù)挖掘方法對(duì)獲取有價(jià)值的數(shù)據(jù)信息尤為關(guān)鍵。然而,傳統(tǒng)統(tǒng)計(jì)學(xué)方法不能得出具體指標(biāo)與透析時(shí)機(jī)選擇之間的相關(guān)規(guī)則,同時(shí)對(duì)綜合性醫(yī)院來(lái)說(shuō),選擇合適的方法處理不同格式的原始數(shù)據(jù)較為困難。提出一種腎衰竭透析時(shí)機(jī)選擇方法:利用信息增益從15個(gè)特征中選擇出5大關(guān)鍵特征,根據(jù)提取的特征,利用K均值聚成3簇,在每一簇中運(yùn)用Apriori算法,得到與透析時(shí)機(jī)選擇有關(guān)的規(guī)則,并利用這些規(guī)則進(jìn)行透析時(shí)機(jī)預(yù)測(cè)。實(shí)驗(yàn)結(jié)果表明,應(yīng)用該算法能達(dá)到0.3以上的支持度和0.98以上的置信度。

      信息增益;聚類;關(guān)聯(lián)規(guī)則;透析時(shí)機(jī)

      0 引言

      終末期腎病(End Stage Renal Disease, ESRD)的治療方法包括:包括血液透析、腹膜透析和腎移植[1-2],最常用的為透析方法。由于腎臟疾病的異質(zhì)性和衰竭速度不同,因此需要建立一種準(zhǔn)確的腎衰風(fēng)險(xiǎn)預(yù)測(cè)模型[3],幫助CKD患者得到更早期的個(gè)體化治療。數(shù)據(jù)挖掘可以用來(lái)構(gòu)建數(shù)據(jù)相關(guān)性模型,通過(guò)使用這些模型,不僅能得到數(shù)據(jù)的特征分布情況,還可以預(yù)測(cè)發(fā)展趨勢(shì)。因此,數(shù)據(jù)挖掘可以為決策者、醫(yī)生等提供科學(xué)的輔助決策。

      透析時(shí)機(jī)選擇[4-5]直接決定替代治療的效果,日益受到學(xué)者們關(guān)注。近年來(lái),已有學(xué)者利用數(shù)據(jù)挖掘的方法研究透析治療過(guò)程。K R Lakshm等[6]對(duì)ANN、決策樹和邏輯回歸算法在腎透析存活能力中的性能作了比較,發(fā)現(xiàn)ANN性能最好,準(zhǔn)確率為93.85%,但容易過(guò)擬合;N SRIRAAM等[7]提出了聯(lián)合挖掘方法來(lái)進(jìn)行腎衰竭參數(shù)估計(jì),以改善腎透析病人的治療,分類準(zhǔn)確率會(huì)在50~97.7%之間變動(dòng),準(zhǔn)確率波動(dòng)較大;Yeh[8]利用決策樹預(yù)測(cè)透析患者住院率,但決策樹容易過(guò)擬合。本文提出了一種基于K均值和關(guān)聯(lián)規(guī)則的慢性腎病透析時(shí)機(jī)預(yù)測(cè)方法,克服了過(guò)擬合局限,得到了透析時(shí)機(jī)預(yù)測(cè)規(guī)則,并實(shí)現(xiàn)了精準(zhǔn)預(yù)測(cè)。

      1 理論依據(jù)

      1.1 透析時(shí)機(jī)選擇預(yù)測(cè)流程

      圖1為透析時(shí)機(jī)選擇預(yù)測(cè)流程。本研究采集成都某醫(yī)院腎內(nèi)科HIS系統(tǒng)數(shù)據(jù),對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,首先去除血肌酐和尿素氮含有缺失值的患者;然后根據(jù)所選取的特征,去除特征值缺失值大于總樣本15%的特征,其余缺失值用平均值替代;最后選出2 659個(gè)病人的實(shí)驗(yàn)室檢查數(shù)據(jù)。其中包括透析患者1 202個(gè),選取胱抑素c(CysC)、內(nèi)生肌酐清除值(Ccr)、磷(P)、尿素氮(Bun)、鉀(K)、鈣(Ca)、白蛋白(Alb)、鈉(Na)、性別(SEX)、舒張壓(BH)、年齡(AGE)、收縮壓(BL)、身高(HT)、肌酐(Scr)、體重(WT)作為特征,利用信息增益進(jìn)行特征提取,將提取出的特征作為簇中心元素進(jìn)行聚類,最后在每一簇中運(yùn)用Apriori算法進(jìn)行關(guān)聯(lián)規(guī)則挖掘,得到與透析時(shí)機(jī)選擇相關(guān)的規(guī)則。

      圖1 透析時(shí)機(jī)選擇預(yù)測(cè)流程

      1.2 信息增益

      “信息熵”是度量樣本集合純度最常用的一種指標(biāo)。假定當(dāng)前樣本集合D中第k類樣本所占的比例為Pk(k=1,2,3,...,|y|),則D的信息熵定義為:

      (1)

      Ent(D)的值越小,則D的純度越高。

      (2)

      一般而言,信息增益越大,則意味著使用屬性a來(lái)進(jìn)行劃分所獲得的“純度提升”越大。因此,可用信息增益來(lái)進(jìn)行特征選擇[9]。

      表1 樣本部分?jǐn)?shù)據(jù)

      表2 信息增益值

      1.3 K均值

      本課題采用棋盤作為標(biāo)定物體,棋盤是由不同黑白方塊構(gòu)成的平面格子。棋盤的標(biāo)示點(diǎn)與其他標(biāo)定物相比比較明顯,處理起來(lái)也比較容易。將棋盤以不同的位置和角度放置,并采集相應(yīng)圖像,檢測(cè)每組標(biāo)定模板圖像的角點(diǎn),通過(guò)前面的幾個(gè)步驟,得到多幅圖像的角點(diǎn)數(shù)據(jù)后,可以調(diào)用OpenCV中的函數(shù)cvCalibrateCamera2()來(lái)進(jìn)行攝像頭的標(biāo)定。由這個(gè)函數(shù)可以得到攝像頭的內(nèi)參數(shù)矩陣、畸變系數(shù)、旋轉(zhuǎn)向量和平移向量。前兩個(gè)構(gòu)成攝像頭的內(nèi)參數(shù),后兩個(gè)構(gòu)成了物體位置和方向的攝像頭外參數(shù)。

      首先根據(jù)設(shè)定的聚類簇?cái)?shù)k,從樣本集中隨機(jī)選擇k個(gè)樣本作為初始均值向量,計(jì)算其余樣本與各均值向量的距離,根據(jù)距離最近的均值向量確定樣本集的簇標(biāo)記,將樣本劃入相應(yīng)的簇,然后再計(jì)算每個(gè)所獲新聚類的聚類中心(該聚類中所有對(duì)象的均值),不斷重復(fù)這一過(guò)程直到后一輪迭代產(chǎn)生的結(jié)果與前一輪迭代相同才停止,得到最終的簇劃分。

      1.4 關(guān)聯(lián)規(guī)則

      關(guān)聯(lián)規(guī)則挖掘過(guò)程:①找出所有頻繁項(xiàng)集;②由頻繁項(xiàng)集產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則。

      最大頻繁項(xiàng)集的生成是影響關(guān)聯(lián)規(guī)則挖掘的關(guān)鍵問(wèn)題。Apriori算法是一種最有影響的挖掘布爾關(guān)聯(lián)規(guī)則頻繁項(xiàng)集的算法,使用頻繁項(xiàng)集性質(zhì)的先驗(yàn)知識(shí),用逐層搜索的迭代方法來(lái)獲得頻繁項(xiàng)集。k-項(xiàng)集用于搜索 (k+1)-項(xiàng)集。首先,找出頻繁1-項(xiàng)集的集合,記作L1。L1用于找頻繁2-項(xiàng)集的集合L2,而L2用于找L3,如此下去,直到不能找到頻繁k-項(xiàng)集。

      Apriori性質(zhì):頻繁項(xiàng)集的所有非空子集都必須也是頻繁的。通過(guò)連接和剪枝兩個(gè)過(guò)程來(lái)實(shí)現(xiàn)。

      連接步:為找Lk,通過(guò)Lk-1與自己連接產(chǎn)生候選k-項(xiàng)集的集合,記作Ck。

      剪枝步:Ck是Lk的超集,即它的成員可以是頻繁的,也可以不是頻繁的,但所有的頻繁k-項(xiàng)集都包含在Ck中。掃描數(shù)據(jù)庫(kù),確定Ck中每個(gè)候選的計(jì)數(shù),從而確定集都不可能是頻繁k-項(xiàng)集的子集。因此,如果一個(gè)候選k-項(xiàng)集的(k-1)-子集不在Lk-1中,則該候選也不可能是頻繁的,從而可以由Ck中刪除[10]。

      本文在關(guān)聯(lián)規(guī)則挖掘前,首先對(duì)每一簇?cái)?shù)據(jù)進(jìn)行離散化,離散化間隔為10,將樣本中每個(gè)特征的范圍劃分成10個(gè)區(qū)間。設(shè)置最低支持度為0.3,最低置信度為0.9。就簇1而言,通過(guò)計(jì)算肌酐、尿素氮、磷、胱抑素C、內(nèi)生肌酐清除值、鈉、鉀等子集是否大于最低支持度值,將大于最低支持度值的特征設(shè)定為頻繁1-項(xiàng)集的集合L1={Scr,Ccr,CysC,Bun,P,Na,K},然后利用L1找到頻繁2-項(xiàng)集的集合L2={Scr∪Ccr,Scr∪Bun,...,Na∪K},直到不能找到滿足最低支持度的頻繁項(xiàng)集為止。簇2、簇3用同樣的方法可以得到頻繁項(xiàng)集。

      2 實(shí)驗(yàn)分析

      2.1 實(shí)驗(yàn)結(jié)果

      對(duì)患者樣本進(jìn)行K均值聚類,最終聚類中心如表3所示,一共分為3簇,每個(gè)樣本向量有5個(gè)元素,分別為肌酐、胱抑素C、內(nèi)生肌酐清除值、尿素氮和磷?;颊邩颖鞠蛄颗c各簇的聚類中心向量{853.3,4.7,27.6,28.1,2.1}、{227.5,3.5,36.2,12.1,1.3}、{85.6,1.2,76.6,5.9,1.2}中的某一簇聚類中心距離最小時(shí),則歸為相應(yīng)的簇。最后得到簇1的樣本有772條,占總樣本的29%,簇2的樣本有1346條,占總樣本的51%,簇3的樣本有541條,占總樣本的20%。

      表3 最終聚類中心

      利用關(guān)聯(lián)規(guī)則算法,得到如表4所示的關(guān)聯(lián)規(guī)則結(jié)果,第一列表示每條規(guī)則,第二列為該條規(guī)則所支持的樣本數(shù),最后一列表示該條規(guī)則的置信度。從表4可知,關(guān)聯(lián)規(guī)則置信度均為100%,大于所設(shè)置的0.9,表明所得到的這些關(guān)聯(lián)規(guī)則均為強(qiáng)規(guī)則,可以很好地說(shuō)明肌酐、尿素氮與血液透析時(shí)機(jī)選擇的強(qiáng)關(guān)聯(lián)性。

      2.2 實(shí)驗(yàn)總結(jié)

      本研究使用k均值和Apriori確定與血液透析有關(guān)的特征和一些可能的規(guī)則。實(shí)驗(yàn)結(jié)果發(fā)現(xiàn),當(dāng)肌酐值在641-918.5(Scr=779.75±138.75)或者918.5-1196(Scr=1057.25±138.75)、尿素氮在21.97-30.33(Bun=26.15±4.18)范圍內(nèi)患者有較高的風(fēng)險(xiǎn),應(yīng)在此時(shí)合理選擇透析。相反,肌酐值在45-207.2(Scr=126.1±81.1)、Ccr在58.46-68.86(Ccr=63.84±5.38)、Cysc在0.904-1.032(CysC=0.968±0.064)、P在1.02-1.26(P=1.14±0.12)、K在3.88-4.2(K=4.04±0.16)、Na在139.57-142.63(Na=141.1±1.53)、Bun在2.24-4.36(Bun=3.3±1.06)時(shí)有較低的風(fēng)險(xiǎn)。腎病學(xué)者明確表示,肌酐、尿素氮、內(nèi)生肌酐清除率影響患者透析時(shí)機(jī)的合理性,胱抑素C和磷對(duì)患者透析時(shí)機(jī)選擇的合理性影響目前不是很明確,需要更加深入的研究。通過(guò)與實(shí)際數(shù)據(jù)的對(duì)比,肌酐值在641~1 196范圍內(nèi)透析介入的概率是100%,尿素氮在21.97~30.33透析介入的概率是83%。

      3 結(jié)語(yǔ)

      正確把握透析時(shí)機(jī)可以緩解病人病情,提高治愈率。本研究將幫助醫(yī)護(hù)人員找到一些關(guān)鍵特征預(yù)測(cè)病人透析時(shí)機(jī)。通過(guò)信息增益計(jì)算每個(gè)指標(biāo)所包含的信息量確定最終選擇的特征,并根據(jù)這些特征進(jìn)行k均值聚類,最后對(duì)每一簇進(jìn)行關(guān)聯(lián)規(guī)則挖掘。最終結(jié)果可以輔助醫(yī)護(hù)人員及時(shí)關(guān)注慢性腎病患者病情變化,一旦某個(gè)指標(biāo)達(dá)到相應(yīng)值時(shí),患者就有較高的腎衰風(fēng)險(xiǎn),選擇合適的時(shí)機(jī)進(jìn)行透析,從而達(dá)到更好的治療效果。

      [1] FRESENIUS MEDICAL CARE. ESRD patients in 2011 a global perspective[EB/OL].http:// www. vision-fmc.com/filesdownload/ESRD/ESRDPatientsin2011.pdf,2012-4-12/2016-3-24.

      [2] ABBASI M, CHERTOW M G , HALL N Y. End stage renal disease[EB/OL].http://clinicaleviden ce.bmj.com, 2010-07-19/2016-3-24.

      [3] JUSTIN B ECHOUFFO-TCHEUGUI, ANDRE P KENGNE. Risk models to predict chronic kidney disease and its progression: a systematic review[J]. PLOS Medicine,2012,9(11):1-18.

      [4] NATIONAL KIDNEY FOUNDATION. Clinical practice guideline for hemodialysis adequacy[J]. Am J Kidney Dis,2015,66(5):884-930.

      [5] NATIONAL KIDNEY FOUNDATION. Clinical practice guidelines and recommendations for peritoneal dialysis adequacy[J]. Am J Kidney Dis, 2006,48(suppl 1):S1-S322.

      [6] K R LAKSHMI, Y NAGESH M VeeraKrishna, performance comparison of three data mining techniques for predicting kidney disease survivability[J].International Journal of Advances in Engineering & Technology, Mar.2014.

      [7] N SRIRAAM, V NATASHA,H KAUR.Data mining approaches for kidney dialysis treatment[J]. Journal of Mechanics in Medicine and Biology, Volume 06, Issue 02. June 2010.

      [8] J Y YEH, T,WU,C W TSAO.Using data mining techniques to predict hospitalization of hemodialysis patients[J].Decision Support Systems,2011,50(2):439-448.

      [9] 周志華.機(jī)器學(xué)習(xí)[M].北京:清華大學(xué)出版社,2016.

      [10] JAIWEI HAN,MICHELINE KAMBER, JIAN PEI. 數(shù)據(jù)挖掘概念與技術(shù)[M].范明,孟小峰,譯.北京:機(jī)械工業(yè)出版社,2012.

      (責(zé)任編輯:陳福時(shí))

      費(fèi)海波(1990-),男,湖南衡陽(yáng)人,四川大學(xué)電子信息學(xué)院碩士研究生,研究方向?yàn)獒t(yī)學(xué)數(shù)據(jù)挖掘;童玲(1979-),女,安徽合肥人,碩士,成都軍區(qū)總醫(yī)院計(jì)算機(jī)網(wǎng)絡(luò)管理中心助理工程師,研究方向?yàn)獒t(yī)院信息管理、醫(yī)療數(shù)據(jù)分析;李智(1975-),男,四川成都人,博士,四川大學(xué)電子信息學(xué)院副教授、碩士生導(dǎo)師,研究方向?yàn)閴嚎s感知、醫(yī)學(xué)數(shù)據(jù)分析。

      10.11907/rjdk.162784

      TP319

      A

      1672-7800(2017)003-0118-03

      猜你喜歡
      項(xiàng)集時(shí)機(jī)肌酐
      兩個(gè)人結(jié)婚的最好時(shí)機(jī)
      海峽姐妹(2017年12期)2018-01-31 02:12:24
      暢想 把握每一次時(shí)機(jī)跨越成長(zhǎng)
      師生互動(dòng)4時(shí)機(jī)
      血肌酐水平對(duì)慢性心力衰竭患者預(yù)后判斷的臨床意義
      肌酐-胱抑素C公式在糖尿病腎病超濾過(guò)檢出中的作用
      關(guān)聯(lián)規(guī)則中經(jīng)典的Apriori算法研究
      卷宗(2014年5期)2014-07-15 07:47:08
      判斷腎功能的可靠旨標(biāo)血肌酐
      一種頻繁核心項(xiàng)集的快速挖掘算法
      血肌酐、胱抑素C、簡(jiǎn)化MDRD和Le Bricon公式在評(píng)估腎移植術(shù)后腎功能中的作用
      一種新的改進(jìn)Apriori算法*
      遂溪县| 新邵县| 唐山市| 宝丰县| 九江县| 威信县| 沧州市| 田林县| 贵溪市| 咸宁市| 乐平市| 华坪县| 普兰县| 三明市| 高州市| 涟源市| 九台市| 广水市| 绥芬河市| 郁南县| 逊克县| 金堂县| 白水县| 崇文区| 赤峰市| 扶余县| 湖口县| 河津市| 闽清县| 来安县| 扬中市| 文成县| 恩施市| 调兵山市| 青龙| 东莞市| 万盛区| 弋阳县| 庄浪县| 凤山县| 宁乡县|