• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于數(shù)據(jù)挖掘技術(shù)的門診合理用藥分析

      2014-05-31 01:41:10韓蓉吳俊
      中國醫(yī)療設(shè)備 2014年4期
      關(guān)鍵詞:數(shù)據(jù)挖掘關(guān)聯(lián)門診

      韓蓉,吳俊

      南通市腫瘤醫(yī)院 信息科,江蘇 南通266000

      0 前言

      數(shù)據(jù)挖掘是指從大量的、不安全的、有噪聲的、模糊的、隨機的數(shù)據(jù)中提取隱含在其中人們未知的、但又具有潛在應(yīng)用價值的數(shù)據(jù),建立模型,提供給分析預(yù)測部門[1]。將數(shù)據(jù)挖掘技術(shù)應(yīng)用于門診合理用藥分析的研究不僅有利于門診用藥信息結(jié)構(gòu)化,促進門診用藥合理化研究,還有利于提示門診用藥與季節(jié)、科室、醫(yī)保政策是否允許等多層關(guān)聯(lián)屬性的研究。近年來,國內(nèi)將數(shù)據(jù)挖掘應(yīng)用于醫(yī)學、藥學的研究越來越多,秦莉花等人[2]將其應(yīng)用于絕經(jīng)綜合征焦慮、抑郁的相關(guān)因素的研究中;于紅艷等人[3]將其應(yīng)用于中藥藥性屬性與其他屬性的研究。臨床上利用數(shù)據(jù)挖掘算法找出提高孤立性肺結(jié)節(jié)(solitary pulmonary nodul,SPN,一種肺癌的先兆病癥)的診斷率[4];用數(shù)據(jù)挖掘方法來分析早期乳腺癌診斷的X光片,達到了比較滿意的準確率(70%以上)[5]。大量研究證明,醫(yī)學數(shù)據(jù)挖掘有廣闊的應(yīng)用前景[6]。

      1 目的

      遏制藥品不當促銷行為,控制藥品費用不合理增長,使患者用上既安全又經(jīng)濟的藥品一直是醫(yī)院藥事管理部門追求的目標,針對用藥的不合理性,國內(nèi)大部分醫(yī)院的操作模式是從各個科室抽調(diào)負責人或技術(shù)骨干成立處方點評小組,由他們負責對門診處方用藥及配伍的合理性、用藥規(guī)范性進行考核及點評。這樣的手工模式效率低、誤差高,而且有時因人為原因不能及時進行處方點評,導致問題不能及時發(fā)現(xiàn)。因此本文嘗試將數(shù)據(jù)挖掘的方法應(yīng)用于醫(yī)院門診用藥的合理性分析,從海量的醫(yī)療數(shù)據(jù)中找出門診各科室醫(yī)生、處方金額、藥品用量、是否醫(yī)保政策允許范圍藥品等之間的關(guān)聯(lián)規(guī)則,找出門診用藥可能存在的問題,及時指導、更正甚至處罰,真正做到減輕患者經(jīng)濟負擔,解決人民群眾“看病難、看病貴”問題。

      2 方法

      2.1 數(shù)據(jù)預(yù)分類

      數(shù)據(jù)預(yù)處理主要目的是消除或減少數(shù)據(jù)噪聲和處理缺失數(shù)據(jù),盡量減少數(shù)據(jù)“不一致性”“不完整性”等干擾因素,提高數(shù)據(jù)質(zhì)量[2]。針對本文挖掘的目的,我們將數(shù)據(jù)分成以下幾大類:

      (1)疾病診斷類。病史類中的屬性是為了說明病人來院前和當時的病情狀況及相關(guān)情況。這部分屬性分疾病主診斷,疾病次診斷等。

      (2)檢查類。檢查類中的屬性主要是反映病人入院后所做檢查的結(jié)果。該數(shù)據(jù)主要從病人的檢驗、體檢和其他檢查及病程記錄中抽取,如:血壓、脈搏、呼吸、血常規(guī)、大生化、凝血三項、超聲、胸片等屬性。該類屬性大多會有多屬性和多次檢查值,因此要建立這些屬性間的關(guān)聯(lián)及屬性值間的關(guān)聯(lián)。

      (3)用藥類。該類中的屬性主要反映病人在我院門診開藥的情況,藥品單價、藥品數(shù)量、藥品金額、開單醫(yī)生等。

      (4)醫(yī)保政策類。該類中的屬性主要反映病人的參保類型,有自費、醫(yī)保、農(nóng)保等。

      2.2 數(shù)據(jù)處理

      對于抽取后存入數(shù)據(jù)庫的原始數(shù)據(jù)不完整和不一致的采用填充空缺值、糾正非法值和糾正數(shù)據(jù)不一致性的方法進行處理。這部分主要是如何將數(shù)據(jù)轉(zhuǎn)換成統(tǒng)一的格式,以適合數(shù)據(jù)的再處理。一般在海量的數(shù)據(jù)上進行復雜的數(shù)據(jù)分析和處理將花費很長的時間,甚至有時導致處理無法完成。而數(shù)據(jù)歸約技術(shù)則可以得到小數(shù)集的歸約表示,但仍能保持數(shù)據(jù)的完整性。

      本文在研究過程中用到概念分層技術(shù),主要涉及到的部分有開藥的日期、疾病診斷、開藥藥品單價、開單醫(yī)生、所屬科室等。醫(yī)保政策屬性則被歸約成醫(yī)保政策允許與不允許兩種。

      維歸約技術(shù)是通過刪除不相關(guān)維來減少數(shù)據(jù)量的,屬性子集的選擇可以用基本子集的啟發(fā)式方法,這種方法主要包括逐步向前選擇、逐步向后刪除、向前選擇和向后刪除的結(jié)合和判定的歸納技術(shù)。本文采用逐步向后的刪除技術(shù)。

      維歸約技術(shù)涉及到的維有病人癥狀、病人病史、個人史、輔助檢查、病人參保性質(zhì)等。下面舉例說明維歸約技術(shù)在本文中的應(yīng)用。

      (1)醫(yī)保政策是否允許(Sfzl)。門診病人的醫(yī)保屬性有好多種,有農(nóng)保、市區(qū)醫(yī)保、縣區(qū)醫(yī)保等,我們就將其歸約為醫(yī)保政策允許與不允許。

      (2)藥品處方金額(Jined)。處方金額設(shè)定≥300元即為大處方,用d表示,反之用j1表示。

      (3)開藥日期(yf)。這部分數(shù)據(jù)是以月份形式表示的,所以我們根據(jù)醫(yī)院專家的建議將其開藥時間分為4段,即0~3月為1段,4~6月為2段,7~9月為3段,10~12月為4段,也就是春夏秋冬四季,這樣劃分的意義在于,評估病人用藥的多少是否和季節(jié)有關(guān)。

      (4)藥品單價(ypdjd)。根據(jù)抽取的數(shù)據(jù),最小金額為1.12元,最大金額為2596元。所以將其劃分為0~50元、50~100元、100~150元、150~200元等幾部分,分別用b1、b2、b3、b4、b5、b6 表示。

      (5)藥品數(shù)量(shuld)。根據(jù)抽取的數(shù)據(jù),最小藥品數(shù)量為1支(粒),最大為1~10支(粒)、10~20支(粒)、20~30 支(粒)、30~40支(粒),40~50 支(粒)、50~100 支(粒),分別用 a、b、c、d、e、f表示。

      (6)醫(yī)生科室(ksdm)。因為在數(shù)據(jù)庫中抽取的科室代碼均為數(shù)值型,我們將這些代碼均用字母代替,如 93、141、83、175、84、81 用 字 母 表 示 為 a、b、c、d、f、g。映射后得到的部分屬性數(shù)據(jù)庫,見表1。

      表1 映射后的部分屬性數(shù)據(jù)庫

      3 關(guān)聯(lián)規(guī)則挖掘與結(jié)果分析

      根據(jù)研究目的的數(shù)據(jù)源數(shù)據(jù)屬性特點,本文采用關(guān)聯(lián)規(guī)則方法,關(guān)聯(lián)規(guī)則就是從事務(wù)數(shù)據(jù)庫、關(guān)系數(shù)據(jù)庫和其他信息存儲中的大量數(shù)據(jù)的項集之間發(fā)現(xiàn)有趣的、頻繁出現(xiàn)的模式關(guān)聯(lián)和相關(guān)性。若2個或多個變量的取值之間存在某種規(guī)律,就稱為關(guān)聯(lián)。關(guān)聯(lián)規(guī)則[7]是R.Agrawal等人于1993年首先提出的。關(guān)聯(lián)規(guī)則的挖掘過程:

      找出所有的頻繁項集,即找出所有那些支持度大于事先給定的最小支持度的項集。由頻繁項集產(chǎn)生強關(guān)聯(lián)規(guī)則:這種規(guī)則必須同時滿足最小支持度和最小置信度。對每一頻繁項目集A,找到A的所有非空子集a,如果比率support(A)/support(a)≥min_conf,就生成關(guān)聯(lián)規(guī)則a≥(A-a)。support(A)/support(a)即規(guī)則a≥(A-a)的置信度。即此過程分為兩個步驟,第一步找出頻繁項集,第二步再從頻繁項集中找出置信度,或者說滿足置信度的關(guān)聯(lián)規(guī)則。這些既滿足置信度,又滿足支持度的關(guān)聯(lián)規(guī)則,就是強關(guān)聯(lián)規(guī)則,也就是我們挖掘的結(jié)果。

      收集2012年某三甲醫(yī)院門診用藥信息,采用自主開發(fā)的軟件經(jīng)過抽取、清理、轉(zhuǎn)換數(shù)據(jù)、最終裝載入數(shù)據(jù)庫,分析是否存在大處方的可能性,給定最小支持率minsup=0.1,最小置信度minconf=0.7,挖掘出74條關(guān)聯(lián)規(guī)則,這些關(guān)聯(lián)規(guī)則中有意義的部分及其最小支持度與最小可信度,見表2。

      根據(jù)這些規(guī)則我們可以分析得出大處方存在的可能性,是否是醫(yī)保政策允許范圍的病人等。從表2可以看出,如果是醫(yī)保政策允許的病人則其處方金額≥300元,藥品單價<50元的可能性為81%,支持度為0.190752;同時我們也發(fā)現(xiàn)如果藥品數(shù)量<10且科室代碼為l(經(jīng)查為婦科),則不是醫(yī)保政策允許范圍的病人且開的藥品單價<50元的小處方的可能性為91%,支持度為0.168519。

      表2 有意義的關(guān)聯(lián)規(guī)則(minsup=0.1,minconf=0.7)

      經(jīng)過挖掘?qū)嵗菔痉治霭l(fā)現(xiàn):關(guān)聯(lián)規(guī)則與輸入的參數(shù)有很大的關(guān)系,輸入的參數(shù)值不同,產(chǎn)生的關(guān)聯(lián)規(guī)則也不同,有時甚至產(chǎn)生大量模糊的關(guān)聯(lián)規(guī)則。同時若數(shù)據(jù)源選取的不同,也是會產(chǎn)生不同的關(guān)聯(lián)規(guī)則。

      經(jīng)過評估,數(shù)據(jù)挖掘階段發(fā)現(xiàn)出來的模式可能滿足用戶的需求,也可能不滿足。這就需要管理員在不斷完善挖掘過程中積累的經(jīng)驗,對挖掘模型的參數(shù)進行調(diào)整,以達到更好的挖掘效果。

      因為用戶在挖掘過程中也可能存在冗余或無關(guān)的模式,這時則需要整個發(fā)現(xiàn)過程回退到前一階段,如需要用戶重新選擇數(shù)據(jù)源,設(shè)定新的參數(shù)值,直到達到用戶滿意為止。

      挖掘結(jié)果應(yīng)用:① 門診有大處方存在,但是藥品單價并不高,而且一般是醫(yī)保政策允許范圍的病人,藥事管理部門就此情況在醫(yī)生處得到證實,這種情況比較普遍,因為參保病人(醫(yī)保政策允許范圍的病人)認為醫(yī)保帳戶上的款項取不出來,自己開藥也就順帶幫家人開些藥;② 分析看出,如果是自費病人(非醫(yī)保政策允許的病人),存在大處方的可能性很??;③ 我們還發(fā)現(xiàn),該院婦科醫(yī)生開的處方一般性價比較高,金額都比較小。所以整體來說該院2012年全年門診用藥情況還算良好。

      4 結(jié)論

      本文采用自主開發(fā)的軟件抽取、清理、轉(zhuǎn)換數(shù)據(jù)、裝載入庫,通過設(shè)定最小支持度,最小可信度,挖掘出有意義的關(guān)聯(lián)規(guī)則,對這些規(guī)則分析解釋得出的結(jié)與門診科室真實情況大體一致,證明了關(guān)聯(lián)規(guī)則挖掘在門診合理用藥分析中的有效性。這些結(jié)論為藥事管理部門分析門診用藥合理性提供了重要的依據(jù),得到藥事管理部門的認可與好評。隨著數(shù)據(jù)庫、人工智能等新技術(shù)的發(fā)展,在數(shù)據(jù)挖掘技術(shù)應(yīng)用于醫(yī)學領(lǐng)域必會有很多知識發(fā)現(xiàn)[8],本文只是提供了一個用數(shù)據(jù)挖掘來指導門診用藥合理性分析的一種方法,下一步將嘗試其他合理用藥的分析研究,以后還會進一步嘗試將關(guān)聯(lián)規(guī)則的挖掘方法應(yīng)藥理分析、抗菌素等其他合理用藥分析中。

      [1]崔園.數(shù)據(jù)挖掘在中文病歷分類中的應(yīng)用[J].計算機與數(shù)字工程,2011,(3):160-163.

      [2]秦莉花,陳曉陽.基于數(shù)據(jù)挖掘的絕經(jīng)綜合征焦慮、抑郁的相關(guān)因素研究分析[J].時珍國醫(yī)國藥,2013,24(6):1431-1432.

      [3]于紅艷.許成剛關(guān)聯(lián)挖掘技術(shù)在中藥藥性及其他屬性間關(guān)系的應(yīng)用研究[J].中國實驗方劑學雜志,2013,19(14):343-346.

      [4]Rakesh Agrawal,Tomasz Imielinski,Arun Swami.Data Mining:Medical and Engineering Case Studies[A].Proceedings of thd ILE Research 2000 conference[C].Cleveland, OH,May 2000:1-7.

      [5]翟愛珍,莊人戈.計算機輔助醫(yī)學診斷系統(tǒng)的數(shù)據(jù)挖掘和知識發(fā)現(xiàn)研究[J].國外醫(yī)學生物醫(yī)學工程分冊,2002, 25 (3):97-103.

      [6]蔣儀,陳輝,管曉福,等.淺談抗菌藥物信息系統(tǒng)建設(shè)[J].中國醫(yī)療設(shè)備,2013,28(10)64-66.

      [7]A kusiak,KH Kernstine,JA kern,et al.Database mining:A Performance Perspecetive[J].IEEE Transactions.on Knowledge and Data Engineering,1993,Vol.5:914-925.

      [8]童元元,霍剛.數(shù)據(jù)挖掘技術(shù)在中藥研究中的應(yīng)用進展[J].中華中醫(yī)藥學刊,2010,(5):1067-1069.

      猜你喜歡
      數(shù)據(jù)挖掘關(guān)聯(lián)門診
      門診支付之變
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
      “一帶一路”遞進,關(guān)聯(lián)民生更緊
      當代陜西(2019年15期)2019-09-02 01:52:00
      奇趣搭配
      基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      智趣
      讀者(2017年5期)2017-02-15 18:04:18
      漢字小門診系列(四)
      漢字小門診系列(九)
      漢字小門診系列(八)
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      宁都县| 丹凤县| 新邵县| 平陆县| 大兴区| 鄄城县| 六盘水市| 阜平县| 泰和县| 安西县| 塔城市| 商丘市| 江阴市| 横山县| 洪雅县| 抚州市| 原平市| 衢州市| 武平县| 阿勒泰市| 中超| 车险| 永昌县| 博罗县| 广东省| 蒙山县| 濮阳县| 新干县| 离岛区| 延安市| 遵义市| 平泉县| 遵义县| 雷州市| 云和县| 二手房| 临潭县| 嘉善县| 化隆| 灵川县| 辽阳市|