(德宏州第二人民醫(yī)院,云南 德宏 678400)
數(shù)據(jù)挖掘作為一項(xiàng)先進(jìn)的技術(shù)對(duì)于我國(guó)醫(yī)院運(yùn)行管理具有非常重要的作用,是發(fā)現(xiàn)并培養(yǎng)核心競(jìng)爭(zhēng)力的重要途徑之一。本文將對(duì)數(shù)據(jù)挖掘在HIS系統(tǒng)中的應(yīng)用進(jìn)行分析,并在此基礎(chǔ)上探索數(shù)據(jù)挖掘技術(shù)在醫(yī)院信息系統(tǒng)中的有效運(yùn)用。
第一,確定挖掘?qū)ο?、?zhǔn)備數(shù)據(jù)。在數(shù)據(jù)挖掘中非常重要的一步就是確定研究對(duì)象、明確數(shù)據(jù)挖掘,這也是實(shí)現(xiàn)數(shù)據(jù)挖掘預(yù)期目的的重要前提。保證數(shù)據(jù)挖掘得以成功的先決條件就是數(shù)據(jù)準(zhǔn)備,由數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)處理、數(shù)據(jù)選擇構(gòu)成。首先,數(shù)據(jù)選擇。在數(shù)據(jù)選擇中需要對(duì)醫(yī)院信息系統(tǒng)中與研究對(duì)象有關(guān)數(shù)據(jù)信息進(jìn)行選擇,這樣就能夠在獲得原始數(shù)據(jù)的基礎(chǔ)上對(duì)適合數(shù)據(jù)挖掘應(yīng)用的數(shù)據(jù)進(jìn)行選擇。其次,數(shù)據(jù)預(yù)處理。數(shù)據(jù)預(yù)處理中需要初步整理數(shù)據(jù),并對(duì)不完全和不一致的數(shù)據(jù)進(jìn)行清理,這樣就能夠據(jù)此進(jìn)行下一步的分析工作。例如,在進(jìn)行病理書(shū)寫(xiě)的過(guò)程中,不同醫(yī)生針對(duì)同一疾病會(huì)存在不同的命名,這樣就會(huì)有不一致的數(shù)據(jù)產(chǎn)生,在挖掘數(shù)據(jù)前就需要對(duì)不一致的數(shù)據(jù)進(jìn)行轉(zhuǎn)換。最后,數(shù)據(jù)轉(zhuǎn)換。將數(shù)據(jù)轉(zhuǎn)換成適合于挖掘的形勢(shì)是數(shù)據(jù)轉(zhuǎn)換的目的,通常運(yùn)用數(shù)據(jù)概化的方法實(shí)現(xiàn)。例如病名中耳炎,很多病人記錄中都記錄為卡他性中耳炎、化膿性中耳炎、分泌性中耳炎等,這些都需要進(jìn)行概化。第二,發(fā)現(xiàn)知識(shí)。挖掘轉(zhuǎn)換后的數(shù)據(jù),并對(duì)潛在的、有用的是指進(jìn)行提取。通常時(shí)間序列預(yù)測(cè)法、關(guān)聯(lián)分析法、人工神經(jīng)網(wǎng)絡(luò)、決策樹(shù)、遺傳算法、粗糙集理論等經(jīng)常運(yùn)用于該環(huán)節(jié)中。第三,結(jié)果分析和知識(shí)的應(yīng)用。以醫(yī)學(xué)專(zhuān)業(yè)知識(shí)為依據(jù)揭示數(shù)據(jù)挖掘結(jié)果,通過(guò)最有模型的選擇實(shí)現(xiàn)對(duì)新知識(shí)的評(píng)估和獲取。最后在醫(yī)學(xué)研究和醫(yī)院管理中運(yùn)用這些知識(shí),將它們的指導(dǎo)作用充分發(fā)揮出來(lái)。
第一,粗糙集理論。作為一種計(jì)算方法,粗糙集理論處理對(duì)象包括含糊性和不確定性知識(shí),其主要原理是在不改變分類(lèi)能力的額基礎(chǔ)上,運(yùn)用知識(shí)約簡(jiǎn)將概念的分類(lèi)規(guī)則導(dǎo)出,通過(guò)其中隱含知識(shí)的發(fā)掘?qū)撛诘囊?guī)律揭示出來(lái)。在醫(yī)學(xué)中運(yùn)用數(shù)據(jù)挖掘,能夠通過(guò)粗糙集理論規(guī)則構(gòu)建的模型將臨床數(shù)據(jù)庫(kù)中的正例和反例知識(shí)發(fā)掘出來(lái)。例如利用自主判別算法可以對(duì)肺部腫瘤是良性還是惡性進(jìn)行診斷[1]。
第二,人工神經(jīng)網(wǎng)絡(luò)。人工神經(jīng)網(wǎng)絡(luò)是對(duì)人腦神經(jīng)元結(jié)構(gòu)進(jìn)行模擬,通過(guò)學(xué)習(xí)和應(yīng)用訓(xùn)練數(shù)據(jù)集中的知識(shí)形成分類(lèi)和預(yù)測(cè)模型,進(jìn)而在預(yù)測(cè)、特色挖掘、聚類(lèi)、分類(lèi)方面應(yīng)用,由于人工神經(jīng)網(wǎng)絡(luò)具有容錯(cuò)性、魯棒性、自組織性的特點(diǎn),所以當(dāng)前已經(jīng)廣泛應(yīng)用于醫(yī)學(xué)數(shù)據(jù)挖掘,尤其是在診斷顱內(nèi)星形膠質(zhì)細(xì)胞瘤的良惡性時(shí)。因?yàn)樾切文z質(zhì)細(xì)胞惡性腫瘤具有手術(shù)風(fēng)險(xiǎn)大、雨后不理想的額特點(diǎn),所以要想正確選擇治療方案和預(yù)后評(píng)估,就需要正確判斷出腫瘤的良惡性。
第三,決策樹(shù)。在決策樹(shù)中數(shù)據(jù)受各變量的影響情況的分析預(yù)測(cè)模型通過(guò)樹(shù)枝狀展現(xiàn)出來(lái),并對(duì)分類(lèi)規(guī)則進(jìn)行提取。首先該方法會(huì)以一批已知訓(xùn)練數(shù)據(jù)為依據(jù)進(jìn)行決策樹(shù)的構(gòu)建,然后會(huì)在此基礎(chǔ)上預(yù)測(cè)數(shù)據(jù),這樣數(shù)據(jù)規(guī)則可視化就實(shí)現(xiàn)了。通過(guò)決策數(shù)據(jù)進(jìn)行二型糖尿病發(fā)生規(guī)則的構(gòu)建,能夠?qū)崿F(xiàn)對(duì)糖尿病發(fā)病因素之間的相互關(guān)系和影響程度的有效揭示,這樣二型糖尿病就能夠據(jù)此進(jìn)行預(yù)警和開(kāi)展干預(yù)控制研究[2]。
第一,灰色關(guān)聯(lián)分析法。在灰色關(guān)聯(lián)分析法中,因素間關(guān)聯(lián)程度的衡量是建立在因素之間發(fā)展趨勢(shì)的相似相異程度基礎(chǔ)上的。通過(guò)灰色關(guān)聯(lián)分析法分析醫(yī)院收治病人數(shù)的影響因素,能夠?qū)崿F(xiàn)對(duì)年度收治病人數(shù)和年平均醫(yī)生人數(shù)、平均開(kāi)放病床數(shù)、年收治病人人數(shù)、住院病人手術(shù)人次、病床周轉(zhuǎn)次數(shù)關(guān)聯(lián)程度的有效掌握[3]。
第二,時(shí)間序列預(yù)測(cè)方法。時(shí)間序列預(yù)測(cè)法中根據(jù)時(shí)間先后順序?qū)⒛撤N統(tǒng)計(jì)指標(biāo)的數(shù)值進(jìn)行排序,通過(guò)對(duì)時(shí)間序列的編制和分析,獲得時(shí)間序列中蘊(yùn)含的發(fā)展趨勢(shì)、方向、過(guò)程,在此基礎(chǔ)上進(jìn)行延伸和類(lèi)推,進(jìn)而實(shí)現(xiàn)對(duì)下一段時(shí)間或若干年內(nèi)可能達(dá)到的水平進(jìn)行預(yù)測(cè)。該方法能夠模擬HIS中現(xiàn)有的藥品量信息,這樣就能夠形成藥品消耗模型。根據(jù)醫(yī)院藥品實(shí)際消耗情況能夠獲得領(lǐng)藥量,進(jìn)而形成對(duì)藥品積壓和斷貨問(wèn)題的有效預(yù)防,不僅能夠使醫(yī)院用藥量得到滿(mǎn)足,還能夠使得藥房備藥的科學(xué)性與合理性得到有效滿(mǎn)足[4]。
通過(guò)以上內(nèi)容克制,數(shù)據(jù)挖掘在醫(yī)院信息系統(tǒng)中的有效運(yùn)用能夠提升其運(yùn)行管理水平,是醫(yī)院未來(lái)發(fā)展的重要方向。醫(yī)院應(yīng)當(dāng)充分重視的數(shù)據(jù)挖掘技術(shù)運(yùn)用的意義,進(jìn)而推動(dòng)醫(yī)院運(yùn)行管理水平的提升。