• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于醫(yī)療數(shù)據(jù)的挖掘算法研究與應(yīng)用

      2021-04-04 08:35:36郭志豪
      信息記錄材料 2021年9期
      關(guān)鍵詞:數(shù)據(jù)挖掘關(guān)聯(lián)數(shù)據(jù)庫(kù)

      郭志豪

      (蘭州城市學(xué)院 甘肅 蘭州 730000)

      1 引言

      為更好地推進(jìn)我國(guó)醫(yī)療衛(wèi)生事業(yè)的發(fā)展和進(jìn)步,國(guó)家衛(wèi)健委在2015年通過(guò)了醫(yī)院監(jiān)管系統(tǒng)建設(shè)方案,其對(duì)于我國(guó)各個(gè)醫(yī)院數(shù)據(jù)采集工具的使用做出了明確說(shuō)明,要求對(duì)各項(xiàng)數(shù)據(jù)的應(yīng)用必須要規(guī)范化、科學(xué)化和合理化。醫(yī)療數(shù)據(jù)統(tǒng)一上傳,集中管理,可以幫助患者更加便捷地查詢自身就醫(yī)信息,醫(yī)務(wù)工作人員對(duì)于患者的就醫(yī)以及病史等也有了更加深入的了解和認(rèn)識(shí),其是醫(yī)療衛(wèi)生事業(yè)進(jìn)步的重要表現(xiàn)。但實(shí)際上,我國(guó)建設(shè)方案雖然出臺(tái)已久,但是實(shí)際應(yīng)用的質(zhì)量效果卻不盡如人意,醫(yī)療領(lǐng)域的信息化程度沒(méi)有跟上互聯(lián)網(wǎng)發(fā)展的步伐,尤其是在一些縣鎮(zhèn)醫(yī)院,其實(shí)施效果比較差,這對(duì)于我國(guó)醫(yī)療衛(wèi)生的進(jìn)步實(shí)際上產(chǎn)生極為不利的影響。為此,本文嘗試對(duì)醫(yī)療大數(shù)據(jù)中數(shù)據(jù)挖掘技術(shù)進(jìn)行研究和分析,希望能夠更好地發(fā)揮相關(guān)技術(shù)的作用優(yōu)勢(shì),推進(jìn)各項(xiàng)工作朝著更好的方向發(fā)展[1]。

      2 數(shù)據(jù)挖掘技術(shù)概述

      在當(dāng)前的信息化背景下,科學(xué)技術(shù)、醫(yī)療服務(wù)領(lǐng)域產(chǎn)生的信息呈爆炸式增長(zhǎng),這些信息中的一些數(shù)據(jù)十分關(guān)鍵,具備較高的分析價(jià)值。將這些數(shù)據(jù)轉(zhuǎn)化為容易被人們接受的圖表,一方面可以方便醫(yī)療工作人員的日常工作,同時(shí)也可以推動(dòng)醫(yī)療大數(shù)據(jù)挖掘的進(jìn)步[2]。所謂的數(shù)據(jù)挖掘,主要是指從海量的信息中挖掘出具備價(jià)值的信息,涉及機(jī)器學(xué)習(xí)、人工智能、統(tǒng)計(jì)分析和模式分類(lèi)等不同學(xué)科的知識(shí)[3]。一般情況下,數(shù)據(jù)挖掘主要分成如下3個(gè)階段。

      (1)數(shù)據(jù)準(zhǔn)備。數(shù)據(jù)準(zhǔn)備階段需要剔除干擾數(shù)據(jù),主要圍繞數(shù)據(jù)的清理、集成和選擇幾方面展開(kāi)工作。將數(shù)據(jù)挖掘的基礎(chǔ)性數(shù)據(jù)形成一個(gè)數(shù)據(jù)庫(kù),然后再對(duì)其降噪,最后再?gòu)臄?shù)據(jù)庫(kù)中找到有用的信息;(2)發(fā)現(xiàn)規(guī)律。該階段主要是指通過(guò)運(yùn)用各種算法來(lái)分析數(shù)據(jù)庫(kù),并且發(fā)現(xiàn)有效信息,是整個(gè)數(shù)據(jù)挖掘中十分重要的環(huán)節(jié),該環(huán)節(jié)主要是對(duì)最終的決策提供必要的支持;(3)表現(xiàn)規(guī)律。該階段是在發(fā)現(xiàn)了數(shù)據(jù)的規(guī)律以后,利用可視化的工具將其展示出來(lái),便于醫(yī)療人員的研判。

      3 醫(yī)療大數(shù)據(jù)中的數(shù)據(jù)挖掘應(yīng)用分析

      為充分地發(fā)揮出數(shù)據(jù)的作用,需要對(duì)醫(yī)療大數(shù)據(jù)進(jìn)行深度挖掘,并詳細(xì)整理、分析看似雜亂的數(shù)據(jù),找到其中蘊(yùn)含的價(jià)值信息,從而方便臨床護(hù)理、醫(yī)學(xué)研究和疾病治療等方面的研究。對(duì)于患者來(lái)說(shuō),也可通過(guò)全面分析醫(yī)療大數(shù)據(jù)的相關(guān)信息,使其享受到更加高效精準(zhǔn)的服務(wù),免去一些不必要的檢查,避免醫(yī)療資源的浪費(fèi)。醫(yī)學(xué)領(lǐng)域的研究也可通過(guò)深度挖掘醫(yī)療大數(shù)據(jù)為疾病的診斷和藥物的研發(fā)提供強(qiáng)大的支持,攻克很多過(guò)去無(wú)法解決的醫(yī)學(xué)難題??v觀整個(gè)醫(yī)療領(lǐng)域,挖掘分析醫(yī)療大數(shù)據(jù)可在醫(yī)療成本評(píng)估和醫(yī)療質(zhì)量管理兩方面起到一定的作用。

      在以上兩方面的應(yīng)用過(guò)程中,主要是通過(guò)對(duì)于醫(yī)療大數(shù)據(jù)信息進(jìn)行深度挖掘來(lái)密切監(jiān)測(cè)廣大群眾的健康狀況,并從中分辨出一些疾病的高發(fā)人群,從而精準(zhǔn)預(yù)測(cè)一些流行病或區(qū)域性疾病的發(fā)展走向,從而為公共衛(wèi)生政策的制定提供一定的支持。數(shù)據(jù)挖掘技術(shù)是合理分析醫(yī)療大數(shù)據(jù)的關(guān)鍵,隨著深度學(xué)習(xí)技術(shù)的不斷進(jìn)步,數(shù)據(jù)挖掘領(lǐng)域也得到了前所未有的發(fā)展,主要包括關(guān)聯(lián)規(guī)則挖掘、異常挖掘等,這些算法是醫(yī)療數(shù)據(jù)應(yīng)用的基礎(chǔ),同時(shí)在上述算法的基礎(chǔ)上也衍生出了其他拓展算法,下面分別說(shuō)明。

      3.1 關(guān)聯(lián)規(guī)則算法分析

      關(guān)聯(lián)規(guī)則發(fā)掘技術(shù)主要是通過(guò)分析不同實(shí)驗(yàn),然后對(duì)其中有一定依賴或關(guān)聯(lián)的信息進(jìn)行收集和分析,在數(shù)據(jù)挖掘技術(shù)中屬于關(guān)鍵性問(wèn)題。關(guān)聯(lián)規(guī)則挖掘這一研究方向一經(jīng)提出,在國(guó)際上得到了學(xué)者的廣泛關(guān)注,通過(guò)這些年的不斷發(fā)展也推出了很多關(guān)聯(lián)規(guī)則的挖掘算法,典型的有Apriori算法。該算法是關(guān)聯(lián)規(guī)則挖掘算法中第一個(gè)被成熟應(yīng)用的算法。在醫(yī)療行業(yè)的運(yùn)行過(guò)程中,每天都會(huì)產(chǎn)生海量的數(shù)據(jù)信息,而這些信息之間看似雜亂無(wú)章,但實(shí)際的內(nèi)在聯(lián)系十分密切,通過(guò)關(guān)聯(lián)規(guī)則挖掘算法的統(tǒng)計(jì)分析,可提取其中有關(guān)聯(lián)的知識(shí),從而對(duì)致病因素、疾病診療及公共衛(wèi)生健康監(jiān)測(cè)等工作提供一定的幫助。

      例如,通過(guò)海量的電子病歷信息,可以發(fā)掘心血管病死亡情況和傳統(tǒng)危險(xiǎn)元素之間的關(guān)聯(lián)規(guī)則,然后通過(guò)分析這些數(shù)據(jù),還可以總結(jié)出心血管病死亡和體重超標(biāo)之間的內(nèi)在關(guān)系。又如,通過(guò)Apriori算法分析大量的女性乳腺疾病方面的數(shù)據(jù),可以建立乳腺癌和其他屬性之間的關(guān)聯(lián)規(guī)則。很多醫(yī)學(xué)科研工作需要分析病因,如一些新出現(xiàn)的并發(fā)癥是不是由另一種并發(fā)癥誘發(fā)而來(lái)的,這就需要數(shù)據(jù)挖掘技術(shù)中的關(guān)聯(lián)算法從大量的隨機(jī)個(gè)例中找尋內(nèi)在的關(guān)聯(lián)。關(guān)聯(lián)算法的優(yōu)點(diǎn)主要在于在該算法下更容易識(shí)別內(nèi)在的因果關(guān)系,如果在前后時(shí)間序列的互推中具有較高的置信度,則說(shuō)明兩者之間存在著較為強(qiáng)烈的因果關(guān)系,否則為單方面映射或無(wú)映射。

      3.2 分類(lèi)挖掘算法分析

      分類(lèi)挖掘分析可通過(guò)分類(lèi)算法將數(shù)據(jù)庫(kù)中的對(duì)象映射成某一個(gè)預(yù)設(shè)的類(lèi)別,從而便于模型來(lái)計(jì)算和預(yù)測(cè),進(jìn)而實(shí)現(xiàn)對(duì)未知對(duì)象的類(lèi)別歸類(lèi)。上文中所提到的序列數(shù)據(jù)庫(kù),主要是由一系列的數(shù)據(jù)對(duì)象構(gòu)成,在這些數(shù)據(jù)對(duì)象中每一個(gè)單一對(duì)象都可以視為多種特性所構(gòu)成的綜合輸入向量,且訓(xùn)練樣本需要帶有多種類(lèi)別標(biāo)記。

      現(xiàn)如今,對(duì)于不同數(shù)據(jù)類(lèi)別的應(yīng)用場(chǎng)合,已經(jīng)有多種多樣的分類(lèi)挖掘模型,較為常見(jiàn)的有機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、專(zhuān)家系統(tǒng)等方法。分類(lèi)挖掘分析結(jié)合醫(yī)療行業(yè)來(lái)看及應(yīng)用主要包括如下兩方面:首先,基于智能算法的疾病預(yù)測(cè);其次,預(yù)測(cè)一些醫(yī)療事件。

      在醫(yī)療服務(wù)中,大部分的疾病診斷都局限在經(jīng)驗(yàn)性診斷上,但由于不同的病患存在著較大的個(gè)體差異,同時(shí)復(fù)合疾病也對(duì)經(jīng)驗(yàn)性診斷帶來(lái)了一定程度的限制。所以,在具體的診斷過(guò)程中,對(duì)于一些疑難雜癥,醫(yī)生很難憑借現(xiàn)有的經(jīng)驗(yàn)給出十分精確的判斷。但通過(guò)正確的搜集海量的診斷病例的信息,然后借助大數(shù)據(jù)分析工具,可以詳細(xì)地分析所有病例中的綜合癥狀,然后研究出疾病類(lèi)型和病癥之間的內(nèi)在聯(lián)系。在實(shí)際的臨床診斷過(guò)程中,通過(guò)分析患者所提供的基礎(chǔ)性信息,將其輸入到診斷系統(tǒng)中,就可給出較為精確的確診結(jié)論。國(guó)內(nèi)目前有很多醫(yī)學(xué)專(zhuān)家和機(jī)器學(xué)習(xí)算法科研人員都通過(guò)醫(yī)療大數(shù)據(jù)的分類(lèi)挖掘分析逐步構(gòu)建起以預(yù)防早期慢性病為目的的防控體系。在新冠肺炎疫情的防控過(guò)程中,騰訊公司也聯(lián)合一些國(guó)內(nèi)的醫(yī)療機(jī)構(gòu)研發(fā)了一系列的智能診斷系統(tǒng),減輕醫(yī)療人員的壓力。

      3.3 聚類(lèi)算法分析

      所謂的聚類(lèi)分析主要是根據(jù)不同的規(guī)律按照個(gè)體屬性來(lái)分成不同的類(lèi)別,其目的主要是為了縮小同類(lèi)別下不同個(gè)體之間的距離。許多領(lǐng)域目前都廣泛應(yīng)用了該技術(shù),例如人工智能領(lǐng)域。聚類(lèi)分析與分類(lèi)學(xué)習(xí)相比,所分析的對(duì)象并沒(méi)有類(lèi)別的標(biāo)記,而是通過(guò)算法來(lái)自動(dòng)確定,但由于訓(xùn)練數(shù)據(jù)庫(kù)中對(duì)象的不同,其本質(zhì)上有類(lèi)別標(biāo)記。近年來(lái),聚類(lèi)分析逐步成為大數(shù)據(jù)挖掘領(lǐng)域中較為前沿和熱門(mén)的研究領(lǐng)域,經(jīng)過(guò)學(xué)者們不斷分析研究,逐步開(kāi)發(fā)了K均值聚類(lèi)算法、BIRCH聚類(lèi)算法等一系列的聚類(lèi)分析模型,主要針對(duì)未知分布規(guī)律的數(shù)據(jù)展開(kāi)挖掘,同時(shí)還可以挖掘具有代表性的事件集。

      聚類(lèi)分析算法被應(yīng)用到醫(yī)療領(lǐng)域中的典型場(chǎng)景,主要有疾病的分布分析和醫(yī)療費(fèi)用兩方面。過(guò)去的臨床科研研究對(duì)象一般以醫(yī)院的患者為主體,通過(guò)分析臨床指標(biāo)和患者的基本變量展開(kāi)研究。但一般情況下,性別和年齡存在差異的患者其醫(yī)學(xué)特征也并不相同,所以還要根據(jù)性別和年齡對(duì)病患展開(kāi)分組,在分組過(guò)程中采用人工劃分的方法,例如以10年或5年為一個(gè)跨度,但這種分組難以客觀地反映出研究對(duì)象的年齡分布規(guī)律。而采用聚類(lèi)分析算法,可以更加科學(xué)合理地?fù)Q位研究對(duì)象的年齡和性別,并且對(duì)于不同性別和年齡組別下的患者,臨床指標(biāo)也能展開(kāi)深入的分析。

      3.4 異常挖掘算法分析

      數(shù)據(jù)庫(kù)建設(shè)過(guò)程中可能會(huì)遇到這樣或者那樣的問(wèn)題,研究對(duì)象難以真實(shí)反映情況的現(xiàn)象也并不少見(jiàn),之所以如此是因?yàn)檠芯繉?duì)象與數(shù)據(jù)庫(kù)中的一般性樣本并不匹配,這些數(shù)據(jù)樣本通常被人們稱(chēng)作離群點(diǎn)。為了保證數(shù)據(jù)挖掘技術(shù)應(yīng)用的質(zhì)量與效果,通常情況下,這些離群點(diǎn)可能會(huì)事先被當(dāng)作異常數(shù)據(jù)處理掉,但在實(shí)際應(yīng)用過(guò)程中,可能會(huì)發(fā)現(xiàn)這些異常數(shù)據(jù)反而更具有特點(diǎn),如果進(jìn)一步深入挖掘,可以挖掘出更加多元化的信息。在異常挖掘過(guò)程中,科研人員必須弄清楚如下兩方面的問(wèn)題:(1)選擇何種挖掘算法作為確定異常點(diǎn)的挖掘方法;(2)在數(shù)據(jù)庫(kù)中何種特征的數(shù)據(jù)被劃分為異常數(shù)據(jù)。目前,較為成熟的異常挖掘分析算法,主要有基于距離的算法、基于偏差的算法及基于統(tǒng)計(jì)的算法。

      例如,國(guó)內(nèi)的有些學(xué)者就借助心電圖的歷史數(shù)據(jù)實(shí)施異常挖掘,在挖掘過(guò)程中主要采用了時(shí)間序列數(shù)據(jù),通過(guò)對(duì)數(shù)據(jù)進(jìn)行挖掘,疾病診斷效果大幅度提升。同時(shí),也可以針對(duì)醫(yī)療賬單中的數(shù)據(jù)進(jìn)行挖掘,找到可能存在的醫(yī)保欺詐行為,該方法在控制醫(yī)療保險(xiǎn)行業(yè)的欺詐行為中存在著十分明顯的效果。但值得注意的是,上述數(shù)據(jù)挖掘分析方法,在整個(gè)醫(yī)療大數(shù)據(jù)的應(yīng)用過(guò)程中相對(duì)比較理論化,在應(yīng)用過(guò)程中還要結(jié)合具體情況不斷調(diào)整使其適應(yīng)醫(yī)院的實(shí)際形勢(shì)。

      4 結(jié)語(yǔ)

      綜上所述,當(dāng)前醫(yī)療大數(shù)據(jù)中的數(shù)據(jù)挖掘技術(shù),對(duì)于我國(guó)醫(yī)療衛(wèi)生事業(yè)的發(fā)展和進(jìn)步有著較為積極促進(jìn)作用,其可以為廣大人民群眾提供更好的治療效果,可以使醫(yī)療工作更具有針對(duì)性。但是不可否認(rèn)的是,當(dāng)前醫(yī)療大數(shù)據(jù)中的數(shù)據(jù)挖掘技術(shù)在具體應(yīng)用中,還存在多方面的不足,而要想更好地發(fā)揮相關(guān)技術(shù)的優(yōu)勢(shì)作用,就需要正視其存在的缺點(diǎn)和不足,然后采取針對(duì)性措施予以優(yōu)化,以便更好地發(fā)揮大數(shù)據(jù)技術(shù)的作用與價(jià)值。

      猜你喜歡
      數(shù)據(jù)挖掘關(guān)聯(lián)數(shù)據(jù)庫(kù)
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
      “一帶一路”遞進(jìn),關(guān)聯(lián)民生更緊
      奇趣搭配
      基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      數(shù)據(jù)庫(kù)
      智趣
      讀者(2017年5期)2017-02-15 18:04:18
      數(shù)據(jù)庫(kù)
      數(shù)據(jù)庫(kù)
      數(shù)據(jù)庫(kù)
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      郸城县| 博客| 嘉峪关市| 墨脱县| 郎溪县| 通州区| 天祝| 阳曲县| 沂水县| 贵阳市| 缙云县| 万年县| 周至县| 蓝田县| 卢氏县| 苏州市| 乐山市| 黄龙县| 手游| 策勒县| 马鞍山市| 河源市| 天峨县| 铜川市| 邓州市| 晋城| 河南省| 桑日县| 上虞市| 贵定县| 安化县| 江源县| 靖宇县| 镇赉县| 西林县| 大冶市| 夏津县| 高青县| 溧阳市| 南部县| 商水县|