• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      醫(yī)學大數(shù)據(jù)可視分析研究

      2018-01-05 08:03降惠
      軟件工程 2017年11期
      關鍵詞:大數(shù)據(jù)醫(yī)學研究

      降惠

      摘 要:可視化分析可以提高科研人員對數(shù)據(jù)隱藏信息的洞察力。本文將醫(yī)學數(shù)據(jù)源分為普通數(shù)據(jù)、高維數(shù)據(jù)、公共衛(wèi)生數(shù)據(jù)、管理數(shù)據(jù)、評估數(shù)據(jù)五種類型,分析了每種類型數(shù)據(jù)的集成轉(zhuǎn)換方法和交互呈現(xiàn)方式。但不容忽視的是,醫(yī)學數(shù)據(jù)可視分析還面臨數(shù)據(jù)不一致、人機交互普及性較差和可視技術不豐富等問題,有待進一步研究和探討。

      關鍵詞:醫(yī)學;大數(shù)據(jù);可視分析;研究

      中圖分類號:TP391.1 文獻標識碼:A

      Abstract:With visualized analysis,scientific researchers can improve the insight to hiding information in data.The medical data sources are classified into five different types,including general data,high dimensional data,public health data,management data and evaluation data.The paper analyzes the integration and conversion method and the interaction and presentation method of each type of data.But some noticeable problems still need further studying and probing,such as the inconsistency of data,the low popularity of human-computer interaction,and the inadequacy of visualized technology.

      Keywords:medicine;big data;visualized analysis;study

      1 引言(Introduction)

      隨著互聯(lián)網(wǎng)、云計算、物聯(lián)網(wǎng)等信息技術的飛速發(fā)展,我國省、市、縣、鄉(xiāng)、村各級醫(yī)療機構(gòu)不斷推行信息化、智能化,互聯(lián)網(wǎng)中的醫(yī)學數(shù)據(jù)正在以井噴的方式急劇增加。醫(yī)學數(shù)據(jù)正在變得無處不在、觸手可及。然而,創(chuàng)造數(shù)據(jù)的最高價值是發(fā)現(xiàn)其蘊含的潛在知識,這個發(fā)現(xiàn)的過程就是數(shù)據(jù)分析[1]。在“互聯(lián)網(wǎng)+醫(yī)學”大背景下,醫(yī)學數(shù)據(jù)是一種無形資源,只有通過深入分析才能幫助人們認識新知識,掌握新規(guī)律,發(fā)現(xiàn)新理論,功克新難關。但醫(yī)學大數(shù)據(jù)與其他領域大數(shù)據(jù)相比,具有其獨特的特性,每個實體具有上百個臨床或診斷變量。心理學家研究又表明人類只可以同時正確分析處理四種變量[2]。在臨床診斷分析中,研究人員通常會使用降維的方式來處理數(shù)據(jù),將問題分割成人類可以認知的維度或?qū)⑾嗤母拍钸M行組合,但降維技術往往會忽視臨床數(shù)據(jù)中可以突破和理解醫(yī)學數(shù)據(jù)中有價值的內(nèi)容。研究發(fā)現(xiàn),當分析過程中呈現(xiàn)出直觀的數(shù)據(jù)圖形時,分析人員可以增強對數(shù)據(jù)背后隱藏信息的洞察力[3]。因此,研究人員嘗試采用人機交互的方式——可視分析技術來改善醫(yī)學大數(shù)據(jù)分析。

      2 可視分析(Visualized analysis)

      可視化分析技術是一種綜合利用可視化界面和分析理論來輔助用戶對復雜數(shù)據(jù)進行解釋和推理的技術??梢暦治鍪切畔⒖梢暬⒄J知科學、人機交互、數(shù)據(jù)挖掘、數(shù)據(jù)處理、圖像、統(tǒng)計等多領域融合的研究方法??梢暬抢萌搜鄹兄芰腿祟愔腔郏瑢?shù)據(jù)進行交互的可視表達,以增強認知的一門學科[4],是將難以直接顯示或不可見的數(shù)據(jù)映射為可感知的圖形、顏色、符號等,以提高數(shù)據(jù)識別效率并高效傳遞有用信息[5]??梢暦治霭〝?shù)據(jù)集成、呈現(xiàn)和交互??梢暬怯脩襞c數(shù)據(jù)的接口。

      3 醫(yī)學數(shù)據(jù)源及其類型(Medical data sources and

      types)

      3.1 醫(yī)學數(shù)據(jù)來源

      醫(yī)療“大數(shù)據(jù)”來源廣泛,內(nèi)容豐富。它可以來源于電子醫(yī)療記錄、醫(yī)學檢測、家庭監(jiān)測、社交媒體、零售藥房、公共衛(wèi)生控制中心和醫(yī)療保險。

      電子醫(yī)療記錄是患者醫(yī)療就診全過程的數(shù)字化記錄。它記錄了患者人口統(tǒng)計信息、病史、病癥、藥物治療、影像檢測、病程記錄和賬單數(shù)據(jù)等信息,是最有價值的數(shù)據(jù)來源[6]。目前國內(nèi)外醫(yī)院基本實現(xiàn)了患者病史、就醫(yī)全過程和康復隨訪的電子記錄,各級醫(yī)療機構(gòu)可以提供患者醫(yī)療全過程數(shù)據(jù)。

      醫(yī)學檢測數(shù)據(jù)包括檢驗實驗室的實驗儀器報告數(shù)據(jù)和影像診斷中心的診斷報告數(shù)據(jù),包括生理數(shù)據(jù)、生化數(shù)據(jù)和生命體征數(shù)據(jù)。影像數(shù)據(jù)包括核磁、CT、超聲、X光檢測數(shù)據(jù)。國外醫(yī)學檢測數(shù)據(jù)來源于醫(yī)院外的獨立醫(yī)學實驗室,如美國的Quest、LabCorp實驗室,加拿大的MDS實驗室和日本的BML實驗室。我國2016年印發(fā)了《關于醫(yī)學檢驗實驗室基本標準和管理規(guī)范(試行)的通知》和《關于醫(yī)學影像診斷中心基本標準和管理規(guī)范(試行)的通知》,今后醫(yī)學檢驗實驗室和醫(yī)學影像診斷中心將作為獨立的法人單位,相應的醫(yī)學檢測數(shù)據(jù)將來源于醫(yī)院外的獨立部門。

      家庭醫(yī)療檢測數(shù)據(jù)來源于體溫計、體溫貼、制氧機、血糖儀、血壓計、多功能治療儀、脂肪測量儀、洗鼻器、按摩椅等。家庭醫(yī)療檢測使得數(shù)據(jù)的獲取精確到秒。

      零售藥房是指依法取得《藥品經(jīng)營許可證》的單一門店的藥品零售經(jīng)營企業(yè)。零售藥房主要服務于附近的居民。零售藥房的銷售記錄,是醫(yī)學大數(shù)據(jù)的一個主要來源。

      公共衛(wèi)生控制中心數(shù)據(jù)主要收集了地方各種流行病的發(fā)病情況,包括發(fā)病人數(shù)、患者年齡、發(fā)病日期、發(fā)病天數(shù)和最終診斷治療結(jié)果等。

      醫(yī)療保險數(shù)據(jù)來源于各醫(yī)療保險公司。在我國醫(yī)療保險數(shù)據(jù)包括患者使用一類、二類、三類藥品費用,處置費、手術費、檢查費、醫(yī)學檢驗費、醫(yī)學影像診斷費、護理費用等。endprint

      3.2 醫(yī)學數(shù)據(jù)類型

      醫(yī)學數(shù)據(jù)可以分為普通數(shù)據(jù)、高維數(shù)據(jù)、公共衛(wèi)生數(shù)據(jù)、管理數(shù)據(jù)、評估數(shù)據(jù)五種。普通數(shù)據(jù)包括電子病歷、臨床設備和臨床軟件等產(chǎn)生的數(shù)據(jù),如血液檢測數(shù)據(jù)、心電圖數(shù)據(jù)、病情描述文本數(shù)據(jù)等,數(shù)據(jù)量較小。高維數(shù)據(jù)包括患者多維度的個人數(shù)據(jù),如家族史、患病史等。公共衛(wèi)生數(shù)據(jù)包括患者的家庭住址、發(fā)病天數(shù)、發(fā)病日期等信息,往往具有時間和空間特性。管理數(shù)據(jù)主要包括醫(yī)療保險數(shù)據(jù)、藥品安全數(shù)據(jù)、患者治療效果數(shù)據(jù)、患者候診時間等。評估數(shù)據(jù)指患者對自身健康信息的評估,包括患者家庭醫(yī)療監(jiān)測、自我評估測驗數(shù)據(jù)等。

      4 醫(yī)學數(shù)據(jù)可視分析技術(Visualized analysis

      technology of medical data)

      針對以上醫(yī)學數(shù)據(jù)源和醫(yī)學數(shù)據(jù)類型,醫(yī)學數(shù)據(jù)可視分析主要包括普通數(shù)據(jù)可視分析、高維數(shù)據(jù)可視分析、公共衛(wèi)生數(shù)據(jù)可視分析、管理數(shù)據(jù)可視分析、評估數(shù)據(jù)可視分析等。

      4.1 普通數(shù)據(jù)可視分析

      普通數(shù)據(jù)集成通過R語言、Python、Excel、SPSS、Matlab、SAS、Tableau、Spotfire等實現(xiàn)。普通醫(yī)學數(shù)據(jù)一般為結(jié)構(gòu)化數(shù)據(jù),類型單一,數(shù)據(jù)集成計算較為容易。普通數(shù)據(jù)可視化呈現(xiàn)方式包括線圖、直方圖、餅圖、散點圖、熱點圖、心電圖、腦電圖等?;谶@些動態(tài)交互式界面,醫(yī)生可以分類患者,可以直觀觀測患者個人體征和病情。但對于患者病情的介紹一般為文本數(shù)據(jù),為非結(jié)構(gòu)化數(shù)據(jù)。數(shù)據(jù)集成分析可以采用Python中的NLTK(自然語言處理)包。數(shù)據(jù)呈現(xiàn)比較好的形式是標簽云。標簽云技術是一種將關鍵詞根據(jù)詞頻或其他規(guī)則,將不同關鍵詞用不同大小顏色等呈現(xiàn)出來的一種可視化效果。在臨床病歷病情描述中應用最為廣泛。

      4.2 高維數(shù)據(jù)可視分析

      高維數(shù)據(jù)可視分析可以通過R語言、Python、SAS等實現(xiàn)。數(shù)據(jù)集成可以采用層次聚類的方法。高維醫(yī)療數(shù)據(jù)可視化分析呈現(xiàn)方式有平行坐標、樹圖、依賴圖、時序分析。平行坐標將患者的生命特征表示為等距離的多個垂直平行軸,其中每條曲線表示一個患者個體。平行坐標可以觀測每位患者各生命特征之間的關系。具有層次特性的數(shù)據(jù)通常采用樹圖來進行分析。家族史通常采用依賴圖來進行分析。個人患病史通常采用時序分析法進行分析,主要關注患者個體隨時間推移的患病過程。

      4.3 公共衛(wèi)生數(shù)據(jù)可視分析

      公共衛(wèi)生數(shù)據(jù)可視分析可以通過Python、R語言、Geoda、OpenGeoda、ArcGIS等實現(xiàn)。數(shù)據(jù)轉(zhuǎn)換采用計算空間權重矩陣,通過全局空間相關性和局部空間相關性等進行分析。公共衛(wèi)生數(shù)據(jù)通常采用地理空間分析方法,可視化呈現(xiàn)方式有統(tǒng)計點圖、二維散點圖、分級地圖、時序分析、時空探索分析等。對于公共衛(wèi)生數(shù)據(jù)分析主要從時間和空間兩個維度分析病例數(shù)據(jù)的傳播和蔓延。

      4.4 管理數(shù)據(jù)可視分析

      管理數(shù)據(jù)通常采用主控制臺(Dashboard)技術。主控制臺技術將不同的可分析技術集成到一個平臺上,使管理者可以一目了然地分析數(shù)據(jù)、匯總信息并作出科學決策,如Brown[7]等用主控制臺技術監(jiān)視和快速分析與護士相關的多維數(shù)據(jù)。

      4.5 評估數(shù)據(jù)可視分析

      評估數(shù)據(jù)通常采用手機應用軟件來實現(xiàn)可視分析,患者可以了解自身健康狀態(tài),合理安排作息和飲食,配合醫(yī)生開展更好的治療。

      5 問題與挑戰(zhàn)(Problems and challenges)

      5.1 醫(yī)學數(shù)據(jù)格式、結(jié)構(gòu)、標準的不一致性

      醫(yī)療數(shù)據(jù)來源廣泛,除了具有了其他大數(shù)據(jù)的一般特性外,還具有幾種不一致性。(1)格式:由于醫(yī)療數(shù)據(jù)來源于不同的醫(yī)療系統(tǒng),產(chǎn)生于不同的醫(yī)療軟件,所以生成的數(shù)據(jù)格式往往不同。一方面,數(shù)據(jù)格式豐富,包含文本、數(shù)字、圖像、聲音、多媒體等。另一方面,相同的數(shù)據(jù)可能在不同的軟件中重復記錄,但不同的軟件數(shù)據(jù)的記錄方式可能存在很大的差異,同一屬性有的可能標記為文本,而有的軟件中則標記為數(shù)字,使得數(shù)據(jù)分析時數(shù)據(jù)間的連接具有了一定的挑戰(zhàn)性。(2)結(jié)構(gòu):醫(yī)院信息化管理仍不健全,醫(yī)院信息錄入者輸入的數(shù)據(jù)形式多樣,有結(jié)構(gòu)化表格數(shù)據(jù),也存在一些非結(jié)構(gòu)化的病歷、醫(yī)學影像檢測數(shù)據(jù)。(3)標準:藥房或藥品研究人員可能會以藥品的化學成分來標記對象,而醫(yī)院醫(yī)護工作者往往采用藥品的通用名稱或商品名稱進行標記。

      這些不一致性使得數(shù)據(jù)的質(zhì)量無法保證,數(shù)據(jù)集成困難很大,而這些又恰恰是數(shù)據(jù)可視分析的基礎和前提,將直接影響到數(shù)據(jù)可視分析的科學性和準確性。

      5.2 人機交互的普及性有待提高

      目前,醫(yī)學數(shù)據(jù)可視化主要針對醫(yī)學數(shù)據(jù)分析人員,對于患者、醫(yī)生和護理人員的人機交互分析并未完善。未來任何領域的普通個體均有大數(shù)據(jù)分析的需求?!叭巳硕级髷?shù)據(jù),人人都能可視化”已成為大數(shù)據(jù)發(fā)展的目標之一。因此,提供自助式大數(shù)據(jù)可視分析技術有待進一步研究。

      5.3 可視技術有待豐富

      針對不同的醫(yī)學數(shù)據(jù),雖然已經(jīng)涌現(xiàn)出很多不同的可視分析方法,但可視技術以直方圖、散點圖、樹圖、空間分布圖、時間序列圖為主,可視技術仍有很大豐富空間。探索更多符合人類認知的可視分析技術仍是今后努力的一個方向。

      6 結(jié)論(Conclusion)

      醫(yī)學數(shù)據(jù)可視分析將大量醫(yī)學普通、高維、公共衛(wèi)生、管理和評估數(shù)據(jù)轉(zhuǎn)換成直觀形式。在符合人類認知和感知規(guī)律的基礎上,通過計算機應用軟件實現(xiàn)數(shù)據(jù)集成和轉(zhuǎn)換,通過不同的可視化呈現(xiàn)方式,實現(xiàn)醫(yī)學數(shù)據(jù)分析的“增值”效果。但不容忽視的是,醫(yī)學數(shù)據(jù)可視分析還面臨數(shù)據(jù)不一致、人機交互普及性較差和可視技術不豐富等問題。基于數(shù)據(jù)挖掘的醫(yī)學數(shù)據(jù)可視分析有待進一步研究和探討。

      參考文獻(References)

      [1] Cohen J,Dolan B,Dunlap M,et al.MAD skills:New analysis practices for big data[J].PVLDB,2009,2(2):1481-1492.

      [2] Graeme S Halford,Rosemary Baker,Julie E McCredden,et al.

      How many variablescan humans process[J].Psychological

      Science,2005,16(1):70-76.

      [3] 任磊,杜一,馬帥,等.大數(shù)據(jù)可視分析綜述[J].軟件學報,

      2014,25(9):1909-1936.

      [4] MunzneR.T.WileyInterdisciplinaryReviews Computational Statistics[J].Visualization analysis and design,2015,2(4):387-403.

      [5] Charles D.H,ChrisJ.The Visualization Handbook[M].2004:

      76-85.

      [6] Trivedi,Shrawan Kumar,Deynil,et al.Handbook of Research on Advanced Data Mining Techniques and Applications for Business Intelligence[M].IGI Global,2017:242.

      [7] Diane Storer Brown,Carolyn E Aydin,Nancy Donaldson.Quartile dashboards:Translatinglarge data sets into performance improvement priorities[J].Journal for Healthcare Quality,2008,30(6):18-30.

      作者簡介:

      降 惠(1983-),女,碩士,講師.研究領域:數(shù)據(jù)挖掘,醫(yī)學計算機應用.endprint

      猜你喜歡
      大數(shù)據(jù)醫(yī)學研究
      FMS與YBT相關性的實證研究
      遼代千人邑研究述論
      醫(yī)學的進步
      預防新型冠狀病毒, 你必須知道的事
      視錯覺在平面設計中的應用與研究
      EMA伺服控制系統(tǒng)研究
      基于大數(shù)據(jù)背景下的智慧城市建設研究
      醫(yī)學
      醫(yī)學、生命科學類
      昭平县| 海兴县| 缙云县| 错那县| 塘沽区| 寿宁县| 安龙县| 阳山县| 舟山市| 河南省| 哈巴河县| 通辽市| 盘锦市| 光山县| 林周县| 武义县| 南雄市| 潞西市| 伊川县| 新密市| 买车| 松滋市| 故城县| 嘉义县| 晋江市| 米脂县| 望奎县| 华池县| 肃宁县| 威远县| 乌拉特前旗| 玛曲县| 景洪市| 富宁县| 顺平县| 河东区| 定襄县| 迁西县| 农安县| 阜康市| 禹州市|