楊廠鋒 胡曉娟 張湘星
摘? 要:隨著信息技術(shù)的不斷發(fā)展,新一代移動(dòng)互聯(lián)網(wǎng)的技術(shù)的不斷成熟,以及最近興起的物聯(lián)網(wǎng)、人工智能等的迅猛發(fā)展,大數(shù)據(jù)的浪潮已經(jīng)悄然降臨。醫(yī)療服務(wù)作為人類最基本的需求之一,醫(yī)院信息系統(tǒng),電子病歷、影像、遠(yuǎn)程醫(yī)療等都會(huì)產(chǎn)生大量的數(shù)據(jù),但是數(shù)據(jù)都存在于各個(gè)分散的醫(yī)療機(jī)構(gòu)之中,形成信息孤島,數(shù)據(jù)的種類復(fù)雜,大多數(shù)都沒有得到充分利用。本文對(duì)醫(yī)療大數(shù)據(jù)的概念進(jìn)行剖析,并對(duì)醫(yī)療大數(shù)據(jù)的應(yīng)用方向進(jìn)行了探討,在此基礎(chǔ)之上,闡述醫(yī)療大數(shù)據(jù)處理的基本框架和技術(shù),最后歸納總結(jié)醫(yī)療大數(shù)據(jù)面臨的挑戰(zhàn)和其未來(lái)發(fā)展。
關(guān)鍵詞:醫(yī)療大數(shù)據(jù);云計(jì)算;數(shù)據(jù)挖掘;數(shù)據(jù)倉(cāng)庫(kù);電子病歷
中圖分類號(hào):R197.32;TP311.13? ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-4706(2019)09-0106-03
0? 引? 言
隨著新一代移動(dòng)互聯(lián)網(wǎng)的快速發(fā)展,以及物聯(lián)網(wǎng)和云計(jì)算技術(shù)的興起,數(shù)據(jù)呈現(xiàn)爆炸式增長(zhǎng),大數(shù)據(jù)的時(shí)代已經(jīng)悄然到來(lái)。醫(yī)療行業(yè)從二十世紀(jì)九十年代開始,醫(yī)院信息化發(fā)展迅速,積累了海量結(jié)構(gòu)數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),也面臨著大數(shù)據(jù)的挑戰(zhàn)。知名咨詢公司麥肯錫在其研究的報(bào)告中說(shuō)明,大數(shù)據(jù)分析可以幫助美國(guó)的醫(yī)療相關(guān)產(chǎn)業(yè)每年創(chuàng)造超過(guò)3000億美元的附加價(jià)值。
醫(yī)療大數(shù)據(jù)概念的火熱傳播,并不意味著對(duì)于醫(yī)療大數(shù)據(jù)的深入了解,比如醫(yī)療大數(shù)據(jù)的概念、關(guān)鍵技術(shù),以及在其利用上存在的很多疑問,尚且沒有深入的了解,有一些應(yīng)用也還處于初始探索階段。本文對(duì)醫(yī)療大數(shù)據(jù)的概念進(jìn)行剖析,歸納總結(jié)醫(yī)療大數(shù)據(jù)應(yīng)用的分類,在此基礎(chǔ)之上對(duì)醫(yī)療大數(shù)據(jù)所用到的技術(shù)框架進(jìn)行解析,最后對(duì)醫(yī)療大數(shù)據(jù)遇到的挑戰(zhàn)進(jìn)行闡述。
1? 大數(shù)據(jù)與醫(yī)療大數(shù)據(jù)的概念
大數(shù)據(jù)從表面上理解,是一個(gè)比較抽象的邏輯概念,從字面上來(lái)說(shuō),就是數(shù)據(jù)累積的規(guī)模龐大。但是僅從數(shù)據(jù)量上來(lái)說(shuō)和以前討論的海量數(shù)據(jù)、超大規(guī)模的概念沒有什么區(qū)別,對(duì)于大數(shù)據(jù)尚未有一個(gè)公認(rèn)的定義,不同的定義基本是從大數(shù)據(jù)的特征出發(fā),通過(guò)對(duì)這些特征的闡述和歸納,試圖給出其定義。在這些定義中,比較有代表性的是3V定義,即認(rèn)為大數(shù)據(jù)需滿足三個(gè)特點(diǎn):規(guī)模(Volume)、多樣性 (Variety)和高速性(Velocity)。
醫(yī)療大數(shù)據(jù)的概念,除包含大數(shù)據(jù)的這3個(gè)特點(diǎn)外,還具有其他一些特點(diǎn):第一,醫(yī)療數(shù)據(jù)的來(lái)源分散,來(lái)源于成千上萬(wàn)的醫(yī)療機(jī)構(gòu)之中;第二,醫(yī)療數(shù)據(jù)的異構(gòu)性突出,結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)大量存在;第三,點(diǎn)醫(yī)療數(shù)據(jù)含有更高的價(jià)值。
2? 醫(yī)療大數(shù)據(jù)的應(yīng)用方向
2.1? 臨床輔助決策
臨床治療是復(fù)雜的,從長(zhǎng)期看,治療不足或者治療過(guò)度都會(huì)對(duì)病人的健康帶來(lái)負(fù)面的影響,并產(chǎn)生高昂的醫(yī)療費(fèi)用。通過(guò)研究表明,對(duì)同樣一種疾病同樣一個(gè)病人,不同的醫(yī)療機(jī)構(gòu),治療的方法和護(hù)理的手段存在差異,所耗費(fèi)的醫(yī)療資源和費(fèi)用也有顯著差異。通過(guò)分析病人的費(fèi)用數(shù)據(jù)、治療信息、體征數(shù)據(jù)等,可以給醫(yī)生提供最優(yōu)的治療方案,達(dá)到效果最好,成本最節(jié)約。通過(guò)對(duì)大型三甲優(yōu)質(zhì)醫(yī)院的電子病歷進(jìn)行分析,分析患者的癥狀、主訴、病史等信息,可以給醫(yī)生提供多種的診斷和治療方案,通過(guò)對(duì)比各種方案,醫(yī)生可以選擇最佳診療路徑,可以大幅度減少平均住院天數(shù),降低成本。
2.2? 醫(yī)療質(zhì)量監(jiān)管
通過(guò)對(duì)醫(yī)院內(nèi)部數(shù)據(jù)進(jìn)行分析,可以充分地發(fā)揮醫(yī)院自我評(píng)價(jià)的作用,促進(jìn)醫(yī)院內(nèi)部“醫(yī)療質(zhì)量和醫(yī)療安全”的持續(xù)改進(jìn)。大數(shù)據(jù)改變了原有的現(xiàn)場(chǎng)評(píng)審方式,擺脫了以往制度文件的檢查方法,將所涉及的各專業(yè)和科室貫穿在一起進(jìn)行整體評(píng)價(jià),通過(guò)對(duì)醫(yī)院運(yùn)營(yíng)和臨床診療數(shù)據(jù)的實(shí)時(shí)抽取、自動(dòng)轉(zhuǎn)換、集中存儲(chǔ)、統(tǒng)一展示,實(shí)現(xiàn)對(duì)臨床業(yè)務(wù)的規(guī)劃、協(xié)調(diào)和控制,實(shí)時(shí)監(jiān)測(cè)和管理醫(yī)療機(jī)構(gòu)的日常運(yùn)營(yíng),為領(lǐng)導(dǎo)決策提供及時(shí)、真實(shí)、可信的數(shù)據(jù),以保證醫(yī)療質(zhì)量和醫(yī)療安全。
2.3? 疾病預(yù)測(cè)模型
通過(guò)大數(shù)據(jù)可以分析某種疾病和癥狀,檢查檢驗(yàn)數(shù)據(jù)的相關(guān)性,科研人員可以通過(guò)這些數(shù)據(jù)構(gòu)建出典型疾病的疾病預(yù)測(cè)分析模型,這些數(shù)據(jù)模型是固定不變的,會(huì)隨著數(shù)據(jù)的不斷積累,進(jìn)行動(dòng)態(tài)的自我學(xué)習(xí)(機(jī)器學(xué)習(xí)),隨著數(shù)據(jù)的變化不斷調(diào)整優(yōu)化?;诖髷?shù)據(jù)的疾病預(yù)測(cè)模型可以很好地利用數(shù)據(jù)潛在的知識(shí),不會(huì)受到其他因素的影響,從而幫助患者更早地預(yù)防疾病或者采取最佳的治療方案。
2.4? 臨床實(shí)驗(yàn)分析
分析病人住院期間的診療記錄,以及臨床試驗(yàn)數(shù)據(jù)可以發(fā)現(xiàn)各類藥品的副作用和適應(yīng)癥。對(duì)這些數(shù)據(jù)進(jìn)行分析后,可以對(duì)藥物的療效進(jìn)行重新定位,并且可以發(fā)現(xiàn)藥物的其他適應(yīng)癥,并進(jìn)行針對(duì)性的產(chǎn)品營(yíng)銷。實(shí)時(shí)收集藥物的不良反應(yīng)報(bào)告,可以促進(jìn)藥物的研發(fā)改進(jìn)。還有一個(gè)很重要的方面就是,以前沒有足夠的數(shù)據(jù)去證明的藥物的新情況,基于臨床試驗(yàn)的大數(shù)據(jù)就可以很好地給予佐證。
2.5? 個(gè)性化治療
個(gè)性化治療,或者稱為精準(zhǔn)醫(yī)療,通過(guò)對(duì)大型人體基因組數(shù)據(jù)進(jìn)行分析,分析遺傳變異、特定疾病的易感染性和藥物反應(yīng)的關(guān)系,在藥物研發(fā)和用藥過(guò)程考慮各個(gè)患者的遺傳因素。
個(gè)性化醫(yī)療可以大幅度提高醫(yī)療保健效果,在患者發(fā)生疾病前,就進(jìn)行早期檢測(cè)和診斷。在臨床中,經(jīng)常發(fā)生同樣的疾病,用同樣的診療方案,效果卻完全不一樣的情況,很重要的一部分原因就是遺傳因素,針對(duì)不同患者的個(gè)性診療方案,根據(jù)具體情況調(diào)整藥物種類和劑量,可以最大程度減少副作用,提高診療效果。
2.6? 對(duì)患者健康檔案的挖掘分析
在患者健康檔案方面可以整合歷次在各醫(yī)院的就診記錄以及體檢信息,形成完整的患者一生全視圖,應(yīng)用統(tǒng)計(jì)學(xué)方法可以分析出哪類人群容易感染哪種疾病、不同地區(qū)患者所患病種類的不同、各個(gè)病種年齡段的分布情況等等。舉例說(shuō),可以分析出哪類人群容易患高血壓、糖尿病、高血脂癥,可以給患者提早進(jìn)行保健知識(shí)的宣傳,盡早接受預(yù)防性保健方案,并且可以從疾病治療指南或者疾病管理方案中找到最好的治療方案。
3? 醫(yī)療大數(shù)據(jù)關(guān)鍵技術(shù)
3.1? 云計(jì)算和云存儲(chǔ)
云計(jì)算是通過(guò)使計(jì)算能力分布在大量的分布式計(jì)算機(jī)集群上,而不是本地單個(gè)計(jì)算機(jī)或者遠(yuǎn)程服務(wù)器中,計(jì)算能力甚至可以帶到萬(wàn)億次的級(jí)別,運(yùn)用形象的比喻來(lái)解釋就是從單臺(tái)發(fā)電機(jī)模式轉(zhuǎn)向了大型電廠集中供電的模式。這樣可以使計(jì)算能力作為一種商品進(jìn)行流通交易,計(jì)算就如同水電一樣,獲取方便,并且費(fèi)用低廉。
云存儲(chǔ)是在云計(jì)算概念的基礎(chǔ)上擴(kuò)展出來(lái)的一個(gè)新的概念,是指使用集群應(yīng)用、網(wǎng)格技術(shù)或分布式文件系統(tǒng)等功能,將大量不同類型的存儲(chǔ)設(shè)備通過(guò)軟件集成起來(lái)協(xié)同工作,對(duì)外提供數(shù)據(jù)存儲(chǔ)服務(wù)和業(yè)務(wù)訪問功能的一個(gè)系統(tǒng)。當(dāng)云計(jì)算系統(tǒng)運(yùn)算和處理的核心是對(duì)大量數(shù)據(jù)的存儲(chǔ),以及對(duì)存儲(chǔ)的管理時(shí),云計(jì)算系統(tǒng)中就需要配置和管理大量的存儲(chǔ)設(shè)備,這時(shí)云計(jì)算系統(tǒng)就轉(zhuǎn)變成為一個(gè)云存儲(chǔ)系統(tǒng),因此云存儲(chǔ)是一個(gè)以數(shù)據(jù)存儲(chǔ)和管理為核心的云計(jì)算系統(tǒng)。
3.2? 數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘
數(shù)據(jù)倉(cāng)庫(kù),是為決策制定過(guò)程,提供所有類型數(shù)據(jù)支持的集合,出于分析性報(bào)告和決策支持目的而創(chuàng)建的。為需要智能業(yè)務(wù)的部門,提供業(yè)務(wù)指導(dǎo),流程改進(jìn)、時(shí)間監(jiān)視、成本、質(zhì)量控制等。數(shù)據(jù)倉(cāng)庫(kù)是決策支持系統(tǒng)和聯(lián)機(jī)分析應(yīng)用數(shù)據(jù)源的數(shù)據(jù)環(huán)境。數(shù)據(jù)倉(cāng)庫(kù)主要解決從數(shù)據(jù)庫(kù)中獲取決策信息的問題,數(shù)據(jù)倉(cāng)庫(kù)的特征包括面向主題、集成性、穩(wěn)定性和時(shí)變性。
數(shù)據(jù)挖掘是通過(guò)算法分析每條數(shù)據(jù),從海量數(shù)據(jù)中尋找其規(guī)律,發(fā)現(xiàn)潛在問題和信息的技術(shù),主要有數(shù)據(jù)清洗和準(zhǔn)備、規(guī)律發(fā)現(xiàn)和規(guī)律展示3個(gè)步驟。數(shù)據(jù)清洗和準(zhǔn)備是從相關(guān)的數(shù)據(jù)源中選取所需的數(shù)據(jù)進(jìn)行清洗規(guī)整,并集成用于數(shù)據(jù)挖掘的數(shù)據(jù)集;規(guī)律發(fā)現(xiàn)是用各種算法將數(shù)據(jù)集所含的潛在規(guī)律找出來(lái);規(guī)律展示是用用戶容易理解的方式(例如可視化圖表)將發(fā)現(xiàn)的規(guī)律展示出來(lái)。
3.3? 常用的數(shù)據(jù)架構(gòu)平臺(tái)
以下常用的主流平臺(tái)都可以在醫(yī)療大數(shù)據(jù)中采用。
3.3.1? Hadoop分布式平臺(tái)架構(gòu)
它是Apache基金會(huì)所開發(fā)的分布式基礎(chǔ)架構(gòu),使用該架構(gòu)的用戶不需要了解分布式的實(shí)現(xiàn)細(xì)節(jié),來(lái)開發(fā)分布式程序,使用集群進(jìn)行高速存儲(chǔ)和運(yùn)算,該計(jì)劃是完全模仿Google體系架構(gòu)做的一個(gè)開源項(xiàng)目,其核心包括Map/Reduce和HDFS文件系統(tǒng),HDFS提供了海量數(shù)據(jù)的存儲(chǔ),Map/Reduce提供了海量數(shù)據(jù)的計(jì)算。
3.3.2? AbiCloud云計(jì)算平臺(tái)
AbiCloud是一款開源的云計(jì)算平臺(tái),使用者能夠簡(jiǎn)單、快速、可擴(kuò)展地創(chuàng)建和管理復(fù)雜的大型信息基礎(chǔ)設(shè)施,包括虛擬服務(wù)器、網(wǎng)絡(luò)、存儲(chǔ)設(shè)備、應(yīng)用等。能夠用來(lái)開發(fā)公有、私有,或者混合云,以及云應(yīng)用的各種基礎(chǔ)設(shè)施。
3.3.3? Eucalyptus開源軟件基礎(chǔ)架構(gòu)
它是一款開源的軟件基礎(chǔ)架構(gòu),通過(guò)集群或者工作站實(shí)現(xiàn)彈性的、實(shí)用的云計(jì)算,創(chuàng)建了一個(gè)能夠用內(nèi)部IT資源(包括服務(wù)器、存儲(chǔ)系統(tǒng)、網(wǎng)絡(luò)設(shè)備)的開源界面,來(lái)建立能夠和EC2兼容的云計(jì)算平臺(tái)。
以上云存儲(chǔ)、云計(jì)算、數(shù)據(jù)倉(cāng)庫(kù)等形成典型的醫(yī)療大數(shù)據(jù)架構(gòu),如圖1所示。
圖1? 醫(yī)療大數(shù)據(jù)技術(shù)架構(gòu)
4? 醫(yī)療大數(shù)據(jù)面臨的挑戰(zhàn)
4.1? 缺乏政策制度方面的支持
眾所周知醫(yī)療行業(yè)是“人命關(guān)天”,醫(yī)療大數(shù)據(jù)的研究核心數(shù)據(jù)是病人的診療信息,所有這些信息都涉及病人的隱私。所以必須要有相關(guān)的法律做保障,明確數(shù)據(jù)存儲(chǔ),共享的范圍和邊界,以及要承擔(dān)的責(zé)任。只有在法律法規(guī)的規(guī)范下才能使醫(yī)療大數(shù)據(jù)真正落地應(yīng)用,真正挖掘出醫(yī)療大數(shù)據(jù)的價(jià)值。
4.2? 缺乏統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)
對(duì)醫(yī)療大數(shù)據(jù)進(jìn)行研究,首先是收集各個(gè)醫(yī)療機(jī)構(gòu)的異構(gòu)數(shù)據(jù),這種數(shù)據(jù)包括醫(yī)療診斷、處方、檢驗(yàn)等結(jié)構(gòu)化的數(shù)據(jù),也包括PACS系統(tǒng)的大量非結(jié)構(gòu)化的數(shù)據(jù)。要進(jìn)行大數(shù)據(jù)研究,必須制定統(tǒng)一的數(shù)據(jù)共享標(biāo)準(zhǔn),打破信息孤島造成的障礙。
4.3? 系統(tǒng)的異構(gòu)性和數(shù)據(jù)的異構(gòu)性
各個(gè)醫(yī)院的系統(tǒng)使用的技術(shù)架構(gòu)各不相同,數(shù)據(jù)的異構(gòu)性也普遍存在。其中比較典型的例如醫(yī)院的電子病歷,電子病歷的發(fā)展從二十世紀(jì)末至今已有二十多年的歷史,其發(fā)展歷程大致可以分為三個(gè)階段。
第一階段,類似文本式的錄入電子病歷,這種模式取代紙質(zhì)病歷,但是沒有結(jié)構(gòu)化、標(biāo)準(zhǔn)化,使用不方便。
第二階段,改善了電子病歷的結(jié)構(gòu),而且發(fā)展出了電子病歷的專業(yè)廠商,取代了文本式的電子病歷。提高了電子病歷內(nèi)容標(biāo)準(zhǔn)化程度,并且提高了有效性和規(guī)范性,但是結(jié)構(gòu)化方面依然存在一些問題,例如術(shù)語(yǔ)不規(guī)范,以至于不能很好地實(shí)現(xiàn)醫(yī)院間共享。
第三階段,從電子病歷發(fā)展出集成化的電子病歷系統(tǒng),其能夠保證在一個(gè)完整統(tǒng)一的界面完成整個(gè)醫(yī)囑的錄入、執(zhí)行和查詢等工作,并且可以方便地獲取檢查、檢驗(yàn)、生命體征等數(shù)據(jù)。
雖然經(jīng)歷了這3個(gè)階段,但各個(gè)醫(yī)院的電子病歷發(fā)展參差不齊。大多數(shù)的醫(yī)療機(jī)構(gòu)的數(shù)據(jù)不能方便地提取。從而造成如圖2所示的結(jié)果。
圖2? 醫(yī)院系統(tǒng)的復(fù)雜性
5? 結(jié)? 論
隨著醫(yī)療數(shù)據(jù)的爆發(fā)式增長(zhǎng),正確利用大數(shù)據(jù)將為醫(yī)療行業(yè)帶來(lái)前所未有的改變。本文對(duì)醫(yī)療大數(shù)據(jù)相關(guān)方面進(jìn)行了回顧和總結(jié),介紹了大數(shù)據(jù)和醫(yī)療大數(shù)據(jù)的基本概念,詳細(xì)分析了大數(shù)據(jù)的關(guān)鍵技術(shù),著重介紹了目前醫(yī)療大數(shù)據(jù)研究面臨的挑戰(zhàn)??傮w上說(shuō),目前對(duì)于醫(yī)療大數(shù)據(jù)的研究仍處于一個(gè)初步的研究探索階段,主要集中在數(shù)據(jù)標(biāo)準(zhǔn)化、數(shù)據(jù)收集、數(shù)據(jù)處理階段,還有很多基礎(chǔ)性的問題有待解決,只有解決了這些基礎(chǔ)性問題,醫(yī)療大數(shù)據(jù)才能真正發(fā)揮巨大的價(jià)值,因此醫(yī)療大數(shù)據(jù)的發(fā)展還有很長(zhǎng)的路要走。
參考文獻(xiàn):
[1] [美]埃里克·托普.顛覆醫(yī)療:大數(shù)據(jù)時(shí)代的個(gè)人健康革命 [M].張南,魏薇,何雨師,譯.北京:電子工業(yè)出版社,2014.
[2] 董建成.醫(yī)學(xué)信息學(xué)的現(xiàn)狀與未來(lái) [J].中華醫(yī)院管理雜志,2004(4):232-235.
[3] 孟薇薇.信息爆炸時(shí)代的新概念——大數(shù)據(jù) [J].商品與質(zhì)量,2012(9):9.
[4] 李曉輝,王淑艷.大數(shù)據(jù)及其挑戰(zhàn) [J].科技風(fēng),2012(23):51.
[5] 許繼楠.醫(yī)療服務(wù)業(yè)率先受益于大數(shù)據(jù) [N].中國(guó)計(jì)算機(jī)報(bào),2012-02-20(第17版).
[6] 維克托·邁爾-舍恩伯格,肯尼思·庫(kù)克耶.大數(shù)據(jù)時(shí)代——生活、工作與思維的大變革 [M].盛楊燕,周濤,譯.杭州:浙江人民出版社,2013.
[7] 周光華,李岳峰.數(shù)據(jù)挖掘技術(shù)在衛(wèi)生統(tǒng)計(jì)信息工作中的應(yīng)用研究 [J].中國(guó)衛(wèi)生信息管理雜志,2012,9(6):82-86.
[8] 汪鵬,李剛榮,周來(lái)新.電子病歷系統(tǒng)發(fā)展趨勢(shì) [J].中國(guó)數(shù)字醫(yī)學(xué),2011,6(9):19-21.
[9] 梁銘會(huì),俞汝龍,舒婷,等.我國(guó)電子病歷立法原則的探討 [J].中國(guó)數(shù)字醫(yī)學(xué),2010,5(5):5-9.
作者簡(jiǎn)介:楊廠鋒(1984.04-),男,漢族,陜西乾縣人,助理工程師,本科,研究方向:醫(yī)學(xué)信息大數(shù)據(jù)及應(yīng)用研究、醫(yī)院信息平臺(tái)研究。