安文琛
(廣州市第一人民醫(yī)院,廣東 廣州 510180)
大數(shù)據(jù)在現(xiàn)代化醫(yī)院建設(shè)中的應(yīng)用
安文琛
(廣州市第一人民醫(yī)院,廣東廣州510180)
醫(yī)院每天都會(huì)產(chǎn)生海量的數(shù)據(jù),充分運(yùn)用大數(shù)據(jù)技術(shù)在數(shù)據(jù)中心、商業(yè)智能、醫(yī)療科研管理等方面的作用,對(duì)醫(yī)院大數(shù)據(jù)進(jìn)行整合、發(fā)掘與利用,為醫(yī)院管理者提供決策依據(jù),將可以極大提升醫(yī)院的核心競(jìng)爭(zhēng)力。
大數(shù)據(jù);數(shù)據(jù)中心;商業(yè)智能;醫(yī)療科研管理
這是一個(gè)信息爆炸的時(shí)代,也是一個(gè)概念爆炸的時(shí)代。當(dāng)業(yè)界還在探討物聯(lián)網(wǎng)和云計(jì)算等前沿概念的時(shí)候,一些國(guó)際IT巨頭已經(jīng)聚焦于物聯(lián)網(wǎng)和云計(jì)算產(chǎn)業(yè)背后的大數(shù)據(jù),并努力挖掘其潛在價(jià)值。醫(yī)院每天產(chǎn)生海量的數(shù)據(jù),大數(shù)據(jù)應(yīng)用技術(shù)將推動(dòng)現(xiàn)代化醫(yī)院更迅猛、更高層次地發(fā)展。能否抓住“大數(shù)據(jù)”所帶來(lái)的機(jī)遇,將成為醫(yī)院提升核心競(jìng)爭(zhēng)力的關(guān)鍵環(huán)節(jié)[1]。
全球數(shù)據(jù)量每?jī)赡甏蠹s增加一倍,根據(jù)國(guó)際數(shù)據(jù)資訊(IDC)公司監(jiān)測(cè),估計(jì)到2020年,全球?qū)碛?5ZB的數(shù)據(jù)量,這些數(shù)據(jù)85%以上以非結(jié)構(gòu)化或半結(jié)構(gòu)化的形式存在。IT界用“BigData(大數(shù)據(jù))”來(lái)形容這個(gè)問(wèn)題。早在上個(gè)世紀(jì)80年代就有美國(guó)人提出來(lái)“大數(shù)據(jù)”這個(gè)名詞。2008年9月,文章“Big Data:ScienceinthePetabyteEra”在《科學(xué)》雜志發(fā)表,“大數(shù)據(jù)”這個(gè)詞開(kāi)始廣泛傳播[2]。
大數(shù)據(jù)中的數(shù)據(jù)其數(shù)量級(jí)以PB(1PB=1024 TB)或EB(1EB=100萬(wàn)TB)或更高計(jì)算,它們包括結(jié)構(gòu)化的、半結(jié)構(gòu)化的和非結(jié)構(gòu)化類型,其規(guī)模和復(fù)雜程度超出了以往。在數(shù)據(jù)管理中,一方面數(shù)據(jù)量和業(yè)務(wù)量雙向增長(zhǎng),更重要的另一方面是現(xiàn)代企業(yè)向全社會(huì)互聯(lián)互通的交互式云計(jì)算業(yè)務(wù)模式的逐漸演進(jìn)。傳統(tǒng)的數(shù)據(jù)管理方式在容量、效率、擴(kuò)展性上存在瓶頸,為了克服以上瓶頸,現(xiàn)代的數(shù)據(jù)管理需要達(dá)到以下目標(biāo):海量容納能力,多類型,多結(jié)構(gòu),高負(fù)載,高可用,高可靠,低成本。
“大數(shù)據(jù)”的“大”不僅體現(xiàn)在數(shù)量龐大,更重要的是數(shù)據(jù)發(fā)生質(zhì)的變化,即數(shù)據(jù)具有網(wǎng)絡(luò)化和交互性特性。到目前為止,大數(shù)據(jù)沒(méi)有統(tǒng)一的定義,比較流行的是4v定義:即有以下四個(gè)特征的數(shù)據(jù)稱為大數(shù)據(jù),這四個(gè)v特征分別是Volume,Velocity,Variety,Value。其中,Volume代表容量大,Velocity代表變化速度快,Variety代表種類和結(jié)構(gòu)類型多,Value代表價(jià)值密度低。從數(shù)據(jù)形態(tài)出發(fā),大數(shù)據(jù)的來(lái)源主要有社交媒體上的用戶評(píng)論,互聯(lián)網(wǎng)上客戶交互的行為數(shù)據(jù),傳感器等機(jī)器數(shù)據(jù)等。醫(yī)療是一個(gè)擁有海量大數(shù)據(jù)的行業(yè),而醫(yī)院則是具體的承載單位。
2.1來(lái)源復(fù)雜
從數(shù)據(jù)來(lái)源來(lái)看,醫(yī)院大數(shù)據(jù)主要來(lái)自以下8個(gè)方面:
1)社會(huì)化媒體、互聯(lián)網(wǎng)及移動(dòng)互聯(lián)網(wǎng)、電子商務(wù);
2)傳感器網(wǎng)絡(luò)、鏈接設(shè)備、智能終端、實(shí)時(shí)監(jiān)控設(shè)備;
3)商業(yè)智能(BI)、醫(yī)院輔助決策系統(tǒng);
4)計(jì)算機(jī)、平板電腦、手機(jī)、其他移動(dòng)設(shè)備、移動(dòng)存儲(chǔ);
5)物聯(lián)網(wǎng)、貨幣聯(lián)網(wǎng)、RFID、GPS、GIS等醫(yī)院信息技術(shù)的應(yīng)用;
6)云計(jì)算、第三方數(shù)據(jù)處理技術(shù)、第三方平臺(tái)的應(yīng)用;
7)專業(yè)研究報(bào)告、行業(yè)資訊、行業(yè)活動(dòng)記錄;
8)其他大交互、大交易數(shù)據(jù)來(lái)源。
2.2類型繁多
醫(yī)院的大數(shù)據(jù)類型呈現(xiàn)出多樣化特點(diǎn),可以描述如下:
1)人的行為信息、習(xí)慣信息、偏好信息、交互數(shù)據(jù)等;
2)Web文本數(shù)據(jù)、流量分析數(shù)據(jù)、電商交易數(shù)據(jù)、使用者網(wǎng)上活動(dòng)數(shù)據(jù)等;
3)各類設(shè)施設(shè)備采集的數(shù)據(jù)如傳感器讀數(shù)、運(yùn)營(yíng)數(shù)據(jù)、實(shí)體數(shù)據(jù)、醫(yī)院信息、儀表讀數(shù)、監(jiān)控視頻數(shù)據(jù)等;
4)醫(yī)院內(nèi)部基干類系統(tǒng)和信息類系統(tǒng)所采集或處理的各類數(shù)據(jù)如輔助決策信息、運(yùn)營(yíng)數(shù)據(jù)、產(chǎn)品數(shù)據(jù)、供應(yīng)鏈數(shù)據(jù)、人力資源數(shù)據(jù)、財(cái)務(wù)數(shù)據(jù)、病人數(shù)據(jù)、呼叫記錄、市場(chǎng)數(shù)據(jù)等;
5)計(jì)算機(jī)使用數(shù)據(jù)和移動(dòng)設(shè)備使用數(shù)據(jù)等;
6)基礎(chǔ)地理位置信息、RFID讀取信息、GPS映射數(shù)據(jù)、圖像文件、醫(yī)院信息、時(shí)間與位置數(shù)據(jù)、貨幣數(shù)據(jù)、高分辨率影像、矢量、遙感及動(dòng)態(tài)監(jiān)測(cè)數(shù)據(jù)等;
7)CRM、KDD、DWH、流量監(jiān)測(cè)、查詢應(yīng)用、分析器等應(yīng)用數(shù)據(jù);
8)報(bào)告資訊、科研數(shù)據(jù)、調(diào)研數(shù)據(jù)、公共數(shù)據(jù)、公共信息。
2.3結(jié)構(gòu)多維,格式多樣
醫(yī)院的大數(shù)據(jù),可以從多個(gè)維度進(jìn)行解構(gòu):
1)結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)。醫(yī)院的大數(shù)據(jù)既包括存儲(chǔ)在數(shù)據(jù)庫(kù)里的結(jié)構(gòu)化數(shù)據(jù),也包括日志文件、XML文檔、JSON文檔和電子郵件等半結(jié)構(gòu)化數(shù)據(jù),而更多的數(shù)據(jù)類型是辦公文檔、文本、圖片、XML、HTML、各類報(bào)表、圖像和音頻/視頻信息等非結(jié)構(gòu)化數(shù)據(jù),半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)約占大數(shù)據(jù)總量75%~85%。
2)內(nèi)部數(shù)據(jù)與外部數(shù)據(jù)。醫(yī)院的大數(shù)據(jù)既有來(lái)自醫(yī)院經(jīng)營(yíng)的內(nèi)部交易數(shù)據(jù)、CRM數(shù)據(jù),也有來(lái)自其他數(shù)據(jù)源的外部數(shù)據(jù)。醫(yī)院的大數(shù)據(jù)兼具公共、私密二重屬性。外部數(shù)據(jù)的公共性特征比較明顯,而內(nèi)部數(shù)據(jù)由于和行業(yè)標(biāo)準(zhǔn)和商業(yè)機(jī)密密切相關(guān),因而具有私密性。
3)與數(shù)據(jù)結(jié)構(gòu)的多維特征相對(duì)應(yīng),醫(yī)院大數(shù)據(jù)的格式也是多樣的。除了傳統(tǒng)的紙質(zhì)文件、檔案、報(bào)表、表格、記錄、信函等之外,更多的是以數(shù)字?jǐn)?shù)據(jù)存在的Web文本、視頻、短信、音頻、視頻、郵件、存儲(chǔ)信息、配置文件、符號(hào)、圖片、檔案等。數(shù)據(jù)格式的多樣性和互不兼容、數(shù)據(jù)訪問(wèn)的隨機(jī)性,為數(shù)據(jù)的采集、存儲(chǔ)、分析、應(yīng)用帶來(lái)了困難。
在《大數(shù)據(jù)時(shí)代》一書(shū)中,作者提出“大數(shù)據(jù)的核心就是預(yù)測(cè)”。信息使用者通過(guò)收集大量的數(shù)據(jù),對(duì)其進(jìn)行加工處理,建立起數(shù)據(jù)的內(nèi)在發(fā)生發(fā)展規(guī)律,通過(guò)計(jì)算分析所獲得的有價(jià)值的信息成為企業(yè)預(yù)測(cè)顧客喜好、潮流趨勢(shì)、企業(yè)發(fā)展方向等事物的有力依據(jù),對(duì)企業(yè)管理者的決策有著極大的幫助。從這里可以看出信息就是一種資產(chǎn),對(duì)這種類型的資產(chǎn)來(lái)說(shuō),對(duì)其進(jìn)行加工精煉才是它的增值方式。具體到醫(yī)院的實(shí)際情況,就是研究如何應(yīng)用醫(yī)院產(chǎn)生的海量數(shù)據(jù),提取出有用的信息為醫(yī)院的管理者提供決策依據(jù),提升管理水平與服務(wù)質(zhì)量,具體有以下這些表現(xiàn)形式:
3.1數(shù)據(jù)中心
醫(yī)院信息化建設(shè)在保障與支持醫(yī)藥衛(wèi)生體制改革順利進(jìn)行、保證醫(yī)院可持續(xù)發(fā)展等方面的作用日益顯著。由于大型公立醫(yī)院信息化建設(shè)時(shí)期較長(zhǎng),各業(yè)務(wù)信息子系統(tǒng)分散,各數(shù)據(jù)庫(kù)模塊信息耦合困難,勢(shì)必會(huì)造成實(shí)時(shí)抓取數(shù)據(jù)真實(shí)性差、穩(wěn)定性差、關(guān)聯(lián)性差。因此,通過(guò)大數(shù)據(jù)集成平臺(tái)的建設(shè),能夠有效采集數(shù)據(jù)、高度集成數(shù)據(jù)、實(shí)時(shí)分析數(shù)據(jù),提高數(shù)據(jù)信息的準(zhǔn)確性和可利用性,實(shí)現(xiàn)醫(yī)院內(nèi)部各信息系統(tǒng)之間的數(shù)據(jù)整合、信息共享和流程協(xié)同,提高醫(yī)院管理水平[3]。
隨著醫(yī)療信息技術(shù)的迅猛發(fā)展及快速更新,信息量日益豐富,單純依靠各個(gè)醫(yī)療信息系統(tǒng)的歸口信息管理模式已遠(yuǎn)遠(yuǎn)不能滿足現(xiàn)代化醫(yī)院發(fā)展的步伐,醫(yī)療信息系統(tǒng)的交互與集成研究已經(jīng)成為建設(shè)全面、專業(yè)、集成和智能的數(shù)字化醫(yī)院的迫切需求。
構(gòu)建以臨床數(shù)據(jù)倉(cāng)庫(kù)為核心的全院數(shù)據(jù)中心平臺(tái),不僅可以實(shí)現(xiàn)醫(yī)院內(nèi)不同部門的、異構(gòu)信息系統(tǒng)間的臨床交換、共享、互操作和統(tǒng)一管理,而且能夠?qū)⑴R床業(yè)務(wù)和臨床用戶的需求與臨床數(shù)據(jù)的智能化應(yīng)用相結(jié)合,為醫(yī)院提供智能化臨床數(shù)據(jù)瀏覽的臨床醫(yī)生門戶、臨床管理數(shù)據(jù)分析門戶、臨床科研門戶以及患者健康門戶,實(shí)現(xiàn)各類集成業(yè)務(wù)應(yīng)用。全面集成的智能化信息系統(tǒng)必將實(shí)現(xiàn)醫(yī)院“人、財(cái)、物”“醫(yī)、教、研”基于統(tǒng)一平臺(tái)的協(xié)同管理,數(shù)據(jù)倉(cāng)庫(kù)和商業(yè)智能技術(shù)將使醫(yī)院領(lǐng)導(dǎo)者的決策得到真正的支持,有效提高醫(yī)院精細(xì)化管理水平,保障醫(yī)院健康可持續(xù)發(fā)展。
當(dāng)前,基于信息集成平臺(tái)的建設(shè)來(lái)實(shí)現(xiàn)醫(yī)院內(nèi)部績(jī)效的實(shí)時(shí)管理與評(píng)價(jià)、提高各管理層級(jí)的調(diào)控能力與決策水平具有重要發(fā)展前景,已成為廣大醫(yī)院信息建設(shè)的主攻方向。
3.2商業(yè)智能平臺(tái)
商業(yè)智能(BusinessIntelligence)運(yùn)用數(shù)據(jù)倉(cāng)庫(kù)、在線分析和數(shù)據(jù)挖掘等技術(shù)來(lái)處理和分析數(shù)據(jù),它允許用戶查詢和分析數(shù)據(jù)庫(kù)或數(shù)據(jù)倉(cāng)庫(kù),進(jìn)而得出影響醫(yī)療活動(dòng)的關(guān)鍵因素,最終幫助用戶做出更好、更合理的決策,最終目的是為決策者提供決策支持將數(shù)據(jù)變?yōu)橹R(shí)[4]。
隨著醫(yī)院信息化的快速發(fā)展,信息系統(tǒng)積累了海量的管理與醫(yī)療數(shù)據(jù),但在信息資源的開(kāi)發(fā)應(yīng)用方面,普遍存在以下問(wèn)題:原始信息多、加工整理少;孤立分散多、聯(lián)合共享少;為宏觀服務(wù)多、為微觀服務(wù)少;靜態(tài)信息多、動(dòng)態(tài)信息少。如何整合醫(yī)院中的各類信息資源,進(jìn)行有效的開(kāi)發(fā)利用,構(gòu)建一個(gè)以患者為核心,覆蓋廣泛的應(yīng)用領(lǐng)域,面向不同信息使用者的數(shù)據(jù)分析平臺(tái)就顯得尤為迫切。
商業(yè)智能可以幫助醫(yī)院的管理層進(jìn)行快速,準(zhǔn)確的決策,迅速的發(fā)現(xiàn)醫(yī)院業(yè)務(wù)中的問(wèn)題,提示管理人員加以解決。但商業(yè)智能軟件系統(tǒng)不能代替管理人員進(jìn)行決策,不能自動(dòng)處理醫(yī)院運(yùn)行過(guò)程中遇到的問(wèn)題。因此商業(yè)智能系統(tǒng)并不能為醫(yī)院帶來(lái)直接的經(jīng)濟(jì)效益,但必須看到,商業(yè)智能為醫(yī)院帶來(lái)的是一種經(jīng)過(guò)科學(xué)武裝的管理思維,給整個(gè)醫(yī)院帶來(lái)的是決策的快速性和準(zhǔn)確性,發(fā)現(xiàn)問(wèn)題的及時(shí)性,以及發(fā)現(xiàn)那些其他醫(yī)院未發(fā)現(xiàn)的潛在的知識(shí)和規(guī)律,而這些信息是醫(yī)院產(chǎn)生經(jīng)濟(jì)效益的基礎(chǔ)。不能快速,準(zhǔn)確地指定決策方針將造成病源流失,不能及時(shí)發(fā)現(xiàn)業(yè)務(wù)中的潛在信息等于浪費(fèi)自己的資源優(yōu)勢(shì)。比如:通過(guò)對(duì)病人就診數(shù)據(jù)的分析可發(fā)現(xiàn)各類病人的就診高峰時(shí)間以及用藥及治療信息,這樣就可進(jìn)行更有針對(duì)性的排班,或向某一類特定的病人提供更具有個(gè)性的服務(wù)推薦等,這都會(huì)為醫(yī)院帶來(lái)直接的經(jīng)濟(jì)效益。
3.3醫(yī)療科研管理
醫(yī)療科研管理信息化存在數(shù)據(jù)共享度比較低,科技產(chǎn)出數(shù)據(jù)零散不系統(tǒng),數(shù)據(jù)質(zhì)量不理想,信息化數(shù)據(jù)利用率低等問(wèn)題。將大數(shù)據(jù)概念以及技術(shù)引入到醫(yī)院的科研管理中,對(duì)積累的數(shù)據(jù)進(jìn)行重新利用,將現(xiàn)有的管理數(shù)據(jù)轉(zhuǎn)化為可供使用的知識(shí),以此提高科技管理水平和技術(shù)含量,能夠?yàn)楣芾聿块T決策提供客觀、科學(xué)、全面的參考。建立科學(xué)、高效的科研管理模式,優(yōu)化科研資源配置和提高科研計(jì)劃項(xiàng)目的管理績(jī)效,保障醫(yī)療科研事業(yè)的良性、健康發(fā)展,已經(jīng)成為當(dāng)前醫(yī)療科研管理體制改革的一項(xiàng)重要內(nèi)容,大數(shù)據(jù)方法在這一領(lǐng)域的實(shí)施具有廣泛的應(yīng)用前景[5]。
大數(shù)據(jù)環(huán)境下,隨著數(shù)據(jù)收集、存儲(chǔ)、分析技術(shù)的突破性發(fā)展,可以更加方便、快捷、動(dòng)態(tài)地獲得與研究對(duì)象有關(guān)的所有數(shù)據(jù),而不再因諸多限制不得不采用樣本研究方法,相應(yīng)地,思維方式也應(yīng)該從樣本思維轉(zhuǎn)向總體思維,從精確思維轉(zhuǎn)向容錯(cuò)思維,從而能夠更加全面、立體、系統(tǒng)地認(rèn)識(shí)總體狀況。對(duì)于臨床科研人員,信息需求發(fā)生顯著性的變化,研究對(duì)象從樣本數(shù)據(jù)變成全部數(shù)據(jù),為疾病全過(guò)程研究提供廣度信息展示、個(gè)性化信息推送和深度信息互動(dòng)。
在大數(shù)據(jù)時(shí)代,生物醫(yī)學(xué)研究模式已由原來(lái)的假設(shè)驅(qū)動(dòng)轉(zhuǎn)向數(shù)據(jù)驅(qū)動(dòng)。大數(shù)據(jù)研究應(yīng)關(guān)注歷史沉淀數(shù)據(jù)的挖掘,關(guān)注社交媒體與患者就診行為數(shù)據(jù),進(jìn)行更加準(zhǔn)確和個(gè)性化的患者行為分析,改善就診流程,提升就診體驗(yàn)。醫(yī)院管理、醫(yī)院營(yíng)銷、醫(yī)院規(guī)劃、醫(yī)院戰(zhàn)略、病患滿意度等無(wú)不與大數(shù)據(jù)關(guān)聯(lián)。通過(guò)挖掘這些信息,可以預(yù)測(cè)醫(yī)院市場(chǎng)需求,進(jìn)行智能化決策分析,從而制定更加行之有效的研究戰(zhàn)略。
大數(shù)據(jù)分析將為生命機(jī)制解讀、醫(yī)院管理、個(gè)性化醫(yī)療帶來(lái)革命。在醫(yī)學(xué)科研領(lǐng)域,信息化環(huán)境越來(lái)越復(fù)雜,使信息化資源由成本單元轉(zhuǎn)變?yōu)槔麧?rùn)單元并助力科研活動(dòng),將科研管理由精細(xì)化的數(shù)字管理引申到趨勢(shì)化的數(shù)據(jù)管理,聚合各種相關(guān)數(shù)據(jù)為科研目標(biāo)的凝練、科研方向的遴選等提供依據(jù),滿足知識(shí)創(chuàng)新需求等方面,這些問(wèn)題的解決為大數(shù)據(jù)應(yīng)用提供了強(qiáng)勁的內(nèi)生動(dòng)力。大數(shù)據(jù)已成為科技發(fā)展的競(jìng)爭(zhēng)戰(zhàn)略,利用大數(shù)據(jù)進(jìn)行科學(xué)研究和從事科研管理,建立科學(xué)、高效的科研管理模式,優(yōu)化科研資源配置和提高科研計(jì)劃項(xiàng)目的管理績(jī)效,保障醫(yī)院科研工作的良性、健康發(fā)展,并將其價(jià)值轉(zhuǎn)化成科研活動(dòng)的競(jìng)爭(zhēng)優(yōu)勢(shì),從而提高創(chuàng)新驅(qū)動(dòng)能力。
越來(lái)越多的醫(yī)院已經(jīng)意識(shí)到大數(shù)據(jù)的價(jià)值,針對(duì)這些數(shù)據(jù)的各種預(yù)測(cè)、分析、統(tǒng)計(jì)在醫(yī)院管理和決策的過(guò)程中正扮演越來(lái)越重要的角色。能夠更加充分利用大數(shù)據(jù)的醫(yī)院,必將在未來(lái)的競(jìng)爭(zhēng)中占得先機(jī),保持蓬勃的發(fā)展?jié)摿Α?/p>
[1] 王淑娟,石曉宇.大數(shù)據(jù)應(yīng)用對(duì)現(xiàn)代信息化醫(yī)院競(jìng)爭(zhēng)力的影響[J].現(xiàn)代醫(yī)院管理,2015,13(1):68-71.
[2] 林海文.大數(shù)據(jù)研究綜述[J].電腦知識(shí)與技術(shù),2015,11 (26):1-2.
[3] 吳正一,崔迎慧,陸耀,等.以臨床數(shù)據(jù)倉(cāng)庫(kù)為核心的醫(yī)院大數(shù)據(jù)平臺(tái)構(gòu)建[J].中國(guó)醫(yī)院管理,2015,35(11):13-15.
[4] 秦芳,高軼,孫仁峰,等.基于大數(shù)據(jù)的商業(yè)智能在醫(yī)院門診管理中的設(shè)計(jì)應(yīng)用[J].中國(guó)數(shù)字醫(yī)學(xué),2015,10(11):93-95.
[5] 張勝行,陳大鵬,凌小明.基于大數(shù)據(jù)視角的醫(yī)院科研管理[J].解放軍醫(yī)院管理雜志,2015,22(5):481-483.
F274