楊琳,李超,林麗華,紀(jì)婷婷
(上海計(jì)算機(jī)軟件技術(shù)開發(fā)中心,上海 201112)
基于IT治理的區(qū)域醫(yī)療衛(wèi)生大數(shù)據(jù)架構(gòu)研究
楊琳,李超,林麗華,紀(jì)婷婷
(上海計(jì)算機(jī)軟件技術(shù)開發(fā)中心,上海 201112)
十二五期間,區(qū)域醫(yī)療衛(wèi)生信息化建設(shè)取得顯著成果,信息化系統(tǒng)應(yīng)用過程中積累海量的醫(yī)療衛(wèi)生數(shù)據(jù)。醫(yī)療衛(wèi)生大數(shù)據(jù)中蘊(yùn)含著豐富的價值,通過有效的手段進(jìn)行分析、挖掘和利用能夠提高醫(yī)療衛(wèi)生服務(wù)水平。如何設(shè)計(jì)一套合理的區(qū)域醫(yī)療衛(wèi)生大數(shù)據(jù)架構(gòu),規(guī)劃醫(yī)療衛(wèi)生大數(shù)據(jù)價值實(shí)現(xiàn)路徑,成為當(dāng)前研究的熱點(diǎn)問題。結(jié)合區(qū)域醫(yī)療衛(wèi)生大數(shù)據(jù)現(xiàn)狀,借鑒IT治理的先進(jìn)方法及思路,提出基于IT治理的區(qū)域醫(yī)療衛(wèi)生大數(shù)據(jù)總體架構(gòu),并分別對數(shù)據(jù)架構(gòu)、技術(shù)架構(gòu)、應(yīng)用架構(gòu)以及安全體系進(jìn)行實(shí)現(xiàn)。該架構(gòu)設(shè)計(jì)方法為醫(yī)療衛(wèi)生領(lǐng)域大數(shù)據(jù)架構(gòu)設(shè)計(jì)提供一種思路,給出的區(qū)域醫(yī)療衛(wèi)生大數(shù)據(jù)架構(gòu)能夠?yàn)獒t(yī)療衛(wèi)生機(jī)構(gòu)規(guī)劃大數(shù)據(jù)應(yīng)用提供可參考的模型。
醫(yī)療衛(wèi)生大數(shù)據(jù);架構(gòu)研究;IT治理
當(dāng)前,高速發(fā)展的信息技術(shù)帶來了全球信息化浪潮,信息化已成為當(dāng)今世界發(fā)展的大趨勢,在社會和經(jīng)濟(jì)的發(fā)展過程中起著重要的作用。國內(nèi)外在推進(jìn)衛(wèi)生改革中,把衛(wèi)生信息化作為重要的技術(shù)支撐和手段[1]。在美國,促進(jìn)衛(wèi)生信息經(jīng)濟(jì)發(fā)展的重要舉措便是衛(wèi)生信息化,聯(lián)邦政府從衛(wèi)生信息化的組織保障、制度創(chuàng)新、衛(wèi)生信息系統(tǒng)設(shè)計(jì)以及對醫(yī)療服務(wù)供方采取一定的經(jīng)濟(jì)激勵約束機(jī)制等方面促進(jìn)信息技術(shù)在衛(wèi)生領(lǐng)域中的應(yīng)用。建立實(shí)用共享的醫(yī)療衛(wèi)生信息系統(tǒng)、加快信息標(biāo)準(zhǔn)化和公共服務(wù)信息平臺建設(shè)也成為了我國頒布的一系列醫(yī)改方案。國內(nèi)外對醫(yī)療衛(wèi)生信息化建設(shè)和發(fā)展寄予厚望:其一衛(wèi)生行業(yè)綜合管理的科學(xué)決策能力和水平的提高可以借由信息化手段實(shí)現(xiàn),其二醫(yī)改監(jiān)測、監(jiān)督和績效考核能力,提高衛(wèi)生服務(wù)效率的提升也依賴于信息化手段,進(jìn)而保障服務(wù)安全和提升服務(wù)質(zhì)量[2]。
隨著醫(yī)療衛(wèi)生信息化“十二五”規(guī)劃、“3521工程”等意見和方案的出臺,在基層醫(yī)療信息系統(tǒng)建設(shè)指導(dǎo)意見等政策的指導(dǎo)下,我國醫(yī)療信息化建設(shè)腳步越來越快。目前,全國已有14個省份、107個地市建立了省級、地市級衛(wèi)生信息平臺,居民健康卡試點(diǎn)工作已在29個省份開展,區(qū)域內(nèi)醫(yī)療衛(wèi)生系統(tǒng)互聯(lián)互通已在不同程度地實(shí)現(xiàn)了。目前已有2000多家醫(yī)療機(jī)構(gòu)開展遠(yuǎn)程醫(yī)療,二級以上醫(yī)療機(jī)構(gòu)均開展電子病歷建設(shè)。在“十三五”期間,我國醫(yī)療信息化建設(shè)任務(wù)較重,重點(diǎn)還將圍繞全員人口信息數(shù)據(jù)庫、電子病歷數(shù)據(jù)庫、電子健康檔案數(shù)據(jù)庫3大數(shù)據(jù)庫,國家、省、地市和縣的4級區(qū)域人口健康信息平臺,6大類業(yè)務(wù)應(yīng)用等方面展開。
在信息化基礎(chǔ)上積累的大數(shù)據(jù)已成為促進(jìn)區(qū)域醫(yī)療衛(wèi)生發(fā)展的基礎(chǔ)性戰(zhàn)略資源,未來三大數(shù)據(jù)庫的建設(shè)也充分表明基于大數(shù)據(jù)的醫(yī)療健康應(yīng)用越來越受到重視。但是目前并沒有一個針對區(qū)域醫(yī)療衛(wèi)生大數(shù)據(jù)架構(gòu)的完整、長期以及統(tǒng)一的規(guī)劃。IT治理以其先進(jìn)的理念和方法,能夠使組織從IT中獲得最大價值,借鑒其理念和方法應(yīng)用到醫(yī)療衛(wèi)生大數(shù)據(jù)架構(gòu)規(guī)劃設(shè)計(jì)中,能夠產(chǎn)生新的思路和價值。本文重點(diǎn)研究了基于IT治理的區(qū)域醫(yī)療衛(wèi)生大數(shù)據(jù)架構(gòu)設(shè)計(jì)方法,從總體上對區(qū)域醫(yī)療衛(wèi)生大數(shù)據(jù)架構(gòu)進(jìn)行了規(guī)劃和設(shè)計(jì),并分別對數(shù)據(jù)架構(gòu)、技術(shù)架構(gòu)、應(yīng)用架構(gòu)以及安全體系進(jìn)行具體的實(shí)現(xiàn),為未來區(qū)域醫(yī)療衛(wèi)生大數(shù)據(jù)資源建設(shè)以及挖掘利用提供了參考。
1.1 IT治理概述
信息時代,公司治理的內(nèi)涵有了重要表現(xiàn)和發(fā)展,IT治理成為了治理的重要內(nèi)容[3]。IT治理用于描述企業(yè)或政府是否采用有效的機(jī)制,使得IT的應(yīng)用能夠完成組織賦予它的使命,同時平衡信息技術(shù)與過程的風(fēng)險、確保實(shí)現(xiàn)組織的戰(zhàn)略目標(biāo)。許多研究者基于他們自己的研究和理解,看待IT治理的視角各不相同,對IT治理亦有不同的描述:
Weill、Peterson等人認(rèn)為“IT治理是在IT應(yīng)用過程中,為鼓勵期望行為而明確決策權(quán)歸屬和責(zé)任擔(dān)當(dāng)?shù)目蚣堋保麄儗⒉渴餓T決策權(quán)看作是IT治理的重點(diǎn)內(nèi)容,Weill更是強(qiáng)調(diào)IT治理旨在解決IT決策權(quán)力的分布問題。ITGI(全球IT治理研究中心)、Hoffman等認(rèn)為“IT治理是董事會和執(zhí)行層的責(zé)任,通過領(lǐng)導(dǎo)、組織和過程來保證IT實(shí)現(xiàn)和推動企業(yè)戰(zhàn)略目標(biāo)。價值、風(fēng)險與控制是IT治理的核心?!彼麄儚?qiáng)調(diào)IT治理中的控制因素,主要研究思想是平衡IT風(fēng)險與回報,控制企業(yè)IT資源的運(yùn)用,實(shí)現(xiàn)IT資源的有效性和效率。通過平衡IT資源及IT過程的風(fēng)險與回報,有助于降低IT成本,提升IT投資價值。Gartner公司則認(rèn)為IT治理是一種商業(yè)范式,它是由戰(zhàn)略競爭力、全球化、業(yè)務(wù)流程共享和實(shí)時的企業(yè)創(chuàng)新需求所驅(qū)動而產(chǎn)生的。
ITSS分會(中國電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會信息技術(shù)服務(wù)分會)認(rèn)為“IT治理是專注于信息技術(shù)體系及其績效和風(fēng)險管理的一組治理規(guī)則,由領(lǐng)導(dǎo)關(guān)系、組織結(jié)構(gòu)和過程組成,以確保信息技術(shù)能夠支撐組織的戰(zhàn)略目標(biāo)?!?/p>
基于各不相同的IT治理思想,風(fēng)格迥異的IT治理模型或框架也被研究者們提出。參考ITSS分會對IT治理的定義,我們得到IT治理模型如圖1所示,治理主體通過評估、指導(dǎo)、監(jiān)督的治理方法完成治理過程。
1.2 基于IT治理的大數(shù)據(jù)架構(gòu)設(shè)計(jì)方法
各衛(wèi)生服務(wù)機(jī)構(gòu)的業(yè)務(wù)系統(tǒng)通常由不同的信息化服務(wù)商提供,并擁有多個業(yè)務(wù)系統(tǒng),在系統(tǒng)的互聯(lián)互通及數(shù)據(jù)規(guī)范化方面缺乏統(tǒng)一標(biāo)準(zhǔn)。醫(yī)療衛(wèi)生機(jī)構(gòu)業(yè)務(wù)的快速發(fā)展,催生了對信息系統(tǒng)各種新的需求,業(yè)務(wù)過程中積累的數(shù)據(jù)量也越來越多,數(shù)據(jù)量越來越大,需要大量存儲與計(jì)算資源,使得數(shù)據(jù)應(yīng)用的成本越來越高,系統(tǒng)的可維護(hù)性和運(yùn)行效率越來越差。如何提升對數(shù)據(jù)的采集、分析、應(yīng)用能力,保障信息系統(tǒng)的有效性,促進(jìn)信息系統(tǒng)和公眾健康醫(yī)療數(shù)據(jù)互聯(lián)融合、開放共享,使得大數(shù)據(jù)架構(gòu)設(shè)計(jì)成為信息化過程中關(guān)注的熱點(diǎn)。因此我們提出了基于IT治理的大數(shù)據(jù)架構(gòu)設(shè)計(jì)方法,以IT戰(zhàn)略為指導(dǎo),從信息系統(tǒng)整體視角進(jìn)行大數(shù)據(jù)架構(gòu)設(shè)計(jì),使得信息系統(tǒng)處理能力與醫(yī)療健康大數(shù)據(jù)應(yīng)用需求相匹配。
圖1 IT治理模型
IT治理的治理方法包括評估、指導(dǎo)、監(jiān)督。評估是考慮組織內(nèi)部需求和外部壓力,評估組織當(dāng)前和將來對IT應(yīng)用的需求及能力,并隨著業(yè)務(wù)需求、環(huán)境壓力的變化,持續(xù)評估[4];指導(dǎo)是對IT治理的相關(guān)職責(zé)進(jìn)行分配,對IT治理戰(zhàn)略的準(zhǔn)備和實(shí)施、信息技術(shù)及其應(yīng)用管理體系的管理方案和規(guī)劃進(jìn)行指導(dǎo);監(jiān)督是對組織IT管理和應(yīng)用的績效進(jìn)行監(jiān)控,確保與IT有關(guān)的戰(zhàn)略被正確執(zhí)行、IT管理和應(yīng)用符合內(nèi)外部要求。
架構(gòu)開發(fā)方法ADM(Architecture Development Method)是TOGAF架構(gòu)研究和設(shè)計(jì)的核心[5],是一個以需求為中心的循環(huán)流程。主要包括架構(gòu)愿景、業(yè)務(wù)架構(gòu)、技術(shù)架構(gòu)、信息系統(tǒng)架構(gòu)、機(jī)會及解決方案、遷移規(guī)劃、架構(gòu)變更管理、實(shí)施治理、需求管理九大流程。結(jié)合IT治理的思路,在大數(shù)據(jù)架構(gòu)設(shè)計(jì)方法中,我們把架構(gòu)開發(fā)流程劃分為規(guī)劃、實(shí)施和應(yīng)用三個階段,治理實(shí)施不再單獨(dú)作為一個流程,而是融合在整個架構(gòu)開發(fā)的過程中。在明確了總體戰(zhàn)略/IT治理目標(biāo)后,應(yīng)用IT治理的方法對業(yè)務(wù)需求、能力現(xiàn)狀、規(guī)劃方案進(jìn)行評估,對實(shí)施過程進(jìn)行指導(dǎo),對應(yīng)用過程進(jìn)行監(jiān)督,并且對應(yīng)用成效進(jìn)行持續(xù)的評估和反饋,作為IT規(guī)劃設(shè)計(jì)的一個輸入。其中規(guī)劃包括需求管理、業(yè)務(wù)架構(gòu)、架構(gòu)愿景三大流程;實(shí)施包括數(shù)據(jù)架構(gòu)、技術(shù)架構(gòu)、應(yīng)用架構(gòu)、安全體系四大流程;應(yīng)用包括應(yīng)急聯(lián)動、疫情監(jiān)測、疾病預(yù)測等。大數(shù)據(jù)架構(gòu)設(shè)計(jì)方法見圖2。
圖2 基于IT治理的區(qū)域醫(yī)療衛(wèi)生大數(shù)據(jù)架構(gòu)設(shè)計(jì)方法
在架構(gòu)開發(fā)的規(guī)劃、實(shí)施和應(yīng)用三個階段,每個階段的具體任務(wù)包括:
(1)規(guī)劃階段
評估規(guī)劃階段的三大流程,確保規(guī)劃形成的結(jié)果與總體戰(zhàn)略保持一致。
需求管理:查找、記錄、組織和跟蹤系統(tǒng)需求變更,并在系統(tǒng)需求變更上使不同部門保持一致,進(jìn)而可以維護(hù)清晰明確的需求闡述、每種需求類型所適用的屬性,以及與其他需求和其他項(xiàng)目工作之間的可追蹤性。
架構(gòu)愿景:用于明確組織的架構(gòu)遠(yuǎn)景。架構(gòu)愿景利用業(yè)務(wù)推動者明確組織架構(gòu)工作的目的,并且創(chuàng)建基線和目標(biāo)架構(gòu)的粗略描述。如果業(yè)務(wù)目標(biāo)不清楚,那么該階段中的一部分工作是來幫助業(yè)務(wù)人員確定其關(guān)鍵的目的和相應(yīng)的過程。
業(yè)務(wù)架構(gòu):詳述關(guān)于業(yè)務(wù)領(lǐng)域架構(gòu)的工作。架構(gòu)愿景中概括的基線和目標(biāo)架構(gòu)在此被詳細(xì)說明,從而使它們作為技術(shù)分析的有用輸入。業(yè)務(wù)架構(gòu)采用的技術(shù)有業(yè)務(wù)過程建模、業(yè)務(wù)目標(biāo)建模、用例建模以及差距分析等。
(2)實(shí)施階段
按照總體戰(zhàn)略/IT治理目標(biāo)要求,指導(dǎo)實(shí)施階段四大流程工作的開展。
數(shù)據(jù)架構(gòu):重點(diǎn)考慮大數(shù)據(jù)價值,基于此方面產(chǎn)生的流程出發(fā),明確在大數(shù)據(jù)全生命周期諸如采集、傳輸、存儲、分析挖掘以及應(yīng)用過程中數(shù)據(jù)的數(shù)據(jù)流動情況[6],定義實(shí)體對象的數(shù)據(jù)表示和描述、數(shù)據(jù)存儲、數(shù)據(jù)分析的方式及過程,以及數(shù)據(jù)交換機(jī)制、數(shù)據(jù)接口等內(nèi)容。
技術(shù)架構(gòu):技術(shù)架構(gòu)是大樹價值實(shí)現(xiàn)的關(guān)鍵保障,是從技術(shù)視角研究和分析大數(shù)據(jù)的獲取、管理、分布式處理和應(yīng)用等[7]。大數(shù)據(jù)的技術(shù)架構(gòu)與具體實(shí)現(xiàn)的技術(shù)平臺和框架息息相關(guān),不同的技術(shù)平臺決定了不同的技術(shù)架構(gòu)和實(shí)現(xiàn)。
應(yīng)用架構(gòu):應(yīng)用架構(gòu)描述了主流的大數(shù)據(jù)應(yīng)用系統(tǒng)和模式所具備的功能,以及這些功能之間的關(guān)系[8],主要體現(xiàn)在圍繞醫(yī)療衛(wèi)生大數(shù)據(jù)的應(yīng)用如疫情監(jiān)測、宏觀規(guī)劃、疾病分布及預(yù)測等,以及為支撐相關(guān)應(yīng)用所必須的數(shù)據(jù)倉庫、數(shù)據(jù)分析和挖掘、大數(shù)據(jù)相關(guān)技術(shù)等方面。
安全體系:數(shù)據(jù)的安全性直接關(guān)系到大數(shù)據(jù)業(yè)務(wù)能否全面地推廣,通過安全體系建設(shè)保障大數(shù)據(jù)平臺及其中數(shù)據(jù)的安全性。組織自身大數(shù)據(jù)環(huán)境所面臨的安全威脅需進(jìn)一步明確,由技術(shù)層面到管理層面應(yīng)用多種策略加強(qiáng)安全防護(hù)能力,提升大數(shù)據(jù)應(yīng)用過程中及其平臺安全性。
(3)應(yīng)用階段
按照總體戰(zhàn)略/IT治理目標(biāo),對不同的場景下基于大數(shù)據(jù)的應(yīng)用成效進(jìn)行監(jiān)督和評價,并將評價結(jié)果反饋至需求管理流程,為后期大數(shù)據(jù)架構(gòu)的完善提供參考。醫(yī)療衛(wèi)生大數(shù)據(jù)應(yīng)用包括應(yīng)急聯(lián)動、疫情監(jiān)測以及疾病預(yù)測等[9-10]。
區(qū)域醫(yī)療衛(wèi)生大數(shù)據(jù)總體架構(gòu)是在IT治理/標(biāo)準(zhǔn)和安全體系的支撐下,由區(qū)域醫(yī)療衛(wèi)生IT戰(zhàn)略/數(shù)據(jù)戰(zhàn)略、應(yīng)用架構(gòu)與技術(shù)架構(gòu)、數(shù)據(jù)架構(gòu)、基礎(chǔ)設(shè)施四個層面構(gòu)成。通過IT治理/標(biāo)準(zhǔn)的實(shí)施,確保由醫(yī)療衛(wèi)生IT戰(zhàn)略/數(shù)據(jù)戰(zhàn)略指導(dǎo)應(yīng)用架構(gòu)與基礎(chǔ)設(shè)施、技術(shù)架構(gòu)、數(shù)據(jù)架構(gòu)三個層面的規(guī)劃建設(shè),安全體系為三個層面的安全性提供保障,最終實(shí)現(xiàn)醫(yī)療衛(wèi)生IT戰(zhàn)略/數(shù)據(jù)戰(zhàn)略目標(biāo)。區(qū)域醫(yī)療衛(wèi)生大數(shù)據(jù)總體架構(gòu)如圖3所示。
圖3 區(qū)域醫(yī)療衛(wèi)生大數(shù)據(jù)架構(gòu)實(shí)施框架示意圖
區(qū)域醫(yī)療衛(wèi)生IT戰(zhàn)略/數(shù)據(jù)戰(zhàn)略:規(guī)定了浦東新區(qū)醫(yī)療衛(wèi)生發(fā)展信息化戰(zhàn)略和大數(shù)據(jù)應(yīng)用的目標(biāo),是設(shè)計(jì)大數(shù)據(jù)架構(gòu)的基礎(chǔ)。
IT治理/標(biāo)準(zhǔn):明確區(qū)域醫(yī)療衛(wèi)生IT戰(zhàn)略和數(shù)據(jù)戰(zhàn)略目標(biāo),定義治理團(tuán)隊(duì)的組織結(jié)構(gòu)、權(quán)責(zé)分配,對各個層面的規(guī)劃實(shí)施結(jié)果提出要求。
數(shù)據(jù)架構(gòu):規(guī)劃區(qū)域醫(yī)療衛(wèi)生信息化中的各主題數(shù)據(jù)庫,定義各主題數(shù)據(jù)庫及其之間的關(guān)系,提出數(shù)據(jù)的采集、加工、分布和利用機(jī)制。
技術(shù)架構(gòu):定義了大數(shù)據(jù)價值實(shí)現(xiàn)過程中各個環(huán)節(jié)的技術(shù)要點(diǎn)、技術(shù)規(guī)范,技術(shù)架構(gòu)作為較為重要的方面,是對應(yīng)用架構(gòu)和數(shù)據(jù)架構(gòu)的支撐。
應(yīng)用架構(gòu):規(guī)劃區(qū)域醫(yī)療衛(wèi)生大數(shù)據(jù)應(yīng)用的架構(gòu)。描述了區(qū)域醫(yī)療衛(wèi)生應(yīng)用系統(tǒng)和模式所具備的功能,定義各應(yīng)用與信息資源的關(guān)系、與業(yè)務(wù)的支撐關(guān)系。
安全體系:定義大數(shù)據(jù)架構(gòu)的安全方面的需求,例如安全規(guī)劃模型、安全等級和安全評估保障機(jī)制等。
基礎(chǔ)設(shè)施:規(guī)劃區(qū)域醫(yī)療衛(wèi)生信息化中的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)、主要計(jì)算和存儲服務(wù)器,包括網(wǎng)絡(luò)交換分層規(guī)劃、計(jì)算與存儲匯聚點(diǎn)的分布、IP地址規(guī)劃、基礎(chǔ)IT設(shè)施所采用的主要平臺及技術(shù)。
大數(shù)據(jù)架構(gòu)的研究和實(shí)現(xiàn)主要是在領(lǐng)域分析和建模的基礎(chǔ)上,因此,區(qū)域醫(yī)療衛(wèi)生大數(shù)據(jù)架構(gòu)實(shí)現(xiàn)包括數(shù)據(jù)架構(gòu)、技術(shù)架構(gòu)、應(yīng)用架構(gòu),同時安全體系作為保障,支撐架構(gòu)的實(shí)現(xiàn)和安全運(yùn)行。
3.1 數(shù)據(jù)架構(gòu)
數(shù)據(jù)架構(gòu)作為醫(yī)療衛(wèi)生機(jī)構(gòu)不得不面臨的數(shù)據(jù)量問題,主要研究大數(shù)據(jù)采集、存儲、分析以及應(yīng)用過程中的數(shù)據(jù)表現(xiàn)形式以及支持各種業(yè)務(wù)應(yīng)用的數(shù)據(jù)來源,數(shù)據(jù)定義的規(guī)范、使用方法等,明確數(shù)據(jù)流轉(zhuǎn)關(guān)系及各模塊之間傳輸、交換及共享的數(shù)據(jù)。
圖4 區(qū)域醫(yī)療衛(wèi)生數(shù)據(jù)架構(gòu)圖
由圖可知,區(qū)域醫(yī)療衛(wèi)生信息化業(yè)務(wù)系統(tǒng)將產(chǎn)生各種數(shù)據(jù)信息,包括醫(yī)院管理信息、臨床信息、醫(yī)療圖像信息等,以及其他文檔資源等,這些數(shù)據(jù)通過數(shù)據(jù)總線,按照相關(guān)規(guī)范匯聚傳輸,統(tǒng)一存儲到數(shù)據(jù)中心中。數(shù)據(jù)中心的數(shù)據(jù)信息經(jīng)過數(shù)據(jù)抽取、轉(zhuǎn)換和加載等數(shù)據(jù)的整理,即把醫(yī)療衛(wèi)生機(jī)構(gòu)核心業(yè)務(wù)的數(shù)據(jù)從各個應(yīng)用系統(tǒng)和未利用的信息資源文件中抽取出來,然后在數(shù)據(jù)規(guī)范的指導(dǎo)下,統(tǒng)一數(shù)據(jù)表達(dá),剔除冗余數(shù)據(jù),最后建立起數(shù)據(jù)倉庫。數(shù)據(jù)倉庫中的數(shù)據(jù)不再是業(yè)務(wù)流程的數(shù)據(jù),而是一個個事實(shí)的描述,再根據(jù)數(shù)據(jù)分析或挖掘的不同主題,建立相對應(yīng)的數(shù)據(jù)集市。數(shù)據(jù)集市中的數(shù)據(jù)高度匯總又包含各個維度,非常有利于數(shù)據(jù)分析挖掘,進(jìn)行產(chǎn)生應(yīng)用及展示。
3.2 技術(shù)架構(gòu)
技術(shù)架構(gòu)定義了如何建立一個服務(wù)運(yùn)行環(huán)境來支持?jǐn)?shù)據(jù)和應(yīng)用架構(gòu),以保證業(yè)務(wù)的正常開展。技術(shù)架構(gòu)設(shè)計(jì)結(jié)果能夠提供對數(shù)據(jù)和應(yīng)用的支持并保持一致。
由圖可知,區(qū)域醫(yī)療衛(wèi)生信息化系統(tǒng)產(chǎn)生的數(shù)據(jù)經(jīng)過梳理、傳輸、存儲到數(shù)據(jù)庫中,結(jié)構(gòu)化數(shù)據(jù)可以采用傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)庫進(jìn)行存儲操作,非結(jié)構(gòu)化數(shù)據(jù)采用分布式存儲技術(shù)進(jìn)行存儲操作。數(shù)據(jù)處理是數(shù)據(jù)應(yīng)用的關(guān)鍵一步,利用Hadoop、Spark等工具及技術(shù)進(jìn)行數(shù)據(jù)的挖掘分析操作,支撐報表、統(tǒng)計(jì)分析、挖掘預(yù)測等功能。
圖5 區(qū)域醫(yī)療衛(wèi)生大數(shù)據(jù)技術(shù)架構(gòu)圖
數(shù)據(jù)抽取采用ETL技術(shù)手段,ETL(Extract-Transform-Load)是構(gòu)建數(shù)據(jù)倉庫的重要一環(huán)。現(xiàn)實(shí)世界中,數(shù)據(jù)來源復(fù)雜,產(chǎn)生了許多臟數(shù)據(jù),用戶從數(shù)據(jù)源抽取出所需的數(shù)據(jù),經(jīng)過數(shù)據(jù)清洗等數(shù)據(jù)預(yù)處理工作,最終按照預(yù)先定義好的數(shù)據(jù)倉庫模型,將數(shù)據(jù)加載到數(shù)據(jù)倉庫中去。ETL包含三個方面:“抽取”從原始的業(yè)務(wù)系統(tǒng)中讀取出來原始數(shù)據(jù),這是所有工作的前提和起點(diǎn);“轉(zhuǎn)換”按照預(yù)先設(shè)計(jì)好的規(guī)則將前一階段抽取得數(shù)據(jù)進(jìn)行轉(zhuǎn)換,消除數(shù)據(jù)的多源異構(gòu)特性,使本來異構(gòu)的數(shù)據(jù)格式能統(tǒng)一起來;“裝載”即是完成進(jìn)入到數(shù)據(jù)倉庫中的工作,即將轉(zhuǎn)換完的數(shù)據(jù)按計(jì)劃增量或全部導(dǎo)入到數(shù)據(jù)倉庫中。
非結(jié)構(gòu)化或半結(jié)構(gòu)化數(shù)據(jù)越來越多的存在與醫(yī)療衛(wèi)生領(lǐng)域當(dāng)中,同時對于醫(yī)療衛(wèi)生服務(wù)具有較為重要的價值,非結(jié)構(gòu)化數(shù)據(jù)的存儲、處理等是當(dāng)前需要考慮的問題。我們采用分布式數(shù)據(jù)存儲技術(shù)處理采集到的非結(jié)構(gòu)化數(shù)據(jù),與目前常見的集中式存儲技術(shù)是將數(shù)據(jù)存儲在某個或多個特定的節(jié)點(diǎn)上,而分布式存儲技術(shù)是通過網(wǎng)絡(luò)使用機(jī)構(gòu)中的每臺機(jī)器上的磁盤空間,并將這些分散的存儲資源構(gòu)成一個虛擬的存儲設(shè)備,在機(jī)構(gòu)的各個角落分散的存儲數(shù)據(jù)。而對于傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)是一種用戶定義的數(shù)據(jù)類型,它包含了一系列的屬性,每一個屬性都有一個數(shù)據(jù)類型,存儲在關(guān)系數(shù)據(jù)庫里,可以用二維表結(jié)構(gòu)來表達(dá)實(shí)現(xiàn)的數(shù)據(jù)。
分布式大數(shù)據(jù)處理是醫(yī)療衛(wèi)生信息資源利用的重要一步,在醫(yī)療衛(wèi)生數(shù)據(jù)中應(yīng)用的數(shù)據(jù)挖掘處理技術(shù)對于提高整個醫(yī)療衛(wèi)生行業(yè)水平是相當(dāng)有益的。目前在醫(yī)療衛(wèi)生領(lǐng)域應(yīng)用較為廣泛的有決策樹、支持向量機(jī)、回歸分析、數(shù)據(jù)倉庫與OLAP分析、粗糙集理論以及聚類分析等。
數(shù)據(jù)挖掘處理的結(jié)果需要借助于數(shù)據(jù)展示技術(shù)來更加形象化、多樣化的顯示其價值和意義,在此可采用可視化技術(shù)、報表、統(tǒng)計(jì)分析、預(yù)測圖等方式實(shí)現(xiàn)。
3.3 應(yīng)用架構(gòu)
大數(shù)據(jù)應(yīng)用是其價值的最終體現(xiàn),應(yīng)用架構(gòu)描述了區(qū)域醫(yī)療衛(wèi)生應(yīng)用系統(tǒng)和模式所具備的功能,以及這些功能之間的關(guān)系,主要體現(xiàn)在圍繞醫(yī)療衛(wèi)生大數(shù)據(jù)應(yīng)用如疫情監(jiān)測、宏觀規(guī)劃、疾病分布及預(yù)測等,以及作為支撐相關(guān)應(yīng)用所必須的數(shù)據(jù)倉庫、數(shù)據(jù)分析與挖掘、大數(shù)據(jù)相關(guān)技術(shù)等方面。
區(qū)域醫(yī)療衛(wèi)生大數(shù)據(jù)應(yīng)用架構(gòu)如下:
圖6 區(qū)域醫(yī)療衛(wèi)生大數(shù)據(jù)應(yīng)用架構(gòu)圖
區(qū)域醫(yī)療衛(wèi)生大數(shù)據(jù)應(yīng)用架構(gòu)以大數(shù)據(jù)資源存儲基礎(chǔ)設(shè)施、數(shù)據(jù)倉庫、大數(shù)據(jù)分析與挖掘等為基礎(chǔ),結(jié)合大數(shù)據(jù)分析、挖掘、展示等技術(shù),實(shí)現(xiàn)疫情監(jiān)測、宏觀規(guī)劃、應(yīng)急聯(lián)動、疾病分布、疾病預(yù)測等應(yīng)用。
疫情監(jiān)測:大數(shù)據(jù)時代,數(shù)據(jù)、統(tǒng)計(jì)、理性思考等為人類對疫情監(jiān)測及防控帶來了新的方法和路徑。在某疫情爆發(fā)區(qū),通過對醫(yī)療衛(wèi)生大數(shù)據(jù)抽取,采用實(shí)時分析算法及模型,對整個區(qū)域疫情的發(fā)展態(tài)勢、嚴(yán)重程度等保持時刻關(guān)注,為疫情應(yīng)對提供決策支持。
宏觀規(guī)劃:醫(yī)療衛(wèi)生大數(shù)據(jù)中涵蓋方方面面的病人、醫(yī)院、藥品等信息,通過深入分析和挖掘,能夠?yàn)獒t(yī)療衛(wèi)生管理機(jī)構(gòu)規(guī)劃及管理提供決策支持。例如在醫(yī)院的選址研究中,通過分析病人地址區(qū)域、醫(yī)院位置信息以及結(jié)合其他交通等信息,為醫(yī)院的選址建設(shè)提供決策建議。
應(yīng)急聯(lián)動:當(dāng)某地發(fā)生突發(fā)醫(yī)療衛(wèi)生情況時,通過相關(guān)醫(yī)療衛(wèi)生數(shù)據(jù)的分析,統(tǒng)籌協(xié)調(diào)區(qū)域醫(yī)療衛(wèi)生機(jī)構(gòu)對突發(fā)情況進(jìn)行處置,合理安排及分配醫(yī)療衛(wèi)生資源,提高突發(fā)情況處置效率及處理效果。
疾病分布:通過大量醫(yī)療衛(wèi)生數(shù)據(jù)信息,描述疾病事件在什么時間、地區(qū)、人群中發(fā)生以及發(fā)生多少的現(xiàn)象,流行病學(xué)中簡稱“三間分布”。從數(shù)據(jù)倉庫中,抽取出相應(yīng)的數(shù)據(jù)庫表,通過分析方法,建立疾病分布模型數(shù)據(jù)庫,基于疾病分布模型數(shù)據(jù)庫進(jìn)行挖掘和分析,得出疾病的分布信息。
疾病預(yù)測:流行病的發(fā)生和傳播有一定的規(guī)律性,與人群分布、氣候以及環(huán)境指數(shù)等因素密切相關(guān)。通過挖掘醫(yī)療衛(wèi)生數(shù)據(jù)內(nèi)部特征,結(jié)合外部因素(氣溫、人口、環(huán)境指數(shù)等),可形成相應(yīng)流行疾病的預(yù)測模型,有利于醫(yī)療衛(wèi)生機(jī)構(gòu)提前做好部署,提醒市民防范。
3.4 安全體系
安全體系支撐大數(shù)據(jù)架構(gòu)的安全實(shí)施,保障醫(yī)療衛(wèi)生大數(shù)據(jù)應(yīng)用環(huán)境安全,具體可分為數(shù)據(jù)存儲、數(shù)據(jù)傳輸、數(shù)據(jù)應(yīng)用以及數(shù)據(jù)管理等方面。
圖7 區(qū)域醫(yī)療衛(wèi)生大數(shù)據(jù)安全體系圖
醫(yī)療衛(wèi)生數(shù)據(jù)量本來就很大,近年來隨著業(yè)務(wù)的增長,醫(yī)療衛(wèi)生服務(wù)水平的提升,數(shù)據(jù)量呈非線性增長,數(shù)據(jù)集中存儲在一起且復(fù)雜多樣,多種應(yīng)用的并發(fā)運(yùn)行及頻繁無序的使用狀況,產(chǎn)生了數(shù)據(jù)類別存放錯位、數(shù)據(jù)丟失等問題。存儲備份是保護(hù)數(shù)據(jù)存儲安全的重要環(huán)節(jié),身份驗(yàn)證能夠確定誰正在對數(shù)據(jù)尤其是敏感數(shù)據(jù)進(jìn)行訪問,可以有效地應(yīng)對數(shù)據(jù)存儲安全問題。
數(shù)據(jù)傳輸過程中一旦出現(xiàn)安全漏洞,容易使得數(shù)據(jù)泄露,數(shù)據(jù)被盜用,造成較大損失。數(shù)據(jù)掩蔽是保護(hù)數(shù)據(jù)安全的有效手段,這些數(shù)據(jù)通過加密或斷詞被屏蔽等進(jìn)行傳輸安全控制,加強(qiáng)傳輸安全可控性。核心數(shù)據(jù)的加密防護(hù)是增強(qiáng)大數(shù)據(jù)安全的重心,加強(qiáng)對敏感關(guān)鍵數(shù)據(jù)的加密保護(hù),使任何未經(jīng)授權(quán)許可的用戶無法解密獲取到實(shí)際的數(shù)據(jù)內(nèi)容,能夠有效地保護(hù)數(shù)據(jù)信息安全。
大數(shù)據(jù)應(yīng)用往往具有海量用戶及跨平臺特性,這在一定程度上會帶來較大的風(fēng)險,因此在數(shù)據(jù)使用,特別是大數(shù)據(jù)應(yīng)用方面應(yīng)加強(qiáng)授權(quán)控制,保護(hù)數(shù)據(jù)的應(yīng)用安全。數(shù)據(jù)應(yīng)用中,通過訪問控制技術(shù),防止非授權(quán)訪問和使用受保護(hù)的數(shù)據(jù)資源,近年來于屬性的訪問控制模型、基于任務(wù)的訪問控制模型和基于角色的訪問控制模型等諸如此類的訪問控制模型比較人們。通過一系列權(quán)限控制技術(shù)諸如授權(quán)、統(tǒng)一身份認(rèn)證等,對用戶進(jìn)行嚴(yán)格的認(rèn)證和訪問控制,有效保證大數(shù)據(jù)應(yīng)用安全。
隨著醫(yī)療衛(wèi)生信息化建設(shè)的不斷深入,應(yīng)用系統(tǒng)級及其他途徑產(chǎn)生的醫(yī)療衛(wèi)生數(shù)據(jù)呈非線性增長,醫(yī)療衛(wèi)生機(jī)構(gòu)面臨大數(shù)據(jù)環(huán)境帶來的機(jī)遇與挑戰(zhàn)。本文借鑒IT治理的思路和方法,對區(qū)域醫(yī)療衛(wèi)生大數(shù)據(jù)架構(gòu)進(jìn)行了研究,提出了區(qū)域醫(yī)療衛(wèi)生大數(shù)據(jù)總體架構(gòu),并對架構(gòu)實(shí)現(xiàn)做了進(jìn)一步說明。通過對區(qū)域醫(yī)療衛(wèi)生大數(shù)據(jù)架構(gòu)的設(shè)計(jì)及實(shí)現(xiàn),能夠?yàn)獒t(yī)療衛(wèi)生機(jī)構(gòu)大數(shù)據(jù)的應(yīng)用及價值實(shí)現(xiàn)提供可行的借鑒方法和框架,從而更好地為建設(shè)醫(yī)療衛(wèi)生事業(yè)服務(wù)。
參考文獻(xiàn):
[1]馬金鳳,趙強(qiáng),蔣璐,等.云存儲在區(qū)域醫(yī)療衛(wèi)生信息化建設(shè)中的價值探究[J].軟件導(dǎo)刊,2013,12(10):10-11.
[2]郭麗,王秀麗,馮婕,等.新醫(yī)改背景下衛(wèi)生信息化建設(shè)的幾點(diǎn)思考[J].信息通信,2013,(2):154-156.
[3]胥洪娥,趙炳新.企業(yè)IT治理對IT績效影響的實(shí)證研究[J].科技管理研究,2016,36(4):177-183.
[4]馬健.淺析企業(yè)IT治理概念及治理架構(gòu).科技視界,2015(4):312-312.
[5]宋俊典,李名敏,金濤,等.基于TOGAF的軌道交通企業(yè)信息化架構(gòu)規(guī)劃研究[J].計(jì)算機(jī)應(yīng)用與軟件,2010,27(5):165-168.
[6]葛蘇慧,梁宏濤,房正華.高校共享數(shù)據(jù)中心虛擬化技術(shù)的架構(gòu)[J].計(jì)算機(jī)技術(shù)與發(fā)展,2014(4):174-177.
[7]任桂禾,王晶.淺談大數(shù)據(jù)處理技術(shù)架構(gòu)的演進(jìn)[J].信息通信技術(shù),2014(6):47-51.
[8]陳麗.基于大數(shù)據(jù)的應(yīng)用系統(tǒng)架構(gòu)研究與應(yīng)用[J].軟件產(chǎn)業(yè)與工程,2014(5):33-38.
[9]林青,黃玉蕾.醫(yī)療衛(wèi)生領(lǐng)域大數(shù)據(jù)共享的應(yīng)用研究[J].信息安全與技術(shù),2016,7(4):23-25.
[10]張傳文.基于大數(shù)據(jù)的區(qū)域醫(yī)療信息共享體系研究[M].廣州,華南理工大學(xué),2015.
Research on the Big Data Framework of Regional Medical and Health Based on IT Governance
YANG Lin,LI Chao,LIN Li-hua,JI Ting-ting
(Shanghai Development Center of Computer Software Technology,Shanghai 201112)
During the 12th Five-Years Plan period,information construction of regional medical and health has achieved significant results,these information systems come into being bring massive medical and health data.Medical and health data contains wealth of value,through improving the level of medical and health by means of analysis,mining and utilization.How to design a set of reasonable regional medical and health data structure,plan medical and health data value realization,has become the hot issue of the current research.Proposes big data framework of regional medical and health based IT governance,which is focus on current situation,realizes data framework,technology framework,application framework and security system.The design method of architecture provides a novel idea for the big data architecture designing of medical and health,and gives formative medical and health framework to provide a reference model for medical and health institutions.
Medical Big Data;Architecture Research;IT Governance
1007-1423(2017)05-0052-07
10.3969/j.issn.1007-1423.2017.05.013
楊林(1979-),女,湖北襄陽人,工程師,研究方向?yàn)镮T治理、大數(shù)據(jù)理論
2016-11-24
2017-02-10
上海市科技人才計(jì)劃項(xiàng)目(No.16XD1421500)