袁駿毅,湯欽華,馬群圣
上海交通大學(xué)附屬胸科醫(yī)院 信息中心,上海 200030
隨著精準(zhǔn)醫(yī)療以及智慧醫(yī)院的深入,醫(yī)院信息化的重點(diǎn)需要更精細(xì)化地聚焦在專病與亞專業(yè)的科研與決策方面。醫(yī)學(xué)上專病的研究往往伴隨著大量的患者信息,以及貫穿整個(gè)診療活動的醫(yī)學(xué)檢查和影像學(xué)資料等,在每個(gè)專病領(lǐng)域中又各有特殊的要求。目前,國內(nèi)用于特定專病研究的數(shù)據(jù)庫正處于蓬勃建設(shè)階段,金濤等[1]通過研究歸納國內(nèi)專病數(shù)據(jù)庫的建設(shè)情況發(fā)現(xiàn),雖然包括運(yùn)動障礙、前列腺癌等專病數(shù)據(jù)庫建設(shè)取得了較好的效果,但是數(shù)據(jù)庫中主要是患者病史,結(jié)構(gòu)化程度不高,手術(shù)數(shù)據(jù)等仍有待完善。Barnes等[2]和Khan等[3]通過對特定專病的研究認(rèn)為,??撇±龜?shù)據(jù)庫可以促進(jìn)疾病的健康教育、治療與隨訪的效果。胸腺瘤作為前上縱隔原發(fā)性腫瘤,病理類型復(fù)雜,臨床醫(yī)生往往由于輔助專業(yè)知識限制因而認(rèn)識有限[4]。因此,研究胸腺瘤專病數(shù)據(jù)庫的建設(shè)對于臨床工作的有效展開具有重要的現(xiàn)實(shí)意義。
上海市胸科醫(yī)院為三級甲等專科醫(yī)院,在胸外科疾病診治方面具有明顯的學(xué)科優(yōu)勢與專業(yè)特色。本文以胸科醫(yī)院為背景,通過在電子病歷系統(tǒng)中新增病種模板,進(jìn)行數(shù)據(jù)庫需求分析和整體架構(gòu)構(gòu)建,設(shè)立數(shù)據(jù)質(zhì)量評估指標(biāo)體系,建設(shè)基于結(jié)構(gòu)化電子病歷的胸腺瘤專病數(shù)據(jù)庫,為此類專病的診療質(zhì)量、臨床方案與醫(yī)療決策提供數(shù)據(jù)和技術(shù)上的支持。
建立胸腺瘤專病數(shù)據(jù)庫的前提,在于能夠從專病病歷中采集到有效的數(shù)據(jù)。因此,需要通過細(xì)化醫(yī)生的輸入模式,對病種的關(guān)鍵病歷內(nèi)容進(jìn)行分析與處理,進(jìn)而在電子病歷系統(tǒng)中設(shè)立專病結(jié)構(gòu)化模板[5-8]。專病模板的結(jié)構(gòu)化是較為復(fù)雜的工作,既要考慮結(jié)構(gòu)化后錄入的方便,又要兼顧數(shù)據(jù)元顆粒度的大小,足以支撐病歷檢索和分析[6-10]。在數(shù)據(jù)庫需求分析階段,采用了現(xiàn)場扎根訪談的形式,根據(jù)目的性采樣的原則,與胸外科共計(jì)4位醫(yī)生進(jìn)行需求調(diào)研(2位副主任醫(yī)師、2位主治醫(yī)師)。調(diào)研結(jié)果表明:醫(yī)院現(xiàn)有的電子病歷雖然已經(jīng)實(shí)現(xiàn)部分結(jié)構(gòu)化,包括入院記錄、首次病程錄、手術(shù)記錄、出院小結(jié)等15種病歷文書。但是已有的病歷文書強(qiáng)調(diào)描述性信息,缺乏針對專病管理需求而制定的關(guān)鍵指標(biāo),無法后續(xù)進(jìn)行病種數(shù)據(jù)的采集與挖掘。經(jīng)過分析討論,最終確定的胸腺瘤結(jié)構(gòu)化專病模板包括患者信息、診斷、檢查及檢驗(yàn)、手術(shù)情況(如Osserman分期、腫瘤情況)、術(shù)后情況、病理報(bào)告等內(nèi)容,共計(jì)689個(gè)結(jié)構(gòu)化指標(biāo)項(xiàng)。例如,結(jié)構(gòu)化后的胸腺瘤手術(shù)記錄模板見圖1。
圖1 胸腺瘤結(jié)構(gòu)化手術(shù)記錄模板
胸腺瘤專病數(shù)據(jù)庫依托于臨床數(shù)據(jù)中心(Clinical Data Repository,CDR)進(jìn)行建設(shè),以專病患者為研究對象,將此類疾病的入院診斷與出院診斷編碼(ICD10碼:D38.401、C37.X00等)進(jìn)行標(biāo)簽,獨(dú)立于其他類疾病,最終實(shí)現(xiàn)以患者身份證為主索引,建立完整的診療過程中產(chǎn)生的數(shù)據(jù)記錄。數(shù)據(jù)來源范圍涵蓋了醫(yī)院信息系統(tǒng)(Hospital Information System,HIS)、電子病歷(Electronic Medical Record,EMR)系統(tǒng)、醫(yī)囑系統(tǒng)、檢查檢驗(yàn)系統(tǒng)、病理系統(tǒng)等。實(shí)現(xiàn)對胸腺瘤專病數(shù)據(jù)多層次多角度的分析,為臨床診斷提供數(shù)據(jù)支撐,系統(tǒng)架構(gòu)見圖2。
圖2 系統(tǒng)架構(gòu)
由于專病數(shù)據(jù)庫存儲方案高度依賴于所需解決病歷的信息表示模型,傳統(tǒng)的關(guān)系數(shù)據(jù)庫事先雖可明確定義屬性和關(guān)系,但無法描述復(fù)雜的數(shù)據(jù)類型。因此,胸腺瘤專病數(shù)據(jù)庫基于XML技術(shù)進(jìn)行存儲,采用了SQLSERVER的R2版本。R2版本是一種基于標(biāo)準(zhǔn)病歷數(shù)據(jù)描述的語言,可以滿足臨床診療過程中如主訴等直訴性內(nèi)容的記錄,同時(shí)也支持SNOMED等醫(yī)學(xué)標(biāo)準(zhǔn)術(shù)集的結(jié)構(gòu)化嵌入,在結(jié)構(gòu)化與文本化之間達(dá)到靈活控制。為了在復(fù)雜的醫(yī)療信息環(huán)境中具備良好的適應(yīng)性,數(shù)據(jù)庫不僅開放標(biāo)準(zhǔn)的XML數(shù)據(jù)訪問方式,同時(shí)臨床文檔以XML Schema的URL形式注冊在數(shù)據(jù)庫中,提供以文件目錄展現(xiàn)的虛擬文件,避免調(diào)閱方花費(fèi)精力進(jìn)行二次解析,快速實(shí)現(xiàn)多種格式類型的文檔查看。
數(shù)據(jù)中心CDR采用數(shù)據(jù)庫復(fù)制技術(shù)從生產(chǎn)庫上實(shí)時(shí)發(fā)布訂閱,然后采用ETL技術(shù)把數(shù)據(jù)抽取入庫,在抽取過程中對臨床數(shù)據(jù)進(jìn)行相應(yīng)的清洗和轉(zhuǎn)換工作,胸腺瘤專病數(shù)據(jù)庫則定時(shí)從CDR按設(shè)定的病種標(biāo)簽規(guī)則同步更新數(shù)據(jù)。專病數(shù)據(jù)庫存在大量與其他系統(tǒng)的集成,其他臨床系統(tǒng)支持直接調(diào)用專病數(shù)據(jù)服務(wù)接口,調(diào)用方式通過面向服務(wù)的架構(gòu)進(jìn)行分布式的部署及應(yīng)用。在與科教平臺、數(shù)據(jù)分析平臺等系統(tǒng)對接時(shí),方便醫(yī)院在臨床業(yè)務(wù)系統(tǒng)中調(diào)閱胸腺瘤專病數(shù)據(jù)的相關(guān)服務(wù)[11-14]。
定期對專病數(shù)據(jù)庫進(jìn)行數(shù)據(jù)完整性與準(zhǔn)確性方面的檢查非常重要。因此,結(jié)合胸腺瘤專病的實(shí)際特點(diǎn),經(jīng)過與醫(yī)務(wù)管理部門多次討論,從數(shù)據(jù)的采集量、數(shù)據(jù)的多態(tài)性、數(shù)據(jù)綜合質(zhì)量及系統(tǒng)建設(shè)質(zhì)量等四個(gè)方面來設(shè)立數(shù)據(jù)庫質(zhì)量評估體系,為日常巡檢數(shù)據(jù)收集的可用性制定了判斷的依據(jù)。如表1所示。
表1 胸腺瘤專病數(shù)據(jù)庫建設(shè)的質(zhì)量評估體系
目前醫(yī)院已完成了胸腺瘤結(jié)構(gòu)化專病數(shù)據(jù)庫的建設(shè),實(shí)現(xiàn)了患者數(shù)據(jù)的集成。正式投入使用后,共收集了394例胸腺瘤患者的診療數(shù)據(jù),這些數(shù)據(jù)全部轉(zhuǎn)化為可供查詢分析的結(jié)構(gòu)化數(shù)據(jù)。目前數(shù)據(jù)庫的數(shù)據(jù)量約為45萬條記錄、21兆容量(不含影像資料)。隨著醫(yī)院的業(yè)務(wù)增長與數(shù)字化更精細(xì)化,經(jīng)統(tǒng)計(jì)對比,每年收錄的數(shù)據(jù)量約有10%的復(fù)合增長率,滿足了臨床醫(yī)生快速及準(zhǔn)確的獲得患者信息資源的需求。
專病數(shù)據(jù)庫對臨床提供統(tǒng)一的檢索服務(wù),實(shí)現(xiàn)了常規(guī)的文字搜索和高級特定范圍搜索。常規(guī)搜索功能類似百度之類的搜索,提供搜索詞聯(lián)想功能、分詞功能、同義詞以及在結(jié)果中檢索等功能,檢索結(jié)果中關(guān)鍵字以高亮的形式顯示。改變了醫(yī)生以往需要在多個(gè)業(yè)務(wù)系統(tǒng)進(jìn)行調(diào)閱的不便之處,支持更快速地定位到符合研究要求的患者,將患者歷次就診以結(jié)構(gòu)化數(shù)據(jù)的明細(xì)結(jié)果導(dǎo)出,便于對數(shù)據(jù)進(jìn)一步綜合分析和使用。數(shù)據(jù)庫應(yīng)用效果圖,見圖3。
圖3 數(shù)據(jù)庫應(yīng)用效果圖
胸腺瘤數(shù)據(jù)庫的價(jià)值不僅在于數(shù)據(jù)本身,更在于充分利用數(shù)據(jù)進(jìn)行回顧性分析所產(chǎn)生的價(jià)值。專病數(shù)據(jù)庫的建設(shè)是一個(gè)持續(xù)的過程,隨著醫(yī)院信息化建設(shè)的不斷完善,專病數(shù)據(jù)庫中接入的數(shù)據(jù)將越來越全面。醫(yī)院通過胸腺瘤數(shù)據(jù)庫中建立的6個(gè)數(shù)據(jù)分析模型,在此基礎(chǔ)上臨床醫(yī)生完成了4個(gè)科研隨訪項(xiàng)目的研究,取得了一定的成效,對于醫(yī)院在病種數(shù)據(jù)庫的建設(shè)上起到了以點(diǎn)到面的示范性作用[15-16]??梢灶A(yù)見的是,隨著各個(gè)醫(yī)院單病種專病數(shù)據(jù)庫的完善,有利于推動未來的區(qū)域內(nèi)醫(yī)聯(lián)體構(gòu)建更大型的、整合多家醫(yī)療機(jī)構(gòu)的多中心專病數(shù)據(jù)庫,在病種數(shù)據(jù)的標(biāo)準(zhǔn)化以及跨院數(shù)據(jù)綜合利用上起到支撐作用,進(jìn)一步促進(jìn)醫(yī)務(wù)人員更好地分析胸腺瘤疾病的發(fā)展趨勢,完善臨床治療方案,為患者提供更加優(yōu)質(zhì)的服務(wù)。