巴武龍,楚治良,王 珊,孟曉東,吉 萍,趙 光
醫(yī)學(xué)實(shí)驗(yàn)室信息管理系統(tǒng)(laboratory information management system,LIS)是利用計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)和數(shù)據(jù)存儲、處理技術(shù),快速高效地對醫(yī)學(xué)實(shí)驗(yàn)室信息的采集、存貯、處理、傳輸、查詢和分析等全方位管理的計(jì)算機(jī)軟件系統(tǒng)[1]。近年來,隨著計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,越來越多的實(shí)驗(yàn)室已經(jīng)建立了自己的LIS 系統(tǒng)[2],并與醫(yī)院的醫(yī)院信息管理系統(tǒng)(hospital information system,HIS)、臨床信息系統(tǒng)(clinical information system,CIS)進(jìn)行基于局域網(wǎng)的數(shù)據(jù)互通,使得檢驗(yàn)科與臨床科室的信息傳遞更為流暢,并保證了數(shù)據(jù)的可追溯性,在醫(yī)院信息化的建設(shè)中發(fā)揮了非常重要的作用。
目前, 醫(yī)院的檢驗(yàn)設(shè)備自動化程度越來越高,檢驗(yàn)設(shè)備、LIS 系統(tǒng)和HIS 系統(tǒng)之間的信息交互是一個(gè)重要環(huán)節(jié)。 作為目前全球應(yīng)用最廣泛的醫(yī)療信息交換標(biāo)準(zhǔn)——HL7 標(biāo)準(zhǔn)已經(jīng)得到了醫(yī)療領(lǐng)域?qū)<覍W(xué)者的認(rèn)可[3]。 在 HL7 標(biāo)準(zhǔn)下,檢驗(yàn)設(shè)備和 LIS系統(tǒng)通過LIS 接口實(shí)現(xiàn)信息的交互,LIS 系統(tǒng)和HIS系統(tǒng)再通過信息交互,從而實(shí)現(xiàn)院內(nèi)信息資源的共享。 但是在實(shí)際工作中發(fā)現(xiàn),有些醫(yī)院并不是所有的檢驗(yàn)項(xiàng)目都實(shí)現(xiàn)了院內(nèi)檢驗(yàn)報(bào)告的在線共享,仍是以紙質(zhì)版報(bào)告發(fā)送給患者或醫(yī)師。 調(diào)查發(fā)現(xiàn),引起這類問題的原因主要有兩類。 一是,有些臨床實(shí)驗(yàn)室, 只有由儀器公司提供的單一的數(shù)據(jù)處理軟件[4],而沒有LIS 接口。這類項(xiàng)目主要是一些高精新的檢驗(yàn)項(xiàng)目,往往需手動編輯word 類報(bào)告,例如采用流式細(xì)胞儀進(jìn)行白血病免疫分型檢驗(yàn)等項(xiàng)目。 二是,在醫(yī)院信息化建設(shè)的過程中,系統(tǒng)之間的設(shè)計(jì)不可能一步到位,每一次的設(shè)備更換或升級都意味著需要設(shè)備廠家和軟件公司、 醫(yī)院LIS 接口工程師共同協(xié)商解決,這就需要三方投入較大的人力物力財(cái)力成本[5]。 有些醫(yī)院出于各種原因的考慮而沒有將這些檢驗(yàn)項(xiàng)目接入到LIS 系統(tǒng),也就無法實(shí)現(xiàn)院內(nèi)數(shù)據(jù)共享。
針對上述問題,該研究嘗試?yán)秒娮游臋n提取技術(shù),對檢驗(yàn)實(shí)驗(yàn)室生成的電子報(bào)告進(jìn)行關(guān)鍵信息提取,并以MTV(Model template view)模式構(gòu)架網(wǎng)站以實(shí)現(xiàn)檢驗(yàn)報(bào)告院內(nèi)局域網(wǎng)在線瀏覽,以期開發(fā)出一種技術(shù)簡單、開發(fā)迅速、人力財(cái)力成本低的院內(nèi)報(bào)告在線瀏覽系統(tǒng)。
1.1 服務(wù)器端 由于本系統(tǒng)針對的主要是一些沒有接入LIS 系統(tǒng)的報(bào)告,此類報(bào)告一般占醫(yī)院所有報(bào)告的比例較小, 并且經(jīng)過對系統(tǒng)的優(yōu)化處理,系統(tǒng)所需計(jì)算機(jī)資源較小,故所需硬件要求不高,CPU i3 及以上處理器、4G 及以上內(nèi)存即可保證系統(tǒng)運(yùn)行流暢。 用于存儲的硬盤越大越好,方便以后的報(bào)告存檔。 操作系統(tǒng)為Windows 7 及以上版本操作系統(tǒng)。 采用輕量級 Apache 2.4 作為應(yīng)用服務(wù)器,Mysql 5.7 作為后臺數(shù)據(jù)庫。選擇Pycharm 作為開發(fā)工具, 以Bootstrap 作為前端界面主要開發(fā)技術(shù),以Django 作為整體框架。 Django 是一種遵循 MVC(Model view controller) 模式的框架, 然而,Django采用的MVC 模式與傳統(tǒng)意義上的MVC 模式有所不同[6]。 Django 整個(gè)框架分為模型(Model)、 模板(Template)和視圖(View)三部分。 該研究中模型Model 為數(shù)據(jù)存取層, 根據(jù)不同檢驗(yàn)項(xiàng)目設(shè)置不同的數(shù)據(jù)庫用于存取數(shù)據(jù); 模板Template 為表現(xiàn)層,處理與表現(xiàn)相關(guān)的決定,根據(jù)不同檢驗(yàn)項(xiàng)目設(shè)置檢驗(yàn)項(xiàng)目顯示模板;視圖View 為業(yè)務(wù)邏輯層,用于設(shè)計(jì)存儲數(shù)據(jù)及調(diào)取適當(dāng)模板兩種操作之間的邏輯關(guān)系。 從而實(shí)現(xiàn)以數(shù)據(jù)庫驅(qū)動前端來進(jìn)行檢驗(yàn)報(bào)告的在線瀏覽。 Bootstrap 是基于 HTML、CSS、JavaScript的前端框架,它簡潔靈活,使得Web 開發(fā)更加快捷。系統(tǒng)設(shè)計(jì)如圖1 所示。
圖1 系統(tǒng)設(shè)計(jì)
1.2 客戶端 該系統(tǒng)基于B/S 模式,無須安裝特定軟件, 僅需客戶端能夠流暢運(yùn)行谷歌等瀏覽器即可。
該研究目的在于驗(yàn)證將未能接入LIS 系統(tǒng)的檢驗(yàn)報(bào)告通過電子文檔提取技術(shù)實(shí)現(xiàn)院內(nèi)局域網(wǎng)在線瀏覽這一方案是否可行,故基本業(yè)務(wù)流程主要設(shè)計(jì)為四部分:(1)檢驗(yàn)電子報(bào)告生成;(2)電子報(bào)告上傳;(3)檢驗(yàn)報(bào)告審核及檢驗(yàn)報(bào)告發(fā)布。 實(shí)際檢驗(yàn)工作中仍需遵循醫(yī)學(xué)檢驗(yàn)標(biāo)準(zhǔn)。 該研究所述基本業(yè)務(wù)流程設(shè)計(jì)圖見圖2。
圖2 基本業(yè)務(wù)流程設(shè)計(jì)圖
在利用電子文檔提取技術(shù)對醫(yī)學(xué)檢驗(yàn)電子報(bào)告進(jìn)行提取的關(guān)鍵步驟中,如何簡便正確地提取決定了系統(tǒng)的開發(fā)和維護(hù)成本。 醫(yī)學(xué)檢驗(yàn)項(xiàng)目都有明確的目的性,即要確定某項(xiàng)指標(biāo)的具體數(shù)值或性狀等,從而為疾病的診斷提供依據(jù)。 在此基礎(chǔ)上,檢驗(yàn)技師出具相關(guān)的檢驗(yàn)電子報(bào)告通常具有比較嚴(yán)謹(jǐn)?shù)倪壿嬓?,這為電子文檔提取技術(shù)的應(yīng)用提供了可能。 例如針對Word 電子報(bào)告,可利用Python 第三方庫docx,非常簡便有效地提取出所需數(shù)據(jù)。 以運(yùn)用流式細(xì)胞儀進(jìn)行白血病免疫分型檢測為例,檢驗(yàn)人員所出具的電子報(bào)告有如下描述:(1)初篩管。 B系標(biāo)志:CD19=54.7%和CD10=0.09%;T 細(xì)胞標(biāo)志:CD7=2.13% ; 髓 系 標(biāo) 志 :CD33=96.28% (+ ) 和CD117=93.24%(++); 早 期 標(biāo) 志 :CD34=94.98%(++)。 (2) 髓系檢測。 CD9=2.63%(+);HLA-DR=97.82%(+++);CD123=94.87%(+); CD13=95.13%(+);CD16=0.44%;CD38=97.91%(+);CD14=1.29%;CD56=7.6%;CD64=3.26%;CD11b=5.09%; CD2 =0.44%。 (3) 胞內(nèi)標(biāo)記。 cCD3=0.3%(T 淋巴細(xì)胞);cMPO=98.3%(+)(髓系標(biāo)志);cCD79a=4.1%(B 淋巴細(xì)胞)。(4)參考意見??傮w印象(CD45/SSC):幼稚細(xì)胞占總細(xì)胞數(shù)58%, 單核細(xì)胞占總細(xì)胞數(shù)55.1%,其他各系比例降低。 幼稚細(xì)胞門細(xì)胞大量表達(dá)CD13、CD33、HLA-DR、CD123、CD38、cMPO、CD117、CD34;結(jié)合骨髓象,考慮AML-M5。
針對上述報(bào)告, 可用如下幾行代碼完成提取,見圖3。
圖3 示例代碼
上述代碼分類提取出初篩管、髓系檢測、胞內(nèi)標(biāo)記和參考意見四個(gè)段落中的內(nèi)容,下一步可將上述內(nèi)容存入數(shù)據(jù)庫以方便醫(yī)師調(diào)閱報(bào)告。 相同方法可根據(jù)實(shí)際需要分別對前三個(gè)段落中對應(yīng)CD 分子所占比例進(jìn)行提取, 并將提取內(nèi)容存入數(shù)據(jù)庫,方便以后調(diào)用或?qū)Ρ取?對于含有圖片和表格的Word報(bào)告,也可用類似方式進(jìn)行提取。
在筆者醫(yī)院的實(shí)際運(yùn)行過程中,該系統(tǒng)較好地實(shí)現(xiàn)了預(yù)期目的, 使個(gè)別沒有納入Lis 系統(tǒng)的報(bào)告實(shí)現(xiàn)了在線瀏覽,解決了信息孤島問題,提高了該院的數(shù)據(jù)共享程度。
通過該研究的方法和思路,可以實(shí)現(xiàn)醫(yī)院未接入LIS 系統(tǒng)的檢驗(yàn)報(bào)告在線瀏覽,同時(shí)由于該系統(tǒng)所提取出的報(bào)告數(shù)據(jù), 實(shí)時(shí)存入數(shù)據(jù)庫中, 為HIS系統(tǒng)與該系統(tǒng)之間的數(shù)據(jù)交互提供了可能,進(jìn)而解決了“信息孤島”問題,有效提升了醫(yī)院信息的全面共享程度。 該研究所表述的利用Python 第三方包docx 對Word 版電子報(bào)告進(jìn)行檢驗(yàn)內(nèi)容提取, 所需代碼數(shù)量少,開發(fā)簡單。 以Django 框架架構(gòu)的網(wǎng)站相比其他系統(tǒng)架構(gòu)也具有更加簡便快捷的開發(fā)形式。 上述便利條件使得該院信息科技術(shù)人員可以快速開發(fā)并靈活升級系統(tǒng)。
當(dāng)然,該系統(tǒng)也有不足之處。 Django 框架的并發(fā)性有待進(jìn)一步優(yōu)化, 如何優(yōu)化系統(tǒng)的并發(fā)性,將是下一步的研究目標(biāo)。 另外,不同醫(yī)院的同一檢驗(yàn)項(xiàng)目的電子報(bào)告模板可能不同,需要針對不同的模板設(shè)置不同的提取模塊。 統(tǒng)一報(bào)告模板后,將大大增加系統(tǒng)的通用性。
綜上所述, 該系統(tǒng)的開發(fā)具有方便快捷的特點(diǎn), 可快速實(shí)現(xiàn)未納入Lis 系統(tǒng)的檢驗(yàn)報(bào)告的院內(nèi)局域網(wǎng)在線瀏覽,方便臨床同時(shí)降低成本,可作為LIS 系統(tǒng)的一種補(bǔ)充。 該研究所述系統(tǒng)《不依賴LIS接口的醫(yī)院報(bào)告在線瀏覽系統(tǒng)》(軟著登字第5132460 號)已經(jīng)獲得軟件著作版權(quán),同時(shí)部分相關(guān)源代碼已經(jīng)以apache 2.0 協(xié)議進(jìn)行了開源,用以方便其他醫(yī)院以此為模板便捷地開發(fā)自己醫(yī)院的系統(tǒng),以期發(fā)揮更好的社會效益和經(jīng)濟(jì)效益。