文/中山市博愛醫(yī)院 劉沛坤 陳昂 郭杰青
大數(shù)據(jù)時代的到來,使得醫(yī)院經營業(yè)務以及服務項目的待儲存信息不斷增加,進一步凸顯出醫(yī)院科研檔案信息管理的重要性。傳統(tǒng)醫(yī)院科研檔案通常采用紙質檔案信息的形式進行存儲和管理,而這樣的管理方法已經無法滿足大數(shù)據(jù)時代醫(yī)院科研檔案管理的需要。因此,為了進一步提高醫(yī)院科研檔案管理效率,應當結合現(xiàn)代科技為其提供全新的思路和條件。從當前大數(shù)據(jù)技術的應用形式來看,其主要依賴于云計算技術,通過對海量數(shù)據(jù)進行綜合的分析和處理,最終將大量數(shù)據(jù)信息高度集成并實現(xiàn)共享。當前醫(yī)院科研檔案管理存在的主要問題包括檔案存儲格式不規(guī)范、檔案管理人員整體素質較差、檔案管理安全性較低等。因此,基于大數(shù)據(jù)的醫(yī)院科研檔案信息化管理方法應當在實際管理工作過程中,充分保障檔案管理的安全性、檔案存儲格式的統(tǒng)一性以及檔案管理的系統(tǒng)性。基于此,本文開展對大數(shù)據(jù)時代下醫(yī)院科研檔案信息化管理方法的設計研究。
(一)建立基于大數(shù)據(jù)映射的電子檔案安全管理平臺。本文提出的醫(yī)院科研檔案信息化管理方法應結合集成化、精細化的檔案管理理念,構建基于大數(shù)據(jù)映射技術的電子檔案安全管理平臺。首先,采用安全性能相對較高且獲取途徑合法的防火墻軟件,實現(xiàn)對防火墻訪問安全防護的強化。在管理平臺的內網與外網之間設置官方認證服務,并針對平臺內網中安全等級不同的軟件進行不同類型的防火墻設置。同時,加強對網絡危險入侵檢測的應用力度,構建網關病毒檢測及抵御系統(tǒng),從而在電子檔案安全管理平臺受到非法威脅或危險入侵時可以在第一時間對電子檔案進行保護,并針對不同的安全問題采取對應的措施。其次,在電子檔案安全管理平臺搭建過程中還需要結合大數(shù)據(jù)映射技術,針對醫(yī)院科研的多路徑檔案信息的大數(shù)據(jù)流和上述建立的網關病毒檢測及防御端口之間建立二者的映射連接模式,如圖1所示。
圖1 檔案信息大數(shù)據(jù)流與網關病毒檢測映射連接模式
根據(jù)圖1映射連接模式,實時建立映射關系元組,并通過公式(1)、(2)實現(xiàn)對平臺中多個服務器節(jié)點的異構映射和大數(shù)據(jù)流摘要處理。
(二)醫(yī)院科研檔案信息數(shù)據(jù)集成。針對醫(yī)院科研檔案管理中各類信息的數(shù)據(jù)量較為龐大且種類較多,管理程序實施較為復雜的特點,在對檔案信息數(shù)據(jù)進行記錄和存儲時,可通過大數(shù)據(jù)技術對檔案信息數(shù)據(jù)進行集成處理,結合上文建立的基于大數(shù)據(jù)映射的電子檔案安全管理平臺,對不同路徑、不同類型、不同格式的數(shù)據(jù)通過命令解析器對其進行劃分,再由分配器從元數(shù)據(jù)集合中讀取到的所有數(shù)據(jù)源信息發(fā)送到每一個在線的數(shù)據(jù)源中,完成代理模塊的處理工作,最后通過數(shù)據(jù)源元數(shù)據(jù)管理將所有數(shù)據(jù)信息集合在統(tǒng)一的數(shù)據(jù)庫中,實現(xiàn)對檔案信息的集成。在檔案信息數(shù)據(jù)集成過程中,還需要保證數(shù)據(jù)的清潔,將檔案信息數(shù)據(jù)中冗余性數(shù)據(jù)濾除,并將存在殘缺問題的數(shù)據(jù)補全,更正存在錯誤的數(shù)據(jù),圖2為醫(yī)院科研檔案信息數(shù)據(jù)集成模式示意圖。
圖2 醫(yī)院科研檔案信息數(shù)據(jù)集成模式示意圖
針對結構化、半結構化以及非結構化的數(shù)據(jù),在集成時無法做到同一標準格式存儲的問題,可采用分布式大數(shù)據(jù)存儲方法,將不同類型格式的檔案信息數(shù)據(jù)存儲在與之相對應的模塊中,再通過不同類型的數(shù)據(jù)存儲引擎,建立各個存儲模塊之間的有機連接。同時,在集成處理后還應當對醫(yī)院科研檔案信息數(shù)據(jù)進行有機整合和歸納。
大數(shù)據(jù)時代下醫(yī)院科研檔案信息在集成過程中會產生大量的信息數(shù)據(jù),而絕大多數(shù)是陳舊冗余數(shù)據(jù)信息,不存在任何利用價值。針對這一部分檔案信息垃圾數(shù)據(jù),本文采用Clean Space垃圾數(shù)據(jù)清除工具,在基于大數(shù)據(jù)映射的電子檔案安全管理平臺中按照管理人員的需要將檔案信息數(shù)據(jù)劃分為大小不同的數(shù)據(jù)存儲區(qū)和人工干預存儲區(qū)。根據(jù)不同存儲區(qū)域的大小對數(shù)據(jù)進行讀取,并通過java數(shù)據(jù)庫連接接口調入到數(shù)據(jù)處理平臺中,此時檔案數(shù)據(jù)的存儲格式是以數(shù)據(jù)庫表的形式存儲在不同區(qū)域中。將數(shù)據(jù)庫表中的檔案信息數(shù)據(jù)按照規(guī)定設置為不同的字段ID,當定義的字段ID為非法數(shù)據(jù)時,程序自動執(zhí)行錯誤數(shù)據(jù)處理動作;當定義的字段ID為重復數(shù)據(jù)時,程序自動執(zhí)行人工數(shù)據(jù)處理,從而實現(xiàn)對錯誤數(shù)據(jù)及重復數(shù)據(jù)的清除,降低電子檔案安全管理平臺對冗余數(shù)據(jù)的管理消耗,提高管理效率。
記錄某醫(yī)院科研中心檔案管理部門相關的檔案數(shù)據(jù),構建本次對比實驗的實驗對象,分別利用本文提出的醫(yī)院科研檔案信息化管理方法與傳統(tǒng)管理方法對實驗對象進行管理。記錄兩種管理方法的管理過程第40s、80s、120s、160s和200s時,對科研檔案的集成管理數(shù)量,并將實驗結果記錄如圖3所示。
圖3 本文方法與傳統(tǒng)方法實驗結果對比圖
根據(jù)圖3中的數(shù)據(jù)可以看出,在管理過程200s之內的五次記錄中,本文管理方法的檔案管理數(shù)量均明顯高于傳統(tǒng)管理方法。同時,通過二者相差數(shù)量可以看出,隨著管理方法運行時間的不斷增加,二者之間存在的差異越來越明顯。因此,通過對比實驗證明,本文提出的管理方法管理效率更高,且隨著管理時間的增加,管理效率保持良好,更符合醫(yī)院科研中心對檔案管理的需要。
本文針對大數(shù)據(jù)時代下的醫(yī)院科研檔案信息化管理進行研究,結合大數(shù)據(jù)技術,對原有管理方法進行創(chuàng)新,并通過對比實驗證明其實用性。本文提出的管理方法可基本滿足當前醫(yī)院科研檔案管理的安全性和系統(tǒng)性需求,但目前仍然存在管理人員素質偏低、標準化程度不高的問題。應針對這一些問題對管理人員進行培訓,制定相應管理機制。在今后將對這些問題進行更加深入的研究。