在大數(shù)據(jù)時代,伴隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,各類社會媒體的普遍應(yīng)用,數(shù)據(jù)呈現(xiàn)出數(shù)量大、種類多、變化迅速、價值總量高的特點,基層醫(yī)院疾控檔案信息資源作為重要的社會信息資源之一,呈現(xiàn)出大數(shù)據(jù)特點。在大數(shù)據(jù)背景下,基層醫(yī)院疾控檔案信息資源的數(shù)量急劇增長,種類愈發(fā)繁雜,數(shù)字化、信息化程度不斷提升,使用傳統(tǒng)的管理手段已經(jīng)難以處理新形態(tài)的疾控檔案信息資源,因此,在新的時代背景下,將大數(shù)據(jù)技術(shù)運用到基層醫(yī)院疾控檔案信息化建設(shè)中,推動基層醫(yī)院疾控檔案信息化建設(shè)快速發(fā)展顯得愈發(fā)必要。
對于基層醫(yī)院疾控檔案信息化建設(shè)來說,其對大數(shù)據(jù)的運用,主要有五個環(huán)節(jié):一是數(shù)據(jù)準(zhǔn)備環(huán)節(jié)。基層醫(yī)院疾控檔案數(shù)量龐大、格式多樣,質(zhì)量良莠不齊。因此,基層醫(yī)院疾控檔案管理的數(shù)據(jù)準(zhǔn)備環(huán)節(jié)可對數(shù)據(jù)進行格式的規(guī)范化處理,為后續(xù)的存儲與管理奠定基礎(chǔ)。此外,可在保留原有語義的情況下去粗取精,消除數(shù)據(jù)噪聲。二是數(shù)據(jù)存儲與管理環(huán)節(jié)。當(dāng)前疾控檔案數(shù)量快速增長,海量化是大數(shù)據(jù)對存儲技術(shù)提出的首要挑戰(zhàn)。而大數(shù)據(jù)則對需要存儲的多種數(shù)據(jù)格式具有適應(yīng)能力。格式多樣化是大數(shù)據(jù)的主要特征之一,大數(shù)據(jù)存儲管理系統(tǒng)能滿足對各種非結(jié)構(gòu)化數(shù)據(jù)進行高效管理的需求,能夠應(yīng)對非結(jié)構(gòu)化數(shù)據(jù)多樣化的特點。三是計算處理環(huán)節(jié)。大數(shù)據(jù)的計算是數(shù)據(jù)密集型計算,對計算單元和存儲單元間的數(shù)據(jù)吞吐率要求極高,對性價比和擴展性的要求也非常高,分布式并行計算技術(shù)彌補了傳統(tǒng)并行計算系統(tǒng)在速度、可擴展性和成本上的不足,因而能適應(yīng)基層醫(yī)院疾控檔案大數(shù)據(jù)計算分析的新需求。四是數(shù)據(jù)分析環(huán)節(jié)。數(shù)據(jù)分析環(huán)節(jié)是大數(shù)據(jù)價值挖掘的關(guān)鍵。目前大數(shù)據(jù)分析主要有兩條技術(shù)路線,其一是憑借先驗知識人工建立數(shù)學(xué)模型分析數(shù)據(jù);其二則是通過建立人工智能系統(tǒng),使用大量樣本數(shù)據(jù)進行訓(xùn)練,讓機器代替人工,獲得從數(shù)據(jù)中提取知識的能力。人工智能和機器學(xué)習(xí)能夠更好地適應(yīng)當(dāng)前基層醫(yī)院疾控檔案信息化建設(shè)的大數(shù)據(jù)環(huán)境,具有良好的前景。五是知識展現(xiàn)環(huán)節(jié)。在大數(shù)據(jù)服務(wù)于決策支持場景下,以直觀的方式將基層醫(yī)院疾控檔案分析結(jié)果呈現(xiàn)給用戶,是大數(shù)據(jù)分析的重要環(huán)節(jié)。
(一)保障檔案數(shù)據(jù)高效存儲。目前,隨著信息技術(shù)及醫(yī)療事業(yè)的發(fā)展,基層醫(yī)院疾控檔案量已經(jīng)從小數(shù)量朝著海量化發(fā)展。與此同時,科技進步衍生出的數(shù)據(jù)呈現(xiàn)出了分布式和異構(gòu)性特點,需要歸檔的基層醫(yī)院疾控檔案數(shù)字資源繁多,包含結(jié)構(gòu)化、非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)。非結(jié)構(gòu)化數(shù)據(jù),如文本、圖片、各類表格、圖像和音視頻等;半結(jié)構(gòu)化數(shù)據(jù),不便于使用關(guān)系數(shù)據(jù)庫二維邏輯表來表現(xiàn)。傳統(tǒng)關(guān)系型數(shù)據(jù)庫已經(jīng)無法滿足對數(shù)量龐大、類型多樣的檔案資源的組織與管理需求,需要引入大數(shù)據(jù)管理系統(tǒng)對檔案進行分布式存儲、快速檢索。大數(shù)據(jù)存儲方法有很多種,具有一些共同的特點,即利用硬件的優(yōu)勢,使用可擴展的、并行的處理技術(shù),采用非關(guān)系模型存儲處理非結(jié)構(gòu)化和半結(jié)構(gòu)化的數(shù)據(jù),并對大數(shù)據(jù)運用高級分析和可視化技術(shù)。
(二)加強疾控檔案數(shù)據(jù)價值挖掘。在基層醫(yī)院疾控檔案數(shù)字資源中,不同的疾控檔案數(shù)據(jù)中蘊含的價值存在差異,有可能導(dǎo)致用戶獲取價值信息的難度增大。如何從這些資源中提煉、挖掘出有價值的檔案信息,并以人們易于接受的方式傳遞給用戶,是目前基層醫(yī)院疾控檔案工作者必須解決的問題。大數(shù)據(jù)時代帶來新的技術(shù),為基層醫(yī)院疾控檔案工作者提供解決問題的方式。檔案工作者可以采用大數(shù)據(jù)技術(shù),在海量檔案數(shù)據(jù)中發(fā)現(xiàn)關(guān)聯(lián),從不同角度對其進行聚類和分類,以多維度、多層次的方式展現(xiàn)檔案數(shù)據(jù),將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù),從而使用戶更準(zhǔn)確、更容易獲得檔案信息。必要時,還可以通過可視化技術(shù),形成圖形圖像,直觀地展示最終結(jié)果。從海量數(shù)據(jù)中分析潛在的知識,決定著大數(shù)據(jù)時代基層醫(yī)院疾控檔案工作的發(fā)展水平及方向,這也意味著大數(shù)據(jù)時代,基層醫(yī)院疾控檔案工作的重心將向檔案資源的數(shù)據(jù)分析、數(shù)據(jù)挖掘方向轉(zhuǎn)移。
(三)提高疾控檔案數(shù)據(jù)高效利用?;鶎俞t(yī)院疾控檔案工作的目的是提供利用。大數(shù)據(jù)時代下基層醫(yī)院疾控檔案工作服務(wù)講求時效性和便捷性,基于大數(shù)據(jù)技術(shù)可為實現(xiàn)網(wǎng)絡(luò)信息服務(wù)的智能化、個性化、精品化提供支持工具。依托互聯(lián)網(wǎng)技術(shù),全方位實現(xiàn)基層醫(yī)院疾控檔案信息智能檢索服務(wù)、檔案信息決策服務(wù)及檔案信息跟蹤與推送服務(wù)。利用這些技術(shù)手段,徹底顛覆傳統(tǒng)基層醫(yī)院疾控檔案分類在檔案管理中存在的諸多弊端,將基層醫(yī)院疾控檔案建設(shè)事業(yè)發(fā)展推向全新的高度。
大數(shù)據(jù)能夠極大推動基層醫(yī)院疾控檔案信息化建設(shè)的速度與效率,但有可能會帶來一些問題,需要注意。
(一)實現(xiàn)大數(shù)據(jù)技術(shù)問題。大數(shù)據(jù)技術(shù)相比傳統(tǒng)技術(shù)更為復(fù)雜。不同于傳統(tǒng)的基層醫(yī)院疾控檔案管理技術(shù),基層醫(yī)院疾控檔案大數(shù)據(jù)管理系統(tǒng)通常是一個由很多節(jié)點組成的分布式系統(tǒng),實現(xiàn)起來較為困難?;鶎俞t(yī)院疾控檔案管理工作者需要打破專業(yè)限制,尋求與專業(yè)的具有相應(yīng)資質(zhì)的大數(shù)據(jù)開發(fā)公司合作,將行業(yè)的需求和大數(shù)據(jù)技術(shù)結(jié)合起來,才能開發(fā)出適合基層醫(yī)院疾控檔案行業(yè)特點的大數(shù)據(jù)平臺。另外,我國基層醫(yī)院疾控紙質(zhì)檔案數(shù)字化形成的絕大多數(shù)是文字圖像,不便于大數(shù)據(jù)技術(shù)的處理,應(yīng)當(dāng)將文字圖像通過技術(shù)識別,生成文本文件,并盡可能提高識別的準(zhǔn)確率,為檔案大數(shù)據(jù)處理創(chuàng)造條件。
(二)信息安全問題。基層醫(yī)院疾控檔案是不可再生的社會核心信息資源。但有時人為的操作失誤、系統(tǒng)技術(shù)故障、計算機病毒、黑客攻擊、間諜竊取等原因都會造成檔案數(shù)據(jù)的破壞,給基層醫(yī)院疾控檔案管理部門,甚至整個醫(yī)療事業(yè)的發(fā)展帶來巨大損失。因此,基層醫(yī)院疾控檔案管理部門在實施大數(shù)據(jù)技術(shù)時,要重點加強信息安全保障體系建設(shè),采取各種安全技術(shù)措施,保證檔案數(shù)據(jù)的完整與安全。
(三)泄密問題?;鶎俞t(yī)院疾控檔案管理大數(shù)據(jù)時代,檔案信息主要通過網(wǎng)絡(luò)進行傳輸,容易被復(fù)制和擴散,導(dǎo)致檔案信息資源在開發(fā)和利用過程中可能出現(xiàn)信息泄漏、隱私權(quán)侵犯、知識產(chǎn)權(quán)糾紛等隱患。對于一些涉及社會穩(wěn)定的敏感領(lǐng)域來說,檔案涉密層次高,一旦泄密將直接危及國家安全或社會穩(wěn)定。如何實現(xiàn)基層醫(yī)院疾控涉密檔案信息資源的合理利用,既充分發(fā)揮涉密檔案的價值,又保證涉密檔案的安全,是大數(shù)據(jù)時代檔案管理面臨的重大挑戰(zhàn)。
相比其他信息技術(shù),大數(shù)據(jù)是當(dāng)今世界發(fā)展的大趨勢,是推動經(jīng)濟社會變革的主要力量,其更加契合基層醫(yī)院疾控檔案信息化建設(shè)工作的需要,尤其是在當(dāng)前的知識經(jīng)濟時代,將基層醫(yī)院疾控檔案信息轉(zhuǎn)化為知識資源,會成為新時期基層醫(yī)院疾控檔案工作的必然發(fā)展方向。大力推進檔案信息化,是檔案事業(yè)適應(yīng)時代和社會發(fā)展的必由之路,更是提高檔案管理能力和檔案信息服務(wù)水平的必然選擇。