高春輝
摘 要:大數(shù)據(jù)時代對于檔案資源的整合與利用提出了更高的要求,任何一項工作都需要建立在數(shù)據(jù)的基礎(chǔ)上,只有通過數(shù)據(jù)才可以保證其自身的發(fā)展。所以檔案數(shù)字資源在當前的工作中就顯得尤為重要。檔案數(shù)字資源自身具有一定的優(yōu)勢,例如具有龐大的數(shù)據(jù)量,并且在短時間內(nèi)就實現(xiàn)了迅速的增長等,面對如此繁雜的數(shù)據(jù),就為檔案數(shù)字資源的整合工作帶來了一定的難度。本文重點對相應(yīng)的難點以及具體的對策展開了分析和探討。
關(guān)鍵詞:大數(shù)據(jù);檔案數(shù)字資源;整合;方法;難點
檔案數(shù)字資源是大數(shù)據(jù)時代下一個主要的特征,隨著時代的發(fā)展,這些館藏數(shù)量也在不斷的增加,尤其是電子檔案的數(shù)量,增長速度是十分明顯的。同時,檔案數(shù)字資源也具有十分廣泛的分布,在人們的不斷探索過程中,數(shù)據(jù)保存的能力也得到了進一步的提升,結(jié)構(gòu)化信息以及其他類型的半結(jié)構(gòu)化信息等都逐漸融合在了一起,此外,檔案數(shù)字資源變得愈發(fā)可靠了起來,其正在以一種更加真實的面貌展現(xiàn)在人們的面前。所以本文主要對大數(shù)據(jù)時代下的檔案數(shù)字資源整合的相關(guān)問題展開了探討,希望對今后的工作有所幫助。
1 大數(shù)據(jù)時代檔案數(shù)字資源整合的難點
與傳統(tǒng)檔案存在很大的不同,大數(shù)據(jù)時代下的檔案數(shù)字資源正面臨著以下幾個方面的難點。首先是在數(shù)據(jù)的存儲量方面,數(shù)據(jù)數(shù)量的不斷增多就需要一定的支撐才能得以實現(xiàn),當前對于數(shù)據(jù)的存儲以及管理都投入了較大的資源,但是仍然不能滿足大量數(shù)字資源增長的現(xiàn)狀。所以在這種情況下就需要進一步的完善存儲方式以滿足實際發(fā)展的需要。
其次是在大數(shù)據(jù)分析的過程中,對于數(shù)據(jù)的分析是一個嚴峻的問題,因為在信息化時代的發(fā)展下,傳統(tǒng)的檔案挖掘技術(shù)對于處理非結(jié)構(gòu)化數(shù)據(jù)時具有一定的局限性,要想將數(shù)據(jù)的價值體現(xiàn)出來,就需要進行更加深入的挖掘以及分析,但是現(xiàn)階段的數(shù)據(jù)分析只能在檢索方面為用戶提供服務(wù),這就不符合大數(shù)據(jù)時代的發(fā)展要求。
第三,在安全性方面有待進一步的完善,與信息資源存在一定的差異性,檔案數(shù)字資源是經(jīng)過精心的挑選才保存下來的,在這之中包含著大量的秘密,因此安全性是十分重要的。如何才能避免出現(xiàn)安全隱患,保證對檔案數(shù)字資源更加嚴密的保護是當前工作中面臨的一個主要問題,需要與大數(shù)據(jù)時代的發(fā)展相一致。
最后是人才方面的問題。只有具備高素質(zhì)的人才才能保證檔案工作的順利展開,在現(xiàn)階段的檔案管理過程中,專業(yè)化的人才較少,所以整個檔案隊伍不具有較高的專業(yè)性,這樣就會對數(shù)字資源的整合工作帶來一定的難度,無法順利的實現(xiàn)檔案整合,甚至還會存在一定的制約,由此可見,加強對檔案人才的培養(yǎng)是十分必要的。
2 應(yīng)對策略
在大數(shù)據(jù)時代的發(fā)展進程中,應(yīng)該將大數(shù)據(jù)的價值積極的展現(xiàn)出來,所以相應(yīng)的管理模式需要加以進一步的變革。應(yīng)該將相應(yīng)的管理模式加以進一步的轉(zhuǎn)變,積極的采用大數(shù)據(jù)技術(shù)實現(xiàn)檔案數(shù)據(jù)信息的相互關(guān)聯(lián),這樣才能更好的實現(xiàn)檔案資源的共享。相關(guān)的檔案管理部門也應(yīng)該做相互協(xié)調(diào)的工作,將檔案數(shù)字資源中所蘊含的潛在價值充分的體現(xiàn)出來,這樣才能實現(xiàn)進一步的整合。傳統(tǒng)的檔案管理部門中,供給式的模式占據(jù)重要位置,而在新時期的發(fā)展下,這一思維模式應(yīng)該加以進一步的轉(zhuǎn)變,從用戶面臨的問題入手,為人們的行為決策提供有益指導(dǎo)。以解決用戶所面臨的問題為目標整合檔案數(shù)字資源,構(gòu)建起以社會利用需求為導(dǎo)向的檔案數(shù)字資源體系,不斷提高檔案服務(wù)與用戶需求之間的匹配程度。
構(gòu)建適應(yīng)大數(shù)據(jù)要求的檔案數(shù)字資源。以云計算為例,它適應(yīng)了大數(shù)據(jù)時代分布式存儲與海量數(shù)據(jù)并行處理的需要,實現(xiàn)了計算機資源的服務(wù)化,是大數(shù)據(jù)時代檔案數(shù)字資源整合的基礎(chǔ)平臺和支撐技術(shù)。首先,各檔案部門應(yīng)根據(jù)國家統(tǒng)一規(guī)劃以及自身基礎(chǔ)設(shè)施建設(shè)與檔案數(shù)據(jù)庫資源匹配程度的具體情況,靈活選擇適合的云部署方案。對于那些處在檔案數(shù)字資源整合關(guān)鍵節(jié)點的部門應(yīng)架設(shè)私有云,以動態(tài)申請公有云的方式彌補自身計算能力、存儲空間等的不足。其次,云計算能統(tǒng)一各應(yīng)用環(huán)境之間的業(yè)務(wù)邏輯、組織結(jié)構(gòu)和表達方式等,消除信息孤島,從而建立集成的檔案數(shù)字資源管理平臺,促成檔案數(shù)字資源深層次整合與知識開發(fā)的實現(xiàn)。再次,云計算能實現(xiàn)對檔案應(yīng)用的整合,并支持用戶利用各種終端設(shè)備隨時隨地訪問所需的云服務(wù)。這些都將在最大程度上發(fā)揮檔案數(shù)字資源整合的優(yōu)勢,提高檔案服務(wù)的效率和便捷性。
加強大數(shù)據(jù)時代檔案數(shù)字資源整合的安全保障體系建設(shè)。首先,應(yīng)建立IAM(身份和訪問管理)和隱私保護系統(tǒng),實現(xiàn)統(tǒng)一身份認證與訪問權(quán)限控制,達到用戶安全集成管理的目標,有效應(yīng)對檔案數(shù)字資源整合與大數(shù)據(jù)應(yīng)用過程中的安全風險。其次,通過數(shù)據(jù)加密技術(shù)保護檔案信息安全。通過SSL(Secure Sockets Layer,安全套接層協(xié)議層)加密,實現(xiàn)在數(shù)據(jù)集的節(jié)點和應(yīng)用程序之間移動保護大數(shù)據(jù)。再次,綜合運用大數(shù)據(jù)技術(shù)手段與安全保密制度,加強對重點領(lǐng)域檔案數(shù)據(jù)的日常監(jiān)管,有效應(yīng)對檔案數(shù)據(jù)聚集性與檔案利用需求無序性造成的檔案泄密風險。最后,實時開展檔案數(shù)字資源異地異質(zhì)備份工作,提高系統(tǒng)容災(zāi)能力。
最后,還要組建一支具有大數(shù)據(jù)素質(zhì)的檔案從業(yè)者隊伍。大數(shù)據(jù)環(huán)境下,檔案從業(yè)者應(yīng)加強自身素質(zhì)建設(shè),在檔案數(shù)字資源整合中承擔起業(yè)務(wù)專家的重任,成為檔案數(shù)字資源的提供者、組織者和導(dǎo)航者。作為檔案數(shù)字資源的提供者,就要求檔案從業(yè)者具有過硬的檔案專業(yè)知識與技能,能正確預(yù)判大數(shù)據(jù)給本單位數(shù)據(jù)處理各環(huán)節(jié)帶來的風險構(gòu)成,給出基于檔案專業(yè)的解決方案,從而確保檔案數(shù)字資源的真實、完整與安全,最大限度地滿足檔案數(shù)字資源整合的需要,保證檔案價值的實現(xiàn)。
3 結(jié)語
檔案數(shù)字資源整合是大數(shù)據(jù)時代檔案事業(yè)發(fā)展的關(guān)鍵命題,也是檔案部門抓住機遇重塑職業(yè)形象的重要內(nèi)容。在此過程中,檔案部門除應(yīng)時刻關(guān)注云計算技術(shù)、大數(shù)據(jù)處理技術(shù)等新興信息技術(shù)的發(fā)展,不斷深入研究其在相關(guān)領(lǐng)域的應(yīng)用實踐外,更應(yīng)進一步探索大數(shù)據(jù)時代檔案數(shù)字資源整合的理論體系和實踐措施,從而推動檔案服務(wù)理念與方式的變革,為開展個性化檔案智慧服務(wù),最大限度地實現(xiàn)檔案數(shù)字資源的內(nèi)在價值做好準備。
參考文獻
[1]王飛躍.知識生產(chǎn)方式和科技決策支持的重大變革――面向大數(shù)據(jù)和開源信息的科技態(tài)勢解析與決策服務(wù)[J].中國科學(xué)院院刊,2012,(5).
[2]周峰林.大數(shù)據(jù)時代的數(shù)字檔案館(業(yè)務(wù)指導(dǎo)司司長孫鋼[J]浙江檔案,2013,(8)