趙明芝
摘 要:檔案工作是當(dāng)下時(shí)代發(fā)展的重點(diǎn)建設(shè)工作,并且在當(dāng)今時(shí)代的經(jīng)濟(jì)全球化形式的渲染下,我國(guó)的經(jīng)濟(jì)建設(shè)得到了全方位的革新因此人們?cè)谏钯|(zhì)量隨經(jīng)濟(jì)而得到全面提升的同時(shí),也對(duì)自身的生活水平有了全新的要求,所以人們?cè)诟黝I(lǐng)域的需求觀念也就有了實(shí)質(zhì)性的變化,在檔案工作這一與人們有著千絲萬(wàn)縷聯(lián)系的體系性建設(shè)中也不例外,因此對(duì)于檔案工作的建設(shè)細(xì)節(jié)來(lái)說(shuō),迫切需要將新時(shí)代發(fā)展進(jìn)程中的數(shù)據(jù)以及科技化因素融于其中。因此本文在這一基礎(chǔ)上主要分析和研究了檔案工作中大數(shù)據(jù)框架構(gòu)建及與之相關(guān)的應(yīng)用性思考,以期為相關(guān)建設(shè)體系的開(kāi)展提供一定的理論性借鑒。
關(guān)鍵詞:檔案工作;大數(shù)據(jù)框架;構(gòu)建;應(yīng)用思考
檔案與我們的生活息息相關(guān),并且我們的生活也離不開(kāi)檔案的建設(shè)性規(guī)劃,因此,我們需要在此基礎(chǔ)上進(jìn)一步完善檔案工作的相關(guān)建設(shè)項(xiàng)目,進(jìn)而使我國(guó)檔案體系的容納力以及規(guī)劃性都得到全方位的提升與發(fā)展。而在當(dāng)今大數(shù)據(jù)的時(shí)代特色下,相應(yīng)的諸如檔案工作這類系統(tǒng)化的工作體系也都要或多或少地融入這一體系中,進(jìn)而全面提升自身的工作建設(shè)思路,因此對(duì)于檔案工作體系內(nèi)部的大數(shù)據(jù)框架的建設(shè)也就顯得尤為重要,因此我們需要對(duì)大數(shù)據(jù)體系展開(kāi)較為全面而細(xì)致的了解,進(jìn)而全面體提升檔案工作的實(shí)際發(fā)展水平。
1 檔案資源的大數(shù)據(jù)特征
1.1 種類繁多
檔案資源以文本類為主,還有大量的音視頻檔案、照片圖片檔案、圖紙、憑證檔案、地理信息、網(wǎng)絡(luò)日志等,都是非結(jié)構(gòu)化數(shù)據(jù),描述這些檔案資源的元數(shù)據(jù)又是結(jié)構(gòu)化數(shù)據(jù)。海量結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù)的混合正是傳統(tǒng)數(shù)據(jù)處理難以解決的問(wèn)題,符合大數(shù)據(jù)的多樣性特征。
1.2 價(jià)值密度與價(jià)值成反比
檔案留存著社會(huì)的歷史記憶,具有很高的歷史價(jià)值。然而對(duì)當(dāng)前應(yīng)用來(lái)說(shuō),海量檔案信息,每次可能利用的數(shù)據(jù)非常少,存在著價(jià)值密度低的特點(diǎn)。如視頻,連續(xù)不間斷攝制過(guò)程中,可能有用的數(shù)據(jù)僅僅有一兩秒。這些檔案信息蘊(yùn)含著巨大潛能,需要人員、流程與技術(shù)的密切配合,方能將其轉(zhuǎn)化為更大的真正價(jià)值。
1.3 對(duì)處理速度要求較高
大數(shù)據(jù)要求實(shí)時(shí)或近乎實(shí)時(shí)的處理速度,這對(duì)企事業(yè)單位來(lái)說(shuō)沒(méi)問(wèn)題,對(duì)于國(guó)家檔案館來(lái)說(shuō)好像要求過(guò)高,其實(shí)不然。傳統(tǒng)檔案利用方式是被動(dòng)等待用戶來(lái)查找原始信息,給社會(huì)留下“故紙堆”印象。如果改被動(dòng)服務(wù)為及時(shí)、準(zhǔn)確的主動(dòng)服務(wù),這種主動(dòng)服務(wù)不僅提供檔案原始信息,還應(yīng)提供BI、預(yù)測(cè)分析、內(nèi)容分析、輔助決策分析等。
2 檔案工作中大數(shù)據(jù)框架的具體應(yīng)用
2.1 相應(yīng)平臺(tái)的搭建
大數(shù)據(jù)檔案工作體系的建設(shè)在理論層面具備著十分充足的可行性,當(dāng)在這一建設(shè)體系的具體實(shí)施層面依舊因?qū)嵤l件的不足而潛藏著一定程度的阻礙性瑕疵,所以其具體的實(shí)施環(huán)節(jié)依舊存在著一定的執(zhí)行難度,。因此需要經(jīng)過(guò)全方位的權(quán)衡才能夠確切地進(jìn)行大數(shù)據(jù)檔案工作的開(kāi)展,而實(shí)際的權(quán)衡性環(huán)節(jié)需要結(jié)合具體的檔案數(shù)據(jù)、相關(guān)技術(shù)的實(shí)際應(yīng)用方法以及較為成熟化的實(shí)施機(jī)制這三點(diǎn)來(lái)進(jìn)行實(shí)際的方案策劃。而同時(shí)這三點(diǎn)也是大數(shù)據(jù)檔案工作體系想進(jìn)行較為成功的發(fā)展所必須具備的基礎(chǔ)性要素。檔案部門(mén)長(zhǎng)期以來(lái)利用思想是提供原始信息的被動(dòng)查詢,還談不上迫切且明確的大數(shù)據(jù)研究需求,即使在企事業(yè)單位,檔案部門(mén)也很難做到主動(dòng)提供服務(wù),利用好大數(shù)據(jù),依然需要敏銳的洞察和創(chuàng)新的思維,這是檔案部門(mén)比較欠缺的。一定的技術(shù)積累與成熟度對(duì)于檔案部門(mén)目前更是困難。綜合上述分析,大數(shù)據(jù)目前在我國(guó)檔案部門(mén)開(kāi)展有相當(dāng)大的難度。如果依靠檔案部門(mén)自己,目前幾乎是不可行的。但并不表示面對(duì)大數(shù)據(jù),檔案部門(mén)無(wú)所作為,可以做好迎接大數(shù)據(jù)的準(zhǔn)備工作,同時(shí)借助外力開(kāi)展試點(diǎn)工作。
2.2 服務(wù)觀念的轉(zhuǎn)變
檔案部門(mén)作為一個(gè)服務(wù)部門(mén),其服務(wù)態(tài)度的確立是這一部門(mén)想要取得發(fā)展性建設(shè)的必要保障,而同時(shí)態(tài)度問(wèn)題也是服務(wù)類行業(yè)尤為重要的執(zhí)行要素,因此在檔案部門(mén)的大數(shù)據(jù)框及體系建設(shè)的環(huán)節(jié)也就要對(duì)此尤為注意。但是大多數(shù)的檔案部門(mén)所持的服務(wù)觀念以及對(duì)服務(wù)這一理論的理解依舊停留在傳統(tǒng)的服務(wù)理論上,因此也就會(huì)一直延續(xù)傳統(tǒng)服務(wù)行業(yè)的弊端,即服務(wù)者對(duì)被服務(wù)者持一種被動(dòng)的等待態(tài)度,而且其實(shí)際的服務(wù)內(nèi)容依舊也是以對(duì)檔案信息的單純性提供為主。隨著檔案信息化工作的開(kāi)展,檔案目錄、部分檔案全文經(jīng)數(shù)字化后上網(wǎng)供利用者瀏覽,這是主動(dòng)服務(wù)思想的體現(xiàn)。一些檔案部門(mén)也在嘗試開(kāi)展進(jìn)一步的主動(dòng)服務(wù)工作, 面對(duì)大數(shù)據(jù),這種轉(zhuǎn)變尚不夠。大數(shù)據(jù)數(shù)據(jù)量大、查詢分析復(fù)雜,更重要的是精準(zhǔn)把握利用者的需求。然而利用者很多時(shí)候并不知道準(zhǔn)確的需求,需要檔案管理人員主動(dòng)深入了解業(yè)務(wù),明確需求,準(zhǔn)備相應(yīng)數(shù)據(jù),尤其對(duì)企事業(yè)單位檔案部門(mén)更應(yīng)該如此。
2.3 檔案質(zhì)量的提升
檔案質(zhì)量的提升也是檔案大數(shù)據(jù)框架構(gòu)建體系建設(shè)的必然性要素,而檔案質(zhì)量的提升其首先必然是先實(shí)現(xiàn)檔案數(shù)量的提升,進(jìn)而在此基礎(chǔ)上由檔案館為基點(diǎn),開(kāi)展數(shù)字化檔案網(wǎng)絡(luò)體系的構(gòu)建,進(jìn)而實(shí)現(xiàn)其館內(nèi)檔案的全部數(shù)字化,然后讓這一批數(shù)字化的檔案能夠集結(jié)到統(tǒng)一檔案數(shù)據(jù)庫(kù)中,再經(jīng)過(guò)對(duì)數(shù)據(jù)庫(kù)的集中性建設(shè)后借助一定的共享性平臺(tái)分布機(jī)制從而實(shí)現(xiàn)檔案網(wǎng)絡(luò)的構(gòu)建,針對(duì)那些不全的檔案信息進(jìn)行二次修正性錄入,并在此基礎(chǔ)上實(shí)現(xiàn)對(duì)已錄入網(wǎng)絡(luò)的電子檔案的全方位管理。由于與載體的不可分離,同一份傳統(tǒng)檔案可能在多個(gè)全宗或立檔單位都存在,在大數(shù)據(jù)處理前需要查重,以免增加超級(jí)計(jì)算機(jī)或服務(wù)器集群的負(fù)擔(dān)。查重的方法是利用檔案目錄。各檔案部門(mén)基本都已建設(shè)自己館藏的檔案條目,先把條目上傳,根據(jù)條目比對(duì)檔案的重復(fù)性,將結(jié)果反饋給相應(yīng)檔案部門(mén)。以一個(gè)檔案部門(mén)為主進(jìn)行數(shù)字化,其他部門(mén)或下載拷貝或通過(guò)鏈接關(guān)聯(lián)相應(yīng)檔案。
2.4 云服務(wù)的實(shí)現(xiàn)
大數(shù)據(jù)的基礎(chǔ)是云計(jì)算,同時(shí)檔案信息資源的整合也應(yīng)該建立在云計(jì)算基礎(chǔ)之上,可以考慮建設(shè)全國(guó)或區(qū)域性的公有云,實(shí)現(xiàn)全國(guó)或區(qū)域內(nèi)檔案條目的集中與共享,實(shí)現(xiàn)查重檔案的存放與共享,甚至可以實(shí)現(xiàn)區(qū)域內(nèi)所有電子文件、數(shù)字檔案的存儲(chǔ),下級(jí)檔案部門(mén)保留檔案鏈接地址即可。這樣的前提是訪問(wèn)公有云是高速網(wǎng)絡(luò)。公有云下,區(qū)域內(nèi)檔案部門(mén)可以建設(shè)自己的私有云。檔案云資源的建設(shè)使得大數(shù)據(jù)平臺(tái)有了強(qiáng)有力的數(shù)據(jù)支撐。
結(jié)束語(yǔ)
總而言之,檔案的大數(shù)據(jù)框架構(gòu)建體系的建設(shè)以及具體應(yīng)用體系的構(gòu)建對(duì)于我國(guó)的信息化建設(shè)是十分有益的,其能將檔案以數(shù)字的形式較為集中地規(guī)劃到一處,并在此基礎(chǔ)上,進(jìn)一步來(lái)完善實(shí)際的檔案數(shù)據(jù)庫(kù)的確立,并對(duì)這一數(shù)據(jù)庫(kù)進(jìn)行較為穩(wěn)妥地管理,這樣檔案的搜索機(jī)制的運(yùn)行就無(wú)需通過(guò)冗雜的人力來(lái)實(shí)現(xiàn),僅需通過(guò)數(shù)據(jù)庫(kù)的調(diào)動(dòng)就能夠更為高效。迅捷地實(shí)現(xiàn)。因此,這一體系的建設(shè)性開(kāi)展與實(shí)際的應(yīng)用能為我國(guó)的相關(guān)信息化建設(shè)帶去更值得借鑒的體系架構(gòu),進(jìn)而在此基礎(chǔ)上我國(guó)能夠?qū)崿F(xiàn)相應(yīng)數(shù)字工程體系的全方位構(gòu)建。
參考文獻(xiàn)
[1]劉國(guó)華,李澤鋒.檔案工作中大數(shù)據(jù)框架構(gòu)建及應(yīng)用思考[J].檔案管理,2014.
[2]滕春娥.大數(shù)據(jù)環(huán)境下檔案工作轉(zhuǎn)型研究[J].北京檔案,2015.
[3]鄒華英.試論大數(shù)據(jù)時(shí)代的檔案工作[J].檔案與建設(shè),2013.
[4]蘭祝剛,惠英,李剛.大數(shù)據(jù)時(shí)代下的檔案工作[J].中國(guó)檔案,2013.
科學(xué)與財(cái)富2016年14期