黃璇
摘要:在大數(shù)據(jù)“引爆”時(shí)代,其影響力滲透到了現(xiàn)代社會(huì)的各個(gè)方面。 李克強(qiáng)總理曾經(jīng)表示,大數(shù)據(jù)是21世紀(jì)的“鉆石礦”。 通過(guò)充分挖掘大數(shù)據(jù),可以更好地服務(wù)用戶,帶來(lái)更好的應(yīng)用,幫助政府做出精準(zhǔn)有效的決策,幫助行業(yè)進(jìn)行創(chuàng)新變革,獲得類似鉆石的價(jià)值。 面對(duì)大數(shù)據(jù)廣闊的前景,檔案部門(mén)也要順應(yīng)趨勢(shì),轉(zhuǎn)變觀念,與時(shí)俱進(jìn),積極探索大數(shù)據(jù)與檔案工作融合建設(shè)發(fā)展的道路。
關(guān)鍵詞:大數(shù)據(jù);檔案管理;數(shù)據(jù)化;轉(zhuǎn)型策略
中圖分類號(hào):A 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):(2021)-15-255
引言
互聯(lián)網(wǎng)時(shí)代,大數(shù)據(jù)正在引領(lǐng)各領(lǐng)域和各行業(yè)的變革與轉(zhuǎn)型。被譽(yù)為“大數(shù)據(jù)之父”的美國(guó)數(shù)據(jù)科學(xué)家維克托·邁爾·舍恩伯格將大數(shù)據(jù)概括為“一場(chǎng)生活、工作與思維的大變革”。2014年3月,大數(shù)據(jù)被首次寫(xiě)入政府工作報(bào)告;2015年8月,國(guó)務(wù)院發(fā)布《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》;2015年10月,黨的十八屆五中全會(huì)正式提出“實(shí)施國(guó)家大數(shù)據(jù)戰(zhàn)略,推進(jìn)數(shù)據(jù)資源開(kāi)放共享”,這表明中國(guó)已將大數(shù)據(jù)視作戰(zhàn)略資源并上升為國(guó)家戰(zhàn)略。在大數(shù)據(jù)浪潮洶涌而至的時(shí)代,檔案部門(mén)應(yīng)順勢(shì)而為,推進(jìn)大數(shù)據(jù)時(shí)代檔案管理事業(yè)轉(zhuǎn)型升級(jí)。
1檔案數(shù)據(jù)化的內(nèi)涵
存檔數(shù)據(jù)化。 文件管理對(duì)象的數(shù)據(jù)化,包括將紙質(zhì)文件轉(zhuǎn)換為數(shù)據(jù)或?qū)㈦娮游募鳛閿?shù)據(jù)進(jìn)行管理。 二是用數(shù)據(jù)記錄文件管理的過(guò)程,進(jìn)而實(shí)現(xiàn)“數(shù)據(jù)管理文件”。 存檔數(shù)據(jù)化與數(shù)字化不同,數(shù)據(jù)能否被量化分析是本質(zhì)的區(qū)別。 “數(shù)字化帶來(lái)數(shù)據(jù)化,但數(shù)字化不能代替數(shù)據(jù)化”檔案數(shù)據(jù)化是大數(shù)據(jù)時(shí)代檔案工作的發(fā)展方向,其側(cè)重點(diǎn)在于“用”。 在具體的日常檔案工作中,庫(kù)存檔案的數(shù)字化,第二是增量檔案的電子化。第三是檔案管理的數(shù)據(jù)化。 “庫(kù)存文件數(shù)字化、增量文件電子化”已經(jīng)作為文件工作發(fā)展戰(zhàn)略得到大力推進(jìn),引起了廣泛關(guān)注,取得了明顯的效果。 但是,目前的檔案資源體系容易忽視管理過(guò)程本身的相關(guān)數(shù)據(jù)。 檔案管理過(guò)程包括收集、整理、鑒定、保管、利用、統(tǒng)計(jì)等環(huán)節(jié),檔案工作者要有意識(shí)地量化這些環(huán)節(jié),依靠信息技術(shù)的支撐,通過(guò)系統(tǒng)、傳感器等設(shè)備進(jìn)行捕獲,實(shí)現(xiàn)數(shù)據(jù)的整合。
2大數(shù)據(jù)背景下檔案數(shù)據(jù)化管理的措施
2.1開(kāi)拓檔案管理數(shù)字化系統(tǒng)
在構(gòu)建歸檔數(shù)據(jù)平臺(tái)時(shí),必須為特定的服務(wù)設(shè)置自己的視圖目錄,并按時(shí)間排序或按類別進(jìn)行搜索。 這樣設(shè)置有助于及時(shí)了解文件的當(dāng)前狀態(tài),并有助于促進(jìn)文件數(shù)據(jù)系統(tǒng)的完整構(gòu)建。 合理開(kāi)發(fā)存檔數(shù)據(jù)分析工具有助于各行各業(yè)準(zhǔn)確地找到合適的存檔數(shù)據(jù)。 數(shù)字時(shí)代注重高效便捷,隨著人們更加熟練地運(yùn)用計(jì)算機(jī)技術(shù),有利于更好地提高文件管理工作的規(guī)范性,提高文件數(shù)據(jù)管理的效率。
2.2傳統(tǒng)與變革的融合
傳統(tǒng)的文件管理模式和遷移后的文件管理模式不是互斥的關(guān)系,而是互補(bǔ)融合的關(guān)系。 在檔案管理過(guò)程的各個(gè)階段都出現(xiàn)了收集整理的階段。 在傳統(tǒng)的檔案管理模式中,定期收集檔案范圍內(nèi)的檔案資料,擴(kuò)大檔案范圍的檔案資料收集主要由用戶自主提出,檔案管理員處于被動(dòng)狀態(tài),檔案管理員必須熟悉單位工作。 轉(zhuǎn)型后的檔案數(shù)據(jù)資源管理從數(shù)據(jù)需求角度和業(yè)務(wù)架構(gòu)角度創(chuàng)建數(shù)據(jù)收集范圍,統(tǒng)一數(shù)據(jù)門(mén)戶,對(duì)各種類型的檔案資源從數(shù)據(jù)格式、數(shù)據(jù)需求等不同角度采取不同的元數(shù)據(jù)方案 從元數(shù)據(jù)的角度定期結(jié)合單位業(yè)務(wù)需求分析增量數(shù)據(jù),分析內(nèi)容包括數(shù)據(jù)價(jià)值、數(shù)據(jù)分類、數(shù)據(jù)利用等方向,用該模型實(shí)現(xiàn)真正意義上的歸檔數(shù)據(jù)資源的定期完整收集。
鑒定的一環(huán)。 在傳統(tǒng)的文件管理模式中,必須手動(dòng)判斷文件是否屬于歸檔范圍,是否具有歸檔價(jià)值。 轉(zhuǎn)換后的檔案數(shù)據(jù)資源的處理關(guān)注數(shù)據(jù)處理的自動(dòng)化流程和規(guī)劃,實(shí)際上是基于非結(jié)構(gòu)化文檔管理的大規(guī)模智能文檔管理,包括TCMM指標(biāo)、XML指標(biāo)、數(shù)據(jù)挖掘、主題詞指標(biāo)、DRM系統(tǒng)、碎片化、自動(dòng)提取和注釋。 當(dāng)數(shù)字對(duì)象進(jìn)入系統(tǒng)時(shí),將自動(dòng)進(jìn)行元數(shù)據(jù)標(biāo)記,從而根據(jù)文本數(shù)字自動(dòng)提取數(shù)字對(duì)象中包含的符合元數(shù)據(jù)規(guī)范的信息,從而節(jié)省人工標(biāo)記的工作量。 自動(dòng)標(biāo)引的文獻(xiàn)可以根據(jù)用戶配置進(jìn)入人工檢測(cè)環(huán)節(jié),減少人工投入,同時(shí)確保數(shù)據(jù)著錄的準(zhǔn)確性。
保管環(huán)節(jié)。 傳統(tǒng)的檔案管理模式關(guān)注的是在實(shí)體檔案?jìng)}庫(kù)內(nèi)根據(jù)一定的環(huán)境要求集中保存檔案,或者在檔案管理系統(tǒng)內(nèi)著錄保存檔案。 轉(zhuǎn)型后的檔案數(shù)據(jù)資源基于對(duì)數(shù)據(jù)挖掘技術(shù)和內(nèi)容的理解,破壞了整個(gè)數(shù)字對(duì)象的結(jié)構(gòu),提取結(jié)構(gòu)化內(nèi)容的碎片,將數(shù)字對(duì)象碎片化存儲(chǔ),不是文件的檢索和分發(fā),而是更準(zhǔn)確的知識(shí)檢索 同時(shí)監(jiān)測(cè)數(shù)據(jù)的變化過(guò)程,關(guān)注數(shù)據(jù)的合規(guī)性、完整性、異常情況。
檔案價(jià)值的開(kāi)發(fā)環(huán)節(jié)。 主要在檢索和編輯兩方面,傳統(tǒng)文件管理中編輯工作的目標(biāo)是匯編后文件本身的方便查詢能力。 很明顯,文件資源的數(shù)據(jù)價(jià)值開(kāi)發(fā)深度不夠,還沒(méi)有到智能化的階段。 檔案管理部門(mén)在擁有如此龐大的庫(kù)存數(shù)據(jù)和增量一手?jǐn)?shù)據(jù)的情況下,總是處于編輯與否的尷尬境地。 轉(zhuǎn)型后的文件資源數(shù)據(jù)開(kāi)發(fā)水平包括表層和深層,表層是紙質(zhì)文件數(shù)字化和文件著錄的深層是數(shù)據(jù)服務(wù)和知識(shí)發(fā)現(xiàn)。
文件利用的一環(huán)。 許多單位的檔案管理人員難以接觸科研設(shè)計(jì)生產(chǎn)的一線業(yè)務(wù),一線人員對(duì)檔案資源的留存和價(jià)值開(kāi)發(fā)缺乏敏銳的觸覺(jué)。 因此,從最初的收集整理階段開(kāi)始,文件就處于被接收和保管的狀態(tài),在以往的管理模式中,文件數(shù)據(jù)的來(lái)源對(duì)文件管理者來(lái)說(shuō)經(jīng)常是“巧婦難為無(wú)米之炊”,所以文件資源數(shù)據(jù)服務(wù)由用戶 向使用者提供的檔案服務(wù)的范圍基本上由檔案管理員根據(jù)自己制定的規(guī)章制度人工判斷。 轉(zhuǎn)型后的檔案數(shù)據(jù)資源服務(wù)是應(yīng)用系統(tǒng)提供多種組合判斷條件的檔案數(shù)據(jù)搜索引擎,實(shí)現(xiàn)一站式快速準(zhǔn)確的檢索。 其次,分析用戶行為和數(shù)據(jù)利用需求建立數(shù)據(jù)模型,基于數(shù)據(jù)挖掘和分析技術(shù),實(shí)現(xiàn)面向問(wèn)題的查詢和利用服務(wù)。 這種方式為用戶提供了更全面的自主服務(wù)模式,同時(shí)將歸檔管理員從日常重復(fù)工作中解放出來(lái)。
2.3完善制度,確立規(guī)范
做好檔案現(xiàn)代化、數(shù)字化的管理工作,檔案機(jī)構(gòu)應(yīng)當(dāng)積極制定相關(guān)的檔案管理措施,從組織建設(shè)和制度建設(shè)出發(fā),支持檔案數(shù)據(jù)化管理工作的落實(shí)。 在具體建立組織機(jī)構(gòu)、完善管理制度時(shí),相關(guān)人員必須持認(rèn)真態(tài)度,特別關(guān)注制度的完善,為具體管理工作的落實(shí)提供科學(xué)依據(jù)。 在完善制度時(shí),應(yīng)明確檔案數(shù)據(jù)化管理工作內(nèi)容,明確各級(jí)管理人員的管理責(zé)任。 另外,文件數(shù)據(jù)化管理制度必須不斷完善要求,管理者也必須在實(shí)際工作中根據(jù)工作要求調(diào)整管理制度,優(yōu)化工作流程,提高各個(gè)工作環(huán)節(jié)的規(guī)范性和嚴(yán)謹(jǐn)性,才能有效提高文件數(shù)據(jù)化管理的效果。
結(jié)束語(yǔ)
總的來(lái)說(shuō),檔案管理從數(shù)字化到數(shù)據(jù)化的跨越是大數(shù)據(jù)時(shí)代檔案部門(mén)信息化發(fā)展的題中之義,檔案管理數(shù)據(jù)化也是在大數(shù)據(jù)時(shí)代檔案部門(mén)面向未來(lái)、面向自身發(fā)展以及面向用戶的重要發(fā)展戰(zhàn)略轉(zhuǎn)型。檔案管理數(shù)據(jù)化的未來(lái)不僅要實(shí)現(xiàn)檔案數(shù)字化到內(nèi)容數(shù)據(jù)化的知識(shí)組織轉(zhuǎn)型,更應(yīng)實(shí)現(xiàn)數(shù)字資源從內(nèi)容數(shù)據(jù)化到數(shù)據(jù)智能化的價(jià)值開(kāi)發(fā)和智慧洞見(jiàn)。隨著大數(shù)據(jù)的不斷發(fā)展,智能數(shù)據(jù)將會(huì)是未來(lái)影響檔案管理數(shù)據(jù)化的又一變革因素,隨著檔案管理數(shù)據(jù)化工作逐步推進(jìn),智能數(shù)據(jù)將會(huì)在海量檔案數(shù)據(jù)的基礎(chǔ)上完成原始數(shù)據(jù)積累,未來(lái)的檔案信息化建設(shè)將在數(shù)據(jù)化時(shí)代邁上新臺(tái)階。
參考文獻(xiàn)
[1]何彥昕.試析大數(shù)據(jù)時(shí)代背景下檔案管理數(shù)據(jù)化轉(zhuǎn)型[J].機(jī)電兵船檔案,2020(03):87-89.
[2]於菊紅.大數(shù)據(jù)背景下檔案管理范式的轉(zhuǎn)型:從信息管理到數(shù)據(jù)管理[J].檔案管理,2019(06):12-15.
[3]陳雪燕,于英香.從檔案管理走向檔案數(shù)據(jù)管理:大數(shù)據(jù)時(shí)代下的檔案管理范式轉(zhuǎn)型[J].山西檔案,2019(05):24-32.
廣西現(xiàn)代職業(yè)技術(shù)學(xué)院