摘 要:檔案信息化建設(shè)已經(jīng)進(jìn)入了數(shù)據(jù)化時(shí)代,大數(shù)據(jù)背景下檔案管理逐步實(shí)現(xiàn)模式精細(xì)化、服務(wù)精準(zhǔn)化、檔案資源共享化、檔案價(jià)值數(shù)智化。目前,加快檔案數(shù)據(jù)化轉(zhuǎn)型的過程中,還面臨著存量檔案數(shù)字化識(shí)別開發(fā)水平低、增量檔案重復(fù)性保存資源浪費(fèi)大、檔案網(wǎng)絡(luò)綜合性利用水平待提高的問題,需要在加強(qiáng)頂層規(guī)劃,建立數(shù)字賦能檔案管理體制機(jī)制,加強(qiáng)檔案資源整合、檔案共享平臺(tái)建設(shè)、數(shù)字人文賦能,搭建反饋機(jī)制等方面加以改進(jìn)。
關(guān)鍵詞:大數(shù)據(jù);檔案信息化;數(shù)字賦能
基于大數(shù)據(jù)時(shí)代帶來的深刻變化,傳統(tǒng)的檔案管理模式已經(jīng)無法滿足實(shí)際的工作需要,各種信息、數(shù)據(jù)的作用越來越大,為信息化建設(shè)指引了發(fā)展的方向。隨著信息化進(jìn)程的加快,管理的安全性問題、系統(tǒng)體系和制度不夠健全的問題等也越來越突出。為了有效處理相關(guān)問題,最大限度地降低或者消除這些問題帶來的不良影響,要在加強(qiáng)頂層規(guī)劃等方面下功夫。
1 大數(shù)據(jù)背景下檔案信息化的新特征
1.1 管理模式精細(xì)化
隨著云計(jì)算、區(qū)塊鏈等新技術(shù)的廣泛應(yīng)用,以紙質(zhì)檔案管理的傳統(tǒng)模式已經(jīng)落后于時(shí)代發(fā)展,檔案管理逐步進(jìn)入了“單套制”管理階段。目前,檔案信息化的建設(shè)仍然處于初級(jí)階段,計(jì)算機(jī)工具主義的作用凸顯,檔案信息處于孤立狀態(tài),沒有形成固定單元,檔案信息的挖掘未達(dá)到更高層次。檔案數(shù)據(jù)的井噴式增長(zhǎng)是檔案信息化的必然結(jié)果,也是需要提升的關(guān)鍵點(diǎn)。讓檔案管理工作在大數(shù)據(jù)技術(shù)的幫助下進(jìn)行,不僅可以讓海量的數(shù)據(jù)信息集成有效,也可以更好地服務(wù)于大眾。在收集檔案時(shí),“大數(shù)據(jù)”技術(shù)也可以按照篩選要求,過濾掉無用的數(shù)據(jù)信息,不僅可以對(duì)大量檔案資源進(jìn)行收納和聚集,也對(duì)其進(jìn)行分類化、秩序化管理;在存儲(chǔ)檔案時(shí),“大數(shù)據(jù)”技術(shù)可以存儲(chǔ)海量結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù),形成數(shù)據(jù)持久層;在使用數(shù)據(jù)時(shí),“大數(shù)據(jù)”技術(shù)對(duì)于檔案的信息挖掘可以使檔案的儲(chǔ)存與查找更有效率。
1.2 服務(wù)模式精準(zhǔn)化
信息化打破傳統(tǒng)檔案管理的孤島模式,實(shí)現(xiàn)跨館查詢、遠(yuǎn)程訪問、即時(shí)利用,檔案服務(wù)進(jìn)入全新模式。大數(shù)據(jù)技術(shù)能夠基于用戶需要和習(xí)慣識(shí)別,打造個(gè)性化的檔案服務(wù)。搭建技術(shù)賦能管理模式從用戶需求出發(fā),改變以往的閱覽、展示、咨詢等被動(dòng)工作模式。新型的數(shù)字體驗(yàn)服務(wù)管理模式,了解用戶的習(xí)慣和想法,構(gòu)建檔案智慧平臺(tái),利用數(shù)據(jù)挖掘、新媒體服務(wù)、精準(zhǔn)推送等方式切實(shí)高效、有針對(duì)性地解決用戶問題,提高用戶認(rèn)可度。由此可見,“大數(shù)據(jù)”優(yōu)勢(shì)在于提高對(duì)數(shù)據(jù)的優(yōu)化和整合能力,通過優(yōu)化和整合實(shí)現(xiàn)數(shù)據(jù)的增值。“大數(shù)據(jù)”從可視化分析、數(shù)據(jù)挖掘、預(yù)測(cè)性分析、語義分析、數(shù)據(jù)質(zhì)量管理等方面,對(duì)看似無關(guān)聯(lián)的各門類檔案數(shù)據(jù)進(jìn)行關(guān)聯(lián)、萃取和分析,實(shí)現(xiàn)檔案資源與用戶需求的雙向控制達(dá)到最優(yōu)化,使檔案服務(wù)模式走向精細(xì)化。
1.3 檔案資源共享化
大數(shù)據(jù)時(shí)代,云計(jì)算為數(shù)字檔案信息的跨行業(yè)、跨地域、跨時(shí)間提供了新的選擇模式[1]。云計(jì)算和大數(shù)據(jù)是相輔相成的,辦公自動(dòng)化和信息化的迅速發(fā)展,使亟待處理的電子檔案數(shù)據(jù)與日俱增[2],云計(jì)算為海量數(shù)據(jù)資源提供了大量的存儲(chǔ)空間,而大數(shù)據(jù)的目的是對(duì)海量數(shù)據(jù)進(jìn)行較好的分析、計(jì)算和處理。云計(jì)算技術(shù)的廣泛應(yīng)用,也使數(shù)字檔案資源的儲(chǔ)存進(jìn)入新模式,突破了空間限制。通過搭建檔案資源系統(tǒng)“云平臺(tái)”,可以將搜集的檔案數(shù)字信息存儲(chǔ)在該平臺(tái),相關(guān)信息數(shù)據(jù)通過安全保護(hù)網(wǎng)絡(luò)和身份認(rèn)證實(shí)現(xiàn)異地查詢使用,使得查詢利用不再受存儲(chǔ)能力等限制,隨時(shí)隨地都可以查詢,極大節(jié)約了人力物力,提升了檔案利用的滿意度。依托云計(jì)算構(gòu)建不同級(jí)別的共享空間或平臺(tái)可以提供在線式服務(wù)和交互式信息,從而可使檔案知識(shí)服務(wù)的功能得到加強(qiáng)[3]。
1.4 檔案價(jià)值數(shù)智化
大數(shù)據(jù)技術(shù)對(duì)檔案資料數(shù)據(jù)進(jìn)行識(shí)別、規(guī)范、整合和再造,構(gòu)架基于數(shù)據(jù)庫(kù)模式的大數(shù)據(jù)分析模型,以相關(guān)查詢、趨勢(shì)分析、可視化圖片等形式展現(xiàn)和分析。依托檔案管理大數(shù)據(jù)平臺(tái),根據(jù)資料類型和用戶需求,系統(tǒng)能夠自動(dòng)聚焦于數(shù)據(jù)挖掘和價(jià)值分析,實(shí)現(xiàn)分析、描述、指導(dǎo)、預(yù)測(cè)、開發(fā)等功能,為用戶提供更有效的參考決策,使檔案管理從被動(dòng)走向了主動(dòng),一定程度上實(shí)現(xiàn)智能化自動(dòng)決策。如某個(gè)部門可通過數(shù)據(jù)分析技術(shù)進(jìn)行用戶市場(chǎng)預(yù)測(cè),同時(shí)構(gòu)建用戶畫像和用戶關(guān)系圖,實(shí)現(xiàn)精準(zhǔn)服務(wù)。此外,以智慧化的服務(wù)增強(qiáng)用戶體驗(yàn),可以提高用戶決策的精準(zhǔn)度,發(fā)揮檔案資源輔助能力,提升用戶的參與度和幸福感。
2 檔案數(shù)字化轉(zhuǎn)型的問題及原因分析
“加強(qiáng)數(shù)字社會(huì)、數(shù)字政府建設(shè),提升公共服務(wù)、社會(huì)治理等數(shù)字化智能化水平”是新時(shí)代做好檔案工作的要求。加快檔案數(shù)字化轉(zhuǎn)型是信息化技術(shù)突飛猛進(jìn)的必然要求,也是檔案工作更好資政育人、展現(xiàn)檔案價(jià)值的必由之路,將推動(dòng)檔案治理體系和治理能力現(xiàn)代化。近年來,我國(guó)在檔案數(shù)字化轉(zhuǎn)型取得長(zhǎng)足進(jìn)步,但仍存在如下諸多問題。
2.1 檔案數(shù)字化整體水平不高
國(guó)家檔案局有關(guān)統(tǒng)計(jì)數(shù)據(jù)顯示,2021年全國(guó)館藏檔案數(shù)字化成果1.9萬TB。但是由于各館藏?cái)?shù)量體積龐大[4],而且主要以文本、圖片的形式存儲(chǔ),占用了較大的信息存儲(chǔ)單元,數(shù)字化識(shí)別開發(fā)難度較大。從現(xiàn)狀來看,檔案內(nèi)容識(shí)別的準(zhǔn)確率不高,存儲(chǔ)單元不夠,影響著檔案資源的查詢、開發(fā)和利用。主要包括:一是數(shù)據(jù)重復(fù)復(fù)制率高。個(gè)別缺乏責(zé)任感的外包服務(wù)商或崗位工作人員將數(shù)據(jù)復(fù)制充數(shù),這種追求數(shù)量而不顧及質(zhì)量的做法,在目前普遍采用人工抽檢的模式下,給業(yè)主方及外包服務(wù)商在數(shù)據(jù)質(zhì)量方面埋下了諸多隱患。二是影像傾斜合格率和影像裁剪合格率不高。中標(biāo)服務(wù)企業(yè)在數(shù)字化過程中,作業(yè)的設(shè)備在所難免發(fā)生顛簸,質(zhì)量檢查崗位人員也無法張張頁頁檢查到位,裁剪崗位人員對(duì)裁剪值和分辨數(shù)值難以統(tǒng)一把握,完全憑個(gè)人主觀判斷,致使后期驗(yàn)收過程中不達(dá)標(biāo)和返工,來回地辦理領(lǐng)取搬運(yùn)原始數(shù)據(jù)核對(duì)、修正等工作,也相應(yīng)增加了相關(guān)方的管理投入和成本支出。
2.2 紙質(zhì)檔案重復(fù)數(shù)字化浪費(fèi)嚴(yán)重
目前,“單套制”的管理和推廣已經(jīng)積累了一定的經(jīng)驗(yàn),但是電子文件“單套制”模式對(duì)信息化軟硬件的要求較高,同時(shí)也面臨著系統(tǒng)安全、身份識(shí)別等問題,經(jīng)驗(yàn)推廣需要一定的周期。同時(shí),大部分黨政機(jī)關(guān)單位還依然延續(xù)過去的辦公習(xí)慣,公文流轉(zhuǎn)中使用紙質(zhì)文件,導(dǎo)致了既有電子文件的存儲(chǔ),后期還會(huì)對(duì)紙質(zhì)文件再數(shù)字化,造成了資源的浪費(fèi)。主要原因是管理理念未能向現(xiàn)代管理方式轉(zhuǎn)變,沒有根據(jù)檔案管理實(shí)際和技術(shù)變革改變管理方式。檔案資料形成過程中,也存在收集重復(fù)的問題,比如在某些檔案的審批過程中,會(huì)涉及審批前的論證、審批中的批復(fù)、審批后的監(jiān)管等資料,為了全面準(zhǔn)確反映事實(shí),需要對(duì)這些資料進(jìn)行系統(tǒng)的整理,但是資料又是分散不系統(tǒng)的,在形成檔案后,既有整理后歸檔的部分,也有零散部分,存在重復(fù)性管理的格局。
2.3 檔案資源開發(fā)利用水平有待提升
檔案數(shù)字化轉(zhuǎn)型要著眼于為全社會(huì)提供高效的信息服務(wù),雖然目前單就檔案工作服務(wù)方式而言已經(jīng)基本實(shí)現(xiàn)網(wǎng)絡(luò)化,但由于對(duì)檔案資源的開發(fā)利用不足、協(xié)同性和共享性不夠、被動(dòng)式服務(wù)本質(zhì)并未明顯改善等,導(dǎo)致基于網(wǎng)絡(luò)等信息化共享平臺(tái)的檔案資源綜合性利用水平不高,難以滿足新時(shí)期用戶高效化、知識(shí)化和個(gè)性化需求[5]。有的部門共享推進(jìn)緩慢,造成了專業(yè)檔案就無法下沉一線,無法讓數(shù)據(jù)“跑路”代替群眾“跑腿”,影響了檔案利用的時(shí)效。專業(yè)檔案館、民生檔案跨館查詢程度不夠,還未形成高效的服務(wù)。對(duì)檔案開放主體來說,開放鑒定工作滯后,對(duì)檔案的開放內(nèi)容未樹立嚴(yán)謹(jǐn)?shù)墓ぷ骼砟睿瑹o法最大限度滿足單位和個(gè)人不斷擴(kuò)大的查檔需求。
3 大數(shù)據(jù)時(shí)代檔案管理信息化的路徑選擇
在當(dāng)前5G技術(shù)和大數(shù)據(jù)信息技術(shù)的驅(qū)動(dòng)下,檔案信息和用戶需求總量明顯上升,充分利用數(shù)字技術(shù),能夠減少煩瑣流程和工作環(huán)節(jié),實(shí)現(xiàn)檔案管理的轉(zhuǎn)型升級(jí)。
3.1 加強(qiáng)頂層規(guī)劃,建立數(shù)字賦能檔案管理體制機(jī)制
3.1.1積極融入國(guó)家數(shù)字戰(zhàn)略。要因地制宜、實(shí)事求是,根據(jù)信息化進(jìn)程,爭(zhēng)取上級(jí)和主管部門數(shù)字戰(zhàn)略的政策支持。加強(qiáng)組織領(lǐng)導(dǎo),出臺(tái)指導(dǎo)性的文件和政策標(biāo)準(zhǔn),助推信息化建設(shè)數(shù)字化轉(zhuǎn)型。比如浙江省檔案管理部門就主動(dòng)融入省戰(zhàn)略,檔案工作數(shù)字轉(zhuǎn)型納入政府?dāng)?shù)字型轉(zhuǎn)型的方案。
3.1.2摸清底數(shù),有序推進(jìn)。評(píng)估檔案數(shù)字化程度,主要看是否達(dá)到《“十四五”全國(guó)檔案事業(yè)發(fā)展規(guī)劃》的要求和電子文件歸檔要求,要評(píng)估現(xiàn)有設(shè)備的承載程度是否能適應(yīng)云計(jì)算、區(qū)塊鏈、人工智能的發(fā)展。比如,數(shù)字化轉(zhuǎn)型中,高性能服務(wù)器、大容量存儲(chǔ)和備份設(shè)備,以及操作系統(tǒng)、高可靠性的信息安全系統(tǒng)、數(shù)據(jù)庫(kù)管理系統(tǒng)等都是不可缺少的必備條件。
3.1.3健全保障體系建設(shè)。完善檔案信數(shù)字化建設(shè)體系和規(guī)范,對(duì)數(shù)字化操作流程、技術(shù)規(guī)范、保密要求等各方面出臺(tái)指導(dǎo)標(biāo)準(zhǔn);加強(qiáng)對(duì)數(shù)據(jù)庫(kù)、數(shù)字人文、多媒體技術(shù)的綜合運(yùn)用,推廣建設(shè)集約高效的檔案數(shù)字化平臺(tái),為檔案數(shù)字化轉(zhuǎn)型提供科技基礎(chǔ)條件。
3.2 加強(qiáng)檔案資源整合,打通數(shù)據(jù)孤島
檔案館館藏資源數(shù)字化是將檔案資源原有的文本、影像、圖表的固態(tài)形式,經(jīng)過數(shù)字技術(shù)加工處理轉(zhuǎn)換成電子檔案和數(shù)據(jù)。常用的技術(shù)形式是人工智能的通用層技術(shù):機(jī)器人、圖譜識(shí)別、語音識(shí)別、自然語言處理、語義關(guān)聯(lián)、專家系統(tǒng)等。通過這些技術(shù)手段助力檔案資源整合,可以極大提高工作效率,還可以將檔案資源融入各類數(shù)據(jù)庫(kù)的資源系統(tǒng)。如影視影像數(shù)據(jù)庫(kù)、專業(yè)檔案數(shù)據(jù)庫(kù)、自然科學(xué)數(shù)據(jù)庫(kù)、社會(huì)科學(xué)數(shù)據(jù)庫(kù)等。
開放資源整合是指收集政府機(jī)關(guān)、社會(huì)團(tuán)體、個(gè)人(包括社交媒體、新聞媒介、文化系統(tǒng))的數(shù)據(jù)服務(wù)平臺(tái)的檔案資源,打造能夠滿足不同用戶興趣偏好、個(gè)性需求的多領(lǐng)域數(shù)據(jù)資源庫(kù),打破“信息孤島”,形成“數(shù)據(jù)湖”。這些數(shù)據(jù)資源的整合極大地增加了檔案體量,提升了檔案服務(wù)質(zhì)效果,使檔案服務(wù)更加有精準(zhǔn)性,提升檔案用戶服務(wù)體驗(yàn),但整合數(shù)據(jù)資源需要面對(duì)與多部門合作的困難,因此要同步強(qiáng)化安全技術(shù)管控,確保檔案信息安全。
3.3 加強(qiáng)檔案共享平臺(tái)建設(shè),推進(jìn)信息互聯(lián)互通
檔案平臺(tái)技術(shù)化以數(shù)字技術(shù)為支撐,依賴于信息軟件、人工智能、大數(shù)據(jù)等信息技術(shù)。要實(shí)現(xiàn)檔案科學(xué)化管理,搭建技術(shù)化平臺(tái)是檔案數(shù)據(jù)化管理工作的前提,建立檔案部門與數(shù)據(jù)管理部門系統(tǒng)發(fā)展機(jī)制,依托地域大數(shù)據(jù)平臺(tái),制定統(tǒng)一的數(shù)據(jù)模式、接口標(biāo)準(zhǔn)、查詢規(guī)則,打造協(xié)同化、區(qū)域化、安全化的數(shù)據(jù)對(duì)接和共享模式。技術(shù)賦能應(yīng)用到各項(xiàng)檔案工作中,從而提升檔案服務(wù)的精準(zhǔn)性和便利性。打造檔案信息區(qū)域共享體系,建設(shè)數(shù)據(jù)互聯(lián)、共享開發(fā)、綜合利用的公共檔案資源數(shù)據(jù)服務(wù)平臺(tái),構(gòu)建全方位、全覆蓋的服務(wù)體系。比如,通過云計(jì)算、大數(shù)據(jù)技術(shù)建立檔案精準(zhǔn)服務(wù)云平臺(tái),減少人工成本,實(shí)現(xiàn)跨行業(yè)、跨地域的查詢利用。尤其在智慧檢索、模糊查詢等方面,能夠提供既快速、又準(zhǔn)確的檔案服務(wù)。
3.4 數(shù)字人文賦能,提升檔案利用實(shí)效
虛擬智慧引導(dǎo),通過人工智能、3D掃描、虛擬/增強(qiáng)現(xiàn)實(shí)等優(yōu)勢(shì),深度分析館內(nèi)檔案資源及用戶服務(wù)數(shù)據(jù),構(gòu)建虛擬時(shí)空的畫面,打破空間限制,充分滿足用戶的需求。可將地理信息科學(xué)、歷史史料與文獻(xiàn)內(nèi)容相匹配整合,使檔案中所載的歷史事件生動(dòng)“再現(xiàn)”和被“體驗(yàn)”。將經(jīng)度、緯度等地理方位信息嵌入某一檔案事件發(fā)生地的地名和年代中,并對(duì)其進(jìn)行系統(tǒng)編碼和模擬,實(shí)現(xiàn)地名與歷史事件及背景的關(guān)聯(lián)。交互式推送是堅(jiān)持遵循用戶需求的原則,構(gòu)建基于用戶喜好的對(duì)應(yīng)服務(wù)模式,為用戶提供后臺(tái)信息服務(wù),實(shí)現(xiàn)多元雙向的信息交互。精準(zhǔn)把握用戶需求是建立在完善可靠的數(shù)字化深度算法基礎(chǔ)上的,利用數(shù)字人工智能技術(shù),提升服務(wù)的質(zhì)量和針對(duì)性,滿足不同知識(shí)水平、偏好、習(xí)慣的用戶個(gè)性化需要,持續(xù)性提高檔案智慧服務(wù)提供了堅(jiān)實(shí)基礎(chǔ)。
3.5 搭建反饋機(jī)制,優(yōu)化系統(tǒng)服務(wù)
反饋與評(píng)價(jià)是指數(shù)字賦能檔案管理模式需要通過服務(wù)后評(píng)價(jià),實(shí)現(xiàn)平臺(tái)系統(tǒng)自動(dòng)更新,根據(jù)用戶反饋內(nèi)容不斷提升各項(xiàng)檔案服務(wù)水平。服務(wù)反饋與評(píng)價(jià)主要是面向檔案服務(wù)對(duì)象,對(duì)檔案智慧服務(wù)的資源內(nèi)容、個(gè)性化的體驗(yàn)感等方面及時(shí)做出反饋,運(yùn)用數(shù)字化算法進(jìn)行總結(jié)。改進(jìn)與優(yōu)化是數(shù)字化技術(shù)在嵌入檔案管理工作中發(fā)揮系統(tǒng)自動(dòng)更新優(yōu)化的過程,自動(dòng)收集用戶的反饋與評(píng)價(jià)內(nèi)容,在總結(jié)分析后進(jìn)行智能優(yōu)化升級(jí),通過實(shí)現(xiàn)檔案管理服務(wù)的良性循環(huán),吸引更多的用戶。自動(dòng)優(yōu)化過程能夠篩選用戶感興趣的資源內(nèi)容、區(qū)分資源類別、過濾吸引力較差的資源,不斷提升檔案用戶服務(wù)的精準(zhǔn)度和滿意度。
結(jié)語
數(shù)字賦能檔案管理模式為檔案管理工作帶來變革性影響,將數(shù)字技術(shù)嵌入檔案管理工作,構(gòu)建數(shù)字賦能檔案管理模式,能夠智慧性地滿足用戶對(duì)檔案的需求,實(shí)現(xiàn)檔案工作的升級(jí)轉(zhuǎn)型。在保證檔案信息安全性的前提下,改變傳統(tǒng)檔案工作中技術(shù)落后、效率低下等問題,在檔案管理工作中發(fā)揮重要影響力。
參考文獻(xiàn)
[1]馮占江,郭妙英.大數(shù)據(jù)時(shí)代的數(shù)字檔案管理思維[J].辦公室業(yè)務(wù),2019(02):05.
[2]秦美峰.云計(jì)算服務(wù)在數(shù)字檔案館中應(yīng)用途徑探析[J].網(wǎng)友世界,2013(04):30.
[3]關(guān)于進(jìn)一步推進(jìn)我國(guó)檔案數(shù)字化轉(zhuǎn)型及綜合利用的提案[J].中國(guó)檔案,2022(03):30.
作者簡(jiǎn)介:牛麗(1973— ),山東省德州生態(tài)環(huán)境監(jiān)測(cè)中心綜合室主任副研究館員,研究方向:檔案管理。