楊晶晶
摘要:在新形勢下,建設(shè)企業(yè)高質(zhì)量檔案數(shù)據(jù)中心勢在必行,我們通過檔案數(shù)據(jù)的自動(dòng)歸類整合與分析,可以有效保障企業(yè)檔案數(shù)據(jù)安全及實(shí)現(xiàn)檔案數(shù)據(jù)應(yīng)用。該文論述了企業(yè)檔案數(shù)據(jù)自動(dòng)分類管理的目標(biāo)、意義、規(guī)則設(shè)置、實(shí)施以及管理模式等,以期將檔案數(shù)據(jù)自動(dòng)分類管理進(jìn)一步推廣,使其成為企業(yè)中一項(xiàng)可持續(xù)、可執(zhí)行的常態(tài)化工作。
關(guān)鍵詞:檔案數(shù)據(jù) 數(shù)據(jù)分類 數(shù)據(jù)管理 自動(dòng)化
在數(shù)字時(shí)代背景下,企業(yè)檔案數(shù)據(jù)增長快、體量大。為充分發(fā)揮企業(yè)檔案數(shù)據(jù)的資產(chǎn)價(jià)值,使其能夠準(zhǔn)確、清晰地反映業(yè)務(wù)經(jīng)營成果,進(jìn)而推動(dòng)企業(yè)高質(zhì)量發(fā)展,企業(yè)在業(yè)務(wù)經(jīng)營管理過程中,就需要深入開展檔案數(shù)據(jù)管理,對檔案數(shù)據(jù)分類管理模式做進(jìn)一步的研究與創(chuàng)新。這里需要指出的是,本文中所提及的企業(yè)檔案數(shù)據(jù)自動(dòng)分類主要是借助專業(yè)系統(tǒng)對前端業(yè)務(wù)系統(tǒng)收集歸檔到數(shù)字檔案館中的數(shù)據(jù)實(shí)現(xiàn)自動(dòng)組卷/件、分盒、添加管理標(biāo)識(shí)等。
企業(yè)檔案數(shù)據(jù)自動(dòng)分類管理的目標(biāo)主要在于實(shí)現(xiàn)企業(yè)檔案數(shù)據(jù)自動(dòng)整編功能,按照整理規(guī)則對整編庫中的數(shù)據(jù)進(jìn)行模擬組件、裝盒,生成檔案著錄項(xiàng),自動(dòng)添加文件標(biāo)識(shí),比如歸檔章、條形碼、頁碼等,并由管理員進(jìn)行復(fù)核審查,完成檔案的整編。
企業(yè)檔案數(shù)據(jù)自動(dòng)分類管理的主要意義在于:第一,實(shí)現(xiàn)全程系統(tǒng)控制,減少了人工著錄,降低了著錄錯(cuò)誤率,提升了規(guī)范化水平;第二,極大地提高了檔案整編的工作效率,降低了人力物力成本;第三,提高了檔案整編的規(guī)范性,在整編過程中規(guī)范歸檔章、頁碼、條形碼等格式及內(nèi)容;第四,提升了企業(yè)檔案數(shù)據(jù)管理水平,優(yōu)化了其管理、存儲(chǔ)、利用整體過程。
(一)企業(yè)檔案數(shù)據(jù)自動(dòng)分類管理目標(biāo)
1.實(shí)現(xiàn)檔案數(shù)據(jù)自動(dòng)組卷/件,主要實(shí)現(xiàn)途徑為:數(shù)據(jù)組卷/件規(guī)則的設(shè)置、程序設(shè)計(jì)以及系統(tǒng)處理。
2.實(shí)現(xiàn)檔案數(shù)據(jù)著錄及編碼,主要實(shí)現(xiàn)途徑為:數(shù)據(jù)著錄規(guī)則設(shè)計(jì)、數(shù)據(jù)編碼規(guī)則設(shè)計(jì)以及系統(tǒng)處理。
3.實(shí)現(xiàn)檔案數(shù)據(jù)標(biāo)識(shí)及歸檔管理,主要實(shí)現(xiàn)途徑為:數(shù)據(jù)標(biāo)記及添加水印、數(shù)據(jù)檢查及處理、格式管理并生成歸檔文件。
4.實(shí)現(xiàn)檔案數(shù)據(jù)模擬封裝組盒,主要實(shí)現(xiàn)途徑為:數(shù)據(jù)模擬封裝規(guī)則設(shè)計(jì)、程序設(shè)計(jì)及系統(tǒng)處理。
(二)企業(yè)檔案數(shù)據(jù)自動(dòng)分類規(guī)則設(shè)置
企業(yè)檔案數(shù)據(jù)自動(dòng)分類管理功能應(yīng)與統(tǒng)一管理平臺(tái)無縫對接。在改造升級(jí)時(shí),二者可以同設(shè)計(jì)、同開發(fā)、同測試、同實(shí)施,功能建設(shè)尚未一致的應(yīng)及時(shí)通過二次開發(fā)實(shí)現(xiàn)。
自動(dòng)格式轉(zhuǎn)換是實(shí)現(xiàn)自動(dòng)整編及打印的前提,并且有利于數(shù)據(jù)及電子文件的長期保存,統(tǒng)一的格式有助于模擬組件、分盒、添加頁碼標(biāo)識(shí)等;自動(dòng)整編是系統(tǒng)整體承上啟下的重要步驟,是實(shí)現(xiàn)自動(dòng)化管理、解放人力物力的關(guān)鍵,管理員的角色也由檔案整編者向?qū)彶檎咿D(zhuǎn)變;全文檢索有助于提高查詢利用效率。各個(gè)分項(xiàng)功能互相關(guān)聯(lián),最終助力企業(yè)實(shí)現(xiàn)檔案數(shù)據(jù)的自動(dòng)化分類管理。以下為具體系統(tǒng)規(guī)則設(shè)置要求。
1.系統(tǒng)設(shè)置組卷題名規(guī)則為“年度+部門”,數(shù)據(jù)庫待整理中的文件按照系統(tǒng)分類字段自動(dòng)加入各個(gè)當(dāng)前卷(除合同/資料類數(shù)據(jù)外)。
2.行政發(fā)文、行政收文、行政合同類數(shù)據(jù)組件規(guī)則為:同一部門及保管期限一文一件,按照文件形成時(shí)間排序,同時(shí)設(shè)置部門順序。
3.生產(chǎn)合同類文件組件規(guī)則為:同一部門一文一件組件,按照文件編號(hào)排序。
4.檔案數(shù)據(jù)模擬裝盒規(guī)則為:同一部門同一保管期限內(nèi),根據(jù)文件頁面數(shù)量判定盒號(hào),盒號(hào)編制:01、02、03、04……NN。
5.檔案編號(hào)規(guī)則為:全宗號(hào)+年度+保管期限+件號(hào)。
6.將整編庫中每條數(shù)據(jù)對應(yīng)的全部電子文件進(jìn)行格式轉(zhuǎn)換及文檔合并,將電子文件按照批辦單—正文—附件的順序合并為一個(gè)PDF版式文檔。
7.合并文檔命名規(guī)則為:檔案編號(hào)+文件編號(hào)+題名。
8.將合并后的PDF版式文檔添加歸檔章、條形碼、頁碼水印。
企業(yè)檔案數(shù)據(jù)及電子文件歸檔依據(jù)企業(yè)文件材料歸檔范圍和數(shù)據(jù)保管期限表執(zhí)行,電子文件的背景信息和元數(shù)據(jù)的保管期限應(yīng)與電子文件內(nèi)容信息保管期限一致。電子文件及數(shù)據(jù)收集歸檔時(shí)間按照各類規(guī)定執(zhí)行。
(三)企業(yè)檔案數(shù)據(jù)自動(dòng)分類管理的實(shí)施
企業(yè)檔案數(shù)據(jù)自動(dòng)分類管理的組織及實(shí)施過程如下所述。
1.系統(tǒng)對檔案數(shù)據(jù)進(jìn)行處理前首先需要進(jìn)行數(shù)據(jù)檢查,“數(shù)據(jù)檢查”功能將針對打印任務(wù)中的數(shù)據(jù)進(jìn)行文件下載、文件格式轉(zhuǎn)換(將非PDF格式文件轉(zhuǎn)換為PDF格式文件),在檢查過程分別對正常的、異常的數(shù)據(jù)予以標(biāo)記。
數(shù)據(jù)檢查完成之后,系統(tǒng)就可以進(jìn)行生成歸檔文件的操作。生成歸檔文件功能,可實(shí)現(xiàn)將數(shù)據(jù)進(jìn)行標(biāo)識(shí)后按照文件順序合并生成一個(gè)版式文檔,這樣既便于數(shù)據(jù)應(yīng)用,同時(shí)又便于數(shù)據(jù)的長期保存。
2.檔案自動(dòng)組卷功能需將組卷規(guī)則設(shè)置到程序設(shè)計(jì)中,啟動(dòng)程序后,該功能項(xiàng)將待組卷數(shù)據(jù)分類別歸入不同數(shù)據(jù)卷內(nèi)。
3.生成數(shù)據(jù)編碼功能將會(huì)按照規(guī)則生成件號(hào)和檔案編號(hào)。其中,件號(hào)的生成規(guī)則為:同一部門同一保管期限內(nèi)按照文件形成時(shí)間升序排列,順序生成三位編號(hào)(位數(shù)不夠的,在數(shù)字前用“0”補(bǔ)位);檔案編號(hào)的生成規(guī)則為:全宗號(hào)+年度+保管期限+件號(hào)。生成檔案編號(hào)之前,系統(tǒng)會(huì)對必需的字段進(jìn)行檢查,當(dāng)存在必需的字為空的情況時(shí),不能進(jìn)行檔案編號(hào)生成,必需的元數(shù)據(jù)項(xiàng)為:部門、年度、保管期限。
4.自動(dòng)模擬組盒功能按照部門、保管期限、頁數(shù)的制定規(guī)則生成盒號(hào),系統(tǒng)默認(rèn)每盒頁數(shù)不超過300頁,不同部門、不同保管期限的數(shù)據(jù)不在同一盒中進(jìn)行混裝,裝盒時(shí)按照“檔案編號(hào)”字段升序順序進(jìn)行。在開始進(jìn)行自動(dòng)組盒之前,系統(tǒng)將對必需字段進(jìn)行空值驗(yàn)證,驗(yàn)證的字段為:部門、保管期限、頁數(shù)。
5.系統(tǒng)設(shè)置生成審批單功能,針對檔案數(shù)據(jù),根據(jù)數(shù)據(jù)目錄生成PDF格式審批單文件,并且自動(dòng)在生成的審批單文件中添加對應(yīng)的條形碼及歸檔章標(biāo)識(shí)。
企業(yè)檔案數(shù)據(jù)自動(dòng)分類管理系統(tǒng)的功能屬性如下所述。
第一,整編數(shù)據(jù)自動(dòng)組卷管理,主要包括:組卷設(shè)置,即依據(jù)數(shù)據(jù)管理及分類編碼數(shù)據(jù)設(shè)置組卷信息;數(shù)據(jù)分類程序設(shè)計(jì),即通過程序?qū)崿F(xiàn)類別判定自動(dòng)化輔助;數(shù)據(jù)組卷結(jié)果存儲(chǔ)使用,即對數(shù)據(jù)組卷完成結(jié)果予以查驗(yàn),查驗(yàn)無誤后,應(yīng)用組卷分類結(jié)果開展數(shù)據(jù)管理。
第二,數(shù)據(jù)編碼管理,主要包括:編碼設(shè)置,即依據(jù)數(shù)據(jù)分類規(guī)則設(shè)定數(shù)據(jù)編碼規(guī)則;關(guān)鍵字段驗(yàn)證,即對編碼規(guī)則中必要的關(guān)鍵字段實(shí)施驗(yàn)證,驗(yàn)證通過后自動(dòng)編碼;數(shù)據(jù)編碼實(shí)施并存儲(chǔ),即實(shí)施數(shù)據(jù)編碼并將數(shù)據(jù)編碼結(jié)果設(shè)定專門字段存儲(chǔ)。
第三,線下登記數(shù)據(jù)管理,主要包括:數(shù)據(jù)標(biāo)識(shí),即對線下登記數(shù)據(jù)增加數(shù)據(jù)標(biāo)識(shí),便于與接口處收集的數(shù)據(jù)統(tǒng)一管理;數(shù)據(jù)格式維護(hù),即將格式統(tǒng)一為版式文件;審批單設(shè)置及生成,即為線下登記數(shù)據(jù)設(shè)計(jì)與接口數(shù)據(jù)同類的審批單模板。
第四,數(shù)據(jù)模擬封裝及自動(dòng)組盒,主要包括:模擬封裝設(shè)置,即根據(jù)數(shù)據(jù)容量的大小判定模擬封裝設(shè)置規(guī)則;數(shù)據(jù)字段驗(yàn)證,即對開展模擬封裝的必要字段進(jìn)行驗(yàn)證,驗(yàn)證無誤后開始封裝組盒;封裝盒號(hào)判定,即對封裝盒號(hào)給出系統(tǒng)判定;封裝依據(jù)設(shè)置,即根據(jù)實(shí)際情況修改封裝依據(jù)的設(shè)置;加入當(dāng)前封裝盒,即對判定無誤的數(shù)據(jù)加入系統(tǒng)給出的模擬封裝盒;重新組成封裝盒,即對判定不準(zhǔn)確的數(shù)據(jù)重新組成模擬封裝盒。
第五,數(shù)據(jù)處理,主要包括:數(shù)據(jù)檢查,即對待處理的數(shù)據(jù)開展檢查,對于檢查正常的,進(jìn)行數(shù)據(jù)處理,而對于檢查異常的,待將異常數(shù)據(jù)處理完畢后再予以檢查;生成歸檔文件,即為數(shù)據(jù)對應(yīng)的電子文件添加標(biāo)識(shí)等必要程序后生成可用于檔案數(shù)據(jù)管理的歸檔版式文件;數(shù)據(jù)導(dǎo)出,即對待處理數(shù)據(jù)按照需求格式導(dǎo)出;數(shù)據(jù)合并上傳,即數(shù)據(jù)對應(yīng)不同電子文件的合并上傳;數(shù)據(jù)格式管理,即數(shù)據(jù)格式統(tǒng)一轉(zhuǎn)換為PDF版式文件予以管理。
系統(tǒng)建設(shè)前,企業(yè)檔案管理員對于數(shù)據(jù)整編主要依靠手工操作,質(zhì)量上可控度弱,影響了數(shù)據(jù)管理工作的質(zhì)量及效率,因此亟須改進(jìn)。隨著技術(shù)的升級(jí)及高效管理的需求,企業(yè)需要在此基礎(chǔ)上提升系統(tǒng)自動(dòng)化管理水平,加強(qiáng)前端控制,提高管理的規(guī)范性及增強(qiáng)質(zhì)量管控,降低人力物力成本,實(shí)現(xiàn)提質(zhì)增效的目標(biāo)。企業(yè)檔案數(shù)據(jù)自動(dòng)分類管理模式如圖1所示。
企業(yè)檔案數(shù)據(jù)自動(dòng)分類系統(tǒng)按照規(guī)則能夠?qū)崿F(xiàn)電子文件自動(dòng)組件功能,統(tǒng)計(jì)電子文件頁數(shù),模擬裝盒,生成著錄項(xiàng)及設(shè)計(jì)標(biāo)識(shí)水印,實(shí)現(xiàn)電子文件全文檢索等。這一系列操作大大提高了企業(yè)檔案數(shù)據(jù)管理效率,節(jié)省了人力物力,進(jìn)而可以推動(dòng)企業(yè)提質(zhì)增效,實(shí)現(xiàn)高質(zhì)量發(fā)展。
參考文獻(xiàn):
[1]楊帆,王強(qiáng).大型企業(yè)檔案資源分類體系建設(shè)實(shí)踐與思考.北京檔案,2020(10):33-34.
[2]霍光煜,張勇,孫艷豐.基于語義的檔案數(shù)據(jù)智能分類方法研究.計(jì)算機(jī)工程與應(yīng)用,2021(6):247-248.
[3]王泓.電子文件自動(dòng)分類方法概述.檔案與建設(shè),2017(1):29-31.
作者單位:中交第一航務(wù)工程勘察設(shè)計(jì)院有限公司