巫佳立 岳振興/中核龍安有限公司、三門核電有限公司
檔目前核電檔案已逐步實(shí)現(xiàn)管理信息化,隨著移動應(yīng)用技術(shù)的不斷發(fā)展,尤其是近年來大數(shù)據(jù)、云計(jì)算、人工智能等理論和技術(shù)的成熟與發(fā)展,檔案信息服務(wù)不再受時(shí)間和空間限制,在線查詢、遠(yuǎn)程服務(wù)、主動推送等利用檔案服務(wù)方式逐步實(shí)現(xiàn)。在核電檔案電子化、信息化管理的背景下,核電檔案利用者希望通過“一站式”服務(wù),直接、快速、便捷地利用檔案。因此核電檔案管理部門必須結(jié)合信息技術(shù)發(fā)展趨勢,不斷創(chuàng)新檔案利用方式,滿足實(shí)際需求。
以三門核電為例,現(xiàn)階段檔案利用還存在檔案管理部門不能根據(jù)企業(yè)發(fā)展要求主動提供服務(wù)、檔案目錄結(jié)構(gòu)與利用習(xí)慣不匹配、檔案查全率與查準(zhǔn)率都不盡如人意等問題。為此,核電檔案管理部門應(yīng)樹立主動服務(wù)企業(yè)發(fā)展和以人為本的檔案管理理念,堅(jiān)持以“利用”為核心,對文檔業(yè)務(wù)特別是檔案利用的流程和制度進(jìn)行梳理與優(yōu)化,為檔案利用服務(wù)的轉(zhuǎn)型升級提供保障??芍鲃討?yīng)用信息技術(shù)建設(shè)“檔案智能利用系統(tǒng)”,將企業(yè)發(fā)展需求、工作人員利用需求,與檔案數(shù)據(jù)資源有效融合,提供有針對性的檔案服務(wù)。
核電企業(yè)建設(shè)檔案智能利用系統(tǒng)具有現(xiàn)實(shí)意義。從用戶需求層面來說,目前核電企業(yè)檔案管理系統(tǒng)的文檔檢索功能不全面、配置不豐富,工作人員查詢利用文檔效率不高、用戶體驗(yàn)較差。建設(shè)檔案智能利用系統(tǒng)可以根據(jù)用戶需求有針對性地提供檔案信息,有效破解檔案“供給”和“利用”之間的矛盾,并提升用戶體驗(yàn)。從技術(shù)應(yīng)用層面來說,目前信息技術(shù)已經(jīng)得到廣泛應(yīng)用,以核電企業(yè)為例,三門核電、江蘇核電等企業(yè)為例,上述企業(yè)將信息技術(shù)應(yīng)用于信函智能批分等工作中,推動工作提質(zhì)增效。核電企業(yè)完全可以利用信息技術(shù)做好檔案利用服務(wù)。
核電檔案智能利用系統(tǒng)能夠自動收集和分析用戶利用需求,轉(zhuǎn)化為以檔案元數(shù)據(jù)為內(nèi)容的結(jié)構(gòu)化系統(tǒng)配置規(guī)則,通過系統(tǒng)自動執(zhí)行規(guī)則向工作人員配置檔案目錄結(jié)構(gòu)、提供檔案利用服務(wù)。其主要功能可以概括為“隱性需求顯性化、顯性需求結(jié)構(gòu)化、結(jié)構(gòu)規(guī)則信息化、利用信息數(shù)據(jù)化、數(shù)據(jù)信息智能化”。
隱性需求顯性化指檔案人員通過有效方式收集、匯總和分析用戶檔案利用需求,在這其中收集是重中之重,因?yàn)樾枨笫占欠裢暾?、?zhǔn)確直接決定了檔案智能利用系統(tǒng)能否滿足用戶個(gè)性化、精細(xì)化、知識化的利用要求,決定了后續(xù)利用需求能否有效轉(zhuǎn)化為相關(guān)元數(shù)據(jù)。收集的主要內(nèi)容包括檔案主題、類型、形成單位、形成時(shí)間、利用頻率、配置范圍等。
這一項(xiàng)工作可采用系統(tǒng)收集或人工收集的方式開展。如采用系統(tǒng)收集和分析數(shù)據(jù),檔案人員需要進(jìn)行提前確認(rèn),如業(yè)務(wù)人員檢索的關(guān)鍵字、檔案點(diǎn)擊率、檔案查閱時(shí)長等,確保系統(tǒng)收集的數(shù)據(jù)能全面反映用戶利用需求。如采用人工收集和分析數(shù)據(jù),檔案人員需要基于檔案利用者的視角開展工作,形成較為完整的利用需求。主要的收集途徑如下。一是通過賬戶信息初始設(shè)置時(shí)收集,即在創(chuàng)建賬戶或者首次登錄時(shí)由業(yè)務(wù)人員填寫其責(zé)任范圍的系統(tǒng)、設(shè)備或子項(xiàng)等,及其關(guān)注的檔案范圍。系統(tǒng)可根據(jù)崗位職責(zé)預(yù)設(shè)相對應(yīng)的配置規(guī)則作為輔助手段;二是通過定期訪談、問卷調(diào)查、檔案宣傳等方式收集利用需求;三是通過檔案借閱、查詢等數(shù)據(jù)分析收集檔案利用需求;四是根據(jù)項(xiàng)目進(jìn)展情況,或利用主管部門進(jìn)行專項(xiàng)檢查的契機(jī)收集利用需求;五是通過文檔服務(wù)信箱、微信公眾號等收集檔案利用需求。
顯性需求結(jié)構(gòu)化是將用戶的利用需求轉(zhuǎn)化為具體的檔案標(biāo)題、文件編碼、文件類型、形成單位、接收日期等元數(shù)據(jù)及其組合,以上轉(zhuǎn)化是否成功將直接決定檔案配置規(guī)則能否滿足利用要求。這項(xiàng)工作是檔案智能利用系統(tǒng)的基礎(chǔ)性功能。
為確保轉(zhuǎn)化效果,檔案人員應(yīng)當(dāng)提供統(tǒng)一、規(guī)范的檔案元數(shù)據(jù),可以重點(diǎn)從以下三個(gè)方面著手。首先建立檔案元數(shù)據(jù)著錄程序,明確元數(shù)據(jù)的著錄內(nèi)容、標(biāo)準(zhǔn);其次對元數(shù)據(jù)著錄、檢查人員開展專項(xiàng)培訓(xùn),減少人因失誤;最后設(shè)置系統(tǒng)級數(shù)據(jù)著錄校驗(yàn)規(guī)則和環(huán)節(jié),確保著錄信息有效性。
在具體轉(zhuǎn)化時(shí),必須要確保轉(zhuǎn)化元數(shù)據(jù)的數(shù)值準(zhǔn)確、內(nèi)容完整;要確保轉(zhuǎn)化元數(shù)據(jù)之間邏輯關(guān)系嚴(yán)密、精準(zhǔn)、簡單并且規(guī)則唯一;還要確保轉(zhuǎn)化的元數(shù)據(jù)易于被計(jì)算機(jī)識別,因此要以數(shù)字、字母組成的編碼為主,避免使用文字。如,“反應(yīng)堆冷卻劑系統(tǒng)(系統(tǒng)代碼為RCS)近一年的設(shè)計(jì)變更(文件類型代碼為GEF)”,采用文字的方式為,選取文件標(biāo)題包含“反應(yīng)對冷卻劑系統(tǒng)”“設(shè)計(jì)變更”且接收時(shí)間為“前一年內(nèi)”的轉(zhuǎn)化規(guī)則;而采用編碼的方式為,選取為文件編碼包含“RCS”“GEF”且接收時(shí)間為“前一年內(nèi)”的元數(shù)據(jù)組合。采用編碼的方式更易于計(jì)算機(jī)識別,用戶利用效果更好。
結(jié)構(gòu)規(guī)則信息化是將轉(zhuǎn)化的元數(shù)據(jù)規(guī)則在系統(tǒng)后臺配置成系統(tǒng)可執(zhí)行的流程,最終形成用戶個(gè)性化的目錄結(jié)構(gòu)、檔案更新的推送信息等,結(jié)構(gòu)規(guī)則信息化將直接決定檔案智能利用系統(tǒng)能否滿足人員使用需要,這是檔案智能利用系統(tǒng)實(shí)施的重點(diǎn)。
在后臺規(guī)則配置過程中,檔案管理人員需配合完成的主要工作為:提供準(zhǔn)確完整的、邏輯嚴(yán)密的結(jié)構(gòu)化元數(shù)據(jù)規(guī)則;提供檔案智能利用系統(tǒng)啟停的條件;提供檔案成果推送信息的主要內(nèi)容、原則、對象、頻次。在系統(tǒng)前臺展示方面,檔案管理人員需要重點(diǎn)關(guān)注定制化、個(gè)性化、多維度的檔案目錄結(jié)構(gòu);信息動態(tài)推動方式及信息內(nèi)容;檔案成果的匯總報(bào)表及相關(guān)更新數(shù)據(jù)。
利用信息數(shù)據(jù)化是將用戶檢索內(nèi)容、查閱頻次、查閱時(shí)長等行為信息轉(zhuǎn)化為具體的數(shù)據(jù),系統(tǒng)對上述數(shù)據(jù)按照既定規(guī)則進(jìn)行統(tǒng)計(jì)、分析,從而了解和掌握用戶檔案利用情況,發(fā)現(xiàn)檔案利用的變化趨勢,進(jìn)而更新和優(yōu)化檔案智能利用的配置規(guī)則,持續(xù)完善檔案智能利用系統(tǒng)。這是發(fā)現(xiàn)用戶潛在利用需求、持續(xù)提升檔案服務(wù)質(zhì)量的重要途徑,并且有助于提高檔案查全率和查準(zhǔn)率。利用信息數(shù)據(jù)化是檔案智能利用系統(tǒng)的關(guān)鍵功能。
目前用戶行為收集技術(shù)在軟件層面已經(jīng)比較成熟,技術(shù)類型也較多,目前主流的有直接Web日志的抓取、JavaScprit標(biāo)記等。在Web應(yīng)用的訪問過程中,每個(gè)請求都代表著一個(gè)用戶行為,Web日志的抓取可以獲取如停留時(shí)間、訪問對象等一系列信息。同時(shí)每個(gè)網(wǎng)頁都會在瀏覽器中以源碼的形式保存,腳本標(biāo)記通過抓取頁面信息獲取用戶的當(dāng)前動作及對象。
針對檔案智能利用系統(tǒng),利用信息數(shù)據(jù)化可以通過日志抓取和腳本標(biāo)記相結(jié)合的形式進(jìn)行,針對內(nèi)容的檢索記錄、檔案利用等都通過日志抓取來保證數(shù)據(jù)的準(zhǔn)確性,同時(shí)進(jìn)行系統(tǒng)應(yīng)用日志收集,進(jìn)一步完善基礎(chǔ)需求數(shù)據(jù)。
利用數(shù)據(jù)智能化指核電檔案智能利用系統(tǒng)通過配置的算法自動分析統(tǒng)計(jì)檔案利用數(shù)據(jù),更新配置的規(guī)則、范圍、目錄結(jié)構(gòu)、檢索結(jié)果、推送信息等,最終實(shí)現(xiàn)自動化、智能化推送,這是檔案智能利用系統(tǒng)的核心價(jià)值。
當(dāng)前大數(shù)據(jù)分析主要應(yīng)用已有較多成熟技術(shù),供應(yīng)商也可根據(jù)用戶需求提供專門的解決方案。實(shí)現(xiàn)利用數(shù)據(jù)智能化的重點(diǎn)在于總結(jié)提煉檔案利用數(shù)據(jù)的算法,利用人員檢索檔案的范圍、關(guān)鍵詞出現(xiàn)頻率、文件被檢索次數(shù)、文件閱讀停留時(shí)長等都能直接反應(yīng)用戶利用需求,為此根據(jù)利用人員查詢或者直接利用某類檔案的次數(shù)匹配算法進(jìn)行檔案智能利用規(guī)則配置,最為簡單和高效。