摘要:在國家大數(shù)據(jù)戰(zhàn)略的強(qiáng)力推動和信息技術(shù)不斷普及的背景下,數(shù)據(jù)大量形成,相關(guān)概念日益普及,數(shù)據(jù)管理領(lǐng)域迅速發(fā)展,形成時代潮流。文章首先解讀數(shù)據(jù)管理大潮,其次梳理電子文件管理面臨的挑戰(zhàn),最后嘗試分析可能的對策。電子文件管理面臨受到數(shù)據(jù)管理相關(guān)概念沖擊、海量數(shù)據(jù)難以歸檔和管理、在數(shù)據(jù)管理框架中定位單薄、相關(guān)主管部門博弈艱難等挑戰(zhàn),需要建立電子文件與數(shù)據(jù)管理概念關(guān)聯(lián),堅(jiān)定推動單軌制電子文件管理,鍛造多元數(shù)據(jù)管理能力,構(gòu)建協(xié)同發(fā)展的電子文件數(shù)據(jù)管理生態(tài)環(huán)境。
關(guān)鍵詞:數(shù)據(jù)管理 電子文件管理 數(shù)據(jù)治理 融合發(fā)展
Abstract:In the context of the strong promo? tion of the national big data strategy and the contin? uous popularization of information technology, a large amount of data has formed, related concepts have become increasingly popular, and the field of data management has developed rapidly, which is forming a tide of the times. This paper first inter? prets the trend of data management, then sorts out the challenges faced by electronic records man? agement, and finally tries to analyze possible coun? termeasures. Electronic records management is faced with challenges such as being impacted by the concepts related to data management, difficul? ty to archive and manage massive data, poor posi? tioning in the data management framework, and dif? ficult gaming between relevant authorities. It is nec? essary to establish concept relationships between electronic records management and data manage? ment and firmly promote digital continuity, forging multiple data management capabilities, and build? ing a coordinated ecological environment for the in? tegrated development of electronic records and da? ta management.
Keywords:Data management; Electronic re? cords management; Data governance; Integrated development
21世紀(jì)20年代,在大數(shù)據(jù)技術(shù)快速發(fā)展和國家大數(shù)據(jù)戰(zhàn)略的強(qiáng)力推動下,數(shù)據(jù)概念日益普及,走入中央政府的文件里,走入大眾媒體的話語體系中,“數(shù)據(jù)資產(chǎn)”的價值已經(jīng)獲得廣泛共識。數(shù)據(jù)管理相關(guān)政策標(biāo)準(zhǔn)先后出臺,行業(yè)組織和實(shí)踐活動日益活躍,圍繞著數(shù)據(jù)展開的管理已經(jīng)形成了非常大的一股潮流,電子文件管理既是這個大潮的一部分,又受到其強(qiáng)烈的影響。本文首先解讀數(shù)據(jù)管理大潮,其次梳理電子文件管理面臨的挑戰(zhàn),最后嘗試分析可能的對策。
(一)數(shù)據(jù)海量生成
聯(lián)合國官方網(wǎng)站指出:“世界上的數(shù)據(jù)量呈指數(shù)增長,約90%的數(shù)據(jù)是過去兩年創(chuàng)造的,預(yù)計(jì)數(shù)據(jù)量每年將增長40%。”[1]希捷與IDC預(yù)計(jì),2025年全球的數(shù)據(jù)量將是2016年數(shù)據(jù)量的十倍,達(dá)到163ZB。[2]這預(yù)示著電子文件的數(shù)量正以驚人速度增長。與此同時,越來越多的新增數(shù)據(jù)是過去沒有的新型形式,換言之是檔案部門不熟悉的數(shù)字對象,如機(jī)器自動采集的科學(xué)觀測數(shù)據(jù)、關(guān)系復(fù)雜的社交媒體數(shù)據(jù)、內(nèi)容極為豐富的3D數(shù)據(jù)等。“大”數(shù)據(jù)時代已經(jīng)來臨。
(二)數(shù)據(jù)管理大軍集結(jié)
在手工管理環(huán)境下,圖書館,檔案部門(檔案館、檔案室)以及傳統(tǒng)的情報(bào)分析機(jī)構(gòu)是集中保管數(shù)據(jù)的主力軍,處于中心位置。隨著信息技術(shù)的應(yīng)用,數(shù)據(jù)管理主體迅速多元化,單位內(nèi)部的信息技術(shù)中心、數(shù)據(jù)中心,大數(shù)據(jù)管理機(jī)構(gòu)、電子政務(wù)管理部門、第三方信息服務(wù)商等不斷出現(xiàn)。[3]在工信部《關(guān)于工業(yè)大數(shù)據(jù)發(fā)展的指導(dǎo)意見》(工信部信發(fā)〔2020〕67號)、國資委《關(guān)于加快推進(jìn)國有企業(yè)數(shù)字化轉(zhuǎn)型工作的通知》[4]等政策推動下,一些企業(yè)設(shè)置了新型數(shù)據(jù)管理部門,大力推動數(shù)據(jù)治理。在此情況之下,業(yè)務(wù)數(shù)據(jù)管理格局已經(jīng)改變,哪怕是歷史業(yè)務(wù)數(shù)據(jù)管理領(lǐng)域,檔案部門也已經(jīng)不是獨(dú)行者,核心位置受到了很大的沖擊。比如,全國有20家國家級的科學(xué)數(shù)據(jù)中心,管理著國家最為重要的新型科技電子文件、電子檔案——科學(xué)數(shù)據(jù),但顯然已經(jīng)和檔案部門甚少交集。[5]
(三)數(shù)據(jù)管理技術(shù)推陳出新
信息技術(shù)的發(fā)展可謂推陳出新,新技術(shù)不斷涌現(xiàn)和迭代,比如版本控制、文檔協(xié)作、圖文轉(zhuǎn)錄、自動采集等數(shù)據(jù)生成技術(shù),數(shù)據(jù)庫、數(shù)據(jù)倉庫、數(shù)據(jù)湖、數(shù)據(jù)中臺等數(shù)據(jù)集中存儲處理技術(shù),數(shù)據(jù)挖掘、文本分析、知識圖譜等數(shù)據(jù)分析和開發(fā)技術(shù),數(shù)字簽名、數(shù)字摘要、時間戳、區(qū)塊鏈等數(shù)據(jù)真實(shí)性維護(hù)技術(shù)等。近年來機(jī)器學(xué)習(xí)技術(shù)的突破性發(fā)展帶動了人工智能應(yīng)用的熱潮,涉及文件檔案管控決策、知識服務(wù)和數(shù)據(jù)化處理的方方面面。這些技術(shù)相互疊加融合,呈現(xiàn)出一幅非常復(fù)雜的圖景。為何新出現(xiàn)的數(shù)據(jù)管理部門都是技術(shù)實(shí)力雄厚之主體?原因很簡單,新型的、海量的數(shù)據(jù)管理需要使用與數(shù)據(jù)特性相匹配的新技術(shù),唯有技術(shù)掌握者才能掌控資源。
(四)數(shù)據(jù)管理政策法規(guī)匯攏
在國家開啟信息化戰(zhàn)略之初,信息資源就被作為重要的要素之一。隨著信息化推進(jìn),尤其是大數(shù)據(jù)技術(shù)的普及,數(shù)據(jù)的價值認(rèn)同達(dá)到空前的高度,2020年前后,各類相關(guān)政策法規(guī)以“數(shù)據(jù)”為主題標(biāo)識迅速匯攏。2020年4月9日,《中共中央國務(wù)院關(guān)于構(gòu)建更加完善的要素市場化配置體制機(jī)制的意見》對外公布,數(shù)據(jù)作為一種新型生產(chǎn)要素寫入文件中。2020年7月和10月,《數(shù)據(jù)安全法》《個人信息保護(hù)法》的草案先后公布,2021年4月《數(shù)據(jù)安全法》《個人信息保護(hù)法》二審稿面向社會公眾征求意見,[6]這兩部法律將為數(shù)據(jù)生產(chǎn)要素作用的發(fā)揮保駕護(hù)航。2016—2020年間,國家先后在政務(wù)、科技、工業(yè)、文化領(lǐng)域出臺數(shù)據(jù)管理相關(guān)政策,包括《政務(wù)信息資源共享管理暫行辦法》(國發(fā)〔2016〕51號)、《科學(xué)數(shù)據(jù)管理辦法》(國辦發(fā)〔2018〕17號)、《關(guān)于工業(yè)大數(shù)據(jù)發(fā)展的指導(dǎo)意見》(工信部信發(fā)〔2020〕67號)、《關(guān)于做好國家文化大數(shù)據(jù)體系建設(shè)工作的通知》(文改辦發(fā)〔2020〕3號)等,推動各行各業(yè)數(shù)據(jù)管理的發(fā)展。
(一)“一統(tǒng)天下”的數(shù)據(jù)概念
《數(shù)據(jù)安全法(草案)》第三條指出:“本法所稱數(shù)據(jù),是指任何以電子或者非電子形式對信息的記錄。”這里的數(shù)據(jù)概念非常之寬,所有信息記錄都是數(shù)據(jù)。長期以來,檔案界一直在文件、檔案概念之間爭吵不休。毫無疑問,文件也好,檔案也罷,都是電子或非電子形式的信息記錄,都是數(shù)據(jù)。隨著數(shù)據(jù)概念的流行,一方面,“文件檔案究竟是什么樣的數(shù)據(jù)”的問題日益突出,若回答不清楚這個問題,便無法明確檔案部門在數(shù)據(jù)管理大潮中的定位;另一方面,數(shù)據(jù)管理的相關(guān)概念也隨之流行,包括數(shù)據(jù)歸檔、數(shù)據(jù)治理等,將對檔案界的概念理解造成沖擊,比如數(shù)據(jù)歸檔多指不活躍數(shù)據(jù)的冷存儲,與文件歸檔概念存在較大差異。[7]在這些數(shù)據(jù)概念的沖擊下,檔案專業(yè)概念面臨被淡化、被誤解的風(fēng)險(xiǎn),檔案工作的社會角色也面臨挑戰(zhàn)。
(二)海量數(shù)據(jù)的歸檔與管理
新增的海量數(shù)據(jù)會有多大比例歸檔?如何選擇和留存?檔案部門的技術(shù)支撐如何?這些是擺在我們面前的迫切問題,能否回答好這些問題,關(guān)系到檔案部門在未來能否勝任留存數(shù)字時代留存社會記憶的法定職責(zé)。從大的方面來說,電子文件歸檔工作面臨兩大挑戰(zhàn)。
一是遠(yuǎn)超既往數(shù)量的海量數(shù)據(jù),檔案專業(yè)系統(tǒng)的底層技術(shù)能否支撐歸檔相關(guān)應(yīng)用。在調(diào)研過程中,筆者聽說過因歸檔文件數(shù)量達(dá)到千萬級別導(dǎo)致系統(tǒng)崩潰的情況,這涉及系統(tǒng)技術(shù)架構(gòu)和技術(shù)能力。業(yè)界此前對電子文件歸檔管理相關(guān)系統(tǒng)的討論多聚焦于功能,而對技術(shù)的先進(jìn)性、可拓展性則較少涉獵。世界上凡是有影響力的數(shù)據(jù)管理機(jī)構(gòu)無不立足技術(shù)高峰。美國國會圖書館2010年獲得twitter授權(quán)保存所有推文,歷時多年仍無成果對外公布,技術(shù)掣肘乃重要因素,這值得我們所有傳統(tǒng)數(shù)據(jù)管理部門重視。[8]
二是缺乏傳統(tǒng)檔案對應(yīng)物的新類型數(shù)據(jù),這些數(shù)據(jù)很難“原樣”歸檔,應(yīng)如何決策。以電子發(fā)票為例,發(fā)票數(shù)據(jù)產(chǎn)生時為結(jié)構(gòu)化數(shù)據(jù),為了符合人們原來使用習(xí)慣的憑證,按照固定表單樣式生成版式、加蓋電子簽名輸出電子發(fā)票文檔。事實(shí)上結(jié)構(gòu)化數(shù)據(jù)已經(jīng)保留了電子發(fā)票的所有內(nèi)容信息,也可以生成數(shù)字簽名,從功能而非形式來看完全可以履行交易憑證的作用,所以在電子發(fā)票技術(shù)界存在是否保留版式發(fā)票的爭論。再如三維模型包含了之前多份二維圖紙的信息,具有高度的復(fù)雜性和集成性,在歸檔時候是將其作為一個簡單的對象收過來管,還是到模型的內(nèi)部去做一些選擇和加工?這些都是新時代的新問題,需要我們深入電子文件數(shù)據(jù)內(nèi)部,認(rèn)識數(shù)據(jù)構(gòu)成,了解相關(guān)規(guī)則,逐個場景加以鉆研判斷。
(三)層次單薄的文件管理定位
文件管理在數(shù)據(jù)管理中定位如何?對這個問題的回答既有檔案界的自我認(rèn)知,也有外部認(rèn)知。國際數(shù)據(jù)管理協(xié)會(DAMA International)的數(shù)據(jù)管理職能框架反映了技術(shù)主導(dǎo)的數(shù)據(jù)管理領(lǐng)域的基本認(rèn)識。在圖1中,一個單位內(nèi)部所有的數(shù)據(jù)管理職能活動有三個層次,最高層次是監(jiān)督層,主要包括對整個數(shù)據(jù)管理開展戰(zhàn)略規(guī)劃、建立原則和策略等內(nèi)容的數(shù)據(jù)治理,以及推動適應(yīng)數(shù)據(jù)管理的文化變革。中間層次是我們非常熟悉的生命周期管理,包含規(guī)劃與設(shè)計(jì)、實(shí)現(xiàn)與維護(hù)、使用和增強(qiáng)三類活動。最下面的層次是支撐整個數(shù)據(jù)生命周期管理的基礎(chǔ)活動,包括風(fēng)險(xiǎn)管理、元數(shù)據(jù)管理、數(shù)據(jù)質(zhì)量管理等?!拔募蛢?nèi)容管理”屬于中間層次“生命周期管理”中的最后一個類別“使用和增強(qiáng)”。其中“內(nèi)容”指非結(jié)構(gòu)化數(shù)據(jù),它是一個技術(shù)術(shù)語,現(xiàn)有文件檔案管理系統(tǒng)大多為非結(jié)構(gòu)化數(shù)據(jù)管理的產(chǎn)品或解決方案。而在檔案界的認(rèn)知中,文件檔案管理貫穿數(shù)據(jù)整個生命周期,覆蓋監(jiān)督、生命周期管理和基礎(chǔ)活動所有層次。目前內(nèi)外認(rèn)知差別巨大,層次單薄的定位對電子文件管理的深化發(fā)展造成巨大挑戰(zhàn)。
(四)艱難博弈中的國家數(shù)據(jù)治理的格局
上文提及國家對數(shù)據(jù)和數(shù)據(jù)管理越來越重視,頒布了系列政策法規(guī),全面覆蓋政務(wù)、科學(xué)、工業(yè)、文化等多個領(lǐng)域,但是文件檔案體現(xiàn)甚少,且缺乏銜接。比如,《促進(jìn)大數(shù)據(jù)發(fā)展行動綱要》(國發(fā)〔2015〕50號)規(guī)定“加強(qiáng)數(shù)字圖書館、檔案館、博物館、美術(shù)館和文化館等公益設(shè)施建設(shè),構(gòu)建文化傳播大數(shù)據(jù)綜合服務(wù)平臺”。但是《關(guān)于做好國家文化大數(shù)據(jù)體系建設(shè)工作的通知》(文改辦發(fā)〔2020〕3號)并未涉及檔案館。這樣的局面對于文件檔案管理納入數(shù)據(jù)管理極其不利。一些地方、個別行業(yè)開始尋求突破。如浙江、江西、上海等多地的檔案部門將檔案共享服務(wù)嵌入政務(wù)服務(wù)平臺,啟動跨部門跨地區(qū)的信息資源共享;2020年10月份頒布的《科學(xué)技術(shù)研究檔案管理規(guī)定》(國家檔案局、科技部第15號令),首次把科學(xué)數(shù)據(jù)納入科研文件歸檔范圍中。盡管如此,在國家數(shù)據(jù)治理的整體格局中,文件檔案管理遠(yuǎn)未占據(jù)其應(yīng)用的位置。
(一)塑新思維:建立電子文件與數(shù)據(jù)的概念關(guān)聯(lián)
電子文件是什么樣的數(shù)據(jù)對象?它與其他的數(shù)據(jù)對象有何區(qū)別?我們通常會說電子文件是電子化業(yè)務(wù)的信息記錄,是業(yè)務(wù)憑證性、記憶性信息,會強(qiáng)調(diào)其固化特性,實(shí)際操作時會要求“版式文件”格式存檔。然而,一方面,因?yàn)殡娮游募c計(jì)算機(jī)文件之間并不僅僅是一一對應(yīng)的簡單關(guān)系,還可能存在一對多、多對一、多對多的復(fù)雜關(guān)系;[9]另一方面,計(jì)算機(jī)文件中包含越來越多地依賴軟件實(shí)現(xiàn)的功能性要素,比如電子簽名、數(shù)字摘要、超級鏈接等。[10]因此,單一的版式格式并不能完全承載電子文件信息保存的歷史重任,需要我們對電子文件數(shù)據(jù)對象有更為全面立體的認(rèn)知。筆者認(rèn)為電子文件在更多意義上是數(shù)據(jù)的邏輯組合,它可以被視作一個動態(tài)生長的業(yè)務(wù)數(shù)據(jù)體?!皠討B(tài)生長”的意義在于:第一,電子文件的構(gòu)成和呈現(xiàn)方式并非一成不變,而是要隨著環(huán)境的變化不斷變化;第二,上述變化過程不是被動的轉(zhuǎn)變,而是有規(guī)劃、有設(shè)計(jì)的求變,從這個意義上來講,檔案部門參與電子文件的動態(tài)變化過程,換句話說參與構(gòu)建了電子檔案;第三,電子文件的歸檔,并不強(qiáng)求所有要素原封不動留存,而是要根據(jù)保存條件和相應(yīng)規(guī)則去選擇業(yè)務(wù)的真實(shí)數(shù)據(jù),在選擇的過程中,部分要素是可舍、可換、可變的;第四,需要用持續(xù)的元數(shù)據(jù)來描述和補(bǔ)充維系業(yè)務(wù)真實(shí)記錄的價值;第五,電子文件數(shù)據(jù)體本身可能有相對靈活的組織和展示的方式,但是,不管具體的組織和展現(xiàn)方式如何,有機(jī)關(guān)聯(lián)一直會是文件數(shù)據(jù)的血脈。在數(shù)據(jù)世界里,我們需要轉(zhuǎn)換思維,重新認(rèn)識管理對象,從數(shù)據(jù)流動生長的過程中觀察和積累什么是文件檔案管理視角,并以新思維來反哺推動電子文件管理方法的革新。
(二)夯實(shí)基礎(chǔ):堅(jiān)定推動電子文件單軌制管理
文件檔案管理是非常有特色、有傳統(tǒng)、有積累的一個領(lǐng)域。若要在新興數(shù)據(jù)管理中占得一席之地,得有自己的看家本事,即獨(dú)特的數(shù)據(jù)管理視角、方法和技能。那么文件檔案管理進(jìn)入數(shù)據(jù)管理的看家本事是什么?筆者以為就是在單軌制進(jìn)程中積累的電子文件管理知識技能和方法。一方面,檔案界從憑證性保護(hù)的角度持續(xù)探索數(shù)據(jù)管理路徑,沒有其他領(lǐng)域像文件檔案管理領(lǐng)域如此重視憑證性業(yè)務(wù)信息的管理和維護(hù),本領(lǐng)域?qū)W⑽募ο髽?gòu)成、元數(shù)據(jù)、四性維護(hù)、四性檢測等問題,在反復(fù)應(yīng)用和研究的過程中已經(jīng)逐漸形成一套理論和方法體系。另一方面,檔案界也在數(shù)字世界里傳承和探索文件價值鑒定、維護(hù)文件關(guān)聯(lián)的方式方法,這對于數(shù)據(jù)管理是有益的補(bǔ)充。這些獨(dú)特的貢獻(xiàn)將是我們進(jìn)入數(shù)據(jù)管理的基礎(chǔ)。在筆者和數(shù)據(jù)管理部門有限的交流中,也了解到在元數(shù)據(jù)方案、信息組織、數(shù)據(jù)真實(shí)性維護(hù)等方面信息技術(shù)領(lǐng)域亦在向文件檔案領(lǐng)域?qū)W習(xí)。
因此,應(yīng)在國家層面堅(jiān)定地推行單軌制電子文件管理,在此過程中夯實(shí)專業(yè)根基、積累經(jīng)驗(yàn),將我們的專長擴(kuò)大化,而不是在猶豫觀望中降低對電子文件的管理要求,延誤專業(yè)知識更新和積累的良好時機(jī)。2021年開始實(shí)施的新《中華人民共和國檔案法》,提出了電子檔案“來源可靠、程序規(guī)范、要素合規(guī)”的法定條件,為電子文件單軌運(yùn)行、單套保存提供了法律保障。根據(jù)調(diào)研結(jié)果,電子公文、電子發(fā)票、工程項(xiàng)目電子質(zhì)檢單等類型電子文件單套制歸檔正在加快試點(diǎn),有鋪開之勢。
(三)多元路線:鍛造數(shù)據(jù)管理的能力
電子文件管理需要依靠以系統(tǒng)為中心的綜合體系。然而,擺在我們面前的一個事實(shí)是:檔案部門普遍缺乏技術(shù)實(shí)力來接收一些特殊類型的數(shù)據(jù)實(shí)體,比如結(jié)構(gòu)化數(shù)據(jù)、三維數(shù)據(jù)、社交媒體數(shù)據(jù)等對于形成軟件有嚴(yán)重依賴的文件,這些文件即便脫離原始環(huán)境保存下來,看上去也極有可能在一定程度上丟失原件的風(fēng)貌。在此背景下,我們管理數(shù)據(jù)的能力要得到進(jìn)一步的鍛造。筆者以為無論是總體技術(shù)路線,還是具體技術(shù)應(yīng)用,都需要著力加強(qiáng)。
電子文件歸檔的總體性技術(shù)路線有兩個:一是將其物理歸檔到檔案管理系統(tǒng)來加以管理,這種路線延續(xù)了傳統(tǒng)檔案實(shí)體管理的做法;二是電子文件實(shí)體仍然留在原來系統(tǒng)當(dāng)中管控,其部分元數(shù)據(jù)可能同步傳送至檔案管理系統(tǒng)中,這種邏輯歸檔模式是新環(huán)境下的新路線,對檔案部門的管控提出了很高的要求。比如中石油按照系統(tǒng)中所形成的數(shù)據(jù)類型將87個統(tǒng)建業(yè)務(wù)系統(tǒng)劃分為綜合管理型系統(tǒng)、經(jīng)營管理型系統(tǒng)、生產(chǎn)運(yùn)行型系統(tǒng)、連續(xù)監(jiān)測型系統(tǒng)等四大類,對每類系統(tǒng)的數(shù)據(jù)歸檔范圍、歸檔方式及長久保存模式制定不同方案。其中,綜合管理型、經(jīng)營管理型系統(tǒng)中的數(shù)據(jù)采用物理歸檔方式,而生產(chǎn)運(yùn)行型系統(tǒng)、連續(xù)監(jiān)測型系統(tǒng)中的數(shù)據(jù)歸檔后仍在原系統(tǒng)中保管。[11]邏輯歸檔提出多年,期間也受到質(zhì)疑和挑戰(zhàn),目前的迫切任務(wù)是落地實(shí)施。但是,從長遠(yuǎn)來看,電子文件終將脫離其形成系統(tǒng)而保存。因此,我們一方面要探索邏輯歸檔方案中檔案部門的管控之道,另一方面,面向電子檔案長期保存的系統(tǒng)研發(fā)和技術(shù)選擇將是解決問題的根本之道。
隨著大數(shù)據(jù)、人工智能、區(qū)塊鏈等新技術(shù)的不斷出現(xiàn)和持續(xù)應(yīng)用,一個很自然的問題就是檔案部門應(yīng)該采用哪些數(shù)據(jù)開發(fā)和管理的新技術(shù),強(qiáng)化文件檔案數(shù)據(jù)資產(chǎn)的管理能力,活化文檔資源開發(fā)?新技術(shù)在文件檔案管理中應(yīng)用有三個方向,[12]每個方向都有待探路:一為管控,即文件生命周期全過程的規(guī)范化管控提供決策支持,如自動分類、自動鑒定等,在文件數(shù)量激增且檔案專業(yè)人員相對匱乏的情況下,管控智能化給出了破解難題的機(jī)會;二為利用,即開發(fā)檔案內(nèi)容服務(wù)利用需求,如智能推薦、關(guān)聯(lián)檢索等,現(xiàn)在的用戶逐漸會用一些互聯(lián)網(wǎng)使用習(xí)慣、體驗(yàn)來要求文件檔案服務(wù),如在淘寶上購物時,當(dāng)用戶購買了某個產(chǎn)品之后系統(tǒng)會推薦另外類似或相關(guān)東西,那么就會對電子文件、電子檔案管理系統(tǒng)抱有類似期待,即在用戶利用了一份文件之后推薦相關(guān)材料;三為數(shù)據(jù)化,即將面向人工閱讀理解的大顆粒文檔加工轉(zhuǎn)變?yōu)闄C(jī)器可以識讀、理解和計(jì)算的小顆粒數(shù)據(jù),為文檔管控決策和內(nèi)容開發(fā)提供數(shù)據(jù)基礎(chǔ)。這是一個容易為人忽略的基礎(chǔ)性領(lǐng)域,然而沒有文檔數(shù)據(jù)化,就不會有電子文件管控和內(nèi)容開發(fā)利用的智能化。
(四)推動協(xié)同:構(gòu)建良性的電子文件數(shù)據(jù)管理生態(tài)環(huán)境
在復(fù)雜的數(shù)據(jù)管理格局下,管理好電子文件,協(xié)同是唯一的選擇。文件檔案管理領(lǐng)域需要和其他的數(shù)據(jù)管理主體合作,在合作的過程當(dāng)中一方面形成合力,聯(lián)合更多力量推動電子文件管理工作,另一方面擴(kuò)大自己的影響力,鞏固專業(yè)領(lǐng)域,促進(jìn)電子文件管理良好生態(tài)系統(tǒng)的養(yǎng)成。
學(xué)界和業(yè)界非常關(guān)心檔案部門和政府大數(shù)據(jù)部門之間的關(guān)系,認(rèn)為應(yīng)對兩者職責(zé)分工進(jìn)行合理的劃分和協(xié)調(diào)。筆者調(diào)研過的一些地方檔案部門對一網(wǎng)通辦背景下政府?dāng)?shù)據(jù)能否以及如何歸檔表現(xiàn)出較大的擔(dān)憂。浙江、廣東等省份通過《浙江省公共數(shù)據(jù)和電子政務(wù)管理辦法》《廣東省政務(wù)數(shù)據(jù)資源共享管理辦法(試行)》等政策文件對職責(zé)分工進(jìn)行了較為明確的規(guī)定,夯實(shí)檔案部門接收數(shù)據(jù)歸檔、保存檔案數(shù)據(jù)的職責(zé),[13]為其他地方類似問題提供了參考。根據(jù)調(diào)研,在科學(xué)研究領(lǐng)域,同樣存在檔案部門與科學(xué)數(shù)據(jù)管理部門之間關(guān)系需要理順的問題,[14]國家檔案局經(jīng)濟(jì)科技司牽頭推動相關(guān)課題的研究,中科院檔案館積極探索科研檔案和科學(xué)數(shù)據(jù)管理的協(xié)同,通過體制機(jī)制創(chuàng)新和技術(shù)手段的應(yīng)用,發(fā)揮各自的專業(yè)特長,形成互補(bǔ),成為夯實(shí)豐富科學(xué)數(shù)據(jù)檔案化管理和科研檔案數(shù)據(jù)化服務(wù)的關(guān)鍵。
此外,產(chǎn)學(xué)研用全鏈條的深度合作,也將推動整個行業(yè)的發(fā)展。一方面,文件檔案管理的標(biāo)準(zhǔn)化、規(guī)范化的管理方法是文件檔案管理系統(tǒng)的良性輸入,另一方面,良好的技術(shù)和工具是提升文件檔案管理水平的數(shù)字化手段。這個行業(yè)中各類成員之間應(yīng)加強(qiáng)對話和合作,相關(guān)服務(wù)商在盈利的同時成長,相關(guān)的用戶單位在合規(guī)中發(fā)展,相關(guān)的科研教學(xué)單位在學(xué)科建設(shè)、人才培養(yǎng)方面拓展,形成相互支持、同向演進(jìn)的良好局面。中國人民大學(xué)電子文件管理研究中心在此方面進(jìn)行了初步嘗試,2020年12月,該中心和上海鴻翼聯(lián)合發(fā)布了《數(shù)據(jù)管理中的文件檔案與內(nèi)容管理》的白皮書,其目的是提供文件檔案管理與非結(jié)構(gòu)化數(shù)據(jù)管理涉及的基本概念、主要技術(shù)、系統(tǒng)實(shí)踐等通識性知識,以加強(qiáng)文件檔案管理領(lǐng)域和技術(shù)領(lǐng)域的對話和合作,推動文件檔案管理事業(yè)與內(nèi)容管理行業(yè)的共同發(fā)展。[15]
在《數(shù)據(jù)管理中的文件檔案與內(nèi)容管理》白皮書中,課題組提出了文件檔案管理框架,如圖2所示。在這個框架中,文件檔案管理的層次和范圍都得到應(yīng)有的擴(kuò)展,自上而下包括價值實(shí)現(xiàn)層、文檔治理層、管理活動層和技術(shù)實(shí)現(xiàn)層,并貫穿文件從生成到處置或保存的整個生命周期。這是檔案界對于文件檔案管理定位的描繪,圖2和圖1的差距就是我們需要著力彌補(bǔ)的地方。希望通過各方努力,我們能夠在數(shù)據(jù)管理世界中從圖1出發(fā),構(gòu)建圖2,實(shí)現(xiàn)電子文件管理與數(shù)據(jù)管理的深度融合。
注釋及參考文獻(xiàn):
[1]聯(lián)合國.數(shù)據(jù)創(chuàng)新促進(jìn)發(fā)展[EB/OL].[2021-02-25].https://www.un.org/zh/sections/issues- depth/bigdata-sustainable-development/index.html.
[2]51CTO.2025年全球數(shù)據(jù)將攀升至163Z[EB/OL].[2021-02-25].https://www.sohu.com/a/140027985_655957.
[3]劉越男.政策背景下政務(wù)文件歸檔面臨的挑戰(zhàn)[J].檔案學(xué)研究,2018(2):107-114.
[4]國資委.關(guān)于加快推進(jìn)國有企業(yè)數(shù)字化轉(zhuǎn)型工作的通知[EB/OL].[2021-02-25].http://www.sasac.gov.cn/ n2588020 /n2588072 /n2591148 /n2591150 /c15517908/ content.html.
[5]科技部財(cái)政部關(guān)于發(fā)布國家科技資源共享服務(wù)平臺優(yōu)化調(diào)整名單的通知[EB/OL].[2021- 05- 20]. https://www.sohu.com/a/319669645_726570.
[6]網(wǎng)經(jīng)社.全國人大法工委披露數(shù)據(jù)安全法個人信息保護(hù)法二審稿修改內(nèi)容[EB/OL].[2021-05-20]. http://www.100ec. cn/detail--6590734.html.
[7]劉越男.數(shù)據(jù)治理:大數(shù)據(jù)時代檔案管理的新視角和新職能[J].檔案學(xué)研究,2020(5):50-57.
[8]高晨翔,黃新榮.國外社交媒體文件歸檔的政策研究[J].圖書館,2017(7):6-11.
[9] DURANTI L.THIBODEAU K.The Concept of Re? cord in Interactive,ExperientialandDynamicEnvironments:the Viewof InterPARES[J].. ArchivalScience,6(1):13-68.
[10]劉越男,楊建梁,張洋洋.單軌制背景下電子簽名的歸檔保存方案研究[J].檔案學(xué)通訊,2019(3):26-35.
[11]王強(qiáng),高強(qiáng).業(yè)務(wù)系統(tǒng)數(shù)據(jù)歸檔研究:以中國石油業(yè)務(wù)系統(tǒng)數(shù)據(jù)歸檔實(shí)踐為例[J].浙江檔案,2019(12):36-39.
[12]劉越男,楊建梁,何思源,等.計(jì)算檔案學(xué):檔案學(xué)科的新發(fā)展[J/OL].圖書情報(bào)知識,2021:1-10[2021-05-09].http://kns.cnki.net/kcms/detail/42.1085.2.20210401.1122.002.ht? ml.
[13]徐擁軍,張臻,任瓊輝.國家大數(shù)據(jù)戰(zhàn)略背景下檔案部門與數(shù)據(jù)管理部門的職能關(guān)系[J].圖書情報(bào)工作, 2019,63(18):5-13.
[14]何思源,劉越男.科學(xué)數(shù)據(jù)和科研檔案的管理協(xié)同:框架和路徑[J].檔案學(xué)通訊,2021(1):49-57.
[15]中國人民大學(xué)電子文件管理研究中心.數(shù)據(jù)管理中的文件檔案與內(nèi)容管理[EB/OL].[2021-02-25]. http://erm.ruc.edu.cn/filespath/1606635961.pdf.
作者單位:1.中國人民大學(xué)信息資源管理學(xué)院2.中國人民大學(xué)電子文件管理研究中心