王玉 許曉彤
摘 要:文章基于對英國數(shù)據(jù)治理工作宏觀背景的分析,聚焦法規(guī)制度與實(shí)踐樣例兩個(gè)方面,認(rèn)為英國數(shù)據(jù)收集內(nèi)容豐富、方式靈活,數(shù)據(jù)組織與存儲要求明確、標(biāo)準(zhǔn)規(guī)范,數(shù)據(jù)安全設(shè)施、人員與存儲并重,數(shù)據(jù)利用范圍廣泛、形式多樣。我國應(yīng)當(dāng)強(qiáng)化檔案數(shù)據(jù)法規(guī)制度建設(shè)、推動(dòng)多元主體協(xié)同聯(lián)動(dòng)、積極運(yùn)用檔案數(shù)據(jù)治理新技術(shù),協(xié)力提升我國檔案數(shù)據(jù)治理能力。
關(guān)鍵詞:檔案數(shù)據(jù);數(shù)據(jù)治理;檔案數(shù)據(jù)治理
分類號:G279.1
The Present Situation and Enlightenment of Archival Data Governance in the UK
Wang Yu1,2, Xu Xiaotong3
( 1.School of Information Management, Wuhan University, Wuhan, Hubei 430072; 2.National Demonstration Center for Experimental Library and Information Science Education, Wuhan University, Wuhan, Hubei 430072; 3. School of History and Culture, Shandong University, Jinan, Shandong 250100 )
Abstract: Based on the analysis of the macro background of data governance in the UK, the article focuses on two aspects: laws and regulations and practical examples. It believes that data collection in the UK is rich in content, flexible in methods, clear in data organization and storage requirements, standardized in regulations, with equal emphasis on data security facilities, personnel, and storage. The scope of data utilization is wide and diverse in forms. We should strengthen the development of regulations and systems for archival data, promote collaboration among multiple entities, actively utilize new technologies for archival data governance, and work together to enhance China’s archival data governance capabilities.
Keywords: Archival Data; Data Governance; Archival Data Governance
“檔案數(shù)據(jù)”是近年來出現(xiàn)的新概念,是指數(shù)據(jù)化的檔案信息及具備檔案性質(zhì)的數(shù)據(jù)記錄。[1]從其外延上看,檔案數(shù)據(jù)是廣義的數(shù)據(jù)集合,既包括檔案機(jī)構(gòu)中數(shù)據(jù)態(tài)的檔案資源,也包括具備長期保存價(jià)值,但暫時(shí)尚未被納入檔案機(jī)構(gòu)保管的數(shù)據(jù)(如社科領(lǐng)域現(xiàn)有研究匯集成的歷史數(shù)據(jù)集[2])。當(dāng)前,檔案數(shù)據(jù)在安全、質(zhì)量、開放利用等方面仍面臨困境,數(shù)據(jù)孤島、數(shù)據(jù)壁壘、數(shù)據(jù)異構(gòu)等問題普遍存在,如何將檔案數(shù)據(jù)治理融入國家治理體系建設(shè),為數(shù)字政府、數(shù)字經(jīng)濟(jì)與數(shù)字社會(huì)建設(shè)提供高質(zhì)量的可信檔案數(shù)據(jù),成為檔案界研究的焦點(diǎn)。
我國對檔案數(shù)據(jù)治理的研究始于2018年,關(guān)注問題涉及檔案數(shù)據(jù)治理的概念與內(nèi)涵[3]、動(dòng)因[4]、主體[5]、策略[6]等,整體形成了我國檔案數(shù)據(jù)治理體系的理論框架,但尚缺乏對國外相關(guān)現(xiàn)狀的系統(tǒng)性、針對性梳理。本文聚焦英國檔案數(shù)據(jù)治理工作,梳理其在檔案數(shù)據(jù)治理制度、實(shí)踐方面的典型探索,最后結(jié)合我國國情提出可供借鑒的啟示與策略。
1 宏觀背景:國家數(shù)據(jù)治理法規(guī)制度體系日趨完備
英國目前雖未頒布專門的檔案數(shù)據(jù)治理法律法規(guī),但在整體數(shù)據(jù)治理層面已形成“時(shí)空擴(kuò)展,縱橫延伸”的法規(guī)制度體系——以《信息自由法》(Freedom of Information Act)《自由保護(hù)法》(Protection of Freedom)《數(shù)據(jù)保護(hù)法》(Data Protection Act,2018年更新,以下簡稱DPA 2018)《通用數(shù)據(jù)保護(hù)條例》(The General Data Protection Regulation,以下簡稱GDPR)等為核心,涵蓋個(gè)人數(shù)據(jù)保護(hù)、數(shù)據(jù)開放利用、電子政務(wù)管理與服務(wù)、網(wǎng)絡(luò)與數(shù)據(jù)安全、數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)五大領(lǐng)域。2020年9月,英國數(shù)字、文化、媒體和體育部發(fā)布《國家數(shù)據(jù)戰(zhàn)略》(UK National Data Strategy,以下簡稱NDS)。NDS是英國近期一項(xiàng)極為重要的大數(shù)據(jù)國家戰(zhàn)略,它致力于發(fā)展英國數(shù)據(jù)經(jīng)濟(jì),確保公眾信任數(shù)據(jù),為支持英國發(fā)展世界領(lǐng)先的數(shù)據(jù)經(jīng)濟(jì)構(gòu)建了明確的政府行動(dòng)框架。[7]2022年7月18日,英國下議院最新提交的《數(shù)據(jù)保護(hù)和數(shù)字信息法案》(Data Protection and Digital Information Bill),旨在促進(jìn)數(shù)據(jù)驅(qū)動(dòng)創(chuàng)新,鼓勵(lì)合理使用個(gè)人數(shù)據(jù)以保護(hù)公眾利益。[8]整體而言,英國數(shù)據(jù)治理制度體系既包括具有強(qiáng)制約束力的法律法規(guī),又包括宏觀層面的國家戰(zhàn)略、操作性強(qiáng)的指南,以及白皮書等“非正式文件”,類型多樣,覆蓋面極廣,且隨著技術(shù)的發(fā)展不斷更新。
英國的檔案數(shù)據(jù)治理工作在國家數(shù)據(jù)治理的宏觀背景下推行。GDPR首次明確提出“為公共利益存檔”的概念,出于公共利益保存或公布含有個(gè)人數(shù)據(jù)的檔案可以免受部分GDPR所列規(guī)則的管轄;DPA 2018同樣指出,為了社會(huì)的長期利益,允許檔案館永久保存符合公共利益的個(gè)人數(shù)據(jù),但須采取適當(dāng)保護(hù)措施避免對數(shù)據(jù)主體造成威脅。兩部法規(guī)均強(qiáng)調(diào)檔案數(shù)據(jù)治理的重要性,為備受關(guān)注的個(gè)人檔案數(shù)據(jù)處理提供一定責(zé)任豁免,并將其納入立法框架,為檔案館出于公共利益處理個(gè)人檔案數(shù)據(jù)提供了立法支持,拓寬了檔案數(shù)據(jù)治理的發(fā)展空間,檔案工作者在數(shù)據(jù)治理工作中更有可為。
2 法規(guī)制度:檔案數(shù)據(jù)治理有序嵌入國家數(shù)據(jù)治理
國家檔案館等機(jī)構(gòu)緊隨國家數(shù)據(jù)治理發(fā)展趨勢,陸續(xù)頒布檔案數(shù)據(jù)治理規(guī)范性文件,推動(dòng)英國檔案數(shù)據(jù)治理有計(jì)劃地融入國家數(shù)據(jù)治理戰(zhàn)略體系。
2.1 《個(gè)人數(shù)據(jù)存檔指南》
2018年,英國國家檔案館發(fā)布《個(gè)人數(shù)據(jù)存檔指南》(Guide to Archiving Personal Data)[9](以下簡稱《指南》),為出于公共利益的個(gè)人數(shù)據(jù)存檔提供了指導(dǎo)。《指南》遵循GDPR對“個(gè)人信息”的寬泛定義,即“可直接或間接識別自然人(數(shù)據(jù)主體)的所有信息”,并將業(yè)務(wù)或法律存證排除在“為公共利益存檔”范圍之外,以避免規(guī)制范圍的無限擴(kuò)大。
《指南》主要包括三方面內(nèi)容:明確了個(gè)人數(shù)據(jù)保護(hù)與存檔之間的關(guān)系,它指出個(gè)人數(shù)據(jù)保護(hù)不能妨礙存檔工作的正常進(jìn)行,確立了“保護(hù)”與“存檔”并重的法律地位;建立了基于公共利益的個(gè)人數(shù)據(jù)權(quán)利豁免規(guī)則,為了社會(huì)公眾的長期利益,檔案館有權(quán)永久保存確有價(jià)值的個(gè)人數(shù)據(jù);對數(shù)據(jù)處理“知情—同意”的限制性規(guī)定,出于公共利益的存檔行為無須獲得數(shù)據(jù)主體同意,但應(yīng)保留數(shù)據(jù)主體“權(quán)利束”中的部分權(quán)利,如訪問權(quán)、可攜權(quán)、更正權(quán)等,最大限度減少對個(gè)人權(quán)利的干預(yù)。出于公共利益存檔的主要任務(wù)在于確保檔案所載社會(huì)記憶的完整與真實(shí),便于日后查考,在這種環(huán)境下,“被遺忘權(quán)”并不適用。但這一限制并非絕對,是否刪除數(shù)據(jù)需要檔案部門結(jié)合個(gè)案情況綜合考量個(gè)人利益與社會(huì)公共利益,在損益成比例的情況下做出自由裁量。此外,檔案部門還可以通過設(shè)置封閉期、增加訪問限制等手段實(shí)現(xiàn)記憶完整性與個(gè)人隱私保護(hù)的平衡。
《指南》還確立了三個(gè)個(gè)人數(shù)據(jù)存檔的基本原則??陀^性原則,存檔后的個(gè)人數(shù)據(jù)不再更新,固化存檔截止時(shí)的既有事實(shí)。人本性原則,數(shù)據(jù)主體在世時(shí),檔案數(shù)據(jù)管理過程中應(yīng)當(dāng)側(cè)重于對個(gè)人隱私的保護(hù);一旦數(shù)據(jù)主體去世,相關(guān)個(gè)人檔案數(shù)據(jù)失去賴以依存的利益主體,其作為一種公共資源可能面臨公開。透明度原則,檔案數(shù)據(jù)控制者在處理個(gè)人數(shù)據(jù)時(shí),必須向數(shù)據(jù)主體公開,將數(shù)據(jù)主體作為個(gè)人檔案數(shù)據(jù)處理合規(guī)性監(jiān)督的重要力量。
2.2 《數(shù)據(jù)保護(hù)與個(gè)人信息》
2019年,英國國家檔案館發(fā)布更新后的《數(shù)據(jù)保護(hù)與個(gè)人信息》(Data Protection and Personal Information)[10],該文件明確了個(gè)人數(shù)據(jù)存檔免于GDPR與DPA 2018各項(xiàng)規(guī)定要求的兩項(xiàng)前提:一是數(shù)據(jù)處理行為不是為了支持某項(xiàng)個(gè)人決定,而是為了滿足公共利益;二是個(gè)人數(shù)據(jù)的長期保存不會(huì)給數(shù)據(jù)主體帶來負(fù)面影響。如果兩項(xiàng)前提都適用,那么檔案館可以永久保存?zhèn)€人數(shù)據(jù),避免個(gè)人數(shù)據(jù)存檔行為過度受到數(shù)據(jù)保護(hù)原則的掣肘,在立法層面確立了“公共利益”的具體裁量基準(zhǔn)。而對于此類包含個(gè)人數(shù)據(jù)的檔案,國家檔案館也會(huì)將具體情況登記在移交給信息專員的隱私聲明中,標(biāo)明移交至檔案館的文件中含有個(gè)人數(shù)據(jù)。作為隱私監(jiān)管者與個(gè)人數(shù)據(jù)保護(hù)的獨(dú)立官員,信息專員依法對檔案館處理個(gè)人數(shù)據(jù)的行為進(jìn)行監(jiān)督。
此外,文件還指出了檔案封閉的常見原因是包含了依然在世者的個(gè)人信息。然而,無法判斷數(shù)據(jù)主體是否在世是檔案館處理個(gè)人數(shù)據(jù)時(shí)的常見困難。基于此,英國國家文件與檔案咨詢委員會(huì)將人的生命假定為100年,用其減去檔案中數(shù)據(jù)主體已知或推測的年齡,即為相應(yīng)個(gè)人檔案數(shù)據(jù)的封閉期。這一規(guī)則簡稱為“生命周期”(Life Cycling)原則,不僅適用于傳統(tǒng)載體檔案的開放利用,同樣也適用于檔案數(shù)據(jù)的開放利用。英國還采用“滾動(dòng)十年”(Rolling 10 Years)原則,定期對這些封閉狀態(tài)的檔案數(shù)據(jù)展開評估,及時(shí)解除利用限制。此外,個(gè)人數(shù)據(jù)主體生命周期內(nèi)的全部個(gè)人數(shù)據(jù)并非都應(yīng)封閉保存,特定的信息及其上下文內(nèi)容可能在封閉期之前被允許訪問。
2.3 《從檔案中提取數(shù)據(jù):最佳實(shí)踐指南》
2021年,英國地理空間委員會(huì)出于科研工作需要,與內(nèi)閣辦公室共同發(fā)布《從檔案中提取數(shù)據(jù):最佳實(shí)踐指南》(Extracting Data from Archives: Best Practice Guide)[11],用以指導(dǎo)識別檔案中的地理空間數(shù)據(jù)。該指南面向所有使用檔案并希望從檔案中提取地理空間數(shù)據(jù),尤其是首次嘗試數(shù)據(jù)采集的人員,指導(dǎo)其在檔案數(shù)據(jù)管理任意階段識別并處理檔案中的位置數(shù)據(jù)。該指南所使用數(shù)據(jù)的主要來源是Geo6合作機(jī)構(gòu),包括英國地質(zhì)調(diào)查局、煤炭管理局、軍械測量局、土地注冊處、英國水文局與英國評估辦公室機(jī)構(gòu)所擁有的地理空間數(shù)據(jù)。指南總結(jié)了從檔案中提取位置數(shù)據(jù)時(shí)需要注意的要素,包括成本和資金、數(shù)據(jù)領(lǐng)域?qū)I(yè)知識、檔案與待提取數(shù)據(jù)的價(jià)值、提取過程中的數(shù)據(jù)質(zhì)量保證與控制、提取后的數(shù)據(jù)質(zhì)量、數(shù)據(jù)可用性、數(shù)據(jù)標(biāo)準(zhǔn)共7項(xiàng)。此外,該指南還提供了從檔案中提取數(shù)據(jù)的最佳實(shí)踐框架,將數(shù)據(jù)提取項(xiàng)目分為6個(gè)步驟,包括識別用戶需求、檔案審查、掃描或數(shù)據(jù)轉(zhuǎn)錄、數(shù)據(jù)提取、數(shù)據(jù)存儲和數(shù)據(jù)交付,各階段之間的反饋主要靠專家輸入實(shí)現(xiàn)。
3 實(shí)踐樣例:英國數(shù)據(jù)檔案館的檔案數(shù)據(jù)治理探索
英國數(shù)據(jù)檔案館(UK Data Archive)1967年成立于埃塞克斯大學(xué)。作為具有世界影響力的國家級數(shù)據(jù)檔案館,英國數(shù)據(jù)檔案館保存著來自英國國家統(tǒng)計(jì)局、國家社會(huì)研究中心、內(nèi)政部、衛(wèi)生部等諸多機(jī)構(gòu)的調(diào)查數(shù)據(jù),是英國最大的社會(huì)科學(xué)與人口研究數(shù)據(jù)集合地。該機(jī)構(gòu)所保存的數(shù)據(jù)目前尚未為檔案機(jī)構(gòu)所保管,但具備長期保存價(jià)值,屬于本文“檔案數(shù)據(jù)”的討論范圍。自20世紀(jì)70年代起,英國國家統(tǒng)計(jì)局開始向英國數(shù)據(jù)檔案館存放政府調(diào)查數(shù)據(jù)。2005年起,英國數(shù)據(jù)檔案館成為英國國家檔案館的指定數(shù)據(jù)存放地,并于2012年成為英國政府?dāng)?shù)據(jù)服務(wù)的主要合作伙伴。當(dāng)前,英國數(shù)據(jù)檔案館已成為英國國家數(shù)據(jù)資源極為重要的可信存儲庫,極大地拓展了檔案數(shù)據(jù)治理的領(lǐng)域與行為,并獲得CoreTrustSeal國際數(shù)據(jù)知識庫認(rèn)證。作為數(shù)據(jù)管理的有力倡導(dǎo)者,英國數(shù)據(jù)檔案館在數(shù)據(jù)收集、數(shù)據(jù)組織與存儲、數(shù)據(jù)安全、數(shù)據(jù)利用等關(guān)鍵環(huán)節(jié)與方面開展了不同角度的探索,積累了較為豐富的經(jīng)驗(yàn)。因此,本文以英國數(shù)據(jù)檔案館為樣例,管窺英國數(shù)據(jù)治理實(shí)踐工作的特點(diǎn)。
3.1 數(shù)據(jù)收集內(nèi)容豐富、方式靈活
英國數(shù)據(jù)檔案館廣泛收集以社會(huì)與經(jīng)濟(jì)數(shù)據(jù)為主的數(shù)據(jù)檔案,其數(shù)據(jù)收集工作具有四方面特點(diǎn)。第一,數(shù)據(jù)來源廣泛。英國數(shù)據(jù)檔案館不限制數(shù)據(jù)來源,無論是小型組織的科研數(shù)據(jù),還是政府部門和公共機(jī)構(gòu)的大規(guī)模數(shù)據(jù)集,均可存儲在英國數(shù)據(jù)檔案館中,成為開放或受保護(hù)的數(shù)據(jù)。第二,數(shù)據(jù)內(nèi)容與形式多樣。數(shù)據(jù)檔案館代表英國數(shù)據(jù)服務(wù)(UK Data Service)對全國研究數(shù)據(jù)進(jìn)行收集整理,除社會(huì)、經(jīng)濟(jì)與人文數(shù)據(jù)外,其還整合了埃塞克斯的定性數(shù)據(jù)部門和專業(yè)的歷史數(shù)據(jù)服務(wù)中心,館藏?cái)?shù)據(jù)不僅涉及英國社會(huì)生活的諸多領(lǐng)域,而且可能反映了某些國際問題,數(shù)據(jù)種類也涵蓋文本型、圖片型或混合方法等多種形式。第三,數(shù)據(jù)收集方式多樣。初次提供數(shù)據(jù)的主體,可通過免費(fèi)注冊的在線賬戶提供數(shù)據(jù),并對其進(jìn)行簡短說明。英國數(shù)據(jù)檔案館對數(shù)據(jù)進(jìn)行評估后,決定是否接收數(shù)據(jù)及存儲地點(diǎn)。對于經(jīng)常提供數(shù)據(jù)的主體,如政府部門、公共機(jī)構(gòu)或大型研究機(jī)構(gòu),英國數(shù)據(jù)檔案館將安排專業(yè)處理團(tuán)隊(duì)對其進(jìn)行策展,將其數(shù)據(jù)納入策劃的精選數(shù)據(jù)存儲庫,并為數(shù)據(jù)利用提供線索指引。對于可共享數(shù)據(jù)的提供方,尤其是ESRC的被資助者,英國數(shù)據(jù)檔案館建議將其研究數(shù)據(jù)自行存入英國數(shù)據(jù)服務(wù)的在線可共享數(shù)據(jù)存儲庫ReShare中。第四,數(shù)據(jù)獲取以合作為主。英國數(shù)據(jù)檔案館擴(kuò)展了面向數(shù)據(jù)的合作項(xiàng)目,如農(nóng)村地區(qū)數(shù)據(jù)庫等。此外,英國數(shù)據(jù)檔案館與英國政府建立了長期合作關(guān)系,還同世界銀行、國際貨幣基金組織、國際能源署等重要機(jī)構(gòu)開展合作,確保用戶能夠及時(shí)獲取這些重要的、可公開的社會(huì)與經(jīng)濟(jì)數(shù)據(jù)資源。
3.2 數(shù)據(jù)組織與存儲要求明確、標(biāo)準(zhǔn)規(guī)范
在檔案數(shù)據(jù)組織方面,英國數(shù)據(jù)檔案館積極建立數(shù)據(jù)詞典、編纂主題詞表進(jìn)行數(shù)據(jù)組織。英國數(shù)據(jù)檔案館為所有存檔過的SPSS格式數(shù)據(jù)文件建立數(shù)據(jù)詞典[12],并編纂人文與社會(huì)科學(xué)電子主題詞表,該詞表涵蓋了4000多個(gè)核心社科概念,能夠?qū)崿F(xiàn)數(shù)據(jù)集的快速索引。在檔案數(shù)據(jù)存儲方面,英國數(shù)據(jù)檔案館發(fā)布了專門的《保存政策》(Preservation policy)以規(guī)范數(shù)據(jù)存儲行為。[13]英國數(shù)據(jù)檔案館通過數(shù)據(jù)校驗(yàn)實(shí)現(xiàn)數(shù)據(jù)的編輯、清理、驗(yàn)證等。當(dāng)決定對某份數(shù)據(jù)建立專門的數(shù)據(jù)集時(shí),數(shù)據(jù)檔案館將開展數(shù)據(jù)質(zhì)量控制檢驗(yàn),對變量個(gè)數(shù)、文檔格式、數(shù)據(jù)下載格式等進(jìn)行檢查。數(shù)據(jù)質(zhì)量控制檢驗(yàn)將數(shù)據(jù)分為A*、A、B、C四類標(biāo)準(zhǔn),不同層次的數(shù)據(jù)在數(shù)據(jù)集維度、元數(shù)據(jù)、數(shù)據(jù)有效性、數(shù)據(jù)讀取等方面的要求從嚴(yán)到松,并制定《英國數(shù)據(jù)檔案館數(shù)據(jù)處理標(biāo)準(zhǔn)》(UK Data Archive Data Processing Standards)加以規(guī)范。此外,英國數(shù)據(jù)檔案館遵循系列標(biāo)準(zhǔn)以規(guī)范對館藏元數(shù)據(jù)的描述,如《數(shù)據(jù)文檔倡議》(The Data Documentation Initiative)。該標(biāo)準(zhǔn)是專為經(jīng)濟(jì)與社會(huì)科學(xué)數(shù)據(jù)而設(shè)計(jì)的元數(shù)據(jù)標(biāo)準(zhǔn),用以記錄和研究數(shù)據(jù)生命周期從概念化、收集、處理到最終存檔各個(gè)階段的表現(xiàn)狀態(tài)。
3.3 數(shù)據(jù)安全設(shè)施、人員與存儲并重
作為受信任的數(shù)字存儲庫,英國數(shù)據(jù)檔案館的使命是提供對館藏?cái)?shù)字資源的可靠、長期訪問。2010年6月,英國數(shù)據(jù)檔案館通過國際信息安全管理體系標(biāo)準(zhǔn)ISO/IEC 27001評審,這標(biāo)志著其已建立起涵蓋隱私保護(hù)、數(shù)據(jù)處理、人員管理等領(lǐng)域的數(shù)據(jù)安全管理體系。
英國數(shù)據(jù)檔案館從基礎(chǔ)設(shè)施、人員與存儲三方面維護(hù)數(shù)據(jù)安全。在基礎(chǔ)設(shè)施安全方面,英國數(shù)據(jù)檔案館配備了諸多安防系統(tǒng),服務(wù)器機(jī)房的門禁系統(tǒng)能夠?qū)崿F(xiàn)實(shí)時(shí)報(bào)警,并與埃塞克斯大學(xué)保衛(wèi)處直接對接,所有機(jī)房的計(jì)算機(jī)均由密碼系統(tǒng)鎖定,嚴(yán)防未經(jīng)授權(quán)的訪問。在人員安全方面,對于檔案館員工,英國數(shù)據(jù)檔案館要求所有訪問檔案館網(wǎng)絡(luò)的員工簽署保密協(xié)議,有權(quán)訪問敏感檔案數(shù)據(jù)的員工還需接受蘇格蘭政府執(zhí)行機(jī)構(gòu)披露蘇格蘭(Disclosure Scotland)的審查;對于外部訪問者,英國數(shù)據(jù)檔案館要求訪問數(shù)據(jù)須經(jīng)過數(shù)據(jù)擁有者的授權(quán)同意,允許利用者對數(shù)據(jù)進(jìn)行安全訪問與遠(yuǎn)程分析,但不得修改、下載或帶走數(shù)據(jù),以降低檔案數(shù)據(jù)的失效、失密風(fēng)險(xiǎn)。在存儲安全方面,英國數(shù)據(jù)檔案館對訪問披露的安全數(shù)據(jù)有著嚴(yán)格的規(guī)定,所有受限的數(shù)字化文件必須加密,文件名需包含“RESRICTED”以便于識別,并存儲在指定驅(qū)動(dòng)器中的“RESRICTED”目錄中,以維護(hù)館藏檔案數(shù)據(jù)的安全。
3.4 數(shù)據(jù)利用范圍廣泛、形式多樣
英國數(shù)據(jù)檔案館采用多種形式,為世界范圍內(nèi)用戶提供數(shù)據(jù)訪問利用。首先,自2012年起,英國數(shù)據(jù)檔案館開始為所有館藏?cái)?shù)據(jù)啟動(dòng)DataCite數(shù)字對象標(biāo)識符(DOI)集中注冊管理技術(shù)作為數(shù)據(jù)引用方法,極大拓寬了數(shù)據(jù)的可共享范圍。借助互聯(lián)網(wǎng)傳播方式,英國數(shù)據(jù)檔案館當(dāng)前已擁有超過2.3萬名注冊用戶。英國數(shù)據(jù)檔案館還擁有8900余個(gè)數(shù)據(jù)集,各國的科學(xué)研究者、政府部門人員等數(shù)據(jù)用戶均可從中獲取數(shù)據(jù),支持科研發(fā)展與政府決策。其次,英國數(shù)據(jù)檔案館的檢索方式較為便捷,用戶可以通過數(shù)據(jù)日期、主題、數(shù)據(jù)類型、使用權(quán)、國家等要素檢索,快速定位所需數(shù)據(jù)。最后,英國數(shù)據(jù)檔案館還致力于指導(dǎo)數(shù)據(jù)利用者提高數(shù)據(jù)訪問分析能力,通過編制用戶指南、開展網(wǎng)絡(luò)研討會(huì)、提供面對面定制化培訓(xùn)服務(wù)等,幫助利用者更高效地開展研究工作。當(dāng)前,英國數(shù)據(jù)檔案館的培訓(xùn)課程已走出國門,拓展至美國、中國、印度、吉爾吉斯斯坦等國家,極大地?cái)U(kuò)展了檔案數(shù)據(jù)訪問利用的地域范圍。
4 啟示建議:協(xié)力提升我國檔案數(shù)據(jù)治理能力
英國檔案數(shù)據(jù)治理工作產(chǎn)生于國家大數(shù)據(jù)戰(zhàn)略布局對檔案資源數(shù)據(jù)態(tài)轉(zhuǎn)型的客觀需求,檔案數(shù)據(jù)治理體系正向以基礎(chǔ)法規(guī)制度為標(biāo)尺、以個(gè)人檔案數(shù)據(jù)保護(hù)為特色的方向發(fā)展,并圍繞數(shù)據(jù)收集、數(shù)據(jù)組織與存儲、數(shù)據(jù)安全、數(shù)據(jù)利用開展實(shí)踐探索,從制度與實(shí)踐兩個(gè)層面著力提升檔案數(shù)據(jù)治理能力。不可否認(rèn)的是,英國檔案數(shù)據(jù)治理體系建設(shè)還須不斷完善,法律法規(guī)建設(shè)尚未健全,實(shí)踐工作還未大規(guī)模覆蓋至已移交至檔案機(jī)構(gòu)的、具備檔案屬性的數(shù)據(jù)。但英國檔案數(shù)據(jù)治理工作在制度體系建設(shè)、協(xié)同意識強(qiáng)化與新興技術(shù)運(yùn)用等方面的經(jīng)驗(yàn),仍對我們具有借鑒意義。截至 2021 年底,我國各級國家檔案館共計(jì)館藏電子檔案 1629.9 TB。[14]海量原生數(shù)字檔案要求檔案界重視檔案數(shù)據(jù)治理,發(fā)揮檔案數(shù)據(jù)價(jià)值,助力國家治理體系與治理能力現(xiàn)代化。受多方面因素影響,我國檔案數(shù)據(jù)治理仍普遍面臨數(shù)據(jù)質(zhì)量參差不齊、數(shù)據(jù)價(jià)值挖掘不足、檔案數(shù)據(jù)安全風(fēng)險(xiǎn)等困境[15],數(shù)據(jù)涌現(xiàn)與治理滯后、海量數(shù)據(jù)與價(jià)值實(shí)現(xiàn)之間的矛盾廣泛存在。因此,本文基于英國檔案數(shù)據(jù)治理探索過程中在制度構(gòu)建、意識培養(yǎng)、技術(shù)運(yùn)用三方面的現(xiàn)有經(jīng)驗(yàn),結(jié)合我國實(shí)際情況,探討檔案數(shù)據(jù)治理的可行之策,以期對構(gòu)建有中國特色的檔案數(shù)據(jù)治理體系,強(qiáng)化檔案數(shù)據(jù)治理能力提供參考。
4.1 強(qiáng)化檔案數(shù)據(jù)法規(guī)制度建設(shè),融入國家數(shù)據(jù)治理頂層設(shè)計(jì)
檔案數(shù)據(jù)法規(guī)制度建設(shè)為檔案數(shù)據(jù)治理工作提供了基礎(chǔ)保障。一方面,檔案數(shù)據(jù)治理應(yīng)以國家數(shù)據(jù)治理法律規(guī)范為框架,構(gòu)建自上而下的檔案數(shù)據(jù)治理頂層設(shè)計(jì),推動(dòng)檔案事業(yè)可持續(xù)發(fā)展。英國政府較早意識到檔案數(shù)據(jù)治理的重要性,2018年發(fā)布的GDPR與DPA 2018首次將出于公共利益進(jìn)行的個(gè)人數(shù)據(jù)歸檔行為納入管理范疇,為檔案館長期保存?zhèn)€人檔案數(shù)據(jù)提供了立法支持。同年,英國國家檔案館迅速作出反應(yīng),發(fā)布《指南》以響應(yīng)國家戰(zhàn)略布局,并于2019年發(fā)布《數(shù)據(jù)保護(hù)與個(gè)人信息》,推動(dòng)檔案數(shù)據(jù)治理相關(guān)法規(guī)制度不斷融入國家數(shù)據(jù)治理頂層設(shè)計(jì)。另一方面,檔案部門應(yīng)主動(dòng)對接國家大數(shù)據(jù)戰(zhàn)略,積極參與國家數(shù)據(jù)治理規(guī)則制定,找準(zhǔn)自身在數(shù)據(jù)時(shí)代的價(jià)值與定位。英國國家檔案館早于2011年便參與了國家“信息基礎(chǔ)設(shè)施(NII)計(jì)劃”,負(fù)責(zé)指導(dǎo)政府部門定義并發(fā)布各自的公共任務(wù)聲明;2015年,英國國家檔案館又與司法部聯(lián)合修訂了《公共部門信息再利用條例》(The Reuse of Public Sector Information Regulations),明確公民擁有獲取公共部門掌握的信息(除例外信息)的權(quán)利,公共部門應(yīng)以開放的、機(jī)器可讀格式提供信息及其元數(shù)據(jù)。這表明在英國國家數(shù)據(jù)治理體系構(gòu)建中,英國國家檔案館始終占有一席之地,履行其記錄與管理政府信息的基本職責(zé)。
我國的數(shù)據(jù)治理制度建設(shè)正處于快速推進(jìn)階段,檔案機(jī)構(gòu)卻尚未在數(shù)據(jù)治理制度建設(shè)中發(fā)揮應(yīng)有作用。2016年起,我國陸續(xù)頒布了《網(wǎng)絡(luò)安全法》《數(shù)據(jù)保護(hù)法》《個(gè)人信息保護(hù)法》等,圍繞數(shù)據(jù)治理建立起一系列工作機(jī)制,如數(shù)據(jù)出境安全評估機(jī)制、個(gè)人數(shù)據(jù)處理“告知同意”機(jī)制等,初步構(gòu)建起國家數(shù)據(jù)治理制度體系,有效回應(yīng)數(shù)據(jù)治理中的各類問題。然而,參與數(shù)據(jù)治理頂層設(shè)計(jì)的主體中鮮見檔案部門的身影[16],如2015年建立起的“促進(jìn)大數(shù)據(jù)發(fā)展部際聯(lián)席會(huì)議”中,檔案部門并未列席;2023年新組建的國家數(shù)據(jù)局也未見檔案部門參與,針對檔案數(shù)據(jù)治理的頂層制度規(guī)劃也尚未成型?;诖耍瑱n案部門應(yīng)主動(dòng)參與國家數(shù)據(jù)治理的整體部署與具體工作,同時(shí)積極制定全國性檔案數(shù)據(jù)治理頂層規(guī)劃,并將其融入國家數(shù)據(jù)治理的總體發(fā)展浪潮中,與國家數(shù)據(jù)治理工作同頻共振?;诋?dāng)前政府信息資源開放與共享、個(gè)人數(shù)據(jù)保護(hù)、數(shù)據(jù)安全維護(hù)等重點(diǎn)領(lǐng)域?qū)?shù)據(jù)治理的迫切需求,檔案部門可優(yōu)先開展上述領(lǐng)域檔案數(shù)據(jù)治理的探索,強(qiáng)化相關(guān)制度的制定與貫徹,形成覆蓋全面、權(quán)責(zé)明晰、監(jiān)督有力的檔案數(shù)據(jù)治理制度體系。檔案部門也應(yīng)重視檔案管理基礎(chǔ)環(huán)節(jié)的數(shù)據(jù)化轉(zhuǎn)型,加強(qiáng)檔案數(shù)據(jù)安全管理、質(zhì)量控制等制度推進(jìn),從傳統(tǒng)粗放式的管理向更細(xì)顆粒度的數(shù)據(jù)化治理轉(zhuǎn)型,提供更高質(zhì)量的原生檔案數(shù)據(jù)并推進(jìn)檔案數(shù)據(jù)流動(dòng),切實(shí)提升檔案數(shù)據(jù)治理效能。
4.2 推動(dòng)多元主體協(xié)同聯(lián)動(dòng),探索檔案數(shù)據(jù)“多元共治”模式
多元共治是社會(huì)治理現(xiàn)代化的表征,多元主體協(xié)同也是數(shù)據(jù)治理工作的前提。英國檔案數(shù)據(jù)治理秉承多元共治理念,強(qiáng)調(diào)檔案部門要與政府、社會(huì)、公眾等多主體合作互動(dòng)。在制度層面,英國檔案數(shù)據(jù)治理制度體系的構(gòu)建主體并非僅有國家檔案館,以英國內(nèi)閣辦公室、英國地理空間委員會(huì)等為代表的非檔案機(jī)構(gòu)也紛紛立足各自領(lǐng)域,發(fā)布檔案數(shù)據(jù)治理標(biāo)準(zhǔn)或指南等規(guī)范性文件。在實(shí)踐層面,英國數(shù)據(jù)檔案館作為國家數(shù)據(jù)資源的可信存儲庫,與國家統(tǒng)計(jì)局、國家社會(huì)研究中心、內(nèi)政部、衛(wèi)生部等開展合作,積極面向不同機(jī)構(gòu)廣泛收集以社會(huì)與經(jīng)濟(jì)數(shù)據(jù)為主的檔案數(shù)據(jù),并將公眾納入檔案數(shù)據(jù)的重要來源,以實(shí)現(xiàn)社會(huì)范疇內(nèi)的數(shù)據(jù)共享。此外,英國數(shù)據(jù)檔案館主動(dòng)開展面向公眾的檔案數(shù)據(jù)能力培訓(xùn),實(shí)現(xiàn)檔案館與公眾之間的良性互動(dòng),強(qiáng)化多元主體數(shù)據(jù)治理意識與能力,構(gòu)建起以檔案館為主導(dǎo)、多元主體協(xié)同治理的良好格局。
我國新修訂《中華人民共和國檔案法》指出,“國家鼓勵(lì)社會(huì)力量參與和支持檔案事業(yè)的發(fā)展”,這為多元主體協(xié)同參與檔案數(shù)據(jù)治理提供了遵循。我國的檔案數(shù)據(jù)治理體系建設(shè),同樣應(yīng)著力強(qiáng)化檔案部門與政府、社會(huì)力量的協(xié)同合作,激發(fā)社會(huì)參與熱情,形成多元主體共同參與的檔案數(shù)據(jù)治理協(xié)同機(jī)制,共同“辦好一件事”。具體而言,檔案館可與圖書館、博物館、美術(shù)館等文化遺產(chǎn)機(jī)構(gòu)合作,共謀檔案文化數(shù)據(jù)的治理;可與大數(shù)據(jù)局、民政局、財(cái)政局等政府部門合作,共商檔案數(shù)據(jù)惠民。如山東省檔案館與省民政廳、大數(shù)據(jù)局尋求合作,共同發(fā)文督辦省內(nèi)婚姻登記歷史檔案數(shù)據(jù)補(bǔ)錄,為促進(jìn)婚姻登記數(shù)據(jù)共享提供強(qiáng)有力的檔案數(shù)據(jù)支撐[17],為其他地區(qū)檔案數(shù)據(jù)多元共治提供了有益借鑒。
4.3 積極運(yùn)用檔案數(shù)據(jù)治理新技術(shù),釋放檔案數(shù)據(jù)紅利
檔案數(shù)據(jù)治理離不開新興技術(shù)的運(yùn)用??v觀英國檔案數(shù)據(jù)治理已有經(jīng)驗(yàn),新興技術(shù)的運(yùn)用貫穿始終。在制度層面,《從檔案中提取數(shù)據(jù):最佳實(shí)踐指南》指出要運(yùn)用大數(shù)據(jù)技術(shù)實(shí)現(xiàn)數(shù)據(jù)的自動(dòng)提??;在實(shí)踐層面,英國國家檔案館發(fā)布了專門的檔案數(shù)據(jù)保護(hù)工具包,通過結(jié)構(gòu)化決策法協(xié)助檔案管理者處理針對館藏個(gè)人數(shù)據(jù)的訪問請求;英國數(shù)據(jù)檔案館同樣開發(fā)了QAMyData、OpenRefine、sdcMicro、AxCrypt、ZendTo、Nesstar等一系列工具,分別用于數(shù)據(jù)質(zhì)量評估、數(shù)據(jù)清洗、風(fēng)險(xiǎn)監(jiān)測、數(shù)據(jù)加密、數(shù)據(jù)傳輸、數(shù)據(jù)共享等檔案數(shù)據(jù)處理活動(dòng)。
聚焦國內(nèi),在我國數(shù)字檔案管理工作“數(shù)字化存量大量累積,電子化增量海量增長”的現(xiàn)狀之下,需理順傳統(tǒng)檔案管理技術(shù)與數(shù)據(jù)治理所需大數(shù)據(jù)技術(shù)的共存與迭代關(guān)系。一方面,檔案部門應(yīng)對其所掌握的檔案數(shù)據(jù)進(jìn)行國家或省級層面的集中統(tǒng)一治理,打通“數(shù)據(jù)孤島”,為檔案數(shù)據(jù)開發(fā)利用、價(jià)值挖掘奠定基礎(chǔ);另一方面,主動(dòng)加強(qiáng)與業(yè)務(wù)部門和數(shù)據(jù)管理部門的對接,融入業(yè)務(wù)前端,在數(shù)據(jù)治理中堅(jiān)持“檔案視角”,嵌入檔案要求,實(shí)現(xiàn)檔案數(shù)據(jù)的全流程監(jiān)管,確保檔案數(shù)據(jù)應(yīng)歸盡歸。此外,檔案部門應(yīng)積極開展大數(shù)據(jù)相關(guān)技術(shù)研發(fā),實(shí)現(xiàn)數(shù)據(jù)采集、數(shù)據(jù)處理、數(shù)據(jù)鑒定、數(shù)據(jù)存檔、數(shù)據(jù)服務(wù)等關(guān)鍵業(yè)務(wù)環(huán)節(jié)的自動(dòng)化、高速化與針對性,在提升檔案數(shù)據(jù)管理質(zhì)量的同時(shí)提高檔案數(shù)據(jù)服務(wù)效能。
5 結(jié) 語
黨的十九屆五中全會(huì)明確提出,要加強(qiáng)數(shù)字社會(huì)、數(shù)字政府建設(shè)?!丁笆奈濉比珖鴻n案事業(yè)發(fā)展規(guī)劃》同樣強(qiáng)調(diào)了檔案治理的重要性,要求全面推進(jìn)檔案治理體系建設(shè),切實(shí)提高檔案治理能力與水平[18]。檔案數(shù)據(jù)治理是國家治理體系的重要組成部分,總結(jié)并合理借鑒英國檔案數(shù)據(jù)治理現(xiàn)有經(jīng)驗(yàn),從制度、模式、技術(shù)三方著手,提出基于我國國情的檔案數(shù)據(jù)治理發(fā)展建議,有助于規(guī)范檔案數(shù)據(jù)治理行為,構(gòu)建有效的檔案數(shù)據(jù)治理體系,提升檔案數(shù)據(jù)服務(wù)水平,推進(jìn)國家治理體系與治理能力現(xiàn)代化穩(wěn)步前進(jìn)。
*本文系國家社科基金一般項(xiàng)目“國家大數(shù)據(jù)戰(zhàn)略背景下檔案數(shù)據(jù)治理體系構(gòu)建研究”(項(xiàng)目編號:19BTQ097)階段性研究成果。
注釋與參考文獻(xiàn)
[1]金波,添志鵬.檔案數(shù)據(jù)內(nèi)涵與特征探析[J].檔案學(xué)通訊,2020(3):4-11.
[2]趙躍,石酈冰,孫寒晗.“檔案數(shù)據(jù)”一詞的使用語境與學(xué)科內(nèi)涵探析[J].檔案學(xué)研究,2021(3):24-32.
[3]金波,楊鵬.大數(shù)據(jù)時(shí)代檔案數(shù)據(jù)治理研究[J].檔案學(xué)研究,2020(4):29-37.
[4]于英香.從數(shù)據(jù)與信息關(guān)系演化看檔案數(shù)據(jù)概念的發(fā)展[J].情報(bào)雜志,2018(11):154-159.
[5]何玉顏.檔案部門參與政府大數(shù)據(jù)治理的路徑研究[J].浙江檔案, 2018(8):23-25.
[6]常大偉,潘娜.檔案數(shù)據(jù)治理能力的結(jié)構(gòu)體系與建設(shè)路徑[J].浙江檔案,2020(2):27-29.
[7]department for digital, Culture, Media & Sport. national data Strategy[EB/OL].[2023-03-21].https:// www.gov.uk/government/publications/uk-national-datastrategy/national-data-strategy.
[8]uK Parliament. The data Protection and digital Information Bill[EB/OL].[2023-03-21].extension://bfd ogplmndidlpjfhoijckpakkdjkkil/pdf/viewer.html file=https%3A% 2F%2Fpublications.parliament.uk%2Fpa%2Fbills%2Fcbill%2F58-03%2F0143%2F220143.pdf.
[9]The national Archives. Guide to archiving personal data[EB/OL].[2023-03-22].extension://bfdogplmndidl pjfhoijckpakkdjkkil/pdf/viewer.html file=https%3A%2F%2Fcdn. nationalarchives.gov.uk%2Fdocuments%2Finformationmanagement%2Fguide-to-archiving-personal-data.pdf.
[10]The national Archives.data Protection and Personal Information[EB/OL].[2023-03-22]. extension://bfdogplmndidlpjfhoijckpakkdjkkil/pdf/viewer. html file=https%3A%2F%2Fcdn.nationalarchives.gov. uk%2Fdocuments%2Finformation-management%2Fdataprotection-and-personal-information.pdf.
[11]Gov.uK.Extracting data from Archives: Best Practice Guide [EB/OL].[2023-03-22].https://www.gov.uk/ government/publications/extracting-data-from-archives-bestpractice-guide/extracting-data-from-archives-best-practice-guide.
[12]海嘯.英國數(shù)據(jù)檔案館的發(fā)展現(xiàn)狀及其借鑒[J].山東檔案,2019(6):19-22.
[13]uK data Archive. Preservation policy[EB/OL].[2023-03-23].extension://bfdogplmndidlpjfhoijckpakkdjk kil/pdf/viewer.html file=https%3A%2F%2Fdam.data-archive. ac.uk%2Fcontrolled%2Fcd062-preservationpolicy.pdf.
[14] 2021年度全國檔案主管部門和檔案館基本情況摘要(二)[EB/OL].[2023-03-23].https://www.saac.gov.cn/daj/ zhdt/202208/b9e2f459b5b1452d8ae83d7f78f51769.shtml.
[15]岳林恒.大數(shù)據(jù)時(shí)代下檔案數(shù)據(jù)治理的困境與對策探析[J].檔案天地,2023(5):18-23.
[16]徐擁軍,張臻,任瓊輝.國家大數(shù)據(jù)戰(zhàn)略背景下檔案部門與數(shù)據(jù)管理部門的職能關(guān)系[J].圖書情報(bào)工作,2019(18):5-13.
[17]濟(jì)南市民政局.發(fā)力檔案信息數(shù)字化 促進(jìn)數(shù)據(jù)共享惠民生[EB/OL].[2023-03-23].http://jnmz.jinan.gov.cn/ art/2021/9/7/art_8396_4766389.html.
[18]中辦國辦印發(fā)《“十四五”全國檔案事業(yè)發(fā)展規(guī)劃》[EB/OL].[2023-03-23].https://www.saac.gov.cn/daj/yaow/202106/899650c1b1ec4c0e9ad3c2ca7310eca4.shtml.