周文泓 賀譚濤 楊梓釩
摘 要 檔案館數(shù)據(jù)轉(zhuǎn)型的研究旨在為檔案領(lǐng)域應(yīng)對(duì)數(shù)據(jù)化進(jìn)程提供實(shí)踐策略,從而拓展檔案理論與方法。本文選取NARA和NAA兩個(gè)示范性案例呈現(xiàn)檔案館的前沿?cái)?shù)據(jù)轉(zhuǎn)型行動(dòng),從中總結(jié)轉(zhuǎn)型要義并提供參考。由此,發(fā)現(xiàn)立足國家數(shù)字建設(shè)框架、融合檔案館本質(zhì)職能、拓展數(shù)據(jù)對(duì)象認(rèn)識(shí)、顯現(xiàn)數(shù)據(jù)治理思路等轉(zhuǎn)型要點(diǎn),為我國檔案館的數(shù)據(jù)轉(zhuǎn)型提出啟示:提升數(shù)據(jù)轉(zhuǎn)型認(rèn)知、守正檔案館本質(zhì)定位、升級(jí)數(shù)據(jù)層管理行動(dòng)、拓展數(shù)據(jù)治理能力。
關(guān)鍵詞?檔案館 數(shù)據(jù)轉(zhuǎn)型 數(shù)字轉(zhuǎn)型 轉(zhuǎn)型策略
Abstract The research on data transformation of archives aims to provide practical strategies for the archival field to deal with data challenges, which contributes to archival theories and methods. With case study of practice of NAA and NARA, the frontier data transformation is presented and key transformation points are concluded to provide reference. Therefore, key dimensions are revealed as focusing on the framework of national digital construction, integrating the fundamental functions of archives, expanding the cognition of data objects, and indicating ideas of data governance. Then strategies are proposed including improvement of cognition of data transformation, upholding essential positioning of archives, upgrading the management actions on data level, and expanding the ability of data governance.
Keyword archives; data transformation; digital transformation; transformation strategy
數(shù)據(jù)化浪潮正為全球各國與地區(qū)帶來新一輪發(fā)展契機(jī),機(jī)遇與挑戰(zhàn)并存的背景下數(shù)據(jù)各利益相關(guān)者的參與和協(xié)同是重要的助推力量[1]。檔案館作為可信信息管理的監(jiān)督與指導(dǎo)者以及可信信息資源的保管與共享者,其助力是數(shù)據(jù)化的強(qiáng)烈現(xiàn)實(shí)需求,同時(shí)數(shù)據(jù)化亦是檔案館轉(zhuǎn)型升級(jí)的重要內(nèi)容。因之,檔案館在社會(huì)數(shù)據(jù)化進(jìn)程中應(yīng)有怎樣的定位與具體行動(dòng)亟待解答,尤其對(duì)于數(shù)字戰(zhàn)略多維推進(jìn)的中國而言,檔案機(jī)構(gòu)在同數(shù)據(jù)管理機(jī)構(gòu)的協(xié)作探索中更需明晰檔案館數(shù)據(jù)轉(zhuǎn)型的主要內(nèi)容。
研究層面有一定的回應(yīng),一方面,從檔案數(shù)據(jù)化視角將數(shù)字檔案資源轉(zhuǎn)換為可供閱讀、分析和處理的檔案數(shù)據(jù)資源的過程,這從檔案信息資源開發(fā)框架下數(shù)據(jù)挖掘和大數(shù)據(jù)背景下檔案數(shù)據(jù)相關(guān)概念界定與行動(dòng)得以體現(xiàn)[2][3]。另一方面,從數(shù)據(jù)歸檔角度探討如何將數(shù)據(jù)管理同文件、檔案管理相融合,這從機(jī)構(gòu)職能如數(shù)據(jù)管理機(jī)構(gòu)與檔案機(jī)構(gòu)相互關(guān)系、數(shù)據(jù)檔案化管理機(jī)制與流程等方面有一定探討[4][5]。此外,亦有研究從數(shù)據(jù)治理的內(nèi)容組成尤其是開放數(shù)據(jù)的視角明確檔案館開放數(shù)據(jù)的方法、進(jìn)展、問題與對(duì)策[6],然而這些研究對(duì)檔案館應(yīng)如何實(shí)現(xiàn)數(shù)據(jù)轉(zhuǎn)型與展開具體行動(dòng)尚缺整體把控和細(xì)致說明。
對(duì)照于現(xiàn)實(shí)需求和研究局限,全球各國與地區(qū)檔案館正萌發(fā)的數(shù)據(jù)治理能力建設(shè)為參與行動(dòng)提供了探索空間。美國、澳大利亞、英國等均基于各自檔案館職能與檔案管理機(jī)制有一定部署與具體行動(dòng),這些部署與行動(dòng)在具有實(shí)踐參照價(jià)值的情況下可提供經(jīng)驗(yàn)借鑒。
一、兩個(gè)維度:檔案館的數(shù)據(jù)轉(zhuǎn)型行動(dòng)
1.立足國家整體數(shù)據(jù)資源建設(shè)的開放數(shù)據(jù)政策部署:以NARA為例[7]。檔案館作為可信信息資源的保存與利用的核心基地,在政府?dāng)?shù)據(jù)治理背景下的重要職責(zé)之一就包括參與數(shù)據(jù)資源建設(shè)且將檔案開放同數(shù)據(jù)開放在機(jī)制與流程上融合。因而,開放數(shù)據(jù)成為檔案館從后端參與政府?dāng)?shù)據(jù)治理的關(guān)鍵切入點(diǎn)。值得說明的是,選取NARA作為示范性案例在于它不僅實(shí)施開放數(shù)據(jù)行動(dòng)呼應(yīng)微觀的數(shù)據(jù)管理需求,而且從規(guī)則層面制定同治理對(duì)照的開放數(shù)據(jù)政策。對(duì)接于美國數(shù)字政府和開放政府的戰(zhàn)略,NARA從以下方面深化開放數(shù)據(jù)行動(dòng)。
(1)構(gòu)建數(shù)字檔案資源。NARA的終極目標(biāo)是將所有文件與檔案遷移至數(shù)字空間并實(shí)現(xiàn)線上利用,因而數(shù)據(jù)治理中深化開放數(shù)據(jù)的基點(diǎn)是以“數(shù)字化”的過程創(chuàng)建數(shù)字副本,為開放數(shù)據(jù)奠定內(nèi)容資源基礎(chǔ)。為將NARA龐大的檔案存儲(chǔ)數(shù)字化并實(shí)現(xiàn)以數(shù)據(jù)為基本顆粒的管理與利用,NARA通過尋求商務(wù)合作伙伴、眾包、轉(zhuǎn)移至其他利益相關(guān)者,如形成機(jī)構(gòu)、升級(jí)優(yōu)化內(nèi)部的數(shù)據(jù)實(shí)驗(yàn)室等策略,進(jìn)行了一系列檔案轉(zhuǎn)化工作,NARA正在對(duì)包括120億頁文本在內(nèi)的檔案進(jìn)行數(shù)字化,并通過人工與自動(dòng)化著錄結(jié)合的方式予以數(shù)據(jù)挖掘。例如,NARA對(duì)1940年人口普查的370萬張圖片、7.5萬張世界大戰(zhàn)靜態(tài)圖片和164個(gè)(337卷)時(shí)長達(dá)65小時(shí)的內(nèi)容進(jìn)行數(shù)字化處理,這些檔案可以在線獲取。此外,公眾用戶幫助轉(zhuǎn)錄完成了177000份檔案,NARA的內(nèi)部數(shù)字成像實(shí)驗(yàn)室在2015—2016數(shù)字化了超過700萬幅圖像。
(2)開放高價(jià)值數(shù)據(jù)集。為進(jìn)一步提高透明度和數(shù)據(jù)公開力度,NARA在龐大的檔案資源中以開放高價(jià)值的數(shù)據(jù)集為重要對(duì)象,領(lǐng)銜專項(xiàng)開放數(shù)據(jù)行動(dòng)。同時(shí),NARA鼓勵(lì)工作人員對(duì)數(shù)據(jù)資產(chǎn)進(jìn)行內(nèi)部提名,并每季度通過對(duì)新的數(shù)據(jù)資產(chǎn)進(jìn)行審查,以擴(kuò)大清單中包含的數(shù)據(jù)資產(chǎn)的數(shù)量,豐富元數(shù)據(jù),并開放其他數(shù)據(jù)資產(chǎn)來維護(hù)業(yè)務(wù)數(shù)據(jù)清單。截至目前,NARA在Data.gov和Archives.gov開放的高價(jià)值數(shù)據(jù)集有十余個(gè),包括:公共數(shù)據(jù)清單,包含可供公眾使用的數(shù)據(jù)資產(chǎn),涵蓋XML、CSV、PDF和HTML各種格式的數(shù)據(jù);美國聯(lián)邦各項(xiàng)規(guī)定與民主化進(jìn)程的記錄,如2007—2009年聯(lián)邦法規(guī)(CFR)、2000—2010年《聯(lián)邦公報(bào)》、修正美國(1787年至2014年“美國憲法”11000多項(xiàng)擬議修正案)、1996年至今的聯(lián)邦條例法典、2000年至今的聯(lián)邦登記冊(cè)(美國政府的官方法律報(bào)紙)、“聯(lián)邦登記冊(cè)”上公布的“聯(lián)邦政府總條例”和“永久條例”的編纂工作、美國總統(tǒng)的行政命令、美國總統(tǒng)的公開文件、美國政府手冊(cè)(有關(guān)立法、司法、行政部門機(jī)構(gòu)和準(zhǔn)官方機(jī)構(gòu)的全面信息)、1971—1973年尼克松政府的白宮磁帶(尼克松政府期間白宮錄音系統(tǒng)記錄的會(huì)議和電話的元數(shù)據(jù));NARA檔案資源的說明數(shù)據(jù),如檔案研究目錄(ARC)中的檔案說明(提供了有關(guān)聯(lián)邦政府在國家檔案館保管中的永久資產(chǎn)的信息)、國家檔案館目錄中的檔案描述(聯(lián)邦政府永久財(cái)產(chǎn)的檔案描述,包括傳統(tǒng)的紙張收藏、電子文件和文物)、國家檔案目錄中的組織描述(聯(lián)邦和非聯(lián)邦組織的名稱和行政歷史的演變)。
(3)開放數(shù)據(jù)利用工具的優(yōu)化。開放數(shù)據(jù)工具的優(yōu)化,在融合NARA線上檔案利用平臺(tái)的升級(jí)中。
一方面,強(qiáng)化國家檔案目錄這一利用系統(tǒng)的建設(shè),增加線上可利用檔案并將利用深化至數(shù)據(jù)層,提高檢索能力。NARA的開發(fā)工作側(cè)重于提高系統(tǒng)的性能和可伸縮性,并利用開放源碼平臺(tái),使其能夠有效地提供對(duì)數(shù)千萬條甚至數(shù)億條記錄的訪問。檢索內(nèi)容包括來自檔案研究目錄(ARC)的所有數(shù)據(jù),一些來自訪問檔案數(shù)據(jù)庫(AAD)的系列,來自電子文件檔案館(ERA)的電子文件集合、Archives.gov和總統(tǒng)圖書館網(wǎng)站的檔案數(shù)據(jù)。OPA(在線公共利用)系統(tǒng)是NARA文件與檔案以及國家檔案館中有關(guān)信息的在線門戶,提供了對(duì)檔案庫中多種資源的利用,同時(shí)也簡化了檢索方式。其內(nèi)容包括:NARA近75%的傳統(tǒng)館藏(文本記錄)、77%的文物和95%以上的電子文件、所有Archives.gov頁面和總統(tǒng)圖書館網(wǎng)頁的資源。這些都是開放數(shù)據(jù)可利用的重要渠道。
另一方面,是做好同各類系統(tǒng)的對(duì)接,確保數(shù)字原生信息得到數(shù)據(jù)層的記錄,為開放數(shù)據(jù)工作實(shí)現(xiàn)前置的統(tǒng)籌協(xié)同。例如,ERA以前端控制方式確保電子文件在聯(lián)邦政府機(jī)構(gòu)當(dāng)中形成與流轉(zhuǎn)時(shí),通過元數(shù)據(jù)記錄誰創(chuàng)造了它們、為什么創(chuàng)造它們以及對(duì)它們應(yīng)用了哪些過程的知識(shí)。其中,開發(fā)應(yīng)用程序接口(API)是重要舉措,從而確保所有新的IT系統(tǒng)都遵循開放的數(shù)據(jù)、內(nèi)容和Web API政策,并執(zhí)行agency.gov/developer頁面的要求,以促進(jìn)公民開發(fā)人員重新使用National Archives記錄。NARA開發(fā)了大量公共應(yīng)用程序編程接口(API),包括針對(duì)網(wǎng)頁和移動(dòng)應(yīng)用的API。API的使用會(huì)極大地?cái)U(kuò)大公眾使用NARA記錄和JSON、XML和CSV等多種格式的描述性元數(shù)據(jù)的可能性,同時(shí)也會(huì)大大提高NARA與第三方平臺(tái)(如Wikipedia和美國數(shù)字公共圖書館)共享政府記錄的能力。為達(dá)到開發(fā)API的目的,NARA在Github上發(fā)布了從數(shù)字化工具到包含F(xiàn)ederalRegister.gov的代碼,也尋求將站點(diǎn)遷移到開源內(nèi)容管理系統(tǒng)Drupal上。從而在這樣一個(gè)社會(huì)協(xié)作編碼平臺(tái)上,公眾和工作人員可以更好的進(jìn)行開放數(shù)據(jù)的底層代碼設(shè)計(jì)。
目前,可獲的API包括國家檔案目錄API、聯(lián)邦注冊(cè)API、美國數(shù)字公共圖書館API、Flickr API。以國家檔案目錄API為例,它是國家檔案目錄的讀寫網(wǎng)絡(luò)API。該API可用于執(zhí)行對(duì)檔案元數(shù)據(jù)的實(shí)地搜索、元數(shù)據(jù)和數(shù)字媒體的大量導(dǎo)出以及對(duì)記錄的貢獻(xiàn)。數(shù)據(jù)集包括檔案描述、權(quán)威、數(shù)字媒體、網(wǎng)頁和公眾貢獻(xiàn)(如標(biāo)簽、轉(zhuǎn)錄和評(píng)論)。
2.面向數(shù)字連續(xù)性構(gòu)建的可信數(shù)據(jù)管控制度體系設(shè)計(jì):以NAA為例[8]。檔案館另一關(guān)鍵職責(zé)是對(duì)政府各類信息的前端控制,監(jiān)督、指導(dǎo)與輔助政府機(jī)構(gòu)有序可信地全流程形成、管理和維護(hù)信息。數(shù)據(jù)化深入的背景下,數(shù)據(jù)類的記錄亦涵蓋其中,即為政府?dāng)?shù)據(jù)管理建立管控質(zhì)量的規(guī)則體系。以數(shù)字連續(xù)性為目標(biāo)的澳大利亞以澳大利亞國家檔案館(以下稱NAA)為引領(lǐng)者,從文件與檔案管理角度設(shè)定澳大利亞政府?dāng)?shù)據(jù)治理聯(lián)動(dòng)管理的整體體系。為支持澳大利亞政府?dāng)?shù)字化轉(zhuǎn)型,NAA于2005年發(fā)布《數(shù)字連續(xù)性2020》政策,其中可互操作的信息、系統(tǒng)和流程是能力建設(shè)的三大要求之一。NAA認(rèn)為,要達(dá)成此目標(biāo)的構(gòu)件之一是數(shù)據(jù)規(guī)則體系的建立與貫通,從而支持跨業(yè)務(wù)、安全、法律、語義和技術(shù)主題構(gòu)建互操作性,這也是政府?dāng)?shù)據(jù)治理的要義。因而,NAA基于規(guī)范政府?dāng)?shù)據(jù)與信息管理的監(jiān)督與指導(dǎo)者的職責(zé),主導(dǎo)設(shè)計(jì)政府?dāng)?shù)據(jù)治理主要內(nèi)容,并關(guān)注到治理同管理的有效對(duì)接,將內(nèi)容整體界定為“政府?dāng)?shù)據(jù)治理與管理”。當(dāng)前,NAA將政府?dāng)?shù)據(jù)治理與管理的核心活動(dòng)部署為以下內(nèi)容。
(1)面向互操作能力構(gòu)建的元數(shù)據(jù)設(shè)置。元數(shù)據(jù)是定義和描述數(shù)據(jù)的結(jié)構(gòu)化信息,在確保用戶和系統(tǒng)了解交換的信息和數(shù)據(jù)的含義方面起著重要作用,是數(shù)據(jù)治理與管理的重要環(huán)節(jié)。NAA要求政府機(jī)構(gòu)制定元數(shù)據(jù)戰(zhàn)略和元數(shù)據(jù)標(biāo)準(zhǔn)作為保障。針對(duì)元數(shù)據(jù)的收集、存儲(chǔ)和交換等環(huán)節(jié),NAA要求元數(shù)據(jù)收集應(yīng)使用自動(dòng)化工具,從各種來源(如網(wǎng)站)收集元數(shù)據(jù)描述,機(jī)構(gòu)內(nèi)不同的元數(shù)據(jù)存儲(chǔ)庫應(yīng)進(jìn)行集中,以建設(shè)中央元數(shù)據(jù)存儲(chǔ)庫。同時(shí),機(jī)構(gòu)內(nèi)元數(shù)據(jù)相關(guān)文件應(yīng)實(shí)時(shí)更新,以滿足其他機(jī)構(gòu)使用的標(biāo)準(zhǔn),進(jìn)而保證元數(shù)據(jù)的有效交換。
(2)數(shù)據(jù)的索引與發(fā)現(xiàn)。數(shù)據(jù)的索引與發(fā)現(xiàn)包括掃描數(shù)據(jù)集的存儲(chǔ)庫和文件存儲(chǔ)庫,快速有效地在整個(gè)機(jī)構(gòu)中查找數(shù)據(jù),了解機(jī)構(gòu)當(dāng)前的數(shù)據(jù)格局,并充分利用現(xiàn)有數(shù)據(jù),這是政府機(jī)構(gòu)進(jìn)行數(shù)據(jù)治理與管理的基礎(chǔ)。數(shù)據(jù)索引與發(fā)現(xiàn)要求機(jī)構(gòu)進(jìn)行數(shù)據(jù)分析并記錄機(jī)構(gòu)數(shù)據(jù)。數(shù)據(jù)分析通過深入了解數(shù)據(jù)問題的根源,識(shí)別機(jī)構(gòu)數(shù)據(jù)與目標(biāo)數(shù)據(jù)狀態(tài)之間的差異,研究機(jī)構(gòu)當(dāng)前的數(shù)據(jù)流并確定需要改進(jìn)的領(lǐng)域,幫助機(jī)構(gòu)確定匹配特定計(jì)劃的理想標(biāo)準(zhǔn)所需的數(shù)據(jù)轉(zhuǎn)換。記錄機(jī)構(gòu)數(shù)據(jù)指了解機(jī)構(gòu)中擁有的信息和數(shù)據(jù),機(jī)構(gòu)應(yīng)檢查相關(guān)治理框架,以獲取在何處查找有關(guān)數(shù)據(jù)的指導(dǎo),例如信息資產(chǎn)登記冊(cè)(用于識(shí)別您資產(chǎn)的潛在價(jià)值和可能風(fēng)險(xiǎn))、業(yè)務(wù)系統(tǒng)注冊(cè)或軟件許可證注冊(cè)表(其中可能包含有關(guān)系統(tǒng)數(shù)據(jù)的詳細(xì)信息以及任何相關(guān)的系統(tǒng)信息管理計(jì)劃)。
(3)數(shù)據(jù)的分類。數(shù)據(jù)分類是指將信息和數(shù)據(jù)組織成有意義的組的分類方案,幫助機(jī)構(gòu)將其信息和數(shù)據(jù)組織成層次關(guān)系,以確保可以對(duì)其進(jìn)行有效搜索,查找并正確解釋其含義,支持互操作性語義主題的建構(gòu)。數(shù)據(jù)分類最簡單的形式為通過分類對(duì)象間的關(guān)系建立層次結(jié)構(gòu),并使用受控詞匯表來管理同義詞,確保業(yè)務(wù)術(shù)語得到正確解釋,減少歧義。在創(chuàng)建分類方案時(shí),需考慮使用現(xiàn)有數(shù)據(jù)定義,減少數(shù)據(jù)轉(zhuǎn)換,正確解釋數(shù)據(jù)和信息的內(nèi)容。當(dāng)機(jī)構(gòu)需要?jiǎng)?chuàng)建大型本體,標(biāo)記和更正現(xiàn)有分類法中的錯(cuò)誤以及定期生成大量需要分類的數(shù)據(jù)時(shí),可以采取自動(dòng)分類法構(gòu)建(ATC),利用自動(dòng)化工具實(shí)現(xiàn)文本主體的分類。除了傳統(tǒng)分類方案中利用層級(jí)結(jié)構(gòu)來描述信息和數(shù)據(jù),NAA指出還可以通過其與不在其線性層次結(jié)構(gòu)中的其他對(duì)象的關(guān)系來進(jìn)行描述。
(4)數(shù)據(jù)及其格式的開放。政府?dāng)?shù)據(jù)治理與管理要求機(jī)構(gòu)數(shù)據(jù)及其格式必須開放才能支持互操作性的構(gòu)建,其要求為機(jī)器可讀,沒有“鎖定”特定技術(shù)產(chǎn)品或供應(yīng)商,可以自由訪問,能夠在開源或免費(fèi)技術(shù)下使用,同時(shí)需考慮相關(guān)政策和標(biāo)準(zhǔn)等,滿足隱私安全的要求。如機(jī)構(gòu)數(shù)據(jù)因技術(shù)原因無法呈現(xiàn)開放格式,可以使用提取、轉(zhuǎn)換或加載(ETL)等技術(shù)將數(shù)據(jù)轉(zhuǎn)換為需要的格式。NAA建議政府可以接受數(shù)字轉(zhuǎn)型機(jī)構(gòu)使用開放數(shù)據(jù)改進(jìn)機(jī)構(gòu)服務(wù)的指導(dǎo),并使用開放數(shù)據(jù)成熟度的通用模型(如NSW Government Open Data Model新南威爾士州政府開放數(shù)據(jù)模型)來評(píng)估其開放數(shù)據(jù)的成熟度,監(jiān)控機(jī)構(gòu)數(shù)據(jù)及其格式開放的進(jìn)程。
(5)數(shù)據(jù)質(zhì)量的管控。對(duì)數(shù)據(jù)質(zhì)量的管控可以保證政府?dāng)?shù)據(jù)治理與管理的有效開展。數(shù)據(jù)質(zhì)量的管控通過建立數(shù)據(jù)質(zhì)量策略來監(jiān)視和管理數(shù)據(jù)質(zhì)量是否符合機(jī)構(gòu)要求,并對(duì)其進(jìn)行有效評(píng)估。數(shù)據(jù)管理協(xié)會(huì)(DAMA)將數(shù)據(jù)質(zhì)量的共同維度定義為:準(zhǔn)確性、完整性、一致性、真實(shí)性、合理性、及時(shí)性、獨(dú)特性和有效性。數(shù)據(jù)質(zhì)量評(píng)估通過測量數(shù)據(jù)的特定維度來對(duì)數(shù)據(jù)質(zhì)量進(jìn)行評(píng)估,數(shù)據(jù)質(zhì)量評(píng)估可以顯示機(jī)構(gòu)數(shù)據(jù)是否滿足利益相關(guān)方要求,并幫助機(jī)構(gòu)確定高價(jià)值數(shù)據(jù)集的補(bǔ)救優(yōu)先級(jí)。NAA提出可以使用數(shù)據(jù)質(zhì)量評(píng)估工具作為指導(dǎo),監(jiān)控?cái)?shù)據(jù)質(zhì)量,生成數(shù)據(jù)質(zhì)量報(bào)告,協(xié)助驗(yàn)證數(shù)據(jù)并為將來的數(shù)據(jù)修復(fù)提供指導(dǎo)。除此以外,良好的元數(shù)據(jù)對(duì)于理解和評(píng)估數(shù)據(jù)質(zhì)量至關(guān)重要。數(shù)據(jù)質(zhì)量評(píng)估需要確定機(jī)構(gòu)數(shù)據(jù)是否滿足其用戶的期望,元數(shù)據(jù)在表明這些期望方面起著關(guān)鍵作用。例如,機(jī)構(gòu)可以查看元數(shù)據(jù)是否符合格式要求,或者是否已根據(jù)業(yè)務(wù)規(guī)則進(jìn)行更新。元數(shù)據(jù)還可用于記錄數(shù)據(jù)質(zhì)量評(píng)估,這意味著元數(shù)據(jù)存儲(chǔ)庫可用于在整個(gè)組織中存儲(chǔ)和共享數(shù)據(jù)質(zhì)量評(píng)估結(jié)果。機(jī)構(gòu)元數(shù)據(jù)和數(shù)據(jù)質(zhì)量團(tuán)隊(duì)可以緊密合作,共同開發(fā)這些流程。
(6)數(shù)據(jù)合規(guī)性與安全性的保障。所有政府?dāng)?shù)據(jù)均受法律、政策和標(biāo)準(zhǔn)的約束,因此需保障數(shù)據(jù)合規(guī)且安全,才能實(shí)現(xiàn)政府?dāng)?shù)據(jù)治理與管理。NAA認(rèn)為建設(shè)互操作性項(xiàng)目需關(guān)注數(shù)據(jù)交換機(jī)制、數(shù)據(jù)隱私和識(shí)別數(shù)據(jù)許可和使用條款中與數(shù)據(jù)合規(guī)性和安全性相關(guān)的內(nèi)容,并遵循保護(hù)性安全政策框架(PSPF)和澳大利亞政府信息安全手冊(cè)(ISM),對(duì)敏感和機(jī)密信息進(jìn)行有效管控,防止未經(jīng)授權(quán)的信息訪問。數(shù)據(jù)交換機(jī)制可通過參考數(shù)字轉(zhuǎn)換機(jī)構(gòu)(DTA)的可信數(shù)字身份框架和Gatekeeper公鑰基礎(chǔ)結(jié)構(gòu)框架,來確保機(jī)構(gòu)流程和系統(tǒng)滿足安全數(shù)據(jù)交換的標(biāo)準(zhǔn)。澳大利亞信息專員辦公室(OAIC)提供的澳大利亞隱私原則和隱私原則資料單,可以幫助政府機(jī)構(gòu)了解并滿足數(shù)據(jù)隱私和去識(shí)別的要求。為滿足數(shù)據(jù)的合規(guī)要求,政府機(jī)構(gòu)還需了解所需數(shù)據(jù)依據(jù)的許可和使用條款,所需數(shù)據(jù)是否使用其他派生數(shù)據(jù)集以及是否將派生數(shù)據(jù)的許可和使用條款轉(zhuǎn)移到新數(shù)據(jù)集中。
二、檔案館數(shù)據(jù)轉(zhuǎn)型經(jīng)驗(yàn)解析
美國與澳大利亞的數(shù)據(jù)轉(zhuǎn)型行動(dòng)分別從兩個(gè)維度展開,二者亦有相交之處,在世界范圍內(nèi)有著近似實(shí)踐的國家與地區(qū),涵蓋英國、加拿大、新西蘭、韓國、新加坡等。盡管實(shí)踐不盡相同,但面對(duì)人類世界數(shù)據(jù)化延展的趨勢(shì),它們的行動(dòng)顯示的是對(duì)數(shù)據(jù)轉(zhuǎn)型趨勢(shì)的發(fā)現(xiàn)和正面主動(dòng)的應(yīng)對(duì)姿態(tài)。綜合當(dāng)前以上述兩大維度的代表性實(shí)踐來看,無論實(shí)踐形態(tài)為何,關(guān)鍵要義在于以下方面。
1.立足國家數(shù)字建設(shè)框架。檔案館的數(shù)據(jù)轉(zhuǎn)型體現(xiàn)的是主動(dòng)積極參與社會(huì)建構(gòu)的思路,在當(dāng)下顯示為從數(shù)據(jù)化的脈絡(luò)中推動(dòng)國家的數(shù)字建設(shè)。數(shù)字建設(shè)需要數(shù)據(jù)資源和數(shù)據(jù)方法的雙重助力,這也對(duì)各個(gè)領(lǐng)域提出需求,亦是各行業(yè)同步甚至領(lǐng)銜社會(huì)建設(shè)的機(jī)遇。對(duì)兼具信息管理與公共服務(wù)職能的檔案館來說,這也是不可錯(cuò)失的契機(jī)。因而,積極探查所屬外圍環(huán)境,尤其是國家與地區(qū)層面的數(shù)字建設(shè)框架,成為檔案館數(shù)據(jù)轉(zhuǎn)型的重要前提。而系統(tǒng)發(fā)現(xiàn)數(shù)字建設(shè)有何需求,并如何對(duì)照于檔案館運(yùn)行目標(biāo)、方法、對(duì)象、內(nèi)容等各要素的發(fā)展則不可或缺。
因而,一方面,NARA與NAA在美國同澳大利亞均著力建設(shè)數(shù)字政府積極布局國家數(shù)據(jù)戰(zhàn)略的背景下,都提出要展開相應(yīng)行動(dòng),從而表現(xiàn)出同樣的數(shù)據(jù)轉(zhuǎn)型趨勢(shì)。另一方面,不同國家與地區(qū)的數(shù)據(jù)化規(guī)劃不同,這也使得NARA與NAA的數(shù)據(jù)轉(zhuǎn)型路徑相異。美國以數(shù)字政府和開放政府兩大戰(zhàn)略為主線,數(shù)據(jù)層級(jí)的行動(dòng)布局均涵蓋其中,由此NARA的開放數(shù)據(jù)行動(dòng)相對(duì)分散,依據(jù)數(shù)字政府和開放政府的不同要求展開,例如對(duì)照數(shù)字政府著力于平臺(tái)建設(shè),對(duì)應(yīng)于開放政府著重于數(shù)據(jù)資源建設(shè)。相比之下,澳大利亞政府直接提出數(shù)據(jù)治理戰(zhàn)略,NAA則把握主線“集中式”地設(shè)計(jì)數(shù)據(jù)治理與管理模塊。
2.融合檔案館本質(zhì)職能。檔案館本質(zhì)職能的明確是檔案館數(shù)據(jù)轉(zhuǎn)型的基石,它幫助檔案館明晰數(shù)據(jù)轉(zhuǎn)型的必要性、轉(zhuǎn)型點(diǎn)、轉(zhuǎn)型方向與具體內(nèi)容,從而解決如何做的問題。這意味著,檔案館的數(shù)據(jù)轉(zhuǎn)型重點(diǎn)依舊落于檔案館是什么的問題,所有數(shù)據(jù)轉(zhuǎn)型顯示出的方向都要融合在檔案館職能與各職能維度下的業(yè)務(wù)活動(dòng)中。換言之,檔案館的數(shù)據(jù)轉(zhuǎn)型并不是將已有的檔案管理職能弱化,而是要厘清檔案館職能的本質(zhì)。
NARA和NAA的具體行動(dòng),共同顯示出檔案館既是具有長久價(jià)值檔案資源的保管和提供利用方,亦要從專業(yè)角度指導(dǎo)與監(jiān)督各種形式記錄的可信全過程管理。由此,一方面,兩者積極參與或促進(jìn)數(shù)據(jù)資源建設(shè)以及質(zhì)量維護(hù)的目標(biāo),均在于當(dāng)下與未來能夠留存更多可信數(shù)據(jù)并實(shí)現(xiàn)數(shù)據(jù)層級(jí)的價(jià)值挖掘與利用。另一方面,NARA體現(xiàn)為以ERA的積極對(duì)接來確保數(shù)據(jù)層同樣實(shí)現(xiàn)前端控制,NAA則表現(xiàn)為數(shù)據(jù)治理與管理板塊的服務(wù)對(duì)象就是政府機(jī)構(gòu)。其中,檔案管理的本質(zhì)愈加深化,即便如NAA這樣,將核心術(shù)語的常規(guī)表達(dá)為和前端的業(yè)務(wù)部門對(duì)接選擇數(shù)據(jù),但可信文件、檔案管理的理論與方法論仍深入其中。例如,數(shù)據(jù)治理與管理板塊中業(yè)務(wù)、法律、技術(shù)等多維度的布局,充分表現(xiàn)了文件連續(xù)體的基本思想。
3.拓展數(shù)據(jù)對(duì)象認(rèn)識(shí)。數(shù)據(jù)轉(zhuǎn)型的另一要點(diǎn)是將檔案館的內(nèi)容對(duì)象即檔案從形式端予以拓展。一方面,不僅認(rèn)可檔案可以是深化至數(shù)據(jù)形式的記錄,也認(rèn)為數(shù)據(jù)逐步成為檔案主要的表達(dá)形式。并且,由NAA的實(shí)踐透露出的趨向,就是數(shù)據(jù)作為術(shù)語表達(dá)將從形成端貫通至檔案利用端。因而,在NAA的官方網(wǎng)站中,從所有政策文本的內(nèi)容上看,record和archive這樣文件、檔案的提法極為少見,近年主流的information即信息也逐漸被數(shù)據(jù)取代,因而NAA直接將信息治理下的主要板塊之一設(shè)置為數(shù)據(jù)治理與管理。這一變化在2019年中國電子文件管理論壇上得到澳大利亞國家檔案館館長助理Linda Macfariane的確認(rèn),她的報(bào)告中明確提出信息管理的提法將在澳大利亞國家檔案館中凸顯以數(shù)據(jù)為核心術(shù)語的表達(dá)。另一方面,進(jìn)一步強(qiáng)化數(shù)據(jù)化趨向背后更加完整的技術(shù)思維,即技術(shù)理念的認(rèn)識(shí)和技術(shù)的利用,以此將作用對(duì)象深化至數(shù)據(jù)層時(shí),亦能因?yàn)轭w粒度的變化而創(chuàng)新管理方法和應(yīng)用技術(shù)。例如,NARA創(chuàng)設(shè)數(shù)據(jù)實(shí)驗(yàn)室的很大程度受驅(qū)動(dòng)于數(shù)據(jù)資源建設(shè)和提供利用的復(fù)雜性與繁雜工作量,數(shù)據(jù)轉(zhuǎn)型的大量成果導(dǎo)向各類系統(tǒng)的開發(fā)或完善。
4.顯現(xiàn)數(shù)據(jù)治理思路。數(shù)據(jù)轉(zhuǎn)型于檔案館而言還綜合表現(xiàn)為凸顯數(shù)據(jù)治理思路,對(duì)各要素進(jìn)行頂層協(xié)調(diào)與統(tǒng)籌。一方面,對(duì)各要素進(jìn)行聯(lián)動(dòng),將主體矩陣、數(shù)據(jù)流、配套設(shè)施、管理要求相互對(duì)照和貫通,從而能將數(shù)據(jù)管理立體且網(wǎng)絡(luò)化嵌入各類主體的各項(xiàng)活動(dòng)之中,這既體現(xiàn)于檔案館自我的檔案資源保管與利用如開放數(shù)據(jù)中,也顯示于檔案館為政府機(jī)構(gòu)設(shè)定的可信數(shù)據(jù)管理上。例如,NARA的開放數(shù)據(jù)統(tǒng)籌是對(duì)各個(gè)相關(guān)要素的連接,既表現(xiàn)為流程上做好以ERA作為中介的前中后多端流程對(duì)接,也體現(xiàn)為主體、平臺(tái)、資源多方的統(tǒng)籌,如多種組織架構(gòu)設(shè)計(jì)以協(xié)作構(gòu)建數(shù)據(jù)資源。
另一方面,除落實(shí)和推進(jìn)各項(xiàng)數(shù)據(jù)管理活動(dòng),檔案館的數(shù)據(jù)轉(zhuǎn)型亦在于作為專業(yè)機(jī)構(gòu)參與數(shù)據(jù)管理規(guī)則體系建設(shè),共同助力社會(huì)數(shù)據(jù)治理框架搭建。因而,檔案館的數(shù)據(jù)轉(zhuǎn)型在數(shù)據(jù)治理思路下強(qiáng)調(diào)的是,不僅要作為資源管控方的落實(shí)者,而且要為資源可信管理的專業(yè)者對(duì)各類主體、各項(xiàng)流程、各個(gè)行業(yè)的數(shù)據(jù)管理提出可信管理的要求,并為此提供規(guī)則或是協(xié)作制定規(guī)則。以NAA為例,其為澳大利亞政府設(shè)計(jì)的數(shù)據(jù)治理和管理活動(dòng)著重在于數(shù)據(jù)管理有哪些活動(dòng)及其關(guān)鍵要求,如從數(shù)據(jù)管理關(guān)鍵環(huán)節(jié)如索引與分類或是數(shù)據(jù)可信的八大屬性出發(fā),為此提供標(biāo)準(zhǔn)要求,而非檔案館親自進(jìn)行數(shù)據(jù)管理。
三、策略:檔案館的數(shù)據(jù)轉(zhuǎn)型空間探討
于我國,數(shù)據(jù)治理體系的建設(shè)正在進(jìn)程中,以數(shù)據(jù)助力國家治理能力現(xiàn)代化的行動(dòng)正在各領(lǐng)域布局和實(shí)施,檔案館為此接收并提供利用的數(shù)據(jù)資源正在構(gòu)建中,亦為檔案館的整體運(yùn)營提供新的思路和要求,在機(jī)構(gòu)改革的背景下更要求檔案館同數(shù)據(jù)化趨勢(shì)對(duì)接的轉(zhuǎn)型規(guī)劃。NARA和NAA的數(shù)據(jù)轉(zhuǎn)型實(shí)踐經(jīng)驗(yàn)盡管不能全盤照搬于我國,積極應(yīng)對(duì)甚至引領(lǐng)數(shù)據(jù)化的意識(shí)以及對(duì)照檔案館職能所設(shè)計(jì)的轉(zhuǎn)型內(nèi)容可提供一定參照。因而,基于我國檔案館數(shù)據(jù)轉(zhuǎn)型的需求和發(fā)展現(xiàn)狀,兩個(gè)維度的數(shù)據(jù)轉(zhuǎn)型行動(dòng)可啟示以下方面的探索空間。
1.提升數(shù)據(jù)轉(zhuǎn)型認(rèn)知。如何提升數(shù)據(jù)轉(zhuǎn)型認(rèn)知以實(shí)現(xiàn)檔案館對(duì)人類世界數(shù)據(jù)化進(jìn)程的跟進(jìn)、同步甚至引領(lǐng)。檔案館在數(shù)字技術(shù)發(fā)展過程中持續(xù)演進(jìn),從數(shù)字化再到數(shù)據(jù)化的沿革本質(zhì)上受社會(huì)前行而驅(qū)動(dòng),基于檔案網(wǎng)站、數(shù)字檔案館、云計(jì)算、社交媒體、區(qū)塊鏈、人工智能等升級(jí)檔案館職能以及相應(yīng)的業(yè)務(wù)活動(dòng)。然而,盡管數(shù)字檔案館建設(shè)成績斐然,但對(duì)比圖書館、博物館等相近領(lǐng)域,同技術(shù)前沿的跟進(jìn)程度相對(duì)滯后。例如,Web2.0在2010年之前就成為圖書館建設(shè)形態(tài)2.0的重要支持,而檔案館在2012年左右提到的社交媒體或后續(xù)的“互聯(lián)網(wǎng)+”戰(zhàn)略中才有明確的設(shè)想。因而,為更快意識(shí)到數(shù)據(jù)轉(zhuǎn)型的契機(jī)與重要性,提升數(shù)據(jù)轉(zhuǎn)型認(rèn)知是檔案館優(yōu)質(zhì)發(fā)展的前提。
提升數(shù)據(jù)轉(zhuǎn)型認(rèn)知的要點(diǎn)不在于認(rèn)知本身,而是發(fā)現(xiàn)數(shù)據(jù)轉(zhuǎn)型背后的驅(qū)動(dòng)力與驅(qū)動(dòng)表現(xiàn),這就意味著檔案館應(yīng)注重挖掘社會(huì)、文化、技術(shù)、管理等維度的歷史脈絡(luò)與面向未來的發(fā)展趨向。由此,才可發(fā)現(xiàn)數(shù)據(jù)轉(zhuǎn)型在中國處于怎樣的戰(zhàn)略定位和表現(xiàn)要點(diǎn),從而能夠深刻理解:中國的數(shù)據(jù)轉(zhuǎn)型有哪些空間,檔案館參與的必要性、緊迫性與潛在效應(yīng),檔案館對(duì)應(yīng)這些空間有哪些作用陣地。由此,檔案館的數(shù)據(jù)轉(zhuǎn)型認(rèn)知可從意識(shí)層深化至可作為的行動(dòng)布局層。
2.守正檔案館本質(zhì)定位。數(shù)據(jù)轉(zhuǎn)型的支點(diǎn)在于檔案館基于自我認(rèn)識(shí)與外界認(rèn)知結(jié)合而成的綜合定位,因而明確檔案館的職能與業(yè)務(wù)活動(dòng)是數(shù)據(jù)轉(zhuǎn)型得以分析與落實(shí)的基礎(chǔ)。一方面,重新定位需要得到認(rèn)可。在國家治理體系現(xiàn)代化的建設(shè)框架下,我國檔案事業(yè)正迎來多樣化的發(fā)展契機(jī)與挑戰(zhàn),作為主體的檔案館處于重新定位、設(shè)計(jì)、規(guī)劃、行動(dòng)實(shí)踐中,以期對(duì)照人類世界需求完成優(yōu)質(zhì)轉(zhuǎn)型?!稒n案法》修訂呈現(xiàn)的數(shù)據(jù)正納入檔案范疇,機(jī)構(gòu)改革中檔案館尋求新定位而數(shù)據(jù)相關(guān)機(jī)構(gòu)正在各地崛起,使得檔案館在數(shù)據(jù)化洪流中遍布契機(jī)與挑戰(zhàn),這樣的沖突中,檔案館本質(zhì)定位是否要變與變什么均需探索。例如,地方層面的檔案館同當(dāng)前設(shè)立的數(shù)據(jù)管理機(jī)構(gòu)為什么關(guān)系,檔案館如要確保數(shù)據(jù)資源長期保存的權(quán)屬要如何拓展職能并反映于政策中。
3.升級(jí)數(shù)據(jù)層管理行動(dòng)。依托數(shù)字檔案館建設(shè),檔案館的數(shù)據(jù)管理行動(dòng)得以全面展開。然而,數(shù)字檔案館僅是數(shù)據(jù)轉(zhuǎn)型的起點(diǎn)或是基礎(chǔ)維度,除深化數(shù)字檔案館建設(shè)外,落定于數(shù)據(jù)層從數(shù)據(jù)對(duì)象出發(fā)更新認(rèn)知、方法論和相應(yīng)的能力要求更需要綜合的升級(jí),要從社會(huì)、文化、技術(shù)等方面理解數(shù)據(jù)和數(shù)據(jù)管理,并映射于檔案館各要素的數(shù)據(jù)轉(zhuǎn)型中。當(dāng)前,技術(shù)維度強(qiáng)化人才的智力支持是落實(shí)數(shù)據(jù)層管理行動(dòng)不可或缺的途徑,因而各類數(shù)據(jù)相關(guān)技術(shù)的鉆研與適度應(yīng)用應(yīng)是檔案館的常規(guī)活動(dòng),例如當(dāng)前將區(qū)塊鏈應(yīng)用于歸檔數(shù)據(jù)的可信保存是熱點(diǎn)議題。
同時(shí),技術(shù)維度之外從社會(huì)與文化層認(rèn)知數(shù)據(jù)以及帶來的管理方法論革新,是破除技術(shù)決定論的關(guān)鍵。數(shù)據(jù)轉(zhuǎn)型不只是將數(shù)據(jù)納入檔案館的管理范疇,且并非僅將技術(shù)用于檔案館的工具包裝中,而是要認(rèn)識(shí)數(shù)據(jù)與數(shù)據(jù)管理是否要求檔案館重新認(rèn)識(shí)管理對(duì)象、服務(wù)對(duì)象、管理辦法、主體架構(gòu)、流程機(jī)制等,從而實(shí)現(xiàn)深層管理行動(dòng)的整體規(guī)劃。例如,數(shù)據(jù)量急劇增大意味著檔案館要擴(kuò)充社會(huì)力量的參與,主體架構(gòu)的調(diào)整絕非僅是口號(hào)式地提出多元主體的納入,而是對(duì)協(xié)作層級(jí)、關(guān)系、邊界、具體權(quán)責(zé)、平衡協(xié)議等均要有細(xì)致考量并設(shè)定于具體行動(dòng)中。
另一方面,檔案館的不變也應(yīng)得到確認(rèn),即無論檔案范疇如何變化,檔案館作為不可或缺的公共文化事業(yè)單位,是守護(hù)黨政機(jī)構(gòu)信息資產(chǎn)和社會(huì)文化遺產(chǎn)的關(guān)鍵主體,是信息領(lǐng)域的重要踐行者。于檔案館而言,明確的內(nèi)涵界定是能在數(shù)據(jù)轉(zhuǎn)型大潮中得以孵化生長的所在,從而確保我國檔案事業(yè)精準(zhǔn)耦合我國乃至全球發(fā)展趨勢(shì),并在其中逐漸拓展檔案事業(yè)領(lǐng)地、提升業(yè)務(wù)水平,以此成為信息產(chǎn)業(yè)升級(jí)與社會(huì)治理能力建設(shè)的重要力量。
4.拓展數(shù)據(jù)治理能力。數(shù)據(jù)治理能力構(gòu)建是數(shù)據(jù)轉(zhuǎn)型的綜合體現(xiàn),于我國檔案館而言,就是在優(yōu)化管理能力的基礎(chǔ)上依托數(shù)據(jù)實(shí)現(xiàn)向治理層的升級(jí)。數(shù)據(jù)化的進(jìn)程使得數(shù)據(jù)管理不限于微觀行動(dòng),而是要從組織架構(gòu)、規(guī)范等角度要求建立覆蓋各主體、活動(dòng)、流程、領(lǐng)域的規(guī)則體系,即多元主體協(xié)同的頂層設(shè)計(jì)、制度框架和標(biāo)準(zhǔn)規(guī)范集成體。因而,檔案館在我國不應(yīng)只是要做好數(shù)據(jù)保管與利用等具體的管理性工作,而是要積極成為數(shù)據(jù)管理規(guī)則的制定參與方。這要求檔案館對(duì)數(shù)據(jù)管理的利益相關(guān)者、數(shù)據(jù)管理的內(nèi)外要素、數(shù)據(jù)管理的要求等均有整體格局設(shè)計(jì)與把握,參與甚至引領(lǐng)整個(gè)規(guī)則體系的統(tǒng)籌和規(guī)劃,從而提高自身能力要求。
同時(shí),檔案館能在數(shù)據(jù)治理中獲得話語權(quán)的前提應(yīng)得到明確,即檔案館作為可信管理的專業(yè)機(jī)構(gòu)亦是部分重要數(shù)據(jù)資源的保管與提供利用方,這需要檔案館協(xié)同權(quán)力機(jī)關(guān)在檔案的政策法規(guī)中明確表示。例如《檔案法》修訂案中,對(duì)檔案的定義盡管提出了將數(shù)據(jù)納入,但其表述以及新增的檔案信息化的篇章應(yīng)對(duì)數(shù)據(jù)化有更顯性的表達(dá)。由此,檔案館才可作為數(shù)據(jù)資源的權(quán)屬方與專業(yè)管理者參與治理層的構(gòu)建,匹配形成相應(yīng)的治理能力。
總言之,數(shù)據(jù)化浪潮正為檔案館帶來從技術(shù)工具到司法行政、再到社會(huì)文化等多方面的轉(zhuǎn)型驅(qū)動(dòng)。機(jī)遇與挑戰(zhàn)并存的背景下,本文以NARA與NAA的實(shí)踐從認(rèn)知、行動(dòng)、定位、能力等方面為我國檔案館的數(shù)據(jù)轉(zhuǎn)型提供了方向性策略。同時(shí),相關(guān)問題有待系統(tǒng)與深入的探究,以形成更具指導(dǎo)性的理論、方法與實(shí)踐方案。
參考文獻(xiàn)
[1]安小米等.大數(shù)據(jù)治理體系:核心概念、動(dòng)議及其實(shí)現(xiàn)路徑分析[J]. 情報(bào)資料工作,2018(1):6-11.
[2]楊來青.大數(shù)據(jù)背景下檔案信息資源挖掘策略與方法研究[J]. 中國檔案,2018(8):60-61.
[3]趙躍.大數(shù)據(jù)時(shí)代檔案數(shù)據(jù)化的前景展望:意義與困境[J]. 檔案學(xué)研究,2019(5):52-60.
[4]徐擁軍,張臻,任瓊輝.國家大數(shù)據(jù)戰(zhàn)略背景下檔案部門與數(shù)據(jù)管理部門的職能關(guān)系[J/OL].圖書情報(bào)工作:1-9[2019-12-18].https://doi.org/10.13266/j.issn.0252-3116.2019.18.001.
[5]劉越男.大數(shù)據(jù)政策背景下政務(wù)文件歸檔面臨的挑戰(zhàn)[J]. 檔案學(xué)研究,2018(2):107-114.
[6]陳展. 檔案數(shù)據(jù)開放推進(jìn)路徑探略[J]. 浙江檔案,2019(1):20-22.
[7]NARA.Open Government Plan Version 4.0[EB/OL].2020-02-03.https://usnationalarchives.github.io/opengovplan/
[8]NAA.Data governance and management[EB/OL]. 2020-01-31 https://www.naa.gov.au/information-management/building-interoperability/interoperability-development-phases/data-governance-and-management.