周文泓 文利君 陳淑涵
摘 要:調(diào)查梳理面向網(wǎng)絡(luò)空間的計算檔案學(xué)研究成果,旨在明確計算檔案學(xué)的發(fā)展場景與方向。文章對計算檔案學(xué)代表性研究成果進(jìn)行梳理分析,發(fā)現(xiàn)目前面向網(wǎng)絡(luò)空間的計算檔案學(xué)研究在面向網(wǎng)絡(luò)空間的檔案館拓展、基于網(wǎng)絡(luò)技術(shù)的電子文件管理變革、融合于網(wǎng)絡(luò)空間的檔案理論與方法重構(gòu)三方面取得較大進(jìn)展。隨之,結(jié)合網(wǎng)絡(luò)空間及其在中國的發(fā)展實際,文章提出計算檔案學(xué)要圍繞四個方面進(jìn)行拓展:網(wǎng)絡(luò)空間可解析為怎樣的檔案管理場景、計算檔案學(xué)面向網(wǎng)絡(luò)空間的擴展建設(shè)方向及其內(nèi)容是什么、面向網(wǎng)絡(luò)空間的計算檔案學(xué)如何應(yīng)用于實踐活動、立足中國本土的計算檔案學(xué)建設(shè)路徑。
關(guān)鍵詞:計算檔案學(xué);網(wǎng)絡(luò)空間;檔案化;網(wǎng)絡(luò)檔案
分類號:G270
the Development of cyberspace-oriented computational Archival science: Progress and Prospects
Zhou Wenhong1, Wen Lijun1, Chen Shuhan2
( 1. School of Information Resource Management, Renmin University of China, Beijing 100872; 2. School of Public Administration, Sichuan University, Chengdu, Sichuan 610064 )
Abstract: Investigating into the studies of cyberspace-oriented computational archival science aims to clarify the development situation of cyberspace-oriented computational archival science and further prospects. The research results presented in the IEEE Computational Archives Working Group are sorted out, and it is clarified that the current progress of computational archival science oriented to cyberspace is manifested as: the expansion of archives oriented to cyberspace, the change of the management of digital records based on network technology, the reconstruction of archives theory and methodology in cyberspace. Then it puts forward the prospects of the future development of cyberspaceoriented computational archival science from the aspects of the analysis of cyberspace, the direction and content of the development of cyberspace-oriented computational archival science, the development of computational archival science based on China and so on.
Keywords: Computational Archival Science; Cyberspace; Archivalization; Web Archives
計算檔案學(xué)被界定為一個跨學(xué)科的研究領(lǐng)域,在我國被視作新文科背景下檔案學(xué)發(fā)展的新方向,用以引導(dǎo)建立更系統(tǒng)的數(shù)字文件與檔案理論、方法、實踐體系。在內(nèi)容體系建設(shè)上,計算檔案學(xué)正從數(shù)字化的歷史檔案資源拓展向原生數(shù)據(jù),尤其是日益在人類世界中扮演重要作用的網(wǎng)絡(luò)空間中所形成的數(shù)據(jù)。網(wǎng)絡(luò)空間是以信息通信設(shè)施及其使用者為基礎(chǔ),以數(shù)字化信息創(chuàng)造、存儲、修改和流動為內(nèi)容的互聯(lián)互動空間[1],在智慧社會、數(shù)字孿生、元宇宙等未來導(dǎo)向的戰(zhàn)略之下更將是建構(gòu)與應(yīng)用計算檔案學(xué)的重要場景。因之,面向網(wǎng)絡(luò)空間這一綜合社會、文化、技術(shù)、管理等復(fù)雜要素集成的情境,計算檔案學(xué)有著諸多尚待有效理解的可為之處與可拓展空間。
在研究層面,學(xué)界先是對計算檔案學(xué)進(jìn)行總體探討為立足網(wǎng)絡(luò)空間的探索奠定認(rèn)識基礎(chǔ)。一方面從理論層面對計算檔案學(xué)的內(nèi)涵進(jìn)行探索,明確計算檔案學(xué)是計算科學(xué)和檔案學(xué)的雙向融合;[2]另一方面依托關(guān)于各類實踐項目的實證分析對計算檔案學(xué)應(yīng)有的內(nèi)容進(jìn)行探討,包括從策略層明確計算檔案學(xué)框架下檔案實踐的基本原則與方法、從更具體的方案層展現(xiàn)面向檔案管理需求應(yīng)用數(shù)字方法與技術(shù)的實踐等。[3-4]隨著計算檔案學(xué)研究的不斷推進(jìn),網(wǎng)絡(luò)空間在計算檔案學(xué)的探索進(jìn)程中逐步顯現(xiàn)。在數(shù)字轉(zhuǎn)型大背景下,建設(shè)計算檔案學(xué)的必要性與價值得到確認(rèn)[5],網(wǎng)絡(luò)空間及其相關(guān)技術(shù)的應(yīng)用要求立足新的檔案對象變革檔案思維與方法。與之相應(yīng),計算檔案學(xué)的基本內(nèi)涵與內(nèi)容體系同網(wǎng)絡(luò)空間產(chǎn)生一定關(guān)聯(lián),探討議題涉及把網(wǎng)絡(luò)作為工具來對接從而將檔案問題轉(zhuǎn)化為計算方案的設(shè)計[6]、立足網(wǎng)絡(luò)空間如區(qū)塊鏈的具體情境創(chuàng)新管理模式[7]、將計算思維與方法應(yīng)用到網(wǎng)絡(luò)存檔數(shù)據(jù)的開發(fā)利用中并由此拓展計算檔案學(xué)的內(nèi)容體系[8-9]。研究可見,當(dāng)前計算檔案學(xué)更關(guān)注檔案館或相關(guān)記憶機構(gòu)中的歷史檔案資源,只有小部分包含網(wǎng)絡(luò)空間中所形成的原生數(shù)據(jù),且多聚焦于檔案管理中有關(guān)數(shù)字化、數(shù)據(jù)化的場景。因而,網(wǎng)絡(luò)空間所構(gòu)筑出的數(shù)據(jù)情境以及相應(yīng)數(shù)據(jù)對象、數(shù)據(jù)現(xiàn)象的特質(zhì)沒有得到充分關(guān)注。在各領(lǐng)域如計算社會科學(xué)、計算法學(xué)、計算傳播學(xué)已經(jīng)意識到網(wǎng)絡(luò)空間的重要性與特殊性并積極投入研究力量的情況下[10],計算檔案學(xué)尚有較大的跟進(jìn)空間。由此,本文立足數(shù)字轉(zhuǎn)型背景,明確計算檔案學(xué)立足網(wǎng)絡(luò)空間的關(guān)聯(lián)要點、相關(guān)探索進(jìn)程,解析與發(fā)現(xiàn)未來的建構(gòu)方向與內(nèi)容。
1 網(wǎng)絡(luò)空間凸顯為計算檔案學(xué)重要發(fā)展場景
1.1 網(wǎng)絡(luò)空間為計算檔案學(xué)擴充建構(gòu)背景
計算檔案學(xué)的提出直接關(guān)聯(lián)數(shù)字轉(zhuǎn)型背景,其中網(wǎng)絡(luò)空間的角色日益凸顯。
一方面,計算檔案學(xué)需要充分融入網(wǎng)絡(luò)空間。當(dāng)前,以智慧社會、數(shù)字治理、元宇宙等為核心的數(shù)字戰(zhàn)略,無一不需要優(yōu)化網(wǎng)絡(luò)空間,計算檔案學(xué)要識別與深度內(nèi)化數(shù)字轉(zhuǎn)型的要義,就需要積極對接網(wǎng)絡(luò)空間,這也有助于計算檔案學(xué)充分拓展與數(shù)據(jù)科學(xué)、計算科學(xué)的交集。進(jìn)一步來說,網(wǎng)絡(luò)空間的建設(shè)與運行是社會、技術(shù)、文化、管理、信息方法與實踐綜合作用的結(jié)果,可為計算檔案學(xué)提供充分的探索場景。
另一方面,網(wǎng)絡(luò)空間可持續(xù)發(fā)展驅(qū)動計算檔案學(xué)發(fā)展。計算檔案學(xué)作為超學(xué)科的提出也在于檔案與信息學(xué)科積極貢獻(xiàn)于人類世界的數(shù)字轉(zhuǎn)型發(fā)展。當(dāng)前,網(wǎng)絡(luò)空間的有序治理已在全球得到倡導(dǎo),數(shù)據(jù)維度如數(shù)據(jù)治理、數(shù)據(jù)安全、數(shù)據(jù)主權(quán)逐步顯現(xiàn),計算檔案學(xué)均與此相關(guān)。因而,計算檔案學(xué)面向網(wǎng)絡(luò)空間的建構(gòu)同樣受網(wǎng)絡(luò)空間長效運行需求所推動。
1.2 網(wǎng)絡(luò)空間為計算檔案學(xué)提供多維的數(shù)據(jù)情境
對計算檔案學(xué)而言,其與網(wǎng)絡(luò)空間的根本關(guān)聯(lián)在于后者被稱為流動的檔案館,數(shù)據(jù)與數(shù)據(jù)活動是網(wǎng)絡(luò)空間的構(gòu)建載體,是極有價值也應(yīng)重點關(guān)注的對象。
一是從數(shù)據(jù)對象來看。網(wǎng)絡(luò)空間的數(shù)據(jù)多具有原生性,由社會活動依托網(wǎng)絡(luò)平臺開展所形成,無論是數(shù)量還是特性,都將是檔案在未來的主要范疇。計算社會科學(xué)及其引領(lǐng)下的計算法學(xué)、計算傳播學(xué)、計算語言學(xué)、計算教育學(xué)等均指出,網(wǎng)絡(luò)空間提供的原生大數(shù)據(jù)從價值、特征、數(shù)量等方面均有別于以往可獲取的數(shù)據(jù),也是各領(lǐng)域提出“計算+”的基礎(chǔ)支撐。[11]于計算檔案學(xué)也是如此,數(shù)據(jù)對象多是經(jīng)過數(shù)字轉(zhuǎn)換的歷史檔案資源,這些數(shù)字化的歷史檔案資源,同網(wǎng)絡(luò)空間中的原生數(shù)據(jù)有著不同的背景、形式、內(nèi)容,其體量、價值、復(fù)雜性等亦不相同。例如,網(wǎng)絡(luò)空間中檔案的多來源、依賴于第三方平臺、權(quán)屬難辨、需兼顧多方價值取向、場景復(fù)雜多樣等特質(zhì)顯著,也就影響著對檔案與檔案屬性的界定及相應(yīng)的檔案管理方法。計算檔案學(xué)在這其中有諸多深挖之處。
二是從數(shù)據(jù)活動來看。網(wǎng)絡(luò)空間的可持續(xù)運行依靠的是數(shù)據(jù)連續(xù)生成、累積與利用以及相應(yīng)數(shù)據(jù)全生命周期的各項細(xì)節(jié)活動。因此,對計算檔案學(xué)而言,網(wǎng)絡(luò)空間可提供全面的數(shù)據(jù)管理行為,進(jìn)而探討文件的管理工作能否從當(dāng)前主要立足后端延展至前中端等問題。同時,網(wǎng)絡(luò)空間的數(shù)據(jù)活動同樣顯示網(wǎng)絡(luò)空間特質(zhì),如非線性的特征和強化即時開發(fā)利用的要求,可為計算檔案學(xué)強調(diào)以增值利用為目標(biāo)再造檔案管理全流程提供參照。
三是從數(shù)據(jù)場景來看。網(wǎng)絡(luò)空間呈現(xiàn)的是源于實體世界但鑒于其虛擬性而有所變化的數(shù)據(jù)與數(shù)據(jù)活動背景。對計算檔案學(xué)而言,網(wǎng)絡(luò)空間有助于深化理解數(shù)字情境、數(shù)字情境對檔案而言是怎樣的背景、相應(yīng)的數(shù)據(jù)與檔案形成機制等問題。這對重新認(rèn)識與構(gòu)建檔案理論與方法有重要參考意義。
1.3 網(wǎng)絡(luò)空間為計算檔案學(xué)顯示頂層的認(rèn)知與方法參考
網(wǎng)絡(luò)空間在本質(zhì)上全方面顯示了人類世界的走向,對計算檔案學(xué)意義的理解具有重要引導(dǎo)意義。
在認(rèn)知層面,網(wǎng)絡(luò)空間的建構(gòu)與運行顯示的是數(shù)字轉(zhuǎn)型背景下的理念與認(rèn)識,這是計算檔案學(xué)建立整體框架的基礎(chǔ)。網(wǎng)絡(luò)空間的時空概念、認(rèn)知要點、組織方式等,均顯示出新特征,如去中心化、弱化時空界限的非線性、自組織顯著等。于計算檔案學(xué)而言,這樣的認(rèn)知基礎(chǔ)同樣要充分厘清并有效融合,以用于認(rèn)知該環(huán)境下的檔案以及檔案活動。
在方法層面,網(wǎng)絡(luò)空間“如何做”的思路亦是明確檔案方法的前提。網(wǎng)絡(luò)空間依托技術(shù)、管理的實踐機制,適合于計算檔案學(xué)探索以問題為導(dǎo)向的技術(shù)應(yīng)用策略。同時,網(wǎng)絡(luò)空間的重要支持是數(shù)字技術(shù)和管理機制的融合,是計算檔案學(xué)基于計算思維形成方法論的基礎(chǔ)。
2 面向網(wǎng)絡(luò)空間的計算檔案學(xué)探索進(jìn)程
計算檔案學(xué)開始于2016年在IEEE下設(shè)的計算檔案學(xué)工作組的年度研討會,逐漸形成關(guān)注領(lǐng)域聚焦且頗具規(guī)模的研究力量,其研究方向與成果逐漸顯示出同網(wǎng)絡(luò)空間的有效關(guān)聯(lián)。[12-13]通過梳理Ieee計算檔案學(xué)工作組的研究,面向網(wǎng)絡(luò)空間的計算檔案學(xué)研究成果主要體現(xiàn)在三個方面。
2.1 面向網(wǎng)絡(luò)空間的檔案館拓展
對照網(wǎng)絡(luò)的特質(zhì)與功能實現(xiàn)檔案空間的創(chuàng)新構(gòu)建是計算檔案學(xué)承接檔案工作數(shù)字轉(zhuǎn)型的重要議題,其探討方向包括:
一是檔案館融入網(wǎng)絡(luò)空間的數(shù)字復(fù)制。一方面,匹配網(wǎng)絡(luò)空間要求的數(shù)字檔案資源建設(shè),凸顯的是便于線上高效利用的可互理解互操作的檔案數(shù)字化工作。另一方面,依托網(wǎng)絡(luò)空間的數(shù)字檔案資源服務(wù)優(yōu)化,主要體現(xiàn)為需求和問題導(dǎo)向的檔案線上服務(wù)平臺與功能性工具開發(fā),具體表現(xiàn)在以網(wǎng)絡(luò)為工具,探討包括網(wǎng)絡(luò)檔案在內(nèi)的資源化相關(guān)功能設(shè)計、技術(shù)開發(fā)等。[14]例如,為滿足研究人員對網(wǎng)絡(luò)檔案的研究需求,德國L3研究中心Helge所在的研究團隊開發(fā)了多元網(wǎng)絡(luò)利用平臺,建立網(wǎng)絡(luò)檔案動態(tài)語料庫,向用戶提供按研究目的進(jìn)行網(wǎng)絡(luò)檔案數(shù)據(jù)提取的工具,并進(jìn)一步開發(fā)出對網(wǎng)絡(luò)檔案數(shù)據(jù)進(jìn)行遠(yuǎn)讀的功能。[15]再如,在技術(shù)開發(fā)方面,為增加對網(wǎng)絡(luò)檔案的描述,UCLA的Gilliland教授帶領(lǐng)跨學(xué)科的研究團隊運用自然語言處理技術(shù)和人工智能,開發(fā)社交媒體相似性算法(TSMS)和數(shù)據(jù)驅(qū)動的迭代式檔案描述算法(DCAP),實現(xiàn)對大量且不斷生成的社交媒體檔案的深度描述,并識別其中的特殊言論進(jìn)行標(biāo)識,以促進(jìn)后續(xù)對社交媒體檔案資源的深度利用。[16]
二是探索如何將計算思維與方法應(yīng)用于網(wǎng)絡(luò)數(shù)據(jù)的檔案化管理,由此拓展計算檔案學(xué)的內(nèi)容體系。目前研究要點為:(1)明確網(wǎng)絡(luò)檔案是重要資源,探討計算檔案學(xué)可應(yīng)用并實現(xiàn)拓展的場景,推動高質(zhì)量檔案資源的形成。(2)網(wǎng)絡(luò)存檔的基本要求,如網(wǎng)絡(luò)檔案整合應(yīng)充分融合來源以便于用戶確認(rèn)資源的適用性和局限以及對海量網(wǎng)絡(luò)數(shù)據(jù)集的處理,從而用于驗證計算流程的有效性和數(shù)據(jù)的充分度。(3)應(yīng)借助數(shù)字技術(shù)為網(wǎng)絡(luò)檔案全流程管理開發(fā)工具。例如為提升網(wǎng)絡(luò)存檔數(shù)據(jù)處理效率而提出的面向分布式網(wǎng)絡(luò)存檔數(shù)據(jù)技術(shù)框架ArchiveSpark、對互聯(lián)網(wǎng)檔案館所保存的近兩萬網(wǎng)頁的存檔數(shù)據(jù)而開發(fā)的相關(guān)工具[17]、針對電子郵件開發(fā)使用自然語言處理的以背景為基礎(chǔ)的檢索工具[18]、以Twitter的350萬條信息為基礎(chǔ)來探討網(wǎng)絡(luò)存檔數(shù)據(jù)的文本挖掘[19]。
2.2 基于網(wǎng)絡(luò)技術(shù)的電子文件管理變革
針對機構(gòu)應(yīng)用網(wǎng)絡(luò)技術(shù)辦理業(yè)務(wù)所形成的電子文件,計算檔案學(xué)視角下的探索主要關(guān)注三個方面:
一是討論網(wǎng)絡(luò)空間及其不同工具應(yīng)用的基本特征,從技術(shù)背景視角確認(rèn)對電子文件及其管理的影響。例如有研究人員對關(guān)于區(qū)塊鏈所形成的電子文件的基本認(rèn)知、作用與缺陷以及相應(yīng)的工作變化進(jìn)行了探討。[20]
二是明確網(wǎng)絡(luò)空間的文化內(nèi)涵,討論對電子文件及其管理理念與方法的影響。例如,由社交網(wǎng)絡(luò)的后真相傳播延伸至對關(guān)于檔案在網(wǎng)絡(luò)空間中可信性、信任等相關(guān)核心概念的再界定。為應(yīng)對網(wǎng)絡(luò)環(huán)境中大量虛假視頻的傳播,由UBC信息學(xué)院Hoda領(lǐng)銜的研究團隊運用古文書學(xué)理論,將可信檔案方法與計算思維融合,從來源、真實性、可靠性、完整性等特征出發(fā)對網(wǎng)絡(luò)視頻的真假進(jìn)行判斷,進(jìn)而基于機器學(xué)習(xí),提出依據(jù)背景、元數(shù)據(jù)等信息對網(wǎng)絡(luò)視頻進(jìn)行自動判別的方法。[21]
三是面向多元的網(wǎng)絡(luò)技術(shù)應(yīng)用,開發(fā)相應(yīng)的電子文件管理工具。例如,立足區(qū)塊鏈討論電子文件與檔案管理的模式并對后續(xù)的存取提出展望、使用拜占庭共識算法來管理網(wǎng)絡(luò)分布式的文件檔案等。[22-23]為促進(jìn)對長期保存、銷毀等鑒定結(jié)果的高效落實,UBC信息學(xué)院的Danielle開發(fā)了智能合約的方法,對電子文件所處的現(xiàn)行、半現(xiàn)行、非現(xiàn)行的生命周期階段進(jìn)行標(biāo)識和元數(shù)據(jù)著錄,在檔案工作人員鑒定后,運用智能合約將文件變化傳輸至文件處置工具,由處置工具執(zhí)行文件進(jìn)行從臨時存儲庫移動到永久存儲庫、從永久存儲庫中進(jìn)行銷毀等處置行動。[24]
2.3 融合于網(wǎng)絡(luò)空間的檔案理論與方法重構(gòu)
網(wǎng)絡(luò)空間推進(jìn)了信息情境的全面建構(gòu),對與之相適應(yīng)的檔案理論與方法重構(gòu)提出了一定要求。
一是計算檔案學(xué)在確認(rèn)數(shù)字檔案理論與方法的建構(gòu)中表現(xiàn)顯著。計算檔案學(xué)對歷史檔案的數(shù)據(jù)化開發(fā)已有較豐富探索,并擴展向?qū)W(wǎng)絡(luò)存檔數(shù)據(jù)的管理與開發(fā)。例如,有學(xué)者認(rèn)為可將網(wǎng)絡(luò)檔案視為大數(shù)據(jù)進(jìn)行深度利用,借助網(wǎng)絡(luò)檔案的元數(shù)據(jù)和大數(shù)據(jù)特性開發(fā)相應(yīng)工具,促進(jìn)不同學(xué)科的學(xué)者跨學(xué)科進(jìn)行網(wǎng)絡(luò)檔案的分享,并深入到數(shù)據(jù)層級的再利用。[25]
二是將檔案化的管理方法拓展至更廣闊的網(wǎng)絡(luò)對象中。計算檔案學(xué)將檔案思維與計算方法和思維融合,并依托這樣的融合實現(xiàn)對更豐富的網(wǎng)絡(luò)對象進(jìn)行檔案化管理的可能,如將檔案思維融入對NFT(數(shù)字藏品)等數(shù)字資產(chǎn)管理當(dāng)中。以UBC副教授Victoria展開的項目為例,針對NFT的保存和交易中存在保障真實性的巨大挑戰(zhàn),其使用區(qū)塊鏈技術(shù)和分布式賬本技術(shù)融合來源管理、元數(shù)據(jù)管理、nFt之間的關(guān)聯(lián)提出對NFT真實性保障的方法。[26]
三是面向網(wǎng)絡(luò)空間對檔案管理的理念和方法進(jìn)行適應(yīng)性重構(gòu)的探索。例如區(qū)塊鏈技術(shù)在為保證文件真實性提供有益方法之余,也為檔案實踐帶來了新的可能。有學(xué)者研究指出,目前區(qū)塊鏈應(yīng)用于文件管理實踐可分為鏡像型、數(shù)字記錄型、代幣型。鏡像型實踐中的區(qū)塊鏈僅充當(dāng)文件哈希值的存儲庫,可被單純視為促進(jìn)檔案實踐發(fā)展的工具。數(shù)字記錄型實踐的區(qū)塊鏈不再只是哈希值的存儲庫,文件會通過智能合約技術(shù)在區(qū)塊鏈上自動創(chuàng)建,但目前的數(shù)字保存依賴于集中的可信數(shù)字倉儲庫,這就對傳統(tǒng)的數(shù)字保存模式提出挑戰(zhàn)。而代幣型的實踐中,文件不僅會在區(qū)塊鏈上創(chuàng)建,而且地產(chǎn)、黃金等物質(zhì)實體將會以加密貨幣的形式在區(qū)塊鏈上存儲,這意味著在這類型的區(qū)塊鏈實踐中每個實體都有可能成為文件,這樣的特性將會對檔案實踐帶來全新的挑戰(zhàn),如何保存管理這類文件將會是未來檔案管理理念和方法亟須思考的問題。[27]
3 立足網(wǎng)絡(luò)空間的計算檔案學(xué)發(fā)展展望
總體來看,已有探索確認(rèn)了計算檔案學(xué)面向網(wǎng)絡(luò)空間展開擴展建設(shè)的必要性、應(yīng)有的基本內(nèi)容與方向。隨著我國繼續(xù)強化網(wǎng)絡(luò)戰(zhàn)略,在建設(shè)人類命運共同體的愿景下,面向網(wǎng)絡(luò)空間的計算檔案學(xué)在我國具有強大的生命力,也有助于檔案學(xué)自主知識體系的構(gòu)建并引領(lǐng)全球話語。同時,現(xiàn)有探索在全球均處于初步階段,尚須從基本點、重要方向等擴充為更系統(tǒng)的內(nèi)容體系,產(chǎn)出基礎(chǔ)理論與方法的創(chuàng)新成果:一是現(xiàn)有的計算檔案學(xué)主要從歷史檔案資源的數(shù)字化、數(shù)據(jù)化建設(shè)的實踐場景探討理論與方法,對已成為重要的社會活動場景的數(shù)字空間及其所形成的數(shù)字原生信息涉及較少,未充分置于計算社會科學(xué)、計算法學(xué)、計算傳播學(xué)等計算系跨學(xué)科建設(shè)所明確的網(wǎng)絡(luò)空間之中。二是計算檔案學(xué)同樣要立足中國本土確認(rèn)建設(shè)的路徑與策略。目前我國的全球參與和本土探索均有限,且已有的數(shù)字轉(zhuǎn)型相關(guān)理論研究成果也亟待轉(zhuǎn)變?yōu)楦蠈拥睦碚撆c方法。
在這樣的建設(shè)導(dǎo)向下,計算檔案學(xué)于網(wǎng)絡(luò)空間的發(fā)展在內(nèi)容層面有如下展望:
第一,網(wǎng)絡(luò)空間可解析為怎樣的檔案管理場景。網(wǎng)絡(luò)空間的構(gòu)筑與運行依賴數(shù)字基礎(chǔ)設(shè)施、技術(shù)、及其應(yīng)用,直接的載體則是各類數(shù)據(jù)與信息。計算檔案學(xué)面向網(wǎng)絡(luò)空間的建構(gòu)首先需要認(rèn)識與理解網(wǎng)絡(luò)空間提供的檔案情境。具體內(nèi)容涉及:網(wǎng)絡(luò)空間有著怎樣的司法、技術(shù)、文化、社會背景及其規(guī)則;網(wǎng)絡(luò)空間由誰形成哪些數(shù)據(jù),數(shù)據(jù)的內(nèi)容、形式、特征、價值如何;網(wǎng)絡(luò)空間從數(shù)據(jù)角度來看有哪些利益相關(guān)者,有怎樣的生成、采集、支配、收益、利用、管理權(quán)責(zé);網(wǎng)絡(luò)空間對數(shù)據(jù)與檔案的認(rèn)識、規(guī)則以及功能是怎樣的;網(wǎng)絡(luò)空間現(xiàn)有哪些具有檔案管理功能的機構(gòu)或?qū)嶓w,都發(fā)揮怎樣的作用,性質(zhì)如何;根據(jù)上述內(nèi)容,網(wǎng)絡(luò)空間中的檔案與檔案管理應(yīng)用怎樣界定,有哪些突破已有認(rèn)知與方法的地方。
第二,計算檔案學(xué)面向網(wǎng)絡(luò)空間的擴展建設(shè)方向及其內(nèi)容是什么?立足計算檔案學(xué)已有探索與成果,面向網(wǎng)絡(luò)空間呈現(xiàn)的檔案管理場景包括:依循歷史檔案數(shù)據(jù)化利用與現(xiàn)行數(shù)據(jù)檔案化管理的兩大主線,網(wǎng)絡(luò)空間可為計算檔案學(xué)提供哪些建構(gòu)起認(rèn)知、方法、內(nèi)容體系的場景;網(wǎng)絡(luò)空間在檔案情境上具備怎樣的特質(zhì),計算檔案學(xué)現(xiàn)有成果可基于此有怎樣的拓展;立足網(wǎng)絡(luò)空間,計算檔案學(xué)還有哪些可擴充或創(chuàng)新的方向值得探索;中國的網(wǎng)絡(luò)空間中,計算檔案學(xué)可深入探索的重點場景有哪些,預(yù)期的認(rèn)知與方法成果是什么;面向網(wǎng)絡(luò)空間,計算檔案學(xué)的核心概念、基本檔案理論與方法是什么,應(yīng)呈現(xiàn)怎樣的基本框架,又會顯示出哪些具有中國特質(zhì)的理論與方法?
第三,面向網(wǎng)絡(luò)空間的計算檔案學(xué)如何應(yīng)用于實踐活動。計算檔案學(xué)的一大特質(zhì)就是同實踐的密切關(guān)聯(lián),面向數(shù)字孿生、元宇宙、智慧社會等前瞻戰(zhàn)略日益凸顯的全面網(wǎng)絡(luò)化的人類世界,計算檔案學(xué)立足網(wǎng)絡(luò)空間的構(gòu)建旨在從檔案視角推進(jìn)上述設(shè)想的可持續(xù)落實。相應(yīng)探索內(nèi)容體現(xiàn)為:網(wǎng)絡(luò)空間的檔案化管理需求是什么,有哪些值得重點關(guān)注的場景;網(wǎng)絡(luò)空間檔案化管理需要計算檔案學(xué)提供認(rèn)知與方法支持的重要方面是什么;通用的計算檔案框架是怎樣的,面向不同場景又有哪些代表性的應(yīng)用路徑;通過實踐驗證,計算檔案學(xué)又有哪些可擴充完善之處?
第四,立足中國本土的計算檔案學(xué)建設(shè)路徑。充分挖掘數(shù)字轉(zhuǎn)型背景之下我國的整體發(fā)展環(huán)境、學(xué)科建設(shè)要求、計算檔案學(xué)自身的學(xué)科特性,確認(rèn)計算檔案學(xué)的本土化建設(shè)需求、方法與策略。具體內(nèi)容為:我國數(shù)字轉(zhuǎn)型框架下計算檔案學(xué)的建設(shè)需求是什么;新文科與檔案學(xué)學(xué)科發(fā)展背景下的計算檔案學(xué)建設(shè)定位是什么;以網(wǎng)絡(luò)空間為基礎(chǔ)的面向科研教學(xué)融合、產(chǎn)學(xué)研一體化為背景的計算檔案學(xué)建設(shè)方法與策略是怎樣的?
4 結(jié) 語
本文對網(wǎng)絡(luò)空間與計算檔案學(xué)的關(guān)聯(lián)展開深入分析,在此框架下梳理計算檔案學(xué)面向網(wǎng)絡(luò)空間的建設(shè)進(jìn)展。在此基礎(chǔ)上,提出檔案學(xué)面向未來須及時跟進(jìn)人類世界數(shù)字轉(zhuǎn)型進(jìn)程,面向網(wǎng)絡(luò)空間的計算檔案學(xué)系統(tǒng)建設(shè)是重要方向,并對建設(shè)的相關(guān)內(nèi)容予以基本說明。同時,本文更多是以問題的方式呈現(xiàn)面向網(wǎng)絡(luò)空間的計算檔案學(xué)建設(shè)可涉及的內(nèi)容,還需要深入每一方面建構(gòu)出具體成果,也要對如何建設(shè)出系統(tǒng)的成果的策略進(jìn)行探討,這些都需要后續(xù)研究的深入探索。
*本文系國家社科基金青年項目“計算檔案學(xué)視角下的網(wǎng)絡(luò)檔案信息資源建設(shè)研究”(項目編號:22CTQ042)階段性研究成果。
注釋與參考文獻(xiàn)
[1]張新寶,許可.網(wǎng)絡(luò)空間主權(quán)的治理模式及其制度構(gòu)建[J].中國社會科學(xué),2016(8):139-158,207-208.
[2]UNDERWOOD W. Computational Thinking in Archival Science Research and Education[EB/OL].[2022-12-15].https://ai-collaboratory.net/wp-content/uploads/2021/03/ Underwood.pdf.
[3]KIRáLY P. Measuring completeness as metadata quality metric in Europeana[EB/OL].[2022-12-15].https://aicollaboratory.net/wp-content/uploads/2020/03/7.Kiraly.pdf.
[4]UNDERWOOD W. Automatic Extraction of Dublin Core Metadata from Presidential E-records[EB/OL].[2022-12-15].https://ai-collaboratory.net/wp-content/ uploads/2020/11/Underwood.pdf.
[5]劉越男,楊建梁,何思源,等.計算檔案學(xué):檔案學(xué)科的新發(fā)展[J].圖書情報知識,2021(3):4-13.
[6][24]BATISTA D A, WEINGAERTNER T. ArchContract: using smart contracts for disposition[C]//2019 IEEE International Conference on Big Data (Big Data). Piscataway: IEEE, 2019:3060-3065.
[7][22][27]LEMIEUX V L. A typology of blockchain recordkeeping solutions and some reflections on their implications for the future of archival preservation[C]//2017 IEEE International Conference on Big Data (Big Data). Piscataway:IEEE, 2017:2271-2278.
[8][15][25]HOLZMANN H, GOEL V, ANAND A. ArchiveSpark: Efficient Web archive access, extraction and derivation[C]//2016 IEEE/ACM Joint Conference on Digital Libraries (JCDL). Newark: IEEE, 2016: 83-92.
[9]HOLZMANN H, GOEL V, GUSTAINIS E. N. Universal distant reading through metadata proxies with archivespark[C]//2017 IEEE International Conference on Big Data (Big Data). Piscataway: IEEE, 2017:459-464.
[10]申衛(wèi)星,劉云.法學(xué)研究新范式:計算法學(xué)的內(nèi)涵、范疇與方法[J].法學(xué)研究,2020(5):3-23.
[11]張小勁,孟天廣.論計算社會科學(xué)的緣起、發(fā)展與創(chuàng)新范式[J].理論探索,2017(6):33-38.
[12]UNDERWOOD W, MARCIANO R. Computational Thinking in Archival Science Research and Education[C]//2019 IEEE International Conference on Big Data (Big Data). Piscataway:IEEE, 2019:3146-3152.
[13]AMBACHER B, CONRAD M. Computational Archival Science is a Two-Way Street[C]//2021 IEEE International Conference on Big Data (Big Data). Piscataway:IEEE, 2021:2192-2199.
[14]ANDERSON B G, et al. The cybernetics thought collective project: Using computational methods to reveal intellectual context in archival material[C]//2017 IEEE International Conference on Big Data (Big Data). Piscataway:IEEE, 2017:2213-2218.
[16][19]YIN Z, et al. Using a Three-step Social Media Similarity (TSMS) Mapping Method to Analyze Controversial Speech Relating to COVID-19 in Twitter Collections[C]//2020 IEEE International Conference on Big Data (Big Data). Piscataway: IEEE, 2020:1949-1953.
[17]JAYAWARDANA Y, et al. Modeling Updates of Scholarly Webpages Using Archived Data[C]//2020 IEEE International Conference on Big Data (Big Data). Piscataway:IEEE, 2020:1868-1877.
[18]VENKATA S K, et al. EMCODIST: A Context-based Search Tool for Email Archives[C]//2021 IEEE International Conference on Big Data (Big Data). Piscataway:IEEE, 2021:2281-2290.
[20]SMITH T D. The blockchain litmus test[C]//2017 IEEE International Conference on Big Data (Big Data). Piscataway: IEEE, 2017: 2299-2308.
[21]HAMOUDA H, et al. Extending the Scope of Computational Archival Science: A Case Study on Leveraging Archival and Engineering Approaches to Develop a Framework to Detect and Prevent “Fake Video”[C]//2019 IEEE International Conference on Big Data(Big Data). Piscataway:IEEE,2019:3087-3097.
[23]KATUU S. Managing Records in Enterprise Resource Planning Systems[C]//2021 IEEE International Conference on Big Data (Big Data). Piscataway:IEEE, 2021:2240-2245.
[26]ROSS D, CRETU E, LEMIEUX V. NFTs:Tulip Mania or Digital Renaissance [C]//2021 IEEE International Conference on Big Data (Big Data). Piscataway: IEEE,2021:2262-2272.