• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      國內(nèi)外數(shù)字保存研究發(fā)展分析

      2024-06-27 22:27:59張鶴揚臧國全
      檔案管理 2024年2期
      關(guān)鍵詞:發(fā)文領(lǐng)域文獻(xiàn)

      張鶴揚 臧國全

      關(guān)鍵詞:數(shù)字保存;數(shù)字資源;圖書;檔案;合作網(wǎng)絡(luò);知識圖譜;數(shù)字保存;信息技術(shù)

      1 引言

      數(shù)字保存是一系列必要的確保數(shù)字資源可持續(xù)利用的管理活動。2022年6月23日國務(wù)院發(fā)布了《關(guān)于加強數(shù)字政府建設(shè)的指導(dǎo)意見》[1],進(jìn)一步推動數(shù)字政府建設(shè),同時也對檔案部門的數(shù)字檔案歸檔和長期保存能力提出挑戰(zhàn)?!丁笆奈濉比珖鴻n案事業(yè)發(fā)展規(guī)劃》指出2025年要基本實現(xiàn)數(shù)字轉(zhuǎn)型[2],數(shù)字檔案資源有效保存成為一個重要問題。數(shù)字保存可確保對數(shù)字信息跨時間、技術(shù)和語義轉(zhuǎn)換的長期訪問,并具有諸如社會效益(政府證據(jù))、文化效益(國家認(rèn)同)和經(jīng)濟(jì)效益(利用與再利用、創(chuàng)新)等長期效益。因此,數(shù)字遺產(chǎn)的長期訪問和可信保存已引起全球的關(guān)注。

      2012年9月,在加拿大溫哥華召開了旨在探討數(shù)字遺產(chǎn)保存關(guān)鍵問題的國際會議。會上通過了《溫哥華宣言》(UNESCO/UBC VANCOUVER DECLARATION),為數(shù)字遺產(chǎn)領(lǐng)域的理論與實踐發(fā)展提供了指南與參考。2013年12月聯(lián)合國教科文組織正式啟動“全球增強信息社會可持續(xù)性發(fā)展平臺”(Platform to Enhance the Sustainability ofthe Information Society Transglobally,PERSIST)項目,共同推動數(shù)字保存政策、技術(shù)、內(nèi)容與最佳實踐等核心主題的發(fā)展。2016年,聯(lián)合國教科文組織發(fā)布《數(shù)字遺產(chǎn)長期保存鑒選指南》(The UNESCO/PERSIST Guidelinesfor the Selection of Digital Heritage for Long-TermPreservation)(第一版),旨在為圖書館、檔案館、博物館和其他遺產(chǎn)機構(gòu)制定數(shù)字遺產(chǎn)長期可持續(xù)性保存的鑒選政策提供重要支撐。2021年,聯(lián)合國教科文組織發(fā)布了《數(shù)字遺產(chǎn)長期保存鑒選指南》第二版。在國際組織的推動下,各國也開展了數(shù)字保存的相關(guān)規(guī)劃。例如,2017年8月,美國國家檔案與文件署(National Archives and RecordsAdministration,NARA)發(fā)布了首個《數(shù)字檔案資源長期保存策略》(Strategy for Preserving Digital ArchivalMaterials),專門針對數(shù)字檔案資源的長期保存進(jìn)行戰(zhàn)略規(guī)劃。[3]2022年6月,NARA在此基礎(chǔ)上修訂并發(fā)布了《數(shù)字保存戰(zhàn)略2022—2026》(Digital Preservation Strategy2022-2026),提出了8項關(guān)鍵性戰(zhàn)略來確保數(shù)字資產(chǎn)的長期保存和有效訪問。加拿大國家圖書檔案館于2017年11 月發(fā)布了《數(shù)字保存計劃戰(zhàn)略》,并于2022年8月對該戰(zhàn)略進(jìn)行了修訂并重新發(fā)布。[4]丹麥國家檔案館發(fā)布了《數(shù)字保存戰(zhàn)略2025》(Digital Preservation Strategy 2025),提出數(shù)字保存未來發(fā)展的重點領(lǐng)域及實施意見。[5]

      為從整體上把握國內(nèi)外數(shù)字保存領(lǐng)域研究的脈絡(luò)與現(xiàn)狀,本文對國內(nèi)外數(shù)字保存領(lǐng)域研究文獻(xiàn)進(jìn)行計量分析,以期探索數(shù)字保存領(lǐng)域研究發(fā)展的基本脈絡(luò)。

      2 研究設(shè)計

      2.1 數(shù)據(jù)來源。本文利用中國知網(wǎng)(CNKI)數(shù)據(jù)庫和Webof Science作為中英文文獻(xiàn)數(shù)據(jù)源檢索平臺,開展數(shù)字保存領(lǐng)域的文獻(xiàn)研究。以2023年12月為截止時間,對1997年以來的文獻(xiàn)進(jìn)行檢索,共獲得11 85篇中文文獻(xiàn),見圖1;1207篇外文文獻(xiàn)(其中622篇來自Web of Science核心合集),見圖2。通過人工逐篇篩查,剔除相關(guān)程度較低和非學(xué)術(shù)類文獻(xiàn),最終有11 21篇中文文獻(xiàn),1073篇英文文獻(xiàn)(其中514篇來自Web of Science核心合集)。

      2.2 研究與分析方法。本文應(yīng)用Co-Occurrence14.9(后文簡稱COOC)[6]研究文獻(xiàn)數(shù)量發(fā)展特征、主體特征、熱點主題,綜合使用CiteSpace、VOSviewer展示研究趨勢發(fā)展特征。

      3 國內(nèi)外數(shù)字保存研究建制化過程

      3.1 研究趨勢分析

      (1)國內(nèi)數(shù)字保存研究趨勢分析。國內(nèi)對數(shù)字保存的研究始于20世紀(jì)90年代末,根據(jù)發(fā)文趨勢,可將研究進(jìn)程大致分為三個階段。

      第一階段:1997年—2004年,即數(shù)字保存研究的起步階段。該階段年發(fā)文量低于20篇,主要探討電子信息時代的新挑戰(zhàn),研究如何走出傳統(tǒng)知識保存的束縛,強調(diào)利用數(shù)字圖像技術(shù)開展保護(hù)與利用并軌的重要性。

      第二階段:2005年—2019年,即數(shù)字保存研究的快速發(fā)展階段。該階段文獻(xiàn)發(fā)表數(shù)量增長迅速且累計發(fā)文量呈指數(shù)增長,圖書館、檔案館等信息機構(gòu)也加大了在數(shù)字保存上的研究力度。研究主要包括:日益豐富和復(fù)雜的數(shù)字對象類型、長期保存關(guān)鍵技術(shù)問題、長期保存的可持續(xù)發(fā)展問題等。

      第三階段:2020年至今,即數(shù)字保存研究的成熟階段。年發(fā)文量開始回落,發(fā)文速度逐漸放緩。這一階段,云計算和大數(shù)據(jù)技術(shù)等新技術(shù)的出現(xiàn)為數(shù)字保存提供了高效、可持續(xù)的策略。

      (2)國外數(shù)字保存研究趨勢分析。國外關(guān)于數(shù)字保存的實踐最早開始于1998年由歐洲國家圖書館啟動的“書目記錄計算機化行動NEDLIB(Networked European DepositLibrary)項目”。該項目研制了DLS(數(shù)字圖書館系統(tǒng))中的編目、信息采集、DSEP(deposit system electronicpublication)等11 個模塊。國外最早關(guān)于數(shù)字保存的文獻(xiàn)出現(xiàn)在2000年,根據(jù)發(fā)文量趨勢,可將國外研究劃分為兩個階段。

      第一階段:2000年—2008年,即數(shù)字保存研究的起步階段。該階段,年發(fā)文量低于20篇。2001年,聯(lián)機計算機圖書館中心(OCLC)和研究圖書館集團(tuán)(Research LibraryGroup,RLG)聯(lián)合發(fā)布了《數(shù)字對象保存元數(shù)據(jù)現(xiàn)狀回顧》白皮書(Preservation Metadata for Digital Objects:A Review of the State of the Art)開啟了數(shù)字信息資源長期保存元數(shù)據(jù)的研究。2003年開放檔案信息系統(tǒng)(Open Archival Information System,OAIS)模型正式成為ISO標(biāo)準(zhǔn)。2004年開始舉辦數(shù)字資源長期保存國際會議(International Conference on Digital Preservation,iPRES)促進(jìn)了該領(lǐng)域的研究發(fā)展。

      第二階段:2009年至今,即數(shù)字保存研究的快速發(fā)展階段。該階段,數(shù)字保存技術(shù)和理論的研究獲得了顯著進(jìn)展,包括數(shù)字存儲介質(zhì)的演進(jìn)、保存格式的多樣化以及保護(hù)策略的創(chuàng)新。2023年的研究開始轉(zhuǎn)向利用數(shù)字領(lǐng)域新技術(shù)解決數(shù)字保存出現(xiàn)的新挑戰(zhàn),如人工智能在保存中的應(yīng)用,以及運用新技術(shù)應(yīng)對不斷演變的數(shù)字格式。在實踐方面,自2017年開始,美國、澳大利亞、加拿大、丹麥等為防范因設(shè)備、軟件過時或存儲介質(zhì)故障等造成的無法訪問和使用的風(fēng)險,實施了相應(yīng)的數(shù)字保存戰(zhàn)略,在戰(zhàn)略中都注重風(fēng)險監(jiān)測和標(biāo)準(zhǔn)制定,并強調(diào)保存好數(shù)字檔案資源的重要性。

      對比國內(nèi)外文獻(xiàn)發(fā)文趨勢可見,我國在數(shù)字保存領(lǐng)域文獻(xiàn)研究早于國外,且我國先于國外進(jìn)入該領(lǐng)域發(fā)展的成長階段和成熟階段。從發(fā)文數(shù)量可見,我國每年的發(fā)文數(shù)量占據(jù)了該領(lǐng)域全球發(fā)文量的半邊天。

      3.2 研究機構(gòu)及其合作網(wǎng)絡(luò)可視化分析。對研究機構(gòu)及其合作關(guān)系分析可以揭示該領(lǐng)域的研究力量和研究網(wǎng)絡(luò)特征。本文對文獻(xiàn)的研究機構(gòu)進(jìn)行統(tǒng)計(僅統(tǒng)計第一作者所在機構(gòu),如果第一作者有多個所在機構(gòu),則僅計入第一機構(gòu)),以揭示研究機構(gòu)發(fā)展特征。

      (1)國內(nèi)研究機構(gòu)統(tǒng)計及分析。通過對CNKI數(shù)據(jù)庫中數(shù)字保存領(lǐng)域研究機構(gòu)進(jìn)行統(tǒng)計,發(fā)文數(shù)量最多的機構(gòu)分別是鄭州大學(xué)(108篇)、武漢大學(xué)(83篇)和中國科學(xué)院文獻(xiàn)情報中心(67篇)。發(fā)文量排名前10的研究機構(gòu)以及具體的發(fā)文數(shù)量如表1所示。由此可見,該領(lǐng)域的國內(nèi)研究力量主要聚集于鄭州大學(xué)、武漢大學(xué)、中國科學(xué)院文獻(xiàn)情報中心、國家圖書館和中國人民大學(xué)等。

      進(jìn)一步探索該領(lǐng)域研究機構(gòu)間的合作網(wǎng)絡(luò),利用CiteSpace對國內(nèi)研究機構(gòu)合作關(guān)系網(wǎng)絡(luò)進(jìn)行可視化,見圖3。

      由國內(nèi)研究機構(gòu)合作網(wǎng)絡(luò)可見,目前形成了以武漢大學(xué)、中國科學(xué)院文獻(xiàn)情報中心和中國人民大學(xué)為中心的合作網(wǎng)絡(luò)研究集群,體現(xiàn)出當(dāng)前對于數(shù)字保存的研究呈現(xiàn)出全域性合作的研究特征。此外,鄭州大學(xué)、河北大學(xué)、東北師范大學(xué)等,雖然發(fā)文量較大,但較少參與研究機構(gòu)間的合作。在這些研究機構(gòu)中,鄭州大學(xué)、武漢大學(xué)和中國科學(xué)院文獻(xiàn)情報中心較早進(jìn)入該領(lǐng)域進(jìn)行研究,并在該領(lǐng)域持續(xù)深耕至今。

      (2)國外研究機構(gòu)統(tǒng)計及分析。通過對W e b o fScience核心集中的文獻(xiàn)進(jìn)行統(tǒng)計,總發(fā)文數(shù)量最多的機構(gòu)分別是University of Maryland(11 篇)、TechnischeUniversitat Wien(10篇)和Old Dominion University(10篇),其中發(fā)文量排名前10的研究機構(gòu)以及具體的發(fā)文數(shù)量如表2所示。由此可見該領(lǐng)域的國外研究力量主要聚集于University of Maryland、Technische Universitat Wien、Old Dominion University和University of Illinois等。

      使用CiteSpace軟件對國外研究機構(gòu)的合作關(guān)系網(wǎng)絡(luò)進(jìn)行可視化(見圖4),可見,國外合作網(wǎng)絡(luò)整體較為松散,故將軟件中的過濾方式調(diào)整為顯示最大K個子網(wǎng)絡(luò),得出合作關(guān)系較為緊密的若干研究機構(gòu)合作網(wǎng)絡(luò),分別是以Technische Universitat Wien為中心的研究子群,DrexelUniversity和Old Dominion University為中心構(gòu)成的研究子群,以及以University System of Maryland等為中心的研究子群。這些研究子群進(jìn)入數(shù)字保存領(lǐng)域各有先后,尚未形成在該領(lǐng)域長期深耕的研究機構(gòu)。

      3.3 核心作者合作網(wǎng)絡(luò)可視化分析。核心作者被認(rèn)為是在特定研究領(lǐng)域中具有較深的造詣、較高的行業(yè)影響力,并且獲得行業(yè)領(lǐng)域認(rèn)可,科研成果較多,能提出較為新穎學(xué)術(shù)思想與觀點的學(xué)者。[7]通過對數(shù)字保存領(lǐng)域核心作者進(jìn)行分析,能更好地把握該領(lǐng)域發(fā)展的趨勢和熱點。

      (1)國內(nèi)核心作者合作關(guān)系網(wǎng)絡(luò)分析。為了更好地呈現(xiàn)作者之間的合作關(guān)系,使用CiteSpace軟件對作者間的合作關(guān)系網(wǎng)絡(luò)進(jìn)行可視化,見圖5。圖中節(jié)點面積的大小代表其發(fā)文量,節(jié)點間的連線代表作者間的合作關(guān)系,網(wǎng)絡(luò)密度由節(jié)點間連線的稀疏程度反映。國內(nèi)數(shù)字保存領(lǐng)域的核心作者為臧國全、吳振新、董曉莉等,且形成了以臧國全和吳振新為核心的研究子群。

      (2)國外核心作者合作關(guān)系網(wǎng)絡(luò)分析。使用CiteSpace軟件對英文文獻(xiàn)作者間的合作關(guān)系網(wǎng)絡(luò)進(jìn)行可視化,見圖6。國外核心作者合作關(guān)系呈整體分散,局部密集的特點。國外數(shù)字保存領(lǐng)域的核心作者為Christoph Becker,MichealL Nelson,Richard Marciano等人,且形成了以核心作者為中心的合作研究子群。

      3.4 高被引論文分析。論文的影響程度和在學(xué)術(shù)交流中的地位、作用可以在一定程度上通過論文被引頻次的高低所反映,引用次數(shù)高且引用周期長的論文被稱為高被引論文。高被引論文在一定程度上反映了該學(xué)科領(lǐng)域的知識源流。[8]

      (1)國內(nèi)高被引論文分析。本文將從中國知網(wǎng)中檢索到的文獻(xiàn)按被引次數(shù)進(jìn)行降序排列,其中排名前10的高被引文獻(xiàn)如表3所示。

      通過對高被引文獻(xiàn)逐一閱讀,按照內(nèi)容關(guān)注點的不同,可以把論文主題分成三個方面:

      一是數(shù)字保存發(fā)展過程中遇到的問題和挑戰(zhàn)。主要觀點包括區(qū)塊鏈技術(shù)雖然具有存儲、傳輸和數(shù)據(jù)信任方面的實用性,但對于數(shù)字檔案可靠性和可用性、多節(jié)點管理等方面還存在不足和風(fēng)險,以及知識產(chǎn)權(quán)問題[9,10]。

      二是數(shù)字保存的技術(shù)策略。該項研究成果主要體現(xiàn)為區(qū)塊鏈技術(shù)應(yīng)用發(fā)展的可能性、非物質(zhì)文化遺產(chǎn)數(shù)字化采集保存和開發(fā)、云存儲技術(shù)應(yīng)用和安全風(fēng)險等[11 —13]。

      三是數(shù)字保存推進(jìn)的管理策略。馮惠玲[14]認(rèn)為檔案單軌管理制是推進(jìn)數(shù)字保存的重要環(huán)節(jié),并給出了單軌管理制實施的法律、政策和管理方面的必要條件。其他方面的相關(guān)研究包括:歐美國家在數(shù)據(jù)管護(hù)和數(shù)字資源長期保存方面的研究進(jìn)展和啟示[15,16],主體責(zé)任和建立數(shù)字信息歸檔系統(tǒng)和選擇策略[17],非遺數(shù)字信息保護(hù)和管理的理論和知識體系[18],中歐數(shù)字資源長期保存國際研討會關(guān)于管理和技術(shù)策略的介紹[19]和標(biāo)準(zhǔn)化等方面[20]。

      (2)國外高被引論文分析。將Web of Science的檢索結(jié)果按被引次數(shù)最高優(yōu)先的模式排序,排名前10的高被引論文如表4所示。通過仔細(xì)研讀Web of Science數(shù)據(jù)庫中10篇高被引論文,按照研究主題可分成硬件和軟件兩個方面。

      一是數(shù)字保存的硬件解決方案。Gomes等[21]提出了運用3D技術(shù)對文化遺產(chǎn)進(jìn)行數(shù)字化保存的策略。Abel等[22]提出創(chuàng)建在線虛擬博物館對數(shù)據(jù)進(jìn)行保存。Bok等[23]提出利用一種創(chuàng)新的手持融合傳感器系統(tǒng),為大規(guī)模文化遺產(chǎn)的3D重建和數(shù)字化保存提供了一個實用且高效的解決方案。Kerne等[24]討論了Information-Based Ideation(IBI)的框架和評估方法,并且強調(diào)了數(shù)字策展在IBI任務(wù)中的重要作用。Lemieux[25]提出了區(qū)塊鏈技術(shù)記錄保存數(shù)據(jù)存在的問題以及三種類型的解決方案。Vincent等[26]認(rèn)為眾包攝影測量技術(shù)(Crowd-Sourced Photogrammetric Reconstructions)能夠重建失落遺產(chǎn)和對遺產(chǎn)進(jìn)行記憶。Li等[27]介紹了3D數(shù)字化技術(shù)在數(shù)字檔案、3D線圖繪制、虛擬修復(fù)和虛擬展示等方面的作用。Blanco-Pons等[28]討論了通過AR技術(shù),以交互式虛擬信息展示方式解析暗淡、受損巖畫和數(shù)字化長期保存的途徑。

      二是數(shù)字保存的軟件解決方案。Malone[29]介紹了專門為生物醫(yī)學(xué)領(lǐng)域數(shù)據(jù)分析和保存而開發(fā)的軟件本體(SWO),并為其在存儲、管理和分析數(shù)據(jù)等方面的應(yīng)用提供了一個詳細(xì)的描述框架。Uhl等[30]通過整合 Convolutional NeuralNetworks(CNNs)和弱監(jiān)督學(xué)習(xí)方法,提供了一個能高效提取歷史地圖中人類聚居模式的方法。

      4 國內(nèi)外數(shù)字保存研究議題嬗變的可視化分析

      通過對檢索文獻(xiàn)進(jìn)行關(guān)鍵詞共現(xiàn)分析、聚類分析以及突變分析后,可得到數(shù)字保存研究的關(guān)鍵詞共現(xiàn)圖、關(guān)鍵詞聚類表及關(guān)鍵詞突現(xiàn)圖,由此可分析國內(nèi)外數(shù)字保存研究領(lǐng)域的發(fā)展脈絡(luò)、主題分布及熱點前沿。

      4.1 國內(nèi)外數(shù)字保存領(lǐng)域關(guān)鍵詞共現(xiàn)可視化分析

      (1)國內(nèi)數(shù)字保存領(lǐng)域文獻(xiàn)關(guān)鍵詞共現(xiàn)分析。運用COOC軟件,對1 121篇中文文獻(xiàn)進(jìn)行統(tǒng)計,共有關(guān)鍵詞1 652個,其中單元頻次大于等于10的關(guān)鍵詞共有34個。由于在文獻(xiàn)檢索時使用“數(shù)字保存”和“數(shù)字長期保存”作為檢索詞,所以在關(guān)鍵詞分析時不對上述關(guān)鍵詞進(jìn)行分析,并排除掉同義詞“長期保存”與無意義詞“對策”“綜述”,余下的30個高頻關(guān)鍵詞見表5。

      根據(jù)關(guān)鍵詞兩兩共現(xiàn)原則,統(tǒng)計出30個高頻關(guān)鍵詞共同出現(xiàn)的頻次,形成30×30的共詞矩陣,并根據(jù)共詞矩陣,使用VOSviewer軟件進(jìn)行關(guān)鍵詞共現(xiàn)知識圖譜可視化(圖7),發(fā)現(xiàn)“數(shù)字信息資源”“圖書館”“數(shù)字圖書館”“保存策略”“數(shù)字檔案”等為數(shù)字保存相關(guān)研究領(lǐng)域的重要熱點。

      (2)國外數(shù)字保存領(lǐng)域文獻(xiàn)關(guān)鍵詞共現(xiàn)分析。由于Web of Science數(shù)據(jù)庫中并非所有在庫的文獻(xiàn)都存在關(guān)鍵詞,因此只對Web of Science核心合集中的514篇英文文獻(xiàn)進(jìn)行統(tǒng)計,得到關(guān)鍵詞1588個,其中出現(xiàn)頻次大于等于7的關(guān)鍵詞共有22個。由于在檢索文獻(xiàn)時使用“DigitalPreservation”和“Digital Curation”作為檢索詞,所以在關(guān)鍵詞分析時不對上述關(guān)鍵詞進(jìn)行分析,余下的20個高頻關(guān)鍵詞展示見表6。

      根據(jù)兩兩共現(xiàn)原則,統(tǒng)計出20個高頻關(guān)鍵詞在514篇中共同出現(xiàn)的頻次,形成20×20的共詞矩陣,并根據(jù)共詞矩陣,使用VOSviewer進(jìn)行可視化(圖8)。根據(jù)節(jié)點大小,可以看出“Cultural Heritage”“Digital Humanities”“Metadata”“OAIS”等關(guān)鍵詞是國外研究數(shù)字保存領(lǐng)域的熱點話題。可見國外主要以文化遺產(chǎn)為對象研究數(shù)字人文解決方案,重點關(guān)注元數(shù)據(jù)和開放檔案管理系統(tǒng)。

      4.2 國內(nèi)外數(shù)字保存領(lǐng)域關(guān)鍵詞聚類分析

      (1)國內(nèi)文獻(xiàn)關(guān)鍵詞聚類分析。使用VOSviewer軟件將研究領(lǐng)域中具有高度相似特性的關(guān)鍵詞進(jìn)行聚類,在分辨率為1.00的條件下形成7個簇,見表7。

      Cluster1聚焦于數(shù)字檔案的管理,包括數(shù)字檔案信息、數(shù)字檔案館建設(shè)以及與電子文件相關(guān)的議題,尤其探討了美國在該方面的研究;Cluster2著重于研究數(shù)字圖書館,及數(shù)字圖書館信息資源數(shù)字化過程中的知識產(chǎn)權(quán);Cluster3更關(guān)注數(shù)字資源有效保存的策略、資源以及與之相關(guān)的風(fēng)險管理;Cluster4更關(guān)注于數(shù)字保存具體的技術(shù)解決方案,如OAIS、元數(shù)據(jù)在保存中的應(yīng)用,以及監(jiān)測數(shù)字保存風(fēng)險的方法;Cluster5側(cè)重于圖書館中的數(shù)字文獻(xiàn)保存;Cluster6聚焦于公共圖書館的數(shù)字化進(jìn)程、大數(shù)據(jù)應(yīng)用以及LOCKSS的使用;Cluster7專注于云存儲技術(shù)在數(shù)字保存中的應(yīng)用和實踐。

      (2)國外文獻(xiàn)關(guān)鍵詞聚類分析。對Web of Science核心合集中的514篇英文文獻(xiàn),使用VOSviewer設(shè)置分辨率為1.00對高頻關(guān)鍵詞進(jìn)行聚類,形成7個不同的簇(表8)。

      Cluster1和Cluster7專注于3D技術(shù)在文化遺產(chǎn)數(shù)字化方面的應(yīng)用,著重使用三維技術(shù)通過對文化遺產(chǎn)的物理形態(tài)進(jìn)行掃描、建模等方式實施數(shù)字化,以便長期保存;Cluster2集中于數(shù)據(jù)的組織、管理和標(biāo)準(zhǔn)化,Metadata和Ontology作為信息的橋梁確保信息以一種標(biāo)準(zhǔn)化和互操作的方式被記錄和共享;Cluster3涉及數(shù)字資料的真實性以及檔案信息系統(tǒng)的標(biāo)準(zhǔn)(OAIS和Premis);Cluster4聚焦利用圖像捕捉技術(shù)對物理實體進(jìn)行記錄和保護(hù);Cluster5關(guān)注于CNNs(卷積神經(jīng)網(wǎng)絡(luò))在數(shù)字人文領(lǐng)域中的應(yīng)用,例如CNNs在圖像識別、語音處理和自然語言理解等方面為人文學(xué)科的研究提供了新的工具;Cluster6包括數(shù)字圖書館和網(wǎng)絡(luò)存檔,著重于數(shù)字信息資源的保管、檢索以及長期可用性。

      4.3 國內(nèi)外數(shù)字保存領(lǐng)域關(guān)鍵詞突現(xiàn)可視化分析。為了進(jìn)一步把握數(shù)字保存領(lǐng)域研究熱點的演進(jìn)趨勢,并推斷和預(yù)測出可能對未來研究和發(fā)展具有重大影響的新概念或前沿話題,使用COOC軟件對數(shù)字保存領(lǐng)域中英文文獻(xiàn)的關(guān)鍵詞進(jìn)行突發(fā)性檢測,并將結(jié)果進(jìn)行可視化,以清晰地展示在不同時間段內(nèi)關(guān)鍵詞的流行程度以及關(guān)注度的變化。

      (1)國內(nèi)文獻(xiàn)關(guān)鍵詞突現(xiàn)分析。使用COOC軟件的突現(xiàn)檢測功能,過濾掉單元頻次小于5的關(guān)鍵詞,按照順序?qū)⑶?0個關(guān)鍵詞保留并進(jìn)行可視化(圖9),以分析各階段研究主題關(guān)注度的演變。

      在數(shù)字保存研究的起步階段(2000年—2004年)主要關(guān)注數(shù)字圖書館。

      在數(shù)字保存研究的快速發(fā)展階段,研究出現(xiàn)了三個階段的變化。2005年—2011 年關(guān)鍵詞突現(xiàn)為OAIS、LOCKSS、數(shù)字信息保存、檔案館、長期保存、數(shù)字信息資源、質(zhì)量標(biāo)準(zhǔn)框架、數(shù)字保存系統(tǒng)。這一時期的研究者著重關(guān)注于數(shù)字信息資源保存的途徑、方式以及統(tǒng)一的規(guī)范,表明了數(shù)字化資源管理成了研究和實踐的焦點。2011 年—2015年關(guān)鍵詞突現(xiàn)為知識產(chǎn)權(quán)、認(rèn)知調(diào)查、實踐調(diào)查、保存成本、數(shù)字保存項目。在這個階段數(shù)字保存的知識產(chǎn)權(quán)問題開始受到重視,并且數(shù)字保存項目及其成本也受到了關(guān)注。2015年—2019年關(guān)鍵詞突現(xiàn)包括美國、數(shù)字檔案、電子文件、風(fēng)險檢測。在這4年間研究者更關(guān)注于電子文件和檔案以及對于它們保存系統(tǒng)的風(fēng)險評估,以保證這些資料的安全、可靠和完整性。

      在數(shù)字保存研究的成熟階段(2019年—2023年)產(chǎn)生的突現(xiàn)詞為公共圖書館和檔案數(shù)字資源。學(xué)者們更多地關(guān)注公共圖書館在提供數(shù)字保存服務(wù)方面的作用以及檔案數(shù)字資源的保存。

      (2)國外文獻(xiàn)關(guān)鍵詞突現(xiàn)分析。Web of Science核心合集中從2009年開始出現(xiàn)關(guān)鍵詞。使用COOC軟件的突現(xiàn)檢測功能,過濾掉單元頻次小于3的關(guān)鍵詞,并按照順序?qū)⑶?0個關(guān)鍵詞保留并進(jìn)行可視化(圖10),以分析各階段研究主題關(guān)注度的演變。

      2009年—2011 年的突現(xiàn)詞有Digital Libraries、Preservation。在這一階段數(shù)字圖書館以及對文獻(xiàn)和數(shù)字內(nèi)容長期保存的方法和策略得到了廣泛關(guān)注。

      2012年—2015年突現(xiàn)的關(guān)鍵詞包括Image Processing、Ontology、Cloud、Web Archiving,這一時期的學(xué)者著重于數(shù)字信息資源的結(jié)構(gòu)化保存以及通過在線的方式將數(shù)字信息資源進(jìn)行長期的存儲。

      2 0 1 6 年— 2 0 2 0 年產(chǎn)生了較多的突現(xiàn)詞, 包括Convolution Neural Networks、Ontology、Deep Learning、Conservation、Digitization、Computational ArchivalScience、Research Data Management、Interoperability、Computational Thinking、Privacy、Virtual Reality。可以看出,這一時期數(shù)字保存領(lǐng)域的發(fā)展比較活躍,同時機器學(xué)習(xí)和人工智能開始在數(shù)字保存領(lǐng)域得到重視。

      2021年—2023年隨著大數(shù)據(jù)和數(shù)據(jù)科學(xué)的發(fā)展,該階段突現(xiàn)詞包括Data Management、Digital Humanities、Cultural Heritage,數(shù)據(jù)管理在數(shù)字保存中的作用得到重視。

      5 結(jié)論與啟示

      基于文獻(xiàn)計量分析和文獻(xiàn)研究方法,本文在橫向上勾勒了數(shù)字保存研究建制化過程;在縱向上梳理了數(shù)字保存研究趨勢、研究主題的演進(jìn)脈絡(luò)??傮w而言,數(shù)字保存文獻(xiàn)研究始于20世紀(jì)90年代末,發(fā)展至今已有20余載,文獻(xiàn)數(shù)量從年發(fā)文量個位數(shù)實現(xiàn)了累計發(fā)文量指數(shù)級增長。隨著數(shù)字資源采購經(jīng)費的大幅增加,館藏資源結(jié)構(gòu)越來越向數(shù)字資源方向傾斜,相關(guān)研究與實踐愈加豐富。本文綜合運用Co-Occurrence軟件及其他輔助軟件,直觀形象地揭示了國內(nèi)外數(shù)字保存領(lǐng)域發(fā)展脈絡(luò)。

      (1)國內(nèi)外數(shù)字保存的發(fā)文量經(jīng)歷了緩慢起步和快速發(fā)展兩個階段。我國在文獻(xiàn)研究方面起步較早,國外則在相關(guān)實踐方面起步較早,我國先于國外進(jìn)入成熟階段。數(shù)字檔案長期保存是一項艱巨的系統(tǒng)工程,文獻(xiàn)研究的側(cè)重點也越來越多樣化,包括:日益豐富和復(fù)雜的數(shù)字對象類型、長期保存關(guān)鍵技術(shù)問題、長期保存可持續(xù)發(fā)展的管理策略等。

      (2)從研究主體角度分析,通過對比國內(nèi)外研究機構(gòu)合作網(wǎng)絡(luò)圖譜可見,我國的研究機構(gòu)主要集中于大學(xué)、情報中心和圖書館等研究機構(gòu),且發(fā)文量較大,而國外研究機構(gòu)主要集中于大學(xué),且發(fā)文量較小。我國在該領(lǐng)域形成了以核心節(jié)點為中心的較為緊密的合作網(wǎng)絡(luò),且核心節(jié)點在該領(lǐng)域持續(xù)深耕,保持了較好的研究傳承;國外合作關(guān)系整體較為松散,存在規(guī)模較小的研究子群,且核心節(jié)點在該領(lǐng)域持續(xù)深耕現(xiàn)象并不明顯。通過對比國內(nèi)外核心作者合作網(wǎng)絡(luò)圖譜可見,在國內(nèi)形成了以臧國全和吳振新為核心的較大的合作網(wǎng)絡(luò),且核心作者在該領(lǐng)域持續(xù)深耕;國外合作網(wǎng)絡(luò)呈整體分散,局部密集的特點,形成了進(jìn)入該領(lǐng)域早晚不一的研究子群。

      (3)從研究議題角度分析,國內(nèi)側(cè)重于研究圖書館、數(shù)字檔案等“數(shù)字信息資源”的“保存管理策略”,而國外則側(cè)重于研究基于元數(shù)據(jù)的文化遺產(chǎn)、數(shù)字人文方面的開放檔案信息系統(tǒng),以及先進(jìn)數(shù)字技術(shù)在數(shù)字保存應(yīng)用中的研究,側(cè)重于數(shù)字保存的技術(shù)解決方案。綜合國內(nèi)外文獻(xiàn)關(guān)鍵詞聚類分析可見,國內(nèi)外均關(guān)注于數(shù)字信息資源的組織、管理和標(biāo)準(zhǔn)化;在數(shù)字保存方法上均探討了OAIS、元數(shù)據(jù)等方式的使用。國外更多側(cè)重于使用3D技術(shù)和圖像捕捉等技術(shù)在文化遺產(chǎn)數(shù)字化方面的應(yīng)用。綜合國內(nèi)外數(shù)字保存高頻關(guān)鍵詞突現(xiàn)分析,可見我國數(shù)字保存的文獻(xiàn)研究從2005年開始進(jìn)入了多元化研究領(lǐng)域,國外2012年開始多元化;我國的研究側(cè)重于數(shù)字保存的管理方式和風(fēng)險規(guī)避等方面,國外則側(cè)重于數(shù)字保存技術(shù)的研究;OAIS、LOCKSS等圖書館數(shù)字資源長期保存新方式和新機制的研究是國內(nèi)外共同的研究熱點。

      猜你喜歡
      發(fā)文領(lǐng)域文獻(xiàn)
      Hostile takeovers in China and Japan
      速讀·下旬(2021年11期)2021-10-12 01:10:43
      10條具體舉措! 山東發(fā)文做好返鄉(xiāng)留鄉(xiāng)農(nóng)民工就地就近就業(yè)
      Cultural and Religious Context of the Two Ancient Egyptian Stelae An Opening Paragraph
      大東方(2019年12期)2019-10-20 13:12:49
      領(lǐng)域·對峙
      青年生活(2019年23期)2019-09-10 12:55:43
      校園拾趣
      爺孫趣事
      以牙還牙
      The Application of the Situational Teaching Method in English Classroom Teaching at Vocational Colleges
      The Role and Significant of Professional Ethics in Accounting and Auditing
      商情(2017年1期)2017-03-22 16:56:36
      新常態(tài)下推動多層次多領(lǐng)域依法治理初探
      普陀区| 竹山县| 阿尔山市| 车险| 百色市| 繁峙县| 福建省| 武宁县| 广州市| 菏泽市| 吴江市| 逊克县| 满洲里市| 改则县| 白城市| 六安市| 大连市| 东阳市| 梅州市| 通榆县| 辉县市| 闽清县| 琼海市| 保德县| 张家川| 稷山县| 蒙城县| 福贡县| 宜君县| 奈曼旗| 曲阜市| 临夏县| 延寿县| 保康县| 延川县| 桑植县| 肃宁县| 黔西县| 黄梅县| 区。| 家居|