羅丹 黃夏基
摘要:目的?通過對國外檔案數據研究的分析,了解國外相關研究的現狀,根據研究熱點的變化,在一定程度上推測國外今后的研究方向。方法?選取Web?of?Science作為數據來源,對國外關于檔案數據2013—2023年的文獻通過可視化軟件CiteSpace從年代分布、期刊、重要作者、研究熱點等方面進行統(tǒng)計分析。結果?國外對于檔案數據的研究一直處于較高的水準,以如何將檔案數據應用于社會科學領域、自然科學領域和檔案學領域為主。結論?國外未來的研究趨勢應是探索長期保存檔案數字資源的方法以及加大檔案數據研究的深度。
關鍵詞:檔案數據?數據檔案?研究熱點?CiteSpace軟件
中圖分類號:G270.7
Comparative?Research?on?Archival?Data?Hotspots?Abroad?in?the?Past?Decade
—Based?on?the?Visual?Analysis?of?CiteSpace
LUO?Dan???HUANG?Xiaji?(HUANG-XIA?Ji??)
(School?of?Management,?Guangxi?Minzu?University,?Nanning,?Guangxi?Zhuang?Autonomous?Region,?530006?China)
Abstract:?Objective?To?understand?the?current?situation?of?related?research?abroad?through?the?analysis?of?archival?data?research?abroad,?and?speculate?the?future?research?direction?abroad?to?a?certain?extent?according?to?the?changes?in?research?hotspots.?Method??Web?of?Science?was?selected?as?the?data?source,?and?the?literature?from?2013?to?2023?in?archival?data?abroad?was?statistically?analyzed?by?visualization?software?CiteSpace?from?the?aspects?of?age?distribution,?journals,?important?authors?and?research?hotspots.?Result??Research?on?archive?data?abroad?had?always?been?at?a?high?level,?focusing?on?how?to?apply?archival?data?to?the?fields?of?social?science,?natural?science?and?archival?science.?Conclusion??The?future?research?trend?abroad?should?be?to?explore?methods?for?the?long-term?preservation?of?archival?digital?resources?and?increase?the?depth?of?archival?data?research.
Key?Words:?Archival?data;?Data?archive;?Research?hotspot;?CiteSpace?soft
互聯網技術的出現,推動數字化的興起,大數據技術的出現,推動著數據化的興起。大數據及隨之而來的數據化浪潮對檔案行業(yè)的沖擊已經顯現。2021年,中共中央辦公廳、國務院辦公廳印發(fā)《“十四五”全國檔案事業(yè)發(fā)展規(guī)劃》明確將數據歸檔作為“十四五”期間全國檔案工作的重要任務,標志著國家檔案局正在將數據檔案管理作為檔案部門當前和今后長期的重要工作[1]。國家檔案局原局長楊冬權提出:我國檔案館(室)建設的新方向應該是智慧檔案館。他還指出,智慧檔案館首先是把檔案或檔案數字化圖像的內容全文輸入電腦,即把檔案全部“數據化”,使檔案里包含的智慧能夠成為人類智慧,是對數字檔案館的升級[2]。由此可見,檔案數據化趨勢愈發(fā)明顯,在信息時代的影響下,檔案數據總量增長迅猛,已經成為檔案管理的重要戰(zhàn)略資源。因此,通過探析國外檔案數據的研究熱點,能為國內今后的檔案數據研究方向和檔案事業(yè)的未來發(fā)展提供一定參考。
1數據來源與研究方法
1.1數據來源
文獻數據以Web?of?Science為來源,檢索方式為:TS="archival?data",(TI="archival?data*")?AND?TS="archival?data*";檢索范圍:Web?of?Science核心數據庫,文獻時域定為2013—2023年,檢索時間為2023年10月5日,共檢索到1?294篇文獻,經過數據清洗、去重、剔除文獻記錄,最終獲得有效數據1?181條。
1.2研究方法
本文運用信息可視化軟件CiteSpace對檢索得到的數據進行分析,可以梳理出國外檔案數據領域的研究現狀和研究熱點,能較為直觀地了解到這一領域今后發(fā)展的大致方向。
2文獻時間分布
發(fā)文數量的變化可以直觀地發(fā)現某個學科領域在特定時期或某一時間段研究熱點的變化,是判斷該學科在該時期發(fā)展趨勢的重要指標。如圖1所示,在2013—2015年間,國外以“檔案數據”為主題的研究發(fā)文量呈穩(wěn)定增長狀態(tài),2016—2017年雖有少許回落,但隨后兩年的增長較快,到2021年達到最高發(fā)文量165篇,之后發(fā)文量有所下降,尤其是2023年發(fā)文量下降了50.49%(截至2022年10月5日,國外已有103篇文獻)。
由圖1可知,國外關于“檔案數據”的研究發(fā)文量在2021年達到最高。主要是受到了聯合國教科文組織(United?Nations?Educational,?Scientific?and?Cultural?Organization,UNESCO)、國際檔案理事會?(International?Council?on?Archives?--?ICA)?的影響,2021年,ICA在國際檔案周開展了以“建立數字橋梁”為主題的研討會,該會重點關注教科文組織成立75周年的教科文組織章程文件的數字化,以探索數字化為全球檔案界賦權的挑戰(zhàn)和機遇,以及檔案數據的價值應用為主。因此,國外學者在這一時期也發(fā)表了大量以“檔案數據”為研究主題的成果。從整體的發(fā)文量呈增長趨勢來看,檔案數據仍是國外學者的研究熱點。
3檔案數據研究分析
3.1核心期刊分析
在CiteSpace中構建期刊共被引知識圖譜,得到的檔案數據研究的核心期刊共被引知識圖譜如圖2所示。每個節(jié)點表示一個期刊,節(jié)點越大,表示期刊被引頻次越高。
由圖2可得,有關檔案數據的研究主要分布在ASTROPHYS?J、MON?NOT?R?ASTRON?SOC、ASTRON?ASTROPHYS、ASTROPHYS?J?LETT等天文物理學領域期刊,NATURE、SCIENCE等自然科學領域期刊。
其中,被引頻次較高的期刊有ASTROPHYS?J、MON?NOT?R?ASTRON?SOC、ASTRON?ASTROPHYS,被引次數依次為479次、468次、437次,這些都是天文物理學領域的期刊,說明也是檔案數據研究的重要文獻來源。而中心度較高的期刊分別為ASTROPHYS?J、IEEE?T?GEOSCI?REMOTE、SCIENCE,中心度依次為0.28、0.28、0.23,說明這3種期刊中有關檔案數據研究的文章質量較高,對該學科的研究有重要的支撐作用。
從期刊共被引圖譜來看,國外檔案數據研究主要是分布在天文學這一自然科學領域,原因是天文學領域的“檔案數據”更重視檔案數據對科學研究的價值[3],對檔案數據的定義、內容、本質研究較少。
3.2重要作者分析
首先確定出被引頻次較高的作者,圖譜中的連線表示作者與作者之間的合作關系,節(jié)點代表作者,節(jié)點越大,作者的被引頻次就越高,如圖?3?所示。
從圖中可以看出,被引頻次最高的作者是Christine?L.?Borgman,被引60次。Christine?L.?Borgman的研究領域又以信息研究和計算機科學為主,?Digital?data?archives?as?knowledge?infrastructures:?Mediating?data?sharing?and?reuse一文被引76次,這篇文章通過研究荷蘭檔案數據和網絡服務研究所DANS打開了檔案數據的“黑匣子”[4]。Rene?Hudec對塔爾拉天文臺底片檔案實現了完全數字化和部分數據訪問,并提出天文攝影資料檔案仍在等待數字化,需要既復雜又簡單的數據歸檔工具,為科學界提供對這些數字數據的訪問操作(包括元數據搜索)[5]。
3.3研究熱點分析
將Web?of?Science的樣本數據導入CiteSpace軟件進行研究熱點分析,得到國外檔案數據研究的關鍵詞知識圖譜,如圖4所示,節(jié)點代表關鍵詞,節(jié)點越大,代表關鍵詞出現的頻率越高,對關鍵詞共現圖譜進一步分析,得到關鍵詞的中心性,中心性越高,其影響力和重要程度越大,具體如表1所示。
根據關鍵詞詞頻排序和中心性可知,近10年來國外檔案數據研究熱點主要是檔案數據在社會科學領域(Social?Science?Field)、自然科學領域(Natural?Science?Field)以及檔案學領域(Field?of?Archival?science)的定義與應用。
檔案數據保存的一項要求是能夠更新記錄的元數據,為了保證數字保存操作后的真實性以及與其他記錄的關系,STANI?H等人[6]提出一個支持元數據更改的數據庫系統(tǒng),探討了在基于區(qū)塊鏈的檔案系統(tǒng)中實現檔案綁定的問題。KRISHNAN?S等人[7]認為利用檔案數據可以探索電子政務對民族國家腐敗、經濟繁榮和環(huán)境惡化的作用和貢獻,雖然電子政務的成熟度無助于經濟繁榮和環(huán)境惡化,但其價值可以通過對腐敗的影響間接實現;RANADE?S[8]探討了將現代數據分析技術應用于歷史檔案數據的挑戰(zhàn),考慮了計算方法為遺產收藏創(chuàng)建新的訪問路線的潛力,為從業(yè)者提供了數字時代檔案描述影響的視角。
運用CiteSpace軟件,對國外檔案數據文獻關鍵詞進行聚類分析,得到圖5。由圖5可知Web?of?science檔案數據關鍵詞聚類共14類,其中有兩個聚類:聚類#1,聚類#10直接以檔案數據為中心,側重兩個不同的方面,分別是數據共享和檔案數據。
MARKIEWICZ?C?等人[9]描述了一個大腦倡議數據檔案(Open?Neuro)它提供了根據FAIR數據共享原則公開共享各種大腦成像數據類型的數據的能力,對確??茖W研究的可重復性和最大限度地發(fā)揮公共投資的影響至關重要;CHENG?S?S等人[10]認為對于需要歸檔的大量數字化信息,實現檔案存儲的穩(wěn)定性,才能使數字化檔案的信息資源得到持久的利用。
4結語
隨著時代的信息化和數據化發(fā)展,如何將檔案數據更好地和其他領域融合應用仍然作為國外學者的研究熱點,檔案數據的發(fā)展以及相關技術在檔案學領域的成功應用,可以證明研究檔案數據和其他領域交叉的可行性與有效性。本文梳理國外相關文獻綜合分析可以預判:國外檔案數據在未來的研究趨勢應是加大檔案數據的研究深度,探索長期保存檔案數字資源的方法。
參考文獻