慕容慧
(廣東肇慶學院人事處,廣東肇慶526061)
我國檔案大數(shù)據(jù)研究論文的計量學分析
慕容慧
(廣東肇慶學院人事處,廣東肇慶526061)
本文運用文獻計量學的相關(guān)知識,總結(jié)了2013年—2017年3月我國檔案大數(shù)據(jù)研究論文的時間分布、期刊分布、機構(gòu)分布、作者分布、關(guān)鍵詞頻分布、主題分布及合著情況,揭示了近幾年檔案大數(shù)據(jù)的整體研究狀況和特點,并對其未來研究發(fā)展趨勢進行了分析。
檔案大數(shù)據(jù);文獻計量學;統(tǒng)計;分析
大數(shù)據(jù)是海量數(shù)據(jù)的代名詞,是一種宏觀的、綜合性的概念,是對潛藏巨大價值、類型多樣并且可被快速處理應(yīng)用的巨量信息的一種描述。[1]目前,大數(shù)據(jù)技術(shù)在社會各領(lǐng)域全面滲透、已被廣泛應(yīng)用,并引起一系列社會變革,人類已經(jīng)邁入大數(shù)據(jù)時代。我國關(guān)于大數(shù)據(jù)的理論成果從2011年開始增多,但是檔案學術(shù)界對于大數(shù)據(jù)在檔案領(lǐng)域的應(yīng)用與研究起步較晚,文獻研究成果直到2013年才開始逐漸出現(xiàn)。檔案業(yè)務(wù)在大數(shù)據(jù)時代背景下,所產(chǎn)生的動態(tài)變化和發(fā)展必將受到檔案工作者的共同關(guān)注。
以檔案大數(shù)據(jù)為研究對象,通過對中國知網(wǎng)“中國期刊全文數(shù)據(jù)庫”進行檢索,在主題項輸入“檔案大數(shù)據(jù)”,檢索年限為2013年—2017年3月,檢索文獻52篇。排除匯編及一稿多投各一篇,最后得50篇。對這些文獻的發(fā)表時間、主題、作者、關(guān)鍵詞等數(shù)據(jù)信息進行統(tǒng)計分析,從科學量化的角度探索檔案大數(shù)據(jù)的文獻情報規(guī)律,對檔案大數(shù)據(jù)的研究現(xiàn)狀和發(fā)展趨勢進行宏觀了解。
(一)發(fā)表時間與年度分布
分析論文發(fā)表的時間可以了解科研對象在時間序列方面的發(fā)展速度和受關(guān)注程度。對2013年至2017年3月檔案大數(shù)據(jù)的論文數(shù)量做分析,有助于揭示檔案學界對大數(shù)據(jù)研究進展的總體趨勢。2013年至2017年3月我國檔案大數(shù)據(jù)研究性論文的發(fā)表時間及年度分布情況具體見表1:
表1 論文的時間及數(shù)量分布
表1顯示出2013年至2016年論文數(shù)量呈現(xiàn)上升趨勢。其中,2013年至2015年,論文數(shù)量小幅增長,文獻量趨于穩(wěn)定;2016年文獻數(shù)量達到統(tǒng)計期的最大峰值(20篇),2017年刊發(fā)的論文數(shù)量稀少,與當年被統(tǒng)計時間不長有一定關(guān)系。從總體趨勢判斷,檔案大數(shù)據(jù)已經(jīng)引起檔案學界的注意,相關(guān)研究正在逐步深入,2017年的文獻量有望持續(xù)穩(wěn)定。
(二)載文期刊分布
學術(shù)期刊是科研工作者進行學術(shù)探討、合作交流的平臺,統(tǒng)計論文的期刊分布是總結(jié)學術(shù)期刊的學術(shù)取向,獲取其研究重要性的重要方法。
表2 論文的期刊分布
表2是2013年—2017年3月的檔案大數(shù)據(jù)論文在各期刊上的分布情況,50篇論文共刊登在32種期刊上。依布拉德福定律將上述32種期刊按載文數(shù)量n>3、1<n<4、n=1劃分成核心區(qū)、相關(guān)區(qū)和非相關(guān)區(qū),三區(qū)載文量依次是9,18,23,三區(qū)所含期刊數(shù)依次是:1,8,23,與布拉德福定律提出的核心區(qū)與后繼各區(qū)所含的期刊數(shù)成1∶a∶a2(a為布氏系數(shù),a=5)的比例基本吻合。
表3是論文在不同類型期刊上的分布情況。32種刊物中檔案學核心刊物有8種,共發(fā)文15篇。檔案類普通期刊7種,共發(fā)文16篇。這兩種期刊上發(fā)表的論文,占發(fā)表論文總數(shù)的62%,說明檔案專業(yè)刊物對檔案大數(shù)據(jù)的研究給予了足夠重視,科研產(chǎn)出水平比較高。檔案學以外的其他學術(shù)期刊有17種,共發(fā)文19篇,占發(fā)表論文總數(shù)的38%。
表3 論文在不同類型期分布
(三)作者分布
1.核心作者分析
核心作者是指某一學科研究中造詣較深,發(fā)表論文較多,獲得科研成果較多的學科帶頭人。[2]核心作者群由核心作者集合而成。核心作者群對科研工作有導向作用,能夠進一步把學科研究推至新的高度。
表4 論文的作者分布
表4是2013年—2017年3月檔案大數(shù)據(jù)論文的作者分布情況。對這一時期發(fā)表檔案大數(shù)據(jù)論文的作者進行統(tǒng)計分析,可以了解檔案大數(shù)據(jù)學術(shù)領(lǐng)域主要研究者及主要作者群的研究動態(tài),進而推測他們的研究方向。普賴斯定律[3]指出,核心作者發(fā)文量應(yīng)占論文總量的50%,核心作者最低發(fā)文量為N≌0.749(其中ηmax為最高產(chǎn)量作者的論文數(shù))。據(jù)表4可知ηmax為2篇,N取最大鄰近整數(shù)為2篇,發(fā)文2篇以上的核心作者有5人,占作者總數(shù)的11%,他們一共發(fā)表論文10篇,占論文總量的20%。由于數(shù)據(jù)與普賴斯定律“10%的作者發(fā)文量占發(fā)文總量的50%”的指標相距甚遠,說明檔案大數(shù)據(jù)研究的核心作者群未能有效形成,他們的研究對其他作者的影響力有限。
2.論文的作者合著分析
合著情況體現(xiàn)了學科綜合水平和研究的難易程度。邱均平對作者合作的情況提出了兩種指標:(1)合作度=(一定時期內(nèi)相關(guān)文獻的)作者總?cè)舜?(一定時期內(nèi)相關(guān)文獻的)論文總數(shù);(2)合作率=(一定時期內(nèi)相關(guān)文獻的)合作論文數(shù)/(一定時期內(nèi)相關(guān)文獻的)論文總數(shù)。指標數(shù)值越高,合作智能發(fā)揮越充分。[4]
表5 論文作者合著分析
表5給出了論文作者合著分析數(shù)據(jù)。整體而言,檔案大數(shù)據(jù)論文的合著度與合著率偏低,說明過去檔案大數(shù)據(jù)領(lǐng)域以獨立研究為主,與其他領(lǐng)域交叉不足,未來應(yīng)該加強不同專業(yè)人員的共同深入研究,確保檔案大數(shù)據(jù)研究全面、合理發(fā)展。
(四)發(fā)文機構(gòu)統(tǒng)計分析
統(tǒng)計論文第一作者機構(gòu)可以揭示不同系統(tǒng)的科研人員的學術(shù)水平與科研能力,掌握專業(yè)人才的分布情況。從圖1可知,50篇論文的發(fā)文機構(gòu)大致可以分為四類:檔案館(局)、高等院校其他機構(gòu)、高等院校檔案館、其他社會機構(gòu)。其中高等院校發(fā)文量最多,總共26篇(含其他機構(gòu)20篇,檔案館6篇),占總發(fā)文量52%。此外,5位核心作者中有3位來自高等院校的檔案館及其他機構(gòu):張倩(南京藝術(shù)學院綜合檔案室)、李彥(湖南師范大學檔案館)、黃桂新(中山大學附屬第一醫(yī)院),說明高等院校是檔案大數(shù)據(jù)科研成果的高發(fā)地,在該研究領(lǐng)域發(fā)揮了學術(shù)帶頭作用。其他社會機構(gòu)發(fā)文量及占總發(fā)文百分比排名第二,說明檔案大數(shù)據(jù)正以積極主動的姿態(tài)跨越學科專業(yè)和行業(yè)領(lǐng)域的界限,受到不同社會機構(gòu)的共同關(guān)注。地方檔案館(局)發(fā)文量較少,說明對檔案大數(shù)據(jù)的研究關(guān)注度不高,研究力度有待加大。
圖1 論文發(fā)文機構(gòu)分布圖
(五)論文的主題分布
2013年至2017年3月檔案大數(shù)據(jù)論文的研究主題分為5個方向。從表6可以看出,檔案大數(shù)據(jù)的論文里面,主題排前三位的是“檔案工作的現(xiàn)狀與發(fā)展”、檔案大數(shù)據(jù)建設(shè)、檔案大數(shù)據(jù)的基礎(chǔ)理論,分別占發(fā)文總數(shù)的44%、13%、9%。說明研究人員不僅介紹與分析檔案大數(shù)據(jù)的基本理念,更注重研究檔案大數(shù)據(jù)對現(xiàn)行檔案工作的影響,以及如何優(yōu)化現(xiàn)有的檔案資源、平臺和體系,達到建設(shè)檔案大數(shù)據(jù)的目的。檔案大數(shù)據(jù)挖掘與應(yīng)用(包括檔案大數(shù)據(jù)的利用及檔案大數(shù)據(jù)與公共服務(wù)的關(guān)系)的論文占發(fā)文總數(shù)的10%,說明學者有意超越陜隘的基礎(chǔ)理論研究,努力破解檔案大數(shù)據(jù)在大數(shù)據(jù)時代中產(chǎn)生的實踐難題。
表6 論文的主題分布
圖2直觀地反映了檔案大數(shù)據(jù)論文各主題的研究發(fā)展過程和研究趨勢:檔案工作的現(xiàn)狀與發(fā)展呈折線向上的發(fā)展態(tài)勢,說明在將來一定時間內(nèi),檔案大數(shù)據(jù)對檔案工作的影響這一方面的研究還將會繼續(xù)深入。檔案大數(shù)據(jù)建設(shè)、檔案大數(shù)據(jù)的挖掘與應(yīng)用這兩個主題呈折線向下的態(tài)勢,說明作者對這兩個主題的研究力度不夠,缺少新穎的研究成果。檔案大數(shù)據(jù)基礎(chǔ)理論方面的研究則給人們留下了較多的深入空間。
圖2 論文主題的年度分布圖
(六)關(guān)鍵詞頻統(tǒng)計
關(guān)鍵詞是作者對論文內(nèi)容的高度提煉和概括描述,高頻關(guān)鍵詞經(jīng)常被用于分析學科領(lǐng)域的研究熱點。表7對2013年至2017年3月檔案大數(shù)據(jù)論文的關(guān)鍵詞進行了統(tǒng)計。
表7 論文關(guān)鍵詞頻統(tǒng)計
從表7可以看出:(1)大數(shù)據(jù)、檔案大數(shù)據(jù)2個關(guān)鍵詞出現(xiàn)的頻次較高,說明這兩個是檔案大數(shù)據(jù)研究的基礎(chǔ)詞匯;(2)檔案、數(shù)據(jù)化、高校、信息化等出現(xiàn)的頻次僅次于檔案出現(xiàn)的頻次,說明檔案大數(shù)據(jù)與檔案的關(guān)系,以及如何把檔案大數(shù)據(jù)進行數(shù)據(jù)化、信息化,也是人們的關(guān)注重點;(3)檔案管理、公布式文件系統(tǒng)、檔案工作、云桌面技術(shù)等關(guān)鍵詞數(shù)次出現(xiàn),這些方面的內(nèi)容已經(jīng)引起了人們的關(guān)注;(4)隱私保護、大數(shù)據(jù)分析方法、挖掘利用等研究有待進一步拓展與深入。
縱觀檔案大數(shù)據(jù)論文,發(fā)現(xiàn)該領(lǐng)域研究存在以下問題:起步較晚,相關(guān)研究偏于表象,不夠深入;重復介紹基本理念;在檔案大數(shù)據(jù)對檔案工作的影響的研究中,創(chuàng)新觀點不多;對國外和港臺的檔案大數(shù)據(jù)實踐應(yīng)用方面的介紹和借鑒較少。
結(jié)合大數(shù)據(jù)時代的發(fā)展現(xiàn)狀,對檔案大數(shù)據(jù)的研究趨勢作如下展望:(1)檔案大數(shù)據(jù)是檔案事業(yè)應(yīng)對大數(shù)據(jù)時代信息技術(shù)迅猛發(fā)展的必然選擇,是不容忽視的重要課題。(2)隨著檔案大數(shù)據(jù)研究的不斷深入和發(fā)展,其理論歸納在深度和廣度方面也會隨之不斷擴展。(3)檔案大數(shù)據(jù)的概念框架與檔案信息化、數(shù)字化存在不同,這種對比研究以及它對我國檔案工作的影響會進一步深入。(4)在未來的研究中,將檔案大數(shù)據(jù)的概念應(yīng)用于檔案資源的組織、管理,進一步開發(fā)相應(yīng)平臺,加強規(guī)范控制,完善檔案大數(shù)據(jù)功能等實踐應(yīng)用的方面會不可避免地遇到障礙,尋求有效的解決方法并且加以完善會成為另一個關(guān)注點。
檔案大數(shù)據(jù)的研究論文是檔案事業(yè)人員和學者對大數(shù)據(jù)領(lǐng)域已有知識進行歸納和總結(jié),在分析前人研究成果的基礎(chǔ)上,對未來研究方向做出的預(yù)測和指引,在一定程度上反映了該學科研究的發(fā)展水平。
本文運用多樣化的文獻計量工具,從時間分布、期刊分布、機構(gòu)分布等七個方面對中國知網(wǎng)“中國期刊全文數(shù)據(jù)庫”收錄的50篇檔案大數(shù)據(jù)研究論文的結(jié)構(gòu)特征進行統(tǒng)計分析,從中發(fā)現(xiàn),我國檔案大數(shù)據(jù)研究論文在期刊分布、作者分布、主題層次上已經(jīng)取得一定的進展,但是仍然存在發(fā)文量不多、論文合作率不高、相關(guān)主題研究較少等問題,還需要更多的研究論文來進行反思和總結(jié),從而提升檔案大數(shù)據(jù)研究的質(zhì)量及其在實際工作中的應(yīng)用水平。檔案大數(shù)據(jù)建設(shè)賦予檔案工作嶄新的內(nèi)容,面對大數(shù)據(jù)時代的機遇和挑戰(zhàn),檔案工作者要適應(yīng)檔案大數(shù)據(jù)建設(shè)的需要,開創(chuàng)檔案工作新局面。
[1]樊樹娟.大數(shù)據(jù)時代檔案職業(yè)改革與發(fā)展研究[D].山東:山東大學,2015:66.
[2]袁小翠.2005年—2011年我國檔案信息化研究文獻計量分析[J].檔案管理,2011(6):61.
[3]羅式勝.文獻計量學概論[M].廣州:中山大學出版社,1994:309-310.
[4]張愷.2001—2010年我國檔案學核心期刊綜述類文獻的計量分析[J].檔案學通訊,2011(5):19.
(責任編輯:劉嶺峰2572756826@qq.com)
A Bibliometric Analysis of Research Papers on Archival Large Data in China
MURong-hui
(Personnel Division,ZhaoqingUniversity,Zhaoqing526061,China)
In this paper,researches on archival large data,from 2013 to March 2017,are summarized and analyzed through bibliometrics,which contains the distribution of the time,journals,authors,cooperation, organizations,subjects and the frequency of key words.This paper also reveals researching status and characteristics of archival large data in recent years,and analyzes the research trend in the future.
archival large data;bibliometrics;statistics;analysis
G272.6
A
1008-018X(2017)03-0086-06
2017-03-23
慕容慧(1976-),女,廣東肇慶人,廣東肇慶學院檔案館員。