白美程
(佳木斯大學(xué)圖書館黑龍江佳木斯154007)
我國(guó)關(guān)聯(lián)數(shù)據(jù)的研究進(jìn)展分析
白美程
(佳木斯大學(xué)圖書館黑龍江佳木斯154007)
以CNKI中收錄的與關(guān)聯(lián)數(shù)據(jù)研究有關(guān)的期刊論文為對(duì)象,分別從論文年代、來(lái)源期刊、核心作者、關(guān)鍵詞、高被下載及高被引等方面對(duì)國(guó)內(nèi)關(guān)聯(lián)數(shù)據(jù)研究進(jìn)行計(jì)量分析,指出國(guó)內(nèi)該研究領(lǐng)域具有國(guó)內(nèi)關(guān)聯(lián)數(shù)據(jù)的研究正處于探索期、研究主體集中、研究逐漸從理論轉(zhuǎn)向?qū)嵺`等特點(diǎn)。
關(guān)聯(lián)數(shù)據(jù);文獻(xiàn)計(jì)量學(xué);圖書館
關(guān)聯(lián)數(shù)據(jù)(Linked Data)的概念由萬(wàn)維網(wǎng)(World Wide Web,WWW)創(chuàng)始人Tim Berners-Lee于2006年在一個(gè)語(yǔ)義網(wǎng)項(xiàng)目中首次提出[1],自此關(guān)聯(lián)數(shù)據(jù)就引起了學(xué)術(shù)界(特別是圖書情報(bào)學(xué)領(lǐng)域)的高度關(guān)注和重視。
2.1數(shù)據(jù)來(lái)源
2009年,華東師范大學(xué)信息學(xué)系姚小樂(lè)等、華東師范大學(xué)信息學(xué)系李雯靜等分別發(fā)表于《現(xiàn)代圖書情報(bào)技術(shù)》第3期的譯文《LCSH,SKOS和關(guān)聯(lián)數(shù)據(jù)》和《將圖書館目錄納入語(yǔ)義萬(wàn)維網(wǎng)》正式拉開(kāi)了國(guó)內(nèi)關(guān)聯(lián)數(shù)據(jù)研究的序幕[2-3]。隨后,國(guó)內(nèi)學(xué)界開(kāi)始投入大量的人力、物力和財(cái)力進(jìn)行關(guān)聯(lián)數(shù)據(jù)領(lǐng)域的理論研究與實(shí)踐運(yùn)用,并取得了大量的學(xué)術(shù)研究成果。為厘清我國(guó)關(guān)聯(lián)數(shù)據(jù)的研究現(xiàn)狀與趨勢(shì),以為后續(xù)相關(guān)研究領(lǐng)域提供借鑒參考,筆者以CNKI為樣本來(lái)源庫(kù),以“關(guān)鍵詞=‘Linked Data’OR關(guān)鍵詞=‘關(guān)聯(lián)數(shù)據(jù)’”為檢索條件,勾選“中英文擴(kuò)展檢索”功能后進(jìn)行“精確”檢索,并對(duì)檢索結(jié)果進(jìn)行去重和剔除非相關(guān)文獻(xiàn)后得到有效期刊論文313篇。筆者運(yùn)用計(jì)量分析法對(duì)這313篇期刊論文進(jìn)行分析,以全面把握國(guó)內(nèi)關(guān)聯(lián)數(shù)據(jù)研究的現(xiàn)狀與未來(lái)發(fā)展趨勢(shì)。
2.2論文年代與來(lái)源期刊分析
學(xué)術(shù)論文發(fā)文量的年代分析能有效反映該研究領(lǐng)域的研究現(xiàn)狀與發(fā)展脈絡(luò)[4]。據(jù)統(tǒng)計(jì),我國(guó)關(guān)聯(lián)數(shù)據(jù)從2009年始至2015年止(不計(jì)數(shù)據(jù)庫(kù)收錄滯后,檢索時(shí)間2016年1月5日)間共發(fā)表期刊論文313篇,如圖1所示。從圖1可知,2009年只有2篇,到2015年已經(jīng)達(dá)到了77篇,其發(fā)文量呈逐年遞增趨勢(shì),累計(jì)發(fā)文量也快速增長(zhǎng),這表明國(guó)內(nèi)學(xué)術(shù)界十分關(guān)注關(guān)聯(lián)數(shù)據(jù)的發(fā)展,并十分重視其研究與實(shí)踐。
圖1 期刊論文發(fā)文量分析
為進(jìn)一步厘清我國(guó)關(guān)聯(lián)數(shù)據(jù)期刊論文的集中度與重要情報(bào)源,筆者對(duì)刊載關(guān)聯(lián)數(shù)據(jù)論文的期刊進(jìn)行計(jì)量分析。據(jù)統(tǒng)計(jì),國(guó)內(nèi)關(guān)于關(guān)聯(lián)數(shù)據(jù)研究的313篇期刊論文分布在88種期刊上,每種期刊載文的平均值為3.6篇,而載文量>3篇的期刊共有18種,其載文量合計(jì)215篇,占總載文量的68.69%。據(jù)布拉德福定律可知[4],這18種期刊的前四位是國(guó)內(nèi)關(guān)聯(lián)數(shù)據(jù)研究領(lǐng)域的核心期刊情報(bào)源,其載文量合計(jì)117篇,占總發(fā)文量的37.38%。如表1所示,這表明國(guó)內(nèi)關(guān)聯(lián)數(shù)據(jù)的研究成果主要發(fā)表于圖書情報(bào)領(lǐng)域的核心期刊(中文核心期刊(2014版)和CSSCI來(lái)源期刊(2014-2015)),核心情報(bào)源為圖書館學(xué)期刊《中國(guó)圖書館學(xué)報(bào)》和《圖書館學(xué)研究》、圖書情報(bào)學(xué)兩棲刊物《圖書情報(bào)工作》和《現(xiàn)代圖書情報(bào)技術(shù)》,同時(shí)這些也說(shuō)明了國(guó)內(nèi)各界十分關(guān)注關(guān)聯(lián)數(shù)據(jù)的發(fā)展,其學(xué)術(shù)研究成果的質(zhì)量和研究者水平都較高。
2.3核心作者分析
對(duì)核心作者的分析能夠全面把握某研究領(lǐng)域的高產(chǎn)作者與核心作者群,促進(jìn)該研究領(lǐng)域的深入研究與學(xué)術(shù)交流[5]。據(jù)統(tǒng)計(jì),國(guó)內(nèi)313篇關(guān)聯(lián)數(shù)據(jù)期刊論文共有445位作者,發(fā)文量最高的作者是夏翠娟(不區(qū)分作者在每篇論文中的排名),其發(fā)文量為17篇,如表2所示。據(jù)普賴斯定律知[5],發(fā)文量4篇及以上的作者構(gòu)成了國(guó)內(nèi)關(guān)聯(lián)數(shù)據(jù)研究領(lǐng)域的核心作者群,這表明國(guó)內(nèi)在引入關(guān)聯(lián)數(shù)據(jù)后,各界都十分關(guān)注并對(duì)其進(jìn)行研究與實(shí)踐,同時(shí)形成了如夏翠娟、劉煒、李春旺、祝忠明等核心作者對(duì)其進(jìn)行跟蹤研究與實(shí)踐,這也一定程度上說(shuō)明了國(guó)內(nèi)對(duì)關(guān)聯(lián)數(shù)據(jù)的研究已形成了比較完備的科研體系和人才隊(duì)伍。
表1 載文量4篇及以上的情報(bào)源
表2 發(fā)文量≥4篇的作者分布情況
2.4關(guān)鍵詞分析
通過(guò)對(duì)期刊論文的關(guān)鍵詞(特別是高頻關(guān)鍵詞)的分析將有效地把握國(guó)內(nèi)關(guān)聯(lián)數(shù)據(jù)研究領(lǐng)域的熱點(diǎn)和趨勢(shì)[6]。除去本位關(guān)鍵詞“關(guān)聯(lián)數(shù)據(jù)”“Linked Data”,表3所示為國(guó)內(nèi)關(guān)聯(lián)數(shù)據(jù)研究領(lǐng)域的高頻關(guān)鍵詞。從這些高頻關(guān)鍵詞可知,國(guó)內(nèi)關(guān)聯(lián)數(shù)據(jù)的研究主要集中在如何有效地利用關(guān)聯(lián)數(shù)據(jù)這種簡(jiǎn)單的語(yǔ)義網(wǎng),實(shí)現(xiàn)技術(shù)以及結(jié)合本體技術(shù)來(lái)有效地實(shí)現(xiàn)知識(shí)的組織與管理,特別是圖書館如何有效地利用這種技術(shù)來(lái)實(shí)現(xiàn)書目數(shù)據(jù)的組織與管理,并拓寬其知識(shí)服務(wù)平臺(tái)。
表3 高頻關(guān)鍵詞
2.5下載頻次分析
期刊論文的下載頻次能第一時(shí)間反映出期刊和學(xué)術(shù)論文的被利用情況[7]。據(jù)統(tǒng)計(jì),國(guó)內(nèi)關(guān)聯(lián)數(shù)據(jù)研究領(lǐng)域下載頻次在1200以上的期刊論文有13篇,如表4所示。
從表4可知,這13篇高被下載期刊論文全部發(fā)表于中文核心期刊(2014版)和CSSCI來(lái)源期刊(2014—2015),其中劉煒、夏翠娟、黃永文、沈志宏等作者的期刊學(xué)術(shù)論文的傳播最廣、被關(guān)注度也最高。被下載次數(shù)最多的期刊論文是上海圖書館劉煒等作者發(fā)表的《大數(shù)據(jù)與關(guān)聯(lián)數(shù)據(jù):正在到來(lái)的數(shù)據(jù)技術(shù)革命》,其被下載頻次為3891次,可見(jiàn)其影響力與學(xué)術(shù)價(jià)值都十分高。劉煒等在闡述語(yǔ)義鏈接給大數(shù)據(jù)系統(tǒng)帶來(lái)開(kāi)放性和互操作性以及提供基于“知識(shí)”的分析的基礎(chǔ)上,區(qū)分“大”關(guān)聯(lián)數(shù)據(jù)和“關(guān)聯(lián)的”大數(shù)據(jù)兩類不同的應(yīng)用,梳理了目前采用大數(shù)據(jù)技術(shù)發(fā)布關(guān)聯(lián)數(shù)據(jù)的方法和路徑,展望了兩類數(shù)據(jù)技術(shù)在圖書情報(bào)學(xué)領(lǐng)域的發(fā)展前景[8]。
2.6被引頻次分析
文獻(xiàn)被引頻次是評(píng)價(jià)文獻(xiàn)的學(xué)術(shù)質(zhì)量和影響力的重要指標(biāo),被引頻次越高,其學(xué)術(shù)價(jià)值越大[9]。據(jù)統(tǒng)計(jì),國(guó)內(nèi)關(guān)聯(lián)數(shù)據(jù)研究領(lǐng)域被引頻次大于等于40次的期刊論文有9篇,如表5所示。這9篇高被引期刊論文反映了目前國(guó)內(nèi)關(guān)聯(lián)數(shù)據(jù)研究領(lǐng)域的熱點(diǎn)。從表5可知,關(guān)聯(lián)數(shù)據(jù)的概念、技術(shù)與實(shí)現(xiàn)、應(yīng)用現(xiàn)狀與展望、資源組織與整合、帶給圖書館的機(jī)遇與挑戰(zhàn)等是目前我國(guó)關(guān)聯(lián)數(shù)據(jù)研究領(lǐng)域的熱點(diǎn)。
表4 下載頻次>1200的論文統(tǒng)計(jì)
表5 高被引文獻(xiàn)
本文從期刊論文的年代、來(lái)源期刊、核心作者、關(guān)鍵詞、高被下載頻次及高被引頻次等6個(gè)方面對(duì)國(guó)內(nèi)關(guān)聯(lián)數(shù)據(jù)研究領(lǐng)域的期刊文獻(xiàn)進(jìn)行計(jì)量分析,以全面厘清國(guó)內(nèi)關(guān)聯(lián)數(shù)據(jù)領(lǐng)域的研究現(xiàn)狀與熱點(diǎn)。筆者結(jié)合期刊文獻(xiàn)研究?jī)?nèi)容的深入分析,認(rèn)為國(guó)內(nèi)關(guān)聯(lián)數(shù)據(jù)研究領(lǐng)域具有以下特點(diǎn):
(1)國(guó)內(nèi)關(guān)聯(lián)數(shù)據(jù)的研究正處于探索期。主要表現(xiàn)在從2009年到2013年的快速增長(zhǎng),2013年至2015年的發(fā)文量幾乎維持在70篇到80篇之間。這表明國(guó)內(nèi)關(guān)聯(lián)數(shù)據(jù)在前期的快速發(fā)展基礎(chǔ)上,已進(jìn)入到了探索期,需要學(xué)界進(jìn)一步探索其發(fā)展趨勢(shì),并強(qiáng)化其應(yīng)用實(shí)踐。
(2)研究主體集中。從核心作者和來(lái)源期刊分析可知,國(guó)內(nèi)關(guān)聯(lián)數(shù)據(jù)的研究者主要是圖書情報(bào)學(xué)領(lǐng)域的專家學(xué)者,其研究成果主要發(fā)表于圖書情報(bào)學(xué)領(lǐng)域的核心期刊。
(3)研究逐漸從理論轉(zhuǎn)向?qū)嵺`。目前國(guó)內(nèi)關(guān)聯(lián)數(shù)據(jù)的研究雖偏重于理論研究,但也開(kāi)始了實(shí)踐應(yīng)用的探索,如《面向圖書館關(guān)聯(lián)數(shù)據(jù)的自動(dòng)問(wèn)答技術(shù)研究》《基于關(guān)聯(lián)數(shù)據(jù)的語(yǔ)義數(shù)字檔案館框架設(shè)計(jì)研究》等,同時(shí)只有這些實(shí)踐應(yīng)用才能更好地促進(jìn)國(guó)內(nèi)關(guān)聯(lián)數(shù)據(jù)的發(fā)展。因此國(guó)內(nèi)學(xué)界在開(kāi)展關(guān)聯(lián)數(shù)據(jù)研究時(shí),除了加強(qiáng)其理論研究的深化外,還應(yīng)強(qiáng)化其具體的實(shí)踐應(yīng)用和經(jīng)驗(yàn)總結(jié)。
[1]Berners-Lee T.Linked Data—Design Issues[EB/OL].[2016-04-06].http://www.w3.org/DesignIssues/LinkedData.html.
[2]Summers Ed,Antoine I,Clay R,等.LCSH,SKOS和關(guān)聯(lián)數(shù)據(jù)[J].現(xiàn)代圖書情報(bào)技術(shù),2009(3):8-14.
[3]Martin M,李雯靜.將圖書館目錄納入語(yǔ)義萬(wàn)維網(wǎng)[J].現(xiàn)代圖書情報(bào)技術(shù),2009(3):3-7.
[4]陽(yáng)廣元.國(guó)內(nèi)機(jī)構(gòu)知識(shí)庫(kù)研究文獻(xiàn)計(jì)量統(tǒng)計(jì)分析[J].圖書館理論與實(shí)踐,2015(10):49-53.
[5]陽(yáng)廣元,鄧進(jìn).國(guó)外E-Science研究論文的計(jì)量研究[J].西南民族大學(xué)學(xué)報(bào)(人文社會(huì)科學(xué)版),2015(3):234-240.
[6]白美程,陽(yáng)廣元.我國(guó)Data Curation(DC)的研究進(jìn)展分析[J].科技情報(bào)開(kāi)發(fā)與經(jīng)濟(jì),2015(24):132-135.
[7]尚新麗,史雙青.我國(guó)信息經(jīng)濟(jì)學(xué)研究的文獻(xiàn)計(jì)量分析[J].圖書館理論與實(shí)踐,2012(3):25-27.
[8]劉煒,夏翠娟,張春景.大數(shù)據(jù)與關(guān)聯(lián)數(shù)據(jù):正在到來(lái)的數(shù)據(jù)技術(shù)革命[J].現(xiàn)代圖書情報(bào)技術(shù),2013(4):2-9.
[9]丁佐奇,鄭曉南,吳曉明.科技論文被引頻次與下載頻次的相關(guān)性分析[J].中國(guó)科技期刊研究,2010(4):467-470.
A Bibliometric Analysis of Linked Data Research in China
This paper conducts a bibliometric analysis of linked data research in China based on essays collected by CNKI,exploring aspects of publishing years,source journals,core authors,key words,and cited frequencies.It reveals that current research on linked data in China is still underway,the research subjects are centralized and that researches are moving from theories to practices.
linked data;bibliometric;library
G250.74
A
白美程(1985—),女,佳木斯大學(xué)圖書館館員。
2016-08-16