谷紫藤
【摘要】本文以中國知網(wǎng)、萬方、維普三大中文數(shù)據(jù)庫為檢索來源,收集了2009年到2017年語義出版領(lǐng)域的研究文獻(xiàn),采用定量與定性相結(jié)合的分析方法,分析了期刊、作者的分布情況,以及語義出版領(lǐng)域的研究熱點(diǎn)問題,作者共現(xiàn)知識圖譜以及關(guān)鍵詞共現(xiàn)知識圖譜。與此同時,考察了布拉德福定律在該領(lǐng)域的適用性,展示了語義出版的在國內(nèi)的研究發(fā)展情況。
【關(guān)鍵詞】語義出版 數(shù)字出版 文獻(xiàn)統(tǒng)計(jì)分析 計(jì)量分析
一、研究背景
如今,博客、微博、社交網(wǎng)絡(luò)、移動服務(wù)在互聯(lián)網(wǎng)時代飛速發(fā)展,這給我們帶來了很大的便利,與此同時,我們也面臨著“信息過載”“信息迷航”“信息孤島”等問題。此外,傳統(tǒng)的元數(shù)據(jù)描述已經(jīng)無法滿足科研用戶對于資源的獲取以及檢索需求。所以,面向以關(guān)聯(lián)數(shù)據(jù)為基礎(chǔ)技術(shù)的web3.0的語義技術(shù)在出版領(lǐng)域得到應(yīng)用,它增強(qiáng)了出版內(nèi)容的語義標(biāo)識,使得信息組織在語義時代又有了新的發(fā)展。語義出版通過構(gòu)建語義相關(guān)的文章之間的鏈接,提供多種獲取文章內(nèi)數(shù)據(jù)的可行途徑,也使文章之間的數(shù)據(jù)整合更容易實(shí)現(xiàn)。
二、數(shù)據(jù)獲取與研究方法
選擇2009年到2017年作為研究時段,在中國知網(wǎng)、萬方、維普三大中文數(shù)據(jù)庫進(jìn)行檢索,以“主題=“語義出版”or“主題=增強(qiáng)出版”or“主題=納米出版物”or“主題=微型出版物”為檢索式,采用高級檢索進(jìn)行篩選(檢索時間為2017年6月12日),共得到377篇文獻(xiàn),經(jīng)過選擇剔除得到有效文章102篇,其中選擇標(biāo)準(zhǔn)為剔除人物訪談、期刊索引、會議通知、以及主要題錄信息不全面的文章。再對其進(jìn)行質(zhì)量剔除,最終得到67篇有效文獻(xiàn)。其中,質(zhì)量剔除的標(biāo)準(zhǔn)為體現(xiàn)語義出版、增強(qiáng)出版、納米出版物、微型出版物的語義信息。在此基礎(chǔ)上,利用文獻(xiàn)統(tǒng)計(jì)分析法以及對于文獻(xiàn)的期刊分布,作者分布,以及研究前沿?zé)狳c(diǎn)進(jìn)行分析。
三、數(shù)據(jù)分析
(一)文獻(xiàn)年代分布
語義出版的概念自從2009年被提出之后,直到2017年其研究文獻(xiàn)單年度仍處以不斷增加的階段。2011-2017年發(fā)表文章共計(jì)67篇,并且呈現(xiàn)逐年曲線遞增的發(fā)展趨勢,可見其正處于快速發(fā)展時期。從2011年至今,語義出版的相關(guān)文獻(xiàn)日益增多,隨著其研究的質(zhì)與量的增長,其研究也形成了一定的研究規(guī)模,逐步走向正軌。
(二)文獻(xiàn)期刊分布
(1)布拉德福定律驗(yàn)證。與語義出版相關(guān)的期刊主要有中國科技期刊研究、出版科學(xué)、圖書情報(bào)工作、科技與出版、出版發(fā)行研究等刊物。其中除圖書情報(bào)工作外,其他四種刊物收錄內(nèi)容較偏重出版領(lǐng)域,以此來看,語義出版的研究主要集中在出版領(lǐng)域的刊物上。
根據(jù)所檢出的語義出版相關(guān)的文獻(xiàn)分別分布在39種刊物上,對于67篇文章進(jìn)行布拉德福定律的驗(yàn)證。首先,將期刊分為三個區(qū),分別是核心區(qū)、相關(guān)區(qū)、外圍區(qū)。假設(shè)m1,m2,m3分別為三個區(qū)的期刊刊載的論文數(shù),n1,n2,n3分別為三個區(qū)的期刊數(shù)。通過驗(yàn)證,n1:n2:n3=1:4:14.5,得出布拉德福常數(shù)約等于4。其分區(qū)情況如表1。
通過對分區(qū)表的觀察,發(fā)現(xiàn),各分區(qū)論文數(shù)量分別為15,19,33,第三分區(qū)的文獻(xiàn)占得比例較多,反映出目前該領(lǐng)域的研究尚未成熟,大部分文獻(xiàn)較為分散,所以只能說大致符合布拉德福定律。
(2)核心期刊分析。根據(jù)上述分析得出,語義出版領(lǐng)域的核心期刊有中國科技期刊研究和出版科學(xué)兩本期刊,現(xiàn)對他們進(jìn)行影響因子分析。通過中國知網(wǎng)總庫平臺,出版物檢索,對兩種期刊進(jìn)行檢索,得到中國科技期刊研究的復(fù)合影響因子:1.462 綜合影響因子:1.394;出版科學(xué)的復(fù)合影響因子:0.527 綜合影響因子:0.381。
(三)作者分析
通過對作者進(jìn)行分析,得出在此領(lǐng)域較為杰出的作者有曾建勛,彭?,B,任慧玲,周杰以及蘇靜。通過可視化分析這些學(xué)者的合著現(xiàn)象也很普遍,曾建勛和周靜、蘇杰等都曾有過合作,彭?,B與任慧玲屬于獨(dú)著。通過分析,也可以得出,當(dāng)下對于語義出版領(lǐng)域深入研究的作者還是很少,語義出版目前還處于發(fā)展期,在以后的研究中,應(yīng)該會有更多的學(xué)者深入了解該領(lǐng)域,隨著語義出版研究的深入,其合著現(xiàn)象將產(chǎn)生新的變化。
(四)文獻(xiàn)關(guān)鍵詞分析
目前語義出版領(lǐng)域的研究熱點(diǎn)包含語義化、數(shù)字圖書館、領(lǐng)域本體、語義網(wǎng)絡(luò)、出版發(fā)行、學(xué)術(shù)期刊、科技期刊、語義網(wǎng)等相關(guān)領(lǐng)域。這個也反映出語義出版是數(shù)字出版的高級形式,他既有數(shù)字出版的優(yōu)劣勢,也存在著自身的特點(diǎn)——語義化與出版產(chǎn)業(yè)相結(jié)合的成果。目前語義出版的應(yīng)用領(lǐng)域主要集中在學(xué)術(shù)期刊的語義出版,其發(fā)展前景日后也應(yīng)該會涉及到社交媒體以及移動化產(chǎn)品中,使得浩如煙海的數(shù)字資源帶來的信息孤島以及信息迷失等問題可以得到解決。
四、結(jié)語
目前,出版機(jī)構(gòu)、信息服務(wù)商、圖書館等建設(shè)主體正積極開展語義出版實(shí)踐,語義出版也正處于發(fā)展階段,相關(guān)學(xué)者對于語義出版的概念形式、流程步驟、功能效用、標(biāo)準(zhǔn)規(guī)范、技術(shù)方法等問題進(jìn)行了探討。作為數(shù)字出版的高級形式,其發(fā)展的過程必然受到數(shù)字出版的影響,但是其自身的特征,也發(fā)揮著很大的作用。[3]本文通過對文獻(xiàn)發(fā)表年份、領(lǐng)域核心期刊、作者以及關(guān)鍵詞前沿?zé)狳c(diǎn)研究,顯示了數(shù)字時代語義出版的研究現(xiàn)狀,對于語義出版的前景及未來的發(fā)展趨勢進(jìn)行預(yù)測,有助于認(rèn)清語義出版的發(fā)展方向,促進(jìn)其向成熟期過渡,得以健康發(fā)展。
參考文獻(xiàn):
[1]SHOTTON D,PORTWIN K,GRAHAM K,et al. Adventuresin semantic publishing: exemplar semantic enhancements of a re-search article [J]. PLo S Computational Biology, 2009,(4).
[2]許鑫,江燕青,翟姍姍. 面向語義出版的學(xué)術(shù)期刊數(shù)字資源聚合研究[J]. 圖書情報(bào)工作,2016,(17).
[3]徐雷. 語義出版應(yīng)用與研究進(jìn)展[J]. 出版科學(xué),2016,(03).