文/徐萍
隨著互聯(lián)網(wǎng)技術(shù)的高速發(fā)展和普及,數(shù)字化成為科學(xué)論文傳播的一條重要途徑,文獻(xiàn)被引頻次、下載頻次、期刊影響因子、CI指數(shù)等指標(biāo)在評(píng)價(jià)學(xué)術(shù)成果影響力等方面發(fā)揮了重要的作用。下載頻次與被引頻次作為文獻(xiàn)價(jià)值的集中體現(xiàn)方式一直受到學(xué)界的廣泛關(guān)注,有研究提出了利用下載頻次代替被引頻次來(lái)解決引文評(píng)價(jià)中時(shí)間的滯后性問(wèn)題。[1-4]因此,下載頻次有望成為一個(gè)新的考量論文傳播和影響的指標(biāo)。
以往的研究發(fā)現(xiàn)[5-12]:下載頻次與被引頻次(兩年后的)具有較強(qiáng)的相關(guān)性,文獻(xiàn)的被引頻次可以通過(guò)對(duì)應(yīng)的下載頻次進(jìn)行預(yù)測(cè);可以用期刊的前期下載頻次借助回歸方程對(duì)其后期(兩年)的被引頻次進(jìn)行估計(jì);期刊的下載頻次與被引頻次高度正相關(guān),且不是單純的線性相關(guān)關(guān)系。也有不少研究直接對(duì)被引頻次與下載頻次具有高度一致性這一說(shuō)法進(jìn)行否認(rèn),甚至否認(rèn)兩者具有相關(guān)性:Andrew等對(duì)International Journal of Cardiology上2007年下載頻次和被引頻次最高的前25篇論文進(jìn)行比較分析發(fā)現(xiàn),被引頻次與下載頻次并無(wú)明顯的關(guān)系,由此對(duì) “將被引頻次作為評(píng)價(jià)論文影響力的決定性因素”提出了質(zhì)疑;[13]杜秀杰等采用簡(jiǎn)單線性相關(guān)系數(shù)判斷學(xué)術(shù)論文的被引頻次并不是簡(jiǎn)單的與下載頻次成正比。[14]
如果兩者具有較強(qiáng)的相關(guān)性,是否直接可以利用下載頻次對(duì)被引頻次進(jìn)行預(yù)測(cè)呢?有必要對(duì)兩者關(guān)系展開(kāi)進(jìn)一步深入探討。
資料來(lái)源:利用中國(guó)知網(wǎng)“中國(guó)引文數(shù)據(jù)庫(kù)”(http://ref.cnki.net.knsref/index.aspx)的高級(jí)檢索功能(檢索日期為2019年3月1日),在“檢索項(xiàng)”選擇“刊名”,“檢索詞”輸入“西南交通大學(xué)學(xué)報(bào)”,發(fā)布時(shí)間從2014—2018年的EI來(lái)源期刊,檢索學(xué)報(bào)2014—2018年刊登論文的下載和被引用情況,分別按下載頻次和被引頻次從大到小進(jìn)行排序,將文章名、發(fā)表年份、下載頻次、被引頻次等相關(guān)信息導(dǎo)入到excel表格中進(jìn)行數(shù)據(jù)分析。
文章的下載頻次和被引頻次是計(jì)量學(xué)評(píng)價(jià)體系中的兩個(gè)基本指標(biāo),在研究?jī)蓚€(gè)隨機(jī)變量間的相互關(guān)系時(shí),常使用數(shù)理統(tǒng)計(jì)學(xué)中的簡(jiǎn)單線性相關(guān)系數(shù),具體公式為[15,16]
式中:r為簡(jiǎn)單線性相關(guān)系數(shù);n為取樣數(shù)量;xi為被引用頻次;yi為下載頻次。
基于定量分析,探討下載頻次與被引頻次之間的相關(guān)性,利用相關(guān)系數(shù)判別數(shù)據(jù)的相關(guān)性大小,在分析相關(guān)性的基礎(chǔ)上,使用曲線估計(jì)初步確定下載頻次與被引頻次的函數(shù)關(guān)系曲線方程,主要是選出最佳的曲線模型,對(duì)下載頻次與被引頻次進(jìn)行擬合。
表1 被引頻次和下載頻次TOP50論文數(shù)量分布情況 篇
對(duì)《西南交通大學(xué)學(xué)報(bào)》2014—2018年在知網(wǎng)上被引頻次、下載頻次TOP50論文的發(fā)表年份進(jìn)行統(tǒng)計(jì),結(jié)果如表1所示。由表1可知:被引頻次TOP50論文主要集中在2014—2016年,其中,以2014年最多(27篇,占比54%);2015年發(fā)表的論文數(shù)其次(15篇,占比30%);2017年和2018年發(fā)表的論文都沒(méi)有進(jìn)入TOP50。下載頻次TOP50的論文集中在2014—2016年,分別占比32%左右,下載頻次TOP50的論文主要集中在論文發(fā)表后的3~5年。
下載頻次可反映上網(wǎng)論文的擴(kuò)散速率, 是網(wǎng)絡(luò)環(huán)境下期刊傳播效率的一個(gè)新指標(biāo),論文下載量在第一時(shí)間反映了文獻(xiàn)的使用情況,在一定程度上反映了被使用但最終未被引用文獻(xiàn)的價(jià)值,相對(duì)論文被引頻次、下載頻次具有更強(qiáng)的時(shí)效性。
對(duì)《西南交通大學(xué)學(xué)報(bào)》2014—2018年在知網(wǎng)上下載頻次TOP25論文進(jìn)行統(tǒng)計(jì)分析,結(jié)果如表2所示。下載頻次最多的為2015年發(fā)表的論文(4347次),對(duì)應(yīng)的被引頻次為121次,其中,期刊論文和碩士論文的引用居多。下載頻次是2016年發(fā)表的排第二論文的2倍多。
表2 下載前25論文被引情況分析
下載頻次TOP25論文被引頻次和下載頻次相關(guān)性見(jiàn)圖1。相關(guān)系數(shù)R=0.431,關(guān)系式為yi=0.028xi+6.3127。由圖1可知:下載頻次主要集中在500~1000的范圍內(nèi),對(duì)應(yīng)的被引頻次主要集中在60次以下,下載頻次在500~1000次時(shí)和被引頻次擬合度好,高于1000次時(shí)分布比較分散。
具體被引分布情況見(jiàn)圖2。由圖2可知:下載頻次TOP25的論文總被引頻次為854,其中,期刊論文引用412次,占比48.24%;博士論文引用64次,占比7.49%;碩士論文引用351次,占比41.10%;會(huì)議論文引用23次,占比2.69%。
圖1 下載頻次TOP25論文被引頻次和下載頻次相關(guān)性
圖2 下載頻次前25論文被引具體分布情況
對(duì)《西南交通大學(xué)學(xué)報(bào)》2014—2018年在知網(wǎng)上被引頻次TOP25論文進(jìn)行統(tǒng)計(jì)分析,結(jié)果如表3所示。被引頻次最多的為2014年發(fā)表的論文(152次),對(duì)應(yīng)的下載頻次為1459次,其中,期刊論文和碩士論文的引用居多。被引頻次與2015年發(fā)表的排第二的論文相差31次,但下載頻次卻相差了3000次左右。被引頻次TOP25的論文的被引頻次次數(shù)主要集中在20次左右。
被引頻次TOP25論文被引頻次和下載頻次相關(guān)性見(jiàn)圖3。相關(guān)系數(shù)R=0.458 3,關(guān)系式為yi=18.166xi+193.1。具體被引分布情況見(jiàn)圖4。由圖4可知:被引頻次主要集中在20次左右,對(duì)應(yīng)的下載頻次主要集中在500次左右,被引頻次20次左右時(shí)和下載頻次擬合度好,大于20次時(shí)分布比較分散,擬合度差。
表3 被引頻次前25具體數(shù)據(jù)分析
圖3 被引頻次前25論文被引頻次與下載頻次相關(guān)性
圖4 被引頻次前25論文具體被引分散情況
具體被引分布情況見(jiàn)圖4。由圖2可知:被引頻次TOP25的論文總被引頻次為933,其中,期刊論文引用476次,占比51.01%;博士論文引用56次,占比6.00%;碩士論文引用386次,占比41.10%;會(huì)議論文引用25次,占比2.68%。
被引頻次是評(píng)價(jià)學(xué)術(shù)質(zhì)量和影響力的重要指標(biāo), 從下載頻次可以直接看出文獻(xiàn)被讀者使用的情況,反映了論文被關(guān)注的程度, 但是,不是所有的下載都會(huì)被引用。根據(jù)本文的研究結(jié)果, 文章出版后3~5年下載頻次達(dá)到峰值,文章出版后4~5年被引頻次達(dá)到峰值, 而高引用和高下載存在時(shí)間差解釋了高下載和高被引論文年份不對(duì)應(yīng)的現(xiàn)象。
論文下載頻次越高,受讀者關(guān)注的程度越高,被引用的幾率就會(huì)增大,通過(guò)下載頻次直接看出論文被讀者使用的情況,視為對(duì)論文學(xué)術(shù)價(jià)值的先期反映。文獻(xiàn)的被引頻次與其質(zhì)量高度相關(guān),論文被引用意味著研究成果得到發(fā)展或評(píng)價(jià),被引頻次越高,效果越明顯。
人們通常認(rèn)為論文的下載頻次與被引頻次正相關(guān),即文章被下載得越多, 被引頻次也就越高。下載一篇文章后是否引用它要看它的內(nèi)在質(zhì)量。當(dāng)然, 下載頻次與被引頻次之間擁有某些相關(guān)性,但不是完全的線性相關(guān),在一定的下載頻次范圍內(nèi)(本文對(duì)應(yīng)的下載頻次為500~1000次)下載頻次與被引頻次是呈線性相關(guān)的,超過(guò)這個(gè)相關(guān)范圍后被引頻次和下載頻次相關(guān)性不大,所以,不能完全用下載頻次對(duì)后續(xù)的被引頻次進(jìn)行預(yù)測(cè)。