• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      下載次數(shù)與被引次數(shù)的統(tǒng)計(jì)關(guān)系研究

      2010-08-31 11:26:50劉思源劉新新王玲玉譚雙岸
      圖書(shū)館理論與實(shí)踐 2010年9期
      關(guān)鍵詞:直觀次數(shù)變量

      ●郭 強(qiáng),趙 瑾,劉思源,劉新新,王玲玉,譚雙岸

      (1.鄭州大學(xué) 信息管理系,鄭州 450001;2.中國(guó)人民解放軍炮兵學(xué)院 軍事運(yùn)籌教研室,合肥 230031)

      1 引言

      在對(duì)期刊、論文以及作者的學(xué)術(shù)價(jià)值或者是學(xué)術(shù)影響力等進(jìn)行評(píng)價(jià)的過(guò)程中,被引次數(shù)作為一種評(píng)價(jià)指標(biāo)與下載次數(shù)相比會(huì)有其相對(duì)的滯后性,而且如果直接利用被引次數(shù)來(lái)對(duì)文獻(xiàn)的學(xué)術(shù)價(jià)值進(jìn)行評(píng)價(jià),那么對(duì)于研究活動(dòng)中被使用但在最終成果中未被引用的文獻(xiàn)的學(xué)術(shù)價(jià)值,是否需要考慮如何來(lái)進(jìn)行衡量,從而使得期刊、論文等評(píng)價(jià)對(duì)象的該類(lèi)價(jià)值也能夠得到體現(xiàn)。盡管可以采取對(duì)被引次數(shù)進(jìn)行某種數(shù)學(xué)修正,使得修正后的被引次數(shù)能夠包含對(duì)該類(lèi)價(jià)值的估計(jì),但是描述精確性的提高也往往伴隨著計(jì)算復(fù)雜程度的上升,這種復(fù)雜性不僅體現(xiàn)于被引次數(shù)指標(biāo)自身的量化,還可能會(huì)體現(xiàn)在評(píng)價(jià)指標(biāo)體系中各指標(biāo)權(quán)重的確定上。由此,可以考慮將下載次數(shù)引入指標(biāo)體系,一方面,從直觀上,文獻(xiàn)的下載次數(shù)能夠與該文獻(xiàn)被閱讀的次數(shù)呈高度正相關(guān),從而下載次數(shù)可以用來(lái)對(duì)文獻(xiàn)的受利用程度進(jìn)行反映,這樣文獻(xiàn)的被引次數(shù)指標(biāo)就無(wú)需做數(shù)量上的修正,當(dāng)然前提是在網(wǎng)絡(luò)環(huán)境下;另一方面,文獻(xiàn)的下載次數(shù)也可視為對(duì)文獻(xiàn)學(xué)術(shù)價(jià)值的先期反映,從而評(píng)價(jià)可以有所提前。將下載次數(shù)納入指標(biāo)體系時(shí),需要相應(yīng)地賦予其權(quán)重,對(duì)于權(quán)重的確定則需要探討下載次數(shù)自身的性質(zhì),以及與其他指標(biāo)之間的聯(lián)系,這樣對(duì)下載次數(shù)與被引次數(shù)之間的關(guān)系進(jìn)行考察則有一定的實(shí)際意義。另外,下載次數(shù)與被引次數(shù)作為對(duì)期刊、論文等的不同側(cè)面反映,同是考察對(duì)象的基本屬性,同為計(jì)量學(xué)的基本考察指標(biāo),所以對(duì)兩者之間的相互關(guān)系進(jìn)行探討也會(huì)有一定的理論意義。

      對(duì)于下載次數(shù)與被引次數(shù)之間的關(guān)系,已有的研究主要包括對(duì)下載次數(shù)的布拉德福分布考察,期刊的下載次數(shù)、被引次數(shù)以及影響因子相互之間的等級(jí)相關(guān)分析,被引次數(shù)與下載次數(shù)的比較研究,包括對(duì)期刊影響因子與下載影響因子所進(jìn)行的比較研究,[1-3]數(shù)據(jù)來(lái)源為《中國(guó)學(xué)術(shù)期刊網(wǎng)絡(luò)計(jì)量測(cè)試報(bào)告》與《中國(guó)學(xué)術(shù)期刊綜合引證報(bào)告》。本文側(cè)重于闡述下載次數(shù)與被引次數(shù)的對(duì)立與統(tǒng)一。下載次數(shù)與被引次數(shù)的共性源于對(duì)同一評(píng)價(jià)對(duì)象的價(jià)值描述,但是老化規(guī)律的不同、用戶(hù)的行為與偏好以及網(wǎng)絡(luò)環(huán)境等因素會(huì)影響兩者之間的一致性,所造成的這種差異也從總體上反映著種種影響因素之間的相互作用。

      2 經(jīng)驗(yàn)認(rèn)識(shí)

      2.1 總量考察

      可以對(duì)下載次數(shù)與被引次數(shù)的關(guān)系進(jìn)行統(tǒng)計(jì)研究,其前提是將下載次數(shù)與被引次數(shù)均視為隨機(jī)變量,所以?xún)烧叩母怕史植际沁M(jìn)一步對(duì)相互關(guān)系進(jìn)行討論的基礎(chǔ)。假設(shè)以期刊作為考察對(duì)象,由于CNKI鏡像站版對(duì)其所有入庫(kù)期刊按照學(xué)科屬性進(jìn)行了分類(lèi),并且能夠提供各個(gè)期刊的下載次數(shù)與被引次數(shù),所以在這里我們?nèi)詫⑵渥鳛閿?shù)據(jù)來(lái)源,并以基礎(chǔ)科學(xué)類(lèi)期刊為例,得到下載次數(shù)與被引次數(shù)在期刊中的頻次分布,如圖1所示,數(shù)據(jù)統(tǒng)計(jì)時(shí)間為2009年3月,其中坐標(biāo)橫軸為期刊評(píng)價(jià)指標(biāo)的計(jì)量單位的倍數(shù),在此對(duì)于下載次數(shù)與被引次數(shù),計(jì)量單位分別取為50000次與1000次,盡管兩變量的統(tǒng)計(jì)單位有所不同,但是這并不妨礙在圖中對(duì)兩變量的頻次變化趨勢(shì)分別加以描述。

      圖1 基礎(chǔ)科學(xué)類(lèi)期刊按期刊評(píng)價(jià)指標(biāo)的分布圖

      從直觀上,下載次數(shù)與被引次數(shù)這兩個(gè)隨機(jī)變量都不服從正態(tài)分布,而且曲線擬合的結(jié)果分別為y1=79.6365exp(-x/1.7537)-0.1334與y2=42.6188exp(-x/2.1245)+0.7745,判定系數(shù)達(dá)到0.9779與0.9702,其中y1和y2分別為與下載次數(shù)和被引次數(shù)相對(duì)應(yīng)的期刊比重,x為該兩指標(biāo)的計(jì)量單位數(shù),由此能夠有這樣的經(jīng)驗(yàn)認(rèn)識(shí),即下載次數(shù)與被引次數(shù)在期刊中是與負(fù)指數(shù)分布較為吻合,這意味著對(duì)于下載次數(shù)或者是被引次數(shù)相對(duì)較少的期刊,其數(shù)量會(huì)相對(duì)較多,而且由于負(fù)指數(shù)分布的遞減速率在所有初等衰減函數(shù)中為最快,所以?xún)H有很少部分的期刊具有較高的下載頻次或者是被引次數(shù)。例如將期刊按照被引次數(shù)降序排列,所得列表中的前12.31%的期刊與50.21%的被引次數(shù)相對(duì)應(yīng),而后67.39%的期刊卻只對(duì)應(yīng)19.94%的被引次數(shù),這種下載次數(shù)與被引次數(shù)在期刊中的集中與分散狀況也與傳統(tǒng)布拉德福定律的內(nèi)涵相一致,從而所得負(fù)指數(shù)分布也并不違反對(duì)文獻(xiàn)計(jì)量體系的已有經(jīng)驗(yàn)認(rèn)識(shí)。另外還需要檢驗(yàn)所得經(jīng)驗(yàn)結(jié)果是否具有某種一般性,對(duì)鏡像站中其余期刊的經(jīng)驗(yàn)考察顯示,從直觀上,不同學(xué)科屬性的期刊集合均具有類(lèi)似的情形。

      另外,對(duì)于經(jīng)驗(yàn)認(rèn)識(shí)希望能夠作出一定的理論解釋?zhuān)瑥亩岣咚媒Y(jié)果的置信度。若不嚴(yán)格地,第一,在給定的時(shí)間段內(nèi),期刊的下載頻次從直觀上會(huì)具有最可幾的居中取值,也即該時(shí)段內(nèi)的累積期刊下載次數(shù)過(guò)多或過(guò)少的概率都會(huì)相對(duì)較低,而存在概率相對(duì)較大的居中取值或者是取值區(qū)間。第二,泊松分布適合于給定尺度(時(shí)間或空間)中隨機(jī)事件發(fā)生的次數(shù),且參數(shù)λ大于1的泊松分布往往會(huì)在變量取值較為居中的時(shí)候?qū)?yīng)的概率為極大。第三,泊松分布在社會(huì)現(xiàn)象中有其普遍性,從而在這里用泊松分布來(lái)對(duì)給定考察時(shí)段內(nèi)期刊下載次數(shù)的概率分布進(jìn)行描述,即P(ξ=d)=λde-λ/d!,其中 d=0,1,2, …,且λ為正常數(shù)。

      需要指出,泊松分布的產(chǎn)生要求隨機(jī)事件流滿(mǎn)足平穩(wěn)、無(wú)后效以及普通性。對(duì)于期刊而言,新刊用論文能夠在一定程度上抵消由于過(guò)刊論文的老化而對(duì)期刊下載次數(shù)概率分布的影響,所以平穩(wěn)性能夠近似得到保證。第二,如果考察時(shí)長(zhǎng)足夠短,那么期刊下載次數(shù)等于或多于兩次可視為小概率事件,所以普通性也可近似成立。第三,由于從直觀上,下載次數(shù)多的期刊會(huì)更具吸引力,從而會(huì)得到更多的下載次數(shù),會(huì)有馬太效應(yīng)的出現(xiàn),所以如果期刊的前期下載次數(shù)較多,則后期得到的下載次數(shù)可能也會(huì)相應(yīng)較多,這樣就很難保證無(wú)后效性的近似成立,由此需要對(duì)下載次數(shù)服從的概率分布進(jìn)行改進(jìn)。

      由于泊松分布的期望值為λ,該取值應(yīng)與該期刊自身的學(xué)術(shù)價(jià)值、期刊論文網(wǎng)絡(luò)獲取的便捷程度以及期刊所屬學(xué)科的發(fā)展階段等客觀因素相對(duì)應(yīng),設(shè)λm為所有樣本期刊的下載次數(shù)期望值的最大值,如果考慮后效性,則應(yīng)有期刊的下載次數(shù)為d’=ξ+αexp[-(λm-λi)],其中λi為第i份期刊下載次數(shù)的期望值,且a為正常數(shù),由此,對(duì)于下載次數(shù)期望值越大的期刊,其(λm-λi)值也相應(yīng)地越小,于是由后效性所帶來(lái)的下載次數(shù)的增加也就越大,從而能夠?qū)︸R太效應(yīng)加以體現(xiàn)。由該式可得d’的數(shù)學(xué)期望為E(d’)=λi+α exp[-(λm-λi)],所以當(dāng)(λm-λi)很小時(shí),相應(yīng)期刊下載次數(shù)的期望值會(huì)很大,而當(dāng)(λm-λi)增大時(shí),由于負(fù)指數(shù)函數(shù)的關(guān)系,期望值會(huì)下降得很快,從而會(huì)有較多的期刊,其下載次數(shù)的期望值相對(duì)較小。

      圖2 考慮后效性的期刊下載次數(shù)期望值與(λmλi)的關(guān)系圖

      圖2描述了E(d’)隨(λm-λi)的變化情況,各參數(shù)取值分別為λm=24以及a=12,如此取值的目的是使期刊下載次數(shù)的期望值E(d’)能夠與圖1中下載次數(shù)的變化范圍相一致,一方面是由于圖1中的數(shù)據(jù)為下載次數(shù)的實(shí)際情況,另一方面也有利于相互比較。在圖2中,從直觀上,較少部分期刊的下載次數(shù)期望值會(huì)相對(duì)較大,而期望值相對(duì)較小的期刊,其數(shù)量則相對(duì)較多,而這與圖1中實(shí)際的期刊百分比隨期刊下載次數(shù)的變化趨勢(shì)是相吻合的,所以對(duì)于負(fù)指數(shù)分布能夠通過(guò)引入馬太效應(yīng)來(lái)進(jìn)行一定程度的解釋。但是應(yīng)當(dāng)指出,這種建立于圖2的直觀判斷還并不充分,畢竟在曲線的居中部分,其衰減速率并未達(dá)至負(fù)指數(shù)分布的程度,這意味著還需考慮其他的下載次數(shù)影響因素以作進(jìn)一步的探討。

      另外,下載次數(shù)或是被引次數(shù)等評(píng)價(jià)指標(biāo)的分布狀況從直觀上會(huì)具有其復(fù)雜性,從而負(fù)指數(shù)分布未必會(huì)成為這些評(píng)價(jià)指標(biāo)的唯一表現(xiàn)形式。盡管經(jīng)驗(yàn)考察具有直觀性?xún)?yōu)勢(shì),但是所得到的負(fù)指數(shù)分布畢竟只是對(duì)樣本特征的描述,那么研究總體是否具有相類(lèi)似的性質(zhì),還需進(jìn)行顯著性檢驗(yàn),更何況經(jīng)驗(yàn)考察面對(duì)普遍性規(guī)律的探求會(huì)有其方法上的局限性,下載次數(shù)與被引次數(shù)實(shí)際所服從的分布規(guī)律是評(píng)價(jià)對(duì)象自身的學(xué)術(shù)價(jià)值、學(xué)科的屬性與進(jìn)展、用戶(hù)行為、網(wǎng)絡(luò)環(huán)境等諸多影響因素相互作用的縮影與反映,對(duì)于下載次數(shù)或者是被引次數(shù)等評(píng)價(jià)指標(biāo)的規(guī)律性認(rèn)識(shí),模型的構(gòu)建會(huì)是可取的解釋性方法之一。

      對(duì)于由經(jīng)驗(yàn)考察所得到的這種負(fù)指數(shù)分布尚需做進(jìn)一步的探討,但是該結(jié)果在一定程度上仍可作為一種依據(jù),來(lái)說(shuō)明如果采用簡(jiǎn)單相關(guān)分析來(lái)考察評(píng)價(jià)指標(biāo)相互之間的統(tǒng)計(jì)相關(guān)性,則需要考察方法的適用性,其原因是由于簡(jiǎn)單相關(guān)分析往往要求被考察的變量均須服從正態(tài)分布,那么對(duì)于非正態(tài)分布的情形而言,等級(jí)相關(guān)分析則較為合適。[1,3]

      下載次數(shù)與被引次數(shù)之間的關(guān)系是兩者同一性與差異性的對(duì)立與統(tǒng)一,為了更好地體現(xiàn)這種同一性,可以考察下載次數(shù)與其他評(píng)價(jià)指標(biāo)之間的相關(guān)性,以便作為參照,這樣在圖1中也給出了基礎(chǔ)科學(xué)類(lèi)期刊的載文量以及期刊影響因子在期刊中的頻次分布,目的也是希望能夠?qū)υ搩芍笜?biāo)的概率分布進(jìn)行大致的描述,數(shù)據(jù)統(tǒng)計(jì)時(shí)間同上,并且對(duì)于影響因子以及載文量,計(jì)量單位分別取為0.05和360篇。在圖1中,期刊載文量以及期刊影響因子的分布均具有一定的單峰性,且由曲線擬合所得到的方程為y3=11.2178exp[-(x-5.3402)2/24.1304]以及y4=1148.1398/[4(x-4.9697)2+148.6732],判定系數(shù)分別是0.9400與0.9394,其中y3和y4為與載文量以及影響因子這兩個(gè)指標(biāo)相對(duì)應(yīng)的期刊百分比,x仍為指標(biāo)的計(jì)量單位數(shù)。對(duì)于單峰性的成因,如果從直觀上理解,可以是在一般情況下載文量或是影響因子過(guò)大或者過(guò)小的期刊,其數(shù)量可能都會(huì)相對(duì)較少。另外還注意到該兩指標(biāo)所服從的這種分布在指標(biāo)取值偏低處,與偏高處相比,期刊的百分比相對(duì)較高,這與期刊整體的實(shí)際情況也較相符合,而指標(biāo)值偏高區(qū)域的慢衰減性也在一定程度上反映著期刊整體的發(fā)展以及期刊價(jià)值的提升。對(duì)于期刊而言,選取以上四個(gè)指標(biāo)進(jìn)行比較的原因是由于這些指標(biāo)能夠從外部較為全面地反映期刊的價(jià)值或者是影響力,[2]也即這些指標(biāo)具有一定的完備性,從該角度,其他評(píng)價(jià)指標(biāo)可不參與比較。另外,這些指標(biāo)相互之間也具有明顯的內(nèi)涵差異,從而可以用來(lái)進(jìn)行兩兩比較,以顯現(xiàn)下載次數(shù)與被引次數(shù)的相關(guān)程度。

      仍然以CNKI鏡像站版中的入庫(kù)期刊作為樣本集。由于各個(gè)期刊均有與之對(duì)應(yīng)的上述四項(xiàng)指標(biāo)值,所以可以得到其中任意兩個(gè)指標(biāo)的隨機(jī)樣本對(duì),對(duì)各變量的取值分別由小到大進(jìn)行編秩,則能夠計(jì)算該兩指標(biāo)的等級(jí)相關(guān)系數(shù)并做直線相關(guān)關(guān)系的顯著性檢驗(yàn),所得結(jié)果如圖3所示。

      圖3 期刊評(píng)價(jià)指標(biāo)的等級(jí)相關(guān)系數(shù)(基礎(chǔ)科學(xué)類(lèi)期刊)

      在圖3中1、2、3、4分別代表期刊的載文量、影響因子、被引次數(shù)以及下載次數(shù),星號(hào)表示在0.01水平下括號(hào)內(nèi)的兩個(gè)變量為顯著直線相關(guān)。另外,圖中的指標(biāo)對(duì)如果不包含影響因子,則考察的期刊樣本數(shù)量為739份,否則數(shù)量為676份,這是由于部分期刊的影響因子數(shù)據(jù)未能得到??梢宰⒁獾匠ジ髯兞颗c其自身的相關(guān)性之外,與其余指標(biāo)對(duì)相比,被引次數(shù)與下載次數(shù)之間具有較高的等級(jí)相關(guān)系數(shù),但是需要考察這種直觀印象的一般性,以期在一定程度上消除原始數(shù)據(jù)中的隨機(jī)因素,況且對(duì)于該數(shù)據(jù)集以及所涉及的基礎(chǔ)科學(xué)類(lèi)期刊而言,影響因子與被引次數(shù)、載文量與下載次數(shù)之間的相關(guān)系數(shù)也都相對(duì)較高,為此對(duì)各指標(biāo)的相關(guān)程度按照不同的學(xué)科屬性分別進(jìn)行了考察,結(jié)果如圖4所示。

      圖4 期刊評(píng)價(jià)指標(biāo)的等級(jí)相關(guān)系數(shù)

      在圖4中,各標(biāo)號(hào)的含義與圖3相同,從直觀上,期刊的被引次數(shù)與下載次數(shù)之間較高的相關(guān)系數(shù)在不同的學(xué)科屬性條件下均能得到保持,與其他的指標(biāo)對(duì)相比,其相關(guān)系數(shù)的平均值處于前列,且方差較小。另外,影響因子與被引次數(shù)的相關(guān)程度也相對(duì)較高,方差也偏低,畢竟期刊的影響因子是由期刊的被引次數(shù)計(jì)算得來(lái)的,所以這兩個(gè)指標(biāo)之間的密切相關(guān)是自然的。而對(duì)于下載次數(shù)與被引次數(shù),同為對(duì)期刊價(jià)值的描述是兩者高度相關(guān)的基礎(chǔ),這種變量變化的同步性是兩者同一性的表現(xiàn),從直觀上理解,期刊的下載頻次越高,其受利用的程度也就相對(duì)越高,從而在研究活動(dòng)的最終成果中被引用的可能性也就越大;反之,如果期刊的被引次數(shù)越高,則期刊信息受傳播的范圍可能也就越為廣泛,所以被下載的機(jī)會(huì)也就相對(duì)越多。兩變量之間的這種高度相關(guān)性也是利用下載次數(shù)來(lái)研究被引次數(shù)的基礎(chǔ)。既然后者與前者相比有一定的滯后性,那么就可以嘗試通過(guò)下載次數(shù)來(lái)對(duì)被引次數(shù)進(jìn)行預(yù)測(cè),從而使得科學(xué)評(píng)價(jià)得以進(jìn)一步提前。但是事實(shí)上往往會(huì)面臨著與這種同步性不相符合的情形,例如存在期刊的下載次數(shù)很高但卻僅具有較少的被引頻次,[1]再注意到如果期刊的被引次數(shù)較高,則通常會(huì)有較多的下載頻次與該期刊相對(duì)應(yīng),那么下載次數(shù)與被引次數(shù)之間的互逆性就可能得不到滿(mǎn)足,這種非同步以及非互逆情形也是兩個(gè)指標(biāo)之間差異性的體現(xiàn)。對(duì)于兩者間關(guān)系的探討需要以直觀認(rèn)識(shí)作為基礎(chǔ),但是直觀認(rèn)識(shí)也能夠從側(cè)面反映出兩者之間的關(guān)系可能并不顯然。

      對(duì)于下載次數(shù)與被引次數(shù)的差異性探討,選取期刊樣本集合同上,將同一學(xué)科屬性的各個(gè)期刊按照其被引頻次降序排列,并用下載次數(shù)與被引次數(shù)的比值來(lái)表征該兩個(gè)指標(biāo)之間的差異,[1-2]則每份期刊均有與其對(duì)應(yīng)的序號(hào)與比值,從而對(duì)于給定的樣本集能夠得到該比值與期刊序號(hào)的關(guān)系,如圖5所示。

      圖5 基礎(chǔ)科學(xué)類(lèi)期刊的下載次數(shù)與被引次數(shù)之比隨期刊序號(hào)的變化關(guān)系

      圖6 下載次數(shù)與被引次數(shù)之比隨期刊序號(hào)的變化關(guān)系(取自圖5)

      圖5以基礎(chǔ)科學(xué)類(lèi)期刊為例,經(jīng)過(guò)檢驗(yàn),對(duì)于其他的學(xué)科屬性也有類(lèi)似的情形,即在期刊序號(hào)偏低或是期刊被引次數(shù)偏高的區(qū)域,下載次數(shù)與被引次數(shù)的比值變化相對(duì)較為穩(wěn)定,這意味著隨著被引頻次的增加(降低),期刊的下載次數(shù)也會(huì)逐漸增多(減少),從而兩個(gè)指標(biāo)變化的同步性可以較好地得到保證。所以直觀上,當(dāng)期刊的被引次數(shù)偏高時(shí),期刊下載次數(shù)與被引次數(shù)的相關(guān)性能夠體現(xiàn)。圖6是圖5在期刊序號(hào)小于等于300時(shí)的截圖,其中比值超過(guò)30的期刊比例僅為5%,除了這些少量的特例外,指標(biāo)比值能夠維持在較平穩(wěn)的狀態(tài),且剔除特例后的均值與標(biāo)準(zhǔn)差分別為12.2886和5.7113。隨著期刊被引次數(shù)的減少,從期刊序號(hào)300起直至末尾的733,指標(biāo)比值的震蕩幅度逐漸變大,且變化趨向不穩(wěn)定,以致在被引次數(shù)偏低的區(qū)域600至700處,被引次數(shù)規(guī)則遞減,但是指標(biāo)比值卻并不隨之規(guī)則變化,這意味著比值的分子也即期刊的下載次數(shù),其變化亦不規(guī)則,從而能夠有這樣的經(jīng)驗(yàn)認(rèn)識(shí):即在期刊序號(hào)偏高的區(qū)域,被引次數(shù)與下載次數(shù)之間缺乏變化的同步性,或者是兩者相關(guān)性較弱的一種體現(xiàn),類(lèi)似地有在期刊序號(hào)600至733處,指標(biāo)比值的均值與標(biāo)準(zhǔn)差分別是485.1708和965.6124。同時(shí)也注意到在被引次數(shù)偏高的區(qū)域,指標(biāo)比值相對(duì)較低,而在期刊序號(hào)偏高處,指標(biāo)比值則相對(duì)較高,這說(shuō)明當(dāng)期刊的被引頻次偏低時(shí),對(duì)應(yīng)的下載次數(shù)卻相對(duì)較高,從而是從數(shù)值角度反映了期刊下載次數(shù)與被引次數(shù)在后者偏低時(shí)的弱相關(guān)。

      2.2 分布考察

      以上是希望從變量的總量出發(fā)來(lái)對(duì)下載次數(shù)與被引次數(shù)之間的同一性與差異性進(jìn)行考察,那么從變量分布的角度,兩變量之間的辯證關(guān)系是否仍然能夠得到體現(xiàn)。首先可以利用圖1來(lái)對(duì)下載次數(shù)與被引次數(shù)在期刊中的概率分布進(jìn)行比較,從直觀上,并以其他的指標(biāo)對(duì)作為參照,下載次數(shù)與被引次數(shù)的分布狀況依然能夠保持較高的同步性,經(jīng)過(guò)計(jì)算,該兩變量概率分布之間的相關(guān)系數(shù)為0.9724,略高于期刊載文量與影響因子之間的0.9156,其余變量對(duì)的相關(guān)系數(shù)則均不超過(guò)0.5005,這些與圖1的直觀表象相吻合。如前所述,載文量與影響因子間所表現(xiàn)出來(lái)的這種強(qiáng)相關(guān)性應(yīng)屬自然,從而能夠從側(cè)面反映期刊下載次數(shù)與被引次數(shù)之間較高的內(nèi)在關(guān)聯(lián)程度。另外還可考察此類(lèi)相關(guān)系數(shù)隨指標(biāo)值增加的變化情況,假設(shè)取周期為10個(gè)計(jì)量單位,則能夠得到下載次數(shù)與被引次數(shù)的移動(dòng)相關(guān)系數(shù)曲線,如圖7所示。

      圖7 下載次數(shù)與被引次數(shù)的移動(dòng)相關(guān)系數(shù)

      在圖7中,坐標(biāo)的橫軸為各移動(dòng)周期的起始計(jì)量單位數(shù),能夠注意到隨著變量取值的逐漸增加,對(duì)于下載次數(shù)與被引次數(shù)的概率分布而言,兩者之間的相關(guān)系數(shù)呈現(xiàn)遞減趨勢(shì),究其原因是由于當(dāng)變量取值增加時(shí),下載次數(shù)與被引次數(shù)的概率分布或者是期刊百分比的遞減速率會(huì)有所不同。與下載次數(shù)相比,被引次數(shù)在期刊中的分布相對(duì)較為集中,大量期刊的被引頻次處于較低水平,具有高被引頻次的僅為少量期刊,所以對(duì)于被引次數(shù)較低的期刊,其所占的期刊百分比處于較高水平,而下載次數(shù)在期刊中的分布則相對(duì)較為分散,會(huì)有更多比例的期刊具有相對(duì)較高的下載次數(shù)。相應(yīng)地,由于總比例為1,所以下載次數(shù)偏低的期刊也會(huì)有所減少,由此期刊百分比隨下載次數(shù)的變化曲線會(huì)相對(duì)較為平坦,于是隨著被引次數(shù)與下載次數(shù)的逐漸增加,兩組期刊百分比的變化情況也會(huì)逐漸顯得不同步,從而相關(guān)系數(shù)呈現(xiàn)為遞減趨勢(shì),特別是在變量取值偏高的區(qū)域,對(duì)于按照被引次數(shù)得到的期刊百分比曲線,其變化已不明顯,而按下載次數(shù)的百分比曲線仍然呈下降趨勢(shì),以致在此兩者之間的相關(guān)系數(shù)減至最低。

      對(duì)于會(huì)有更多比例的期刊具有相對(duì)較高的下載次數(shù),第一,由于圖6所顯示的下載次數(shù)與被引次數(shù)在低被引頻次區(qū)域處的弱相關(guān)性,原本被引次數(shù)較少的期刊,其下載次數(shù)可能會(huì)相對(duì)較高;第二,文獻(xiàn)資源的數(shù)字化以及網(wǎng)絡(luò)化所帶來(lái)的便捷性使得原本被引次數(shù)較少的期刊能夠獲得更多的關(guān)注;第三,資源的網(wǎng)絡(luò)化使得期刊集合的下載以及被引用的程度都能夠得以提升。作者在調(diào)研過(guò)程以及后續(xù)的科研活動(dòng)中對(duì)所需文獻(xiàn)往往會(huì)通過(guò)基礎(chǔ)文獻(xiàn)的參考文獻(xiàn)來(lái)進(jìn)行追蹤,除非對(duì)研究領(lǐng)域有一定的了解,則在傳統(tǒng)環(huán)境下通常會(huì)有部分的文獻(xiàn)處于檢索的盲區(qū),資源的數(shù)字化與網(wǎng)絡(luò)化不僅能夠?qū)Υ擞兴倪M(jìn),還能夠帶來(lái)文獻(xiàn)獲取的便捷性,以及提高對(duì)文獻(xiàn)間相互關(guān)系進(jìn)行考察的效率,由此可以進(jìn)一步擴(kuò)大文獻(xiàn)集或是期刊集的下載與被引程度。但是需要指出,下載次數(shù)更多地是與期刊的受利用程度相對(duì)應(yīng),而作者在最終成果中所引用的期刊往往只是其在科研活動(dòng)中利用過(guò)的期刊的一部分,所以與被引次數(shù)相比,下載次數(shù)在期刊集合中的分布狀況總是會(huì)顯得相對(duì)分散,從而與被引次數(shù)相比,下載次數(shù)較多的期刊數(shù)量會(huì)相對(duì)較多。

      還需要說(shuō)明的是,上述這種比較有其粗糙性,畢竟以上對(duì)各指標(biāo)或變量所選取的計(jì)量單位有所不同,如此直接進(jìn)行比較,只是為了能夠得到大致的經(jīng)驗(yàn)認(rèn)識(shí)。實(shí)際上由這種粗糙性所造成的后果在圖1中已經(jīng)有所顯現(xiàn),例如應(yīng)當(dāng)是按被引次數(shù)得到的曲線會(huì)相對(duì)陡峭,而下載次數(shù)曲線則會(huì)相對(duì)較為平坦。造成該結(jié)果的原因是由于各指標(biāo)計(jì)量單位的選取具有一定的隨意性,或者說(shuō)還需要對(duì)各計(jì)量單位相互之間的具體對(duì)應(yīng)關(guān)系作進(jìn)一步的探討,在這里沒(méi)有作出修正是因?yàn)檫€沒(méi)有妨礙到上述對(duì)兩類(lèi)期刊百分比曲線所進(jìn)行的定性比較與解釋。

      3 結(jié)束語(yǔ)

      除了概率分布,下載次數(shù)與被引次數(shù)在期刊中的布拉德福分布狀況也可以成為考察兩者對(duì)立與統(tǒng)一的組成部分,類(lèi)似地可以進(jìn)行差異性與統(tǒng)一性的經(jīng)驗(yàn)探討,結(jié)合相應(yīng)的期刊累積百分比以及布拉德福常數(shù),能夠使得這類(lèi)考察更具嚴(yán)格性。盡管不同的布拉德福常數(shù)的確有大小之分,但是從統(tǒng)計(jì)的角度兩者的差異是否足夠顯著,例如,如果數(shù)值大小的絕對(duì)差異是由原始數(shù)據(jù)的隨機(jī)性等因素所造成,那么是否可以認(rèn)為兩者實(shí)質(zhì)上并無(wú)明顯不同,從而同一性能夠得以體現(xiàn)。由此需要從統(tǒng)計(jì)的角度來(lái)考察下載次數(shù)與被引次數(shù)之間的關(guān)系,特別是對(duì)兩者間同一與差異的程度進(jìn)行度量??梢允紫炔扇〉氖菍⑾螺d次數(shù)與被引次數(shù)的樣本空間分別進(jìn)行標(biāo)準(zhǔn)化處理,并在此基礎(chǔ)上對(duì)隨機(jī)變量的特征量包括均值以及標(biāo)準(zhǔn)差等之間的差異分別進(jìn)行顯著性檢驗(yàn),這樣做的目的是希望對(duì)下載次數(shù)與被引次數(shù)之間的對(duì)立與統(tǒng)一,乃至兩者之間的相互關(guān)系進(jìn)行量化,從而為期刊以及論文等評(píng)價(jià)指標(biāo)體系中指標(biāo)權(quán)重的確定建立基礎(chǔ)。

      [1]張洋.期刊Web下載總頻次的布拉德福分布研究[J].圖書(shū)情報(bào)知識(shí),2006(6):38-42,60.

      [2]萬(wàn)錦堃,等.期刊論文被引用及其Web全文下載的文獻(xiàn)計(jì)量分析[J].現(xiàn)代圖書(shū)情報(bào)技術(shù),2005(4):58-62.

      [3]龐景安.中文科技期刊下載計(jì)量指標(biāo)與引用計(jì)量指標(biāo)的比較研究[J].情報(bào)理論與實(shí)踐,2006,29(1):44-48.

      猜你喜歡
      直觀次數(shù)變量
      機(jī)場(chǎng)航站樓年雷擊次數(shù)計(jì)算
      2020年,我國(guó)汽車(chē)召回次數(shù)同比減少10.8%,召回?cái)?shù)量同比增長(zhǎng)3.9%
      抓住不變量解題
      數(shù)形結(jié)合 直觀明了
      一類(lèi)無(wú)界算子的二次數(shù)值域和譜
      也談分離變量
      簡(jiǎn)單直觀≠正確
      根據(jù)計(jì)數(shù)單位 直觀數(shù)的大小
      依據(jù)“次數(shù)”求概率
      幾何直觀,相時(shí)而動(dòng)有講究
      沙雅县| 城市| 平山县| 新兴县| 阳曲县| 乐平市| 康乐县| 元江| 泗水县| 通州区| 新乐市| 镇沅| 高唐县| 酒泉市| 马鞍山市| 丽江市| 西乡县| 聂荣县| 宁南县| 巴中市| 犍为县| 崇州市| 大悟县| 鹤庆县| 梓潼县| 兴业县| 乌兰察布市| 东台市| 商河县| 万安县| 连江县| 云霄县| 马鞍山市| 富宁县| 平邑县| 招远市| 南昌市| 平江县| 上饶县| 沛县| 策勒县|