■張學(xué)梅
蘇州市職業(yè)大學(xué)圖書(shū)館,蘇州致能大道106號(hào) 215011,E-mail:phygreen@hotmail.com
影響因子(impact factor,簡(jiǎn)稱(chēng)IF)最早由加菲爾德于1955年提出,最初目的是為科學(xué)家進(jìn)行科研活動(dòng)檢索參考文獻(xiàn)提供一種新途徑[1]。1972年,加菲爾德又提出被引量能夠反映出一種期刊的重要性大小,但同時(shí)也指出,有一些期刊,盡管很少被引用但卻同樣非常重要[2]。此后,影響因子概念在學(xué)術(shù)界逐漸流行開(kāi)來(lái),不但成為評(píng)價(jià)科技期刊的一種重要指標(biāo),還被廣泛用于科學(xué)家個(gè)人、科研機(jī)構(gòu)等對(duì)象的評(píng)價(jià)之中,成為眾多科學(xué)家研究的熱點(diǎn)課題之一[3]。而對(duì)影響因子的效用,人們褒貶不一,許多科學(xué)家認(rèn)為影響因子具有各種局限性,如:影響因子只適用于評(píng)價(jià)期刊整體而不適用于評(píng)價(jià)單篇論文[4]、不能跨學(xué)科進(jìn)行期刊評(píng)價(jià)[5]、在某些特定學(xué)科領(lǐng)域中無(wú)法發(fā)揮評(píng)價(jià)效果[6,7]等等。為了克服影響因子的上述不足,很多新的理論和方法被提出來(lái)以試圖代替或修正期刊影響因子[8-10]。如:Kuo和Rupe為能夠消除期刊的短期表現(xiàn),提出可靠性影響因子,即 R-影響因子[10]。 最近,Patricia等人[11]為解決期刊影響因子對(duì)某一種期刊的評(píng)價(jià)可能存在短期內(nèi)產(chǎn)生分?jǐn)?shù)變化過(guò)大這一局限性,提出了基于貝葉斯理論的后驗(yàn)影響因子(即IFPI)。由于R-影響因子僅考慮到某一年期刊的影響因子JIF和表示較長(zhǎng)時(shí)間的數(shù)據(jù)-被引半衰期,卻沒(méi)有考慮相鄰年份期刊JIF數(shù)據(jù),而后驗(yàn)影響因子IFPI雖考慮了的期刊相鄰年份的JIF,但沒(méi)有考慮較長(zhǎng)時(shí)間內(nèi)期刊的數(shù)據(jù)。
綜上所述,傳統(tǒng)影響因子JIF只考慮期刊短期內(nèi)(2年)的數(shù)據(jù)、R-影響因子沒(méi)有考慮相鄰年份期刊JIF數(shù)據(jù)以及基于貝葉斯理論的后驗(yàn)影響因子IFPI沒(méi)有考慮較長(zhǎng)時(shí)間內(nèi)期刊的數(shù)據(jù)。為降低以上因子容易受到人為因素控制這一現(xiàn)象,本文將結(jié)合Kuo和Patricia等人的理論,提出一種既包含可靠性影響因子(R-影響因子),又包含基于貝葉斯統(tǒng)計(jì)理論的先驗(yàn)影響因子的新影響因子,即R-后驗(yàn)影響因子。本文首先簡(jiǎn)單介紹R-后驗(yàn)影響因子的原理,為檢驗(yàn)該影響因子的適用性,對(duì)物理學(xué)領(lǐng)域34種JIF≥3.0高質(zhì)量期刊進(jìn)行了實(shí)證研究,結(jié)果證明此影響因子對(duì)評(píng)價(jià)同一領(lǐng)域的期刊具有適用性。
這里z(z≥2)表示計(jì)算過(guò)程中所選引文窗口的大小(一般為2年或5年,相應(yīng)表示2年影響因子或5年影響因子),ny表示第y年之前z年內(nèi)(即{y-z,...,y-1})期刊刊載的論文總量,nc,y表示這 ny篇論文在第y年中獲得的總被引量。
根據(jù)Kuo和Rupe等人定義的R-影響因子[10]可表示為:
設(shè)由JCR收錄的期刊在{y-z,...,y-1}年間發(fā)表的全部論文組成樣本Ω,隨機(jī)變量X:Ω→Z+,ω→X(ω)=x,即某一篇論文ω在第y年間獲得的總被引量;為研究方便,進(jìn)一步設(shè)定x大小依賴(lài)于該篇論文所刊載的期刊“質(zhì)量”,定義為該篇論文發(fā)表在“質(zhì)量”為θ(為一未知量,本文中指JIF值)期刊上,且在第y年得到x次引用的概率。因期刊影響因子概率分布一般呈指數(shù)分布[12],于是可設(shè)隨機(jī)變量X在(θ0,θ)1?{θ∈R:aθ2+bθ+c和g()θ>0}區(qū)間內(nèi)指數(shù)型概率密度函數(shù)的一般表達(dá)式為,其中g(shù)()θ和h()θ是滿足以下條件連續(xù)可微的實(shí)數(shù)函數(shù):[12]
設(shè)樣本 Xi={x1, ..., xny},i∈ JCR,xi為第i種期刊在{y-z,...,y-1}年之內(nèi)發(fā)表的論文在第y年獲得的總被引量,則于是基于樣本Xi的似然函數(shù):
若選用參數(shù)θ的先驗(yàn)概率為
πQ()θ表示以前的可靠度;隨機(jī)變量Q:JCR→R+,Q(i) =θ表示期刊i的質(zhì)量指標(biāo)為θ,它描述某篇論文的被引量。其中α>3a(本文中a=0)且則后驗(yàn)概率
第二天下午,顏真卿又來(lái)方便時(shí),抱著竹樹(shù)搖頭晃腦沉思入廁,竹根全斷,竹子一松,他自己是猝不及防,破茅而出,直墜水潭,好容易一個(gè)千金墜定住身形,那邊東方宇軒剛好路過(guò),慌忙將鞋襪皆濕的一代文曲星拉上來(lái)。
根據(jù) Chen等人的結(jié)論[13],可得到:
為便于與傳統(tǒng)期刊影響因子JIF進(jìn)行比較,需定義兩個(gè)新的影響因子分別為先驗(yàn)影響因子(prior impact)IFPO和后驗(yàn)影響因子 (posterior impact)
聯(lián)立方程(1)、(9) 和(10),得后驗(yàn)影響因子IFPI:
聯(lián)立方程(2)、(11)和(12),可得R-后驗(yàn)影響因子 RIFPI:
從公式(11)和(13)不難發(fā)現(xiàn)期刊后驗(yàn)影響因子IFPI和R-后驗(yàn)影響因子RIFPI是明顯不同的。期刊后驗(yàn)影響因子IFPI只涉及期刊2年的JIF,而R-后驗(yàn)影響因子RIFPI包含兩個(gè)元素:期刊影響因子JIF和描述期刊論文長(zhǎng)期影響力的被引半衰期T0.5。
為檢驗(yàn)R-后驗(yàn)影響因子RIFPI在期刊評(píng)價(jià)中的效果,選取2012年6月湯森路透公司發(fā)布的2011年度期刊引證報(bào)告(JCR)中JIF≥3.0的物理學(xué)領(lǐng)域34種科技期刊為研究對(duì)象,并將它們按2011年影響因子值排列,結(jié)果如表1所示。
表1 34種物理類(lèi)期刊各參量及名次變化對(duì)比情況
為了更好說(shuō)明R-后驗(yàn)影響因子RIFPI在期刊評(píng)價(jià)中的作用,首先分析了基于貝葉斯理論的后驗(yàn)影響因子IFPI。從表1中不難發(fā)現(xiàn),后驗(yàn)影響因子IFPI方程(11)反映出信息量(如,發(fā)文量)越大,與先驗(yàn)信息相比現(xiàn)在的JIF也越大。在這種條件下,對(duì)于那些刊載大量論文的高質(zhì)量期刊,如Phys Rev B(n2011=6121, A=0.99578) 和 Appl Phys Lett(n2011=4419,A=0.97874),這種方法效果顯著。
然而,還有一些期刊,盡管它們刊載的論文量足夠大,但其可靠度因子卻很低,如Classical Quant Grav(n2011=456,A=0.39117),出現(xiàn)這種狀況的原因是在過(guò)去兩年間的先驗(yàn)影響力具有很小的變量。由于此期刊在過(guò)去連續(xù)三年內(nèi)的JIF幾乎未發(fā)生顯著變化(分別為3.32,3.098和 3.029),說(shuō)明假定的先驗(yàn)影響力是正確的。
從表1第七列,還可以發(fā)現(xiàn)以后驗(yàn)影響因子IFPI大小進(jìn)行排序時(shí),名次降低的期刊(2種)和名次提高的期刊(3種)相差并不多,例如,Classical Quant Grav(A=0.39117)降低2名(從第29名降至31名)和Laser Phys(A=0.9912)名次降低1名(從第25名降至第26名)。名次提高的期刊分別是 Opt Express(A=0.98959)、Phys Rev C(A=0.93386) 和Comput Phys Commun (A=0.92139),均提高1名。以上期刊均表現(xiàn)出一種異常狀態(tài),它們?cè)谶^(guò)去幾年內(nèi)JIF值起伏較大,后驗(yàn)影響因子IFPI在一定程度上能夠消除這種陡變情況。
為了便于直觀對(duì)IFPI和JIF進(jìn)行比較,將它們進(jìn)行作圖(圖1)。由于IFPI是一些離散點(diǎn)所組成,故對(duì)其進(jìn)行線性擬合,擬合方程為IFPI=0.00729+0.9897×JIF,擬合表達(dá)式中常數(shù)項(xiàng)非常小,接近于零,而比例項(xiàng)接近于1,說(shuō)明IFPI與JIF之間存在非常顯著的線性關(guān)系,即IFPI既保留了JIF特性,又具獨(dú)特的一面,能夠部分消除期刊影響因子的突變情況。換句話也就是說(shuō)那些JIF波動(dòng)較大(即兩年JIF相差的絕對(duì)值較大)的期刊相應(yīng)偏離擬合曲線較遠(yuǎn),可靠度也相應(yīng)較??;可靠度較高期刊的偏離擬合曲線較近。如圖中期刊Crit Rev Solid State偏離曲線較遠(yuǎn),它的可靠度只有而其它期刊兩種排序發(fā)生變化時(shí),ΔJIF<3,故沒(méi)有以上兩種期刊偏離程度之遠(yuǎn)??煽慷纫蜃咏咏?的期刊未發(fā)生顯著變化,這主要是因研究的樣本期刊均為JIF>3.0的高質(zhì)量期刊。
圖1 IFPI隨JIF相對(duì)變化情況
圖2 34種JIF〉3.0物理學(xué)期刊RIFPI隨JIF變化情況
最近,R-因子被用到研究影響因子操縱過(guò)程中影響因子和可靠性影響因子的變化過(guò)程,并發(fā)現(xiàn)可靠性影響因子可以部分抵消人為操縱行為的影響,說(shuō)明R-因子對(duì)傳統(tǒng)影響因子JIF有一定修正作用[14]。圖2描述的是JIF≥3.0物理學(xué)期刊RIFPI與JIF的關(guān)聯(lián)性,這與Kuo和Rupe等人研究IEEE的系列期刊時(shí)的R-因子變化情況相似[10]。這說(shuō)明RIFPI與R-因子一樣,都能對(duì)傳統(tǒng)影響因子JIF具有一定的修正作用,其不但能用來(lái)描述期刊被引壽命,而且還能描述期刊中被發(fā)表的論文的被引率。RIFPI與R-因子不同之處在于RIFPI是建立在嚴(yán)格的統(tǒng)計(jì)理論基礎(chǔ)之上的,并且具有可靠性因子A(表1第5列),而R-因子沒(méi)有。從表格1最后一列還可以發(fā)現(xiàn),除了最后一種期刊 Appl Phys Express的排序沒(méi)有改變外,其它期刊的排序均已發(fā)生變化,這與按基于貝葉斯得到的后驗(yàn)影響因子IFPI排序大大不同,這主要是因?yàn)楹篁?yàn)影響因子IFPI雖對(duì)影響因子JIF進(jìn)行了修正,將研究年限從傳統(tǒng)JIF的2年提高到后驗(yàn)影響因子IFPI的5年,但還是不能有效的控制影響期刊影響因子的因素(如操作行為)的發(fā)生,而只能在一定程度上減輕由于人為等因素帶來(lái)的影響因子的增加。而R-后驗(yàn)影響因子RIFPI由于是在期刊影響因子基礎(chǔ)上引入期刊被引半衰期,從而把長(zhǎng)期的變化因素考慮進(jìn)來(lái),從而能夠大大的消除那些影響期刊影響因子的因素所帶來(lái)的影響,從提高對(duì)期刊評(píng)價(jià)度。[14]
后驗(yàn)影響因子IFPI以貝葉斯統(tǒng)計(jì)理論為基礎(chǔ),其雖只考慮了相鄰年份傳統(tǒng)影響因子JIF的影響,但對(duì)JIF能起到一定的平滑作用,所以得到的結(jié)果相對(duì)JIF具有一定的客觀性和穩(wěn)定性;而R-后驗(yàn)影響因子RIFPI是在IFPI基礎(chǔ)上引入期刊被引半衰期,從而把長(zhǎng)期的變化因素考慮進(jìn)來(lái),進(jìn)而能夠大大消除人為因素對(duì)期刊影響因子的影響,對(duì)傳統(tǒng)影響因子JIF起到較好的修正作用,提高期刊評(píng)價(jià)效果。因計(jì)算RIFPI所需的數(shù)據(jù)均可以直接從JCR中獲得,計(jì)算過(guò)程簡(jiǎn)單且具有可操作性。此外,通過(guò)對(duì)34種JIF≥3.0的物理學(xué)領(lǐng)域期刊的實(shí)證研究,發(fā)現(xiàn)RIFPI與IFPI和JIF相比,不但能描述期刊被引壽命,而且還能描述期刊中論文的被引率。
1 Garfield E.Citation indexes for science:a new dimension in documentation through association of ideas.Science, 1955,122(3159): 108-111
2 Garfield E.Citation analysis as a tool in journal evaluation.Science,1972,178 (4060):471-479
3 Braun T.(Ed.) Special discussion issue on journal impact factors[Special issue].Scientometrics, 2012, 92 (2)
4 Bagatin E, Gontijo B.The expansion of a measure: what is a scientific journal impact factor and how important is it for academic Brazilian dermatologists.International Journal of Dermatology,2011, 50(11):1432-1434
5 Loet L.Alternatives to the journal impact factor:I3 and the top-10% (or top-25%?) of the most-highly cited papers.Scientometrics, 2012, 92(2): 355-365
6 Brown T.Journal quality metrics:options to consider other than impact factors.the American Journal of Occupational Therapy,2011, 65(3): 346-350
7 Gualberto B.&Izabela Z.What do the scientists think about the impact factor?.Scientometrics,2012, 92(2): 281-292
8 Hirsch J.An index to quantify an individual's scientific research output.In:Proceedings of the National Academy of Sciences of the United States of America, 2005, 102(46):16569-16572
9 Braun T,GlanzelW,Schubert A.A Hirsch-type index for journals.Scientometrics, 2006, 69(1):169-173
10 KuoW and Rupe J.R-impact factor:Reliability-based citation impact factor.IEEE Transaction on Reliability, 2007, 56(3): 366-367
11 Patricia P, JoséP.s, Antonio A., et al.An annual JCR impact factor calculation based on Bayesian credibility formulas.Journal of Informetrics, 2013, 7(1): 1-9
12 Morris C N.Natural exponential families with quadratic variance functions.Annals of Statistics, 1982, 10(1): 65-80
13 Chen L, Eichenauer-Hermann J, Hofmann H., et al.Gamma-minimax estimators in the exponential family[EB/OL].[2013-1-08].www.impan.pl/Preprints/p661.pdf
14 Guang Yu,Dong-Hui Yang and Wang Liang.Reliability-based citation impact factor and the manipulation of impact factor.Scientometrics,2010, 83(1): 259-270