羅晨陽 潘明湃 王芳 張躍超
摘要:h指數(shù)和半衰期如何應用于區(qū)域知識評價領域?以半衰期為橫坐標、h指數(shù)為縱坐標建立坐標系,取全部研究對象半衰期和h指數(shù)的均值為分界值,形成4個不同的象限,據(jù)此建立區(qū)域知識質量評價模型,并利用該模型采集知網(wǎng)數(shù)據(jù)對河南省18個地市的知識質量進行了分析。研究發(fā)現(xiàn),將h指數(shù)和半衰期同時應用于知識評價能得到更為全面、客觀的結果。這一研究不但拓展了h指數(shù)和半衰期的應用領域,而且為區(qū)域知識質量的評價提供了新的思路。
關鍵詞:h指數(shù);半衰期;知識質量評價模型
中圖分類號:G353文獻標識碼: ADOI:10.3969/j.issn.1003-8256.2020.04.014
開放科學(資源服務)標識碼(OSID):
基金項目:河南省教育廳人文社科一般項目(2020-ZZJH-342);平頂山市政府決策研究課題(2019-SJY-02);平頂山學院博士啟動項目(PXY-BSQD-2018029)
加大基礎研究投入,促進知識生產(chǎn)是打造國家競爭優(yōu)勢的一條關鍵路徑。知識來源于基礎研究和應用研究,其中基礎研究生產(chǎn)一般知識,拓展知識基礎,應用研究是指針對某一特定目的進行知識創(chuàng)新、技術創(chuàng)造等[1]。無論是在基礎研究方面,還是在應用研究領域,知識都只有通過在高校、企業(yè)以及研究機構之間流動實現(xiàn)擴散與轉移,才能有效“盤活”區(qū)域內的各種資源,形成基于地方資源的區(qū)域創(chuàng)新能力[2]。高校是知識生產(chǎn)的主要主體,論文是知識生產(chǎn)與再生產(chǎn)的主要客體,從長遠來看,一個區(qū)域競爭力的強弱取決于當?shù)厮a(chǎn)知識質量的高低。目前,大部分地區(qū)著重強調本地區(qū)在科研或科技方面的知識產(chǎn)出量,在潛意識里認為“量大”即包括“質優(yōu)”,這顯然有失客觀。對知識質量的高低進行評價屬于科學計量學、文獻學或圖書情報領域的研究范疇。在實踐中,學者們圍繞知識評價設計出了眾多指標,比較常用的有h指數(shù)與半衰期,二者常被分別應用于特定主體所生產(chǎn)(或所擁有)知識的影響力與老化程度的研究。既然h指數(shù)和半衰期能夠從不同角度對知識的生產(chǎn)狀況進行測量,如果將一個地區(qū)在一定時期內所有高校生產(chǎn)的知識視為區(qū)域知識總量,如何將這兩個指標相結合對區(qū)域知識進行科學分析?本文將努力解決這一問題。
1文獻綜述
1.1 h指數(shù)
h指數(shù)是目前被廣泛應用的評價學術影響力的重要指標。Hirsch[3]認為,如果一個學者發(fā)表的論文總量為Np,其中有h篇論文的被引頻次都不小于h,其他的(Np-h)篇論文被引頻次都小于h,那么該學者的科研水平指數(shù)就為h。這是公認的最有影響力的h指數(shù)的定義,h指數(shù)自被提出以來在評價科研工作者學術成果的影響力、鑒別期刊的影響力等方面發(fā)揮了巨大的作用[4]。當然h指數(shù)也有不足之處,如對被引信息的利用不夠充分,雖然在識別成果突出學者方面有較好的效果,但對于h指數(shù)相同的學者缺乏區(qū)分能力[5]。鑒于此,不少學者在實踐中反復嘗試對h指數(shù)進行改進以更好地適應研究需要,這些改進后的h指數(shù)又被稱為擴展h指數(shù)。根據(jù)定義及計算方法可將這些擴展后的h指數(shù)分為四類:①以h指數(shù)為基礎的擴展指數(shù),如AR指數(shù);②獨立的擴展指數(shù),如g指數(shù);③用于評價不同領域學者的擴展指數(shù),如n指數(shù);④考慮合作關系的擴展指數(shù),如h-bar指數(shù)等[6]。從時間序列來看,關于h指數(shù)的研究呈現(xiàn)明顯的階段性特征:第一階段(2005—2008年),主要聚焦于對h指數(shù)的介紹以及在圖書情報領域的應用,開始對其進行修正并著手相關衍生指數(shù)的研究;第二階段(2009—2012年),在這一時期內h指數(shù)被逐漸廣泛應用于多個學科的信息計量、科學分析、科研評價中,同時其社會化應用的趨勢開始顯現(xiàn);第三階段(2012年至今),在這一時期內學術界更加關注h指數(shù)的衍生指標的研究及應用、優(yōu)化及擴展等[7]。
1.2半衰期
半衰期是指在統(tǒng)計當年引用的全部參考文獻中,較新的一半是在多長時間內出版的[8]。半衰期是衡量知識老化程度的重要指標,知識老化表現(xiàn)在文獻上是指隨著時間的推移文獻內容日益變得陳舊過時,利用價值逐漸衰減的現(xiàn)象,在量的方面表現(xiàn)為文獻隨著出版年齡的增長被引用頻次逐漸減少[9]。目前針對半衰期的研究主要有兩個方向:一是將半衰期的概念“修正”之后加以應用,如基于文獻下載量可以計算出“下載半衰期”[10];類似地可以將期刊被引半衰期定義為某種期刊在T年內被引次數(shù)達50%的該刊較新那部份論文的出版年限[11];對于微博不但可以計算其“轉發(fā)半衰期”,還可以研究其“評論半衰期”[12]。二是將半衰期應用于其它對象進行研究,除了微博之外,如果將半衰期的理論與計算方法引入到對維基百科的研究中,就能夠以時間為標度揭示中文維基百科的發(fā)展演化規(guī)律[13];抑或是將一個學科視為一個研究對象,這樣可以研究整個學科的引用半衰期與被引半衰期(如宗教學學科[14]);當然基于圖書的引文數(shù)據(jù)可以直接進行引用半衰期、被引半衰期的計量[15]。
1.3研究評述
目前,盡管學者們針對h指數(shù)與半衰期展開了大量的研究并取得了豐碩的成果,但依然存在研究空間。首先,目前對h指數(shù)與半衰期的研究主要針對諸如單個學者、單個期刊或單個微博之類的“簡單個體”展開研究,極少出現(xiàn)針對“區(qū)域個體”方面的成果;其次,現(xiàn)有研究基本都是將h指數(shù)與半衰期分割開來分別加以研究,極少有人將二者有機結合起來進行探討。針對由地方所有高校所生產(chǎn)知識所構成的“區(qū)域知識”這一對象,將h指數(shù)與半衰期相結合對其進行科學評價將會豐富科學計量學或圖書情報學的研究內容。
2基于h指數(shù)與半衰期的區(qū)域知識評價模型構建
本研究根據(jù)區(qū)域知識生產(chǎn)的特點對h指數(shù)和半衰期進行重新界定,在此基礎上構建模型。第一步,我們將一個地區(qū)所有高校研究人員視為整體,將一定時間段內該地區(qū)高校的所有發(fā)文數(shù)量視為該地區(qū)的知識生產(chǎn)總量,并將檢索出來的論文數(shù)量記為a,將被引次數(shù)超過a的論文數(shù)量定義為該地區(qū)的h指數(shù),h指數(shù)越大說明本地區(qū)所生產(chǎn)知識越有價值,表明該地區(qū)的學術影響力越大。在實際操作過程中,考慮到很多地方性高校,尤其是近年來新建或新升本高校的h指數(shù)都比較小且比較接近,為了簡化計算可以將一個地區(qū)的h指數(shù)用該地區(qū)所有高校h指數(shù)的均值代替。
第二步,再將一個區(qū)域最新發(fā)表論文的年份記為d,按年份降序找出a /2數(shù)量的論文發(fā)表的年份記為e,最早發(fā)表的論文的年份記為f,則有:
通過這種算法得出的半衰期可以判定一個區(qū)域知識的老化程度,半衰期越大說明該地區(qū)的知識老化程度越大、知識越陳舊,半衰期越小說明該地區(qū)的知識老化程度越小、知識越新。
第三步,h指數(shù)和半衰期計算出來之后,以半衰期為橫坐標、指數(shù)為縱坐標建立坐標軸,取全部研究對象半衰期和h指數(shù)的均值為分界值構建模型,并形成A、B、C、D四象限(圖1)。其中,A象限:h指數(shù)較高、半衰期較小;B象限:h指數(shù)較高、半衰期較大;C象限:h指數(shù)較低、半衰期較??;D象限:h指數(shù)較低、半衰期較大。其中,A象限是知識質量最高的區(qū)域,D象限是知識質量最低的區(qū)域,B象限和C象限兩個區(qū)域分別在h指數(shù)和半衰期兩個指標方面各有優(yōu)勢。這樣,根據(jù)一個區(qū)域的所有若干子區(qū)域h指數(shù)和半衰期所確定的坐標,將其歸入對應的象限,就可對其知識質量進行評價與比較分析了。
3區(qū)域知識質量評價模型的應用
3.1數(shù)據(jù)來源
為了便于對比,選擇2003—2019年河南省18地市作為研究對象。主要原因:第一,河南省內缺乏高水平的研究型大學,各地市相對比較“均衡”,研究結論更有可比性;第二,從2003年起全國各地開始大規(guī)模高校升級、合并,河南省大部分地市的??圃盒R泊笾略谶@一時間內完成??紤]到本研究查詢到的很多大學在2003年更改了學校名稱或合并,為了使研究更加精確,對學校合并、更名前后的數(shù)據(jù)全部檢索出來并進行了合并處理。數(shù)據(jù)檢索時間區(qū)間為2003年1月1日到2019年12月31日,涉及河南省18個地市138所高校,共計31萬多條數(shù)據(jù)(表1)。數(shù)據(jù)顯示,鄭州、新鄉(xiāng)、洛陽、焦作、開封、商丘、南陽等在河南省內屬于高校數(shù)量較多的地市,相應地這些地方的論文總量也在省內排在前列。類似地,其它地市的高校數(shù)量較少,在論文總量排名方向也都比較靠后。特別需要指出的是,濟源市作為河南省最典型的直轄縣級市(唯一的省直轄縣級市),只有一所高職院校,高校數(shù)量全省最少,相應地論文數(shù)量也是全省最少。
3.2數(shù)據(jù)處理與分析
首先,根據(jù)第2部分的計算方法分別計算出河南省18地市的h指數(shù)和半衰期(表2)。如果僅僅從h指數(shù)來看,開封、濟源、焦作、南陽、洛陽排名前五,說明這些地市的知識影響力較大,三門峽、周口、濮陽、駐馬店、鶴壁五地市排名在后,說明知識影響力較?。蝗绻麅H從半衰期來看,三門峽、周口、鶴壁、許昌、信陽、駐馬店等地較小,說明這些地方知識老化速度較慢,而濟源、商丘、洛陽、焦作、新鄉(xiāng)等地方的知識老化速度較快。如果將h指數(shù)和半衰期對比,對這些地市知識質量判斷的結果可能會出現(xiàn)“矛盾”,如濟源、焦作兩地市h指數(shù)較大(知識影響力較大),但半衰期也較大(知識老化速度較快);而三門峽、周口、駐馬店、鶴壁四地市的h指數(shù)較?。ㄖR影響力較?。?,但半衰期較?。ㄖR老化速度較慢)。這說明僅僅采用單一指標難以對知識質量做出客觀的評價。
根據(jù)第2部分第三步,分別計算出18個地市h指數(shù)和半衰期的均值(0.325和0.161),完成并將18個地市根據(jù)其坐標分別填入四個象限(圖2)。開封、南陽、安陽、許昌位于A象限,說明知識的影響力大且老化速度慢,知識質量最高;新鄉(xiāng)和商丘兩地市位于D象限,說明知識影響力小且老化速度快,知識質量最低;漯河、焦作、洛陽、濟源等地市位于B象限,這些地方的知識的影響大,老化速度快;三門峽、周口、鄭州、信陽、駐馬店、濮陽、鶴壁等地市位于C象限,這些地方的知識影響力較小,老化速度較慢。
再結合表1進行分析可知,區(qū)域內高校數(shù)量最多、知識產(chǎn)量最大的鄭州、新鄉(xiāng)、洛陽、焦作等地市均不在A象限,這充分說明在知識產(chǎn)出方面質與量不一定正相關。另外,從圖2還可以看出,河南18個地市中有11個分布在B和C兩個象限內,這說明河南省大部分區(qū)域的知識質量存在較大提升空間,其中有7個地市位于C象限,說明這些地方的知識較新,但影響力較小。這一評價結果比采用指數(shù)或半衰期單一指標更為全面、客觀,根據(jù)這一評價結果,政府教育主管機構或地方高校可以重新審視自己科研管理辦法,并更好地提出相應改進建議,以提高本地知識生產(chǎn)質量。
4結語
針對h指數(shù)和半衰期在區(qū)域知識質量的評價進行了研究。首先以半衰期為橫坐標、h指數(shù)為縱坐標建立坐標系,取全部研究對象半衰期和h指數(shù)的均值為分界值,形成4個不同的象限,建立區(qū)域知識質量評價模型;接著,采用該模型對河南省18個地市的知識質量進行了分析。本研究不但拓展了h指數(shù)和半衰期的應用領域,而且為區(qū)域知識質量的評價提供了新的思路。不足之處:首先,本研究沒有照顧到“學科”、學校,甚至論文所發(fā)表期刊之間h指數(shù)和半衰期的差異;其次,所構建的模型僅應用于河南省,沒有照顧到“知識發(fā)達”和“知識欠發(fā)達”地區(qū);另外,本研究數(shù)據(jù)主要來源于中國知網(wǎng),未涉及其它數(shù)據(jù)庫。
參考文獻:
[1]張濤.國家競爭優(yōu)勢的來源——知識生產(chǎn)、知識資本化和制造基礎[J].探索與爭鳴, 2019(7): 136-146.
[2]沙文兵,李瑩. OFDI逆向技術溢出、知識管理與區(qū)域創(chuàng)新能力[J].世界經(jīng)濟研究, 2018(7): 80-94.
[3]HIRSCH, E. J. An index to quantify an individuals scientific research output [J]. Proceedings of the National Academy of Sciences of the United States of America, 2005, 102(46): 16569-16572.
[4]呂娜,劉揚,全少穎.基于作者主要貢獻的h指數(shù)時間趨勢分析[J].情報雜志, 2015(4): 58-62.
[5]周春雷,蔡程瑞,張?zhí)梗?國內圖情學者歷時h指數(shù)研究[J].圖書情報工作, 2017, 61(19): 96-101.
[6]熊回香,葉佳鑫,丁玲,等.基于改進的h指數(shù)的學者評價研究[J].情報學報, 2019, 38(10): 1022-1029.
[7]蔡洪齊,孫莉群.研究述評視角下的h指數(shù)與圖書館服務應用[J].圖書與情報, 2018,(3): 109-112, 55.
[8]BURTON R E, Kebler R W. The half-life of some scientific and technical literature [J]. Journal of the American Society for Information Science & Technology, 1960, 11(1): 18-22.
[9]陳京蓮,羅紅,羅小臣,等.基于文獻老化負指數(shù)方程的半衰期與普賴斯指數(shù)關系的研究[J].圖書情報工作, 2012(8): 74-77.
[10]許新軍.基于下載量的期刊半衰期實證研究[J].情報雜志, 2014, 33(6): 117-121.
[11]羅式勝.期刊被引半衰期的概念及其應用[J].情報科學, 1994, 15(1): 23-25.
[12]江燕青,許鑫.半衰期視角的微博信息老化研究——以高校官方微博為例[J].圖書情報知識, 2016, 170(2): 94-102.
[13]高金菲,梁晗晗.基于半衰期的維基百科演化分析[J].圖書情報知識, 2011(5): 122-128.
[14]吳偉成.基于文獻引證關系的我國宗教學學科半衰期分析[J].圖書與情報, 2015(2): 92-96.
[15]宋雯斐,劉曉娟.基于BKCI的圖書半衰期分析——以圖書情報學學科為例[J].圖書情報工作, 2016, 60(12): 124-129.
The Application of h-Index and Half-Life on the Evaluation of Regional Knowledge Quality
LUO Chenyang1,PAN Mingpai2,WANG Fang1,ZHANG Yuechao1
(1.School of economics management Pingdingshan University, Pingdingshan 467000, China;2.Institute of Science of Science and S&T, Dalian University of Technology, Dalian 116024, China)
Abstract: How h-index and half-life are applied to regional knowledge evaluation? Taking half-life as abscissa and hindex as ordinate to establish coordinate system, taking the mean value of half-life and h index of all research objects as boundary value, forming four different quadrants, establishing regional knowledge quality evaluation model. And the model is used to analyze the knowledge quality of 18 cities in Henan Province. It is founded applying h index and half-life to knowledge evaluation at the same time can get more comprehensive and objective results. This study not only expands the application fields of h-index and half-life, but also provides a new idea for the evaluation of regional knowledge quality.
Keywords: h-index;half-life;knowledge quality evaluation model