朱少強
摘要:國際上有關科研計量評價的研究比較深入和系統(tǒng),具體內(nèi)容涉及到定量評價指標、文獻計量與引文分析、命名現(xiàn)象分析、內(nèi)容分析、學術研究對社會影響力的測度等多個方面,研究人員遍布美、英、澳、荷、丹麥等主流發(fā)達國家,其中澳大利亞REPP項目的工作尤其引人注目。
關鍵詞:科研評價;科研計量;文獻計量;科學學
中圖分類號:G316文獻標志碼:A文章編號:1008-5831(2008)02-0072-06
在進行科學及科學項目的評價時,國際上普遍采用同行評議的方式,這也包括對人文社會科學的評價。最早的同行評議源于1416年對專利申請的審查。20世紀30年代以后,美國率先把同行評議引進到科研項目經(jīng)費申請的評審工作中,此后這一方法為歐美國家廣泛采用,成為國際學術界通行的學術水準評價手段。隨著科學計量學日趨成熟,在20世紀70年代末至80年代初,歐美發(fā)達國家出現(xiàn)的引文計量法開始向同行評議制提出了謹慎的挑戰(zhàn)。早期的計量學諸量化指標主要是為了科學決策而開展的科學質(zhì)量和科學發(fā)展趨勢的研究。科學計量學指標真正應用到科學家個人研究成就的評估過程中,大約是20世紀80年代中后期和90年代初開始的。盡管科學計量學起源于西方發(fā)達國家,并率先開發(fā)出SCI、SSCI、A&HCI;等引文計量工具,但首先把科學計量學指標應用于科學家職稱與成就評定的則是前東歐社會主義諸國。在西方發(fā)達國家,似乎對引入科學計量學指標方法要謹慎和緩慢得多。直到20世紀90年代初,英國高等教育基金委員會才在《1992年科研評價實施條例:評價標準》中明確宣布同行評議是科研評價的基石的同時,同樣公開表示他們將向包括文獻計量學指標在內(nèi)的可能作為同行評議補充的評價方法和建議敞開大門。大約也在同一時期,在德國、奧地利、日本等國家的大學或科研院所的職稱評定過程中,也程度不同地引進了科學計量學和文獻計量學的方法和指標。
一、定量評價指標
澳洲國立大學社會科學研究院科研評價與政策項目組(REPP),是澳大利亞首屈一指的系統(tǒng)性學術評價中心,其研究的焦點領域為科研績效和澳大利亞學術研究結(jié)構(gòu)的深層次定量分析。在ARC(澳大利亞研究理事會)、CSIRO(聯(lián)邦科學與工業(yè)研究組織)、NHMRC(國家衛(wèi)生醫(yī)藥研究中心)等資助下,還定期對科學出版物進行文獻計量分析。REPP強調(diào),為科研評價開發(fā)一些新的定性和定量指標很有價值。同時,在人文社會科學、工程技術領域,文獻計量方法不怎么適用,所以需要為這類學科開發(fā)一些其他的測度方法和指標。
2005年REPP在一份研討報告中,對英、法、澳等國家所采用的定量學術評價指標進行了詳細的綜述研究和理論剖析。提出采用定量指標進行科學研究評價的基礎步驟一般有7個方面。
其一,搞清楚基本概念,區(qū)分什么是研究質(zhì)量(research quality)、效果(impact)、學術水平(scientif-ic excellence)等。
其二,對定量指標進行“角色定位”,確定是完全取代同行評議,還是作為同行評議的輔助手段。多數(shù)學者贊同后一種觀點,即定量指標作為一種信息工具,與同行評議相互補充、相互比較、相互啟發(fā),為同行評議提供輔助性的評價信息,尤其要防止科研管理層對定量指標作用的盲目拔高和誤用。
其三,指標的選取。每一類指標都有自己的優(yōu)缺點,所以學者們建議采用多項指標予以綜合,且定量指標也不能脫離同行評議等其他評價方式單獨使用,在對個人或小范圍群體進行評價時尤其如此。如何選取指標和確定指標權(quán)重方面,有的是采取向?qū)<覍W者發(fā)放調(diào)查問卷、征詢意見的辦法,有的則建議采用統(tǒng)計分析方法,選擇那些相關度最高的指標組合。格倫采爾認為,極有必要開發(fā)一些標準化的評價指標,以增加文獻計量分析結(jié)果的可靠性、有效性,使文獻計量數(shù)據(jù)之間相互兼容。但他同時指出,標準化并不意味著文獻計量專家必須遵循同一個標準。
其四,注意因評價而產(chǎn)生的負面后果。如果評價結(jié)論影響資金分配或者學術地位(prestige),那么也很可能會影響研究人員及其管理層的日常行為。無論對定性評價還是定量評價都是如此。可能的后果之一是目標的錯位,即把在評價中獲取高分當作最高行動綱領,而不關注正常的學術研究目標是否達成。學術機構(gòu)會根據(jù)評價規(guī)則進行“博弈”(game-playing)。另一個可能的后果是引起學術活動自身的改變,學術研究人員因評價而產(chǎn)生一些適應性行為,比如大量往國際期刊投稿而歧視國內(nèi)期刊,重復發(fā)表論文,申請低風險的、主流的研究項目等。
其五,認識和處理各學科領域之間的差別。不同的學科領域,其出版和引用方式是不同的。就理科而言,發(fā)表期刊論文很重要,文獻的引文期限較短,但數(shù)學引文期限較長。工科論文較少,引文期限最短,專利更加重要,但計算機學科則以國際會議論文及其報告、發(fā)言最能反映其成就。文科更加注重專著、作品等,論文只占學術研究成果總量的近一半。同時,即使在同一學科內(nèi)部,不同專業(yè)、研究方向的出版和引用行為也有差別。在一些小學科,由于研究人員總數(shù)較少,可能平均被引量就不如那些大學科。理想的辦法是把評價限制在一個小的研究領域內(nèi)。真正遵循“同類比較”(same with the same)的原則。
其六,選擇聚合(評價單元)的級別。對于科技政策應以學科領域作為評價對象,還是以研究機構(gòu)、研究團體作為評價對象,學者們存在一些分歧。前者是基于認知的觀點,后者是基于管理操作的觀點。另外,根據(jù)統(tǒng)計學原理,要保證評價單元之間的差別不是隨機現(xiàn)象,評價單元就不能太小。例如引文量的分布是高度偏斜的:少數(shù)論文被大量引用,大多數(shù)論文被少量引用,甚至無人引用。如果分析的對象規(guī)模太小,就可能導致個別行為決定整體結(jié)論的現(xiàn)象。部分學者建議,研究團體的出版物數(shù)量在50份以上,或每年10~20份出版物,3~5年一評,才能基本滿足統(tǒng)計條件。還有人建議如果出版物份數(shù)在10份以下,應用中位數(shù)代替平均值。研究團體被認為是文獻計量分析得以成立的最小單元,而對于研究人員個人的評價則是不合適的。
其七,評價結(jié)果的呈現(xiàn)。定量分析的結(jié)果以什么方式發(fā)布,對它的用途、有效性及人們的認可度有相當大的影響。對研究質(zhì)量的評判沒有絕對的標尺,所以一個簡單的數(shù)字不能揭示任何東西,而必須要有一個對照的標準,以此來評判績效。這時。統(tǒng)計方法常被用來檢驗被引率是否顯著地高于或低于平均水平。排名表(ranking tables)是比較流行的數(shù)據(jù)表示方式。這些排名通常用一組定量指標計算得出,標準的文獻計量測度如出版物數(shù)量、引文數(shù)量等常常在這類指標中占據(jù)核心地位。許多人嘗試為不同類型的指標賦予一定權(quán)重,并以此構(gòu)建一個綜合的指數(shù)系統(tǒng)。通過綜合指數(shù)就可以為被評價的對象計算得分,并給出排名表。但這些指標加權(quán)體系都
不可避免地陷于武斷(arbitrary),目前還沒有關于權(quán)重篩選的經(jīng)驗基礎或?qū)嶒炛С?。這類排名表通常很能吸引眼球,但往往容易被夸大和誤用。
REPP報告還根據(jù)各類研究文獻對定量評價指標進行了歸納整理,給出了40個指標的名稱、描述、現(xiàn)有應用、操作性定義、計算方法、對數(shù)據(jù)來源的要求等。并將所有定量指標分為出版物指標、引文指標、結(jié)構(gòu)特征指標、其他非文獻計量指標4類,研究了各類指標的應用范圍、局限性及其指標間的相互關聯(lián)。
澳洲國立大學REPP成員的C Donovan和LButler將定量評價指標分為質(zhì)量指標(quality indica-tors)、影響力指標(impact indicators)兩類,其中質(zhì)量指標又分為標準文獻計量指標(規(guī)定范圍內(nèi)的學術出版物數(shù)量、篇均被引率、用影響因子加權(quán)的期刊論文數(shù))、非標準文獻計量指標(總被引數(shù)、用出版商或期刊聲譽加權(quán)的出版物數(shù)量、論文瀏覽與下載次數(shù))、文獻計量以外的其他指標(榮譽和獎勵、學術團體成員、學術團體職務、參加學術會議、雜志編委、訪問學者)三類。選取了十幾個代表性指標,對經(jīng)濟學領域的2個教學型和3個研究型的學術機構(gòu)進行試點統(tǒng)計研究,觀察這些指標值是否因?qū)W術機構(gòu)的性質(zhì)(偏重教學還是科研,以基礎研究、應用研究還是政策研究為主)不同而存在明顯差異。研究結(jié)論認為,將標準文獻計量方法擴展到非ISI來源項目,并不能提供額外的有用信息,論文瀏覽與下載次數(shù)不能視為對研究質(zhì)量的有效測度,學術榮譽指標不能單獨作為對研究質(zhì)量的有效測度,但可以提供一些有用的背景信息。對研究質(zhì)量、學術榮譽、社會影響3類不同級別的指標,應分別予以界定,而不應籠統(tǒng)地混為一談。
英國J S Katz對指標得分與團體規(guī)模的相關性研究成果表明,傳統(tǒng)的科研評價指標未能很好地處理科研績效與機構(gòu)規(guī)模之間的非線性關系,而這可能導致因為規(guī)模不同而高估或低估其科研績效。實證的統(tǒng)計數(shù)據(jù)表明,學術認知、學術影響與學術團體的出版規(guī)模之間存在冪函數(shù)關系(power law relation-ship),冪指數(shù)可能大于1或小于1。同樣,在合作性研究的數(shù)量與學術機構(gòu)規(guī)模之間也存在冪函數(shù)關系。根據(jù)上述認識,作者開發(fā)了一些與規(guī)模無關(scale-independent)的學術績效測度指標。
二、文獻計量與引文分析法
W Glanzel與U Schoepin以1993年SCI和SSCI年度累積索引作為數(shù)據(jù)來源,選取“連續(xù)出版物占參考文獻比例”、“平均引文年限”、“平均引文數(shù)”3個指標,比較了文科與理科的引文差別。通過研究發(fā)現(xiàn),第一個指標是區(qū)分文科、理科的敏感特征指標,但數(shù)學、技術性學科、一些文科領域等在該特征指標的表現(xiàn)上存在著交叉;在某些文科領域,引文不僅指向?qū)V?、預印本、報告等非連續(xù)出版物,而且還指向一些非學術性文獻。因此,在將標準的文獻計量方法移植應用到文科領域時,需要對原有的信息流模型進行重大改進。
丹麥J A Wallin指出了文獻計量方法。主要是引文分析方法應用于科研評價的可能缺陷、注意事項、應對措施等。他指出,文獻計量方法是天然定量的,但卻被用來作出有關定性特征的判斷。那么實際上,各種文獻計量實踐的主要目的,是將“科學質(zhì)量”等不可見因素轉(zhuǎn)換為一個可操作的實體(manageableentity)。與同行評議相比,文獻計量法的優(yōu)點是很容易得到大規(guī)模的應用。盡管許多專家在各類研究文獻中提出了警告,但文獻計量方法仍然被廣泛地、不加選擇地應用(uncritical use)于評價和資源分配目的。用引文分析指標來評價科研績效,是基于這樣一個假設,即:科學研究質(zhì)量與獲得的引文數(shù)量之間是簡單的線性關系。但實際上,引文行為受到學科領域、出版物類型、作者等因素的影響,同時也與科學研究的類型、其長遠意義等有關。例如,有關綜述、方法論的文獻明顯具有較高的被引率;一些包含錯誤觀點或論證的文獻吸引了比中等質(zhì)量文獻更多的引文;而一些知名的開創(chuàng)性研究,其被引率并沒有人們期望的那么高。文獻計量方法具有高度的“工具依賴”性(methodology-dependent),但對所有這些指標都有必要進行各種數(shù)據(jù)的規(guī)范化(data normali-zation)處理。文獻計量應用于科研評價目的具有很多局限性(piffalls),因此需要熟練的技能、批判的眼光,以及對該學科領域的確切了解,才能正確實施文獻計量分析與解釋分析結(jié)論。
A Vincent和D Ross為評價大學教師的科研績效介紹了引文分析技術及其指標。手工的引文計量可以計算篇均引文率,引文及時性(recency),作者自引率,專著、期刊論文及其他資料在參考文獻中的比例、論文篇均長度、期刊自引率等。而用電子數(shù)據(jù)庫則可以計算排除自引的期刊被引率、影響因子、即年指標和被引半衰期。這些分析的結(jié)果可以用來評價大學教師及其研究活動,也可以用作選擇學術期刊的依據(jù)。必須指出,引文數(shù)據(jù)并不能取代同行評議,同時必須注意到有許多因素會影響到引文率,如語言、期刊的歷史長短與格式、刊期及主題領域等。
J s Kotiaho從研究引文行為出發(fā),探討引文分析方法可能帶來的誤差。其中之一是引文歧視。如來自第三世界國家的論文可能在引文中受到明顯歧視;引文可能會指向某些學術權(quán)威、合作者、朋友,或僅僅提供與研究有關的背景資料,而不是指向與論文最相關的文獻;還有一些作者姓名排序?qū)е碌臒o意識的歧視。其二是人們傾向于轉(zhuǎn)引綜述性文獻,而不是原始文獻,導致真正的引文鏈被掩蓋。另外還有錯引現(xiàn)象,如拼錯作者姓名、雜志名稱、卷期頁碼等,導致引文丟失。盡管這些問題并不顯著,但由手這些偏差可能會影響對研究人員個人的評價,并涉及到競爭性的基金申請、職位聘任等利益問題,所以運用引文分析作為評價工具時應該持謹慎和批判的態(tài)度,考慮各種可能的偏差因素。
荷蘭萊登大學Anthony F J van Raan主張文獻計量分析可以客觀、透明地評價科研業(yè)績,是繼同行評議之后不可缺少的評價元素,在研究團隊、大學院系、研究所等對象層次上尤其如此。傳統(tǒng)上,同行評議被認為是定性的評價方法,文獻計量指標則被認為是定量的。但這其實并不絕對,同行評議中就有一些定量元素,比如在權(quán)威性期刊上的出版物數(shù)量。與之相對,對著作的引用可被視為一種評判,視為同行科學家對該著作“投贊成票”。借助深層次的文獻計量分析,不只是提供一般的“附加數(shù)據(jù)”,而且能迫使專家們重新審視他們的判斷,并提供一些挑戰(zhàn)性的新見解。盡管應用在較低統(tǒng)計水平,如個人層次上,文獻計量的表現(xiàn)不盡如人意;但對于較長時間內(nèi)一個研究團體的評價來說,它確實是反映研究績效、尤其研究質(zhì)量的強有力指標。除“發(fā)表論文數(shù)”、
“總被引次數(shù)”、“篇均被引次數(shù)”3個常見計量指標外,Raan還開發(fā)了“未被引證論文的百分比”、“某期刊的篇均被引率”、“世界范圍內(nèi)某學科的篇均被引率”、“國內(nèi)某學科的篇均被引率”及其相互之間的比值等復雜指標,以ISI數(shù)據(jù)庫為工具,分析了德國醫(yī)學研究所的科研績效情況。研究得出了一些很有意思的結(jié)果。并認為所謂“國際標準化影響指標”,即“篇均被引次數(shù)”除以“世界范圍內(nèi)某學科篇均被引率”的比值,是反映科研績效的最佳指標(‘crownindicator)。
三、命名分析、內(nèi)容分析等其他評價方法
命名現(xiàn)象(eponymy)是指用原創(chuàng)者的名字為某一現(xiàn)象、定理、理論、原則、發(fā)明或方法流程命名。命名可以說是科學界的最高榮譽,因為科學家的成就將進入科學史,并從此不朽。當命名現(xiàn)象成立時,科學家的姓名不再被單獨提起,并且/或者也不出現(xiàn)在參考文獻列表中,而是整個地成為了某一學科領域內(nèi)科學交流語言的一部分。命名現(xiàn)象實際上是一種隱含的引用,原始文獻的被引率會因命名及對二手文獻的引用而被低估。命名現(xiàn)象可以作為一種事后的評價依據(jù),但它的評價周期可能長達數(shù)百年,具有歷史性,且只適用于那些具有崇高學術地位的杰出學者。A Fernandez-Cano和I M Femández-Guer-rero兩名西班牙學者利用一部教育領域的人名索引、一個本地數(shù)據(jù)庫及非正式專家訪談對該國教育領域內(nèi)的命名現(xiàn)象進行了研究。
英國R J Ormerod指出,同行評議與引文分析都有各自的隱含前提:同行評議假定論文被一份有聲譽的雜志采用,就證明論文質(zhì)量高;引文分析方法假定論文被引用證明其學術影響,而學術影響是學術質(zhì)量的一個次級指標。盡管同行評議與引文分析都有各自的弱點,但發(fā)展歷史都比較長,應用也很普遍。Ormerod則嘗試著將內(nèi)容分析法應用于科研評價。他認為,內(nèi)容分析的價值不在于獲得與同行評議或引文分析相一致的結(jié)果,而在于因不一致而揭示出來的額外信息。盡管內(nèi)容分析法比較復雜、耗時,不如同行評議和引文分析有效、可靠和實用,所提供的信息也很有限,但仍然可以作為同行評議和引文分析法的有益補充。
四、學術研究的社會效果評價
2005年英國經(jīng)濟與社會研究理事會(ESRC)舉辦了一個為期兩天的“學術研究的學術外效果評價研討會”(Non-academic Impact evaluation),來自圣安德魯斯大學管理學院的H Davies等提交了一份與會報告,探討評價社會科學研究的學術外效果的方法。該文給出了“學術研究的學術外效果”概念定義,即“學術研究結(jié)論對政策、管理、專業(yè)實踐、社會行為或公共輿論(public discourse)的影響。這些影響可以是工具性的,如對政策、專業(yè)實踐、行為變化的影響;也可以是觀念性的,如改進人們關于社會事務的知識、理解、態(tài)度等?!笨偨Y(jié)了兩種主要的評價途徑。一是前向追蹤法,即從研究本身出發(fā),追蹤其所產(chǎn)生的后果。學術研究通常透過以下幾個方面產(chǎn)生社會效果:知識的生產(chǎn),如同行評議過的論文;研究能力的提升,如研究生的培養(yǎng)與職業(yè)發(fā)展;政策或產(chǎn)品開發(fā),如寫進政府規(guī)劃綱要或協(xié)議;使特定群體受益;更廣泛的社會效益,如因國民健康或生產(chǎn)率提高而帶來的經(jīng)濟效益等。二是在用戶群體中理解學術研究的用途。這種方法通常會有典型案例分析,往往還包含對政策制定者進行簡單調(diào)查。這種方法提供了一定的靈活性,它不僅可以找出特定的知識傳播路徑,而且可以探索出一些未知的傳播路徑、研究者與用戶之間的互動及其后果等。
經(jīng)濟學家們試圖找出方法,來評價農(nóng)業(yè)研究的經(jīng)濟效果,并為此進行了一些實證研究。但是他們卻很少關注如何評價社會科學研究的社會效果。1997年國際糧食政策研究所(IFPRI)首次舉辦了有關這一問題的研討會。2001年11月荷蘭外交部與國際糧食政策研究所召集一群研究者,繼續(xù)就這一主題進行研討。研討的結(jié)論歸為兩類,一是如何測量政策導向性社會科學研究的經(jīng)濟效果,二是如何提升該類型研究對于政策制定的影響力。對于前一個問題,與會人員提出了如下值得關注的方面:評價對象單元的規(guī)模;研究績效的分配(attribution);從供給或需求出發(fā)的分析方法;如果某項研究得出意外的結(jié)果,那么研究的價值會提升;指標的選擇,如經(jīng)濟福利的變化。社會分配結(jié)果的變化,文獻計量指標,政策變化過程時間的縮短等;時間滯后效應;事前評價與事后評價。
國際糧食政策研究所的H E Kilpatrick認為。政策導向性社會科學研究的市場回報,應該由那些為研究項目付錢的客戶來評判。對于特定的研究項目而言,事前與事后的評價都是需要的。事前評價用以決定這項研究是否應受到資助;事后評價則用以決定與之有關的下一輪項目是否應受到資助。事后評價可能基于研究結(jié)果所產(chǎn)生的影響而作出。他提出了用以評價社會科學研究的9種方法。首先重復原始研究,然后可選擇以下評價方法:(1)文獻計量分析;(2)同行評議;(3)案例分析;(4)用戶評估;(5)成本/收益分析或社會回報率測度;(6)回歸分析;(7)決策運籌模型、數(shù)據(jù)包絡分析(DEA);(8)運籌學與計算經(jīng)濟學的最新進展——模型仿真法;(9)各種方法的綜合。
兩名農(nóng)業(yè)經(jīng)濟學家D E Schimmmelpfennig和GW.Norton嘗試用經(jīng)濟學方法分析農(nóng)業(yè)經(jīng)濟研究所帶來的直接效益。他們認為,農(nóng)業(yè)經(jīng)濟研究的最終產(chǎn)出是提供信息,許多研究旨在設計或改進制度,貝葉斯決策理論與經(jīng)濟剩余分析是評估這些信息的可能途徑。他們探討了結(jié)合兩種方法來對農(nóng)業(yè)經(jīng)濟研究進行實證性評價的優(yōu)缺點,并利用從關鍵決策者那里得來的先驗和后驗概率分析評估了三個案例。將這些概率導向一套“狀態(tài)/行動”集,顯然對于只有一個政策制定中心或具有一致決策程序的情況是最適宜的。
澳大利亞C Donovan總結(jié)歸納了見諸澳大利亞及國際上的各種評價指標。
其一,在評價學術研究的社會效益方面,澳大利亞國內(nèi)研究機構(gòu)所采用的指標有:商業(yè)化應用、與產(chǎn)業(yè)界的聯(lián)系、為政府提供咨詢等。如產(chǎn)業(yè)化的收入、商業(yè)化披露的次數(shù)、孵化產(chǎn)業(yè)公司(start-up compa-ny)數(shù)、用戶滿意度、國際合作項目數(shù)、人力和資本支出、政策提案、專家委員會成員資格及發(fā)言邀請、研究生數(shù)、博士后數(shù)、參與合作研究項目成員數(shù)等。
其二,澳大利亞研究理事會(ARC)所采用的評價指標有:合作機構(gòu)的數(shù)量、獲得橫向資金的數(shù)量、作者合著和合作申請專利的次數(shù)。該理事會2003年發(fā)布一份題為《知識的富足:澳大利亞研究理事會資助研究項目的投資回報》的報告,用純粹的經(jīng)濟收益觀點評價所資助的研究項目。但該報告也指出了社會效益的其他方面,如基礎知識體系的構(gòu)建、技能
的提高、決策的改善、衛(wèi)生及環(huán)境與文化的提升等,盡管沒有為這些方面擬定評價指標。
其三,澳大利亞國家衛(wèi)生醫(yī)藥研究中心(NHM-RC)的“績效管理框架”則包含了多維測度。其中“知識利用”之“衛(wèi)生建議的作用”指標有:咨詢建議被非學術性引用的次數(shù)、利益相關者對建議與信息的知曉率和滿意度?!爸R轉(zhuǎn)移進入衛(wèi)生政策和實踐”指標有:在此基礎上進行更深入研究的趨勢、引起公共衛(wèi)生政策和實踐的變化、承擔新的咨詢?nèi)蝿??!霸鲞M的商業(yè)活動”包含商業(yè)產(chǎn)出的增長?!敖涣髋c合作的加強”指標有:合作與伙伴關系的增長,包括從合作者獲得外部資助的水平,建立國內(nèi)、國際合作及伙伴關系的數(shù)量?!吧鐓^(qū)聯(lián)系的增進”指標有:為公眾及利益相關者提供顧問服務的趨勢、與其他機構(gòu)聯(lián)系的增多、對該中心產(chǎn)品的需求、利益相關者對該中心作用與建議的了解程度及滿意度水平、社區(qū)對中心所表述事項的了解及對這些事項態(tài)度看法的轉(zhuǎn)變。
其四,在國際上,新西蘭、荷蘭與英國在開發(fā)研究效益評價指標上處于領先。新西蘭的科研績效指標有:為用戶開發(fā)新的或改進的產(chǎn)品、流程、服務,為用戶撰寫的報告、出版物和發(fā)言(包括各種未經(jīng)同行評審的非學術出版物、網(wǎng)站、電子文檔等)、伙伴關系(含合同、聯(lián)系)、建立這些聯(lián)系的總數(shù)及簡短描述。荷蘭采用的“關聯(lián)度”指標,是指學術研究對社會發(fā)展及解決懸疑問題的影響。英國正在努力構(gòu)建測度社會效益的方法,提出“學術研究提供者及其用戶都應該實際參與到評價過程中來,并就研究(評價)范圍給出各自的觀點”。英國藝術與人文研究理事會(AHRC)正在開發(fā)“一套十分新穎的效益評價方法,該方法基于知識的用戶,而不是知識的生產(chǎn)者進行評價”。
五、小結(jié)
國際上有關科研計量評價的研究比較深入和系統(tǒng)。具體內(nèi)容涉及到定量評價指標、文獻計量與引文分析法、命名現(xiàn)象分析、內(nèi)容分析、學術研究對社會影響力的測度等多個方面,研究人員遍布美、英、澳、荷、丹麥等主流發(fā)達國家,其中澳大利亞REPP項目的工作尤其引人注目。鑒于科研計量評價在中國科學研究評價體系中占有相當重要的地位,跟蹤和研究國外有關科研計量評價的進展狀況,及時總結(jié)國內(nèi)外各類評價經(jīng)驗是很有必要的。同時,西方國家盡管在理論與實證研究上都遠遠領先于中國及東歐諸國,但在科研評價實踐中的應用卻很謹慎。這種“慢決策、快執(zhí)行”的策略和態(tài)度也很值得學習。
(責任編輯彭建國)