“三大核心”：拿什么來取而代之？
——學(xué)術(shù)評價的困境

2019-03-05 12:37:45朱劍

濟南大學(xué)學(xué)報（社會科學(xué)版） 2019年2期

朱劍

(《南京大學(xué)學(xué)報》編輯部，江蘇南京 210093)

一

在中國學(xué)術(shù)界和學(xué)術(shù)期刊界，學(xué)術(shù)評價是一個熱議多年的問題了，而提起學(xué)術(shù)評價，必然會說到“三大核心”。所謂“三大核心”，一般指的是：北京大學(xué)圖書館等單位制作的《中文核心期刊要目總覽》、中國社會科學(xué)院文獻信息中心制作的《中國人文社會科學(xué)核心期刊要覽》(今已被中國社會科學(xué)評價研究院《中國人文社會科學(xué)期刊評價報告》取代)，以及南京大學(xué)社科評價中心制作的“中文社會科學(xué)引文索引(CSSCI)來源期刊目錄”。說白了，就是從1990年代初到1990年代末先后問世的三個學(xué)術(shù)期刊排行榜，其發(fā)布者無一不是以文獻情報學(xué)人員為主組成的評價機構(gòu)。雖然僅僅是幾頁或幾十頁紙的榜單，其能量卻不容小覷，因為在幾乎所有由行政權(quán)力主導(dǎo)或組織的學(xué)術(shù)評價中，這些榜單都起到了不可替代的作用，故而說其牽動了整個學(xué)術(shù)界和學(xué)術(shù)期刊界并不為過。

圍繞“三大核心”，有兩個現(xiàn)象想來學(xué)術(shù)界和學(xué)術(shù)期刊界都已不再陌生。其一，自從“三大核心”問世不久，學(xué)術(shù)界特別是學(xué)術(shù)期刊界對它的批評和討伐之聲就沒有平息過，特別是遇有新版期刊排行榜發(fā)布之時，討伐之聲就會形成一個令人矚目的高潮。筆者將其稱為學(xué)術(shù)評價的“潮汐現(xiàn)象”：低潮時常有，而每隔一段時間，必然來場震動學(xué)術(shù)界和管理層的“天文大潮”。其二，盡管對評價機構(gòu)期刊排行榜的討伐從來也沒有中斷過，討伐的言辭也不可謂不激烈，然而卻收效甚微，“三大核心”的期刊排行榜照樣高調(diào)推出，以此為藍本的各高校和科研機構(gòu)的考核指標(biāo)日趨剛性。于是，學(xué)者和期刊人對這些排行榜的迎合也就不可避免。迎合出現(xiàn)的標(biāo)志就是對評價機構(gòu)偏好的研究，從事這種“研究”的行列正在不斷地擴展之中，從學(xué)術(shù)期刊界波及了整個學(xué)術(shù)界。

學(xué)術(shù)界和學(xué)術(shù)期刊界與評價機構(gòu)的“纏斗”不下二十年了，似乎已達成一種巧妙的動態(tài)平衡。按說就這么幾個評價機構(gòu)，百十個核心制作人員，如何能夠與數(shù)以百萬計的學(xué)者和數(shù)以萬計的學(xué)術(shù)期刊人相抗衡，并使得后者中的許多人對其刻意迎合？秘密就在于學(xué)術(shù)評價背后的行政權(quán)力。

在當(dāng)今的科研體制下，行政權(quán)力不僅壟斷了幾乎所有學(xué)術(shù)資源的分配權(quán)，而且完全掌控了科學(xué)研究的管理權(quán)。在這場權(quán)力游戲中，行政權(quán)力充當(dāng)?shù)氖墙M織者和裁判員的角色，而學(xué)者扮演的則是運動員的角色。權(quán)力的運作需要有科學(xué)的依據(jù)，亦即裁判員需要依據(jù)標(biāo)準(zhǔn)對運動員的成績作出判定，這一過程實際上就是學(xué)術(shù)評價；繼而就是組織者根據(jù)評價結(jié)果對運動員予以獎勵或處罰，這一過程實際上就是資源分配和科研管理。資源總是相對稀缺的，行政權(quán)力要讓有限的學(xué)術(shù)資源發(fā)揮出最大的作用，就要找到最合適的學(xué)者或科研單位來承接資源，此后還要對資源的使用進行管理。所以，只有先有評價結(jié)果，才能進行后續(xù)的處置(分配和管理)。可見，行政權(quán)力作用于學(xué)術(shù)研究時，至少包括評價權(quán)和處置權(quán)，前者是后者的基礎(chǔ)和依據(jù)，而要行使好這兩個權(quán)力，除了需受職業(yè)道德約束之外，裁判員是否具有專業(yè)水準(zhǔn)和眼光之于評判結(jié)果是否科學(xué)和公正就顯得十分關(guān)鍵。這也是在競技界裁判員大多出身于運動員或?qū)I(yè)研究人員的道理所在。但是，行政權(quán)力并非由專業(yè)學(xué)者所組成，亦即行政權(quán)力的行使者并不專業(yè)，這就意味著他們是無法直接進行評判的，如此，就只能將評價權(quán)與處置權(quán)分立，行政權(quán)力不得不將評價權(quán)分離出來委托給有能力進行評價的人或機構(gòu)來行使。當(dāng)然，評價權(quán)只是為處置權(quán)服務(wù)的，只要找到合適的受托人或機構(gòu)就可以。

那么，什么樣的人或機構(gòu)有資格和能力接受行政權(quán)力的委托，承擔(dān)起評價的責(zé)任，提供合適的評價結(jié)果呢？行政權(quán)力對評價結(jié)果的要求無非有二：一是權(quán)威性，即評價結(jié)果因其科學(xué)和公正而具有不可質(zhì)疑性；二是簡明性，即評價結(jié)果對評價對象孰優(yōu)孰劣一目了然，從而使據(jù)此進行的處置或決策具有可操作性，最簡明的當(dāng)然莫過于排行榜。然而，要同時滿足這兩個要求是極其困難的。學(xué)術(shù)研究尤其是人文社會科學(xué)研究的復(fù)雜性決定了見仁見智乃是常態(tài)，隨著各學(xué)科一言九鼎式的開創(chuàng)者逐漸退出研究領(lǐng)域，不可質(zhì)疑的權(quán)威性的評價更顯其難；同樣，人文社會科學(xué)研究的復(fù)雜性也決定了其評價結(jié)果本身的復(fù)雜性，而不是排行榜的形式所能呈現(xiàn)的。

在1990年代之前，行政權(quán)力所需要的評價往往是委托給各種常設(shè)的或臨時的專業(yè)委員會的，這些委員會大多由各學(xué)科的知名專家組成，所實行的評價方法多是同行評議，這也符合國際學(xué)術(shù)界的慣例。但是，隨著國家對學(xué)術(shù)研究投入的加大以及學(xué)術(shù)生態(tài)的惡化，同行評議的公正性和公開性遭到的質(zhì)疑日益增多，學(xué)術(shù)界對更為公正和客觀的評價的呼聲開始高漲。正是在這樣的情況下，以客觀和公正相標(biāo)榜的量化評價出現(xiàn)在人們的視野，“三大核心”則是其代表。與同行評議相比，“三大核心”似乎更加符合行政權(quán)力對評價的要求，雖然其制作者說不上權(quán)威，但其以客觀數(shù)據(jù)說話的話語形式也是一種對科學(xué)和公正的權(quán)威性的詮釋，而以排行榜為產(chǎn)品形式正好滿足了行政權(quán)力對評價結(jié)果簡明性的需要。因此，到21世紀(jì)初，在由行政權(quán)力主持的學(xué)術(shù)資源分配和科研管理中，“三大核心”幾乎成為學(xué)術(shù)評價的唯一主角，其制作者也已當(dāng)仁不讓地?fù)?dān)負(fù)起了學(xué)術(shù)評價的責(zé)任。當(dāng)然，在這一切的背后，是行政權(quán)力對同行評議的拋棄和對“三大核心”為代表的量化評價的采信。

“三大核心”對同行評議的取代并非一蹴而就，而是至少有一個從1990年代初到21世紀(jì)初這大約十多年的過程，隨著這一進程，其弊端也開始顯現(xiàn)：一方面，“三大核心”已逐漸成為學(xué)術(shù)界和學(xué)術(shù)期刊界的“指揮棒”，但這一“指揮棒”所引領(lǐng)的方向與學(xué)術(shù)研究和學(xué)術(shù)期刊的發(fā)展規(guī)律并不相符，嚴(yán)重干擾了正常的研究和辦刊工作；另一方面，學(xué)術(shù)評價從來沒有像現(xiàn)在這樣與學(xué)術(shù)利益緊密勾連，而評價方法又是如此的粗暴和單一：只看排行榜，不上榜不僅意味著無法獲取資源，甚至意味著出局。人們不難發(fā)現(xiàn)，從1990年代末以來不斷增多的學(xué)術(shù)不端(剽竊、造假和粗制濫造等)事件背后，都可以找到量化評價的影子。于是，對以“三大核心”為代表的量化評價的批評和討伐之聲逐漸響起，并由零星的“發(fā)聲”演變?yōu)閷W(xué)術(shù)界和學(xué)術(shù)期刊界的“大合唱”。

不斷的批評和討伐表明學(xué)術(shù)界和學(xué)術(shù)期刊界并不甘心聽命和受制于這樣的“指揮棒”，希望通過批評和討伐來改善甚至擺脫這樣的指揮。但是，“不管每一版期刊排行榜問世時批評和討伐之聲有多猛烈，三兩年后，下一版排行榜仍會在更猛烈的批評和討伐聲中隆重推出并繼續(xù)走紅，而關(guān)于學(xué)術(shù)評價問題的熱議還會無休止地繼續(xù)下去。”[注]朱劍：《重建學(xué)術(shù)評價機制的邏輯起點——從“核心期刊”“來源期刊”排行榜談起》，《清華大學(xué)學(xué)報》(哲學(xué)社會科學(xué)版)，2012年第1期。這是筆者七年前在一篇關(guān)于學(xué)術(shù)評價的小文中寫下的一段話。撰寫此文時，因2010-2012年版CSSCI來源期刊目錄公布而引發(fā)的一場討伐風(fēng)暴剛剛平息。在筆者看來，這固然不是學(xué)術(shù)評價機構(gòu)遭遇的第一場，也決不會是最后一場討伐風(fēng)暴。果然不幸而言中，相信學(xué)術(shù)界對于2017-2018年版CSSCI來源期刊目錄公示后某些學(xué)術(shù)期刊主編發(fā)起的討伐風(fēng)暴一定記憶猶新。討伐者的非理性出擊和評價機構(gòu)的不予正面回應(yīng)與以往如出一轍；同樣，這場聲勢不可謂小的風(fēng)暴隨著其他熱點事件的出現(xiàn)也逐漸淡出了人們的視野，而更多的學(xué)者不得不加入到迎合的隊伍中來。

學(xué)術(shù)界和學(xué)術(shù)期刊界與評價機構(gòu)的“纏斗”之所以持續(xù)二十余年而不見止境，是因為作為資源分配者和管理者的行政權(quán)力態(tài)度的曖昧：既不干預(yù)學(xué)術(shù)界和學(xué)術(shù)期刊界對以“三大核心”為代表的評價機構(gòu)的批評和討伐，也不中止在學(xué)術(shù)資源分配和科研管理中對“三大核心”事實上的運用，從而造成了學(xué)術(shù)界和學(xué)術(shù)期刊界對評價機構(gòu)的討伐與迎合的奇妙組合：不討伐，于心不甘；不迎合，利益受損。這樣的狀況的持續(xù)至少說明了以下幾點：

第一，在行政權(quán)力主導(dǎo)的學(xué)術(shù)資源分配和科研管理中，學(xué)術(shù)評價有著無法替代的作用，行政權(quán)力通過對學(xué)術(shù)評價委托權(quán)的掌控深度地介入了學(xué)術(shù)研究，從而也使得評價由一般的學(xué)術(shù)權(quán)利而蛻變?yōu)槊逼鋵嵉脑u價權(quán)力。

第二，伴隨這一蛻變的是量化評價對同行評議的取代，繼而是排行榜對量化評價的取代。前者剝奪了學(xué)術(shù)共同體從事學(xué)術(shù)評價的權(quán)利；后者讓專門從事排行榜制作的評價機構(gòu)壟斷了學(xué)術(shù)評價。

第三，任何評價機構(gòu)要獲得評價權(quán)力，都必須使其產(chǎn)品得到行政權(quán)力部門的采信。盡管到目前為止，尚未有一家評價機構(gòu)或其產(chǎn)品得到高層行政權(quán)力的公開承認(rèn)，亦即尚未有任何評價機構(gòu)正式獲得行政權(quán)力關(guān)于學(xué)術(shù)評價的委托權(quán)，但作為學(xué)術(shù)評價產(chǎn)品的“三大核心”已在各級行政權(quán)力主導(dǎo)的學(xué)術(shù)資源分配和科研管理中發(fā)揮了決定性的作用卻是不爭的事實。這一事實說明，在既有的各種學(xué)術(shù)評價活動中，“三大核心”已與權(quán)威的學(xué)術(shù)評價畫上了等號，其制作者因其產(chǎn)品在學(xué)術(shù)資源分配和科研管理中的決定作用已躋身于學(xué)術(shù)權(quán)力場中。

第四，在資源和利益均來自行政權(quán)力的當(dāng)下，體制中人對權(quán)力的迎合是必然的，而當(dāng)評價成為一種權(quán)力時，對權(quán)力的迎合首先就是對評價的迎合，對評價的迎合同樣具有必然性。在現(xiàn)實中，對評價權(quán)力迎合的最典型的表現(xiàn)就是對“三大核心”偏好的研究并投其所好。

第五，學(xué)術(shù)界和學(xué)術(shù)期刊界對“三大核心”的刻意迎合行為說明了其背后往往是某種程度的屈從。如果評價完全符合學(xué)術(shù)研究和學(xué)術(shù)期刊的規(guī)律，就不會存在研究評價機構(gòu)的偏好而削足適履的迎合行為。既然有屈從，就必然有反抗，所以迎合和討伐才會同時呈現(xiàn)。

由以上幾點觀之，“三大核心”之所以得到行政權(quán)力的加持，是因為它們在一定程度上滿足了行政權(quán)力分配和管理學(xué)術(shù)資源的需要；同時，來自學(xué)術(shù)界和學(xué)術(shù)期刊界前仆后繼、鍥而不舍的討伐又意味著“三大核心”存在著重大缺陷。這就是行政權(quán)力部門既不拋棄“三大核心”，又不向其公開授權(quán)，也不阻止學(xué)術(shù)界和學(xué)術(shù)期刊界討伐的原因。于是，“纏斗”也就達到了一種微妙的動態(tài)平衡。那么，這樣的討伐與迎合的平衡何時會被打破？筆者不敢斷言，但當(dāng)時間來到2018-2019年之時，幾乎同時發(fā)生的兩件事至少會對這一平衡產(chǎn)生一定的影響，或者還會掀起一番前所未有的波瀾。

其一是評價機構(gòu)新版排行榜的集中發(fā)布。如果不出意外，新一版即2019-2020年版CSSCI來源期刊目錄即將發(fā)布，而此前不久，另兩大“核心”剛剛發(fā)布了新版排行榜。不論哪個“核心”，新一版榜單的發(fā)布，有進有出是必然的，而評刊標(biāo)準(zhǔn)、方法也都或多或少會有變化，從已發(fā)布的兩個“核心”來看，誰進誰出固然引人注目，但后者顯然更值得關(guān)注?！叭蠛诵摹痹谙嗑嗪芏痰臅r間內(nèi)分別發(fā)布新版已是多年不見的現(xiàn)象了，這種現(xiàn)象引發(fā)“天文大潮”當(dāng)是大概率事件，但至少從目前來看，超大的風(fēng)暴潮尚未如期而至，當(dāng)然，最終是否會呈現(xiàn)，還要看新版“C刊”發(fā)布后的情況。

其二是始于2018年中、當(dāng)下正席卷高校和科研單位的清理“四唯”(唯論文、唯職稱、唯學(xué)歷、唯獎項)或“五唯”(唯論文、唯帽子、唯職稱、唯學(xué)歷、唯獎項)行動。所謂“唯”，大概是只看一點，不及其余的意思，也就是只以某一項指標(biāo)為評判標(biāo)準(zhǔn)，而不管其他，“三大核心”顯然具有這樣的特征。雖然此次行動并不專門針對“三大核心”，但“三大核心”必然受到波及則是確定無疑的。

以上這兩件同一時段中發(fā)生的事情頗值得玩味。此次清理“四唯”“五唯”行動表明，行政權(quán)力一反過去對排行榜的曖昧態(tài)度，對科研體制特別是評價機制的改革似乎要動真格了。此項行動的開展，對陷于“纏斗”中的學(xué)者和學(xué)術(shù)期刊人來說，多年來的努力和付出總算沒有白費，平衡即將打破，勝利的天平已向他們傾斜。而對評價機構(gòu)來說，“三大核心”在這個時候發(fā)布新版榜單不大會是對清理“四唯”“五唯”行動的公開挑戰(zhàn)，必須看行政權(quán)力臉色行事的制作者還沒這個膽量，只是按照慣例正巧到了該更新的時候，箭在弦上不得不發(fā)而已。但在這樣的高壓態(tài)勢下發(fā)布新版榜單，要說沒有壓力是不可能的。所以，“三大核心”作出策略上的應(yīng)變也是必然的。

那么，“三大核心”在學(xué)術(shù)評價中的唯一或核心地位是否會就此轟然倒塌呢？對此，筆者以為問題并不如此簡單。清理“四唯”“五唯”行動涉及的只是評價的標(biāo)準(zhǔn)和方法，并不觸及由行政權(quán)力掌控資源分配和科研管理的科研體制，也就是說，學(xué)術(shù)評價在資源分配和科研管理中的地位不會因此而改變，能改變的只是委托誰來從事學(xué)術(shù)評價。清理“四唯”“五唯”行動無疑是一種“破”，所要“破”的固然是在學(xué)術(shù)評價中以類似“三大核心”這樣的排行榜為唯一標(biāo)準(zhǔn)的做法，“破”字確已當(dāng)頭了，但是，“立”，即對評價機制的重建，具體而言，找到“三大核心”的替代品以作為學(xué)術(shù)評價的新標(biāo)準(zhǔn)，是否也就在其中了呢？換言之，我們能否找到“三大核心”的替代品，就成為決定此次清理“四唯”“五唯”行動能否取得預(yù)期效果的關(guān)鍵。本文將對此展開分析，不當(dāng)之處，敬請方家指正。

二

要回答“三大核心”能否被取代的問題，我們先要弄清“三大核心”成為“核心”而號令天下這一局面是怎樣形成的。一言以蔽之，是因為它們被行政權(quán)力相中而加持了。那么，為何這三個目錄榮幸入選呢？一個重要原因就是，在參與學(xué)術(shù)評價之初，“三大核心”制作者們就為自己精心地打造了“科學(xué)”的學(xué)術(shù)評價者的形象，為其排行榜披上了“公平”“公正”的外衣，頗具迷惑性。

首先，不管哪個“核心”，在其背后，都有一套精心構(gòu)造的評價理論支撐著。這套理論至少可以追溯到1930年代英國文獻計量學(xué)家布拉德福(S.C.Bradford)發(fā)現(xiàn)的文獻集中與分散定律。布氏發(fā)現(xiàn)，某一學(xué)科或主題的論文都相對集中地分布于少數(shù)期刊中，這些期刊就形成了對該學(xué)科或主題最有貢獻的核心區(qū)。接著，在1950年代，美國文獻計量學(xué)家尤金·加菲爾德(Eugene Garfield)發(fā)現(xiàn)了期刊論文被引用也有類似現(xiàn)象，期刊刊載論文的引文分布也有一個比較集中的核心區(qū)域，這就是著名的加菲爾德引文集中分散定律?！凹臃茽柕聫娬{(diào)的引用關(guān)系本身帶有天然的評價關(guān)系，是核心期刊具有評價功能的出發(fā)點?！盵注]姜曉輝：《核心期刊的評價功能與作用》，《澳門理工學(xué)報》(人文社會科學(xué)版)2012年第1期。所以，無論是核心期刊，還是CSSCI來源期刊，都是以布氏和加氏理論作為其評價行為和評價產(chǎn)品理論基礎(chǔ)的。由于布氏定律和加氏定律都是在對學(xué)術(shù)期刊進行分析和研究后得出的，故而在這樣原理指導(dǎo)下的“三大核心”其實都是以學(xué)術(shù)期刊為對象的評價。必須指出的是，核心期刊與CSSCI來源期刊是有著本質(zhì)區(qū)別的，這一點，稍后再分析。但至少在它們問世時，在世人眼里，并沒有什么不同。不然，也不會有“三大核心”之稱了。

其次，“三大核心”雖然都只是關(guān)于學(xué)術(shù)期刊的排名，但卻為所有的評價定下了基調(diào)。學(xué)術(shù)評價種類繁多，諸如項目申報、績效考核、頭銜授予、職稱評審等，都需要對單位、機構(gòu)、團隊或個人科研水平進行評價。其中的關(guān)鍵都是對評價對象所產(chǎn)出的學(xué)術(shù)論文價值的評價，因為學(xué)術(shù)成果最主要的表現(xiàn)形式就是公開發(fā)表的學(xué)術(shù)論文。評價論文不僅需要深入內(nèi)容層面的專業(yè)分析和判斷，還需要經(jīng)過較長時段沉淀的歷史檢驗，且見仁見智是常態(tài)，可見其難。而在同行評議失去公信力后，如何科學(xué)、公正且及時地評價論文，更加成為困擾人們的難題。核心期刊的問世為解決這一難題提供了替代方法，就是“以刊評文”。如同前些年采用的檢測奶粉質(zhì)量的方法一樣，奶粉的質(zhì)量標(biāo)準(zhǔn)應(yīng)該是蛋白質(zhì)的含量，但直接測定蛋白質(zhì)含卻是復(fù)雜和困難的，于是人們找到了間接辦法，通過檢測出奶粉中氮元素的含量換算出蛋白質(zhì)含量，憑此判斷奶粉的質(zhì)量。所以，論文評價也可用間接的辦法，即通過期刊過往的形式數(shù)據(jù)來“算出”其優(yōu)劣，分出等級，再依據(jù)期刊的不同等級確定其后來發(fā)表的論文質(zhì)量的高下。這樣一來，有了期刊評價，更確切地說是有了期刊等級排行榜，就有了論文評價；有了論文評價，也就有了一切評價。故在所有評價中，期刊評價結(jié)果的基礎(chǔ)地位誰也無法撼動?！叭蠛诵摹彪m然只是期刊排行榜，卻能左右絕大多數(shù)學(xué)術(shù)評價的奧秘就在于此。

再次，“三大核心”之所以成為所有評價的基礎(chǔ)，還因為其制作者都聲稱他們所做的是客觀的“定量評價”，故而具有天然的公正性和公平性。除了CSSCI制作者堅守了只依憑引文數(shù)據(jù)外，另兩大“核心”制作者還進行了理論創(chuàng)新。“‘布拉德福文獻離散定律’和‘加菲爾德引文集中定律’揭示了學(xué)科文獻在期刊中的分布存在‘集中’和‘分散’的客觀規(guī)律，為定量評價學(xué)術(shù)期刊奠定了理論基礎(chǔ)。后人進一步研究證明，學(xué)科文獻的被摘錄、被轉(zhuǎn)載、被閱讀等多種特征在期刊中的分布都遵循集中和分散的規(guī)律?！盵注]蔡蓉華、何峻：《論期刊評價之目的、方法和作用》，《澳門理工學(xué)報》(人文社會科學(xué)版)，2012年第2期。從而創(chuàng)造性地將對學(xué)科文獻的摘錄、轉(zhuǎn)載、閱讀等帶有一定目的性行為的簡單計量都視為與引文計量等量齊觀的定量評價。如此一來，核心期刊評選指標(biāo)的“豐富性”“全面性”就遠遠超過了加菲爾德只重引文而不及其他的單一性。他們還聲稱所有的數(shù)據(jù)不僅都是具有評價意義的，而且都是客觀的，他們只是通過“科學(xué)”的算法，按其結(jié)果對所有的學(xué)術(shù)期刊進行排序，因而“公開”“公正”和“公平”是有保證的。在同行評議聲譽每況愈下之時，這樣量化的“客觀評價”在1990年代的確曾經(jīng)給學(xué)術(shù)界帶來了科學(xué)合理評價的希望。

最后，“三大核心”都以一定的周期進行期刊排行榜的更新，每次更新其評價指標(biāo)或方法都會有一定程度的調(diào)整，比如應(yīng)行政權(quán)力的要求而增加某些指標(biāo)，或為應(yīng)對學(xué)術(shù)界的批評而調(diào)整某些指標(biāo)的權(quán)重。這在“三大核心”說來是很正常的事，情況總是在不斷變化的，學(xué)術(shù)研究和學(xué)術(shù)期刊也不會例外，故而排行榜也當(dāng)常排常新。一般的排行榜對于被排行者來說，每一次更新，無非是前進了幾名還是后退了幾名的事，但“三大核心”的更新有點不一樣，因為其制作的目的是為期刊劃分等級，所以制作者公布的并不是對所有學(xué)術(shù)期刊的排名，而只是其中大約20%即被認(rèn)定為“核心”或“來源”的期刊的排名，所以每次更新都是有進有出的，進出則意味著等級的變化。這樣一來，對于個體的學(xué)術(shù)期刊來說，重要的問題首先是在不在這個榜單上，其次才是排在第幾的問題。因此，盡管“三大核心”一次又一次地說明他們的評價是純客觀的，但在每次新版公布之前，都會有不少期刊主編前來公關(guān)或打探消息[注]《中文核心期刊要目總覽》主編之一蔡蓉華曾告訴《中國青年報》記者，每4年一次的核心期刊評審，都是一系列“公關(guān)”與“反公關(guān)”的過程。每到評審時節(jié)，就有不少學(xué)術(shù)期刊的主編們紛紛找到課題組，甚至動員同學(xué)、同鄉(xiāng)、師友等各路人馬說情(參見《“核心期刊”評選的背后: 主編們頻頻公關(guān)》，《中國青年報》，2009年4月27日)。；又因為刊物等級的變化直接影響到其所刊發(fā)論文的評價，故也會有已被某刊錄用但尚未刊發(fā)的作者前來詢問該刊是否還留在榜單上，以考慮是否需要撤稿；而在榜單公布之后，又都會掀起一場關(guān)于評價的熱議，特別是那些被擠出榜單的期刊，有時還會表現(xiàn)得非常激烈，要過上一段時間后才會逐漸風(fēng)平浪靜。當(dāng)下一個更新周期到來之時，這一切又會再演一遍，從而在客觀上得以牢牢鎖住期刊界和學(xué)術(shù)界的關(guān)注。

從以上分析不難看出，“三大核心”的評價結(jié)果既簡單直觀，又有廣泛的適用性和關(guān)注度，而且還“客觀”“公正”和“科學(xué)”，因此，它們被行政權(quán)力部門相中也就不奇怪了，因為具有這些特征的評價產(chǎn)品正是行政權(quán)力部門在學(xué)術(shù)資源分配和科研管理中最為需要和最好用的，故而“三大核心”才得以在如今學(xué)術(shù)研究的全領(lǐng)域、全過程中無處不在，由此也足見“三大核心”在我國的學(xué)術(shù)評價體系中的分量。其實，“三大核心”本身也常常會被冠以或自封為“評價體系”之名，意即它們是自成體系可以獨立運作的。必須指出的是，行政權(quán)力之所以采信“三大核心”，最初其實與吃夠了同行評議苦頭的學(xué)術(shù)界對“三大核心”一定程度的認(rèn)可是分不開的；而一旦為行政權(quán)力部門采信，在學(xué)術(shù)界當(dāng)然更是通行無阻。只要看一下高校皆以期刊為本的相似的考核方式和各自制定的用于考核的期刊目錄就可以清楚這一點，至今，這些目錄無不以“三大核心”中的某一個為藍本。

三

那么，以“三大核心”為基礎(chǔ)的學(xué)術(shù)評價體制合理嗎？時至今日，大概沒人會給出肯定的答案，但到目前為止，所有對“三大核心”的批評和討伐都集中在其評價方法或程序的不合理。其實，在回答“三大核心”的評價是否合理這一問題之前，有一個問題更值得追問，那就是，“三大核心”制作者們所做的是學(xué)術(shù)評價嗎？要回答這個問題，我們不妨對“三大核心”的特點做進一步的分析。

首先，支撐“三大核心”的評價理論是否科學(xué)。

所謂“布氏定律”，說明的只是各學(xué)科論文在學(xué)術(shù)期刊中的分布規(guī)律。在專業(yè)分工和與此相應(yīng)的專業(yè)期刊遠不如今天這般發(fā)達，多數(shù)學(xué)術(shù)期刊學(xué)科邊界尚不十分清晰的1930年代，布氏定律所揭示的論文分布規(guī)律的意義是不言而喻的，但在今天這樣一個學(xué)術(shù)研究和學(xué)術(shù)期刊分工高度精細(xì)化的時代，布氏定律早已是明日黃花了。而不管布氏定律過時與否，其所揭示的充其量也只是不同學(xué)科的文獻分布規(guī)律而不是不同質(zhì)量的文獻分布規(guī)律，與我們今天判斷期刊學(xué)術(shù)質(zhì)量高下的學(xué)術(shù)評價已沒有直接關(guān)系了。再看“加氏定律”，它也不過說明得到較多引用的文獻會集中在部分刊物上，當(dāng)然，這與學(xué)術(shù)期刊的質(zhì)量之間的確有一定的關(guān)系，但這個關(guān)系是復(fù)雜的和非線性的。因為引文雖然大多出自同行學(xué)者，似乎代表了同行對被引文獻的某些意見，但引文的動機和目的卻是多樣的，比如有正面引用、負(fù)面引用，以及不具備實際意義的為了引用而引用等多種情況；而被引文獻之于施引者研究的作用則更是復(fù)雜的，即使同樣是正面引用，對施引者的作用也是不盡相同的。故而只有對施引者的動機、目的和被引文獻之于施引者的貢獻作出專業(yè)分析后才能對評價產(chǎn)生一定的意義。不經(jīng)過專業(yè)分析的單純數(shù)量統(tǒng)計是沒有科學(xué)評價意義的，更何況不同學(xué)科甚或同一學(xué)科不同方向因引文習(xí)慣不同而導(dǎo)致的數(shù)據(jù)迥異，比如同樣是引用同行學(xué)者的論文，經(jīng)濟學(xué)論文的引用數(shù)量可能是歷史學(xué)論文的十倍以上，這豈是加權(quán)和算法所能對付的。即使強調(diào)引文評價作用的加菲爾德本人也是從不忘同時強調(diào)引文分析對引文評價的關(guān)鍵意義的。

至于“核心期刊”制作者對評價理論的“創(chuàng)新”，即引入復(fù)合指標(biāo)，則至少存在著兩方面的問題：其一，這些增加的指標(biāo)是否具有評價意義？比如被視為重要指標(biāo)的“文摘量”“文摘率”，已有實證研究證明，文摘的數(shù)據(jù)是不足以用來評價學(xué)術(shù)期刊質(zhì)量的[注]參見王文軍：《中國學(xué)術(shù)文摘：現(xiàn)狀與展望——以“三大文摘”為中心的實證研究》，《清華大學(xué)學(xué)報》(哲學(xué)社會科學(xué)版)，2013年第6期。該文論證了期刊被摘量與期刊學(xué)術(shù)質(zhì)量并無正相關(guān)關(guān)系。。其二，即使這些新增的指標(biāo)具有一定的評價意義，又如何判斷其意義的大??？這是依據(jù)復(fù)合指標(biāo)制作排行榜的評價所面臨的普遍問題。評價機構(gòu)采取的應(yīng)對方法無一例外，就是人工干預(yù)——加權(quán)。那么，如何加權(quán)？依據(jù)是什么？同樣無一例外，評價機構(gòu)的加權(quán)都是依據(jù)主觀判斷來進行，其實，加權(quán)原本就是一件極為主觀的事。這樣一來，所謂的客觀評價就充滿了主觀色彩，對于排行榜的制作者來說，稍稍修改一下加權(quán)方案就能輕而易舉地改變排序的結(jié)果。這也是每有新的期刊排行榜出爐之前，評價機構(gòu)的門檻都要被前來公關(guān)的人踩平的原因所在。其實，這些登門的人與其說是希望得到某種“照顧”，不如說其中的大多數(shù)是擔(dān)心評價機構(gòu)數(shù)據(jù)采集和加權(quán)中的任意性而使自己的利益受損。如果說，量化評價的最大特點或優(yōu)勢是指標(biāo)的“客觀性”“公正性”，那么，隨著在制作排行榜時引入復(fù)合指標(biāo)和加權(quán)，“客觀性”“公正性”也因失去了基礎(chǔ)而大打折扣，甚至已不復(fù)存在。

可見，所謂評價理論特別是核心期刊制作者的諸多“創(chuàng)新”，并不那么靠譜。這也是“三大核心”中作為后來者的“C刊”地位不斷上升的原因之一，“C刊”的制作者至少堅持了加氏定律的純潔性，保持了數(shù)據(jù)的單一性，故其客觀性和公開性遠勝于另兩個引入綜合指標(biāo)并加權(quán)運算的“核心”。如果被評價者必須受“核心”指揮的話，當(dāng)然寧可選擇公開性和公正性得到相對保障的“C刊”。于是，在2017年初對CSSCI討伐風(fēng)潮中我們看到了一個以往從不曾見過的現(xiàn)象，就是與以往一面倒的討伐不同，有著名期刊人站出來公開呼吁應(yīng)公正地看待CSSCI之于學(xué)術(shù)研究、學(xué)術(shù)期刊和學(xué)術(shù)評價的作用[注]參見仲偉民、桑海：《如何客觀評價CSSCI》，《澳門理工學(xué)報》(人文社會科學(xué)版)，2017年第3期。。

其次，導(dǎo)致“三大核心”作用不斷外延的“以刊評文”是否科學(xué)。

今天，從學(xué)術(shù)界、學(xué)術(shù)期刊界到評價機構(gòu)再到管理部門，對“以刊評文”均持否定態(tài)度，這應(yīng)該說是近十多年來學(xué)術(shù)界和學(xué)術(shù)期刊界對以“三大核心”為代表的評價機構(gòu)討伐的一個可以看得見的成果，但這似乎并不妨礙“以刊評文”在現(xiàn)實中風(fēng)行不變——幾乎所有高校的評獎和考核仍然是在數(shù)“核心”論文的篇數(shù)。其實，“以刊評文”并非沒有其自身的邏輯，這個邏輯是這樣的：期刊之所以優(yōu)秀是因為其所發(fā)表的論文優(yōu)秀；所發(fā)論文之所以優(yōu)秀，是因為期刊社或編輯部執(zhí)行了嚴(yán)格的審稿標(biāo)準(zhǔn)，將質(zhì)量低劣的來稿拒之于門外。當(dāng)然，也就可以反過來推論：發(fā)表在優(yōu)秀期刊上的論文都是經(jīng)過了嚴(yán)格審稿的，故而都是優(yōu)秀的，而“三大核心”榜單上的期刊都是優(yōu)秀的，能在這些期刊上發(fā)表的論文一定都是經(jīng)過了嚴(yán)格審稿的，當(dāng)然也就是優(yōu)秀的。如果“三大核心”對期刊的遴選能基于被評選期刊的所有論文，證明入選期刊發(fā)表的每篇論文學(xué)術(shù)質(zhì)量都是有保障的，那么，這樣的邏輯演繹亦即“以刊評文”就不會有太大的問題。

但是，現(xiàn)實中“以刊評文”的結(jié)果卻十分荒唐，連“三大核心”的制作者們也不得不承認(rèn)這一點。那么，問題只可能出在評刊，即“三大核心”的遴選標(biāo)準(zhǔn)上。秘密在于：其一，“三大核心”各自評選指標(biāo)的數(shù)值很容易被少數(shù)乃至個別論文的極端值所左右。在“三大核心”榜單遴選時，并不針對期刊發(fā)表的所有論文，即不要求入選期刊所刊發(fā)的每一篇論文都具有指標(biāo)所規(guī)定的足夠數(shù)據(jù)值。事實上，“三大核心”也都沒有針對期刊所有論文的指標(biāo)存在，故而只要其中部分論文具備一定數(shù)據(jù)值，其余文章，則可完全無視。其二，“三大核心”各自評選指標(biāo)只涉及形式數(shù)據(jù)而不涉及內(nèi)容。這就如同通過檢測氮元素的數(shù)量來評價奶粉質(zhì)量一樣，為數(shù)據(jù)造假留下了足夠的空間，不法廠商在奶粉中摻入氮元素豐富卻非蛋白質(zhì)的三聚氰胺即可造成高蛋白質(zhì)的假象，學(xué)術(shù)界的“三聚氰胺”——人為造假的數(shù)據(jù)同樣可混跡其間，造假的方式則是五花八門，層出不窮，令人目不暇接。

正是評價機構(gòu)極力將刊物的部分論文數(shù)據(jù)等同于全刊數(shù)據(jù)，又難以準(zhǔn)確地鑒別數(shù)據(jù)的真?zhèn)?，更不分析?shù)據(jù)本身的意義，才造成了“以刊評文”結(jié)果的荒唐和惡果的蔓延。不管是邏輯推演還是事實判斷，“以刊評文”都首先錯在評刊，是評刊出了問題才導(dǎo)致“以刊評文”跟著出問題。而當(dāng)錯誤的評刊成了“指揮棒”，相當(dāng)多的期刊社或編輯部就沒有必要堅持統(tǒng)一的用稿質(zhì)量標(biāo)準(zhǔn)。至于評價機構(gòu)也在高調(diào)反對“以刊評文”，這是因為他們明白自己根本沒有能力基于論文的質(zhì)量來評刊，按照他們的方法所評出的“核心”中并非所有論文的質(zhì)量都有保證，所以不能“以刊評文”。當(dāng)然，他們也不會不明白論文評價之難，“以刊評文”根本就沒有替代品，所以高喊不能“以刊評文”，既可為他們開脫錯誤評刊所應(yīng)負(fù)的責(zé)任，又不會危及自身的利益。

再次，“三大核心”的所謂“客觀”的定量評價是否科學(xué)。

所謂定量評價，一般指的是通過對評價對象相關(guān)數(shù)據(jù)的采集、分析、運算，得出相關(guān)結(jié)果的方法。作為方法，定量評價或量化分析具有廣泛的適用性，早已成為包括人文學(xué)科在內(nèi)各學(xué)科普遍采用的分析方法。因此，問題不在于可不可以用，而在于誰來用和怎樣用。

定量評價的基礎(chǔ)是數(shù)據(jù)，但是，并不是所有的可以用于評價的信息特別是涉及評價對象內(nèi)容層面的信息都可以轉(zhuǎn)化為被納入“算法”用作運算比較的數(shù)據(jù)的，即使可轉(zhuǎn)換為評價數(shù)據(jù)的信息也無法避免數(shù)據(jù)轉(zhuǎn)換過程中出現(xiàn)的某些重要信息的丟失、扭曲和偏差。因此，數(shù)據(jù)雖然客觀卻難免片面和失真，對于以學(xué)術(shù)研究成果或?qū)W術(shù)期刊為對象的復(fù)雜評價，單純的定量評價是無法勝任的，而只能是工具性和輔助性的。這就決定了僅依靠對期刊某些形式數(shù)據(jù)的運算即得出結(jié)果的評價機構(gòu)所做的必定是變形的和不完整的評價，談不上客觀，更談不上公正和公平。同樣重要的是，即使是作為工具性和輔助性的定量評價，也必有一個絕對不可缺損的程序，即對數(shù)據(jù)的取舍、分析和價值判斷，這是決定其“算法”是否科學(xué)和專業(yè)的前提。對于成果充滿個性的人文社會科學(xué)研究和期刊而言，數(shù)據(jù)所代表的意義需要非常專業(yè)的分析和判斷，故定量評價也只有同行專家才有可能勝任。評價機構(gòu)所缺的正是專業(yè)水準(zhǔn)，他們總希望用“算法”來替代專業(yè)分析，但至少到目前為止，再復(fù)雜的算法也不可能取代專業(yè)分析，何況他們所謂的“算法”只是極為簡單而隨意的加權(quán)而已。換言之，沒有專業(yè)水準(zhǔn)，就不可能有科學(xué)的“算法”，這就決定了評價機構(gòu)不可能作出科學(xué)和專業(yè)的評價，即使單純的定量評價，也不是其所能勝任的。

最后，評價機構(gòu)是否為合適的評價主體。

盡管“三大核心”中兩家只生產(chǎn)排行榜而不開放其數(shù)據(jù)的制作者始終聲稱自己是合適的甚至權(quán)威的評價主體，但這樣的主體身份是經(jīng)不起推敲的。因為囿于專業(yè)所限，“三大核心”制作者都不可能從事對于其挖掘和整理的數(shù)據(jù)的專業(yè)分析，而缺失了這一學(xué)術(shù)評價必不可少的關(guān)鍵環(huán)節(jié)，即使僅做定量評價，他們也不可能是合適的主體?！叭蠛诵摹敝谱髡邆兯龅闹皇悄承┢诳瘮?shù)據(jù)的定向挖掘和整理工作，而且在“三大核心”中，除了CSSCI開放其數(shù)據(jù)庫以外，另兩大“核心”那多達十幾個乃至數(shù)十個指標(biāo)的原始數(shù)據(jù)的挖掘過程和結(jié)果從未開放過，而《中文核心期刊要目總覽》的制作者居然已放棄了原始數(shù)據(jù)的挖掘和采集。即使“三大核心”都能開放其數(shù)據(jù)，充其量也只是為專業(yè)的評價做了某種準(zhǔn)備而已，而決不是真正的評價。

近年來，CSSCI的制作者已公開放棄了作為評價主體的身份，也不再將其來源期刊目錄視為評價成果，而其主打產(chǎn)品則是CSSCI(人文社會科學(xué)引文數(shù)據(jù)庫)，這個數(shù)據(jù)庫的開放存在才是其能夠公開放棄評價主體身份的底氣之所在。這使得CSSCI制作者彰顯出了與另兩大“核心”制作者的根本不同：后者不僅始終堅持他們是合適的評價主體，而且他們的評價產(chǎn)品只有期刊排行榜而沒有開放的數(shù)據(jù)庫，故其排行榜即使真的按某種“算法”而得出的，學(xué)術(shù)界和學(xué)術(shù)期刊界也無法對其進行必要的監(jiān)督，其同行也無法重復(fù)其運算過程，所謂的科學(xué)性也就可想而知了。其實，“三大核心”的三個期刊榜單之于學(xué)術(shù)研究和學(xué)術(shù)評價都沒什么意義，如果有，也只能是負(fù)面的。但需要指出的是，他們所挖掘和整理的數(shù)據(jù)是有意義的，特別是CSSCI，它并不是什么“核心期刊”，而是引文數(shù)據(jù)庫，將其作為數(shù)據(jù)源的“來源期刊目錄”等同于“核心期刊目錄”，是對CSSCI的最大誤讀。關(guān)于這一點，稍后我們將作進一步的分析。

當(dāng)我們弄清楚了“三大核心”制作者并不具備評價主體的身份，其所做的也不可能是真正的學(xué)術(shù)評價，“三大核心”(即期刊排行榜)也算不上是所謂的評價結(jié)果之后，以“三大核心”為基礎(chǔ)的學(xué)術(shù)評價體制是否合理的問題也就不言自明了。

四

以上我們分析了“三大核心”為代表的量化評價的依據(jù)和缺陷，這樣的量化評價的根本缺陷就在于外行評價內(nèi)行。但是，這個外行之所以能夠獲得對內(nèi)行的評價權(quán)，不僅因為他們獲得了行政權(quán)力的采信，還因為“內(nèi)行”在評價方面的無能和墮落而失去了學(xué)術(shù)公信力。誠如張耀銘教授所言：“公信力是權(quán)威性資源之一，一旦受到損傷，便會造成較大面積的信任危機?！盵注]張耀銘：《重建學(xué)術(shù)期刊的公信力和權(quán)威性》，《澳門理工學(xué)報》(人文社會科學(xué)版)，2015年第2期。正是學(xué)術(shù)界中的許多人對同行評議的失望，才有了1990年代對量化評價的呼喚，從而使得評價機構(gòu)乘虛而入。所謂請神容易送神難，當(dāng)學(xué)術(shù)界發(fā)現(xiàn)這個他們寄予很大期望的量化評價遠沒有設(shè)想中的那么美好，甚至進一步毒化了學(xué)術(shù)生態(tài)時，“三大核心”早已成尾大不掉之勢。對于迅速崛起的評價機構(gòu)，行政權(quán)力則經(jīng)歷了從對“三大核心”運用的得心應(yīng)手到發(fā)現(xiàn)其問題卻投鼠忌器的過程。導(dǎo)致學(xué)術(shù)界和行政權(quán)力對“三大核心”態(tài)度變化的直接原因是頻發(fā)的學(xué)術(shù)不端現(xiàn)象。

在學(xué)術(shù)評價中引入“三大核心”二十多年后的今天，學(xué)術(shù)不端已是司空見慣的現(xiàn)象，以至于一般的“炒冷飯”和重復(fù)發(fā)表，甚至少量隱晦的抄襲剽竊已引不起人們的興趣，而每隔三兩年總會有一兩件匪夷所思的學(xué)術(shù)不端事件曝光，諸如院士造假、校長剽竊之類，才得以引起公眾的廣泛關(guān)注。關(guān)注的結(jié)果之一就是將這樣的事件與學(xué)術(shù)評價聯(lián)系起來，視不合理的評價機制為其根源，當(dāng)然也就少不了對評價機構(gòu)的一次新的討伐。

最近一起這樣的事件當(dāng)屬2018年10月24日《中國青年報》一篇題為《青年長江學(xué)者與她“404”的論文》的報道所曝光的“青年長江學(xué)者”梁教授從各家期刊數(shù)據(jù)庫一口氣撤下了自己百余篇論文事件。在這之前，梁教授無疑“是同齡人中的佼佼者”，她幾乎拿下了這個年齡的大學(xué)教師能獲得的所有榮譽。撤稿的原因據(jù)梁教授自己說是因為早期論文學(xué)術(shù)質(zhì)量不高和不符合學(xué)術(shù)規(guī)范，但卻不能不讓人聯(lián)想到這些被撤下的論文更可能與某些學(xué)術(shù)不端行為相關(guān)，故而不出意外地激起了人們的憤慨，而梁教授面對記者說出的一句“我這條路有多難你知道嗎”[注]《青年長江學(xué)者與她“404”的論文》，《中國青年報》，2018年10月24日，第10版。，再一次地使人聯(lián)想到學(xué)術(shù)評價機制之“逼良為娼”，引發(fā)了許多人的感慨。梁教授的成功之路顯然與她學(xué)術(shù)成果數(shù)量的豐碩是分不開的，我們暫且將她是否涉嫌學(xué)術(shù)不端而撤稿這一疑問置于一邊，即使如她所說撤稿是因為論文的質(zhì)量不高和不符合學(xué)術(shù)規(guī)范是真的，那么，她無疑證實了自己就是以量制勝的典范。“量”何以制勝？當(dāng)然靠的是以“量”為標(biāo)準(zhǔn)來評判學(xué)術(shù)優(yōu)劣的評價。梁教授的成功似乎再次向世人昭示了迎合排行榜的“意義”——學(xué)術(shù)利益的獲取，從而折射出了學(xué)術(shù)評價機制的不合理。然而，梁教授并非一個孤例，她只是近十多年來迎合學(xué)術(shù)評價的受益者之一，她的成功和她的悲劇都只不過是比別人多走了一步而已。她當(dāng)然不是第一個也決不會是最后一個因迎合評價而獲益和同樣因迎合評價而樂極生悲的青年教師。近年來，梁教授式的成功和悲劇已成為討伐學(xué)術(shù)評價機構(gòu)的有力武器，使得評價機構(gòu)平添了許多壓力，不得不努力改變和重塑自己的形象。

更能感受到學(xué)術(shù)不端行為頻發(fā)而帶來壓力的是行政權(quán)力部門，畢竟評價機構(gòu)的所作所為在很大程度上是出于現(xiàn)行科研體制順暢運行的需要而由行政權(quán)力默許甚至明許的，因為決定評價機制的正是行政權(quán)力部門。對于“三大核心”，行政權(quán)力的心態(tài)是頗為復(fù)雜的。排行榜將復(fù)雜的學(xué)術(shù)評價簡單化，使行政權(quán)力運用起來得心應(yīng)手固然是他們不愿放棄這樣的評價的原因，比如原新聞出版總署2010年下發(fā)的《全國報紙期刊出版質(zhì)量綜合評估指標(biāo)體系(試行)》就是典型的“三大核心”的翻版，而找不到如此好用的替代品則是另一個原因。但是，來自學(xué)術(shù)界和學(xué)術(shù)期刊界對以“三大核心”為代表的學(xué)術(shù)評價機構(gòu)及其產(chǎn)品的討伐，以及將學(xué)術(shù)不端的根源指向現(xiàn)實中的學(xué)術(shù)評價機制甚至科研體制，使得行政權(quán)力部門對“三大核心”的采信不僅留有很大的余地，而且對“三大核心”在學(xué)術(shù)評價中的運用可能造成的混亂保持了一定的警惕，也意識到改革不合理的學(xué)術(shù)評價機制之必要，所以也一直倡導(dǎo)著要建立科學(xué)合理的學(xué)術(shù)評價機制。時至2010年代中期，對評價問題的重視已由具體的科研管理部門如教育部、科技部等上升到了最高行政權(quán)力部門。

2016年1月，國務(wù)院辦公廳發(fā)布了《關(guān)于優(yōu)化學(xué)術(shù)環(huán)境的指導(dǎo)意見》，該文件開宗明義即指出：“目前我國支持創(chuàng)新的學(xué)術(shù)氛圍還不夠濃厚，仍然存在科學(xué)研究自律規(guī)范不足、學(xué)術(shù)不端行為時有發(fā)生、學(xué)術(shù)活動受外部干預(yù)過多、學(xué)術(shù)評價體系和導(dǎo)向機制不完善等問題。”針對學(xué)術(shù)評價領(lǐng)域各類排行榜泛濫的情況，該文件在“任務(wù)要求”部分特別指出：“優(yōu)化學(xué)術(shù)民主環(huán)境，營造濃厚學(xué)術(shù)氛圍……鼓勵開展健康的學(xué)術(shù)批評，發(fā)揮小同行評議和第三方評價的作用?？茖W(xué)合理使用評價結(jié)果，不能以各類學(xué)術(shù)排名代替學(xué)術(shù)評價，避免學(xué)術(shù)評價結(jié)果與利益分配過度關(guān)聯(lián)?！盵注]國務(wù)院辦公廳：《關(guān)于優(yōu)化學(xué)術(shù)環(huán)境的指導(dǎo)意見》(2015年12月29日)，國辦發(fā)〔2015〕94號，中華人民共和國中央人民政府官網(wǎng)，http://www.gov.cn/zhengce/content/2016-01/13/content_10591.htm。這是筆者所見第一個明確提出“不能以學(xué)術(shù)排名代替學(xué)術(shù)評價、避免學(xué)術(shù)評價結(jié)果與利益分配過度關(guān)聯(lián)”的國務(wù)院文件。該文件的發(fā)布，說明在關(guān)于學(xué)術(shù)評價的頂層設(shè)計中，已意識到必須警惕排行榜的負(fù)面作用。然而，該文件發(fā)布后，學(xué)術(shù)界卻波瀾不興，在高校和科研院所的各類評價中，以排名代替學(xué)術(shù)評價、學(xué)術(shù)評價與利益分配緊密關(guān)聯(lián)的現(xiàn)象仍然普遍存在。正因為如此，2017年初對“CSSCI”的討伐仍然如期而至。與學(xué)術(shù)界不同，對排名就是評價的否定，評價機構(gòu)顯然要敏感得多，因為他們手中所握有的評價權(quán)力是由行政權(quán)力部門所賦予的，來自行政權(quán)力部門特別是最高權(quán)力部門對學(xué)術(shù)評價態(tài)度哪怕任何細(xì)微的改變，都足以對評價機構(gòu)的前途造成決定性的影響。這一點，下文再予分析。

就在國務(wù)院辦公廳《關(guān)于優(yōu)化學(xué)術(shù)環(huán)境的指導(dǎo)意見》發(fā)布兩年多后的2018年7月，中共中央辦公廳、國務(wù)院辦公廳印發(fā)了《關(guān)于深化項目評審、人才評價、機構(gòu)評估改革的意見》，這是近年來“中央兩辦”首次共同就學(xué)術(shù)評價問題發(fā)布專門的指導(dǎo)意見，再次昭示了頂層設(shè)計對學(xué)術(shù)評價的重視和改革評價機制的決心。該文件從“優(yōu)化科研項目評審管理”“改進科技人才評價方式”“完善科研機構(gòu)評估制度”“加強監(jiān)督評估和科研誠信體系建設(shè)”等方面對學(xué)術(shù)評價提出了系統(tǒng)性的改進意見。其中，關(guān)于“改進科技人才評價方式”部分特別提出：“科學(xué)設(shè)立人才評價指標(biāo)。突出品德、能力、業(yè)績導(dǎo)向，克服唯論文、唯職稱、唯學(xué)歷、唯獎項傾向，推行代表作評價制度，注重標(biāo)志性成果的質(zhì)量、貢獻、影響。把學(xué)科領(lǐng)域活躍度和影響力、重要學(xué)術(shù)組織或期刊任職、研發(fā)成果原創(chuàng)性、成果轉(zhuǎn)化效益、科技服務(wù)滿意度等作為重要評價指標(biāo)。在對社會公益性研究、應(yīng)用技術(shù)開發(fā)等類型科研人才的評價中，SCI(科學(xué)引文索引)和核心期刊論文發(fā)表數(shù)量、論文引用榜單和影響因子排名等僅作為評價參考?！⒅匕l(fā)揮同行評議機制在人才評價過程中的作用?！盵注]中共中央辦公廳、國務(wù)院辦公廳：《關(guān)于深化項目評審、人才評價、機構(gòu)評估改革的意見》，中華人民共和國中央人民政府官網(wǎng)，http://www.gov.cn/zhengce/2018-07/03/content_5303251.htm?！翱朔ㄕ撐?、唯職稱、唯學(xué)歷、唯獎項傾向”以及“核心期刊論文發(fā)表數(shù)量、論文引用榜單和影響因子排名等僅作為評價參考”的提出，矛頭所向，直指單純的量化評價，而“三大核心”排行榜正是這樣的產(chǎn)品。

反“四唯”的口號一經(jīng)提出即得到了廣泛響應(yīng)，而且與以往不同的是，此次的反“四唯”并沒有僅僅停留在口頭上，而是有實際行動的。國務(wù)院辦公廳專門發(fā)布了《關(guān)于優(yōu)化科研管理提升科研績效若干措施的通知》，該文件特別指示：“開展‘唯論文、唯職稱、唯學(xué)歷’問題集中清理……對項目、人才、學(xué)科、基地等科技評價活動中涉及簡單量化的做法進行清理，建立以創(chuàng)新質(zhì)量和貢獻為導(dǎo)向的績效評價體系，準(zhǔn)確評價科研成果的科學(xué)價值、技術(shù)價值、經(jīng)濟價值、社會價值、文化價值?！盵注]國務(wù)院辦公廳：《關(guān)于優(yōu)化科研管理提升科研績效若干措施的通知》(2018年7月18日)國發(fā)〔2018〕25號，中華人民共和國中央人民政府官網(wǎng)，http://www.gov.cn/zhengce/content/2018-07/24/content_5308787.htm接著，科技部、教育部、人力資源社會保障部、中科院和中國工程院聯(lián)合發(fā)布了《關(guān)于開展清理“唯論文、唯職稱、唯學(xué)歷、唯獎項”專項行動的通知》，從“任務(wù)依據(jù)”“清理范圍”“清理方向”“組織實施”等幾個方面對各部委清理工作作出了部署。一場頗具聲勢的“四唯 ”專項清理工作就此展開。上述各部院及自然科學(xué)基金委、中國科協(xié)以及行業(yè)主管部門和地方相關(guān)部門都劃出了重點清理的范圍，涵蓋了各種計劃項目、人才項目、基地建設(shè)、機構(gòu)評估、成果獎勵、院士選拔、職稱評審、績效考核等幾乎所有需要或涉及評價的方面，要將這方方面面涉及“四唯”的做法進行清理。具體清理方向是：“1.對部門和單位政策文件中涉及‘四唯’的規(guī)定進行修改；對本部門和單位牽頭執(zhí)行的法律和行政法規(guī)中涉及‘四唯’的規(guī)定，提出修改建議。2.對各類考核評價條件和指標(biāo)中涉及‘四唯’的內(nèi)容進行調(diào)整，具體表現(xiàn)形式包括但不限于評價指標(biāo)體系、評價手冊、評審細(xì)則等。3.對有關(guān)管理信息系統(tǒng)和工作表格中涉及‘四唯’的內(nèi)容進行修改?！盵注]科技部、教育部、人力資源社會保障部、中科院和中國工程院聯(lián)合發(fā)布《關(guān)于開展清理“唯論文、唯職稱、唯學(xué)歷、唯獎項”專項行動的通知》(2018年10月15日)，國科發(fā)政〔2018〕210號，科技部官網(wǎng)，http://www.most.gov.cn/tztg/201810/t20181023_142389.htm。如此明確而具體的部署可謂史無前例，對學(xué)術(shù)界、學(xué)術(shù)期刊界特別是評價機構(gòu)的震動可想而知。

這樣的專項行動將會帶來怎樣的后果？《人民日報》發(fā)表時評作了樂觀估計：“專項行動的開展，有望形成合力，轉(zhuǎn)變科研中存在著的不當(dāng)作風(fēng)?！盵注]沈彬：《人民時評：校正科研激勵的指揮棒》，2018年10月31日，人民網(wǎng)，http://theory.people.com.cn/n1/2018/1031/c40531-30372591.html。筆者當(dāng)然也希望能夠早日呈現(xiàn)這樣的好結(jié)果。然而，冰凍三尺非一日之寒，對于“四唯”的批判并非始于今日，近十多年來，學(xué)術(shù)界的有識之士們一再呼吁應(yīng)該改革以“四唯”或其中的某“唯”為標(biāo)志的不合理的學(xué)術(shù)評價機制，也得到了行政管理部門的回應(yīng)，可結(jié)果又如何呢？當(dāng)然，這一次的反“四唯”專項行動的確與以往不同，最大的不同在于，一是由最高層發(fā)動；二是有具體的清理方向、范圍和措施，但我們必須看到，清理“四唯”主要還屬于“破”的范疇，而“破”字當(dāng)頭，“立”是否就在其中了呢？這就要回答“立”什么，如何“立”的問題，這才是問題的關(guān)鍵。

五

所謂“立”什么、如何“立”的問題，實際上就是如何為以“三大核心”為代表排行榜尋找到合適替代品的問題。近年來，從管理者到學(xué)術(shù)界以及學(xué)術(shù)期刊界對學(xué)術(shù)評價問題多有思考，現(xiàn)行評價之不合理是共同的判斷，甚至連評價機構(gòu)都不否認(rèn)這一點。但不合理在何處、造成不合理的原因是什么，各方的看法卻不盡相同，所以如何改進也是眾說紛紜?？偟恼f來，改進的路徑設(shè)定大多是以下兩個之一，即或者主張改進評價方法，以使其更加科學(xué)，比如提倡“定量評價與定性評價相結(jié)合”；或者主張改變評價主體，使評價向同行評議回歸，比如啟動“代表作評價制度”。對這兩者，很多人都抱有很大的希望。在筆者看來，設(shè)想都很美好，但可行性如何，恐怕還得打個問號。

先看“定量評價與定性評價相結(jié)合”。

關(guān)于“兩結(jié)合”的好處，一般的解釋是讓這兩種各有所長、也各有缺陷的評價互補，以使評價變得相對全面和公正。在筆者看來，這個已被普遍接受的替代方案貌似公允，其實很容易滑向似是而非。這是因為，如果僅僅將定性和定量視為兩種評價方法，同一評價主體可以根據(jù)評價目的和內(nèi)容的需要而靈活地加以運用時，“兩結(jié)合”與所謂方法的多元是一個意思，當(dāng)然是可以的；但當(dāng)定性和定量成為兩類不同主體獨立的評價，而“兩結(jié)合”只是將它們各自的結(jié)果簡單地疊加時，評價結(jié)果的科學(xué)性和公正性就很值得懷疑了。而今天各界所主張的“兩結(jié)合”，恰恰多是后者而鮮見前者。

之所以說當(dāng)“兩結(jié)合”成為定性和定量兩種評價結(jié)果的簡單疊加無法保證評價結(jié)果的科學(xué)性和公正性，是因為當(dāng)我們判斷一個評價是否合理時，需要從以下幾個方面去分析。

首先，我們要看誰是評價主體?！皟山Y(jié)合”恰恰模糊了誰是評價主體這一關(guān)鍵問題，似乎學(xué)術(shù)共同體和評價機構(gòu)是對等的評價主體。自從“三大核心”制作者推出其“定量評價”的排行榜之后，經(jīng)過刻意渲染，定量評價成了評價機構(gòu)的專利，而各學(xué)科專家只會做定性評價。他們?nèi)徊活櫾缭谠u價機構(gòu)產(chǎn)生之前，定量評價作為一種基本的研究方法就已被包括人文學(xué)科在內(nèi)的各學(xué)科專家所普遍使用這一事實(比如在史學(xué)術(shù)界“定量史學(xué)”就成功地使用了定量分析和評價的方法，更不用說在經(jīng)濟管理等社會科學(xué)各學(xué)科了)。于是乎，在學(xué)術(shù)評價領(lǐng)域就出現(xiàn)了一個奇特的現(xiàn)象，不同的方法只能由不同的人來使用，而不能由同一人或同一類人來使用。評價機構(gòu)借此以“定量評價”的唯一適格使用者而躋身評價主體的行列，從而得以與被描述為只會做定性不會做定量評價的各學(xué)科專家(學(xué)術(shù)共同體)分庭抗禮。這樣一來，原本歸屬于學(xué)術(shù)共同體的評價就分裂為評價機構(gòu)的定量評價和學(xué)術(shù)共同體的定性評價這兩類互不統(tǒng)屬、完全獨立的評價，學(xué)術(shù)評價就此分裂。評價的分裂如今已成不爭的事實。評價的分裂之于學(xué)術(shù)研究和學(xué)術(shù)期刊的后果是相當(dāng)嚴(yán)重的，因為分裂后的“定性”和“定量”都成了殘缺不全的評價。在當(dāng)前令人憂慮的學(xué)術(shù)環(huán)境下，缺乏自律的定性評價(同行評議)往往又呈現(xiàn)出不客觀、不公正、不科學(xué)，其對學(xué)者個人利益的傷害有時甚至超過了評價機構(gòu)的排行榜，兩相比較，人們寧可相信排行榜。這就使得學(xué)術(shù)評價幾乎全由評價機構(gòu)說了算，成了他們的一統(tǒng)天下。“兩結(jié)合”正是針對這種情況而提出的應(yīng)對方案。我們知道，在評價問題上，行政權(quán)力部門、評價機構(gòu)和學(xué)術(shù)界是有著不同的利益訴求的，有時甚至是相互對立的，但在“兩結(jié)合”提出后，三方卻出奇地一致?lián)碜o。個中原因是什么？正因為這個方案并沒有明確誰是評價主體這一關(guān)鍵問題，只要打出“兩結(jié)合”的幌子，誰都能當(dāng)評價主體。據(jù)此，行政權(quán)力部門評價組織者的身份不會改變；評價機構(gòu)雖然不可避免地會出讓某些已到手的權(quán)力，但仍可通過具體操作予以彌補，評價主體身份這一要害不會改變；而學(xué)術(shù)界似乎也找到了重返評價領(lǐng)域的路徑。于是，三方的利益和訴求都在一定程度上得到了滿足，但是，誰是評價主體的根本問題并沒有得到解決，評價的分裂不僅依然如故，而且還因為“兩結(jié)合”的提出而合法化了。這樣的“兩結(jié)合”又怎能走向科學(xué)？

其次，我們要看運用的是怎樣的評價方法。評價方法總是與評價目的和內(nèi)容相關(guān)的，不同的評價目的決定了不同的評價內(nèi)容，不同的評價內(nèi)容決定了必須選擇不同的評價方法，只要評價目的和內(nèi)容不同，所采取的方法也就各異，不涉及目的和內(nèi)容談方法都是沒有意義的。這應(yīng)該是常識。至于應(yīng)該使用什么方法，完全取決于評價主體根據(jù)目的和內(nèi)容的需要進行的選取。僅就方法層面來說，不管選擇定量還是定性，有一點是肯定的，就是評價者必須具備專業(yè)分析能力，否則，定性評價就難免望文生義，而定量評價則會淪為數(shù)字游戲?？梢?，除了評價目的和內(nèi)容外，評價方法還是離不開評價主體，在不明確評價主體的情況下，“兩結(jié)合”連評價方法的改進都難做到，只能退而求其次，寄希望于以兩類評價結(jié)果的糅合來替代主體的統(tǒng)一和方法的改進，但因分裂而殘缺的評價并不會因此而真正統(tǒng)一起來，殘缺依舊。這樣的殘缺，并不是缺損了部分正確的結(jié)論，余下的還是正確的，而是因主體的能力或方法的殘缺導(dǎo)致了所有結(jié)論都可能是變形的或錯誤的，我們怎能指望將這樣的兩種結(jié)果疊加就可以得出科學(xué)的結(jié)果來呢？

再次，我們要看評價的程序是如何設(shè)計的。評價的程序如何設(shè)計直接關(guān)系到評價的公正與否，程序公正是評價公正的前提，這是不言而喻的。通過評價程序，我們可以看到誰是評價的組織者，誰是評價主體，誰是評價的參與者，主體和參與者是如何分工的，以及經(jīng)過了哪些步驟而得出了評價結(jié)論，可見評價程序仍然與評價主體相關(guān)。迄今為止，我們還沒有看到“兩結(jié)合”提倡者如何設(shè)計評價者身份和如何設(shè)計“兩結(jié)合”程序的理論探討，但卻不乏一些可供我們分析的實例。已有的“兩結(jié)合”實例，評價的組織者大多不外乎兩種，一是行政部門，二是評價機構(gòu)。即使退一步說，“兩結(jié)合”就是兩類評價的糅合，那么在程序設(shè)計上，至少也應(yīng)該讓兩類主體具有對等的地位。實際情況又是如何呢？先看評價機構(gòu)組織的“兩結(jié)合”評價的程序設(shè)計。目前評價機構(gòu)大多號稱其排行榜是“定量評價與定性評價相結(jié)合”的產(chǎn)物，因為他們引入了學(xué)科或期刊專家參與排行榜的制作。評價程序是如何安排專家評刊的呢？無非是讓成百上千的專家在一張表格上憑印象對成百上千的期刊進行打分。事實上，對于如此數(shù)量級的期刊，專家熟悉的只是其中的少數(shù)乃至極少數(shù)，這樣的打分又有多少參考價值？而這些專家所打的分在排行榜制作中到底起了什么作用，恐怕連這些專家也不知曉，最終的算法和評價結(jié)果，這些專家更是沒有決定權(quán)的。在這樣的評價程序中，專家最多也只參與了一個環(huán)節(jié)而不是全過程，哪有什么主體地位？起決定作用的仍是評價機構(gòu)。再看一些行政主管部門組織的評價，類似的所謂“兩結(jié)合”的程序設(shè)計也比比皆是。所謂專家參與，不過是按定量評價的“指標(biāo)體系”逐項打分而已，而對這些指標(biāo)體系是否合理，最終結(jié)果如何，專家一般無權(quán)置喙。在這樣的“兩結(jié)合”程序設(shè)計中，專家只是起到了“打分機器”的作用，談何主體地位？如此的“兩結(jié)合”程序設(shè)計，又有多少科學(xué)性可言？

最后，我們還要看數(shù)據(jù)在評價中是如何發(fā)揮作用的。作為分析工具的數(shù)據(jù)處理在評價中的作用是十分重要的。如前所述，數(shù)據(jù)如何發(fā)揮其應(yīng)有的作用，取決于采集、整理、分析、運算、解釋的過程是否科學(xué)，關(guān)鍵還在于進行數(shù)據(jù)處理的人是否專業(yè)，故而只有同行專家才是最合適的數(shù)據(jù)處理人選。因此，在“兩結(jié)合”評價中，數(shù)據(jù)能否發(fā)揮應(yīng)有的作用，還是離不開主體的設(shè)定。但在評價分裂情況下的所謂“兩結(jié)合”評價中，由于評價機構(gòu)已獲得了定量評價的專利，也就意味著不僅所有的評價數(shù)據(jù)都由其提供，而且還意味著提供什么樣的數(shù)據(jù)、對這些數(shù)據(jù)進行怎樣的整理、分析、運算和解釋，其權(quán)利都操于評價機構(gòu)之手，被“結(jié)合”的專家們既無法審核其原始數(shù)據(jù)，也無法對數(shù)據(jù)作出分析，更無法干預(yù)其算法，除了為評價機構(gòu)的“兩結(jié)合”背書以外，還能做什么？比如“三大核心”中兩個核心期刊的評選，都號稱吸納了成百上千專家的參與，但專家們是審核了數(shù)據(jù)，還是提供了對數(shù)據(jù)的專業(yè)分析抑或是干預(yù)了算法？當(dāng)專家們參與進去的時候，評價機構(gòu)早已“算”出了排行榜，專家們充其量也就是憑主觀印象對結(jié)果做些微調(diào)而已。我們又如何指望這樣的“兩結(jié)合”能真正發(fā)揮數(shù)據(jù)以及專家在數(shù)據(jù)分析方面的作用？

從以上分析不難看出，導(dǎo)致“兩結(jié)合”滑向似是而非的是評價的分裂，不解決評價主體是誰的問題而只是依靠糅合兩類評價的辦法是不可能走出評價困境的。在我們明確了學(xué)術(shù)評價的主體只能是學(xué)術(shù)共同體后，就可以發(fā)現(xiàn)科學(xué)的評價并不在于定性評價與定量評價這兩類評價的結(jié)合，而在于讓定性評價和定量評價都回歸到一般的評價方法，由評價主體根據(jù)不同的評價目的來選擇和確定最合適的方法。這個方法，可以是定性的，也可以是定量的，更多的時候則是多元的。如同學(xué)術(shù)研究一樣，研究者可以根據(jù)不同的研究目的和所掌握的不同資料，采用不同的方法。方法可以多種多樣，但不同的方法只能由同一個主體來統(tǒng)攝，不應(yīng)分別成為不同主體的專利，而有能力統(tǒng)攝評價方法的主體只能是學(xué)術(shù)共同體。但是，讓學(xué)術(shù)共同體回歸評價主體的地位卻有著種種困難，而“代表作評價制度”的提出，就是要為同行評議的回歸架設(shè)一道橋梁。這條路能走得通嗎？

六

再看“代表作評價制度”。

所謂“代表作評價制度”大致是指通過對被評價者最具代表性的科研成果按一定的程序、方法進行評審，得出關(guān)于被評價者學(xué)術(shù)水平的結(jié)論的學(xué)術(shù)評價制度。近年來部分重點大學(xué)在職稱評審等涉及評價的事務(wù)中高調(diào)推行這一制度，令人有耳目一新之感，贏得了很多贊揚，也得到了教育部的首肯，教育部近年正在力推這一制度，而在“中央兩辦”《關(guān)于深化項目評審、人才評價、機構(gòu)評估改革的意見》中，也明確提出了“推行代表作評價制度”。

之所以如此，是因為在學(xué)術(shù)界已風(fēng)行多年的所謂定量評價——“以刊評文”導(dǎo)致的“以量取勝”實在走得太遠了。學(xué)術(shù)界普遍將時下種種學(xué)術(shù)亂象歸因于定量評價的濫用，而推行“代表作評價制度”的目的就是要改變定量評價重“量”輕“質(zhì)”的偏頗，重新確立以“質(zhì)”為主的評價標(biāo)準(zhǔn)。既然是新推出的一項科研管理的重要制度，當(dāng)然就需要有一系列相應(yīng)的標(biāo)準(zhǔn)、程序等設(shè)計，以使該制度得以落實。部分學(xué)者也撰文參與了相關(guān)規(guī)則與程序設(shè)計的討論[注]此類文章的共同特點是，在論述代表作評價的意義與必要的同時，分析實行代表作評價所面臨的現(xiàn)實困難，開列必須具備的條件，并設(shè)計代表作評價的程序。參見陳云良、羅蓉蓉：《“學(xué)術(shù)代表作” 制度的實施條件和程序安排》，《現(xiàn)代大學(xué)教育》，2014年第1期；姜春林、趙宇航：《代表作評價：探索之路與完善之策》，《甘肅社會科學(xué)》，2016年第3期；王兵：《科研代表作評價工作平臺的功能分析》，《中國高校科技》2017年增刊；等。。但是，伴隨著“代表作評價制度”的推行，在多方贊揚聲中，質(zhì)疑的聲音也幾乎同時出現(xiàn)了。質(zhì)疑的聲音雖然零星而不成氣候，但仍然不容忽視，因為其所質(zhì)疑的并不是以“質(zhì)”為主的評判標(biāo)準(zhǔn)，而是如何具備可操作性，亦即如何保證“代表作評價制度”下的評價能夠公正和公平[注]參見李濤：《高校學(xué)術(shù)評價不宜簡單采用“代表作”制》，《中國社會科學(xué)報》，2012年10月26日；石晶、李曉彤：《熱與冷：高校學(xué)術(shù)代表作評價制度的思考》，《甘肅社會科學(xué)》，2014年第6期；等。。

應(yīng)該如何看待“代表作評價制度”？它能否取代運用排行榜的“以刊評文”？在筆者看來，“代表作評價制度”的實質(zhì)是向以學(xué)術(shù)共同體為評價主體的回歸，用同行評議代替排行榜。這無疑是學(xué)術(shù)評價走向科學(xué)和公正的必由之路?！按碜髟u價制度”，應(yīng)該說是在領(lǐng)教了扭曲的量化評價的種種弊端和傷害后，學(xué)術(shù)界近年來寄予較多希望的一種評價制度，也可視為行政權(quán)力部門回應(yīng)學(xué)術(shù)界的呼聲而力推的一種取代“以刊評文”的重要制度。但是，提出這一制度設(shè)計與將這一設(shè)計落到實處之間是有一條鴻溝需要跨越的。如果我們不太健忘的話，當(dāng)會記得在評價機構(gòu)出現(xiàn)之前，同行評議一直是學(xué)術(shù)界通行的評價制度，這一制度之所以在1990年代以來被逐漸顛覆，學(xué)術(shù)共同體之所以幾乎被驅(qū)逐出了評價領(lǐng)域，蓋因這一制度得以公平、公正實施的條件已漸漸地喪失了。

要確保以學(xué)術(shù)共同體為評價主體的同行評議的科學(xué)、公正是需要具備一定的條件的，至少評價主體必須滿足以下兩個條件：其一是專業(yè)性；其二是自律性。只有同時具備了這兩個條件，同行評議才可望得出令人信服的結(jié)論，否則也許連評價機構(gòu)的排行榜都不如。

專業(yè)性對于學(xué)術(shù)共同體似乎不該是一個問題，要保證專業(yè)性，無非是在選擇評價專家時注重其專業(yè)背景，一般說來就是“小同行”更有發(fā)言權(quán)。但是，專業(yè)性永遠是有限度的。

20多年前的“索卡爾事件”人們一定不會忘記。1996年，美國紐約大學(xué)物理系教授索卡爾(A. Sokal)將其一篇題為《超越界線：走向量子引力的超形式的解釋學(xué)》的“詐文”投給了著名的《社會文本》(SocialText)，在這篇文章中，“索卡爾刻意模仿那些科學(xué)文人的語氣，煞有介事地使用后現(xiàn)代主義的種種詞匯，令人眼花繚亂地從量子力學(xué)，廣義相對論，談到微分拓?fù)?，非線性，超弦和混沌，舉出了一些似是而非的‘論據(jù)’，還杜撰了所謂‘形態(tài)發(fā)生場’的‘最新’物理學(xué)理論，通過這樣的生拼硬湊胡說八道來論證‘量子引力是一種典型的后現(xiàn)代科學(xué)’，是‘超越界限’地發(fā)展出來的一種‘具有解放意義的科學(xué)’。從而得出結(jié)論說，‘后現(xiàn)代科學(xué)的內(nèi)容和方法論，為進步的政治綱領(lǐng)提供了強有力的思想上的支持?！骺栐谶@篇文章里還引用了前輩物理學(xué)家玻爾(N. Bohr)和海森伯(W. Heisenberg)的言論作為依據(jù)，更加迷惑了刊物的幾位總編輯，使他們看不出來這竟會是一場惡作劇?！痹撐陌l(fā)表后，“索卡爾立刻又寫了一篇《曝光——一名物理學(xué)家的文化研究》，發(fā)表在同年晚些時的法語刊物《大眾語言》(LinguaFranca)上。他說自己寫了那篇文章來嘲笑科學(xué)文化研究者們，是因為：‘最好的武器就是諷刺，對那些最頑固對象的批評就是讓他們自己打自己的耳光?！盵注]關(guān)洪：《“索卡爾事件”和科學(xué)家的介入——科學(xué)家與反科學(xué)思潮的一場較量》，《科學(xué)技術(shù)與辯證法》，2003年第5期。這就是轟動一時的“索卡爾事件”，由此引發(fā)了一場被稱為“科學(xué)大戰(zhàn)”(science wars)的激烈辯論。對于這一事件，人們可以從不同的角度進行解釋，在此，僅這一事件中“詐文”居然得以騙過著名期刊的專業(yè)編輯一端，就讓我們不得不對同行評議中的專業(yè)判斷打一個問號。

如果說這只是一個孤立事件，且《社會文本》當(dāng)時尚未實行嚴(yán)格的同行匿名評審，還不足以說明同行評議專業(yè)性方面的問題，那么，在20多年后的2018年，被稱為“索卡爾事件2.0版”的學(xué)術(shù)惡作劇的發(fā)生就再次提醒我們應(yīng)看到同行評議的局限性?！安ㄌ靥m州立大學(xué)的助理教授Peter Boghossian和他的幾位同伴公開揭示了他們精心籌備一年之久的學(xué)術(shù)惡作劇——他們把偽造的二十篇論文寄給人文社科領(lǐng)域的知名期刊，結(jié)果竟然有七篇通過重重審議得以發(fā)表……這些數(shù)據(jù)可疑、結(jié)論荒謬的論文能夠輕易蒙混過關(guān)的事實再一次激發(fā)了大眾對于人文社科部分領(lǐng)域嚴(yán)肅性與學(xué)術(shù)價值的嘲諷和質(zhì)疑?！盵注]王晨陽：《學(xué)術(shù)惡作劇成功發(fā)表：人文社科領(lǐng)域被后現(xiàn)代話語敗壞了嗎？》，澎湃新聞，2018年10月15日。盡管索卡爾事件2.0版針對的主要目標(biāo)不在同行評議，但同樣可以用來說明同行評議的專業(yè)性并非無可挑剔。事件所涉及的期刊，無一不是實行嚴(yán)格的同行專家匿名審稿制的。索卡爾事件2.0版雖然仍然是一個惡作劇事件，但在此事件中竟然有三分之一多的著名期刊中槍，怎不令人震驚！匿名審稿制無疑是同行評議之一種，而在所有種類的同行評議中，匿名審稿是受到其他因素干擾最少的。不能不說在學(xué)科分化和專業(yè)分工日益精細(xì)的當(dāng)下，同行評議的專業(yè)性正在受到前所未有的挑戰(zhàn)。

與專業(yè)性相比，同行評議所要求的自律性所遭遇的問題更為嚴(yán)峻。如前所述，學(xué)術(shù)共同體被“三大核心”取代而逐步退出學(xué)術(shù)評價是從1990年代開始，造成這一局面的主要原因是同行評議的自律性遭到了大范圍的質(zhì)疑而不在其專業(yè)性的缺陷，自律性的失去與學(xué)術(shù)生態(tài)的惡化是分不開的，如李劍鳴教授所言：在“權(quán)力支配，人情主導(dǎo)，標(biāo)準(zhǔn)缺失”的大環(huán)境下，“三者只要居其一，都會使學(xué)術(shù)評價的意義受到嚴(yán)重?fù)p害”[注]李劍鳴：《自律的學(xué)術(shù)共同體與合理的學(xué)術(shù)評價》，《清華大學(xué)學(xué)報》(哲學(xué)社會科學(xué)版)，2014年第4期。。那么，今天的學(xué)術(shù)生態(tài)有根本性改變了嗎？學(xué)界中人大概都會給出否定性的回答。因為學(xué)術(shù)生態(tài)惡化所導(dǎo)致的學(xué)術(shù)不端現(xiàn)象不是減少而是增多了，其程度不是減輕了而是更嚴(yán)重了，甚至到了公眾見怪不怪，若沒有挑戰(zhàn)底線的事情發(fā)生都不算個事的地步。

最近的一起轟動全國的挑戰(zhàn)底線的事當(dāng)數(shù)北京電影學(xué)院翟博士學(xué)術(shù)不端事件，該事件起因于這位博士在網(wǎng)上曬出北京大學(xué)光華管理學(xué)院博士后錄取通知書，很快有網(wǎng)友扒出了該博士竟然不曉知網(wǎng)為何物的視頻，一位博士怎么可能不識知網(wǎng)？這實在是挑戰(zhàn)了所有皓首窮經(jīng)苦讀學(xué)位的學(xué)子們的底線，于是，圍繞該博士的學(xué)位何以獲得的一系列貓膩都相繼被扒了出來。對于這個引起公憤的事件，涉事的北京電影學(xué)院和北京大學(xué)及時作出了回應(yīng)和處理，不出所料地取消了涉事者的博士頭銜和博士后入站資格。輿論界對翟博士的學(xué)術(shù)不端行為有大量的報道和聲討文字[注]關(guān)于這一事件的來龍去脈網(wǎng)上有大量報道，恕不一一列出了。，這里只想指出，翟博士的學(xué)術(shù)不端行為固然值得聲討，但同行評議的聲譽也因此降到了冰點更值得深思和警惕。如果說，前述梁教授因鉆了量化評價的空子而獲益，那么，翟博士的“成功”與同行評議的墮落則是分不開的。無論是博士學(xué)位的授予還是博士后錄取資格的授予，都繞不過同行評議，前者需要通過嚴(yán)格的答辯，后者需要通過資格審查和面試，這些都可歸為同行評議，而且是小同行評議。有關(guān)授予單位既然用了短短幾天或十幾天的時間就可以調(diào)查清楚并明確作出結(jié)論，顯然弄清該博士的學(xué)術(shù)水平和學(xué)術(shù)研究的價值是否與其獲得的學(xué)位和資格相稱、是否存在學(xué)術(shù)不端行為并不困難，為何此前由同行專家組成的答辯委員會和錄取機構(gòu)的考核把關(guān)形同虛設(shè)？如果說該事件只是個案，并不能說明問題的普遍性，那么，近年來那么多日理萬機的官員紛紛在職通過學(xué)術(shù)論文答辯而獲得博士學(xué)位，難道他們都是天賦過人的學(xué)術(shù)奇才？

如果說匿名審稿制是對同行評議專業(yè)性的考驗，那么，學(xué)位論文答辯則是對同行評議自律性的考驗。學(xué)位論文答辯是典型的“代表作評價制度”下的評價，學(xué)位論文應(yīng)該說是學(xué)位申請者至少經(jīng)三年苦讀而拿出的最具代表性的成果，答辯委員的選擇也有嚴(yán)格的專業(yè)資格和標(biāo)準(zhǔn)設(shè)定，但這樣標(biāo)準(zhǔn)的同行評議在人情和利益面前竟然如此脆弱不堪，在事涉大至動輒成百上千萬甚至更多的科研項目分配，小到個人職稱評審、考核這樣各色各類的評價中，我們又怎么敢寄希望于同行評議能夠做到自律？在同行評議仍然聲名狼藉的今天，我們又怎能指望“代表作評價制度”能獨善其身？

在目前的學(xué)術(shù)生態(tài)下，無論是專業(yè)性還是自律性，同行評議都很難做到。作為一種學(xué)術(shù)制度，“代表作評價制度”目前尚處于試驗階段，只是部分高校在職稱評審中嘗試實行，或者作為量化標(biāo)準(zhǔn)的補充[注]如復(fù)旦大學(xué)2010年就宣布“試行‘代表作’學(xué)術(shù)評價制度，2011年擴大到文科領(lǐng)域，2012年將在全校鋪開”，但同時申明：“復(fù)旦大學(xué)推行代表作制，并沒有拋棄原有的‘?dāng)?shù)論文’式的評價方式，只是把‘代表作’制作為一種輔助評價手段，實行雙軌評價?！?《復(fù)旦大學(xué)今年起全面推行“職務(wù)聘任代表作制”》，《新課程研究》，2012年第6期)，無論教育部還是各高校都還沒有制定出詳備的可行性方案或規(guī)則，上述“中央兩辦”文件也只是規(guī)定了基本原則，而這些原則如何落到實處并大面積推廣，還有待探討。即使行政權(quán)力部門強力推行，在將“三大核心”這樣的排行榜強行壓制之后，1990年代同行評議被定量評價逐出學(xué)術(shù)評價領(lǐng)域的那一幕還會重演，類似“三大核心”的排行榜仍會卷土重來。因為，與墮落了的同行評議相比，評價機構(gòu)的期刊排行榜畢竟還有一個客觀的數(shù)據(jù)在那支撐著，如果沒有必要的制約手段，“代表作評價制度”在抵御“制度腐敗”方面遠不如排行榜靠譜。

由此可見，無論是“定量評價與定性評價相結(jié)合”，還是“代表作評價制度”，其主張者雖然都描繪了取代“以刊評文”的所謂定量評價的美好愿景，但要真正實現(xiàn)替代恐怕還有很長的路要走。在走完這條艱難的長路之前，取代類似“三大核心”這樣的期刊排行榜的公正的學(xué)術(shù)共同體評價都只會是水中月、鏡中花，要想獲得學(xué)術(shù)界的一致認(rèn)可，甚至多數(shù)認(rèn)可都是不可能的。

七

行文至此，對前述觀點作一小結(jié)。學(xué)術(shù)界和學(xué)術(shù)期刊界與評價機構(gòu)的“纏斗”已不下二十年，之所以至今難分勝負(fù)，是因為評價機構(gòu)有著自己的理論支撐和數(shù)據(jù)支持，更因為其以排行榜為主要形式的產(chǎn)品(“三大核心”) 滿足了行政權(quán)力的偏好，得到了行政權(quán)力事實上的采信，成功地將學(xué)術(shù)共同體的同行評議驅(qū)逐出了評價領(lǐng)域；但評價機構(gòu)也有著自身無法克服的缺陷——因為專業(yè)能力的缺乏，其理論、數(shù)據(jù)和算法及結(jié)果都有經(jīng)不起推敲之處，更因為其排行榜在學(xué)術(shù)評價實踐中的運用導(dǎo)致了一系列嚴(yán)重的問題，為學(xué)術(shù)界和學(xué)術(shù)期刊界鍥而不舍的抵制和討伐源源不斷地提供了動力和炮彈。在現(xiàn)行的科研體制之下，行政權(quán)力一方面是高于學(xué)術(shù)界和學(xué)術(shù)期刊界以及評價機構(gòu)的唯一存在，另一方面卻也有著為科研服務(wù)的基本屬性，故既不能不顧學(xué)術(shù)界和學(xué)術(shù)期刊界的意見，不能無視排行榜在運用于評價時出現(xiàn)的問題，但卻又無法拋棄“三大核心”，因為離開了“三大核心”，行政權(quán)力就難以順暢地運行。兩難之下，找到可以為學(xué)術(shù)界和學(xué)術(shù)期刊界接受的“三大核心”的替代的產(chǎn)品無疑是最好的選擇，但這又談何容易？在找到這樣的替代產(chǎn)品之前，面對學(xué)術(shù)界和學(xué)術(shù)期刊界與評價機構(gòu)的“纏斗”，行政權(quán)力左右為難，舉棋不定，從而“纏斗”也就一直持續(xù)了下來。然而，維持這樣的“纏斗”是要以學(xué)術(shù)研究受到傷害為代價的。二十年來，行政權(quán)力雖不公開授權(quán)，但卻不阻止“三大核心”在事涉資源分配和科研管理中發(fā)揮決定性的作用，使得學(xué)術(shù)界不得不屈從于這樣的“指揮棒”，繼而從屈從發(fā)展到刻意迎合，某些人甚至不惜因此造假。學(xué)術(shù)不端行為的普遍發(fā)生只是學(xué)術(shù)研究遭受傷害的表現(xiàn)形式之一，實質(zhì)性的傷害更在于學(xué)術(shù)研究的機體遭到侵蝕而不能健康發(fā)展。時至今日，這種傷害正愈演愈烈，以至于行政權(quán)力也不得不出手干預(yù)了。

2018年權(quán)力頂層發(fā)起的清理“四唯”“五唯”行動，清理范圍涵蓋了法律和行政法規(guī)、各類考核評價條件和指標(biāo)、有關(guān)管理信息系統(tǒng)和工作表格等等，似可視為對多年來重“量”輕“質(zhì)”的量化評價的雷霆掃穴之舉，但只要細(xì)讀一下這些文件就可以發(fā)現(xiàn)，清理行動并無意將量化評價逐出評價領(lǐng)域，甚至也不會將“三大核心”這樣的排行榜完全廢棄，而只是通過清理行動改變唯此獨尊的地位，恢復(fù)學(xué)術(shù)共同體在評價中的應(yīng)有地位，讓同行評議重回評價領(lǐng)域并且與各種排名實現(xiàn)融合和互補[注]2018年“中央兩辦”《關(guān)于深化項目評審、人才評價、機構(gòu)評估改革的意見》指出：“SCI(科學(xué)引文索引)和核心期刊論文發(fā)表數(shù)量、論文引用榜單和影響因子排名等僅作為評價參考?！⒅匕l(fā)揮同行評議機制在人才評價過程中的作用?！惫嫒绱耍u價機構(gòu)僅靠制作排行榜獨霸評價是不可能了，但作為評價的參考還是可以存在的。?？梢娦姓?quán)力也明白重建評價的艱難，故希望各方面共同合作，從而也為評價機構(gòu)、學(xué)術(shù)界、學(xué)術(shù)期刊界在今后的評價重建中作出各自恰如其分的努力和貢獻留下了充分的余地。由此，學(xué)術(shù)界與學(xué)術(shù)期刊界與評價機構(gòu)的“纏斗”也許會轉(zhuǎn)向合作，共建未來的評價。當(dāng)然，這樣的愿景是否會實現(xiàn)，還取決于學(xué)術(shù)生態(tài)能否改善和評價機構(gòu)對自身進路的選擇。

如前所述，對于行政權(quán)力的決策，評價機構(gòu)要敏感得多，因為他們手中所握有的評價權(quán)力是由行政權(quán)力所賦予的，來自行政權(quán)力特別是最高權(quán)力部門對學(xué)術(shù)評價態(tài)度哪怕任何細(xì)微的改變，都足以對評價機構(gòu)的前途造成決定性的影響。除了重視和迎合行政權(quán)力的意志以外，評價機構(gòu)雖然極少正面回應(yīng)來自學(xué)術(shù)界和學(xué)術(shù)期刊界的批評，但并不代表他們對這些批評的無視，恰恰相反，他們對這些批評的重視程度一點不亞于對行政權(quán)力的重視。他們不會不明白，來自部分學(xué)者和期刊人的批評一旦成為學(xué)術(shù)界和學(xué)術(shù)期刊界乃至輿論界的共識，是足以影響行政權(quán)力決策的。正因為如此，近年來，針對學(xué)術(shù)界和學(xué)術(shù)期刊界的批評，以“三大核心”為代表的評價機構(gòu)拿出了許多應(yīng)對之舉，比如：加強對支撐其產(chǎn)品的評價理論的宣傳，開拓評價數(shù)據(jù)的挖掘范圍，提高評價數(shù)據(jù)內(nèi)含質(zhì)量，改變具體的評價方法和程序，直到讓渡部分已掌握的評價權(quán)力，吸納部分學(xué)者和期刊人參與其產(chǎn)品的制作，等等，以盡可能地改變自身的形象，力保自己在學(xué)術(shù)評價中的地位。這也是“三大核心”沒被行政權(quán)力拋棄的重要原因之一。

另一個重要原因就是評價機構(gòu)并非一無是處。多年來，評價機構(gòu)實際上充當(dāng)了兩種角色，其一是評價數(shù)據(jù)的采集者和挖掘者；其二是利用這些數(shù)據(jù)進行運算的評價者。后一角色是對學(xué)術(shù)共同體的取代，明顯越界了，因其不具備各學(xué)科專業(yè)分析能力，決定了他們不可能是合適的評價主體。但前一個角色他們還是有一定的優(yōu)勢的，他們二三十年來創(chuàng)造的最大價值不是期刊排行榜，而是他們挖掘或掌控的大量評價數(shù)據(jù)。這些數(shù)據(jù)對于學(xué)術(shù)研究、學(xué)術(shù)期刊和科研管理都是可以有獨到作用的，至于“三大核心”是否發(fā)揮了這些數(shù)據(jù)的價值則是另一回事。在筆者看來，在清理“四唯”“五唯”的高壓下，正是這些數(shù)據(jù)，不僅可以使制作“三大核心”的評價機構(gòu)不致轟然倒塌，而且在未來學(xué)術(shù)評價機制重建的過程中還可以起到難以替代的作用。所以，對于評價機構(gòu)來說，放棄評價主體，回歸數(shù)據(jù)挖掘者的定位，是確保他們發(fā)揮自身作用不被驅(qū)逐出評價領(lǐng)域的最佳選擇。但是，能否真正回歸這一定位，并不是每個評價機構(gòu)都愿意或都能夠做到的。

由于各自的傳統(tǒng)、擁有的資源以及既有產(chǎn)品形式的不同，“三大核心”的制作者在進路設(shè)計方面表現(xiàn)出了不同的選擇。限于篇幅，本文無法對此作出全面的分析和評論，僅根據(jù)“三大核心”近年來主要的變化，對其進路選擇和可能造成的結(jié)果略作評論。

在“三大核心”中，北京大學(xué)圖書館等單位聯(lián)合制作的《中文核心期刊要目總覽》(以下簡稱《總覽》)問世最早，當(dāng)它于1992年首次出版時，只是作為各圖書館訂閱期刊的參考工具書而編制的，雖然也與評價有關(guān)，但當(dāng)時的學(xué)術(shù)評價尚是同行評議的天下，其制作者大概不會想到在學(xué)術(shù)評價中會有今天這樣的地位?！犊傆[》的問世讓正呼喚量化評價的學(xué)術(shù)界看到了同行評議的替代品，《總覽》的功能開始越界，逐步由圖書館訂閱工具書過渡到期刊評價標(biāo)準(zhǔn)再擴展成為學(xué)術(shù)評價標(biāo)準(zhǔn)。公正地說，這一功能越界行為并非《總覽》制作者單一努力的結(jié)果，學(xué)術(shù)界出于對量化評價的渴望而在其中的推波助瀾可謂功不可沒。當(dāng)然，《總覽》的制作者是樂見其成的。隨著《總覽》評價功能的越界展開，特別是批評討伐之聲漸起以及行政權(quán)力對改革評價的回應(yīng)，《總覽》制作者意識到原初的遴選方法太過原始和簡單了，于是有了在評價理論和制作實踐方面的諸多發(fā)展。

2018年，《總覽》第8版(2017年版)正式出版，使我們可以從這新版的變與不變化中一窺其進路選擇。不變有二：其一，所依憑的評價理論和使用的基本方法不變?！啊犊傆[》(2017年版)……在總體研制原則和研制方法上仍延續(xù)以往各版的做法?！盵注]張俊娥、蔡蓉華：《中文核心期刊要目總覽(2017年版)研究報告》，《中文核心期刊要目總覽》(2017年版)，北京：北京大學(xué)出版社，2018年版，第79-99頁。其二，以期刊排行榜為最終產(chǎn)品的形式不變。與不變相比，新版《總覽》的變化更引人注目。首先，雖然理論不變，但制作者在對其產(chǎn)品作用的認(rèn)定上大大地收縮了，似乎想退回到越界前的范圍內(nèi)：“為圖書情報界、出版界等需要對期刊進行評價的用戶提供參考，不具備全面評價期刊優(yōu)劣的功能，不能作為衡量期刊質(zhì)量的標(biāo)準(zhǔn)，更不能作為學(xué)術(shù)評價的標(biāo)準(zhǔn)。”[注]張俊娥、蔡蓉華：《中文核心期刊要目總覽(2017年版)研究報告》，《中文核心期刊要目總覽》(2017年版)，北京：北京大學(xué)出版社，2018年版，第79-99頁。其次，評價指標(biāo)數(shù)量有明顯增加，新版《總覽》較上一版指標(biāo)數(shù)量增加了三分之一，達到了16種。再次，如果說《總覽》的制作者是以搜集、整理評價數(shù)據(jù)并進行加權(quán)運算起家的，那么，隨著指標(biāo)數(shù)量的增加，其制作者逐漸放棄了數(shù)據(jù)的搜集工作，新版《總覽》所有的數(shù)據(jù)已不再自己采集，而直接來自其他機構(gòu)[注]詳見張俊娥、蔡蓉華：《中文核心期刊要目總覽(2017年版)研究報告》，“表4《中文核心期刊要目總覽》(2017年版)各評價指標(biāo)統(tǒng)計源”。。最后，參與所謂“定性評價”專家隊伍的擴展[注]詳見張俊娥、蔡蓉華：《中文核心期刊要目總覽(2017年版)研究報告》，“表6《總覽》各版參評專家數(shù)量”。。

這些變與不變說明了什么？又將給《總覽》帶來怎樣的命運？綜合上述“四變”“兩不變”來看，《總覽》制作者選擇的是一條以退為進的路徑。對于他們說來，未見得不明白排行榜的弊病和在未來評價中必將被弱化的命運，未見得不明白數(shù)據(jù)才是安身立命的根本，但一方面要舍棄已在各界形成很大影響的《總覽》這樣的排行榜是難痛下決心的，另一方面，他們在此前就放棄了原始數(shù)據(jù)的采集和挖掘，現(xiàn)已無法彌補。所以，“兩不變”是不得已的選擇。在獨立數(shù)據(jù)庫建設(shè)基本無望、排行榜為產(chǎn)品唯一形式無法改變的情況下，他們的“四變”實際上是對數(shù)據(jù)采集和挖掘者角色的主動丟棄，甚至不惜在名義上放棄一貫以來所堅持的作為期刊評價乃至學(xué)術(shù)評價產(chǎn)品的定位，而寄希望于通過評價指標(biāo)、評價方法(算法)的改變換取一個評價者的地位。應(yīng)該說，這也是基于利益算計的一種可以理解的選擇。畢竟科學(xué)的評價機制非短時間可以打造，能替代《總覽》的產(chǎn)品何時才能問世，有太多的不確定因素，在此之前，憑著《總覽》多年來的影響，也許還能維持相當(dāng)一段時間。

晚于《總覽》問世的第二大“核心”是中國社會科學(xué)院文獻信息中心制作的《中國人文社會科學(xué)核心期刊要覽》(以下簡稱《要覽》)，其制作原理和產(chǎn)品形式與《總覽》基本一致，都是根據(jù)綜合指標(biāo)制作的期刊排行榜。不過，除了制作者單位不同以及只涉及人文社會科學(xué)期刊以外，其制作動機已明顯偏向要在學(xué)術(shù)評價中分一杯羹了，因為此時《總覽》已成功越界成了學(xué)術(shù)評價的一個新標(biāo)準(zhǔn)。因為形式雷同，而《總覽》先行了一步，所以問世以后，《要覽》的影響總不及《總覽》。這一情況在2013年發(fā)生了重大變化，這一年，中國社會科學(xué)評價中心宣告成立，翌年即高調(diào)推出《中國人文社會科學(xué)期刊評價報告》(以下簡稱《評價報告》)，此后，《要覽》的制作雖被歸入該中心名下，但一直未見更新，事實上已被《評價報告》所取代。《評價報告》雖然仍是個期刊排行榜，但該中心的出場卻表現(xiàn)出了與以往評價機構(gòu)完全不同的氣勢。首先，一改以往評價機構(gòu)在自身評價主體認(rèn)定上躲躲閃閃的底氣不足，不僅儼然以天然的評價主體的身份自居，而且大有一統(tǒng)學(xué)術(shù)評價、號令天下的雄心：“‘以制定標(biāo)準(zhǔn)、組織評價、檢查監(jiān)督、保證質(zhì)量’為主要職責(zé)，以制定和完善中國哲學(xué)社會科學(xué)評價標(biāo)準(zhǔn)，承擔(dān)和協(xié)調(diào)中國哲學(xué)社會科學(xué)學(xué)術(shù)評價，構(gòu)建和確立中國特色哲學(xué)社會科學(xué)評價體系為主要職能?！盵注]《中國社會科學(xué)評價研究院簡介》，http://skpj.cssn.cn/xspj/zxgk/zxjj/。其次，創(chuàng)造性地提出了《中國人文社會科學(xué)期刊綜合評價體系(AMI)》，將評價指標(biāo)涉及的范圍大大擴展。再次，將排行榜上期刊的等級進一步細(xì)化，創(chuàng)造性地在“核心期刊”之上劃分出了“頂級期刊”“權(quán)威期刊”。最后，宣布將著手建立適應(yīng)這一新體系的數(shù)據(jù)資源。2017年，中國社會科學(xué)評價中心更名為中國社會科學(xué)評價研究院，2018年，新版《評價報告》繼續(xù)高調(diào)推出。除了承繼第一版的諸多特點外，新版《評價報告》最大的改變有二：一是將其制作的期刊排行榜命名為“A刊”；二是引入專家參與評刊。

如果說《總覽》制作者采取的是低調(diào)收縮的策略，那么，《評價報告》制作者采取的則是高調(diào)擴張和超越行政權(quán)力的戰(zhàn)略。主要表現(xiàn)有二：其一，借助中國社會科學(xué)院在科研體制中的特殊地位，將制訂與完善中國學(xué)術(shù)評價的標(biāo)準(zhǔn)和承擔(dān)中國學(xué)術(shù)評價的重任加于自身。此前的評價機構(gòu)雖不缺此抱負(fù)，但畢竟還希望通過行政權(quán)力授權(quán)和學(xué)術(shù)界以及學(xué)術(shù)期刊界的認(rèn)可來謀求合法化，而《評價報告》制作者們則繞過行政權(quán)力和學(xué)術(shù)界，直接自我授權(quán)了。其二，其所推出的AMI綜合指標(biāo)體系與自我授權(quán)相配合，指標(biāo)的設(shè)置已大大超出了傳統(tǒng)核心期刊所采集或運用期刊形式數(shù)據(jù)的范圍。AMI由吸引力、管理力和影響力三部分構(gòu)成，除了保留了核心期刊常用指標(biāo)，新增的指標(biāo)主要集中于各期刊雜志社或編輯部的內(nèi)部規(guī)制和運行，并輔之以扣分的手段。這不僅是對學(xué)術(shù)評價權(quán)的要求，而且染指行政管理和雜志社(編輯部)內(nèi)部業(yè)務(wù)的目的已非常清晰。當(dāng)然，也只有這樣，他們一統(tǒng)評價天下的目的才有望達到。那么，他們的目的能達到嗎？如果達到了又會給學(xué)術(shù)界和學(xué)術(shù)期刊界帶來怎樣的影響？

一個人或一個機構(gòu)的雄心能否實現(xiàn)，還是要取決于其能力。評價研究院如果有此能力，至少要做到如下幾點：第一，盡管他們可以自說自話自我授權(quán)，但這樣的做法，勢必打破現(xiàn)行主管主辦制為標(biāo)志的報刊管理體制，所以是繞不過行政權(quán)力和學(xué)術(shù)界以及學(xué)術(shù)期刊界的承認(rèn)的，他們必須邁過從自我授權(quán)到獲得正式授權(quán)和具備公信力這一關(guān)。第二，也是最根本的，要獲得公信力，就必須證明《評價報告》是一個科學(xué)評價范本。盡管《評價報告》的制作者有很多創(chuàng)造性之舉，但就其產(chǎn)品而言，在本質(zhì)上，與《總覽》和《要覽》沒什么區(qū)別，都是通過綜合指標(biāo)加權(quán)運算而得出的期刊排行榜，故而他們必須證明排行榜就是科學(xué)評價。第三，為了拓展權(quán)力邊界，AMI較《要覽》新增了大量的指標(biāo)[注]“AMI 綜合評價指標(biāo)體系……由3個一級指標(biāo)、10個二級指標(biāo)和24個三級指標(biāo)構(gòu)成”(中國社會科學(xué)評價院：《中國人文社會科學(xué)期刊AMI綜合評價報告(2018年)》，2018年11月16日，第二篇：A刊評價報告，第1頁)，http://www.cssn.cn/xspj/xspj_yw/201811/W020181119593425785869.pdf。，特別是涉及期刊制作業(yè)務(wù)和管理的指標(biāo)，撇開其合法性不談，在技術(shù)上也大大增加了數(shù)據(jù)采集、整理、分析的難度，僅保證數(shù)據(jù)的真實可靠，就不是一個評價機構(gòu)所能輕言做到的，因此，他們必須證明在數(shù)據(jù)采集和處置方面自己具有超越常人的能力。

在筆者看來，以上三點，不僅評價研究院，任何一家以排行榜為唯一產(chǎn)品的評價機構(gòu)都不會具此能力的。事實也是如此，老牌的評價機構(gòu)如《總覽》的制作者已深知滿足這些條件之艱難而選擇了退卻；《評價報告》的制作者雖然勇氣可嘉，但評價研究院成立至今，除了其所在的中國社會科學(xué)院以外，又有幾家大學(xué)或科研機構(gòu)認(rèn)同其自我授權(quán)呢？《評價報告》問世至今，又有幾家大學(xué)或科研機構(gòu)將它列為評價的標(biāo)準(zhǔn)了呢？也幸虧如此，不然，僅其別出心裁推出的“頂級期刊”“權(quán)威期刊”等新的期刊級別，定會把以排行榜為形式的量化評價推向極致，定會使“以刊評文”這樣扭曲了的評價歪風(fēng)愈演愈烈。當(dāng)然，也不能排除另外一種可能，那就是憑借中國社會科學(xué)院所具有的特殊優(yōu)勢，說動行政權(quán)力強行授權(quán)，使學(xué)術(shù)評價定于《評價報告》之一尊，那么，結(jié)果必定是災(zāi)難性的。除了“以刊評文”的歪風(fēng)難止以外，允許不具備各學(xué)科專業(yè)研究能力的評價人員組成的評價研究院直接插手乃至指揮各期刊社(編輯部)的編輯出版業(yè)務(wù)，必將在評價機構(gòu)與期刊之間建立起一種顛倒的關(guān)系，是對學(xué)術(shù)期刊和學(xué)術(shù)共同體權(quán)利的嚴(yán)重僭越。

其實，以“A刊”命名自己的排行榜，評價研究院并非首家。2016年4月，教育部學(xué)位與研究生教育發(fā)展中心決定開展全國第四輪學(xué)科評估，同時推出一項重要的改革措施，即在判斷科學(xué)研究水平時，“在人文社會科學(xué)采用‘A類期刊’指標(biāo)”[注]教育部學(xué)位與研究生教育發(fā)展中心：《全國第四輪學(xué)科評估邀請函》，學(xué)位中心〔2016〕42號。，以取代往屆評估中使用的“C刊”(CSSCI來源期刊目錄)，并發(fā)布了由其編制的“A刊”目錄。然而，半個月后該中心就宣布放棄“A刊”，恢復(fù)使用“C刊”。“A刊”之所以短命，不僅因為它是一個新期刊榜，更是因為它是一個即將成為學(xué)科評估標(biāo)準(zhǔn)的新期刊榜，才在遭到了遠遠超出該中心預(yù)料的學(xué)術(shù)界的猛烈抵制和抨擊后草草收場。評價研究院以“A刊”自命期刊榜，多少有點力壓“C刊”的意思，但不免有拾人牙慧之嫌?？梢灶A(yù)料的是，一旦如評價研究院所愿，他們的“A刊”能夠成為一個為行政權(quán)力所公開認(rèn)可的評價標(biāo)準(zhǔn)，那么，必然引發(fā)學(xué)術(shù)界和學(xué)術(shù)期刊界與該評價機構(gòu)新一輪的“纏斗”。實際上，對《評價報告》的批評之聲從其問世時就有了，之所以在學(xué)術(shù)界沒有出現(xiàn)像對“C刊”那樣的激烈討伐，只是因為在中國社會科學(xué)院以外，沒幾個學(xué)術(shù)單位視其為標(biāo)準(zhǔn)，也就沒多少學(xué)者真的把它當(dāng)回事而懶得搭理它了。

“三大核心”中，CSSCI來源期刊目錄問世最晚，也是被誤解誤用最多的。來源期刊和核心期刊原本就不是一回事，兩者最大的區(qū)別在于數(shù)據(jù)與期刊目錄的關(guān)系：核心期刊制作者采集數(shù)據(jù)是為了生產(chǎn)期刊排行榜，排行榜是其最終也是唯一產(chǎn)品；CSSCI制作者評選來源期刊只是為了確定數(shù)據(jù)源，其最終產(chǎn)品是引文數(shù)據(jù)庫，即CSSCI。所以，“CSSCI”和“CSSCI來源期刊”所指是不同的。但因為來源期刊目錄也是通過遴選所得，所以也可以當(dāng)作期刊排行榜來使用。CSSCI于上世紀(jì)末問世之時，核心期刊已在學(xué)術(shù)評價中大行其道，當(dāng)來源期刊這個與數(shù)據(jù)相關(guān)的新的期刊目錄出現(xiàn)之時，對引文數(shù)據(jù)庫尚知之甚少的人文社會科學(xué)學(xué)者和期刊人將其視為核心期刊之一種也就不奇怪了。而作為后來者的CSSCI制作者們?yōu)榱吮M快在學(xué)術(shù)界和學(xué)術(shù)期刊界打出影響，也默認(rèn)和樂見這種誤解，于是，“三大核心”之說不脛而走。短短幾年之后，CSSCI來源期刊目錄即成功地反超了另兩大“核心”，CSSCI來源期刊也漸漸地有了“C刊”的代稱，在學(xué)術(shù)評價中的影響越來越大，而CSSCI(數(shù)據(jù)庫)的影響遠不如它，知“C刊”而不知CSSCI成為一種普遍現(xiàn)象。

CSSCI制作者很快就領(lǐng)教到了借“三大核心”成名的反噬之力。隨著“C刊”影響日隆，大約從2010年開始，學(xué)術(shù)界和學(xué)術(shù)期刊界對評價機構(gòu)討伐的矛頭所向由核心期刊轉(zhuǎn)向了“C刊”，最初對“C刊”的討伐幾乎全是討伐核心期刊的路數(shù)，令CSSCI制作者哭笑不得。痛定思痛，從此他們開始了有意識地加大作為引文數(shù)據(jù)庫的CSSCI意義的宣傳，并成為第一個也是迄今唯一的主動放棄學(xué)術(shù)評價主體定位的評價機構(gòu)，反復(fù)強調(diào)評價只是CSSCI的附帶功能，而其主要功能是為學(xué)術(shù)研究提供數(shù)據(jù)服務(wù)，從而由學(xué)術(shù)評價轉(zhuǎn)向了知識服務(wù)平臺的定位[注]參見王文軍：《檢索抑或評價：CSSCI 功能論析——兼論構(gòu)建引文索引數(shù)據(jù)庫的若干問題》，《澳門理工學(xué)報》，2013 年第 2 期。。

隨著近年來學(xué)術(shù)界和學(xué)術(shù)期刊界對CSSCI了解的逐步加深，CSSCI在學(xué)術(shù)研究中有了較多的運用，其對于學(xué)術(shù)研究、學(xué)術(shù)期刊的價值正在被不斷地開發(fā)出來，而如何確保數(shù)據(jù)真實性和準(zhǔn)確性等數(shù)據(jù)質(zhì)量的問題也就被提了出來。與此同時，由于學(xué)術(shù)評價機制并沒有改變，“以刊評文”依然如故，“C刊”在評價中的風(fēng)頭不僅不減，且因各界對CSSCI認(rèn)同度的提高而風(fēng)頭更盛，“C刊”在評價中的現(xiàn)實作用并沒有因為CSSCI制作者身份定位的轉(zhuǎn)向而有改變，故而遭遇批評和討伐仍然不可避免，如果剔除情緒性的發(fā)泄，理性批評的矛頭已漸漸地集中于遴選“C刊”所依據(jù)的數(shù)據(jù)的質(zhì)量瑕疵?？梢?，數(shù)據(jù)的質(zhì)量問題已成為CSSCI制作者如何面對批評和如何實現(xiàn)自身價值所必須解決的迫切問題。

對于引文數(shù)據(jù)庫來說，原始數(shù)據(jù)是否真實似乎是期刊和作者的問題，但在現(xiàn)行科研體制和評價機制之下，虛假數(shù)據(jù)實際上是和評價機構(gòu)的偏好緊密關(guān)聯(lián)的，造假的目的就是為了在基于排行榜的各種評價中獲利，故而直接的根源還在評價機構(gòu)的指標(biāo)體系。在科研體制和評價機制沒有根本改變的情況下，“C刊”仍會作為評價所用的排行榜而存在，數(shù)據(jù)造假現(xiàn)象就很難從根源上杜絕。CSSCI制作者要保證其引文數(shù)據(jù)庫的質(zhì)量，就必須盡可能減少虛假數(shù)據(jù)對數(shù)據(jù)源遴選造成的影響。具體而言，主要需解決兩方面的問題：其一，虛假引用，最突出的是“互惠”引用；其二，期刊論文質(zhì)量極不平衡問題。這兩者解決不好都會造成來源期刊遴選的失當(dāng)。

由于新版CSSCI來源期刊目錄尚未發(fā)布，針對數(shù)據(jù)質(zhì)量問題，將會有哪些遴選方法的改進尚不得而知，但從上一版發(fā)布以來CSSCI制作者所做的一些嘗試性工作大致也可看出端倪。要防止虛假引用或互惠引用對數(shù)據(jù)質(zhì)量的影響，前提是在海量數(shù)據(jù)中將它們識別出來，如今在技術(shù)上做到這一點已沒有太多困難，困難的是對這些數(shù)據(jù)如何處理，是視而不見，還是剔除不實數(shù)據(jù)了事，或是把有數(shù)據(jù)不實現(xiàn)象的期刊排除出遴選范圍？個中的分寸頗難把握。面對虛假數(shù)據(jù)問題，新版CSSCI來源期刊在遴選時有何新舉措，我們不妨拭目而待。相對于虛假數(shù)據(jù)，鑒別和處置論文質(zhì)量不一的期刊難度要大得多，這不是通過技術(shù)可以解決的，因為這已屬于內(nèi)容評價，只有對期刊所刊載論文進行專業(yè)分析，才能得出結(jié)論。為此，CSSCI制作者建構(gòu)了“中文學(xué)術(shù)出版物評測發(fā)布系統(tǒng)”，這是一個網(wǎng)絡(luò)平臺，已通過一定的途徑吸納了數(shù)以千計的各學(xué)科專業(yè)學(xué)者和學(xué)術(shù)期刊編輯加盟，參與對期刊所發(fā)表論文的抽樣質(zhì)量評測，評測的口徑分為“創(chuàng)新程度、完備程度、難易程度、成果價值等四個部分”[注]王文軍：《定量與定性相結(jié)合何以可能？——構(gòu)建中國特色期刊評價指標(biāo)體系的思考》，待刊稿。。誠然，論文質(zhì)量評價是一個十分復(fù)雜和困難的問題，該系統(tǒng)也許不足以徹底解決這個問題，但對于識別少數(shù)魚龍混雜質(zhì)量參差的期刊應(yīng)該會有不錯的效果，因為鑒別粗制濫造濫竽充數(shù)論文的難度遠低于遴選最優(yōu)論文，一個合格的學(xué)者和編輯都會有這個能力。該系統(tǒng)已于2018年夏上線，相信經(jīng)過一段時間的摸索和數(shù)據(jù)積累，會在今后的來源期刊遴選中發(fā)揮一定的作用。

比較“三大核心”近年來的進路選擇，不難發(fā)現(xiàn)，CSSCI制作者之所以能主動實現(xiàn)身份定位的轉(zhuǎn)向，是因為其所擁有并一直公開發(fā)行的引文數(shù)據(jù)庫(CSSCI)，這是以制作核心期刊排行榜為唯一產(chǎn)品的另兩大“核心”所無法比擬和匹敵的。無論是《總覽》制作者的低調(diào)收縮，還是《評價報告》制作者的高調(diào)突進，他們都沒有改變自己作為評價主體的身份定位，其原因，除了不愿放棄手中在握的評價權(quán)力甚至還希望攫取更多的權(quán)力以外，還在于他們拿不出一個能夠為學(xué)術(shù)研究和學(xué)術(shù)期刊提供數(shù)據(jù)服務(wù)的數(shù)據(jù)庫，所以，他們?nèi)詴愿鞣N手段堅持排行榜的生產(chǎn)和推行。可見，當(dāng)年被視為同類的“三大核心”如今已分道揚鑣了。

重建學(xué)術(shù)評價機制應(yīng)該說是學(xué)術(shù)界、學(xué)術(shù)期刊界和行政權(quán)力多年來的共識，但直到清理“四唯”“五唯”行動發(fā)起之時，學(xué)術(shù)評價的現(xiàn)狀卻仍如筆者在十年前就指出的那樣：“行政部門不便作為，學(xué)術(shù)共同體不能作為，評價機構(gòu)勇于作為”[注]朱劍：《學(xué)術(shù)評價、學(xué)術(shù)期刊與學(xué)術(shù)國際化——對人文社會科學(xué)國際化熱潮的冷思考》，《清華大學(xué)學(xué)報》(哲學(xué)社會科學(xué)版)，2009年第5期。。如果說，我們可以將清理“四唯”“五唯”行動視為行政權(quán)力終于邁出了重建學(xué)術(shù)評價機制實質(zhì)性的一步，那么，真正能夠取代“三大核心”的必然是以學(xué)術(shù)共同體為評價主體的同行評議，而這將取決于制約同行評議的專業(yè)性和自律性條件何時具備，顯然，這將是一個無比艱難的過程?？梢灶A(yù)料的是，因為此前難以出現(xiàn)更好的替代品，類似“三大核心”這樣的期刊排行榜的存在將會伴隨這一過程的始終，只有同行評議公信力建立的那一天，它們才會真正退出學(xué)術(shù)評價。從這個意義上來說，“三大核心”的分道揚鑣不失為一件好事，至少其中之一——CSSCI的制作者已有意放棄評價主體的定位，而愿意僅作為一個評價數(shù)據(jù)的提供者而存在，由此也可以為各界提供一個認(rèn)識評價機構(gòu)應(yīng)有角色擔(dān)當(dāng)?shù)男乱暯恰?/p>

99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

“三大核心”：拿什么來取而代之？——學(xué)術(shù)評價的困境

一

二

三

四

五

六

七

“三大核心”：拿什么來取而代之？
——學(xué)術(shù)評價的困境