包雙葉
中國學(xué)術(shù)評價機制的問題出在哪里
——基于現(xiàn)代信息理論的研究
包雙葉
學(xué)術(shù)評價機制旨在通過其篩選功能,對學(xué)術(shù)水平作出客觀評定,以實現(xiàn)對學(xué)術(shù)造假行為的約束和對科技創(chuàng)新活動的激勵。在科學(xué)研究領(lǐng)域,由于信息不對稱格外顯著,所以,間接評價在學(xué)術(shù)評價中處于重要地位。在間接評價過程中,被評價者發(fā)送信號,評價者接收信號是間接評價得以有效進行的前提。只有選定了合適的信號,才能確保間接評價實現(xiàn)正向選擇的目標,學(xué)術(shù)評價機制才具有合理性和有效性。當前,我國在學(xué)術(shù)評價方面已經(jīng)確定了一套符合國際標準的信號系統(tǒng),但是由于“噪音”的廣泛存在,這些信號并不能有效反映評價對象的學(xué)術(shù)水平。因此,如何降低“噪音”是實現(xiàn)我國學(xué)術(shù)評價機制合理性和有效性的關(guān)鍵。
科技創(chuàng)新;文化環(huán)境;學(xué)術(shù)評價機制;制度分析
作為評價機制,學(xué)術(shù)評價機制具有一切評價機制的共性,它包括評價主體、評價內(nèi)容、評價標準與評價方法等一系列組成要素。就評價內(nèi)容而言,包括科技創(chuàng)新在內(nèi)的所有研究活動都是它的評價對象??萍紕?chuàng)新是指個體根據(jù)一定的目標和任務(wù),運用一切已知的條件,產(chǎn)生出新穎、有價值的精神成果、社會成果或者物質(zhì)成果的活動過程。如果活動產(chǎn)生的成果不是新穎的,此活動就僅僅是再造或者仿造,而不能說是創(chuàng)新。作為一種社會活動,科技創(chuàng)新與社會利益分配緊密相關(guān),諸如科研經(jīng)費的籌集和分配、科研成果的價值、研究人員的社會名譽乃至職稱評定、薪酬水平、生活待遇等等諸多方面都與研究成果是否具有創(chuàng)新意義,以及創(chuàng)新程度的大小密切相關(guān)。而對這些問題的回答就自然而然地進入了學(xué)術(shù)評價的范疇。學(xué)術(shù)評價的功能集中體現(xiàn)在兩個方面,即約束和激勵,諸如對學(xué)術(shù)造假行為的約束和對科技創(chuàng)新活動的激勵。
學(xué)術(shù)評價對學(xué)術(shù)造假行為的約束機制主要通過它的篩選功能來得以實現(xiàn)。由于研究活動與利益分配緊密相關(guān),科研水平的高低、科技創(chuàng)新的程度決定著研究者的社會地位及其在社會利益分配格局中處境。如何才能實現(xiàn)每位研究者和與其研究能力、研究成果相應(yīng)的社會名譽、職稱、薪酬水平、生活待遇相匹配 (matching),而不出現(xiàn)誤配,這就需要對研究者的研究能力和研究成果作出客觀的評價。但是,為研究者提供社會名譽和決定研究者的職稱、薪酬和待遇的主體往往是社會民眾、行政機關(guān)和各項基金的管理者等諸多方面。在一般情況下,這些主體往往對某一研究者的研究領(lǐng)域并不熟悉。如果他們完全聽信研究者對其研究能力和研究成果的自我評價來決定社會利益分配的話,那么在利益驅(qū)動下,研究者有可能夸大研究能力甚至偽造科研成果。顯然,研究者本人和社會民眾、行政機關(guān)、各項基金的管理者等其他主體對于研究者的能力水平具有不對稱的信息 (asymmetric infor ma-tion)。研究者對于他的研究能力和研究成果具有信息優(yōu)勢,而其他主體則在信息上處于劣勢?!?〕如果不能很好地解決信息不對稱引起的困境,那么社會利益將不能得到有效分配,科研活動將無法順利進行。于是,對研究者和研究成果的篩選,即認定那些有能力的研究者和有價值的研究成果,以及核實那些濫竽充數(shù)者和弄虛作假的研究成果,是解決信息不對稱的不二法門。
評價機制的篩選功能是對濫竽充數(shù)者和弄虛作假者的最好約束。而約束和激勵是一枚硬幣的兩個方面,正如打擊盜版就是支持正版,對學(xué)術(shù)不端行為的約束就是對科技創(chuàng)新的激勵。一套良好的學(xué)術(shù)評價機制能夠?qū)ρ芯空叩哪芰脱芯砍晒乃阶鞒隹陀^準確的評定,社會民眾、行政機關(guān)、各項基金的管理者等主體將會根據(jù)這一評定給予研究者與其研究能力相適應(yīng)的回報,這便自然形成了一套良好的科學(xué)研究的激勵體系。
信息不對稱是一種普遍存在的現(xiàn)象,這說明信息并非均勻地在各個主體之間分布,總存在信息優(yōu)勢的一方,也總存在信息劣勢的一方。一般而言,評價對象的擁有者或創(chuàng)造者在信息方面往往處于優(yōu)勢地位,而其他主體往往處于劣勢地位,這正是進行客觀評價的困難之處。盡管信息不對稱現(xiàn)象普遍存在,但是其嚴重程度卻因評價對象的復(fù)雜程度不同而不同。一般而言,評價對象越復(fù)雜,信息不對稱現(xiàn)象會越嚴重,反之亦反之。舉例來說,在商品市場上,商品的出售者對商品的了解程度往往多于商品的購買者,這就是俗語所說的“南京到北京,買的不如賣的精”。賣者對商品的質(zhì)量和價值擁有比潛在的買主更多的信息。這種信息不對稱隨著商品復(fù)雜程度的增加而增加,筆記本電腦市場上的信息不對稱就比西紅柿市場上的更為嚴重,人才市場上的信息不對稱就比筆記本電腦市場上的更甚,而科學(xué)研究往往是探索和開拓未知世界,在科學(xué)研究上的信息不對稱就遠遠嚴重于物質(zhì)商品市場上的信息不對稱,而成為信息不對稱的典型?!?〕
信息不對稱不僅給信息劣勢的一方帶來困難,同樣困擾著信息優(yōu)勢的一方。處于信息優(yōu)勢的一方雖然能夠?qū)υu價對象給出客觀評定,但是由于處于信息劣勢的一方缺乏足夠的信息,他們既不能獨立對評價對象作出客觀評定,也沒有足夠的信息來判定信息優(yōu)勢一方作出的評定是否真實客觀。于是,如何促進信息劣勢一方盡可能地對評價對象作出客觀評定,以及如何使信息優(yōu)勢一方對評價對象作出的評定被信息劣勢一方所接受,將是設(shè)計學(xué)術(shù)評價機制的核心問題。人類長期的實踐活動為解決這一困境提供了有用的經(jīng)驗。那就是,在信息不對稱的情況下,直接評價和間接評價是促進信息劣勢一方順利完成對某一評價對象作出客觀評定的不可或缺的兩個組成部分。直接評價是指某一評價主體,諸如潛在的商品購買者、人才市場的招聘方或者某一科研基金的管理者對某一商品、某一應(yīng)聘者或者某一研究者獨立地作出評定的評價方式。而間接評價是指某一評價主體通過參考其他評價主體對某一評價對象作出的評定來作出自己的評定的評價方式。直接評價和間接評價的相對重要程度因評價對象的復(fù)雜程度的不同而不同。一般來說,對于相對簡單的評價對象而言,人們往往較多地采用直接評價,而較少地采用間接評價。評價對象越復(fù)雜,人們就會越多地依賴間接評價,而較少地依賴直接評價。
假如某一個科研基金管理委員會決定選擇一位極具研究潛質(zhì)的青年學(xué)者進行資金資助,而數(shù)以百計的青年學(xué)者提出了申請,委員會將如何對他們作出客觀評價,進而成功地選擇出他們期望的那一個人呢?誠然,委員會可以采取面試的方式對眾多申請者進行直接評價,但是由于存在顯著的信息不對稱現(xiàn)象,委員會不可能熟悉每一位申請者的研究領(lǐng)域,因而難以作出有價值的評價。另外,委員會也可以根據(jù)每一位申請者的研究領(lǐng)域聘請相應(yīng)的研究同行來對其學(xué)術(shù)水平進行評價,對于委員會而言,這就是間接評價。那么,被聘請的專家對申請者的評價是否可以完全通過直接評價來完成呢?顯然不行,因為他們不可能對申請者十幾年,甚至幾十年的所有研究成果進行逐字逐句的評價,也必須借助于其他間接評價來完成自己對申請者學(xué)術(shù)水平的評價。
在委員會對申請者進行間接評價的過程中,申請者知道自己真實的研究水平,而委員會卻不得不對其研究水平進行猜測。然而,事情并不就此為止,水平高的研究者有著試圖將他們具有的真實研究能力的實情傳遞給委員會的動力,這個傳遞過程被稱為信號發(fā)送。〔3〕被發(fā)送的信號可以是各式各樣的,諸如在國家一級期刊、CSSCI來源期刊或中文核心期刊上發(fā)表學(xué)術(shù)論文的數(shù)量,論文的轉(zhuǎn)載情況或被引用次數(shù),國家級、省部級課題的主持或參與情況,學(xué)歷、學(xué)位或海外留學(xué)背景,本領(lǐng)域?qū)W術(shù)權(quán)威對自己學(xué)術(shù)水平的評價等等諸多方面。另外,在間接評價過程中,不僅申請者主動向評價主體發(fā)送信號,評價主體也往往會主動選定某種接受信號來對申請者進行間接評價。以上海社會科學(xué)院評定研究員為例,職稱評定委員會要求每位申請者必須滿足以下條件:“其一,取得現(xiàn)職稱以來,承擔了國家、省 (市)以及相應(yīng)的重點科研項目,或獨立從事具有重要學(xué)術(shù)價值或重大現(xiàn)實問題的課題研究工作。其二,取得現(xiàn)職稱以來,每年至少公開發(fā)表3萬字以上具有較高學(xué)術(shù)價值或重大實踐意義的論文或階段性成果;至少具備公開出版的、學(xué)術(shù)水平較高的個人研究性專著 1本 (15萬字以上);至少發(fā)表 8篇學(xué)術(shù)論文,其中甲類和乙類學(xué)術(shù)刊物上的論文至少 5篇,其中甲類刊物論文至少 2篇?!薄?〕職稱評定委員會對申請者提出的以上申請要求就是對申請者能力和資格的間接評價。他們通過考察申請者承擔或參與各項課題的級別和數(shù)量,申請者在各級別學(xué)術(shù)刊物上發(fā)表論文的數(shù)量來間接地對申請者進行評價。至于申請者申請到的各項課題是否名至實歸,申請者在甲類或乙類學(xué)術(shù)刊物上發(fā)表的論文是否與刊物的級別和水平相稱則由各項研究基金的管理者和各個甲類或乙類學(xué)術(shù)刊物的編輯委員會來評定,職稱評定委員會往往不會對這些問題進行重新評定或核準,而是在承認以上評定結(jié)果的權(quán)威性和客觀性的基礎(chǔ)之上,來對申請者的能力和資格作出間接評價。而承擔或參與課題的級別和數(shù)量以及論文發(fā)表的級別和數(shù)量便是職稱評定委員會主動選定接受的信號。
在學(xué)術(shù)評價中,間接評價非常重要;就間接評價而言,信號選擇至關(guān)重要。如果沒有信號,那么間接評價便無從進行,學(xué)術(shù)評價便無法順利完成。就學(xué)術(shù)評價而言,信號往往是由評價方選定,而由被評價方發(fā)送的。當然,也存在另一種情況,即雖然評價方并未選定并要求被評價方發(fā)送某一些信號,而被評價方認為這些信號有利于證明自己的研究能力,所以主動發(fā)送這些信號。信號的范圍較為廣泛,并處于不斷變遷之中。在學(xué)術(shù)評價中,文憑、職稱、社會榮譽、學(xué)習經(jīng)歷、工作經(jīng)歷、論文發(fā)表、專著出版等等往往成為一種信號,無論是在研究機構(gòu)的招聘,還是在職稱晉升過程中,都發(fā)揮著重要的作用。
選擇了信號,才能進行間接評價,完成整體評價。只要信號是確定和可衡量的,那么無論這些信號是什么,評價方都可以據(jù)此完成間接評價,但這一評價卻不一定具有合理性和有效性。舉例來說,前蘇聯(lián)時期,文化主管部門為了評價每一年度本國的文化繁榮程度,選定了一個核心指標作為信號,即每一年全國出版物的頁數(shù)。在這一信號的指引下,各地方政府你爭我奪,紛紛把印刷字體調(diào)整到大號,以此來增加出版物的頁數(shù)??梢?以這樣一種信號來進行間接評價,雖然可行,但缺乏合理性和有效性。后來,前蘇聯(lián)文化主管部門認識到了這一弊病,選擇了另一個信號,即印刷物的冊書,來評價每一年度本國的文化繁榮程度,各地方政府就轉(zhuǎn)變策略來應(yīng)對這一革新,將一本書分成幾冊來印刷,以增加出版冊數(shù)。同樣,以此信號對全國文化繁榮程度的間接評價雖然能夠進行,但卻缺乏合理性和有效性。
可見,學(xué)術(shù)評價機制的合理性和有效性很大程度上取決于間接評價的合理性和有效性,而間接評價的合理性和有效性取決于信號選取的合理性和有效性。信號確定之后,被評價方,即研究者的研究活動將受到該信號的指引。如果被選擇的信號能夠有助于評價主體對研究者的能力和水平進行客觀準確的間接評價,能夠?qū)崿F(xiàn)研究成果的優(yōu)勝劣汰,指引研究者沿著正確的道路從事研究活動,從而促進科技創(chuàng)新,那么這種信號選擇便在間接評價過程中起到了正向選擇 (positive selection))的作用,即該信號幫助評價者在間接評價過程中選出了他們期待的那些有能力的研究者或有創(chuàng)新意義的研究成果,從而對科研活動起到了激勵作用,促進了科技創(chuàng)新。
相反,如果被選擇的信號無助于評價主體對研究者的能力和水平進行客觀準確的間接評價,不能實現(xiàn)研究成果的優(yōu)勝劣汰,而是誘使研究者弄虛作假,甚至于達到劣幣驅(qū)逐良幣的效應(yīng),研究領(lǐng)域?qū)涑庵鵀E竽充數(shù)的東郭先生,不學(xué)無術(shù)者將把持學(xué)術(shù)資源,而真才實學(xué)者只能望洋興嘆,科學(xué)研究將缺乏激勵,科技創(chuàng)新將步履蹣跚,那么這種信號選擇便在間接評價過程中起到了逆向選擇 (adverse selection)的作用,即評價者選定信號,進行間接評價,本來期望據(jù)此選出他們期望的那些有高水平的研究者或研究成果,但是由于錯誤地選擇了信號,導(dǎo)致研究領(lǐng)域優(yōu)汰劣勝,劣幣驅(qū)逐良幣,最后被選中的恰恰是那些沒有真才實學(xué)的庸碌之輩,由于選擇的結(jié)果與初始的預(yù)期正好相反,所以被稱為逆向選擇。可見,只有那些正確選擇了信號,確保了間接評價過程實現(xiàn)正向選擇,激勵了科研活動,促進了科技創(chuàng)新的學(xué)術(shù)評價機制才具有合理性和有效性。
改革開放以來,經(jīng)過近 30年,尤其是近 10多年的快速成長,我國已經(jīng)形成了一套日漸成熟的學(xué)術(shù)評價機制,并參照國際學(xué)術(shù)評價慣例,選擇確定了一套國際化的信號系統(tǒng),間接評價開始發(fā)揮著越來越重要的作用。舉例而言,在學(xué)術(shù)評價中對學(xué)歷和學(xué)位的強調(diào),對論文和專著的要求,對研究者學(xué)習經(jīng)歷和工作經(jīng)歷的考察無不是借鑒國際上成熟的學(xué)術(shù)評價機制的結(jié)果。我國對學(xué)術(shù)期刊的分類,諸如中文核心期刊、CSSCI來源期刊、國家一級期刊都是對國際上對期刊的分類,諸如 EI來源期刊、SCI來源期刊、SSCI來源期刊的借鑒。我國對論文轉(zhuǎn)載情況、論文的引用率甚至于對應(yīng)聘者本科、碩士和博士是否畢業(yè)于名校的考察無不是借鑒于國際學(xué)術(shù)評價機制?!?〕由此看來,在學(xué)術(shù)評價機制方面,我國確已確定了一套國際化信號,那么,這套國際化信號是否能夠確保間接評價實現(xiàn)正向選擇呢?亦即是否能夠?qū)崿F(xiàn)我國學(xué)術(shù)評價機制的合理性和有效性呢?
我國的學(xué)術(shù)評價機制是否合理有效取決于他設(shè)定的這一套國際化信號是否能夠真實有效地反映研究者的學(xué)術(shù)水平和研究成果的創(chuàng)新意義。換句話說,把信號作為因變量,把學(xué)術(shù)水平作為自變量,因變量是否唯一地由這一自變量來決定,即信號是否唯一地由學(xué)術(shù)水平來決定。舉例來說,假設(shè)我們設(shè)定的信號之一是論文發(fā)表,事實證明,無論國內(nèi)還是國外,論文發(fā)表并不僅僅由作者的學(xué)術(shù)水平來決定,它往往部分地取決于作者的名望、權(quán)威的推薦、與刊物編輯的私交和友誼,甚至也取決于作者是否愿意支付高昂的版面費和其他許多因素,在信息理論中,這些因素被稱為噪音 (noise)。完全消除噪音是不切實際的。但是,噪音的大小卻決定著信號是否能夠準確反映學(xué)術(shù)研究水平的程度。噪音越大,信號就越不能反映真實的學(xué)術(shù)水平,反之亦反之。
在我國的學(xué)術(shù)評價中,噪音格外顯著,中國式噪音往往使國際化信號失真,嚴重降低了信號反映學(xué)術(shù)水平的能力。舉例而言,博士學(xué)位被認為是代表著研究者的學(xué)術(shù)水平,因此被設(shè)定為學(xué)術(shù)評價的一個信號,成為研究機構(gòu)招聘研究人員的條件或者研究人員職稱晉升的前提。于是,博士學(xué)位在我國變得“洛陽紙貴”,成千上萬的人想盡辦法獲得這一學(xué)位,各種手段,無所不用。從博士生招生腐敗、博士生管理松散到博士論文的粗制濫造。造就了獨具特色的“真的假學(xué)歷”和“假的真學(xué)歷”的奇觀。這些噪音已經(jīng)使得博士學(xué)位這一信號在代表研究者學(xué)術(shù)水平時大打折扣。
就論文發(fā)表這一信號而言,許多研究者依賴與刊物編輯的私人交情,將自己水平較低的論文在級別較高的學(xué)術(shù)刊物上發(fā)表,“關(guān)系稿”一詞的廣泛流行,反映了這一現(xiàn)象的普遍存在。至于那些沒有“關(guān)系”的研究者,也可以通過主動自愿地給刊物編輯支付高昂的“版面費”,以使自己的論文得以發(fā)表?!瓣P(guān)系稿”、“版面費”等噪音嚴重損害了論文發(fā)表這一信號反映學(xué)術(shù)水平的能力。
噪音不僅僅存在于中國的學(xué)術(shù)評價方面,而是廣泛地存在于各種評價過程之中。例如,商家通過賄賂各種認證部門,往往可以得到 “放心肉”、“綠色食品”、“質(zhì)量信得過”等各種認證。本來這些認證原本被認為是能夠反映商品質(zhì)量的信號,但是由于各種噪音的存在,這些信號便在代表商品質(zhì)量時大打折扣。消費者并不會認為購買的貼有“放心肉”、“綠色食品”、“質(zhì)量信得過”的商品就一定能夠放心和信得過。
就當前中國的學(xué)術(shù)評價機制而言,關(guān)鍵問題不在于取消信號,放棄間接評價,而在于如何盡快減少噪音的存在。這也是完善我國學(xué)術(shù)評價機制,促進我國科技創(chuàng)新的關(guān)鍵所在。
〔1〕Hillier:The econometrics of asymmetric information,New York:St.Martin's Press,1997.43.
〔2〕Akerlof:The market for‘lemons’:qualitative uncertainty and the market mechanism,Quarterly journal of economics,1970 (84):488-500.
〔3〕Spence:Job market signaling,Quarterly journal of economics,1973(87):355-374.
〔4〕http://www.sass.org.cn/zc——newsarticleshow. jsp?dinji=737&sortid=2300&id=24667。
〔5〕愛德華·希爾斯:學(xué)術(shù)的秩序——當代大學(xué)論文集 [C].商務(wù)印書館,2007.364-380.
C34
A
1004—0633(2010)01—0026—04
2009—08—04
包雙葉,華東師范大學(xué)社會科學(xué)部博士研究生。 上海 200241
(本文責任編輯 劉昌果)