陳玉卿 俞立平
(1.貴州財(cái)經(jīng)大學(xué) 貴州綠色發(fā)展戰(zhàn)略高端智庫 貴陽 550025;2.浙江工商大學(xué) 統(tǒng)計(jì)與數(shù)學(xué)學(xué)院 杭州 310018)
人文社會(huì)科學(xué)是人類的精神家園,對(duì)人類社會(huì)的發(fā)展具有深遠(yuǎn)的影響。人文科學(xué)主要研究人類社會(huì)的本質(zhì)和發(fā)展規(guī)律,社會(huì)科學(xué)研究社會(huì)整體物質(zhì)客體及其內(nèi)在聯(lián)系,以及人的主體意識(shí)及其內(nèi)在聯(lián)系,廣義的人文社會(huì)科學(xué)一般也稱為哲學(xué)社會(huì)科學(xué)。一個(gè)沒有發(fā)達(dá)的自然科學(xué)的國家不可能走在世界前列,一個(gè)沒有繁榮的哲學(xué)社會(huì)科學(xué)的國家也不可能走在世界前列,這一點(diǎn)已經(jīng)取得人們的普遍共識(shí)。向世界展示中國特色、中國風(fēng)格、中國氣派,是中國人文社會(huì)科學(xué)發(fā)展的歷史使命,構(gòu)建中國特色哲學(xué)社會(huì)科學(xué)體系已上升為國家戰(zhàn)略。
提高人文社會(huì)科學(xué)研究質(zhì)量是人文社科發(fā)展的重要目標(biāo)。《高等學(xué)校哲學(xué)社會(huì)科學(xué)繁榮計(jì)劃(2011-2020年)》強(qiáng)調(diào)要完善以創(chuàng)新和質(zhì)量為導(dǎo)向的科研評(píng)價(jià)制度。我國人文社會(huì)科學(xué)論文質(zhì)量有待提高,根據(jù)科睿唯安數(shù)據(jù),2018年全球發(fā)表SSCI論文33.20萬篇,其中高水平論文2 177篇,中國SSCI論文2.50萬篇,其中高水平論文241篇。中國SSCI論文總量占7.54%,高水平SSCI論文占11.07%。據(jù)中國知網(wǎng)的統(tǒng)計(jì)數(shù)據(jù),2018年國內(nèi)期刊共發(fā)表大陸人文社科論文113.58萬篇,是全球SSCI論文的3.42倍,其中核心期刊論文13.73萬篇。中國人文社科論文總量太多,質(zhì)量不高,這是制約我國人文社科發(fā)展的重要問題。
地區(qū)人文社科研究水平對(duì)區(qū)域經(jīng)濟(jì)社會(huì)發(fā)展具有重要意義。中國地大物博,人口眾多,不同地區(qū)形成了不同的文化和特色,這一切給區(qū)域經(jīng)濟(jì)社會(huì)發(fā)展也打上了深深的烙印。加強(qiáng)人文社科研究,對(duì)地方政府的決策會(huì)產(chǎn)生重要影響,進(jìn)而會(huì)影響到經(jīng)濟(jì)社會(huì)發(fā)展,從而彰顯區(qū)域經(jīng)濟(jì)與社會(huì)發(fā)展特色,弘揚(yáng)傳統(tǒng)文化,展現(xiàn)傳統(tǒng)特色,促進(jìn)經(jīng)濟(jì)高質(zhì)量發(fā)展。
在高質(zhì)量發(fā)展背景下,開展區(qū)域人文社科研究評(píng)價(jià)具有重要意義。首先,相關(guān)領(lǐng)域的研究總體較少,現(xiàn)有研究只涉及人文社科研究效率、人文社科全要素生產(chǎn)率等,對(duì)區(qū)域人文社科研究水平缺乏研究。人文社科學(xué)術(shù)期刊,因?qū)W科門類龐雜、研究范式多元,稿件的質(zhì)量判斷始終是一個(gè)讓人頭疼的問題[1]。其次,研究區(qū)域人文社科研究的基本原則和理論架構(gòu),有助于豐富科學(xué)計(jì)量學(xué)與文獻(xiàn)計(jì)量學(xué)理論。再次,在實(shí)踐角度,也有利于地方政府相關(guān)部門明確差距,從而加大投入,促進(jìn)人文社科健康快速發(fā)展。
關(guān)于人文社科的研究質(zhì)量的界定,Talib[2]提出科研評(píng)估必須權(quán)衡數(shù)量與質(zhì)量。Mazlish等[3]指出人文社會(huì)科學(xué)的質(zhì)量包括學(xué)術(shù)界內(nèi)部質(zhì)量和社會(huì)外部質(zhì)量,內(nèi)部質(zhì)量主要指同行認(rèn)可的學(xué)術(shù)價(jià)值,外部質(zhì)量是科研成果的外部貢獻(xiàn)。Moed[4]研究發(fā)現(xiàn)英國的科技評(píng)價(jià)工作經(jīng)歷數(shù)量—質(zhì)量—數(shù)量三個(gè)階段。
關(guān)于人文社科研究質(zhì)量評(píng)價(jià)的相關(guān)研究,蔣玲等[5]提出人文社會(huì)科學(xué)成果具有主觀性和廣泛性,標(biāo)新立異和百家爭鳴才能推動(dòng)人文社會(huì)學(xué)向前發(fā)展,科研成果的獨(dú)創(chuàng)性是價(jià)值基礎(chǔ),大數(shù)據(jù)可以為同行評(píng)議提供一定的補(bǔ)充。高自龍等[6]認(rèn)為對(duì)于人文社科成果,必須堅(jiān)持質(zhì)量為本原則,不斷完善評(píng)估指標(biāo)體系的設(shè)置,改進(jìn)實(shí)施策略,尋求較為科學(xué)可行的評(píng)估方式和手段。李貞等[7]強(qiáng)調(diào)協(xié)同創(chuàng)新和質(zhì)量標(biāo)準(zhǔn)是科研團(tuán)隊(duì)水平的重要標(biāo)志,但具體質(zhì)量評(píng)價(jià)指標(biāo)選取尚有待研究。潘啟亮[8]認(rèn)為人文社科評(píng)價(jià)包括同行評(píng)議和科學(xué)計(jì)量,同行評(píng)議主要是質(zhì)量的評(píng)價(jià),科學(xué)計(jì)量主要是數(shù)量的評(píng)價(jià)。
關(guān)于人文社科評(píng)價(jià)對(duì)象,視角也是多元的。第一是從學(xué)科角度,高自龍等[9]研究發(fā)現(xiàn),在人文地理學(xué)、社會(huì)學(xué)、管理學(xué)、經(jīng)濟(jì)學(xué)等學(xué)科中,某些指標(biāo)合作論文水平優(yōu)于獨(dú)著論文,在哲學(xué)、馬克思主義理論、外國語言文學(xué)以及圖情檔、法學(xué)學(xué)科中,合作論文的個(gè)別指標(biāo)水平低于獨(dú)著論文。第二是從大學(xué)評(píng)價(jià)角度,蔣玉梅[10]發(fā)現(xiàn)國外大學(xué)對(duì)人文社科研究評(píng)價(jià)包括研究成果的數(shù)量、質(zhì)量、影響,以及產(chǎn)生的社會(huì)效益方面的途徑。第三是從學(xué)術(shù)期刊角度,Prathap[11]在數(shù)量和質(zhì)量的基礎(chǔ)上,提出引文分布一致性系數(shù),并構(gòu)建出z指數(shù)進(jìn)行評(píng)價(jià)。劉仲翔[12]認(rèn)為2018年是中國社科學(xué)術(shù)期刊發(fā)展的重要轉(zhuǎn)折年份,學(xué)術(shù)期刊進(jìn)入了高質(zhì)量發(fā)展的關(guān)鍵階段。第四是從博士論文角度,Ives等[13]研究發(fā)現(xiàn),項(xiàng)目參與對(duì)人文社科博士論文的綜合質(zhì)量、前沿涉獵、創(chuàng)新性均有積極正向影響,課堂討論、跨學(xué)科學(xué)習(xí)和導(dǎo)師交流對(duì)博士論文的綜合質(zhì)量和成果創(chuàng)新性均沒有影響。李霞等[14]將人文社科博士學(xué)位論文質(zhì)量的要素分為形式要素和實(shí)質(zhì)要素,后者就是指論文質(zhì)量,并對(duì)博士論文質(zhì)量進(jìn)行評(píng)價(jià)。
關(guān)于宏觀區(qū)域視角的人文社科評(píng)價(jià),Kocher等[15]對(duì)國際經(jīng)濟(jì)合作組織21個(gè)國家經(jīng)濟(jì)學(xué)科研效率進(jìn)行了比較分析。姜彤彤[16]采用基于DEA的Malmquist 分析方法,對(duì)我國大陸省際高校人文社科研究的全要素生產(chǎn)率進(jìn)行評(píng)價(jià)和分解研究。同時(shí)還基于DEA分析方法,對(duì)我國省際高校人文社科科研效率及其區(qū)域差異情況進(jìn)行分析[17]。
從現(xiàn)有的研究看,關(guān)于人文社科研究成果的評(píng)價(jià)研究,已經(jīng)有不少研究涉獵,對(duì)其研究質(zhì)量的認(rèn)識(shí)和界定已經(jīng)取得共識(shí)。關(guān)于人文社科質(zhì)量評(píng)價(jià)方法總體上是零碎的,相關(guān)研究并不充分,涉及同行評(píng)議、文獻(xiàn)計(jì)量、大數(shù)據(jù)、指標(biāo)體系方法等。學(xué)術(shù)界普遍認(rèn)識(shí)到對(duì)人文社科質(zhì)量的評(píng)價(jià)標(biāo)準(zhǔn)要強(qiáng)調(diào)多元化和創(chuàng)新。單純對(duì)人文社科評(píng)價(jià)的研究,研究視角包括學(xué)科評(píng)價(jià)、大學(xué)評(píng)價(jià)、學(xué)術(shù)期刊評(píng)價(jià)、博士論文評(píng)價(jià)等,區(qū)域全要素生產(chǎn)率與效率評(píng)價(jià)等,研究視角有待進(jìn)一步拓展??傮w上在以下方面有待進(jìn)一步深入研究:
第一,關(guān)于質(zhì)量視角下區(qū)域人文社科研究的評(píng)價(jià)理論,現(xiàn)有研究很少有涉及,需要進(jìn)一步開展研究。相關(guān)內(nèi)容包括:區(qū)域人文社科評(píng)價(jià)的基本原則、數(shù)量與質(zhì)量的關(guān)系、宏觀評(píng)價(jià)與微觀評(píng)價(jià)的關(guān)系等。
第二,關(guān)于質(zhì)量視角下區(qū)域人文社科研究的評(píng)價(jià)方法,也有待進(jìn)一步探索。相關(guān)研究包括:同行評(píng)議的地位、文獻(xiàn)計(jì)量學(xué)的運(yùn)用、多屬性評(píng)價(jià)方法的選擇等等。其中,基于傳統(tǒng)線性加權(quán)評(píng)價(jià)方法的改進(jìn)研究也需要深入。
2.1評(píng)價(jià)規(guī)模與評(píng)價(jià)方法的關(guān)系評(píng)價(jià)規(guī)模與評(píng)價(jià)方法的關(guān)系如圖1所示。學(xué)術(shù)評(píng)價(jià)包括宏觀評(píng)價(jià)、中觀評(píng)價(jià)與微觀評(píng)價(jià),宏觀評(píng)價(jià)方法主要采用多屬性評(píng)價(jià)方法,中觀評(píng)價(jià)采用多屬性評(píng)價(jià)與同行評(píng)議,以多屬性評(píng)價(jià)為主,微觀評(píng)價(jià)主要采用同行評(píng)議方法。
圖1 評(píng)價(jià)規(guī)模與評(píng)價(jià)方法的關(guān)系
宏觀評(píng)價(jià)包括國家或地區(qū)層面的人文社科評(píng)價(jià),其評(píng)價(jià)視角可以采用單個(gè)指標(biāo),也可以采用多個(gè)指標(biāo)。單個(gè)指標(biāo)就是文獻(xiàn)計(jì)量指標(biāo)或科技統(tǒng)計(jì)指標(biāo),如論文數(shù)量、研發(fā)經(jīng)費(fèi)投入總額等等,可以直接進(jìn)行比較。如果采用多個(gè)指標(biāo),一般要采用某種多屬性評(píng)價(jià)方法將其轉(zhuǎn)化為一個(gè)匯總的評(píng)價(jià)結(jié)果,比如國家創(chuàng)新指數(shù)評(píng)價(jià)就是類似的評(píng)價(jià)。多屬性評(píng)價(jià)方法目前有幾十種,如線性加權(quán)匯總、主成分分析、灰色關(guān)聯(lián)、粗糙集、TOPSIS、CRITIC等等,目前已廣泛應(yīng)用在學(xué)術(shù)評(píng)價(jià)中。
中觀評(píng)價(jià)包括大學(xué)評(píng)價(jià)、學(xué)科評(píng)價(jià)、團(tuán)隊(duì)評(píng)價(jià)、院系評(píng)價(jià)、學(xué)術(shù)期刊評(píng)價(jià)等等,由于評(píng)價(jià)對(duì)象范圍相對(duì)較大,評(píng)價(jià)成果眾多,所以一般采用多屬性評(píng)價(jià)方法為主,同行評(píng)議作為必要的補(bǔ)充,比如教育部第四輪學(xué)科評(píng)價(jià)就采用這種方法。在同行評(píng)議中,主要針對(duì)高水平成果以及那些難以用具體指標(biāo)展示的成果進(jìn)行評(píng)價(jià),比如社會(huì)影響力等。
微觀評(píng)價(jià)主要包括學(xué)者評(píng)價(jià)、單篇論文評(píng)價(jià)、個(gè)人獎(jiǎng)勵(lì)評(píng)價(jià)等等。在學(xué)術(shù)期刊中采用的雙向匿名審稿采用的就是同行評(píng)議的方法,職稱評(píng)審中的論文送審類似。但是一些微觀評(píng)價(jià)有時(shí)接近中觀評(píng)價(jià),比如對(duì)于成果較多的學(xué)者進(jìn)行評(píng)價(jià)?,F(xiàn)在推行的代表作制度就是強(qiáng)調(diào)用同行評(píng)議代替評(píng)價(jià)指標(biāo),對(duì)論文本身的創(chuàng)新進(jìn)行評(píng)價(jià)。
2.2微觀評(píng)價(jià)指標(biāo)在宏觀評(píng)價(jià)中的異化所謂微觀評(píng)價(jià)指標(biāo)在宏觀評(píng)價(jià)中的異化,就是人們公認(rèn)的一些存在問題的微觀評(píng)價(jià)指標(biāo),在宏觀評(píng)價(jià)中卻總體上是適用的,這是一個(gè)十分有意思的問題。
比如單篇論文的被引次數(shù),在微觀評(píng)價(jià)中,我們永遠(yuǎn)不能采用被引次數(shù)來判定一篇論文的質(zhì)量,對(duì)單篇論文質(zhì)量的認(rèn)定,唯一的方法就是采用同行評(píng)議,這一點(diǎn)幾乎已經(jīng)得到公認(rèn)。但是在宏觀評(píng)價(jià)中,一個(gè)國家或地區(qū)平均每篇論文的被引次數(shù)一定程度卻能說明論文質(zhì)量。這是因?yàn)閷?duì)于單篇論文而言,永遠(yuǎn)可以將其作為統(tǒng)計(jì)學(xué)上的異常點(diǎn),但對(duì)于一個(gè)國家或地區(qū)的論文總體而言,從統(tǒng)計(jì)學(xué)意義上,這些文獻(xiàn)計(jì)量指標(biāo)是能說明一定問題的。
還有一個(gè)典型的指標(biāo)是核心期刊論文,同時(shí)涉及到以刊評(píng)文問題。在微觀視角,學(xué)術(shù)界對(duì)簡單用核心期刊論文來判斷論文水平高低的現(xiàn)象詬病很深。曹駿等[18]認(rèn)為核心期刊不是優(yōu)秀論文???,不能保證刊出的每篇文章都是精品。周興旺[19]指出用刊物影響力的高低來推斷論文影響力的高低,這在邏輯上是不對(duì)的,期刊影響力并不等同于論文影響力。但是如果換一個(gè)視角,從地區(qū)層面,每個(gè)省市的核心期刊論文數(shù)量一定程度上就可以代表其人文社科的水平,這其實(shí)并沒有太大的爭議。
所以對(duì)于微觀層面的文獻(xiàn)計(jì)量指標(biāo),往往可以適用于中觀和宏觀層面,對(duì)于一些中觀層面的文獻(xiàn)計(jì)量指標(biāo),往往適用于宏觀層面,但是如果這個(gè)次序顛倒則不一定可以,宏觀層面的指標(biāo)不一定能用于中觀或微觀,中觀層面的指標(biāo)也不一定能用于微觀。在學(xué)術(shù)評(píng)價(jià)中,微觀、中觀和宏觀并不是簡單的加總關(guān)系。當(dāng)然具體指標(biāo)要看其內(nèi)涵并進(jìn)行進(jìn)一步分析,這個(gè)原則并不是簡單適用于任何指標(biāo)。
2.3省際人文社科評(píng)價(jià)中數(shù)量與質(zhì)量的關(guān)系人文社科研究的數(shù)量與質(zhì)量問題是一對(duì)矛盾,并且與評(píng)價(jià)規(guī)模緊密相關(guān)。評(píng)價(jià)數(shù)量質(zhì)量與評(píng)價(jià)規(guī)模的關(guān)系如圖2所示。
圖2 評(píng)價(jià)數(shù)量質(zhì)量與評(píng)價(jià)規(guī)模的關(guān)系
第一,在微觀評(píng)價(jià)層面,一定要強(qiáng)調(diào)研究質(zhì)量。盡管人文社科研究具有自己的特點(diǎn),與自然科學(xué)研究存在較大差異,但是在學(xué)術(shù)研究質(zhì)量上,還是要堅(jiān)持質(zhì)量至上的原則。2018年科技部、教育部等聯(lián)合發(fā)文,要求開展清理“唯論文、唯職稱、唯學(xué)歷、唯獎(jiǎng)項(xiàng)”專項(xiàng)行動(dòng)。隨后不久,兩辦印發(fā)《關(guān)于深化項(xiàng)目評(píng)審、人才評(píng)價(jià)、機(jī)構(gòu)評(píng)估改革的意見》,推行代表作評(píng)價(jià)制度,注重標(biāo)志性成果的質(zhì)量水平、貢獻(xiàn)高低、影響力大小。2020年教育部、科技部研究制定了《關(guān)于規(guī)范高等學(xué)校SCI論文相關(guān)指標(biāo)使用 樹立正確評(píng)價(jià)導(dǎo)向的若干意見》,破除論文“SCI至上”。這些舉措的根源就是為了解決研究質(zhì)量問題。固然不同學(xué)者的研究水平存在差異,但是只要樹立質(zhì)量至上的原則,就會(huì)鼓勵(lì)廣大學(xué)者進(jìn)行高水平的研究,而不是僅僅追求論文數(shù)量。
第二,在中觀和宏觀層面,不僅要追求數(shù)量,也要追求質(zhì)量。質(zhì)量代表了人文社科科研成果的高度,而數(shù)量代表了人文社科科研成果的廣度,兩者不可偏廢。如果一個(gè)機(jī)構(gòu)一共只有10篇公認(rèn)的高質(zhì)量成果,而另外一個(gè)機(jī)構(gòu)擁有50篇公認(rèn)的高質(zhì)量成果。兩個(gè)機(jī)構(gòu)孰強(qiáng)孰弱一目了然,所以對(duì)于機(jī)構(gòu)評(píng)價(jià),采用代表作制度是要慎重的。
第三,微觀質(zhì)量要求是宏觀兼顧數(shù)量與質(zhì)量評(píng)價(jià)的基礎(chǔ)。只有在微觀學(xué)者層面強(qiáng)調(diào)科研質(zhì)量,那么中觀和宏觀層面結(jié)合數(shù)量和質(zhì)量的評(píng)價(jià)才有意義,如果微觀層面科研質(zhì)量得不到保證,急功近利行為并不是個(gè)別現(xiàn)象,那么中觀和宏觀評(píng)價(jià)就會(huì)失去質(zhì)量至上的基礎(chǔ),從而導(dǎo)致評(píng)價(jià)異化??萍疾?、教育部“反四唯”,推進(jìn)論文代表作制度的根本動(dòng)因,就是為了保證微觀層面的質(zhì)量的基礎(chǔ)。
2.4地區(qū)人文社科評(píng)價(jià)體系地區(qū)人文社科評(píng)價(jià)體系如圖3所示,一級(jí)指標(biāo)包括3個(gè),分別是科研投入、成果數(shù)量、成果質(zhì)量,成果數(shù)量和成果質(zhì)量均為產(chǎn)出指標(biāo),因此地區(qū)人文社科評(píng)價(jià)也反映了科研成果的投入產(chǎn)出關(guān)系。
圖3 地區(qū)人文社科評(píng)價(jià)體系
第一,科研投入包括兩個(gè)指標(biāo),分別是研發(fā)經(jīng)費(fèi)和研發(fā)人員。從可見度看,研發(fā)經(jīng)費(fèi)和研發(fā)人員是人文社科研究的兩大重要投入,當(dāng)然其他因素還包括國家或地方政府的相關(guān)政策、外部環(huán)境等等,由于相關(guān)數(shù)據(jù)難以獲得,因此沒有選取。對(duì)于人文社科而言,科研人員的重要性相對(duì)重要,這和人文社科研究的特點(diǎn)有關(guān)。相對(duì)自然科學(xué)而言,人文社科的大多數(shù)學(xué)科對(duì)研發(fā)經(jīng)費(fèi)的依賴程度相對(duì)較弱,當(dāng)然一般情況下,人文社科科研經(jīng)費(fèi)的資助力度也遠(yuǎn)遠(yuǎn)小于自然科學(xué)。
第二,成果數(shù)量指標(biāo)包括學(xué)術(shù)著作、核心期刊論文、非核心期刊論文。之所以將學(xué)術(shù)論文分為核心期刊論文和非核心期刊論文,主要目的也是為了加強(qiáng)質(zhì)量視角下的評(píng)價(jià)。對(duì)于人文社科而言,學(xué)術(shù)著作的研究更加全面系統(tǒng),近兩年國家新聞出版廣電總局加大了學(xué)術(shù)專著刊號(hào)的管理,學(xué)術(shù)專著質(zhì)量得到大幅提高。所以學(xué)術(shù)著作和核心期刊論文數(shù)量既是數(shù)量指標(biāo),也是質(zhì)量指標(biāo),代表著較高水平的研究成果,而非核心期刊論文總體上屬于數(shù)量指標(biāo)。
第三,成果質(zhì)量指標(biāo)包括核心期刊論文比、地區(qū)h指數(shù)兩個(gè)指標(biāo)。核心期刊論文比就是地區(qū)核心期刊論文數(shù)量占論文總量的比重。地區(qū)h指數(shù)是仿照h指數(shù)提出的一個(gè)新的指標(biāo),其含義是:某地區(qū)過去兩年發(fā)表的論文在統(tǒng)計(jì)當(dāng)年至少有h篇論文被引用了h次。地區(qū)論文h指數(shù)某種程度上是一種更高水平論文的影響指標(biāo),而核心期刊論文比是一種高水平論文的指標(biāo),兩者表示的質(zhì)量等級(jí)有所區(qū)別。
如果將地區(qū)人文社科的評(píng)價(jià)指標(biāo)分為來源指標(biāo)與影響力指標(biāo),那么學(xué)術(shù)著作、核心期刊論文數(shù)量、非核心期刊論文數(shù)量、核心期刊論文比均屬于來源指標(biāo),只有地區(qū)論文h指數(shù)為影響力指標(biāo)。
總體上,本文建立的評(píng)價(jià)體系兼顧了人文社科研究的投入與產(chǎn)出、數(shù)量與質(zhì)量、來源指標(biāo)與影響力指標(biāo)、絕對(duì)指標(biāo)和相對(duì)指標(biāo),是一個(gè)相對(duì)完善系統(tǒng)的評(píng)價(jià)體系。
2.5評(píng)價(jià)方法與指標(biāo)權(quán)重
2.5.1 指標(biāo)權(quán)重的確定 評(píng)價(jià)指標(biāo)的權(quán)重采用專家會(huì)議法確定,本文之所以不用客觀賦權(quán)法的原因,是沒有哪種客觀賦權(quán)法能夠保證評(píng)價(jià)質(zhì)量的權(quán)重最大。邀請(qǐng)相關(guān)領(lǐng)域的10名專家,采用背對(duì)背遠(yuǎn)程打分形式,每次將平均值再反饋給各位專家,如有需要請(qǐng)他們進(jìn)行必要的調(diào)整,如此經(jīng)過專家三輪討論,權(quán)重設(shè)定如表1所示。關(guān)于投入產(chǎn)出的權(quán)重,投入指標(biāo)的權(quán)重為0.40,產(chǎn)出指標(biāo)的權(quán)重為0.60。產(chǎn)出指標(biāo)中,成果數(shù)量指標(biāo)為0.25,成果質(zhì)量指標(biāo)為0.35。實(shí)際上,由于成果數(shù)量指標(biāo)中,學(xué)術(shù)著作和核心期刊論文數(shù)量均是高質(zhì)量成果,所以實(shí)際上質(zhì)量指標(biāo)的權(quán)重更高,符合質(zhì)量視角下的評(píng)價(jià)原則。
在科研投入指標(biāo)中,研發(fā)經(jīng)費(fèi)和研發(fā)人員采用等權(quán)重處理。在成果數(shù)量指標(biāo)中,學(xué)術(shù)著作和核心期刊論文數(shù)量的權(quán)重均為0.40,非核心期刊論文的權(quán)重為0.20。成果質(zhì)量指標(biāo)中,核心期刊論文比的權(quán)重為0.40,地區(qū)h指數(shù)為0.60,因?yàn)楹笳呤歉咚降难芯砍晒?/p>
表1 評(píng)價(jià)指標(biāo)與權(quán)重
2.5.2 評(píng)價(jià)方法的選擇 本文采用線性加權(quán)方法匯總,這種評(píng)價(jià)方法是一種線性評(píng)價(jià)方法,能夠更好地尊重專家權(quán)重。在目前主流的學(xué)術(shù)評(píng)價(jià)中,比如英國泰晤士報(bào)大學(xué)排名、軟科大學(xué)排名、南京大學(xué)CSSCI期刊評(píng)價(jià)、北大核心期刊評(píng)價(jià)等應(yīng)用中,均采用這種方法。
在線性加權(quán)中,指標(biāo)標(biāo)準(zhǔn)化一般采用極大值法,標(biāo)準(zhǔn)化公式為:
(1)
其中,X為指標(biāo)原始值,Y為標(biāo)準(zhǔn)化后的指標(biāo)值。
在線性加權(quán)中,有一個(gè)關(guān)鍵問題被忽略了,就是由于評(píng)價(jià)指標(biāo)標(biāo)準(zhǔn)化后指標(biāo)均值不等,這會(huì)導(dǎo)致實(shí)際權(quán)重偏離專家設(shè)定的權(quán)重,俞立平[20]將這種現(xiàn)象稱為自然權(quán)重問題。比如小學(xué)生考試,語文的平均成績?yōu)?2,數(shù)學(xué)的平均成績?yōu)?7,在計(jì)算總分時(shí),語文的實(shí)際權(quán)重就比較低,這就是自然權(quán)重導(dǎo)致的。所以采用線性加權(quán)匯總,最重要的是通過某種標(biāo)準(zhǔn)化方法,使得不同指標(biāo)的均值接近相等。為了解決這個(gè)問題,可以采用sigmoid函數(shù)進(jìn)行標(biāo)準(zhǔn)化。
采用sigmoid函數(shù)進(jìn)行標(biāo)準(zhǔn)化,第一步是計(jì)算z值:
(2)
其中,X為指標(biāo)原始值,μ為指標(biāo)均值,σ為指標(biāo)標(biāo)準(zhǔn)差。
第二步是根據(jù)z值計(jì)算標(biāo)準(zhǔn)化后的指標(biāo)Y,即:
(3)
Sigmoid函數(shù)圖像如圖4所示,可以明顯看出,sigmoid函數(shù)和成長曲線非常相似,這符合人文社科發(fā)展的規(guī)律和成長特征。標(biāo)準(zhǔn)化后其極大值為1,極小值為0,標(biāo)準(zhǔn)化值具有絕對(duì)打分功能,比較適合用于評(píng)價(jià)。通常情況下,標(biāo)準(zhǔn)化后的均值相差不大,可以有效解決自然權(quán)重問題。同時(shí)可以通過對(duì)評(píng)價(jià)結(jié)果進(jìn)一步標(biāo)準(zhǔn)化處理,分析各個(gè)省份人文社科發(fā)展階段。在sigmoid函數(shù)中,拐點(diǎn)位置為(0,0.5),進(jìn)入成長期的坐標(biāo)為(-1.317,0.211),進(jìn)入成熟期的坐標(biāo)是(1.317,0.789)。
需要說明的是,本文采用截面數(shù)據(jù)進(jìn)行評(píng)價(jià),難以體現(xiàn)成長性,但是對(duì)于每個(gè)地區(qū)的人文社科發(fā)展而言,從時(shí)間序列數(shù)據(jù)角度,是具有成長曲線特征的。此外,即使對(duì)于截面數(shù)據(jù)而言,本著發(fā)達(dá)地區(qū)今天就是欠發(fā)達(dá)地區(qū)未來的思想,一定程度上也具有成長特征。
圖4 sigmoid函數(shù)
3.1數(shù)據(jù)來源研發(fā)經(jīng)費(fèi)、研發(fā)人員、學(xué)術(shù)著作:這3個(gè)指標(biāo)采用教育部人文社科網(wǎng)站公布的省際高校數(shù)據(jù)。人文社科研究的主要陣地是廣大高校,另外還有各地哲學(xué)社科科研院所、各級(jí)政府的研究機(jī)構(gòu)等部門,但相關(guān)數(shù)據(jù)難以獲取,加上高校研發(fā)投入所占比重較大,因此采用高校數(shù)據(jù)作為人文社科評(píng)價(jià)的替代變量,本文各指標(biāo)數(shù)據(jù)采用的均為2018年的數(shù)據(jù)。
其他指標(biāo):其他所有指標(biāo)均來自中國知網(wǎng)的引文數(shù)據(jù)庫,學(xué)科包括所有的人文社科學(xué)科,即哲學(xué)與人文科學(xué)、社會(huì)科學(xué)Ⅰ輯、社會(huì)科學(xué)Ⅱ輯、經(jīng)濟(jì)與管理科學(xué)4大類,并不包括基礎(chǔ)科學(xué)、工程科技Ⅰ輯、工程科技Ⅱ輯、農(nóng)業(yè)科技、醫(yī)藥衛(wèi)生科技、信息科技。在自然科學(xué)期刊中發(fā)表的少量人文社科論文,或與自然科學(xué)存在學(xué)科交叉的人文社科論文,并不在統(tǒng)計(jì)之列,但這些論文總體數(shù)量不多,并不影響宏觀統(tǒng)計(jì)結(jié)果。
機(jī)構(gòu)h指數(shù)、論文總數(shù)、核心期刊論文數(shù)為直接查詢數(shù)據(jù),在此基礎(chǔ)上計(jì)算出非核心期刊論文數(shù)和核心期刊論文比。對(duì)于來源指標(biāo),所有論文數(shù)據(jù)均為2018年數(shù)據(jù),對(duì)于機(jī)構(gòu)h指數(shù)的計(jì)算,考慮到時(shí)效性,參照影響因子計(jì)算的時(shí)間跨度,載文時(shí)間為2016-2017年,被引數(shù)據(jù)為2018年。
3.2評(píng)價(jià)結(jié)果分析評(píng)價(jià)結(jié)果如表2所示。根據(jù)評(píng)價(jià)結(jié)果,通過sigmoid函數(shù)計(jì)算z值,以判定地區(qū)人文社科的發(fā)展階段,當(dāng)z值小于-1.317時(shí),處于起步期,當(dāng)z值在[-1.317,1.317]時(shí),處于成長期,當(dāng)z值大于1.317時(shí),處于成熟期。
表2 地區(qū)人文社科評(píng)價(jià)結(jié)果
從評(píng)價(jià)結(jié)果看,北京、廣東、上海、江蘇處于第一方陣,均處于成熟期,北京得分最高,為90.79分,是唯一超過90分的地區(qū)。寧夏、西藏、青海排序最低,屬于第三方陣,均處于起步期。其他地區(qū)均在第二方陣,處在成長期。
3.3一級(jí)指標(biāo)評(píng)價(jià)結(jié)果比較分析一級(jí)指標(biāo)評(píng)價(jià)結(jié)果如表3所示。從人文社科科研投入看,廣東、北京、江蘇、浙江排在第四位。人文社科發(fā)展,離不開研發(fā)經(jīng)費(fèi)與研發(fā)勞動(dòng)力的投入支持,廣東省由于經(jīng)濟(jì)發(fā)達(dá),在研發(fā)投入方面具有優(yōu)勢,近年來發(fā)展較快。浙江省人文社科投入發(fā)展勢頭良好。
表3 一級(jí)指標(biāo)分析
從人文社科成果數(shù)量看,北京、江蘇、上海、湖北排在前四位。北京作為首都,其人文社科數(shù)量具有明顯優(yōu)勢,湖北省作為人文社科大省,其人文社科成果數(shù)量發(fā)展態(tài)勢較好。
從人文社科成果質(zhì)量看,北京、上海、湖北、天津排在前四位,北京、上海研究質(zhì)量高是正常的,比較有特色的是天津,其研發(fā)投入排序22位,成果數(shù)量排序20位,而成果質(zhì)量排在第4位,天津規(guī)模較小,但研究質(zhì)量較高,有兩點(diǎn)啟示:第一,在人文社科研究質(zhì)量方面,天津可圈可點(diǎn),值得學(xué)習(xí)。第二,從評(píng)價(jià)的角度,單純?cè)u(píng)價(jià)質(zhì)量是有問題的,必須兼顧數(shù)量進(jìn)行評(píng)價(jià),光有質(zhì)量沒有規(guī)模不能算是人文社科強(qiáng)省。
3.4評(píng)價(jià)結(jié)果與傳統(tǒng)標(biāo)準(zhǔn)化評(píng)價(jià)結(jié)果比較采用本文方法得到的評(píng)價(jià)總分與采用傳統(tǒng)標(biāo)準(zhǔn)化方法得到的傳統(tǒng)得分及一級(jí)指標(biāo)評(píng)價(jià)結(jié)果如表4所示。采用傳統(tǒng)標(biāo)準(zhǔn)化方法進(jìn)行評(píng)價(jià),其問題主要表現(xiàn)在以下幾個(gè)方面:
第一,評(píng)價(jià)得分偏倚。采用極大值標(biāo)準(zhǔn)化,意味著每項(xiàng)指標(biāo)的極大值就是滿分,但是這沒有任何依據(jù),而采用sigmoid函數(shù)標(biāo)準(zhǔn)化,極大值很難是滿分,俞立平等[21]討論了這個(gè)問題,認(rèn)為傳統(tǒng)標(biāo)準(zhǔn)化將極大值認(rèn)定為滿分理論依據(jù)不足。
由于評(píng)價(jià)得分偏倚,傳統(tǒng)評(píng)價(jià)得分超過60分的只有3個(gè)省市,這明顯與人們的感覺不符。而采用sigmoid函數(shù)標(biāo)準(zhǔn)化后,評(píng)價(jià)得分超過60分的有8個(gè)省市,明顯更加合理。
第二,傳統(tǒng)標(biāo)準(zhǔn)化的評(píng)價(jià)得分以及各一級(jí)指標(biāo)評(píng)價(jià)得分的均值并不相等,也就是說存在自然權(quán)重問題,比如期刊質(zhì)量的均分為38.87分,而期刊數(shù)量的均分為21.39分,那么期刊質(zhì)量就顯得更加重要,問題是在專家賦權(quán)時(shí),這個(gè)因素已經(jīng)被考慮進(jìn)去了,最終結(jié)果就是期刊質(zhì)量的權(quán)重被進(jìn)一步加大了。
表4 最終結(jié)果與傳統(tǒng)標(biāo)準(zhǔn)化結(jié)果比較
第三,排序結(jié)果有差異。雖然評(píng)價(jià)對(duì)象不多,只有31個(gè)省市,但對(duì)比評(píng)價(jià)結(jié)果,還是存在較大差異。說明評(píng)價(jià)方法由于自身的瑕疵會(huì)導(dǎo)致評(píng)價(jià)結(jié)果產(chǎn)生較大變化,進(jìn)而影響排序。由于目前主流學(xué)術(shù)評(píng)價(jià)均采用傳統(tǒng)評(píng)價(jià)方法,因此有必要進(jìn)行改進(jìn)。
圖5 最終結(jié)果的數(shù)據(jù)分布
第四,評(píng)價(jià)結(jié)果數(shù)據(jù)分布差異。最終結(jié)果的數(shù)據(jù)分布如圖5所示,Jarque-Bera檢驗(yàn)結(jié)果為1.488,相伴概率為0.475,不能拒絕正態(tài)分布原假設(shè),說明采用sigmoid函數(shù)標(biāo)準(zhǔn)化進(jìn)行評(píng)價(jià)后,最終評(píng)價(jià)結(jié)果服從正態(tài)分布,這對(duì)評(píng)價(jià)是非常有益的。
傳統(tǒng)標(biāo)準(zhǔn)化方法評(píng)價(jià)結(jié)果的數(shù)據(jù)分布如圖6所示,Jarque-Bera檢驗(yàn)結(jié)果為0.351,相伴概率為0.042,拒絕正態(tài)分布原假設(shè),說明其并不服從正態(tài)分布,作為區(qū)域人文社科水平評(píng)價(jià),應(yīng)盡可能服從正態(tài)分布。
圖6 傳統(tǒng)結(jié)果的數(shù)據(jù)分布
a.在研究質(zhì)量視角下進(jìn)行區(qū)域人文社科評(píng)價(jià)非常獨(dú)特。在高質(zhì)量發(fā)展背景下,對(duì)區(qū)域人文社科水平進(jìn)行評(píng)價(jià)意義重大。本文通過理論分析認(rèn)為,在微觀評(píng)價(jià)中,應(yīng)更多采用同行評(píng)議,而在中觀與宏觀評(píng)價(jià)中,應(yīng)該更多采用指標(biāo)體系進(jìn)行多屬性評(píng)價(jià)。一些科學(xué)計(jì)量指標(biāo)或文獻(xiàn)計(jì)量指標(biāo),盡管不能用在微觀評(píng)價(jià)中,但可以用在宏觀評(píng)價(jià)中。微觀評(píng)價(jià)應(yīng)該以質(zhì)量評(píng)價(jià)為主,而宏觀評(píng)價(jià)必須兼顧數(shù)量和質(zhì)量。
b.我國地區(qū)人文社科總體發(fā)展態(tài)勢良好。研究發(fā)現(xiàn),人文社科水平較高的省市主要是北京、廣東、上海、江蘇等地,相對(duì)較弱的地區(qū)是寧夏、西藏、青海等地。31個(gè)省市自治區(qū)中,處在成熟期的省市有4個(gè),處在起步期的省市有3個(gè),其他均處于成長期,這和我國地區(qū)人文社科發(fā)展情況總體上是相符的。北京、上海、江蘇屬于傳統(tǒng)人文社科水平較高地區(qū),而廣東由于經(jīng)濟(jì)發(fā)展迅速,人文社科投入規(guī)模較大,近年來發(fā)展較快。單純從成果質(zhì)量看,北京、上海、湖北、天津位居前列。天津規(guī)模較小,但人文社科研究質(zhì)量較高,當(dāng)然這是值得鼓勵(lì)的。但是從另外一個(gè)角度,地區(qū)人文社科發(fā)展如果僅僅追求質(zhì)量,不追求人文社科的規(guī)模和數(shù)量,那也不利于人文社科的發(fā)展。
c.傳統(tǒng)線性加權(quán)匯總評(píng)價(jià)中標(biāo)準(zhǔn)化方法有待改進(jìn)。傳統(tǒng)線性加權(quán)匯總評(píng)價(jià)方法作為一種主流的學(xué)術(shù)評(píng)價(jià)方法,采用極大值進(jìn)行指標(biāo)標(biāo)準(zhǔn)化是值得商榷的。第一是存在自然權(quán)重問題,即標(biāo)準(zhǔn)化后指標(biāo)均值不相等導(dǎo)致實(shí)際權(quán)重偏倚。第二是打分缺乏絕對(duì)標(biāo)準(zhǔn),某個(gè)評(píng)價(jià)對(duì)象指標(biāo)為極大值并不代表其就是滿分。第三是標(biāo)準(zhǔn)化方法不同也會(huì)影響評(píng)價(jià)結(jié)果。
d.基于sigmoid函數(shù)標(biāo)準(zhǔn)化的線性加權(quán)是一種優(yōu)秀的評(píng)價(jià)方法。本文的實(shí)證研究表明,采用sigmoid函數(shù)標(biāo)準(zhǔn)化可以有效解決傳統(tǒng)線性加權(quán)匯總中的幾個(gè)問題,并且標(biāo)準(zhǔn)化后指標(biāo)均值接近相等,這樣會(huì)直接導(dǎo)致一級(jí)指標(biāo)評(píng)價(jià)結(jié)果的均值也接近相等,徹底解決了自然權(quán)重問題。此外,sigmoid函數(shù)接近成長曲線,符合事物發(fā)展規(guī)律,擁有絕對(duì)的打分標(biāo)準(zhǔn)。并且評(píng)價(jià)結(jié)果更加接近正態(tài)分布,這對(duì)宏觀地區(qū)人文社科評(píng)價(jià)而言更有應(yīng)用價(jià)值。