• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      “不唯”≠“不評”:論人文社會科學成果評價方式的改進

      2021-08-06 03:12馬永霞仇笳熙
      重慶大學學報(社會科學版) 2021年3期
      關鍵詞:社科評議成果

      馬永霞 仇笳熙

      摘要:成果評價是人文社科科研評價的重要內容。破“四唯”、破“五唯”不是摒棄評價,而是要通過建立科學有效的評價方法實現(xiàn)“破立并舉”。文章以國家社科基金年度項目的成果鑒定為研究對象,綜合運用數(shù)據(jù)包絡分析法(DEA)及方差分析法得出結論:以同行評議為主的定性評價在人文社科成果評價中具有一定的合理性,是人文社科成果評價應該遵循的主要方式;同時,針對階段性成果開展計量評價可作為同行評議的重要補充,尤其是在以應用研究為主的學科成果評價中,兩種評價方式的結合顯得尤為重要。通過研究分析提出人文社科成果評價方式改進的新思路:將階段性成果與最終成果共同作為評價對象;開展以同行評議為主,計量評價為輔的綜合評價方式;按照研究類型不同實行分類評價;并輔之以元評價理念對現(xiàn)有評價體系進行動態(tài)監(jiān)控與糾偏。

      關鍵詞:人文社會科學;科研評價;成果評價;綜合評價;分類評價;階段性成果;元評價;破“四唯”;破“五唯”

      中圖分類號:C12 ? 文獻標志碼:A ? 文章編號:1008-5831(2021)03-0054-13

      一、研究背景與文獻分析

      (一)背景及意義

      1.三個文件的政策指向:破“四唯”、破“五唯”

      清理“四唯”“五唯”是當下乃至今后相當長一段時間的熱點話題。2018年,自科技部、教育部、人力資源社會保障部、中科院和中國工程院五部門聯(lián)合發(fā)布《關于開展清理“唯論文、唯職稱、唯學歷、唯獎項”專項行動的通知》后,在科研評價及人才評價領域引發(fā)熱議。人民日報曾發(fā)表評論,對清理“四唯”的內涵[1]進行闡釋。學界也相繼對人文社科領域清理“四唯”的著力點[2]、清理“四唯”對科研管理轉型的必要性[3]等內容展開了探討,初步形成了改進科研評價方式和評價理念的一些基礎性觀點。2020年2月17日,為改進科技評價體系,破除科技評價中過度看重論文數(shù)量、影響因子等指標,忽視標志性成果的質量、貢獻和影響等“唯論文”的不良導向,科技部發(fā)布37號文《關于破除科技評價中“唯論文”不良導向的若干措施(試行)》,提出了九個方面共27條具體舉措。九個方面主要是針對國家層面的科技管理改革舉措,但同時也對承擔項目單位提出了部分要求,尤其是在“突出成果質量與貢獻”方面,提出不可把論文作為唯一的評價依據(jù)和考核指標,而應考慮開展通過強化分類考核導向注重標志性成果的評價模式。2020年2月18日,教育部、科技部聯(lián)合發(fā)布了《關于規(guī)范高等學校SCI論文相關指標使用樹立正確評價導向的若干意見》。該意見旨在破除唯分數(shù)、唯升學、唯文憑、唯論文、唯帽子的“五唯”頑瘴痼疾,破除論文“SCI至上”,從而探索建立科學的評價體系,營造良好的創(chuàng)新環(huán)境,加快提升教育治理體系和治理能力現(xiàn)代化水平。意見共十條,其中包含了建立分類評價體系、完善同行評議、規(guī)范評價活動等具體要求。

      可以認為,以上三個文件所推動的改革的核心是通過建立科學合理的評價體系,營造有利于創(chuàng)新的學術生態(tài)環(huán)境。因此,所謂的“不唯”絕非“不評”。無論是破“四唯”還是破“五唯”,其本質都是相同的,改革重點不僅僅是在擬要破除的指標維度等具體內容上,重要的是務必要實現(xiàn)評價理念上的改變。通過“破唯”糾正目前僅以單一維度和指標開展評價的浮躁之風,力求將評價的重心從評價學者個人轉移為評價學術成果。

      2.高校評價轉型的實踐成果寥寥

      針對五部門聯(lián)合發(fā)布的《通知》,以及科技部、教育部相繼下發(fā)的若干“措施”和“意見”,國內部分高校通過對成果評價的反思,已逐步開展評價轉型的探索與實踐。以國內最早落實破“四唯”的清華大學為例。2018年已將“完善學術評價標準”列為年度重點工作,同時作為落實中辦、國辦關于深化“項目評審、人才評價、機構評估改革”要求的具體舉措。并由校學術委員會牽頭成立工作組和專家組,歷時一年于2019年4月正式發(fā)布《清華大學關于完善學術評價制度的若干意見》,其中明確了學術成果在學術評價中的重要地位,鼓勵教師以高質量的學術成果服務經濟社會發(fā)展;并規(guī)定高質量的學術成果是“作為職務晉升和工作考評的重要學術業(yè)績”;此外,強調要“尊重學科差異,根據(jù)各學科的特點制定相應的學術評價標準”,實現(xiàn)學術評價從重數(shù)量向重質量、比貢獻的轉變[4]。然而改革的嘗試尚局限于部分高校,尤其是對于人文社科成果評價的改革探索更是鳳毛麟角,絕大多數(shù)高校及科研機構仍處于觀望階段。

      3.科學有效成果評價體系的意義彰顯

      人文社科成果評價要實現(xiàn)“破立并舉”,落實政策的過程務必處理好破與立的關系。破“四唯”“五唯”是手段而非目的,不能將原有評價體系集體廢除,而是要通過厘清科研成果產生的內在邏輯,在尊重知識生產方式和學科特點的基礎上,構建恰當合理的評價方式。這是由于我國科研建制以項目制為主要開展形式,國家通過經費投入支持學科發(fā)展。對科研成果開展評價是實現(xiàn)科研績效測評及資源分配的依據(jù),更是“以評促進”的重要環(huán)節(jié)。需要注意的是,人文社科領域的科研成果具有一定的隱性特質,很難像自然科學成果一樣通過生產力的轉化進行效益評估,但不可因為“難評價”而“棄評價”。顯然,人文社科破“四唯”“五唯”的重點是建立科學有效的成果評價體系,其意義有三:(1)成果評價是成果質量的保障。近年來,大部分高校重視各類基金項目的申報,實行目標任務制的考評方式,導致科研人員“重立項、輕結項”,使得國撥經費利用率低、優(yōu)秀成果產出匱乏。因此建立以成果評價為載體的約束機制不僅能借助基金這一政策杠桿撬動優(yōu)秀成果,保障科研成果質量,而且能科學地評價投入資源是否得到合理利用,實現(xiàn)管理目標。(2)成果評價是科研目標的導引?;痤愴椖康牧㈨椩瓌t是“堅持問題導向,以嚴謹回答重大理論和現(xiàn)實問題為主攻方向”。因而對項目成果進行評價具有重要的標尺作用,一則可以判斷實際產出的成果價值與預期價值是否相符;二則可遴選出高影響力的優(yōu)秀成果,在同類研究中樹立標桿、推舉典范。(3)成果評價是對存在問題的反饋。通過成果評價,可將存在問題及專家建議反饋給研究者,有利于研究者發(fā)現(xiàn)研究缺陷及盲區(qū)。同時,成果評價作為項目制管理的重要環(huán)節(jié),間接反映了基金管理流程組織與開展情況,實現(xiàn)及時改進與調適。因此,以破“四唯”“五唯”為契機,通過反觀人文社科成果評價活動,對現(xiàn)有評價體系進行把脈,找出問題和癥結,實現(xiàn)破舊立新,具有重要意義。

      (二)學術進展

      在評價理念轉型的大背景下,學界對人文社科成果評價的研究之風日盛。實踐中,人文社科成果的范疇界定與分類方法眾多。按照成果產出的階段,可分為階段性成果及最終成果兩類,但二者之間存在成果形式的交集,比如階段性成果與最終成果均包含有學術論文、研究報告等成果形式。按照成果性質的類型,一般分為基礎型研究和應用型研究兩類。按學科層面的分類,又分為人文學科與社會學科[5]。然而其成果無論以何種分類界定,學界對人文社科成果評價的研究不外乎三種,即評價構建理論的研究(理論依據(jù))、評價內容的研究(評什么)、評價方式的研究(怎么評)。

      1.關于評價理論的研究

      績效評價是人文社科成果評價的主要實現(xiàn)形式。早在1980年,Beamon就提出,任何企業(yè)都要通過制定適用于自身的績效管理模式來保證運營與協(xié)調發(fā)展[6]。隨著各國科研管理的興起,績效管理的研究及理論成果被廣泛運用于科研評價的多個方面。美國是最早開展科研績效評價的國家,而英國政府推行的REF模式在注重績效的前提下,更加強化了成果的質量導向。近年來,各國科研評價研究表現(xiàn)出以下共性:(1)以績效評價為主要理念。包括我國在內多數(shù)國家的科研評價基本都以政府為主體或者具有政府背景,而項目制是科研開展的主要實現(xiàn)形式,因此對基礎研究的資助及考核依賴于整體績效評價,通過對投入產出的測算來實現(xiàn)管理。(2)成果評價是科研績效評價的主要內容[7]。在美、德、英、法等科研強國的科研評價中,成果質量及創(chuàng)新成果的評價均在科研評價體系中占主要內容和較高權重。事實上,績效評價是科研評價的主要實現(xiàn)形式,而成果評價則是科研績效評價的主要內容。

      2.關于評價內容的研究

      人文社科成果的形式主要體現(xiàn)為學術論文、學術專著、學術研究報告三類。因此,對人文社科成果評價內容的研究也主要集中于對這三種成果載體的單一評價或綜合評價。目前,針對三種不同成果形式而開展的評價方法各自有別。高自龍等提出,要對人文社科學術論文開展分類評價,其方案設計中提出的按照論述體裁及一級學科進行論文分類評價的思想具有可操作性和合理性[8];黃煒等運用績效評價模式對2001—2013年20門人文社科學科的論文產出進行效率分析,得出論文產出效率較低的結論[9];姚莉等針對以專著形式為成果載體的《成果文庫》,提出了一套影響力評價的指標體系[10];張玉等人構建了對中文著作學術影響力進行評價的指標體系,該體系包含4個維度27個指標因子,并采用書評、引文、同行評議等多種方式開展評價[11];魏慶肖采用傳統(tǒng)計量指標與補充計量指標相結合的模式,構建了定性定量相結合的指標體系,用于完善人文社科學術專著的評價方法[12];賴永兵通過構建模型實現(xiàn)對情報研究報告的綜合質量測評[13]。

      3.關于評價方式的研究

      人文社科成果的評價方式一般分為三類,即以同行評議為主的定性評價、以指標計量為主的定量評價和定性與定量相結合的綜合評價。其中,同行評議是國際上通用的人文社科科研成果評價的經典做法。但隨著圖情學和文獻計量學的發(fā)展,指標計量與同行評議在人文社科成果評價中的主體地位開始處于爭論及博弈狀態(tài)。(1)以同行評議為主的定性評價研究。同行評議是人文社科領域認同度較高的一種評價方法,由默頓在20世紀六七十年代于《科學社會學:理論研究與經驗調查》一書中首次提出[14],這是同行評議的雛形和基礎,之后對同行評議的研究大都基于“默頓學派”的理論進行拓展。國內較有影響力的研究是卜衛(wèi)[15]等在1998年發(fā)表的《社會科學成果價值評估》中,提出人文社科的成果價值以“科學共同體”的評價作為判斷的直接指標;胡明銘等[16]認為,同行評議盡管是一種主觀的方法,但在人文社科評價領域尚沒有更好的方法取而代之。(2)以指標計量為主的定量評價研究。人文社科成果定量評價方式主要有兩種:一是根據(jù)指標因子及權重實現(xiàn)量化評級。比如,陸宇飛以學術著作為研究載體,研究構建了國家社科基金后期資助項目的成果評價指標體系[17];二是依據(jù)績效管理理論對被評價單元進行績效考核,其中數(shù)據(jù)包絡分析法(即DEA)最為經典和實用[18]。比如,姜彤彤等將DEA法用于高校的科研績效評估,避免了傳統(tǒng)評價指標體系僅注重絕對數(shù)量和規(guī)模的缺陷,可用于不同評價單元的橫向比較[19]。(3)定性與定量相結合的綜合評價研究。定性與定量相結合的綜合評價方式是近年的研究熱點。2015年《萊頓宣言》提出的首條原則即為“量化評估應當支持而非取代質化的專家評審”[20];英國科研卓越框架(REF)采用專家評議為主、計量評價為輔的綜合評價方式,并且將“科研成果”作為主要考察因素[21];鄭德俊等在原有同行評議的基礎上加入定量評價指標,減少了專家評議的主觀影響[22];葉繼元提出以同行專家主導、量化評價輔助的方式構建學術“全評價”體系[23];張獻鋒24探討了通過增加評議專家群體,實現(xiàn)評價主體多元化,從而最大程度減少同行評議的主觀性和隨意性[24]。

      (三)筆者的研究思路與期待

      通過對已有文獻的梳理可以發(fā)現(xiàn),隨著學術共同體的發(fā)展及科研環(huán)境的變化,經典的同行評議日漸暴露出一些問題和局限性,比如:隨機性較強[25]、遴選過程影響評價結果的主體決策性[26],帶有偏見的“小同行”阻礙新興研究領域的學科發(fā)展[27]等。事實上,當前的科研體制不可避免地會摻入官本位思想及小學術團體等人情關系因素,進而引發(fā)了學界對某些簡單“懶政”式的同行評議的質疑及討論。但如果單純以指標計量來考評人文社科科研成果的價值則容易陷入“四唯”“五唯”誤區(qū)。教師唯“數(shù)量論”“唯結果論”,學校“唯排名論”,導致科研成果“重量輕質”的現(xiàn)象日益突出[28]。

      基于以上研究及其存在的問題,筆者擬選取人文社科領域具有較大覆蓋面和影響力的國家社科基金年度項目(以下簡稱“國家社科基金項目”)的成果鑒定為研究對象。這是我國人文社科領域最高級別的國家項目,而成果評價作為其中的重要環(huán)節(jié)之一,是科學評價項目成果、提高成果質量、促進優(yōu)秀成果及優(yōu)秀人才產出的重要手段和保障,對人文社科整體評價具有示范作用。目前,國家社科基金項目成果評價方式是針對最終成果實行的雙向匿名同行評議制度。暫未納入階段性成果這一定量評價維度,缺乏對研究過程的跟蹤和考核。而對國家社科基金項目的現(xiàn)有研究也多為單一案例分析或者局限于定性討論的模式,缺乏大規(guī)模面板數(shù)據(jù)的實證研究。為此,筆者擬以國家社科基金項目成果鑒定數(shù)據(jù)為樣本,期待研究以下問題:國家社科基金項目成果鑒定的定量評價與定性評價之間是否存在差異?差異是否具有學科特異性?階段性成果是否有必要納入現(xiàn)有成果評價體系?定量評價與定性評價之間的主次關系如何安排才能實現(xiàn)優(yōu)缺點互補?

      二、數(shù)據(jù)采集與研究方法

      (一)數(shù)據(jù)采集

      自2017年10月至2019年2月,研究組走訪多所在京高校的人文社科科研管理部門及相關國家社科基金管理部門,調研獲取了38所在京高校2013—2017年國家社科基金項目成果鑒定數(shù)據(jù)樣本978份:包括免于鑒定項目74項,鑒定結果為優(yōu)秀的項目45項,良好289項,合格441項、不合格88項。根據(jù)研究樣本統(tǒng)一性原則,數(shù)據(jù)清洗去除74項免于鑒定項目,最終納入數(shù)據(jù)分析的樣本為863項。所取樣本包含了國家社科基金管理劃分的全部23個學科,每個項目樣本數(shù)據(jù)包含階段性成果數(shù)據(jù)及專家鑒定等級數(shù)據(jù)。樣本覆蓋面廣,數(shù)據(jù)齊全,適于定量分析。此外,本研究收集整理了2012—2018年《國家社會科學基金年度報告》里有關年度項目成果鑒定的數(shù)據(jù),用于分析全國整體概況。

      (二)研究方法

      本研究綜合運用數(shù)據(jù)包絡分析法(Data Envelopment Analysis,簡稱DEA法)及方差分析法等多種計量方法開展定量研究。

      首先,提取整理2012—2018年《國家社會科學基金年度報告》數(shù)據(jù),根據(jù)國家社科基金在全國范圍內的成果鑒定概況進行趨勢分析。

      其次,以在京高校863個結項樣本的階段性成果數(shù)據(jù)為分析對象,運用DEA法對38所在京高校2013—2017年間的國家社科基金階段性成果投入產出效率數(shù)據(jù)進行績效分析。DEA在處理多投入、多產出的有效性評價方面具有絕對優(yōu)勢,其要求投入與產出指標之間具有正相關關系,即增加投入指標,不會導致產出指標的減少。從一般思維邏輯上看,國家社科基金階段性成果投入產出數(shù)據(jù)符合DEA法的使用要求。因此,根據(jù)DEA模型選定決策單元、投入指標、產出指標,即依據(jù)國家社科基金的學科劃分原則選定決策單元(DMU)為23個人文社會學科;根據(jù)數(shù)據(jù)完備性、獨立性、可得性、關聯(lián)性的原則,選定投入指標兩項,即項目數(shù)、經費數(shù),產出指標三項,即研究報告(以下簡稱研報)、專著、中外期刊論文。本研究綜合運用規(guī)模收益不變的C2R模型和規(guī)模收益可變的BC2模型進行分析,評估前沿生產函數(shù),計算各DMU的技術效率、純技術效率、規(guī)模效率,以及規(guī)模收益情況。

      再次,以863個結項樣本的最終成果專家鑒定等級數(shù)據(jù)為分析對象,計算成果鑒定等級為優(yōu)秀或良好的項目百分比(優(yōu)良率)。將此數(shù)據(jù)與DEA結果進行比較,觀察23類學科中的哪些學科存在定量評價與定性評價差異較大的現(xiàn)象。

      最后,將以上步驟得到的定性數(shù)據(jù)及定量數(shù)據(jù)統(tǒng)一進行無量綱化處理,采用SPSS進行方差分析,遴選出兩種評價方法處理下差異較大的學科,尋找學科分布規(guī)律。

      三、實證分析與研究結果

      (一)全國項目結項與成果鑒定概況及趨勢分析

      選取《國家社會科學基金年度報告》(以下簡稱“《報告》”)作為分析的數(shù)據(jù)來源。該報告由全國哲學社會科學規(guī)劃辦公室統(tǒng)一編撰發(fā)布,是目前國家社科基金最新最全的官方統(tǒng)計年鑒資料。報告自2012年起發(fā)行出版,每年5月發(fā)行上一年度報告。截至2020年3月,本研究系統(tǒng)收集了迄今為止已發(fā)行的所有報告,選取了國家社科基金中覆蓋面最廣且影響力最大的年度項目作為研究對象,統(tǒng)計繪制2012—2018年項目結項與成果鑒定情況表(表1)。

      本研究通過訪談國家社科基金項目管理人員得知,近年來基金項目的經費支持每年呈現(xiàn)遞增趨勢。該情況在表1數(shù)據(jù)中體現(xiàn)為:2012—2018年間申請結項數(shù)大體呈增長趨勢;結項率穩(wěn)定,體現(xiàn)了項目進度與驗收情況良好。然而,優(yōu)良率卻出現(xiàn)逐年降低的趨勢(圖1),這表明國家社科基金盡管加大了投入支持力度,但是優(yōu)良率并未隨投入增多而增大。研究顯示,從全國范圍看,科研績效產出情況不夠理想,國家社科基金項目的研究水平及研究成果質量仍存在一定的提升空間。因此本研究認為,通過建立適當?shù)某晒u價體系以導向性提高國家社科基金項目成果質量勢在必行。

      (二)定量評價與定性評價在成果評價中的差異性和同質性分析

      將收集到的863個在京高校結項樣本數(shù)據(jù)按照學科分類分解為23個決策單元(DMU)。首先,采用DEA法計算23個學科5年內階段性成果的投入產出績效值。然后,計算各學科專家評議模式下成果鑒定的優(yōu)良率。最后,將兩組數(shù)據(jù)(DEA數(shù)據(jù)與優(yōu)良率數(shù)據(jù))進行直觀比較。在此基礎上對兩組數(shù)據(jù)進行無量綱化處理并計算方差,確定組間存在顯著差異的學科及分布規(guī)律。

      1.階段性成果的計量評價分析

      表2數(shù)據(jù)是定量評價與定性評價結果的匯總。對表2中采用DEA法計算績效的定量評價結果進行分析,得出結論如下:(1)23個學科的科研成果產出綜合技術效率平均值為0.829,純技術效率平均值為0.899,規(guī)模效率平均值0.923。反映出2013—2017年間北京地區(qū)38所樣本高校的研究效率總體情況較好,項目總體上得到了良好的運行和開展。(2)4個學科技術效率有效,分別是理論經濟、人口學、體育學、宗教學。這些學科的技術效率、純技術效率及規(guī)模效率均為1,定量評價的結果說明這些單元投入合理,產出效率高,處于規(guī)模報酬最優(yōu)階段。(3)9個學科雖然技術效率無效,但純技術效率有效(vrsre=1),包括:法學、管理學、考古學、社會學、世界歷史、統(tǒng)計學、應用經濟、哲學、中國歷史。這些學科可根據(jù)其所處的規(guī)模收益階段,適當調整投入產出規(guī)模實現(xiàn)DEA有效。(4)9個學科綜合技術效率及純技術效率均無效。包括:黨史黨建、國際問題研究、考古學、馬列科社、圖情、新聞與傳播學、語言學、政治學、中國文學。在調研訪談中得知,這些學科多數(shù)是屬于理論研究或基礎性研究,成果產出周期長,階段成果的發(fā)表存在一定困難。對于這類學科,不能簡單地通過定量計數(shù)的方式來評價其科研效率,而此時同行評議無疑成為了不可替代的評價方式。

      2.針對最終成果的同行評議分析

      國家社科基金最終成果評價是在綜合考慮5位同行專家鑒定分數(shù)、等級建議、鑒定意見的基礎上確定結項等級。根據(jù)結項管理規(guī)定,鑒定等級按表3所示劃分為四類。本研究根據(jù)該等級劃分標準,計算統(tǒng)計了863個樣本中每個學科所包含鑒定等級為優(yōu)秀或良好的項目數(shù),并計算優(yōu)良率(表2)。從結果看出,優(yōu)良率大于50%的學科為:世界歷史、外國文學、語言學、哲學、中國歷史、中國文學。

      3.計量評價與同行評議的對比分析

      將表2中的定量評價(技術效率)及定性評價(優(yōu)良率)兩組數(shù)據(jù)單獨挑出進行對比分析(圖2)。單就某一觀測單元(即學科)而言,兩組折線圖中數(shù)值點距離較近表示評價結果趨同性較強,如:外國文學、法學、圖情、國際問題、哲學、考古、黨史黨建等學科。這類學科中定性評價與定量評價的結果變化趨勢一致。而兩組折線圖中數(shù)值點距離較遠的學科則表示評價結果差異性較強。如:體育學、管理學、人口學、理論經濟等學科,這類學科中定性評價與定量評價的結果變化趨勢相反。

      總體上看,本研究得出的結果符合學界的常規(guī)認識。首先,定性和定量兩種評價方式在大多數(shù)人文社科學科中的評價結果存在同質性,不存在較大的極端情況;其次,根據(jù)現(xiàn)有研究趨勢,學界多倡導推行定性與定量相結合的綜合評價模式。這與本研究得出結論一致,即同行評議在人文社科的部分學科成果評價中具有不可替代的作用,而計量評價對同行評議具有輔助作用。

      4.定性、定量評價方式差異較大的學科情況分析

      從以上研究得知,在人文社科成果評價中,定量評價與定性評價具有同質性和差異性。為進一步探究兩種評價方式差異性存在的學科分布情況,本研究利用線性函數(shù)將兩種評價結果的數(shù)據(jù)進行無量綱化轉換。首先按以下公式將兩種評價方法得到的結果統(tǒng)一量綱:轉換后的值=(轉換前的值-樣本最小值)/(樣本最大值-樣本最小值)。然后對兩組數(shù)據(jù)進行無重復雙因素方差分析。從表4數(shù)據(jù)結果得出:(1)組間方差值較大(大于0.1)的學科為管理學、理論經濟、人口學、社會學、體育學、統(tǒng)計學、應用經濟。說明在這幾個學科中,定性評價與定量評價的結果差異較大,階段性成果評價在這類學科中存在的影響不可忽視。(2)組間方差值較?。ㄐ∮?.01)的學科為語言學、宗教學、新聞與傳播、中國文學、世界歷史、政治學、馬列科社、民族學、黨史黨建、考古學、哲學、國際問題研究、圖情、外國文學、法學、中國歷史。說明在這幾個學科中,定性評價與定量評價的結果差異不大,階段性成果評價與專家同行評議的結果具有同質性。

      為探尋組間差異較大學科之間的共性,本研究將863個結項數(shù)據(jù)樣本按照各項目研究類型的占比不同分為兩類,即基礎研究為主的學科和應用研究為主的學科。圖3顯示了全樣本中23個學科的應用類/基礎類占比。由圖3可知,應用類研究為主(占比大于1)的學科為管理學、人口學、社會學、體育學、統(tǒng)計學、圖情、新聞傳播、應用經濟;其余學科均為基礎類研究為主(占比小于1)的學科。結合方差分析的結果可知,兩種評價方法差異較大的情況存在于管理學、理論經濟、人口學、社會學、體育學、統(tǒng)計學、應用經濟這七類學科中,其中除了理論經濟(應用基礎占比小于1)外,其余學科均為以應用類研究為主的學科。說明兩種評價結果差異較大的學科基本上都分布于應用類學科。因此得出結論,階段性成果的定量評價對應用型學科存在不可忽視的作用。

      四、主要結論與政策建議

      (一)主要結論

      1.定性、定量評價的同質性

      定性、定量兩種評價方式在大部分學科評價中存在同質性。本研究對23個人文社科學科分別開展了定性評價及定量評價。對比后發(fā)現(xiàn),兩種評價方法所得結果趨同的學科共16個,約占70%。說明在人文社科成果評價領域,兩種評價方法對于大多數(shù)學科的評價結果差異不大,具有同質性。這也驗證了,盡管同行評議存在爭議,但就目前來看,這種評價方式在人文社科成果評價領域確實是無可替代的。尤其對于基礎類人文社科研究,其成果具有隱形特質,成果周期較長,依靠同行專家根據(jù)以往研究經驗和判斷給出的評價可以最大程度地降低由單一計量評價引起的“短視效應”。因此,堅持以同行評議為主的評價方式具有合理性和科學性。

      2.定性、定量評價的差異性

      定性、定量兩種評價方式在少部分學科評價中存在差異性。從以上研究得出結論,在23個樣本學科中有7個學科,如果對其采用單一的定量或定性評價,則評價結果存在較大的差異性。具體表現(xiàn)為在階段性成果定量評價中,這7個學科的DEA純技術效率為1,績效測評結果表現(xiàn)優(yōu)秀。但在同行評議時,優(yōu)良率均低于平均值(37%)。因此,本研究認為,在評價以應用型研究為主的學科時,要考慮到這類學科成果產出的特點,即在研究過程中的論文發(fā)表或階段成果的公布,具有時效性。實際上代表了較大比重的成果產出。不能搞“一刀切”,更不能為了“一碗水端平”而采用與基礎研究為主的學科相同的評價方式。在這一類學科中,計量評價有必要成為同行評議的重要補充。

      3.階段性成果評價的必要性

      階段性成果的計量評價有必要作為同行評議的輔助方式納入綜合考評。本研究實證分析結果表明,在多數(shù)應用類學科中,存在同行評議部分失靈的情況(圖情學、新聞傳播學除外),因此,如果能在傳統(tǒng)同行評議的基礎上考慮這部分學科的階段性成果產出狀況,并將其納入成果評價中進行綜合測評,或可解決目前依靠單一同行評議對應用型學科成果評價產生的片面性。此外,對于部分基礎類學科,例如理論經濟,在DEA測評中表現(xiàn)出不俗的成績(三項績效指標均有效,位于生產前沿面上),但同行評議結果不甚理想。對于存在個別差異現(xiàn)象的基礎性學科,假如將其階段性成果的產出狀況納入綜合考評,或可為同行評議提供數(shù)據(jù)參考。

      (二)政策建議

      1.引入元評價理念,動態(tài)監(jiān)控評價偏差

      “四唯”“五唯”不良傾向在以往學術評價領域長期盛行的深層次原因是對原有評價體系缺乏監(jiān)督與糾偏,即缺乏對原有評價體系的元評價研究。同樣,人文社科成果評價缺乏相應的元評價監(jiān)控也會引起評價“偏差大”。美國州立威諾納大學校長R.Krugman曾經指出,“無論哪一類評價,其結果經得起推敲的前提都必須經過元評價的檢驗”。目前世界各科研強國大多采用元評價的方式實現(xiàn)對現(xiàn)行評價體系的監(jiān)控與糾偏。如:美國通過采用Join Committee提出的元評價標準對教育、科研等評價活動進行監(jiān)控與再評價;日本在科研評價中運用元評價理念采取自評與他評相結合,重視戴明循環(huán)在科研成果評價中的作用[29]。我國的科研元評價尚處于理論探索階段,尤其是針對人文社科成果評價的元評價更為缺乏。破“四唯”“五唯”不良傾向的提出,雖未提及“元評價”一詞,但其實質是通過反觀現(xiàn)有評價體系的漏洞及不足,提出修正和糾偏策略,完全屬于元評價的理念范疇。如上所述,現(xiàn)行的人文社科成果評價多為科研績效評價??蒲锌冃гu價雖然能夠引導科研發(fā)展的方向,但在績效評價的過程中,由于對事物發(fā)展形態(tài)存在認知局限性,或是由于存在系統(tǒng)內外環(huán)境中可變因素的影響,使得科研績效評價出現(xiàn)偏差,不能達到預期的評價效果。對科研績效評價開展元評價,能夠實現(xiàn)科研績效評價角色的轉變,使其由評價行為的發(fā)出主體變?yōu)楸辉u價的客體對象,對原有體系開展檢驗及審視。因此,務必利用破“四唯”“五唯”的良好機會,采用元評價的理念及方法開展對舊評價體系的調整,歸正我國現(xiàn)有人文社科成果評價體系缺乏適時監(jiān)控及評價反饋等弊端,從而在破舊立新中提升人文社科成果評價質量。

      2.引入過程性評價,妥善區(qū)分“不唯”與“不評”

      國家社科基金項目的成果既包含最終成果,也包含階段性成果。目前對國家社科基金項目成果鑒定主要針對的是最終成果,而階段性成果僅作為數(shù)據(jù)提供給相關管理部門參考。但是階段性成果作為反應研究過程科研績效的重要數(shù)據(jù),尤其是對應用類學科的項目成果鑒定具有重要的參考價值。階段性成果包含:獲獎、四大期刊轉載、發(fā)表國內外論文、階段研報、專著等指標。其中學術論文、學術專著、學術研究報告是人文社科成果形式的主要體現(xiàn)。首先,學術論文不僅是人文社科科研成果的主要表現(xiàn)形式,也是科研質量的主要評價維度。學術論文具有直觀、體現(xiàn)研究熱點、成果使用方便的優(yōu)點,體現(xiàn)了人文社科科研的最新研究思想?!安晃ㄕ撐摹迸c“不評論文”是兩個不同的概念,事實上,論文在人文社科成果中體現(xiàn)重要的載體作用?!安晃ā钡膬仍谝笫遣灰哉撐淖鳛閱我坏某晒u價指標。而應注重改變評價的實質內涵,將這一指標正本清源,推行代表作制度,通過構建人文社科成果評價體系引導論文質量提升。學界對類似指標的研究也較為成熟,比如邱均平等人提出將轉載作為評價指標之一的文摘評價法,是對論文水平進行間接評價的良好手段,可在很大程度上彌補由單一引文分析帶來的公允性爭議[30]。其次,學術專著是學術圖書的主要類型,相比其他如譯著、教材等圖書,學術專著包含了較高的思想性及原創(chuàng)性,具備更強的問題導向性。對學術專著的評價是人文社科成果長效評價形式的體現(xiàn)。比如著名的《成果文庫》多以專著形式為主。《成果文庫》是全國規(guī)劃辦組織的對國家社科科研優(yōu)秀成果進行集中推介的一項重點工作,旨在發(fā)揮優(yōu)秀成果和科研人才的引領及示范作用,提升精品人文社科成果的產出效率。最后,研究報告是人文社科科研階段性成果及最終成果較為廣泛的提交形式。研究報告作為人文社科成果主要形式之一,其重要性體現(xiàn)在通過研究發(fā)現(xiàn)經濟社會發(fā)展中存在的問題,并對問題的解決提出符合實際的新思路或對策,具有很大的應用價值和理論價值。對研報成果的評價主要是價值判斷,即注重其適用性和可操作性。因此,通過加強人文社科的過程管理,利用好階段性成果指標時效性強的優(yōu)點,更利于知識的擴散與傳播,并且數(shù)據(jù)易于計量,納入考評的可操作性也很強??梢钥闯?,階段性成果評價是對科研過程的評價。目前國內評價中普遍只對結果進行考評,缺乏對科研過程的監(jiān)督與管理。注重過程評價與結果評價相結合,可以更全面、更有針對性地開展科研評價,避免教師僅盯著最終成果目標來搞科研的急功近利行為。因此,可通過建立相對齊備的項目階段性成果數(shù)據(jù)庫,分析研究過程中存在的問題、研究過程與研究結果之間的關系。在原有的最終成果鑒定的基礎上,增加對科研過程的績效評價模塊,形成完備的人文社科科研成果評價體系。

      3.引入分類評價,處理好共性與個性問題

      破“四唯”“五唯”,就是要避免“一把尺子量所有”的一刀切式評價。要根據(jù)評價對象的不同,選擇具有適切性的評價方法。人文社科科研按照研究類型不同分為基礎研究及應用研究兩類?;A研究的主要目的是為了獲取基本理論,并不十分關注研究成果的直接應用問題,成果常表現(xiàn)為一般的原則、理論或規(guī)律。而應用研究則是為了獲得特定的應用成果,比如為解決某一實際問題提供新方法、新途徑等,其成果形式多以論文、研報等為主。因此,人文社科的評價要根據(jù)各學科研究類型及成果產出形式的不同,充分考慮學科特點及差異,開展分類評價。可參照人大復印報刊資料對不同學科論文的評價方式,通過提取普適性較高的標準,設置為通用指標,之后再針對不同學科或成果體裁類型分配不同指標權重的評價方法。即采用“共識性評估標準”與不同權重配比相結合的分類評價方式,開展復合型人文社科學術成果評價模式[31]。

      4.建立質量導向型綜合評價體系,破除科研評價中的“四唯”“五唯”不良傾向

      破除舊“四唯”“五唯”后,如何避免新構建的評價體系不會邁入另一種新“四唯”“五唯”,這是需要思考的問題。根據(jù)以上實證分析,本研究認為在開展人文社科成果評價時,要遵從學科特點,開展以專家評議最終成果為主,計量評價階段性成果為輔的綜合評價方式,且在評價方式上開展二者結合,是徹底破除“唯指標論”“唯專家論”的有效手段。

      首先,定性定量相結合的綜合評價是當前學界最主流、最科學的評價方式。同行評議既保證了科研質量,又對人文社科成果的隱性特質進行了最大程度的發(fā)掘,是人文社科成果評價中應當堅持的主體評價方式。而計量評價的指標具有易于量化、數(shù)據(jù)客觀等特點,能規(guī)避一部分由同行評議帶來的個人主觀因素的干擾,對同行評議具有重要的補充,是同行評議的重要輔助方式。國家社科基金項目的成果鑒定方式雖然從表面上看是單一的定性評價模式,但實質上也包含了定量評價的理念和思維,專家評分歸根到底也是一種量化的評價方式。可見,定性評價與定量評價可以相互滲透、互為補充。

      其次,從本文的數(shù)據(jù)分析中可知,階段性成果的計量評價對國家社科項目成果鑒定,尤其是對于應用類學科的成果鑒定具有重要的參考價值。階段性成果指標中諸如轉載、獲獎等指標,也反映了同行專家經過評價后的認可程度。因此,建立定性為主定量為輔的綜合評價方式,對“階段成果+代表成果”開展全面評價,既能克服同行評議的主觀性,又能消除“四唯”“五唯”可能帶來的不良影響,是實現(xiàn)破立并舉的重要途徑。通過建立人文社科成果評價新體系,確定良好科研導向,建立科研良性循環(huán),可以使更多優(yōu)秀的人文社科成果脫穎而出。

      參考文獻:

      [1]人才評價、學科評價要反對“四唯”[N].人民日報評論,2018-11-01.

      [2]范軍.比“四唯”危害更大的是“唯項目”[J].社會科學動態(tài),2018(12):15-17.

      [3]陳先哲.清理“四唯”推動科研管理轉型[N].中國教育報,2018-10-26(02).

      [4]清華大學關于完善學術評價制度的若干意見[S].清委發(fā)〔2019〕11號,2019-04.

      [5]劉大椿.人文社會科學研究成果評價體系研究[M].北京: 經濟科學出版社,2009:61-70.

      [6]BEAMON B M.Supply chain design and analysis: Models and methods[J].International Journal of Production Economics,1988, 55(3):281-294.

      [7]馬恩斯,周靜,王峻嶺.比較研究下高??萍荚u價指標的優(yōu)化[J].中國高??萍迹?019(10):47-50.

      [8]高自龍,劉峰.人文社科學術論文評價中分類方案的優(yōu)化探析[J].江淮論壇,2011(6):8-12.

      [9]黃煒,程慧平.我國人文社會科學學科學術論文產出的效率研究[J].情報雜志,2016(4):137-140.

      [10]姚莉,陳祖琴.《國家哲學社會科學成果文庫》影響力評價體系研究[J].西南民族大學學報(人文社科版),2016(6):232-236.

      [11]張玉,潘云濤,袁軍鵬,等.論多維視角下中文科技圖書學術影響力評價體系的構建[J].圖書情報工作,2015(7):69-76.

      [12]魏慶肖.人文社科學術專著影響力評價指標體系構建及實現(xiàn)機制研究[D].大連:大連理工大學,2018.

      [13]賴永兵.情報研究報告質量評價體系的研究[J].情報科學,1991(1):9-18.

      [14] R.K.默頓.科學社會學:理論與經驗研究[M].魯旭東,等譯.北京:商務印書館,2009.

      [15]卜衛(wèi),周海宏,劉曉紅.社會科學成果價值評估[M].北京:社會科學文獻出版社,1999.

      [16]胡明銘,黃菊芳.同行評議研究綜述[J].中國科學基金,2005(4):251-253.

      [17]陸宇飛.國家哲學社會科學基金后期資助項目評價體系分析[J].西南民族大學學報(人文社科版),2016(6):237-240.

      [18]CHARNES A,COOPER W W,RHODES E.Measuring the efficiency of decision making units[J].European Journal of Operational Research, 1978, 2(6): 429-444.

      [19]姜彤彤,吳修國.教育部直屬高校產學研協(xié)同創(chuàng)新全要素生產率研究[J].科技管理研究,2016(17):97-101.

      [20]羅納德·魯索,全薇.期刊影響因子,舊金山宣言和萊頓宣言:評論和意見[J].圖書情報知識,2016(1):4-14.

      [21]Research Excellence Framework[EB/OL].[2020-02-15].https://www.ref.ac.uk/2014/.

      [22]鄭德俊,高風華.高校人文社會科學科研績效評價指標體系構建[J].科技進步與對策,2009(7):150-153.

      [23]葉繼元.學術“全評價”分析框架與創(chuàng)新質量評價的難點及其對策[J].河南大學學報(社會科學版),2016(5):151-156.

      [24]張獻鋒.中國社科類學術期刊評價體系的若干思考[J].重慶大學學報(社會科學版),2015(5):116-120.

      [25]蔡蓉華.同行評議的難點[J].甘肅社會科學,2015(4):25-27.

      [26]SUN Y H,MA J, FAN Z P,et al.A group decision support approach to evaluate experts for R&D project selection[J].IEEE Transactions on Engineering Management,2008,55(1): 158-170.

      [27]KENNEDY D. Disclosure and disinterest[J].Science,2004,303(5654):15.

      [28]馬永霞,仇笳熙.“雙一流”建設背景下我國高校學術論文評價改革的思考[C]//2017年中國高等教育學會高等教育專業(yè)委員會第十七屆年會會議論文集,2017.

      [29]日本參議院.政策評価法[EB/OL].(2016-06-16)[2019-12-08].http://law.e-gov.go.jp/data /H13/H13HO086.html.

      [30]邱均平,王菲菲.社會科學研究成果綜合評價方法研究[J].重慶大學學報(社會科學版),2010(1):110-114.

      [31]錢蓉.基于同行評議的復合型人文社科學術評價:以復印報刊資料為例[J].河南大學學報(社會科學版),2016(5):138-144.

      Abstract: Achievement evaluation is an important part in the scientific research evaluation of humanities and social sciences. Breaking the “four-only” and the “five-only” is not to abolish the evaluation, but to establish scientific and effective evaluation methods. This paper takes the achievement result of the annual project of the National Social Science Fund of China as the research object. The DEA method and variance analysis method are used to draw the conclusion as follow: qualitative evaluation mainly based on peer review has certain rationality and should be the main method in the evaluation of achievements in humanities and social sciences; quantitative evaluation of stage achievements can be used as an important supplement to peer review, especially in the applied research based subject achievement evaluation. This paper provides new ideas to improve the evaluation of achievements in humanities and social sciences: take stage achievement and final achievement together as the evaluation objects; develop a comprehensive evaluation method which mainly based on peer review and supplemented by quantitative evaluation; carry out classification evaluation according to different research types; use meta-evaluation to monitor the existing evaluation system.

      Key words: humanities and social sciences; scientific research evaluation; achievement evaluation; comprehensive evaluation; classified evaluation; stage achievements; meta-evaluation; break the “four-only”; break the “five-only”

      (責任編輯 彭建國)

      猜你喜歡
      社科評議成果
      南京市集中“檢視”三方評議
      社科成果展示
      社科成果展示
      社科成果展示
      難忘的兩次評議活動
      工大成果
      “走出去”成果斐然
      “健康照明”成果聚焦
      創(chuàng)新評議形式 提高評議實效
      “三醫(yī)聯(lián)動”擴大醫(yī)改成果
      西乌珠穆沁旗| 什邡市| 新疆| 古丈县| 鄄城县| 中宁县| 苍溪县| 汝州市| 莎车县| 吉安市| 镇沅| 宜君县| 东丰县| 会同县| 甘德县| 玉龙| 巨鹿县| 平和县| 凌云县| 长乐市| 剑阁县| 广德县| 阜康市| 靖宇县| 竹山县| 宁陵县| 确山县| 桐梓县| 隆安县| 利川市| 深圳市| 太康县| 济阳县| 黑河市| 洪洞县| 吉安县| 景宁| 台江县| 那坡县| 滁州市| 定襄县|