劉偉豪,吳 蔚,陽榮威,2,程 昆
(1.湖南大學(xué) 教育科學(xué)研究院,湖南 長沙 410082;2.湖南省教育質(zhì)量與評價研究基地,湖南 長沙 410082)
教育評價是關(guān)乎教育發(fā)展的重要事權(quán),科學(xué)的教育評價導(dǎo)向是教育健康有序發(fā)展的前提。為扭轉(zhuǎn)長期以來不科學(xué)的教育評價導(dǎo)向,2020年10月,中共中央、國務(wù)院印發(fā)《深化新時代教育評價改革總體方案》(以下簡稱《總體方案》),這是新中國成立以來首份以教育評價改革為核心指向的綱領(lǐng)性文件,為我國教育評價和教育事業(yè)發(fā)展提供了重要的理論指導(dǎo)和實踐引領(lǐng)價值,開啟了教育評價系統(tǒng)性改革和高質(zhì)量發(fā)展的新時代。基礎(chǔ)教育質(zhì)量評價是指根據(jù)黨和國家有關(guān)方針、政策、法令和法規(guī),定期對基礎(chǔ)教育質(zhì)量進(jìn)行測量與判斷,利用評價結(jié)果改進(jìn)基礎(chǔ)教育的活動[1],是教育評價的重要組成部分。在構(gòu)建高質(zhì)量教育體系的背景下,教育質(zhì)量評價為基礎(chǔ)教育質(zhì)量提升描繪了發(fā)展基點,是促進(jìn)基礎(chǔ)教育高質(zhì)量發(fā)展的有效抓手?!犊傮w方案》頒布后,基礎(chǔ)教育質(zhì)量評價領(lǐng)域相繼出臺了4份貫徹落實教育評價改革精神的文件,基本上形成了新時代基礎(chǔ)教育質(zhì)量評價政策體系。但政策出臺并不意味著政策目標(biāo)能夠快速達(dá)成,面對教育評價這一歷史性、世界性和實踐性的難題,基礎(chǔ)教育質(zhì)量評價改革的長效落實任重道遠(yuǎn)?!犊傮w方案》實施后,一些地方政府與學(xué)校在全面評價學(xué)生發(fā)展、綜合評估學(xué)校質(zhì)量和有效評估區(qū)域教育發(fā)展的制度體系等方面取得積極進(jìn)展,但也存在制度性改革成效不大、改革面臨著許多瓶頸等問題,這與改革的系統(tǒng)推進(jìn)思路不足和關(guān)系協(xié)同思維的缺失有緊密聯(lián)系[2]。政策工具是政府為實現(xiàn)政策目標(biāo)而采用的方法和手段,是聯(lián)結(jié)政策目標(biāo)、政策執(zhí)行和政策效果的紐帶。政策工具的選擇和使用在政策價值目標(biāo)實現(xiàn)過程中起到至關(guān)重要的作用[3]。因此,從政策工具視角反思基礎(chǔ)教育質(zhì)量評價政策不失為一種政策改進(jìn)的新思路。然而,目前對我國新時代基礎(chǔ)教育質(zhì)量評價的研究主要集中在評價改革路徑與建議[4]、政策解讀[5]、域外經(jīng)驗借鑒[6]等方面,未有研究運用規(guī)范的政策工具理論對其政策設(shè)計進(jìn)行探討。鑒于此,本研究基于政策工具理論視角,運用內(nèi)容分析法對我國新時代基礎(chǔ)教育質(zhì)量評價政策進(jìn)行審視,剖析政策工具使用的現(xiàn)狀及存在的問題,并提出優(yōu)化建議,以期為完善基礎(chǔ)教育質(zhì)量評價政策、改進(jìn)基礎(chǔ)教育評價實踐提供參考。
政策工具分類是政策工具研究的核心議題與分析基礎(chǔ)。施耐德和英格拉姆(Schneider &Ingram)討論“公共政策的研究假設(shè)”后將政策工具分類為權(quán)威工具、能力工具、激勵工具、象征與勸誡工具、學(xué)習(xí)工具[7]。這類工具分類的依據(jù)在于利用不同因素對個體或集體行為施加影響而使目標(biāo)群體按照政策意圖實施行動,這與我國基礎(chǔ)教育質(zhì)量評價現(xiàn)狀的內(nèi)在維度具有耦合性。當(dāng)前基礎(chǔ)教育質(zhì)量評價的利益相關(guān)者眾多,政策落實受多重因素牽絆,政策相關(guān)群體的行為動機(jī)和具體執(zhí)行面臨復(fù)雜深刻的影響因素?;A(chǔ)教育質(zhì)量評價政策的有效推進(jìn)需要相關(guān)群體的認(rèn)同、響應(yīng)和支持,需要我們從“行動主體考察”和“全局群體關(guān)照”的視角出發(fā)廓清政策理想目標(biāo)和實際執(zhí)行之間的規(guī)律,從而更好地驅(qū)動政策行動者完成政策目標(biāo)。同時,施耐德和英格拉姆將政策目標(biāo)和政策行動者的行為動機(jī)聯(lián)系在一起,從行為規(guī)律的原理出發(fā)提出了政策行動者的行為假設(shè),提供了一個較為具象化的分析空間,該分類涵蓋了制度深層結(jié)構(gòu)、微觀行動者等多維元素,層次較為豐富,有助于從政策執(zhí)行者行為規(guī)律的視角來理解基礎(chǔ)教育質(zhì)量評價政策。此外,通過比較可發(fā)現(xiàn),該類政策工具框架中包含的學(xué)習(xí)工具是其他政策工具分類理論所未涉及的,學(xué)習(xí)工具對落實基礎(chǔ)教育質(zhì)量評價改革具有重要意義。當(dāng)前教育評價場域缺乏對評價對象的主體性關(guān)照,如何落實多元主體評價格局(如建立第三方評價機(jī)制)成為迫切議題,這些問題都指向了學(xué)習(xí)型工具所具有的學(xué)習(xí)探索、自我評價的元素屬性。因此,運用該理論框架來分析基礎(chǔ)教育質(zhì)量評價政策工具體系具有適用性。這五類政策工具的特點如下:
(1)權(quán)威工具指政府在合法權(quán)力框架下支配和規(guī)范個人或機(jī)構(gòu)行為的強(qiáng)制性規(guī)則,表現(xiàn)形式包括要求、規(guī)定、許可、禁止等。權(quán)威工具假設(shè)政策行動者能遵守權(quán)威和管制,即使沒有切實的回報,也應(yīng)按照政策期望和規(guī)則來行動。其優(yōu)點在于收益面廣、約束力強(qiáng)、成本較低、見效快、適用于危機(jī)緊急情況,缺點則是靈活性弱、易被功利主義趨附以及易壓抑政策行動者的積極性。
(2)能力工具強(qiáng)調(diào)提供資金保障、基礎(chǔ)設(shè)施與組織建設(shè)、教育、培訓(xùn)和信息等資源給政策行動者,以提升其識別機(jī)會、做出決策和解決問題的能力,表現(xiàn)形式有信息、教育培訓(xùn)、組織制度建設(shè)、其他資源(例如技術(shù)支持、資金保障和營造環(huán)境氛圍等)。能力工具假設(shè)行動者不在意激勵,而需要通過信息、培訓(xùn)和資源供給來提升執(zhí)行能力。其優(yōu)點在于關(guān)注可持續(xù)發(fā)展,缺點在于見效慢、成本高和不確定較強(qiáng)。與激勵工具企圖投入資金產(chǎn)生直接、短期可見的效果相比,能力建設(shè)工具更傾向于培養(yǎng)行動者可持續(xù)的執(zhí)行能力,是一種長期投資。
(3)激勵工具指通過正向的回報或者負(fù)向的懲罰來誘導(dǎo)政策行動者的工具,表現(xiàn)形式包括正向激勵和負(fù)向激勵兩類子工具。其中,正向激勵包括財政補貼、稅收減免、授權(quán)和表彰等物質(zhì)或精神獎勵,負(fù)向激勵則是收費、制裁或問責(zé)等懲罰措施。需要區(qū)分的是,激勵工具中的資金物質(zhì)獎勵目的是激發(fā)政策行動者的動力,這種資金獎勵針對性強(qiáng)但不穩(wěn)定,而能力建設(shè)工具中的資金保障更側(cè)重于通過經(jīng)濟(jì)手段培養(yǎng)政策行動者的執(zhí)行能力,立足于長遠(yuǎn)的考慮,具有穩(wěn)定性和公共利益偏好。該工具假設(shè)個體追求效用的最大化,會對正向回報做出反應(yīng)和選擇,并試圖回避負(fù)向的懲罰。其優(yōu)點在于靈活性強(qiáng)、較高的政治可行性以及易激發(fā)政策行動者的積極性,缺點則是可替代性強(qiáng)、試錯成本高、易滋生資金腐敗問題。
(4)象征與勸誡工具指通過價值觀和信念的勸告與引導(dǎo),使政策行動者做出符合政策目標(biāo)行為的一種工具,表現(xiàn)形式有象征聲明、基本原理、貼標(biāo)簽、勸誡等。其中,象征聲明是發(fā)出聲明以試圖使人們相信政府提出的行動和目標(biāo)是重要優(yōu)先的;基本原理即運用積極的象征(例如自由、平等、價值、效率、秩序等)來闡釋政策的基本內(nèi)容和原理;貼標(biāo)簽是使用比喻、象征和標(biāo)簽來強(qiáng)調(diào)正向的政策理念[8]328-330;勸誡即采用說理方式勸服行動者。象征與勸誡工具假設(shè)個體的信念與要求一致時,傾向于采取符合政策價值觀的行動。其優(yōu)點在于適用面廣、成本低、易實施,缺點在于具有自愿性和不穩(wěn)定性,不適用于危機(jī)緊急情況。
(5)學(xué)習(xí)工具系當(dāng)目標(biāo)群體要實際解決問題時遇到不知道或者不確定的情況下使用的工具,表現(xiàn)形式有自我評價、研究探索、協(xié)商研討等。學(xué)習(xí)工具假定政策行動者能夠進(jìn)行學(xué)習(xí),可以從其他有效的工具中進(jìn)行選擇[9],并能通過探索和協(xié)商解決問題[10]。其優(yōu)點在于集思廣益、益于經(jīng)驗推廣和制度反思,缺點則是實施難度大和見效較慢。
1.研究方法
本研究主要采用內(nèi)容分析法和數(shù)據(jù)統(tǒng)計法來分析新時代基礎(chǔ)教育質(zhì)量評價政策文件。首先,確定相關(guān)政策的分析單元,借助Nvivo11軟件對分析單元進(jìn)行編碼。其次,依據(jù)施耐德和英格拉姆政策工具的分析框架,對不同類別的政策工具使用情況進(jìn)行歸類統(tǒng)計。最后,在量化分析的基礎(chǔ)上剖析新時代基礎(chǔ)教育質(zhì)量評價政策工具的使用現(xiàn)狀與特征,進(jìn)而提出優(yōu)化建議。
2.文本選擇
為保障政策文本分析的代表性和可靠性,本研究選擇政策文件時遵循以下原則:第一,以2020年10月《總體方案》的頒布時間為政策選擇的起點,原因是《總體方案》的頒布開啟了教育評價改革的新時代,“破舊立新”成為教育評價改革的顯著特點,以此為時間節(jié)點進(jìn)行搜索才能準(zhǔn)確找到貫徹新時代教育評價改革要求和精神內(nèi)涵的文件;第二,發(fā)文單位為中央機(jī)關(guān),包括國務(wù)院、教育部等,以確保文件是國家層面的文件;第三,政策文件主題必須是指向基礎(chǔ)教育質(zhì)量評價的總體文件或是針對學(xué)前教育質(zhì)量評價、義務(wù)教育質(zhì)量評價、高中教育質(zhì)量評價的專項文件。基于上述原則,本研究共收集了4份基礎(chǔ)教育質(zhì)量評價領(lǐng)域貫徹落實《總體方案》的政策文本,分別是《幼兒園保育教育質(zhì)量評估指南》(教基〔2022〕1號)、《義務(wù)教育質(zhì)量評價指南》(教基〔2021〕3號)、《國家義務(wù)教育質(zhì)量監(jiān)測方案(2021年修訂版)》(教督〔2021〕2號)、《普通高中學(xué)校辦學(xué)質(zhì)量評價指南》(教基〔2021〕9號)。這4份文件涵蓋了基礎(chǔ)教育全階段,且均明確表述了貫徹教育評價改革精神的要求,可為研究提供可靠的樣本支撐。
基于政策文本的反復(fù)研讀,結(jié)合專家意見,本研究確定以句子為基本單位,結(jié)合上下文內(nèi)容的意群關(guān)系,按照“文本編號—章節(jié)—條款/句子”的原則進(jìn)行編碼。為保證研究信度和編碼效度,本研究運用獨立評判法進(jìn)行對比驗證和集中研討。首先,三名獨立研究者在充分理解政策工具理論與編碼要求后,分別獨立對4份政策文本進(jìn)行類目編入,得到初步編碼表;并對三份編碼表進(jìn)行肯德爾檢驗,結(jié)果顯示肯德爾和諧系數(shù)為0.902,P<0.001,說明三份編碼表具有較高的一致性。其次,對比初步編碼表,查驗編碼不一致的分析單元,共同研討論證達(dá)成一致結(jié)果后,再次編碼歸類,最終得到政策文本內(nèi)容編碼表(見表1)。限于篇幅,僅舉部分樣例。
表1 政策文本內(nèi)容編碼表(部分樣例)
根據(jù)政策工具理論對4份政策文件的137個編碼分析單元進(jìn)行歸類統(tǒng)計,得到政策工具使用情況表(見表2)??傮w而言,五種政策工具都有涉及但使用不均衡。
表2 政策工具使用情況表
表2顯示,權(quán)威工具使用比例最高(39.41%),但內(nèi)部結(jié)構(gòu)不均衡,其中大部分為規(guī)定工具(30.65%),要求(6.57%)、禁止(1.46%)和許可(0.73%)也均有少量使用。規(guī)定是對政策行動者的行為方式做出約束性的規(guī)則,如《普通高中學(xué)校辦學(xué)質(zhì)量評價指南》中規(guī)定“評價周期內(nèi)要實現(xiàn)對學(xué)校辦學(xué)質(zhì)量評價全覆蓋”。這類對教育質(zhì)量評價做出明確性和指示性規(guī)定的表述在4份文件中最為常見?!耙蟆笔菍φ咝袆诱咛岢雒鞔_性的強(qiáng)烈期望,如《幼兒園保育教育質(zhì)量評估指南》中要求“切實扭轉(zhuǎn)‘重結(jié)果輕過程、重硬件輕內(nèi)涵、重他評輕自評’等傾向”?!敖埂泵鞔_提出了不被準(zhǔn)許和認(rèn)可的行為,如《幼兒園保育教育質(zhì)量評估指南》中“嚴(yán)禁用直接測查幼兒能力和發(fā)展水平的方式評估幼兒園保育教育質(zhì)量”,它對直接測查的片面方式給予了強(qiáng)烈堅決反對,劃出了基礎(chǔ)教育質(zhì)量評價的底線范圍?!霸S可”在4份文件中僅出現(xiàn)一次,即《義務(wù)教育質(zhì)量評價指南》中提出“各地可結(jié)合本地實際,制定義務(wù)教育質(zhì)量評價實施細(xì)則”,這實際上是授予了地方政府制定義務(wù)教育質(zhì)量評價具體細(xì)則的權(quán)力,為提升質(zhì)量評價的適配度和靈活性提供了空間。
象征與勸誡工具使用比例(28.47%)僅次于權(quán)威工具,但子工具的使用呈現(xiàn)失衡樣態(tài),其中以勸誡(15.33%)和象征聲明(10.95%)居多,含有少量的貼標(biāo)簽工具(2.19%),基本原理工具未得到使用。勸誡工具試圖勸服行動者采取政策行動,它在4份政策文件中的使用比例僅次于規(guī)定工具,說明政府試圖通過引導(dǎo)、呼吁和號召來推動基礎(chǔ)教育質(zhì)量評價的順利執(zhí)行。宣告聲明即明確地表達(dá)政府優(yōu)先重要的行動和目標(biāo),如《國家義務(wù)教育質(zhì)量監(jiān)測方案》直接聲明要“落實《深化新時代教育評價改革總體方案》等文件要求,進(jìn)一步完善國家義務(wù)教育質(zhì)量監(jiān)測制度,推動落實立德樹人根本任務(wù),促進(jìn)義務(wù)教育質(zhì)量提升”,開宗明義地指出開展基礎(chǔ)教育質(zhì)量評價要落實教育評價改革和立德樹人目標(biāo)的重要事項,以此向公眾滲透政府期望的評價理念及政策意蘊,彰顯出政策制定者對決策啟發(fā)法的偏好。貼標(biāo)簽在政策文件中表現(xiàn)為使用具有比喻性或象征性的詞語或短句,簡明扼要而又意味深長,力求達(dá)到規(guī)勸和引導(dǎo)的作用,如《普通高中學(xué)校辦學(xué)質(zhì)量評價指南》中規(guī)勸政策行動者要防止用“一把尺子”衡量不同學(xué)校的做法。基本原理工具是借助積極的象征來闡釋政策基本內(nèi)容和原理,但在4份政策文件中均未有體現(xiàn)。
能力工具的使用比例(22.63%)稍低于象征與權(quán)威工具,四種子工具均有使用,其中組織制度建設(shè)(9.49%)、信息(5.11%)、教育培訓(xùn)(5.11%)三種占比較高,其他資源(2.92%)占比最低。組織制度建設(shè)意在通過提供組織設(shè)施或建立制度體系,培養(yǎng)行動者的政策執(zhí)行能力,如《國家義務(wù)教育質(zhì)量監(jiān)測方案》提出“搭建監(jiān)測學(xué)習(xí)交流平臺”。信息工具在政策文本中體現(xiàn)為經(jīng)驗推廣和信息公布,如《普通高中學(xué)校辦學(xué)質(zhì)量評價指南》提出“對在評價工作中發(fā)現(xiàn)的辦學(xué)質(zhì)量顯著提高的先進(jìn)典型經(jīng)驗,要大力宣傳推廣”。教育培訓(xùn)強(qiáng)調(diào)對政策行動者的長期性投資,目的在于加強(qiáng)教育質(zhì)量評價的人力資源建設(shè),如《幼兒園保育教育質(zhì)量評估指南》中提到“切實加強(qiáng)評估隊伍建設(shè),建立一支專業(yè)化評估隊伍”。其他資源在4份政策文件中各出現(xiàn)一次,主要措施表現(xiàn)為研制評價工具、資金保障和營造政策環(huán)境,如《國家義務(wù)教育質(zhì)量監(jiān)測方案》指出要“組織專家研制測試工具”;但資金保障僅出現(xiàn)在《幼兒園保育教育質(zhì)量評估指南》和《普通高中學(xué)校辦學(xué)質(zhì)量評價指南》中,義務(wù)教育質(zhì)量評價的兩份文件并未提及資金保障。
學(xué)習(xí)工具的使用處于低頻化,僅為5.11%。自我評價工具意在使目標(biāo)群體更好地認(rèn)識自我和自主學(xué)習(xí),除《國家義務(wù)教育質(zhì)量監(jiān)測方案》外,其他三份文件均有使用一次自我評價工具以鼓勵建立自我評價機(jī)制,例如《普通高中學(xué)校辦學(xué)質(zhì)量評價指南》中明確了“普通高中學(xué)校每年要對本校辦學(xué)質(zhì)量進(jìn)行自評”。我國基礎(chǔ)教育質(zhì)量評價多以研究探索工具來完善評價方法和評價方式,如《義務(wù)教育質(zhì)量評價指南》要求“積極探索采取政府購買服務(wù)方式,培育和委托第三方專業(yè)機(jī)構(gòu)開展義務(wù)教育質(zhì)量評價工作”。協(xié)商探討主要在政策執(zhí)行者信息缺乏或觀點不一致時用于討論和協(xié)調(diào),以集聚廣開言路、集思廣益帶來的政策勢能,但在文件中未有體現(xiàn)。
激勵工具(4.38%)在4份政策文件中使用最少。除《國家義務(wù)教育質(zhì)量監(jiān)測方案》未涉及外,激勵工具的兩類子工具在其余三份文件中均有使用。其中,三條正向激勵工具將教育質(zhì)量評價結(jié)果作為獎懲表彰、資源配置、政策支持和校長考核的重要依據(jù),意圖用正向回報激勵行動者積極參與評價活動。三條負(fù)向激勵工具要求對履職不到位以及教育質(zhì)量持續(xù)下降等情況進(jìn)行問責(zé),意圖對落實不力、違規(guī)的行為給予懲罰,以此反向倒逼行動者服從政策安排。例如,負(fù)向激勵工具出現(xiàn)在《普通高中學(xué)校辦學(xué)質(zhì)量評價指南》中,體現(xiàn)為“對履職不到位、違反有關(guān)政策規(guī)定、學(xué)校辦學(xué)質(zhì)量持續(xù)下滑的,要及時督促整改,并視情況依法依規(guī)追究責(zé)任”。
基礎(chǔ)教育質(zhì)量評價的推進(jìn)需要完善的政策體系來保障,政策體系建設(shè)是不同政策工具交叉協(xié)同運用、共同發(fā)揮作用的系統(tǒng)工程。不同的政策工具在政策體系建構(gòu)中發(fā)揮著不同的作用,因而需要充分考慮到各種政策工具使用的合理性,任何過度依賴或缺少某些政策工具的使用,均有可能在不同層面和程度上影響政策實施的效果。為了有效推進(jìn)我國基礎(chǔ)教育質(zhì)量評價政策體系建設(shè),有必要對其政策工具使用現(xiàn)狀進(jìn)行審思,并在此基礎(chǔ)上提出優(yōu)化建議。
通過對4份政策文件的內(nèi)容分析,可發(fā)現(xiàn)政策工具使用的組合結(jié)構(gòu)呈現(xiàn)失衡化的樣態(tài)。一方面,這種失衡體現(xiàn)在五類政策工具使用頻率有較大差異,權(quán)威工具使用次數(shù)較多,占比高達(dá)39.41%。與此形成鮮明對比的是,激勵工具、學(xué)習(xí)工具使用不足,占比略高于或低于5%。另一方面,同一類政策工具內(nèi)部子工具的使用具有失衡偏向,如權(quán)威工具的內(nèi)部結(jié)構(gòu)中,規(guī)定子工具約占權(quán)威工具總數(shù)的77.77%;又如在象征與勸誡工具的內(nèi)部結(jié)構(gòu)中,勸誡子工具約占象征與勸誡工具總數(shù)的53.85%,而基本原理工具未被使用。綜合運用政策工具以取得政策效果的最大化,取決于多種政策工具的協(xié)商一致程度[11]。雖然政策工具的理想選擇和最優(yōu)組合不一定是平均分配,但是理想的政策效果和長效的政策收益需要政策工具之間的相互補充和制衡[12],過度依賴或過少使用都可能影響政策效能的有效發(fā)揮。因此,我們有必要對基礎(chǔ)教育質(zhì)量評價政策工具組合的失衡化樣態(tài)進(jìn)行深入探討。
1.權(quán)威工具使用比例較高,難以發(fā)揮工具本原效能
權(quán)威工具具有收益面廣、約束力強(qiáng)、成本較低、見效快、適用于危機(jī)緊急情況等優(yōu)勢,是政府最偏好也最常用的政策工具類型?;A(chǔ)教育質(zhì)量評價作為一種診斷方式和改進(jìn)手段,政府推進(jìn)其實施不可或缺地會用到權(quán)威工具,這能夠保障評價政策貫徹執(zhí)行,降低政策成本,提高評價改革效率。但對權(quán)威工具的使用卻有過度依賴傾向,這將導(dǎo)致權(quán)威工具難擔(dān)其責(zé),難以發(fā)揮本原效能。其因有四:第一,缺乏充足性條件。規(guī)模化的權(quán)威工具發(fā)揮效用需要充分的條件,包括政策目標(biāo)認(rèn)識清晰、手段明確,政府各層級、各部門之間目標(biāo)較一致,且執(zhí)行機(jī)構(gòu)擁有充分資源[13]。但就當(dāng)前狀況而言,各地對教育質(zhì)量監(jiān)測與評價的認(rèn)識不清晰、不一致,常出現(xiàn)以“監(jiān)測”之名行“統(tǒng)考”之實的現(xiàn)象[14],各級政府關(guān)于教育評價事權(quán)與責(zé)任的劃分尚不十分明晰,不同地區(qū)教育評價資源的擁有量和開展基礎(chǔ)教育質(zhì)量保障的能力和水平也具有較大差異[15],基層政府系統(tǒng)開展質(zhì)量評價的能力還有較大的提升空間,這些條件弱勢的問題易造成政策行動者選擇性執(zhí)行政策,引起政策失真[16]。第二,弱化政策實施的靈活性。權(quán)威工具有靈活性較差的弱勢,過度依賴這一工具造成的劣勢則更為明顯。多樣性是教育的基本特性,教育意涵著教育目標(biāo)的多重性、短期與長期教育目標(biāo)的矛盾、天賦和后天努力的交互沖突[17],尊重教育的多樣性內(nèi)核、實施教育質(zhì)量多元評價是當(dāng)前教育評價改革的要務(wù)。中央政府下發(fā)的基礎(chǔ)教育質(zhì)量評價文件面向全國,側(cè)重于統(tǒng)一標(biāo)準(zhǔn)、總體要求和宏觀目標(biāo),難以兼顧到不同地區(qū)、不同類型的學(xué)校。權(quán)威工具的靈活性較弱,針對性相對欠缺,過溢使用易造成對教育特殊性和多樣性的忽視,在評價過程中出現(xiàn)較嚴(yán)重的“標(biāo)準(zhǔn)化”“一刀切”問題,導(dǎo)致教育的同質(zhì)化或趨同化現(xiàn)象[18]。第三,易被功利主義趨附。《總體方案》指出“唯分?jǐn)?shù)”“唯升學(xué)”是教育評價的頑瘴痼疾,實際上一些地方的基礎(chǔ)教育評價中時常出現(xiàn)“狀元榜”和“內(nèi)部排名單”等現(xiàn)象,質(zhì)量評價成為“唯分?jǐn)?shù)”“唯升學(xué)”的“遮羞布”,甚至評價結(jié)果變相地成為地方教育行政部門的政績工具,這些都表明評價被功利主義趨附的現(xiàn)象依舊明顯地存在。長期以來,功利主義的文化取向聯(lián)結(jié)磐互在人們的社會心理意識里,深深嵌入至評價相關(guān)者的行為實踐中[19],通過評價為自己謀利更是成為了某些利益主體所追求的目標(biāo),當(dāng)權(quán)威工具使用比例過高,質(zhì)量評價難免被功利主義的頑瘴趨附,不利于深入推進(jìn)基礎(chǔ)教育質(zhì)量評價改革。第四,易壓抑政策行動者的積極性。教育組織行為學(xué)認(rèn)為,當(dāng)高度控制策略被不斷使用,組織成員常常會失去興趣[20]325。這個現(xiàn)象在基礎(chǔ)教育質(zhì)量評價領(lǐng)域顯而易見?;A(chǔ)教育質(zhì)量評價政策深深內(nèi)嵌于我國自上而下的行政管理思維中,政府責(zé)令政策行動者直接執(zhí)行評價任務(wù)和服從評價要求,評價執(zhí)行者和評價對象均處于被動地位,這使評價具有強(qiáng)烈的外部屬性。此時重視的是政府、公眾對教育質(zhì)量問責(zé)的立場和態(tài)度,而非評價的質(zhì)量改進(jìn)功能。在這種情況下,如若過溢依賴權(quán)威工具,易忽視地區(qū)教育發(fā)展的不平衡性,導(dǎo)致評價執(zhí)行部門落入程序固化和目標(biāo)僵化的窠臼中,引發(fā)造假、應(yīng)付式參與評價和考核積極性不高等問題。如在浙江調(diào)研座談會中,某市教育部門負(fù)責(zé)人坦言:“很多學(xué)校的綜合素質(zhì)評價都在造假,這是不爭的事實”[21]。
2.激勵工具使用不足,掣肘評價體系內(nèi)部動力
激勵工具雖然具有可替代性強(qiáng)、試錯成本高等缺點,但靈活度高、政治可行性強(qiáng)以及易激發(fā)政策行動者的積極性等優(yōu)點也使其在“政策工具箱”中的地位舉足輕重。正向激勵工具主要利用物質(zhì)獎勵、名譽表彰等手段在短期內(nèi)激發(fā)政策執(zhí)行者的積極性和主動性,負(fù)向激勵工具則主要利用制裁、問責(zé)等手段反向倒逼政策行動者遵守政策安排并規(guī)范實踐行為,兩者有機(jī)結(jié)合更有利于提升激勵措施的執(zhí)行效力。審視現(xiàn)實情況可發(fā)現(xiàn),缺乏內(nèi)生動力和積極性的現(xiàn)象在教育評價領(lǐng)域長期存在且顯而易見。早在1994年召開的“國家教育評價制度國際研討會”上,有專家就指出“我國教育評價過程中被評價者缺乏評價需要,特別當(dāng)質(zhì)量測評或督導(dǎo)往往帶有自上而下、外部強(qiáng)加的行政命令性質(zhì),被評價者積極性不高的問題比較常見”[22]。時至今日,整個基礎(chǔ)教育評價制度的內(nèi)部動力不足、被評價者的主動性和積極性不高的問題依舊難除[23]。例如在現(xiàn)實中,不少中小學(xué)校已經(jīng)適應(yīng)了長期以來的被動式評價模式,加之缺乏激勵,他們習(xí)慣被上級管理部門“推著走”,習(xí)慣于自上而下的檢查督導(dǎo)和評價方式。事實上,此類現(xiàn)象與教育評價的激勵機(jī)制缺乏有著直接密切的關(guān)系。但反觀質(zhì)量評價政策設(shè)計,卻存在激勵工具使用不足的特點,特別是正向激勵工具的低頻化使用,這在不同程度和層面上掣肘著質(zhì)量評價政策的有效推進(jìn)和評價體系內(nèi)部動力的激發(fā),與解決基礎(chǔ)教育質(zhì)量評價內(nèi)部活力不足的真問題不匹配。
3.學(xué)習(xí)工具使用低頻化,制約多重工具效能發(fā)揮
學(xué)習(xí)工具的優(yōu)點包括集思廣益、益于經(jīng)驗推廣和制度反思,有利于政策執(zhí)行者和目標(biāo)群體加深政策理解。它突破了傳統(tǒng)政策制定“自上而下”的單向模式,為個人和機(jī)構(gòu)建言獻(xiàn)策以及政策相關(guān)者進(jìn)行“互動”提供了機(jī)會[24]52,易創(chuàng)設(shè)出開放協(xié)商、包容共治和改革反思的政策氛圍。但學(xué)習(xí)工具使用的低頻化,卻使評價政策陷入了以下三方面的困境,制約著學(xué)習(xí)工具多重效能的發(fā)揮。其一,減弱相關(guān)群體與政策的聯(lián)結(jié)度[24]53。學(xué)習(xí)工具通過研究探索、協(xié)商探討等子工具的施行,能夠幫助政策制定者、執(zhí)行者、目標(biāo)群體三者之間開展互動對話和溝通協(xié)商,有利于增進(jìn)相關(guān)群體對基礎(chǔ)教育質(zhì)量評價政策內(nèi)容的學(xué)習(xí)和認(rèn)同,促進(jìn)政策制定者廣泛聽取各方意見,凝聚制度共識。然而使用學(xué)習(xí)工具的整體頻次較低,將難以使政策相關(guān)群體保持積極關(guān)注并持久聚焦于政策內(nèi)容,有礙于政策的深度聯(lián)結(jié)和多方共識的凝聚,從而進(jìn)一步降低政策的關(guān)涉度和認(rèn)同度。其二,削弱政策工具組合的平衡性。不同于權(quán)威工具的“自上而下”的實施邏輯,學(xué)習(xí)工具是“自下而上”的實施邏輯[25]50,兩者具有性能上的互補性。長期以來,我國評價權(quán)根源于政府的行政權(quán)力,加之基礎(chǔ)教育質(zhì)量評價依賴于使用較多的權(quán)威工具來推進(jìn)評價活動的組織與實施,這導(dǎo)致評價常常缺乏對被評價者的關(guān)照和學(xué)校等利益相關(guān)者的主動參與,難以提升學(xué)校認(rèn)可評價、利用評價的積極性,甚至一些地區(qū)還用變相手段將以評價結(jié)果向?qū)W校教師施壓[26]。在這種依賴權(quán)威工具的政策語境中,基礎(chǔ)教育質(zhì)量評價內(nèi)部活力不足和評價者積極性不高是一道治理難題。學(xué)習(xí)工具卻能在不同層面上彌補權(quán)威工具在此方面的內(nèi)源性弱勢和消極影響。一方面,學(xué)習(xí)工具通過設(shè)置自我評價的形式,下放一定的評價權(quán)限至評價執(zhí)行者或評價對象,有利于激發(fā)政策相關(guān)者群體的教育評價自主性、診斷教育質(zhì)量的自為性和改進(jìn)教育質(zhì)量的內(nèi)部動因;另一方面,學(xué)習(xí)工具還能通過研究探索和協(xié)商研討等方式,廣泛吸收多方意見和社會關(guān)切,這都是對評價執(zhí)行者和評價對象主體性、能動性的肯定。但學(xué)習(xí)工具使用甚少,與權(quán)威工具之間比例懸殊,兩者難以協(xié)同發(fā)力,勢必會在不同程度和層面上降低政策工具組合的平衡性。其三,降低自我評價的可能性。當(dāng)前,我國整個基礎(chǔ)教育評價領(lǐng)域深受以標(biāo)準(zhǔn)化思維、分析式思維和技術(shù)化思維為主導(dǎo)的影響,評價與教育相脫節(jié)的窘?jīng)r難以消弭,教育評價對教育性的關(guān)注不足,解決這些問題需要在評價標(biāo)準(zhǔn)上重視標(biāo)準(zhǔn)的動態(tài)生成,在評價樣態(tài)上注重個體的自我評價[27]。然而在學(xué)習(xí)工具低頻化使用的情況下,政策行動者將難以通過協(xié)調(diào)、研究探索的方式建立和拓展自我評價的內(nèi)容范疇和操作路徑,在一定程度上降低了評價標(biāo)準(zhǔn)動態(tài)自然生成的閥限,限制了自我評價實現(xiàn)的可能性。
4.政策工具內(nèi)部結(jié)構(gòu)失衡,消解政策體系的協(xié)同性
理想的政策設(shè)計應(yīng)加強(qiáng)政策工具內(nèi)部結(jié)構(gòu)的協(xié)調(diào),在功能上實現(xiàn)互補和配合,形成政策協(xié)同效應(yīng)。若政策工具內(nèi)部結(jié)構(gòu)出現(xiàn)失衡的情況,將導(dǎo)致政策體系的整體功能受到削弱,難以全面協(xié)同地發(fā)力。然而,基礎(chǔ)教育質(zhì)量評價政策卻存在政策工具內(nèi)部結(jié)構(gòu)失衡的問題,主要體現(xiàn)在以下三個方面:其一,權(quán)威工具主要使用了規(guī)定工具,卻對許可和禁止這對屬性相反但性能互補的工具使用較少。由于基礎(chǔ)教育質(zhì)量評價涉及的相關(guān)群體較為復(fù)雜龐大,其利益訴求廣度和需求深度往往會超越政策制定者的設(shè)計預(yù)想,現(xiàn)實中易出現(xiàn)訴求溢出和需求異化的現(xiàn)象?;谫Y源有限性和理性經(jīng)濟(jì)人的假設(shè),政策制定者常常會縮小政策相關(guān)者的需求范圍,甚至對代價大、成本高的政策決策采取規(guī)避傾向。許可與某些禁止或要求特定活動的標(biāo)準(zhǔn)或規(guī)則相聯(lián)系,旨在通過提高某些遠(yuǎn)遠(yuǎn)超出行動本身收益的成本去消滅那些行為[28]66。許可和禁止均具有成本低、見效快的特點,這對于限定評價者和被評價者訴求和責(zé)任的范圍,以及完善評價標(biāo)準(zhǔn)和建立制度準(zhǔn)入機(jī)制(例如引入和審批第三方教育評價機(jī)構(gòu))是一種較好的政策工具選擇。例如,在學(xué)生綜合素質(zhì)評價推進(jìn)中,不少省市已經(jīng)投入大量人力、財力建立了綜合素質(zhì)評價系統(tǒng)平臺,卻出現(xiàn)投入與產(chǎn)出嚴(yán)重的“倒掛”現(xiàn)象,陷入效益困境,致使不少地方政府對其有效性產(chǎn)生懷疑,甚至動搖了持續(xù)推進(jìn)綜合素質(zhì)評價結(jié)果使用的信心[29]。在這種情況下,若未劃定綜合素質(zhì)評價主體的權(quán)責(zé)范圍,規(guī)避責(zé)任和刻意降低成本的行為將缺乏強(qiáng)意義上的“禁止”,綜合素質(zhì)評價難以得到全面長效落實。其二,象征與勸誡工具使用了較多的勸誡工具、象征聲明工具,基本原理工具嚴(yán)重缺位?;驹砉ぞ呦颠\用積極的象征來精心闡釋政策的基本內(nèi)容和原理機(jī)制,引導(dǎo)人們正確理解政策,其特點在于并不必然讓一個政策偏好的選擇客觀上與另外的選擇相沖突,進(jìn)而減少政策的負(fù)面性[8]328。當(dāng)前我國基礎(chǔ)教育質(zhì)量監(jiān)測與評價中存在價值不明確、理論基礎(chǔ)不扎實、具體要求不系統(tǒng)、教育方針落實陷入判斷困境等問題[30],人們對基礎(chǔ)教育質(zhì)量的內(nèi)涵理解不統(tǒng)一,紛繁復(fù)雜甚至錯誤的教育質(zhì)量觀短時期難以消除,對質(zhì)量監(jiān)測評價的理解與實施缺乏理論模型的指導(dǎo)[31];同時,教育評價改革面臨“破五唯”(即破除“唯分?jǐn)?shù)、唯升學(xué)、唯文憑、唯論文、唯帽子”現(xiàn)象)“立四新”(即建立“改進(jìn)結(jié)果評價、強(qiáng)化過程評價、探索增值評價、健全綜合評價”四項新舉措)[32]的邏輯轉(zhuǎn)向,向基礎(chǔ)教育質(zhì)量評價提出了新要求、新訴求和新關(guān)切。舊問題與新挑戰(zhàn)的并存交互對于剛步入深水區(qū)的基礎(chǔ)教育質(zhì)量評價改革來說,亟需基本原理工具的引入和有效應(yīng)用,以落實《總體方案》“加大對科學(xué)教育理念和改革政策的宣傳解讀力度”的要求,進(jìn)一步增進(jìn)政策相關(guān)群體的理解和認(rèn)同。其三,能力工具中的其他資源工具使用比例較低,資金保障工具的使用具有片面性?;A(chǔ)教育質(zhì)量評價政策執(zhí)行需要人力、技術(shù)、財力作為保障和支持,在沒有充足的資源保障與條件供給的情況下,執(zhí)行主體很難持續(xù)、全面有效地推進(jìn)評價的落實。當(dāng)前我國基礎(chǔ)教育質(zhì)量評價還面臨著一系列問題:在評價機(jī)構(gòu)和隊伍建設(shè)上,基礎(chǔ)教育質(zhì)量評價專業(yè)性機(jī)構(gòu)較少、評價人才總體較為匱乏[33];在評價技術(shù)方法層面,評價方法科學(xué)性有待提升,教育質(zhì)量評價深度融合大數(shù)據(jù)、云計算等現(xiàn)代技術(shù)是實現(xiàn)系統(tǒng)化蛻變的關(guān)鍵,需要引入先進(jìn)的評價技術(shù)和科學(xué)的評價方法。解決這些問題需要依靠政府和社會提供充足的支持條件,但當(dāng)前資金保障工具的使用缺乏全面指向性,義務(wù)教育質(zhì)量評價政策文件中未涉及資金保障的說明,這使現(xiàn)實中真正用于質(zhì)量評價實施的經(jīng)費難以得到堅實穩(wěn)定的保障,容易在不同層面上阻滯質(zhì)量評價的全面落實。
新時代推進(jìn)基礎(chǔ)教育質(zhì)量教育評價改革深化,應(yīng)當(dāng)注重政策工具結(jié)構(gòu)的系統(tǒng)性。在這方面,系統(tǒng)論為我們提供了參考:“結(jié)構(gòu)決定功能,要改變系統(tǒng),實現(xiàn)不同的功能,必須調(diào)整其結(jié)構(gòu),基本做法是‘穩(wěn)步推進(jìn)’,‘穩(wěn)’住系統(tǒng)平衡,‘推’動結(jié)構(gòu)演進(jìn),分層、有序、平衡地進(jìn)行”[34]。要使政策工具在執(zhí)行中取得預(yù)期成效,需對政策工具不斷進(jìn)行優(yōu)化和組合,提升其執(zhí)行效力。當(dāng)前,我國教育評價改革步入深水區(qū)、攻堅期、克難關(guān),“大破大立、破立并舉”成為基礎(chǔ)教育評價改革的關(guān)鍵議題?;貞?yīng)這一議題,既需要利用政府主導(dǎo)的權(quán)威工具為改革落實鋪路架橋,為“破”保駕護(hù)航;也需要利用激勵工具、學(xué)習(xí)工具等其他類型政策工具形成多維施政效力,為“立”開辟戰(zhàn)場。有鑒于此,基礎(chǔ)教育質(zhì)量評價政策完善需把握好政策工具組合結(jié)構(gòu)的全局性、協(xié)同性和平衡性,充實、優(yōu)化“政策工具箱”。
1.適時適當(dāng)減少權(quán)威工具的使用,合理釋放權(quán)威工具的正向效能
為更好地發(fā)揮權(quán)威工具的本原效能,避免其過溢使用帶來的消極影響,我們既要適當(dāng)減少權(quán)威工具的使用,也要重視權(quán)威工具的全面指向性,合理釋放其正向效能,從而實現(xiàn)政策工具優(yōu)化配置的目標(biāo)。其一,適時適當(dāng)?shù)販p少權(quán)威工具的使用,結(jié)構(gòu)調(diào)整不應(yīng)過于迅猛。政策工具選擇的變量模型認(rèn)為政府能力(實現(xiàn)政策目標(biāo)的能力)、社會能力(社會組織或個人的自組織能力和主動參與能力)、社會異質(zhì)性特性(各方利益訴求的分化程度)是政策工具配置的結(jié)構(gòu)性變量。當(dāng)政府能力高而社會能力弱時則適合直接型工具,當(dāng)政府能力高而社會異質(zhì)性特性強(qiáng)時則適合自愿性工具[35]。基于此,分析可知,一方面,我國當(dāng)前政府能力較強(qiáng),已經(jīng)建立了國家基礎(chǔ)教育監(jiān)測評價體系,但社會、個體層面的非政府評價主體的執(zhí)行能力較差,且參與度較低,適宜使用直接型工具,也即權(quán)威工具;另一方面,當(dāng)前我國教育評價活動具有較強(qiáng)的行政主導(dǎo)性,政策行動者的利益訴求多元分化,適宜使用自愿型工具,即內(nèi)發(fā)自愿執(zhí)行政策和解決問題的工具。綜上所述,就我國目前基礎(chǔ)教育評價現(xiàn)狀而言,在配置權(quán)威工具時,不宜短期內(nèi)大幅度減少權(quán)威工具的使用,否則與評價改革的現(xiàn)況不符,而應(yīng)根據(jù)政府能力、社會能力、社會異質(zhì)性的現(xiàn)實特性與結(jié)構(gòu)變化,適時適當(dāng)以梯度式穩(wěn)步減少,保證一定的政策緩沖時間,避免權(quán)威工具的結(jié)構(gòu)調(diào)整過于迅猛。其二,重視權(quán)威工具的全面指向性,合理釋放權(quán)威工具的正向效能。需要注意的是,減少權(quán)威工具的使用并不意味著對權(quán)威工具的輕視,更不意味著對權(quán)威工具正向效能的忽視與遮蔽。在具備相應(yīng)充足性條件的情況下,權(quán)威工具所具有的高效率等正向效能是其他類型政策工具難以達(dá)到的。為更好地發(fā)揮權(quán)威工具的正向效能,一方面,我們需要夯實權(quán)威工具使用的條件基礎(chǔ)。即需要強(qiáng)化評價有關(guān)部門的溝通互信和協(xié)商決策,不斷增強(qiáng)基礎(chǔ)教育質(zhì)量評價的社會認(rèn)可度和認(rèn)同感,凝聚多方共識,并著力培養(yǎng)和提升評價者的評價素養(yǎng)和評價能力,為執(zhí)行者提供充足的教育培訓(xùn)、信息指導(dǎo)、技術(shù)支持等支持。另一方面,我們需要構(gòu)建權(quán)威工具與其他各類工具的有效銜接機(jī)制,提升權(quán)威工具的有效性和執(zhí)行力,削弱權(quán)威工具靈活性較弱帶給政策實施的消極影響。以權(quán)威工具與激勵工具進(jìn)行銜接為例,《幼兒園保育教育質(zhì)量評估指南》提出“將評價結(jié)果作為對幼兒園資源配置的重要依據(jù);對違反有關(guān)政策規(guī)定的幼兒園,要及時督促整改,并視情況依法依規(guī)追究責(zé)任”。然而,政策文件對獎懲標(biāo)準(zhǔn)的設(shè)定較為模糊,且缺乏完善的落實和監(jiān)督機(jī)制,這難以保障激勵成效。在這種情況下,我們可利用權(quán)威工具架構(gòu)激勵措施的獎懲范圍和權(quán)限空間,建立激勵措施執(zhí)行的監(jiān)督管理體系,評估其是否達(dá)到預(yù)期的激勵成效,并做出相應(yīng)的督促或指導(dǎo),切實形成以評促“建、管、改、強(qiáng)”的效果。
2.提升激勵工具的使用頻次,激發(fā)評價體系內(nèi)部動力
面對如何解決評價體系內(nèi)部動力和積極性不足的問題,我們可以通過加強(qiáng)激勵工具的使用來予以化解。具體而言,一是要在整個“政策工具箱”中提升激勵工具的使用比例。在施耐德和英格拉姆的政策工具類型中,正向激勵包括財政補貼、授權(quán)、稅收減免和表彰等物質(zhì)或精神獎勵,負(fù)向激勵包括收費、制裁或問責(zé)等懲罰措施,其中適合我國教育評價現(xiàn)狀的是財政補貼、授權(quán)、表彰、制裁、問責(zé)。我們要以基礎(chǔ)教育質(zhì)量評價的具體問題為指向,有針對性地重視對財政補貼、授權(quán)、表彰、制裁、問責(zé)等子工具的選用。二是要提升激勵工具使用的全面性,促進(jìn)正向激勵工具和負(fù)向激勵工具的協(xié)同發(fā)力。激勵的雙因素理論指出“滿意的對立面是沒有滿意,沒有滿意并不意味著不滿意;不滿意的對立面是沒有不滿意,沒有不滿意并不意味著滿意”[36]156。這啟示我們,面對負(fù)向激勵工具,政策行動者會盡量做到防止違規(guī)、防止被問責(zé)和被制裁、不落實不力,但防止違規(guī)、防止被問責(zé)和被制裁、不落實不力并不意味著落實得力,更不意味著能很好地甚至是超越性地完成政策任務(wù)。負(fù)向激勵可以使政策行動者遵守底線要求,避免政策執(zhí)行效果過差,正向激勵則可以鼓勵政策行動者做得更好,兩者結(jié)合使用有利于全面發(fā)揮激勵工具的效力。例如在實踐中,我們可對表現(xiàn)優(yōu)異的第三方評價機(jī)構(gòu)給予一定的財政補貼;評選出在自我評價當(dāng)中表現(xiàn)優(yōu)異的學(xué)校,給予合理的經(jīng)濟(jì)獎勵或表彰宣傳;對政策落實不力、違規(guī)等行為予以問責(zé)或處罰。需要說明的是,正向激勵工具不是對教師教學(xué)品質(zhì)和水平的激勵,也不是對學(xué)校教育質(zhì)量的獎勵,而是對教育質(zhì)量評價本身的激勵。
3.增強(qiáng)學(xué)習(xí)工具的使用力度,充分發(fā)揮多重工具效能
其一,強(qiáng)化自我評價工具的使用,充分關(guān)照評價對象的主體性?;A(chǔ)教育質(zhì)量評價政策與相關(guān)群體的聯(lián)結(jié)度低,說到底還是缺乏評價對象的深度參與,缺乏對其主體性的觀照,解決這一問題需要增強(qiáng)自我評價工具的使用力度。開展自我評價是當(dāng)前教育評價改革的重要面向,當(dāng)前政府已經(jīng)注意到自我評價工具的運用。如《義務(wù)教育質(zhì)量評價指南》中明確“義務(wù)教育質(zhì)量評價實行縣(市、區(qū))和學(xué)校自評;義務(wù)教育學(xué)校對本校辦學(xué)質(zhì)量進(jìn)行自評;縣級黨委政府對本縣域義務(wù)教育質(zhì)量和黨委政府履職情況進(jìn)行自評”。然而,審視政策內(nèi)容可發(fā)現(xiàn)自我評價的詳細(xì)標(biāo)準(zhǔn)、制度框架和落實監(jiān)督等方面尚不完善,這易使自我評價流于形式,實踐中難以得到準(zhǔn)確全面的落實。因此,我們需完善自我評價的細(xì)則和實施程序,建立相應(yīng)的配套監(jiān)督措施,暢通自我評價的信息傳導(dǎo)渠道,保障自我評價結(jié)果的準(zhǔn)確反饋和有效運用。國際上不乏自我評價的范例。新西蘭教育部頒布《學(xué)前教育自我評估指南》,以明確的制度框架指導(dǎo)各級學(xué)前教育學(xué)校開展自我評價活動,在評價前期,學(xué)前教育學(xué)校還需向評估機(jī)構(gòu)提交《學(xué)前教育機(jī)構(gòu)保證陳述和自我檢查清單》《教育理念和自我評估陳述》,以提前了解自我評價的過程和程序,明確評估重點[37]67。該舉措既給評價對象創(chuàng)設(shè)了自我評價的緩沖改進(jìn)空間,關(guān)照了評價對象的主體性,有利于調(diào)動參與者的積極性;同時也為外部評價提供了信息資源,使自我評價結(jié)果和信息得到充分利用。類似做法值得借鑒。
其二,提升研究探索、協(xié)商探討工具的使用,凝聚政策多元共識。教育評價是一項世界性和歷史性的難題,基礎(chǔ)教育質(zhì)量評價的背后裹挾著理論層面復(fù)雜多元的認(rèn)識論挑戰(zhàn)和實踐操作層面暫付闕如的方法論困難。例如基礎(chǔ)教育質(zhì)量評價如何廣泛聽取有益意見,凝聚政策共識?基礎(chǔ)教育質(zhì)量評價改革如何全面落實立德樹人的根本任務(wù)?如何實現(xiàn)教育質(zhì)量的增值評價、過程評價?怎么推進(jìn)學(xué)生的綜合素質(zhì)評價?如何測量學(xué)生的核心素養(yǎng)?如何減少標(biāo)準(zhǔn)化思維、技術(shù)化思維對評價的消極影響?如何化解評價與教育相脫節(jié)的窘?jīng)r以及人的主體性被遮蔽的問題?當(dāng)和這些問題相關(guān)的政策用權(quán)威工具、象征與勸誡工具簡單地呈現(xiàn)給政策行動者時,政策行動者在缺乏正確認(rèn)識和有效的方法技術(shù)手段的情況下,難以深入開展與教育評價活動本質(zhì)要求相符合的評價活動。解決上述問題的關(guān)鍵一招是增強(qiáng)研究探索、協(xié)商探討工具的運用,培養(yǎng)政策行動者的學(xué)習(xí)能力,增強(qiáng)他們對問題的深入理解以及提出高質(zhì)量解決方案的能力。具體而言,一是建立政策學(xué)習(xí)機(jī)制。公共政策制定的合理性取決于增進(jìn)各種公共議事的學(xué)習(xí)能力[38]32,學(xué)習(xí)機(jī)制建設(shè)需要政策制定者根據(jù)以往政策結(jié)果和信息適當(dāng)調(diào)整政策目的或改進(jìn)技術(shù)[39]。就基礎(chǔ)教育質(zhì)量評價政策而言,一方面要在政策修訂過程前深入開展調(diào)查研究,推行試點工作,總結(jié)和積累實踐中涌現(xiàn)的優(yōu)秀評價經(jīng)驗和案例,形成“資料庫”;另一方面,要根據(jù)前期的總結(jié)和積累,在政策文件中羅列需研究探索和學(xué)習(xí)的事項,適當(dāng)要求學(xué)校呈現(xiàn)評價過程中學(xué)習(xí)和研究探索的事項、過程與結(jié)果,進(jìn)而增強(qiáng)政策行動者的學(xué)習(xí)能力和探索意識,促進(jìn)政策學(xué)習(xí)實現(xiàn)制度化和長效化。二是研究探索建立第三方評價機(jī)制。教育質(zhì)量評價是一項專業(yè)性、科學(xué)性的活動,需要專業(yè)評價機(jī)構(gòu)的參與?!胺e極探索政府購買服務(wù)方式,培育和委托第三方評價機(jī)構(gòu)開展評價”亟需通過研究探索和學(xué)習(xí)機(jī)制來深化拓展第三方評價的理論與實踐研究,建立第三方評價制度框架,提供法律法規(guī)的認(rèn)同和賦權(quán),營造良好的制度環(huán)境。國際上不乏優(yōu)秀案例,芬蘭建立了獨立于政府部門的“芬蘭教育評估中心”,該中心不僅是非官方的教育評價機(jī)構(gòu),還是評價研發(fā)部門,芬蘭政府對教育評價從直接干預(yù)轉(zhuǎn)換為間接、宏觀上的規(guī)劃與協(xié)調(diào),使評價活動保持了一定的價值中立。此外,芬蘭政府充分利用“芬蘭教育研究所”等市場化層面的第三方機(jī)構(gòu),使得基礎(chǔ)教育質(zhì)量評價主體廣泛多元,發(fā)揮了重要的溝通、平衡作用。這些第三方評價機(jī)構(gòu)成為芬蘭教育評估的核心抓手,提升了芬蘭基礎(chǔ)教育質(zhì)量評價的專業(yè)化水平和效率[40]26+43。此類經(jīng)驗值得深入研究和試點探索。三是構(gòu)建協(xié)商探討的評價模式。教育評價不是外在于人的、純客觀的過程,而是參與評價的所有人通過不斷的協(xié)商、對話、協(xié)調(diào)教育價值觀,縮短意見分歧后整合而成的共同看法[41]。我國教育評價政策往往關(guān)注政策制定前的廣泛調(diào)研和聽取各方意見,卻忽視了政策實施過程中的協(xié)商探討。為此,應(yīng)將協(xié)商探討納入到評價政策的全過程中,構(gòu)建基于評價過程的,包含政策制定者、執(zhí)行者、評價對象等多元相關(guān)者參與的多向探討和互動溝通模式,為他們設(shè)置對話和反饋渠道(如座談會、報告會、電話熱線等),進(jìn)而增進(jìn)政策聯(lián)結(jié)度,凝聚多方共識。國際上不乏這樣的做法。新西蘭“教育評估辦公室”每年都會以研討會、座談會等方式,圍繞學(xué)前教育評估與教育部、學(xué)前教育機(jī)構(gòu)、高等教育機(jī)構(gòu)、社會公眾等進(jìn)行交流探討,為每一類群體都提供一個共同協(xié)調(diào)對話的空間,增強(qiáng)了政策信息共享與公眾理解,促進(jìn)了學(xué)前教育評估的專業(yè)化交流及結(jié)果運用[37]51。類似做法值得借鑒。
4.完善政策工具內(nèi)部結(jié)構(gòu),提升政策工具的協(xié)同性
調(diào)整權(quán)威工具、象征與勸誡工具、能力工具的內(nèi)部結(jié)構(gòu),優(yōu)化政策工具的組合,才能更好地提升政策工具的協(xié)同效力,促進(jìn)基礎(chǔ)教育質(zhì)量評價取得良好的政策效果。為此,可從以下三個方面著手:其一,以因事制宜為導(dǎo)向合理運用許可、禁止工具,完善權(quán)威工具內(nèi)部結(jié)構(gòu)。例如,為了避免評價者失責(zé)、僭越權(quán)限、多頭重復(fù)評價等行為的發(fā)生,可恰當(dāng)運用禁止工具建立權(quán)力清單、責(zé)任清單、權(quán)益清單等,從而限定評價者的權(quán)責(zé)范圍和被評價者的利益訴求范圍。又如,探索建立第三方評價機(jī)制時,可運用許可工具設(shè)置第三方評價機(jī)構(gòu)的準(zhǔn)入標(biāo)準(zhǔn)與條件、審批程序、市場競爭規(guī)則等內(nèi)容,這既引入了市場機(jī)制,有利于促進(jìn)第三方評價機(jī)構(gòu)市場化競爭與發(fā)展,又以較低成本建立了準(zhǔn)入門檻,節(jié)約了政策成本。其二,加強(qiáng)基本原理工具的使用,增進(jìn)政策理解度和認(rèn)同度。一方面可在政策設(shè)計中設(shè)立清單制度,明確需要宣傳、解讀、闡釋、引導(dǎo)的事項和評價觀念,進(jìn)一步使政策實施者及社會公眾明白評價的優(yōu)先重要事項。另一方面,細(xì)化基本原理工具的落實機(jī)制,在政策制定和實施過程中,充分發(fā)揮基本原理的闡釋性功能,運用積極的象征和正面的元素(如學(xué)生綜合素質(zhì)評價具有的優(yōu)勢和意義)來說明教育質(zhì)量評價的價值作用,加強(qiáng)評價結(jié)果的公開公示和宣傳解讀,引導(dǎo)公眾正確理解評價結(jié)果,為政策落實爭取更多的社會支持和輿論氛圍,推動社會大眾形成科學(xué)的教育質(zhì)量觀[42]。其三,推動資金保障工具全方位、精準(zhǔn)化運用。具體而言,一是針對基礎(chǔ)教育質(zhì)量評價特別是義務(wù)教育質(zhì)量評價中的匱乏性條件要素,例如建設(shè)評價機(jī)構(gòu)和隊伍、引入先進(jìn)評價技術(shù)方法、研發(fā)測評工具等亟需資金支持的方面,提供全方位的精準(zhǔn)資金支持。二是進(jìn)一步明確財政資金的使用程序、范圍,提升資金支持的精準(zhǔn)性和穩(wěn)定性,并建立配套的監(jiān)督措施,防止資金腐敗問題的滋生。三是要厘清激勵工具的財政物質(zhì)激勵與能力工具中的資金保障兩者的邊界,促使資金保障工具的精準(zhǔn)發(fā)力。激勵工具中的財政物質(zhì)激勵強(qiáng)調(diào)短期內(nèi)對政策行動者的獎勵,針對性強(qiáng)但不穩(wěn)定;能力建設(shè)工具中的資金保障更側(cè)重于通過經(jīng)濟(jì)手段培養(yǎng)政策行動者的執(zhí)行能力,立足于長遠(yuǎn)的考慮,具有穩(wěn)定性和公共利益偏好。在政策制定和實施過程中,應(yīng)當(dāng)注重兩者的區(qū)別。
《總體方案》的頒布開啟了基礎(chǔ)教育質(zhì)量評價改革的新征程,標(biāo)志著一場“大仗、硬仗、持久仗”的開始,以基礎(chǔ)教育質(zhì)量評價為政策抓手驅(qū)動教育質(zhì)量的提升、引導(dǎo)教育質(zhì)量及其評價觀的改善成為一項重要議題,需要我們以堅定的改革信念、反思性的改革思維、務(wù)實的改革精神、穩(wěn)重的改革步伐,拿出“真招、實招、妙招”,推進(jìn)基礎(chǔ)教育質(zhì)量評價政策落實落細(xì),實現(xiàn)基礎(chǔ)教育發(fā)展的“再出發(fā)”。本研究強(qiáng)調(diào)了一種政策工具的視角,一種基于政策工具的關(guān)注政策行動者行為規(guī)律的視角,為思考基礎(chǔ)教育質(zhì)量評價政策改進(jìn)提供了一條進(jìn)路。雖然對于全口徑的基礎(chǔ)教育質(zhì)量評價政策系統(tǒng)而言,這種政策工具的分析或許尚不全面和深入,但從這一視角可以窺見基礎(chǔ)教育質(zhì)量評價政策中一些重要的問題與特征,亦為后續(xù)的研究提供了一些思考方向和研究空間。