●潘佳琦 姚春艷
中國教育評價(jià)如何走“第三方化”之路
●潘佳琦 姚春艷
多年來,以國家教育行政部門為主導(dǎo)的評價(jià)與考試模式廣受詬病。中國學(xué)界對此問題的研究可謂汗牛充棟,國家教育部門也早已重視,并一直積極探索解決方案。
2002年,《教育部關(guān)于積極推進(jìn)中小學(xué)評價(jià)與考試制度改革的通知》首次提出探尋評價(jià)主體、內(nèi)容和方法的多樣化;《國家中長期教育改革和發(fā)展規(guī)劃綱要(2010-2020年)》《教育部關(guān)于推進(jìn)中小學(xué)教育質(zhì)量綜合評價(jià)改革的意見》(2013)均提出探索建立一種政府、社會組織和專業(yè)機(jī)構(gòu)等共同參與的外部評價(jià)機(jī)制。中國教育學(xué)會副會長朱永新教授在2013年“兩會”上提交了《關(guān)于發(fā)展“第三方”教育考試與評價(jià)體系的提案》,在對中國教育評價(jià)現(xiàn)狀進(jìn)行深刻剖析的基礎(chǔ)上,更為明確地指出了“國家應(yīng)大力扶持和發(fā)展社會第三方教育考試與評價(jià)機(jī)構(gòu)”的建議。這些政策、方案的制定和提出,為中國教育評價(jià)與考試的“第三方化”發(fā)展指明了方向。
2014年1月,教育部發(fā)布了“2014年工作要點(diǎn)”,在“將啟動(dòng)20項(xiàng)新計(jì)劃”中明確提出了“組織第三方開展教育現(xiàn)代化檢測與滿意度測評”。這意味著,由政府積極倡導(dǎo)的中國教育評價(jià)與考試的第三方化模式將正式開始。
隨著中國教育評價(jià)與考試新政策的推進(jìn),一些地方政府教育部門已開始積極探索第三方評價(jià)與考試的模式。2012年9月,西安市教育局創(chuàng)新教育評價(jià)與考試體系,通過購買服務(wù)的方式,第三方評價(jià)機(jī)構(gòu)作為合同中的乙方正式介入一直以來由教育行政部門為主導(dǎo)的教育評價(jià)工作;同年,四川省成都市青羊區(qū)教育局引入專業(yè)機(jī)構(gòu)公眾教育研究院的ACTS學(xué)業(yè)(素質(zhì))評價(jià)技術(shù)和服務(wù),開展教育質(zhì)量監(jiān)測、學(xué)業(yè)評價(jià)等,并于2013年9月以第三方ACTS學(xué)業(yè)評價(jià)為基礎(chǔ),以《教師專業(yè)發(fā)展標(biāo)準(zhǔn)》為依據(jù),啟動(dòng)了“教師退出機(jī)制”。這一系列的第三方評價(jià)與考試模式的實(shí)踐探索,不僅為中國教育評價(jià)與考試“第三方化”的探索和推廣作出了貢獻(xiàn),而且有力地證明了中國教育評價(jià)與考試走“第三方化”道路是可行的,也是中國教育發(fā)展的必然趨勢。
在中國教育評價(jià)與考試啟動(dòng)“第三方化”模式之際,“追本溯源”則顯得尤為重要。肇始于西方的第三方教育評價(jià)與考試,經(jīng)歷了從最初的測量理論及紙筆測驗(yàn)形式,以教育目標(biāo)為核心的評價(jià)原理,到把教育評價(jià)計(jì)算機(jī)化、因人施測的項(xiàng)目反映理論、革新了傳統(tǒng)智力測試的“多元智能”,逐步形成了較為完備的理論模型、測量評價(jià)技術(shù)及評價(jià)考試模式。截至目前,第三方教育評價(jià)與考試已成為了歐美國家普遍采用的模式。作為西方發(fā)達(dá)國家之一的美國,幾乎所有的考試與評價(jià)都是由獨(dú)立于政府和招生單位之外的社會“第三方”考試評估機(jī)構(gòu)組織實(shí)施。以美國教育考試服務(wù)中心(ETS)為代表的幾大評估機(jī)構(gòu),主要采用總部與分所聯(lián)合的運(yùn)營機(jī)制,服務(wù)項(xiàng)目極其廣泛。第三方評價(jià)與考試模式因其特有的優(yōu)越性,廣為市場和國家所認(rèn)可。更為重要的是:因?yàn)閾碛休^為完善的評價(jià)與考試?yán)碚摵图夹g(shù),各分所與總部各司其職,通過不同的評價(jià)與考試形式,逐步確立了多種考試與評價(jià)、數(shù)據(jù)分析、成績報(bào)告、指導(dǎo)性策略等評價(jià)與考試流程與模式,為第三方教育評價(jià)與考試的發(fā)展提供了有力的技術(shù)保障。
在歐美國家的第三方教育評價(jià)與考試日益發(fā)展和完善的同時(shí),中國的教育評價(jià)與考試卻始終原地踏步。體制方面,教育評價(jià)與考試一直以來主要由政府部門開展,行政監(jiān)管與業(yè)務(wù)實(shí)施職能不分,導(dǎo)致教育評價(jià)與考試水平始終停滯不前,具體表現(xiàn)在評價(jià)與考試內(nèi)容重“知識和技能”,輕“能力和素養(yǎng)”;評價(jià)與考試結(jié)果重“甄別”,輕“診斷”;評價(jià)手段較為單一,技術(shù)落后等。技術(shù)方面,目前中國教育評價(jià)與考試所應(yīng)用的理論仍以美國40、50年代盛行的泰勒評價(jià)理論為主,未能將教育學(xué)、心理學(xué)的最新理論和研究成果應(yīng)用起來,導(dǎo)致評價(jià)和考試的目標(biāo)與新課改的教育目標(biāo)嚴(yán)重脫節(jié)。理論基礎(chǔ)所造成的偏差,絕非先進(jìn)的統(tǒng)計(jì)技術(shù)所能彌補(bǔ)的。這也正是近年來,教育評價(jià)與考試統(tǒng)計(jì)結(jié)果的呈現(xiàn)令人眼花繚亂,卻依舊無法解決教育實(shí)質(zhì)問題的原因所在。因此,盡管國家制定相關(guān)政策和制度,積極推動(dòng)教育評價(jià)與考試的“第三方化”,但若教育評價(jià)與考試技術(shù)不能取得重大突破,政策依舊會淪為紙上談兵。由此可見,教育評價(jià)與技術(shù)的革新是中國教育評價(jià)“第三方化”亟需解決的重點(diǎn)和難點(diǎn)問題。
首先,需積極轉(zhuǎn)變評價(jià)與考試?yán)砟?。中國教育評價(jià)與考試一直以學(xué)生的“知識點(diǎn)與題型”為核心的考試成績?yōu)樵u價(jià)內(nèi)容,以這種考試分?jǐn)?shù)為主要“標(biāo)桿”,衡量學(xué)生的優(yōu)劣,而且“一錘定音”。這種評價(jià)與考試的技術(shù)和模式已不適于教育改革的發(fā)展要求,教育評價(jià)與考試欲走“第三方化”之路,必須轉(zhuǎn)變評價(jià)與考試?yán)砟?,即形成“成長、成績、成才”三位一體的評價(jià)與考試?yán)砟睢?/p>
其次,需借鑒西方科學(xué)的理論與實(shí)踐經(jīng)驗(yàn)。中國的教育評價(jià)與考試以落后的測量學(xué)理論為基礎(chǔ)(知識和簡單技能測量),以“知識點(diǎn)與題型”為核心的考試為評價(jià)方式早已不能滿足課程改革的要求。教育評價(jià)與考試欲實(shí)現(xiàn)“第三方化”,一者,應(yīng)學(xué)習(xí)吸收西方先進(jìn)的教育評價(jià)與考試?yán)碚?。?dāng)今世界的教育評價(jià)和考試,已經(jīng)進(jìn)入了以“教育目標(biāo)分類學(xué)”“多元智能”“認(rèn)知建構(gòu)”等理論為主的時(shí)代,尤其是布魯姆(Benjamin Bloom)提出的“教育目標(biāo)分類學(xué)”,明確指出,教育評價(jià)與考試應(yīng)圍繞“知識、技能、能力”(認(rèn)知領(lǐng)域)、“過程、方法、策略”(心智運(yùn)動(dòng)領(lǐng)域)、“情感、價(jià)值、態(tài)度”(情意領(lǐng)域)這三維目標(biāo)展開。教育目標(biāo)分類理論及以此為基礎(chǔ)的評價(jià)理論,不僅在歐美國家經(jīng)歷了長期科學(xué)實(shí)驗(yàn)和論證,且經(jīng)過長達(dá)半個(gè)世紀(jì)的實(shí)踐檢驗(yàn),也是我國教育改革實(shí)施“三維目標(biāo)”、《國家課程標(biāo)準(zhǔn)》、“考試與評價(jià)改革制度”等理論依據(jù)與實(shí)踐基礎(chǔ)之一,其科學(xué)性、可靠性、可信性等不言而喻。如何有效、可靠地借鑒應(yīng)用歐美國家的應(yīng)用理論模型與操作模式,是擺在我們面前的任務(wù)之一。二者,應(yīng)廣泛借鑒西方教育評價(jià)與考試的實(shí)踐經(jīng)驗(yàn)。從大型的評價(jià)中心,到小型的評價(jià)機(jī)構(gòu);從對大學(xué)入學(xué)考試,中小學(xué)考試評價(jià)到對社會的其他評價(jià),西方的第三方教育評價(jià)與考試機(jī)構(gòu),憑借其雄厚的專業(yè)實(shí)力、一體化的評價(jià)技術(shù),已植根于教育評價(jià)與考試市場。西方教育評價(jià)與考試的“第三方化”所構(gòu)建的應(yīng)用模式、積聚的實(shí)踐經(jīng)驗(yàn),應(yīng)為中國的教育評價(jià)與考試的“第三方化”提供重要的參考。
第三,作為專業(yè)化的第三方評價(jià)與考試機(jī)構(gòu),應(yīng)聚集一批擁有測量學(xué)、統(tǒng)計(jì)學(xué)、數(shù)據(jù)處理技術(shù)等方面的相關(guān)專業(yè)人才,根據(jù)不同的學(xué)科、學(xué)段,建立考前分析、考后評價(jià)、成績單分析、教育咨詢(學(xué)業(yè)咨詢、授業(yè)咨詢、決策咨詢)等一體化的評價(jià)與考試流程。考前分析,即對評價(jià)與考試之前已完成命制的試卷或項(xiàng)目設(shè)計(jì)進(jìn)行解析、信效度分析等,目的是調(diào)整不同題目或項(xiàng)目所考查的知識、技能、能力的結(jié)構(gòu)分布以及其預(yù)設(shè)難度等;考后評價(jià),即對評價(jià)與考試完成的試題在其題目或項(xiàng)目的信度、效度、區(qū)分度上進(jìn)行統(tǒng)計(jì)分析。主要目的是為以后的試題命制(或項(xiàng)目設(shè)計(jì))、教研、教學(xué)、輔導(dǎo)等,提供科學(xué)、可靠、有效的參考依據(jù);而成績單的分析,作為這一流程中的重要環(huán)節(jié),對學(xué)生的成績進(jìn)行多元、多維、多層的深度數(shù)據(jù)挖掘及解析和分析,通過每個(gè)學(xué)生的“知識、技能、能力”顯性維度的分項(xiàng)、維度、指標(biāo)成績,以及“過程、方法、策略”和“情感、價(jià)值、態(tài)度”隱性兩維的分項(xiàng)、維度、指標(biāo)成績,探索對學(xué)生成績、成長、成才產(chǎn)生影響的多元因素,提供科學(xué)、可靠的甄別和診斷,再輔以教育咨詢,不僅能將評價(jià)的診斷作用加以充分發(fā)揮,而且能為學(xué)生的未來得以全面發(fā)展提出科學(xué)化建議。上述流程及模式的實(shí)施可以有效地彌補(bǔ)當(dāng)前中國教育評價(jià)與考試之技術(shù)不足,使得中國教育評價(jià)與考試真正科學(xué)有效、可靠可信地實(shí)現(xiàn)精細(xì)的甄別、精準(zhǔn)的診斷和科學(xué)的咨詢,并實(shí)現(xiàn)可靠的解決教研、教學(xué)、輔導(dǎo)等科學(xué)化和人本化。
中國教育評價(jià)與考試的“第三方化”之路已經(jīng)啟動(dòng),并勢在必行。在符合當(dāng)前中國教育改革發(fā)展趨勢的前提下,以科學(xué)的理論基礎(chǔ)為支撐、以可靠有效的評價(jià)技術(shù)為保障,構(gòu)建新型的評價(jià)與考試模式,才能使中國教育評價(jià)與考試在“第三方”化的道路上走得更科學(xué)、更規(guī)范。
作者
潘佳琦 漢語國際教育碩士。公眾考試研究院見習(xí)研究員。
姚春艷 心理學(xué)、MBA雙碩士,教育評價(jià)與考試專家。公眾教育研究院、公眾考試研究院副院長,公眾學(xué)業(yè)素質(zhì)教育研究所所長。
(責(zé)任編輯 張華英)