梅含辛
長期以來,人們一提及教育評價(jià),想到的就是標(biāo)準(zhǔn)化考試及其測量結(jié)果,這種以數(shù)字表征的結(jié)果所代表的客觀性和科學(xué)性成為標(biāo)準(zhǔn)化考試得以服人的重要原因。因此,在綜合素質(zhì)評價(jià)實(shí)施之初,人們不自覺地去追求這一標(biāo)準(zhǔn)。而人是非常復(fù)雜、豐富的統(tǒng)一體。簡單地以定量的方式很難對人的綜合素質(zhì)進(jìn)行整體全面的評價(jià),而且,量化的評價(jià)把復(fù)雜的教育現(xiàn)象僵化、簡單化和表面化,往往失去了教育中最有意義、最根本的內(nèi)容,無法反映真實(shí)的教育性。
所以,就需要定性評價(jià)的參與。這就涉及到一個(gè)問題:如何處理定性評價(jià)和定量評價(jià)的關(guān)系?本期,就“如何處理定性評價(jià)和定量評價(jià)的關(guān)系”進(jìn)行討論。
泰勒在《課程與教學(xué)的基本原理》一書中闡述課程評價(jià)的基本觀點(diǎn)時(shí)指出,教育評價(jià)是判斷課程和教學(xué)計(jì)劃在多大程度上實(shí)現(xiàn)教育目標(biāo)的過程,也就是判斷學(xué)生行為模式發(fā)生了多大程度的改變。當(dāng)然,這里的行為是廣義的,既指看得見的行為,還指內(nèi)在的思維、情緒過程;這里的變化也不僅僅是指短暫的變化,更是指一種深刻持久的變化,或者說是模式的變化。
評價(jià)的本質(zhì)就是引出或闡發(fā)價(jià)值。課程中的學(xué)生評價(jià)是對學(xué)生學(xué)習(xí)和學(xué)力的評價(jià),其根本目的是為學(xué)生的學(xué)習(xí)和發(fā)展提供有針對性的、切實(shí)的指導(dǎo)和建議。
一、教育評價(jià)是一種有限準(zhǔn)確的手段
泰勒認(rèn)為,教育評價(jià)是一種有限準(zhǔn)確的手段。首先,實(shí)現(xiàn)教育目標(biāo)的那一些經(jīng)驗(yàn)(知識、能力和態(tài)度等等)雖然經(jīng)過評估,不過,它們是與情境分離的、高度抽象的,只適用于一般性原則,而不是一種具體、復(fù)雜而又高度精確的陳述。其次,任何一組學(xué)習(xí)經(jīng)驗(yàn)都包括很多標(biāo)準(zhǔn),而其中每一種標(biāo)準(zhǔn)都只是近似的,因?yàn)槲覀冎荒茉诖篌w上或者以某種有限的準(zhǔn)確性來預(yù)測這些學(xué)習(xí)經(jīng)驗(yàn)是否會真的產(chǎn)生這樣的效果。最后,學(xué)生個(gè)體的復(fù)雜性和學(xué)習(xí)情境的多樣性,也是造成評價(jià)有限準(zhǔn)確的外部原因。
2013年暑假,江蘇省綜合實(shí)踐活動(dòng)課程的省培活動(dòng)中,筆者參加了一次《問卷調(diào)查設(shè)計(jì)指導(dǎo)》的課堂觀摩活動(dòng)。因?yàn)檫@一次觀摩課由許多教師扮演學(xué)生來模擬課堂教學(xué),要從教與學(xué)的雙重角度去參與和評價(jià),所以印象特別深刻。其中有一個(gè)環(huán)節(jié)是一項(xiàng)關(guān)于教師職業(yè)生活幸福指數(shù)的調(diào)查。針對執(zhí)教者的這個(gè)問卷設(shè)計(jì),有教師提出了質(zhì)疑:“我對于問卷調(diào)查中關(guān)于幸福指數(shù)的量化指標(biāo)的答案選項(xiàng),始終無法接受ABcD或者類似的一種僵化分割。”
確實(shí),對于人類情緒的強(qiáng)弱程度、感受能力的大小、思維的敏捷程度等抽象而又復(fù)雜的東西,調(diào)查問卷技術(shù)性的測試和評估表現(xiàn)了一種模糊準(zhǔn)確的智慧。與此類似,教育評價(jià)是一種相對準(zhǔn)確的判斷。
定性評價(jià)多采用描述性的語言來決定評價(jià)對象水平的高低,所以相對來說全面、深入,不過客觀性不強(qiáng)。定性評價(jià)更多的是關(guān)于對象的價(jià)值、性質(zhì)和水平的描述。
定量評價(jià)以按照一定比例的數(shù)據(jù)為常模的量化技術(shù),通過給出數(shù)值來展開評價(jià),主要用數(shù)量表示評價(jià)標(biāo)準(zhǔn)、描述現(xiàn)象、分析狀態(tài)、表示評價(jià)結(jié)果等等。雖然數(shù)值的形式比較單一,但在清楚明確的評價(jià)指標(biāo)下,采取合理的評價(jià)技術(shù),能夠獲得相對客觀的結(jié)果。定量評價(jià)側(cè)重體現(xiàn)了評價(jià)的區(qū)別功能。
基于人類行為的復(fù)雜性和評價(jià)情境的復(fù)雜性,所以在學(xué)生評價(jià)中需要通過定性評價(jià)和定量評價(jià)相結(jié)合的方式來突破評價(jià)的局限性,提高其準(zhǔn)確度。
二、區(qū)分兩種評價(jià),發(fā)展促進(jìn)學(xué)生學(xué)習(xí)和成長的評價(jià)
評價(jià)的本質(zhì)不僅僅是區(qū)別,更是為了引出價(jià)值,而作為考試的評價(jià)強(qiáng)化了區(qū)別的手段功能,使得教育目的及其過程無形之中被異化了。
由于長期推行應(yīng)試教育,中高考成績已經(jīng)成為評價(jià)學(xué)校教育的主要指標(biāo),這樣導(dǎo)致了課程評價(jià)的單一和嚴(yán)重滯后,從而阻礙甚至誤導(dǎo)學(xué)生的發(fā)展。這些已經(jīng)成為我國新課程改革中亟待解決的突出問題。多爾在《后現(xiàn)代課程觀》一書中指出,美國“在現(xiàn)代主義框架中,評價(jià)基本用于區(qū)別勝利者和失敗者。這就是州和全國的考試,以及各類專業(yè)考試所做的——它們旨在區(qū)分等級”,“考試幾乎普遍地作為區(qū)分手段而不是對話的起點(diǎn)”。
這里需要區(qū)分的是兩種評價(jià),一種是對學(xué)習(xí)的評價(jià),也是作為選拔的評價(jià);另外一種是為了促進(jìn)學(xué)習(xí)(甚至是終身學(xué)習(xí))的評價(jià),而在教學(xué)之中更多應(yīng)該采用這一種評價(jià)。讓課程評價(jià)回歸到推動(dòng)學(xué)生個(gè)體智力和社會能力發(fā)展的教育本位和發(fā)展本位,這是課程評價(jià)改革的應(yīng)有之義。
三、在清晰和細(xì)化的評價(jià)目標(biāo)基礎(chǔ)上,合理運(yùn)用定量評價(jià),既作為教育活動(dòng)的反饋,又為學(xué)生的發(fā)展提供有價(jià)值的建議
泰勒認(rèn)為,人類行為的評估是一個(gè)非常復(fù)雜而又系統(tǒng)的分析性過程,不應(yīng)該是單一的分?jǐn)?shù)總結(jié)。得知甲97分,乙64分,對于改進(jìn)課程和幫助個(gè)體并沒有太多的積極意義,而更加有用的是,在清晰和細(xì)化的評價(jià)目標(biāo)下,表明優(yōu)點(diǎn)和弱點(diǎn)的總結(jié)。根據(jù)學(xué)科關(guān)鍵能力、核心概念,采取多種目標(biāo)的分類評價(jià)和分類評分,通過澄清打分細(xì)則來提高評價(jià)的客觀性,這種表明了特定優(yōu)點(diǎn)和缺點(diǎn)的分析性總結(jié)在改進(jìn)課程、促進(jìn)學(xué)生的自我調(diào)整方面是很有價(jià)值的。
反對應(yīng)試,并非單純反對考試,而是合理發(fā)揮定量評價(jià)的作用。多爾指出,“從本質(zhì)上說,評價(jià)應(yīng)該成為共同背景之中以轉(zhuǎn)變?yōu)槟康牡膮f(xié)調(diào)過程?!瓚?yīng)將其(評價(jià))作為一種反饋,作為‘做——批——評——做——批——評這一循環(huán)過程的組成部分。這種個(gè)人做、公眾批評的回歸過程——是杜威批評性反思或科學(xué)方法的核心——是經(jīng)驗(yàn)轉(zhuǎn)變的關(guān)鍵?!F(xiàn)在的重點(diǎn)在于旨在幫助個(gè)體的社區(qū),通過批評和對話發(fā)展個(gè)體的智力和社會能力”。
從立足社會的建構(gòu)主義學(xué)習(xí)觀出發(fā),學(xué)習(xí)是個(gè)體圍繞與自我、環(huán)境和他人的三重對話,而促進(jìn)學(xué)習(xí)發(fā)展的評價(jià)同樣體現(xiàn)了三重對話,有利于多重關(guān)系的建立。評價(jià)不是學(xué)習(xí)的終結(jié),而是學(xué)習(xí)的新起點(diǎn),其目的是推動(dòng)反思,促進(jìn)學(xué)生在學(xué)習(xí)中生成主動(dòng)的意識。作為促進(jìn)學(xué)習(xí)的評價(jià),應(yīng)該貫穿在整個(gè)活動(dòng)過程中。
四、綜合學(xué)習(xí)的表現(xiàn)性評價(jià)以真實(shí)和自主的定性評價(jià),促進(jìn)學(xué)生主動(dòng)發(fā)展,建構(gòu)意義
20世紀(jì)60年代初,美國盛行行為目標(biāo)的概念,其實(shí)際用意是將所有指導(dǎo)性目標(biāo)轉(zhuǎn)化為能被觀察的行為方式。內(nèi)爾·諾丁斯在《當(dāng)學(xué)校改革走入誤區(qū)》一書指出,使用“標(biāo)準(zhǔn)”一詞的用意是傳遞統(tǒng)一和高質(zhì)量的概念,但是它導(dǎo)致了非常復(fù)雜的標(biāo)準(zhǔn)——關(guān)于內(nèi)容的紛繁復(fù)雜的表格,由于太過繁瑣,而無法適用于所有學(xué)生。諾丁斯批評說,過于強(qiáng)調(diào)這樣的細(xì)化行為目標(biāo),會窄化學(xué)習(xí),學(xué)科之間的聯(lián)系也被忽視,使學(xué)習(xí)和成長變得無趣,等等。因?yàn)閭€(gè)體的性向(個(gè)人特征的綜合,包括智力、能力和傾向性)是獨(dú)特而又豐富的,而面對個(gè)體的教育及其評價(jià)也應(yīng)該因境施評、因?qū)W施評和因材施評。
綜合實(shí)踐活動(dòng)課程以促進(jìn)學(xué)生養(yǎng)成健康人格、發(fā)展個(gè)性、培養(yǎng)學(xué)生的創(chuàng)新能力為核心目標(biāo),這門課程的最大優(yōu)勢正是課程內(nèi)容的不確定性,因?yàn)槠湔n程內(nèi)容極其廣泛,足以針對不同學(xué)生開展個(gè)性化的課程和評價(jià)。
綜合實(shí)踐活動(dòng)課程更多采取表現(xiàn)性評價(jià)手段。表現(xiàn)性評價(jià)是指對真實(shí)情境中完成任務(wù)程度的價(jià)值判斷,表現(xiàn)為多樣化的實(shí)踐活動(dòng),是真實(shí)情境之中具體實(shí)際的、非抽象的任務(wù)活動(dòng)?;顒?dòng)的“真實(shí)性”保證了評價(jià)的真實(shí)性,使得學(xué)生在真實(shí)情境之中接觸了更多的信息和困難,當(dāng)然,因?yàn)槠浔旧韥碜陨?,所以更加容易激發(fā)學(xué)生挑戰(zhàn)的動(dòng)機(jī)。不過,要解決這樣的綜合問題和任務(wù),往往需要綜合深刻的理解力和多方面的能力。表現(xiàn)性評價(jià)往往運(yùn)用定性評價(jià),通過開發(fā)評價(jià)量規(guī),采用描述表現(xiàn)、判斷性質(zhì)的定性評價(jià)手段達(dá)到評價(jià)的目的。
筆者了解到這樣的案例:某個(gè)四星高中理科基地班有一名成績比較優(yōu)秀的女生,她在綜合活動(dòng)課程的《雷雨》話劇表演之后,毅然決定棄理從文。在這個(gè)案例中,綜合課程通過活動(dòng)豐富了學(xué)生的體驗(yàn),而表現(xiàn)性評價(jià)通過評價(jià)引導(dǎo)學(xué)生自我反思,實(shí)現(xiàn)了積極的自我探索和自我決策。
需要指出的是,定量評價(jià)和定性評價(jià)處于課程評價(jià)的測量技術(shù)層面,與課程經(jīng)營管理、課程評價(jià)文化等的其它側(cè)面有著千絲萬縷的聯(lián)系。所謂牽一發(fā)而動(dòng)全身,課程評價(jià)改革絕不是單純技術(shù)或效率的問題,它牽涉到教育思想和哲學(xué)、課程模式和方法等的改造,因此不可能畢其功于一役。