洪志忠
【摘 要】核心素養(yǎng)是教育改革的方向,落實核心素養(yǎng)需要多元評價方法的支持。傳統(tǒng)紙筆測驗在檢測學生于復雜環(huán)境中解決不確定性問題的能力水平方面存在明顯的短板。表現(xiàn)性評價具有指向高階學習目標、指向深度學習、指向真實情境中的學習行為,兼顧過程評價和結(jié)果評價等特點。明確學習目標、設(shè)計表現(xiàn)性任務(wù)、開發(fā)評分規(guī)則是表現(xiàn)性評價的重點工作。核心素養(yǎng)評價需要更好地結(jié)合傳統(tǒng)紙筆測驗和以表現(xiàn)性評價為代表的多元評價方法,發(fā)揮各自優(yōu)勢。
【關(guān)鍵詞】核心素養(yǎng) 傳統(tǒng)紙筆測驗 表現(xiàn)性評價
近年來,為扭轉(zhuǎn)不科學的評價導向,相關(guān)教育主管部門先后印發(fā)了《深化新時代教育評價改革總體方案》《義務(wù)教育質(zhì)量評價指南》等重要文件,以期從縣域、學校、學生評價等層面共促良好教育生態(tài)的形成。具體到學生評價方面,改革的方向“旨在促進學生德智體美勞全面發(fā)展,培養(yǎng)適應(yīng)終身發(fā)展和社會發(fā)展需要的正確價值觀、必備品格和關(guān)鍵能力”。也就是說,如何通過評價來促進學生的學習,進而培育核心素養(yǎng),成為評價改革的關(guān)鍵。評價如何體現(xiàn)核心素養(yǎng)的要求?這就需要更加豐富多元的評價方法予以支持,表現(xiàn)性評價是其中一種重要形式。
一、傳統(tǒng)紙筆測驗的短板
正如評價專家波帕姆(Popham)所言,你無法用湯勺來測量體溫[1]。世上并不存在唯一正確的評價方法,關(guān)鍵是提高評價方法和評價目標的匹配度。從評價方法的譜系來看,如果更強調(diào)知識的回憶,那么傳統(tǒng)的紙筆測驗優(yōu)勢明顯;如果強調(diào)能力和素養(yǎng)的展示,那么表現(xiàn)性評價是更為適切的方法(見圖1)。
當前,紙筆測驗依然是學生評價的最主要的方法。紙筆測驗包括選擇題、是非題、配對題、填空題、簡答題等主要形式。紙筆測驗在評價具體一個內(nèi)容領(lǐng)域的知識掌握情況上具有顯著的優(yōu)勢。這些優(yōu)勢表現(xiàn)為對知識點的覆蓋較為全面、題目獲取的途徑較為便捷、成績的呈現(xiàn)相對客觀和便于管理等。然而,紙筆測驗也存在著天然的短板。首先,紙筆測驗更適用于識記再認的認知目標,對于高階認知目標的測量力有不逮;其次,紙筆測驗更適于考察某一具體的知識點或技能,較難測評學生綜合運用知識和技能的水平;再次,紙筆測驗與真實情境的距離相對較遠,而且往往只有一個正確答案,難以應(yīng)對學生在復雜環(huán)境中解決不確定性問題的要求。傳統(tǒng)紙筆測驗的短板在考試文化盛行的社會環(huán)境中被急劇放大,帶來了諸多不良后果。教師課堂教學過分關(guān)注學生低階學習目標的掌握,以獲取更高的分數(shù),而高分的獲得往往是通過高強度、重復的刷題操練來實現(xiàn)。學習被撕裂為碎片化、淺表化的斷點,死記硬背、題海戰(zhàn)術(shù)成為學生的學習常態(tài),學生不再是真實意義上的“學生”,而成為了名副其實的“考生”。
二、表現(xiàn)性評價的內(nèi)涵與特點
關(guān)于表現(xiàn)性評價的內(nèi)涵,研究者和實踐者根據(jù)不同的情境有不同的回答。美國評價專家斯蒂金斯(Stiggins R.J.)認為,“表現(xiàn)性評價是測量學習者運用先前所獲得的知識解決新異問題的評價方式。在表現(xiàn)性評價中,常常運用真實的生活或模擬的評價練習來引發(fā)最初的反應(yīng),而這些反應(yīng)可直接由高水平的評價者按照一定的標準進行觀察、評判。其形式包括建構(gòu)反應(yīng)題、書面報告、作文、演說、操作、實驗、資料收集、作品展示”[2]。國內(nèi)學者周文葉則對表現(xiàn)性評價給出了一個嘗試性的定義:“在盡量合乎真實的情境中,運用評分規(guī)則對學生完成復雜任務(wù)的過程表現(xiàn)或/與結(jié)果作出判斷?!盵3]
具體來說,表現(xiàn)性評價具有以下特點:第一,指向高階的學習目標,關(guān)注學生“能做什么”“做得怎么樣”,展示批判性思維、創(chuàng)造力等學習結(jié)果;第二,指向深度學習,關(guān)注學生完成任務(wù)過程中主動建構(gòu)的學習行為,聚焦學生綜合運用知識、技能乃至品格的能力,而不是選擇一個答案;第三,指向在盡可能真實情境中發(fā)生的學習行為,培養(yǎng)學生在實際生活中運用思維方式靈活解決問題的素養(yǎng);第四,不僅關(guān)注學習成果的評價,也強調(diào)學習過程的評價。
落實立德樹人根本任務(wù)的關(guān)鍵在于培養(yǎng)學生的核心素養(yǎng)。新修訂的《義務(wù)教育課程方案(2022年版)》明確了核心素養(yǎng)在育人體系中的地位。核心素養(yǎng)關(guān)注個體在面對復雜的、不確定的現(xiàn)實生活情境時,綜合運用學科知識、觀念、方法解決實際問題所表現(xiàn)出來的關(guān)鍵能力、必備品格與價值觀念。與核心素養(yǎng)同向同行,在課程教學中涌現(xiàn)出的單元設(shè)計、PBL學習等實踐也對評價方法提出了更高、更新的要求。很顯然,傳統(tǒng)紙筆測驗在新的教育改革背景下面臨巨大的挑戰(zhàn)。表現(xiàn)性評價具有區(qū)別于傳統(tǒng)紙筆測驗的特點與優(yōu)勢,兩者若能相互補益,則能更好地促進學生學習。
三、如何設(shè)計表現(xiàn)性評價
表現(xiàn)性評價要求學生在真實情境中完成活動或作品以表現(xiàn)其所知與所能。設(shè)計表現(xiàn)性評價要求學生執(zhí)行相應(yīng)的表現(xiàn)性任務(wù),對于表現(xiàn)性任務(wù)的完成狀況需要有判斷學生表現(xiàn)水平的評價標準。而表現(xiàn)性任務(wù)和評價標準都是根據(jù)預設(shè)的學習目標來設(shè)計的。因此,表現(xiàn)性評價包括三個構(gòu)成要素:目標、表現(xiàn)性任務(wù)、評分規(guī)則(見圖2)。
1. 確定核心素養(yǎng)導向的學習目標。
與表現(xiàn)性評價相匹配的學習目標是一些不能用傳統(tǒng)紙筆測驗進行檢驗的學習結(jié)果。因此,與表現(xiàn)性評價相匹配的目標主要是具有情境性、復雜性、綜合性的學習目標。斯蒂金斯認為,事實性知識并不適合表現(xiàn)性評價。他將復雜的學習目標、相關(guān)學科(評價內(nèi)容)和成果目標相對應(yīng),總結(jié)了適合表現(xiàn)性評價的學習目標類型(見表1)。
表現(xiàn)性評價的學習目標并不直接指向碎片化的知識點。以語文中的說明文教學為例,教師經(jīng)常教學生關(guān)于說明方法、說明層次、說明語言的知識,但在實際生活中不會有人用如此框架來閱讀。閱讀說明文的關(guān)鍵在于搜索信息、把握關(guān)鍵詞、驗證信息、合理推斷[5]。表現(xiàn)性評價的學習聚焦于超越知識點的大觀念(big idea),因為它居于學科的中心位置,代表的是學科或課程的關(guān)鍵概念或特質(zhì)。那么,大觀念從何而來?課程標準是最為重要的來源。學習目標是一個系統(tǒng)的體系,從教育方針到學生共同核心素養(yǎng),到學科核心素養(yǎng),再到學科課程標準是一個層層分解、不斷具體化以增強可操作性的過程。在設(shè)定目標時,教師首先需要讀透課程標準,思考:學科的特質(zhì)如何體現(xiàn)?哪些大觀念值得學生理解?目標反映了哪些核心素養(yǎng)的要求?目標能否促進學生的深度學習?在此基礎(chǔ)上,教師可以根據(jù)實際情況,以大觀念為線索,構(gòu)建起一個從學科課程標準到學期課程綱要再到單元的學習目標體系。
2. 設(shè)計表現(xiàn)性任務(wù)。
表現(xiàn)性任務(wù)是指圍繞學習目標而設(shè)計的特定作業(yè),旨在引發(fā)學生在學習情境中的表現(xiàn)活動,從而將收集到的學生的學習證據(jù)信息,作為評價學習的依據(jù)。表現(xiàn)性任務(wù)常見的形式包括紙筆任務(wù)(主要是論述題和問題解決題)、展示、實驗與調(diào)查、口頭表達與角色扮演、項目課題等[6]。根據(jù)不同的評價目的、學習目標和學習內(nèi)容,表現(xiàn)性評價采取不同的任務(wù)類型。
設(shè)計表現(xiàn)性任務(wù)大致分成任務(wù)分析、設(shè)置問題情境、撰寫任務(wù)指導語、修改完善等若干步驟。任務(wù)分析主要完成對學生學情和學習認知過程分析的兩項工作,回答“為了完成任務(wù),學生需要具備什么樣的基礎(chǔ)知識和技能”。問題情境設(shè)計要考慮任務(wù)對學生的吸引力、挑戰(zhàn)度和可行性等要素。教師需要選擇對于大部分學生具有個人意義、與經(jīng)驗相聯(lián)系的問題情境,這些問題情境能夠激發(fā)學生投入高階的思考過程,有充分的機會進行實踐和反思。撰寫任務(wù)指導語應(yīng)當用簡潔的語言說明評價任務(wù)的要求,讓學生理解他們所要完成的任務(wù)、任務(wù)要求和評分規(guī)則。修改完善主要針對前期設(shè)計(例如評分規(guī)則)的可行性進行修訂和改進,確保評價方案滿足現(xiàn)場的需求。
在設(shè)計表現(xiàn)性任務(wù)時,需要對任務(wù)形態(tài)進行系統(tǒng)的考量。在任務(wù)結(jié)構(gòu)方面,結(jié)構(gòu)化程度越高的任務(wù),評價的指向越明確;結(jié)構(gòu)化程度低的任務(wù),意味著有更多的問題解決路徑和可供選擇的答案。但不論結(jié)構(gòu)化程度如何,教師需要根據(jù)學情和任務(wù)難度,為學生提供完成任務(wù)所需要的學習支架。在任務(wù)數(shù)量方面,要綜合考慮評價內(nèi)容的覆蓋范圍、評價目標的多少、完成任務(wù)所需的時間、可供利用的資源。在任務(wù)完成人數(shù)方面,采取獨立完成還是小組合作視評價目標而定。在任務(wù)表現(xiàn)形式方面,不同的評價目標需要不同的任務(wù)表現(xiàn),例如考查學生合作交流的能力很難依靠個體書面報告,同時允許學生以更加多元的形式,發(fā)揮自己的優(yōu)勢,完成作業(yè),呈現(xiàn)作品。
3. 開發(fā)評分規(guī)則。
評分規(guī)則是表現(xiàn)性評價中作業(yè)和作品質(zhì)量標準的主要表現(xiàn)形式。它能夠讓學生清楚完成任務(wù)時自身所達成的不同學習水平,從而使學習更有方向感。評分規(guī)則的基本邏輯是將任務(wù)分解成若干關(guān)鍵維度,對這些維度劃分出不同的成就水平,并呈現(xiàn)不同成就水平的表現(xiàn)描述(見表2)。
開發(fā)評分規(guī)則可以按照五個步驟來開展。首先,根據(jù)評價目標,提取最能反映表現(xiàn)性任務(wù)完成情況的若干維度/指標。這些維度集中體現(xiàn)了完成任務(wù)所涉及的知識和技能,因此數(shù)量不能過多,同時要用學生能理解的語言進行清晰表達。其次,將維度進一步具體化,確定期待可觀察的指標,梳理出每一個維度上的具體指標。接著,劃分不同的成就水平,以具體指標為框架對完成任務(wù)的最優(yōu)表現(xiàn)和最差表現(xiàn)進行描述,賦予最高等級和最低等級。最后,補充在最優(yōu)表現(xiàn)和最差表現(xiàn)之間不同成就水平的表現(xiàn)描述(見表3)。
綜上,基于核心素養(yǎng)教育改革的落地,離不開課堂評價改革。核心素養(yǎng)怎么評,不僅需要更為科學地利用好傳統(tǒng)紙筆測驗,也需要充分發(fā)揮以表現(xiàn)性評價為代表的多元評價方法的功能。
參考文獻:
[1][美]W.James Popham.促進教學的課堂評價[M].國家基礎(chǔ)教育課程改革“促進教師發(fā)展和學生成長的評價研究”項目組.北京:中國輕工業(yè)出版社,2003:262.
[2]Stiggins,R.J. Design and development of performance assessments[J]. Educational Measurement:Issues and Practice,1987(6).
[3]周文葉. 中小學表現(xiàn)性評價的理論與技術(shù)[M]. 上海:華東師范大學出版社,2014:53.
[4][美]Richard J.Stiggins. 促進學習的學生參與式課堂評價[M]. 國家基礎(chǔ)教育課程改革“促進教師發(fā)展和學生成長的評價研究”項目組.北京:中國輕工業(yè)出版社,2005:157.
[5]李海林.按照實際狀況教會學生讀寫和交流——美國母語教學的一個重要啟示[J]. 語文建設(shè),2015(11):16-19.
[6]王少非.課堂評價[M]. 上海:華東師范大學出版社,2013:115-120.
[7]狄海鳴. PBL|如何設(shè)計項目化學習評價量表?這些做法值得借鑒[EB/OL]. https://mp.weixin.qq.com/s/5a5m05H4dlHc-W2dTcacpQ.