■ 周 園 王夢璐 王 凱
構(gòu)建學(xué)生綜合素質(zhì)評價體系,是學(xué)校樹立科學(xué)的教育質(zhì)量觀念、學(xué)生發(fā)展觀念的關(guān)鍵,也是貫徹立德樹人核心任務(wù),培養(yǎng)全面發(fā)展的學(xué)生的堅實基礎(chǔ)。“增值評價”的概念是建立在學(xué)??梢栽黾印皟r值”到其學(xué)生的學(xué)習(xí)成就的假設(shè)之上,“增值”表示學(xué)校所加諸學(xué)生身上,與一般期望成績相比的差值部分。增值評價方法旨在探索某些學(xué)校學(xué)生在某一時間內(nèi)的學(xué)習(xí),與另外一些學(xué)校的學(xué)生相比,是否有相對較多的進步。[1]增值評價是在對學(xué)校效能評價研究中發(fā)展起來的,而學(xué)校效能評價技術(shù)是在對傳統(tǒng)學(xué)校績效及質(zhì)量評估的批判中成長起來的,因此采用增值理念對學(xué)校進行評價通常也稱之為學(xué)校效能增值評價,通過增值評價分析學(xué)校對學(xué)生的作用或影響大小。增值理念在學(xué)校評價中的應(yīng)用,最早在美英等國提出,其后傳到其他國家與地區(qū),目前已在國際上得到廣泛應(yīng)用。[2]國外流行的方法有以英國為代表的背景化多水平增值模型(Value-added Model),以美國多個州為代表的基于百分位數(shù)的成長模型(Student Growth Percentiles),在美國田納西州采用的教師績效檔案袋增值法。在我國,發(fā)展性評價依據(jù)評價指標體系將評價對象自己的終點與起點進行比較的學(xué)生成長記錄袋,等等。
教育評價事關(guān)教育發(fā)展方向,是進一步推動教育綜合改革、落實教育立德樹人根本任務(wù)、全面提升教育質(zhì)量的關(guān)鍵突破口。2020 年10 月,中共中央、國務(wù)院印發(fā)的《深化新時代教育評價改革總體方案》,提到“堅持科學(xué)有效,改進結(jié)果評價,強化過程評價,探索增值評價,健全綜合評價,充分利用信息技術(shù),提高教育評價的科學(xué)性、專業(yè)性、客觀性”。不僅為新時代系統(tǒng)推進教育評價改革提供了根本遵循,而且“四個評價”創(chuàng)新了教育評價思路,開拓了教育評價路徑。2021 年,教育部等六部門印發(fā)的《義務(wù)教育質(zhì)量評價指南》 (教基〔2021〕3 號)指出,著力構(gòu)建以發(fā)展素質(zhì)教育為導(dǎo)向的科學(xué)評價體系,以滿足新時代教育發(fā)展和人才培養(yǎng)新要求。我國教育發(fā)展已經(jīng)邁入了增值賦能的高質(zhì)量發(fā)展新階段,但目前仍存在影響教育高質(zhì)量發(fā)展的諸多問題,教育評價的功能并未得到科學(xué)、充分的發(fā)揮。改革學(xué)生評價,就是要著力破除分數(shù)至上、用分數(shù)給學(xué)生貼標簽的不科學(xué)做法,落實德智體美勞全面發(fā)展的育人要求。
增值評價目前推廣存在諸多困難,主要表現(xiàn)為:一是對增值評價理念有錯誤認識或不全面認識。二是增值評價內(nèi)容缺少統(tǒng)一的標準。增值評價內(nèi)容涉及教育教學(xué)的方方面面,也是評價過程的開端,需要采集的數(shù)據(jù)包括學(xué)校的背景資料、學(xué)生的背景資料、學(xué)業(yè)成績、學(xué)生綜合素質(zhì)等。這些數(shù)據(jù)都是增值計算中不可缺少的部分,但目前尚未有統(tǒng)一的標準進行規(guī)范。三是增值評價模型復(fù)雜,難以普及。增值的計算受到統(tǒng)計方法的限制,國際上常用的模型如多水平模型、簡單回歸模型、學(xué)生增長百分位模型等都有其具體的適用的范圍與局限性,如何在眾多模型中挑選出適切的模型需要專業(yè)人員進行指導(dǎo)。[3]四是增值評價數(shù)據(jù)收集有困難。缺乏大規(guī)模的標準化測驗提供數(shù)據(jù),以學(xué)校為單位的樣本量無法滿足多水平模型和成長模型的要求。[4]
評價的最終目的是為了改進學(xué)校教學(xué)與管理,促進學(xué)生全面發(fā)展。作為數(shù)據(jù)的重要來源者——學(xué)校,對數(shù)據(jù)的理解、運用卻失去主動權(quán),導(dǎo)致了評價結(jié)果運用的異化。因此,改進學(xué)校教學(xué)與管理,成為評判學(xué)校優(yōu)劣的依據(jù)。學(xué)校對結(jié)果運用往往不主動、不重視。雖然教育質(zhì)量監(jiān)測實施投入了大量人力、物力、財力,但實踐中對數(shù)據(jù)的挖掘與應(yīng)用還不夠深入,教育評價的“以評促建”作用在區(qū)域教育發(fā)展中沒有得到充分發(fā)揮。同時,增值評價若僅以“方法”“結(jié)果”為標準,雖然能夠分析出學(xué)生學(xué)業(yè)成就等方面在不同時間段的增值發(fā)展狀況,卻難以分析學(xué)生學(xué)習(xí)過程中出現(xiàn)困難的原因以及解決困難的方法,學(xué)生的發(fā)展過程變成了“黑箱”,教育發(fā)展過程中許多有價值、有意義的信息將被舍棄,增值評價難以為改進教育實踐和教育決策提供有價值的幫助。[5]
本文基于濟南市部分區(qū)域初中學(xué)生綜合素質(zhì)增值評價的實踐,總結(jié)學(xué)生綜合素質(zhì)增值評價運用的方法與經(jīng)驗,以期為學(xué)生綜合素質(zhì)評價的理論研究者和實踐運用者提供一定的借鑒與參考。
理念是行動的先導(dǎo),區(qū)域增值評價實施的基礎(chǔ)關(guān)鍵在于教育行政部門管理人員、學(xué)校校長、教研員、教師等群體對于增值評價理念的認識和認可。但增值評價在我國起步較晚,且“重研究輕實踐”,增值評價理念普及與認可程度并不高。因此,區(qū)域增值評價的實施首要的是不斷加強培訓(xùn),轉(zhuǎn)變以往評價觀念,并且對增值評價理念有客觀正確的認識。只有接受這一評價理念,以后的工作實施才能形成合力,對于評價實施、結(jié)果反饋及運用等工作的開展才能事半功倍。
基于以上認識,培訓(xùn)對象主要為縣(區(qū))教育行政部門分管領(lǐng)導(dǎo)、校長、各學(xué)科教研員,培訓(xùn)主要分為以下幾個步驟進行:第一階段,充分認識傳統(tǒng)終結(jié)性評價存在的弊端,分析增值評價的優(yōu)勢,對增值評價的理念有大致了解;第二階段,詳細介紹基于不同增值評價理念產(chǎn)生的不同增值分析方法,與樣本區(qū)域、學(xué)校達成共識,采用普遍認同的分析方法;第三階段,針對增值評價實施的結(jié)果以及如何運用進行案例示范,使其對增值評價的意義有更進一步的了解。通過培訓(xùn),對于增值評價理念有了較為科學(xué)、整體的把控。
2016 年,在教育部《關(guān)于全面深化課程改革落實立德樹人根本任務(wù)的意見》的指導(dǎo)與要求下,《中國學(xué)生發(fā)展核心素養(yǎng)》公布中國學(xué)生發(fā)展的六大素養(yǎng):人文底蘊、科學(xué)精神、學(xué)會學(xué)習(xí)、健康生活、責(zé)任擔(dān)當和實踐創(chuàng)新。[6]基于此,將綜合素養(yǎng)界定為:學(xué)生應(yīng)具備的、能夠適應(yīng)終身發(fā)展和社會發(fā)展需要的必備品格和關(guān)鍵能力,主要包括思想品德、科學(xué)文化素質(zhì)、身體健康狀況、心理健康素質(zhì)以及藝術(shù)審美能力。根據(jù)2021 年3 月發(fā)布的《義務(wù)教育質(zhì)量評價指南》和《國家義務(wù)教育質(zhì)量監(jiān)測方案(2021 年修訂版)》等相關(guān)文件依據(jù),結(jié)合濟南市教育實際,構(gòu)建以下增值評價內(nèi)容指標體系:一是校長問卷,主要調(diào)查辦學(xué)方向、德育建設(shè)、跟蹤年級的班額、教師隊伍建設(shè)4 個維度的信息,共包含16 個指標;二是學(xué)生問卷,主要調(diào)查人口學(xué)基本信息、品德發(fā)展水平、課業(yè)負擔(dān)、身體健康狀況、心理發(fā)展狀況、藝術(shù)素養(yǎng)、學(xué)業(yè)發(fā)展水平7 個維度的信息,共包含31個指標。
與以往增值評價的研究與實踐不同的是,改變了以往只對學(xué)科成績進行增值評價的思路,將評價范圍擴大至綜合素養(yǎng)的其他方面。一方面可以直觀了解學(xué)生各方面的進步程度;另一方面,可以關(guān)注各方面的內(nèi)在聯(lián)系,探尋教育規(guī)律。
為了保障評價結(jié)果的科學(xué)有效性,在工具開發(fā)、評價實施以及數(shù)據(jù)分析的各個評價工作環(huán)節(jié)中,都遵循科學(xué)嚴謹?shù)脑瓌t。第一,在工具開發(fā)階段,通過研究相關(guān)文獻以及政策文件、實地調(diào)研、訪談等形式研發(fā)學(xué)生發(fā)展質(zhì)量影響因素調(diào)查問卷,并進行預(yù)測試,針對預(yù)測試數(shù)據(jù)進行問卷的信效度檢驗,從而根據(jù)結(jié)果對問卷進行修訂。第二,在評價實施階段,嚴格按照標準化考場要求安排學(xué)生進行紙筆作答,保證數(shù)據(jù)真實有效性。第三,在數(shù)據(jù)分析階段,采用多水平線性回歸模型計算增值。學(xué)生層面,通過對文獻研究發(fā)現(xiàn),學(xué)生的性別、家庭社會經(jīng)濟地位對其學(xué)業(yè)發(fā)展水平有顯著影響;學(xué)校層面,經(jīng)過前期對區(qū)域校長、教師的調(diào)研發(fā)現(xiàn),學(xué)校的生師比、班額大小等因素對學(xué)校的教育教學(xué)質(zhì)量有顯著影響。因此,在計算時,剔除生師比、班額大小、家庭社會經(jīng)濟地位等顯著影響增值結(jié)果的因素,關(guān)注學(xué)校管理的“凈效應(yīng)”。
目前,在增值評價結(jié)果運用方面的研究相對較少,“重方法、輕結(jié)果”“重結(jié)果、輕運用”的問題較為突出。正如前面提到的,雖然教育質(zhì)量監(jiān)測實施投入了大量人力、物力、財力,但實踐中對數(shù)據(jù)的挖掘與應(yīng)用還不夠深入,教育評價的“以評促建”作用在區(qū)域教育發(fā)展中沒有得到充分發(fā)揮。基于以上問題,結(jié)果反饋不僅僅只是對于增值報告的解讀,更為重要的是區(qū)縣、學(xué)校、教研員、教師如何用好這些數(shù)據(jù)。因此,在結(jié)果反饋時,一方面,采用“分階段分對象”的反饋方式,即針對區(qū)縣教育行政部門、教研員、校長不同群體進行反饋,以實際數(shù)據(jù)舉例不同群體應(yīng)該如何發(fā)現(xiàn)數(shù)據(jù)反映的問題;另一方面,為了打通評價的“最后一公里”,對于問題突出的學(xué)校進行數(shù)據(jù)的深度挖掘,診斷發(fā)現(xiàn)的問題,結(jié)合實際調(diào)研情況提出具體解決措施。
樹立正確的增值評價理念是開展增值評價工作的重要前提。一方面,應(yīng)明確增值評價的最終價值導(dǎo)向在于立德樹人。2019 年,中共中央、國務(wù)院在《關(guān)于深化教育教學(xué)改革全面提高義務(wù)教育質(zhì)量的意見》中指出,“要堅持立德樹人,著力培養(yǎng)擔(dān)當民族復(fù)興大任的時代新人”。學(xué)生增值評價的工具性價值應(yīng)在實現(xiàn)立德樹人的終極性價值中體現(xiàn),以其為指揮棒促進學(xué)生德智體美勞全面發(fā)展。濟南市在開展學(xué)生增值評價的過程中不僅關(guān)注學(xué)生的智育增值發(fā)展,同時強調(diào)德育、體育、美育、勞育的變化狀況,采用成熟的心理測量量表、統(tǒng)一測量維度與標準,持續(xù)關(guān)注學(xué)生的變化發(fā)展情況。這種嘗試與努力促使區(qū)縣、學(xué)校及教師不再囿于學(xué)業(yè)成績的“一分兩率”,聚焦“學(xué)生學(xué)業(yè)成績提升是否以犧牲了身心健康為代價”“學(xué)生的智力發(fā)育是否得益于良好品德與習(xí)慣的養(yǎng)成”等問題,重新思考立德樹人的價值意蘊。
另一方面,應(yīng)理性看待增值評價的問責(zé)功能,更加關(guān)注增值評價的診斷價值。“評價過程實質(zhì)上是一個確定課程與教學(xué)計劃實際達到教育目標的程度的過程”,其旨在不斷提升教育教學(xué)質(zhì)量,優(yōu)化教育教學(xué)實踐,并為教育決策提供信息,具有包含問責(zé)、導(dǎo)向與診斷等多種功能。[7]學(xué)校及教師需明白,評價發(fā)揮問責(zé)功能的初衷是為更好地服務(wù)學(xué)校深化課程改革和特色發(fā)展,推進區(qū)域教育優(yōu)質(zhì)均衡發(fā)展。[8][9]若狹隘地將增值評價視為對學(xué)校辦學(xué)狀況的檢查,因擔(dān)心問責(zé)而推卸教師責(zé)任,將學(xué)生出現(xiàn)“負增值”的原因歸結(jié)為“學(xué)生整體素質(zhì)不高”“學(xué)生不努力、習(xí)慣不好”等借口,則顯然矮化了增值評價的意義追求,窄化了學(xué)校教育的終極價值。學(xué)校及教師應(yīng)充分理解增值評價的底層內(nèi)涵,客觀理性分析增值評價數(shù)據(jù)反映的更為深層次的教學(xué)與管理的優(yōu)勢與問題,關(guān)注每個學(xué)生在各方面的努力與動態(tài)進步幅度,發(fā)現(xiàn)每個學(xué)生的特點與優(yōu)勢,有針對性地進行指導(dǎo),充分發(fā)揮增值評價的診斷功能。
當前,開展學(xué)生增值評價缺乏相對統(tǒng)一的評價指標內(nèi)容。為實現(xiàn)學(xué)生增值評價的長遠發(fā)展,一方面,應(yīng)具有前瞻性的頂層設(shè)計和考量,進一步豐富增值評價內(nèi)容,不斷拓寬增值評價的廣度。濟南市基于2021 年教育部等六部門聯(lián)合印發(fā)的《義務(wù)教育質(zhì)量評價指南》研制增值評價指標,在關(guān)注學(xué)生學(xué)業(yè)成績的同時,更加關(guān)心學(xué)生的思想品德、身心健康狀況等方面的變化發(fā)展情況,構(gòu)建了相對完善的增值評價指標內(nèi)容。
另一方面,聚焦區(qū)域?qū)W生發(fā)展特點,不斷深挖增值評價的深度。學(xué)生增值評價無法盡善盡美,不能單純追求“廣而全”,忽視區(qū)域?qū)W生發(fā)展特點與需求。在確定增值評價指標與內(nèi)容時,還應(yīng)結(jié)合當?shù)貙W(xué)校教育教學(xué)現(xiàn)狀,因地制宜細細打磨每一項評價維度內(nèi)容,使評價更具針對性和指導(dǎo)性。例如,在濟南市增值評價內(nèi)容中的心理健康維度下,我以重點考察測量學(xué)生的同伴關(guān)系、校園欺凌及積極心理情緒等變化發(fā)展狀況,既是基于對當前社會各界廣泛關(guān)注的中小學(xué)生校園欺凌的積極回應(yīng),也是基于調(diào)查對象多為寄宿生、留守兒童,心理情緒變化尚處于青春期關(guān)鍵時刻的深刻考量。
一方面,區(qū)域各級教育主體應(yīng)積極參與,明確各主體職責(zé),既要有精通增值評價的專業(yè)技術(shù)人員嚴把技術(shù)難關(guān),也需要了解教育教學(xué)實際的教育工作者堅守教育倫理;既要有統(tǒng)籌規(guī)劃者把控增值評價的總體導(dǎo)向,也要有實施執(zhí)行者落實增值評價的診斷與改進過程。另一方面,若要充分發(fā)揮增值評價的診斷功能,幫助學(xué)校及教師基于評價數(shù)據(jù)改進教育教學(xué),則需要進一步優(yōu)化增值評價的實施流程,確保在收集數(shù)據(jù)真實全面、分析數(shù)據(jù)科學(xué)有效的基礎(chǔ)上,及時反饋數(shù)據(jù)結(jié)果,以指導(dǎo)改進教學(xué)與管理實踐。當前,“互聯(lián)網(wǎng)+”、信息技術(shù)、人工智能、大數(shù)據(jù)等技術(shù)不斷革新發(fā)展,在眾多技術(shù)加持下進一步優(yōu)化增值評價實施流程成為可能,評價數(shù)據(jù)的針對性與實效性也有望進一步得到加強。
教師作為與學(xué)生直接接觸的一線教育實踐者,其對增值評價數(shù)據(jù)的正確理解、客觀分析以及解構(gòu)利用決定了評價數(shù)據(jù)最終是否能夠驅(qū)動精準教學(xué)。然而,很多研究及實踐表明,當前,教師對數(shù)據(jù)如何作用于教學(xué)缺乏正確理解,且缺乏解讀和分析數(shù)據(jù)的基本技能,不僅難以基于數(shù)據(jù)采取行動,還容易對海量數(shù)據(jù)產(chǎn)生無力感、冷漠感甚至恐懼感。評價數(shù)據(jù)非但沒有助力教學(xué),反而成為教師負擔(dān)。[10]
基于此,首先,應(yīng)著眼于系統(tǒng)問題的區(qū)域結(jié)構(gòu)安排上。將評價結(jié)果運用于教學(xué)與管理絕非單個教師、某個學(xué)校一己之力,其極容易受到區(qū)域教育發(fā)展政策及要求的影響。濟南市開展學(xué)生綜合素質(zhì)增值評價工作,就是在以市級為主導(dǎo)、區(qū)縣及學(xué)校多元主體協(xié)同推動下開展起來的。相較于某一個或某幾個教師群體主動尋求評價結(jié)果運用的單薄力量,以區(qū)域為主導(dǎo)統(tǒng)籌推進評價工作更像是一股強大的推力,推動著區(qū)域內(nèi)整個教師群體不得不參與進來、學(xué)習(xí)起來,才可能實現(xiàn)教師從“走近增值評價”到“走進增值評價”的根本轉(zhuǎn)變。其次,學(xué)校的數(shù)據(jù)領(lǐng)導(dǎo)力也是關(guān)鍵,學(xué)校領(lǐng)導(dǎo)有關(guān)評價的理念、重視程度在很大程度上影響教師的行為。在反饋增值評價結(jié)果后,我以發(fā)現(xiàn)有的學(xué)校領(lǐng)導(dǎo)積極組織相關(guān)教師就數(shù)據(jù)展開激烈討論、深入剖析,邀請市增值評價項目組專家對教師開展培訓(xùn),甚至主動學(xué)習(xí)制作數(shù)據(jù)分析圖表。評價數(shù)據(jù)真正運用到了指導(dǎo)教學(xué)中,教師的數(shù)據(jù)素養(yǎng)也在該過程中得到鍛煉提升。當然,也有的學(xué)校領(lǐng)導(dǎo)將評價數(shù)據(jù)束之高閣,學(xué)校教師對評價工作一知半解,評價意義就此夭折。最后,激發(fā)教師個人專業(yè)發(fā)展的目標與意愿是核心。無論是區(qū)域結(jié)構(gòu)安排還是學(xué)校領(lǐng)導(dǎo)統(tǒng)籌,其最終都是為教師提供了評價結(jié)果運用的外部環(huán)境與資源支持。借著這兩股外力,教師或許能夠走上“評價改進教學(xué)”之路,但在這條路上如何走、走得遠不遠,便仰賴于教師對增值評價的理解及個人專業(yè)發(fā)展追求。