陳國平
摘? ? 要:考試成績是教學(xué)量化評價的重要依據(jù)。隨著評價方式的不斷進步,把平均分作為單一的評價維度的局限性越來越明顯。在高考改革后學(xué)校實行選課走班教學(xué)的背景下,教學(xué)評價期待新的評價維度。標(biāo)準(zhǔn)分增量評價體系以學(xué)生的發(fā)展來定量評價教師教學(xué),“以入口看出口”,“以起點看變化”,可以在教師評價、班級評價、學(xué)生綜合實力評價等方面發(fā)揮重要作用。
關(guān)鍵詞:增量評價;標(biāo)準(zhǔn)分增量;標(biāo)準(zhǔn)分增量評價體系;教學(xué)評價
一、增量評價體系研究的緣起
(一)平均分評價的局限性
考試是教學(xué)中的一個重要環(huán)節(jié),考試成績則是教學(xué)量化評價的最重要依據(jù)。從測量學(xué)角度講,考試是對動態(tài)的教學(xué)情況進行的有限度的測量??荚嚋y量對象是參加考試的學(xué)生,試卷則是按一定標(biāo)準(zhǔn)制作的測量工具,測量值便是考分或等級。測量值不過是附著于測量工具上的刻度。
考試的測量與物理學(xué)的測量方式不同。比如,物理學(xué)長度測量使用直尺、卷尺、皮尺等測量工具,在對不同物體進行測量時我們可以采用不同工具,但是不同測量工具上的最小分度都是同一標(biāo)準(zhǔn),即相當(dāng)于使用了相同的測量工具??荚嚋y試的試卷相當(dāng)于物理學(xué)的測量工具,多次考試時我們采用不同的試卷,就相當(dāng)于使用了不同的測量工具。但是每次命制的試題考查的知識點不同、難易度不同,且測試者和被測試者都是動態(tài)的、變化的,存在眾多偶然因素,測試的誤差較大。在物理學(xué)中,減小此類誤差的常用方法是多次測量后取平均值,于是考試測量也參考采用了多次考試取平均分的方法。但由于測量工具(試卷)不同,采用求多次考試的平均分進行比較的方法便沒有了意義。
因此,把同一學(xué)科不同次考試的測量結(jié)果進行直接比較和處理是不合理的,把同次考試不同學(xué)科考試的測量結(jié)果進行直接比較和處理同樣也是不合理的。而很多時候,學(xué)校在處理成績時,還會計算多次考試的科目平均分和總分平均分,這樣的比較分析則更不科學(xué)。
(二)新高考背景下高校招生的需要
從2014年起,浙江和上海開始新高考3+3模式試點,即語數(shù)英3科+選考科目任選3科計入高考總分。高校招生依據(jù)“3+3”高考總分從高到低,采用專業(yè)平行志愿投檔錄取。然而,不管是上??忌?選3,還是浙江考生的7選3,選考科目(任選3科)存在多種組合,考生的三科選考科目各不相同。不同科目試卷不同,相當(dāng)于“測量工具”的標(biāo)準(zhǔn)發(fā)生了變化,因此將選考科目實考分數(shù)進行比較與處理就失去了意義。而選考科目賦分制就是為了給“測量工具”賦予相同的標(biāo)準(zhǔn),從而實現(xiàn)不同學(xué)科的分數(shù)處理和累加比較,滿足新高考依高考總分從高到低錄取的需要。比如,浙江省采用的是將分值分成21檔、每檔3分的方法進行賦分,其他有些省份則采用了“3+1+2”模式的等比例賦分法。不同省市在賦分處理上的方式雖各不相同,但其目的都是為了對實考分數(shù)進行標(biāo)準(zhǔn)化處理,以實現(xiàn)不同學(xué)科間的直接比較與處理。
高校采用綜合評價招生時仍然涉及測試分數(shù),不同科目間仍然存在比較的需求。以高水平三位一體招生為例,北京大學(xué)采用的評價方法也同樣實現(xiàn)了不同學(xué)科考試成績的標(biāo)準(zhǔn)化。北京大學(xué)三位一體考試要求選擇理工科專業(yè)考生的測試科目共5科,必考科目為語文、數(shù)學(xué)、英語、物理,選考科目為“歷史、化學(xué)、政治”中的一科,考試滿分為40分。為實現(xiàn)對學(xué)生不同科目間的成績進行公平合理的比較和評價,北京大學(xué)不是只對3選1的科目進行標(biāo)準(zhǔn)化處理,而是同時對5科進行標(biāo)準(zhǔn)化處理,處理公式為:
單科標(biāo)準(zhǔn)分=(單科考分/單科最高分)×8
如表1所示為某考生在北京大學(xué)三位一體考試中的各科卷面分與標(biāo)準(zhǔn)分,將標(biāo)準(zhǔn)分求和得出總分,就使不同考生的總分具有了可比性。
(三)高中學(xué)校選課走班教師評價、教學(xué)質(zhì)量評估的需要
選課走班后,學(xué)校選課共有35種(7選3)、20種(6選3)、12種(4選2)不同的可能。面對選考科目不同的學(xué)生,考試成績原始分的總分比較已經(jīng)沒有意義。不同選科按“定三”或“定二走一”或“定一走二”實行行政班或教學(xué)班教學(xué)后,平行班間的平均分比較也失去了意義。目前,各地高中的教師評價、教學(xué)質(zhì)量評估普遍采用的辦法有兩種:第一種,按本校校情分析本校高考賦分比例進行賦分,從而實現(xiàn)不同學(xué)科考試成績的標(biāo)準(zhǔn)化;第二種,各地各校建立聯(lián)合考試聯(lián)盟,擴大考試樣本,按高考賦分辦法進行賦分,此舉運行下來最大問題就是增加了學(xué)生考試的壓力。
總而言之,不管從高校招生的需要分析,還是從高中學(xué)校選課走班教師評價、教學(xué)質(zhì)量評估的需要分析,平均分評價體系亟須增加新的評價元素,以滿足目前教學(xué)評價診斷的需要。需要指出的是,并不是選課走班后,不同科目的成績原始分不能累加,本質(zhì)上來講,即使所有考生考試科目全相同,不同科目的成績原始分累加也存在問題。這是平均分評價體系本身的局限性導(dǎo)致的,因此我們迫切需要修正這種僅以平均分作為單一的評價維度的評價體系。
二、標(biāo)準(zhǔn)分增量評價體系構(gòu)建
(一)標(biāo)準(zhǔn)分定義
標(biāo)準(zhǔn)分是一種由原始分推導(dǎo)出來的相對地位量數(shù),它是用來說明原始分在所屬的那批分數(shù)中的相對位置的。[1]標(biāo)準(zhǔn)分定義如下:
Z=[X-XbarS]……………………①
其中Z為某考生標(biāo)準(zhǔn)分,[X]為某考生原始分,[Xbar]為所有考生原始分的平均分,[S]為原始分的標(biāo)準(zhǔn)差。
標(biāo)準(zhǔn)分是依據(jù)原始分數(shù)結(jié)合平均分和標(biāo)準(zhǔn)差折算得到的,標(biāo)準(zhǔn)分的大小排列順序與原始分數(shù)完全相同。對于同次同學(xué)科比較,標(biāo)準(zhǔn)分與原始分相比無特別的優(yōu)勢。但標(biāo)準(zhǔn)分實現(xiàn)了不同次考試原始分的標(biāo)準(zhǔn)化。經(jīng)標(biāo)準(zhǔn)分定義后的各科分數(shù)按分數(shù)段隨人數(shù)分布規(guī)律接近于理想的正態(tài)分布或準(zhǔn)正態(tài)分布,這類似于用一把刻度尺來進行測量,消除了由于測量工具的不同而帶來的偏差。標(biāo)準(zhǔn)分的意義是讓同學(xué)科的不同次考試分數(shù)更具有可比性,讓同一次不同學(xué)科的考試分數(shù)更具有可比性,讓不同次不同學(xué)科的考試分數(shù)更具有可比性,從而實現(xiàn)了考試總分更具可比性的目的 。
(二)標(biāo)準(zhǔn)分定義修正
由于①式處理后得到的標(biāo)準(zhǔn)分Z會在原始分[X]<平均分[Xbar]時出現(xiàn)負值,這與我們平常的經(jīng)驗不符。因此,一般情況下我們會對標(biāo)準(zhǔn)分進行線性修正,以保證其數(shù)值接近我們的習(xí)慣,并且盡量不出現(xiàn)負值。修正辦法如下:
Z=k × [X-XbarS+b]……………………②
其中,k與b值的確定前提是樣本數(shù)據(jù)呈現(xiàn)正態(tài)分布(至少是準(zhǔn)正態(tài)分布),考慮有可能的極端情況,以正負5個標(biāo)準(zhǔn)差為區(qū)間并結(jié)合一般人的習(xí)慣而確定。
一般情況下:k=考試滿分分值×0.1;
b=考試滿分分值×0.5。
(三)總分標(biāo)準(zhǔn)分定義
②式適用于單學(xué)科??偡值臉?biāo)準(zhǔn)分并不是將各科考試原始分求總分后代入上式處理,而是將各科的考試原始分折算成標(biāo)準(zhǔn)分后再計算總分的標(biāo)準(zhǔn)分。
Z總分=[X總-X總barS]×k+b……………③
Z總分:某考生的總分標(biāo)準(zhǔn)分;
[X總]=[該考生的各科標(biāo)準(zhǔn)分];
X總bar=Average(所有學(xué)生X總);
標(biāo)準(zhǔn)差S:全體學(xué)生的X總的標(biāo)準(zhǔn)差。
(四)標(biāo)準(zhǔn)分增量評價體系
增量評價體系是一種為了更好地推進素質(zhì)教育,提高學(xué)校的教育教學(xué)質(zhì)量,促進每一個學(xué)生更好發(fā)展而采用的新型評價體系。它能科學(xué)客觀地反映學(xué)生的學(xué)業(yè)變化,體現(xiàn)班級和學(xué)科的進步、退步,評價教師的教學(xué)質(zhì)量。實施增量評價的前提是學(xué)生的不同次考試成績必須進行標(biāo)準(zhǔn)化處理(折算成標(biāo)準(zhǔn)分),使不同科目的考試分數(shù)具有可比性。標(biāo)準(zhǔn)分增量評價可以概括為“以入口定出口”“從起點看變化”。
1.標(biāo)準(zhǔn)分增量評價——確定“入口”
研究之始,筆者認為普通高中教學(xué)的“起點”是初三,將初中學(xué)業(yè)水平測試成績(中考成績)作為高中教學(xué)的起點最為合理。但初中和高中課程開設(shè)形式不同,科目起點成績不對應(yīng),因此初中學(xué)業(yè)水平測試不能作為高中的起點,并且以一次成績作為起點并不科學(xué)。最終,筆者確定標(biāo)準(zhǔn)分增量評價的“入口”成績?yōu)楦咭灰荒甑钠谥?、期末四次考試成績,“出口”成績?yōu)楦叨鸬娜我庖淮慰荚嚦煽儭?/p>
2.標(biāo)準(zhǔn)分增量評價——實施步驟
浙江省實行新高考改革后,高一結(jié)束后學(xué)生將進行選課,高二實行選課走班教學(xué),增量評價不僅要折算標(biāo)準(zhǔn)分,還要根據(jù)學(xué)生的選科挑出對應(yīng)分數(shù)。標(biāo)準(zhǔn)分增量評價需要完成行政班增量評價、教學(xué)班增量評價、教師增量評價,因此數(shù)據(jù)間的邏輯關(guān)系、整體框架的合理性至關(guān)重要。標(biāo)準(zhǔn)分增量評價系統(tǒng)采用條件矩陣運算,運用Excel表格實現(xiàn)。如圖1所示,首先要利用任課任職表確定師生對應(yīng)關(guān)系(師生矩陣),接著要依據(jù)分班確定學(xué)生與班級對應(yīng)關(guān)系(班生矩陣),然后將入口和出口成績折算成標(biāo)準(zhǔn)分,最后利用條件矩陣進行增量運算。
3.標(biāo)準(zhǔn)分增量評價——計算公式
每個學(xué)生的標(biāo)準(zhǔn)增量[ΔX個=X出口-X入口],其中X出口為該生的出口標(biāo)準(zhǔn)分,X入口為該生的入口標(biāo)準(zhǔn)分。班級的標(biāo)準(zhǔn)增量定義為班級的平均增量[ΔX班],其計算公式為[ΔX班=Average(ΔX所屬班)],其中[ΔX所屬班]是指屬于指定班級的學(xué)生的增量。教師的增量定義為教師所任教的所有學(xué)生的平均增量[ΔX任教],其計算公式為[ΔX教]=[Average(ΔX任教學(xué)生)],其中[ΔX任教學(xué)生]為所任教學(xué)生增量。
4.標(biāo)準(zhǔn)分增量評價——結(jié)果呈現(xiàn)
標(biāo)準(zhǔn)分增量包括班級標(biāo)準(zhǔn)分增量和教師標(biāo)準(zhǔn)分增量。
表2為班級標(biāo)準(zhǔn)分增量表。語文、數(shù)學(xué)、英語按行政班編班,表中顯示的即為語數(shù)英3科行政班標(biāo)準(zhǔn)分增量;7選3科目行政班與教學(xué)班并存,表中顯示的有教學(xué)班也有行政班標(biāo)準(zhǔn)分增量。標(biāo)準(zhǔn)分增量絕對值小于1分,說明該班該科目該次考試成績波動屬正常范圍;標(biāo)準(zhǔn)分增量絕對值大于1分而小于2分,說明該班該科目該次考試成績有較大進步或有較大退步;標(biāo)準(zhǔn)分增量絕對值大于3分,說明該班該科目該次考試成績波動很大,學(xué)校應(yīng)啟動教學(xué)診斷程序進行干預(yù)。
表3為教師標(biāo)準(zhǔn)分增量表。教師標(biāo)準(zhǔn)分增量依據(jù)所任教的所有學(xué)生進行計算,評價量表指標(biāo)包括入口標(biāo)準(zhǔn)分、當(dāng)次考試標(biāo)準(zhǔn)分及“出口”相對于“入口”的標(biāo)準(zhǔn)分增量。教師標(biāo)準(zhǔn)分增量數(shù)值可以直接反映教師所任教的學(xué)生的整體進步、退步情況,為學(xué)校和教師做教學(xué)診斷提供依據(jù)。在表3中,“語文教師6”和“數(shù)學(xué)教師6”的入口標(biāo)準(zhǔn)分明顯高于其他班級,那是因為學(xué)校實行分層教學(xué)的原因。教師標(biāo)準(zhǔn)分增量表仍然保留教師平均分指標(biāo),包括入口平均分、當(dāng)次考試平均分及平均分增量?!罢Z文教師6”“數(shù)學(xué)教師6”所帶學(xué)生在標(biāo)準(zhǔn)分增量上要突破,難度會大于其他班級。從標(biāo)準(zhǔn)分增量角度看,“語文教師6”標(biāo)準(zhǔn)分增量為-1.87分,有較大退步。但從平均分指標(biāo)看,“語文教師6”所任教學(xué)生當(dāng)次考試平均分最高,且平均分增量也最大。據(jù)此可以認定“語文教師6”的當(dāng)次考試標(biāo)準(zhǔn)分波動屬正常范圍。
因此,標(biāo)準(zhǔn)分增量評價與平均分評價是教學(xué)評價的兩個維度。兩個維度評價都有其局限性,僅看一個維度會讓教學(xué)評價失真,因此須將兩者有機結(jié)合起來進行教學(xué)評價。
三、標(biāo)準(zhǔn)分增量評價的意義及使用
筆者對班級和教師標(biāo)準(zhǔn)分增量進行跟蹤,對出現(xiàn)異常波動的班級和教師進行教學(xué)診斷。通過大量的教學(xué)診斷,筆者發(fā)現(xiàn),當(dāng)標(biāo)準(zhǔn)分增量絕對值大于3分且為負值時,教師備課、上課、聽課、作業(yè)批改、作業(yè)反饋方面或多或少會出現(xiàn)嚴重偏差。因此,標(biāo)準(zhǔn)分增量評價在教學(xué)評價中有重要意義。
標(biāo)準(zhǔn)分增量評價實現(xiàn)了選課走班背景下不同選科學(xué)生的學(xué)習(xí)綜合實力比較,實現(xiàn)了同學(xué)科的不同次考試間的比較,實現(xiàn)了同一次考試不同學(xué)科間的比較。同時,標(biāo)準(zhǔn)分增量評價突破了平均分評價的局限性,解決了分層教學(xué)引起的因班與班存在較大平均分分差而難以合理評價的難題。
目前,標(biāo)準(zhǔn)分增量評價已在我校推廣使用,成為學(xué)校教師量化評價的重要依據(jù),在學(xué)校獎教金確定、學(xué)術(shù)性教研組評比、年級推優(yōu)等方面發(fā)揮了重要的作用。同時,標(biāo)準(zhǔn)分增量評價也成為了教師改進教學(xué)、班主任管理班級、學(xué)校診斷教學(xué)的重要參考。
總之,標(biāo)準(zhǔn)分增量評價體系是一種發(fā)展性評價體系,它以學(xué)生的發(fā)展來對教師教學(xué)質(zhì)量進行發(fā)展性增量評價,“以入口看出口”“以起點看變化”,不看存量看增量,不比基礎(chǔ)比進步,能科學(xué)地調(diào)動教師教學(xué)的積極性。
參考文獻:
[1]趙娟.標(biāo)準(zhǔn)分在區(qū)域初中畢業(yè)生學(xué)業(yè)質(zhì)量評價中的應(yīng)用[J].中外教育研究,2012(12):146-147.