摘要:近年來,“二選一”文題在中考中被廣泛使用。然而,兩道文題的差異性較大、文題評價的一致性不足、糾偏機(jī)制的科學(xué)性缺位,使得“二選一”文題評價有失科學(xué)與公平。而科學(xué)與公平是“二選一”文題理應(yīng)堅持的基本倫理。這就亟須引入糾偏機(jī)制。等級賦分作為成熟的糾偏機(jī)制,已被廣泛運(yùn)用到高考選科評價中。將等級賦分引入“二選一”文題評價,能平抑差異,彌補(bǔ)缺漏,實(shí)現(xiàn)科學(xué)評價。
關(guān)鍵詞:等級賦分? “二選一”文題? 考試評價? 糾偏機(jī)制? 等值處理
引用格式:蔣興超.中考“二選一”文題評價引入等級賦分的研究[J].教學(xué)與管理,2022(01):66-69.
“二選一”文題,以其柔性關(guān)懷擴(kuò)展了寫作和選擇的空間,在近年來的中考文題命制中愈來愈受重用。兩道文題必然有兩種評價,兩種評價就有兩套評價標(biāo)準(zhǔn),它們是否有統(tǒng)一的科學(xué)維度?當(dāng)兩種評價出現(xiàn)巨大偏差,理應(yīng)有科學(xué)而成熟的糾偏機(jī)制。等級賦分作為相對性評價,其目的是糾偏,平抑評價的失當(dāng)和不公?!岸x一”文題評價的種種漏洞與不足亟須引入糾偏機(jī)制加以彌補(bǔ),等級賦分正逢其時。
一、“二選一”文題評價的現(xiàn)狀分析
1.兩道文題的差異性較大
筆者收集了2021年中考語文試卷共124套,其中“二選一”文題共45卷,占比36.3%,接近樣本的四成。這比2019年占比的27.2%和2020年占比的34.7%又有所提高??梢?,“二選一”文題受到命制者的普遍青睞??v觀2021年中考的“二選一”文題,其顯著特點(diǎn)是差異性較大,有如下兩種表現(xiàn)。
(1)直接關(guān)聯(lián)小
兩道文題之間有直接關(guān)聯(lián)的有8卷,分別出自山西省,江西省,浙江省寧波市、湖州市、金華市、嘉興市、舟山市,湖南省永州市,湖北省恩施市。其他37卷的兩道文題之間沒有關(guān)聯(lián)性,具體表現(xiàn)為:缺少共同的情境,沒有相同或相似的話題,不在同一思考起點(diǎn)。缺乏關(guān)聯(lián)性意味著沒有可比性,這就增加了科學(xué)評價的難度。
(2)難度差異大
兩道文題的類型大都不同,組合形式較多,難度差異較大。比如2021年遼寧省營口市中考題:
文題一:運(yùn)動讓我_____________
近視、超重、肥胖……當(dāng)前學(xué)生體質(zhì)健康水平發(fā)展不充分、不平衡成為社會關(guān)注的熱點(diǎn),北京體育大學(xué)教授張一民說:“運(yùn)動是有效增強(qiáng)孩子體質(zhì),促進(jìn)健康和預(yù)防疾病,主動追求健康的重要手段。”以上材料引發(fā)了你怎樣的思考?請先補(bǔ)全題目,然后寫一篇文章。
文題二:綜合下面三則材料,選擇合理角度,自擬題目,寫一篇文章。
文題一是半命題作文,材料給出了思維支架,寫作方向較為明晰。文題二是材料作文,材料由“古訓(xùn)”“現(xiàn)代理念”和“全面育人觀”組合而成,而“古訓(xùn)”又由三則文言組成,這些看似不相關(guān)的材料成了審題障礙??忌€要能審讀出它們的共同話題是“勞動”,意在強(qiáng)調(diào)“勞動”的意義,否則無法下筆。因此,文題二要頗費(fèi)一番功夫才能找到寫作方向。顯而易見,文題二的難度要比文題一大得多。
2.文題評價的一致性不足
“二選一”文題相較于單一文題,對評價的要求更高:要有更寬的視域和更高的技術(shù)。要有更寬的視域,是因?yàn)閮傻牢念}的評價各自為陣,要平抑兩者的差異,需要用聯(lián)系和比較的眼光,眼界要開闊。要有更高的技術(shù),是因?yàn)槠揭植町愐C合文題難度、考分分布、等級劃分、占比確定等諸多因素,需要科學(xué)專業(yè)的技術(shù)支撐,技術(shù)要過硬。然而,頗受詬病的評價現(xiàn)狀是一致性不足,缺乏宏觀統(tǒng)籌。
單一文題的評價相對容易把握,而兩道文題就完全不同:這部分考生選擇此,那部分考生選擇彼,文題難度差異較大,選擇高難度文題的起評分是否要比選擇低難度文題的起評分高?考生一窩蜂地選擇難度低的,由此帶來嚴(yán)重的同質(zhì)化,寫得尚可的作文是否因此而受到打壓?兩道文題考生分差較大,是否需要調(diào)配考分的占比?這些都需要宏觀統(tǒng)籌。宏觀統(tǒng)籌是從上位設(shè)計來考量兩道文題評價的可比性和一致性。宏觀統(tǒng)籌,注重大局意識,拒絕偏狹和失衡,兩題都要兼顧,重在協(xié)同和平衡。
然而,“二選一”文題評價的現(xiàn)狀是:相互獨(dú)立,彼此割裂,主觀化和隨意化的傾向還很嚴(yán)重。這就導(dǎo)致了兩道文題的評價完全失聯(lián),一致性嚴(yán)重不足。
3.糾偏機(jī)制的科學(xué)性缺失
教育家懷特主張:“特別重要的考試,應(yīng)該讓所有的學(xué)生對同一問題做出反應(yīng),這樣所有的人站在相同的起點(diǎn),需要走相同的距離。最有意義的自由就是公平?!盵1]在懷特看來,高利害的選拔性考試應(yīng)有科學(xué)而公平的競爭起點(diǎn)。科學(xué)與公平,正是“二選一”文題理應(yīng)堅持的基本倫理。然而,文題命制有先天性缺陷,文題評價有明顯性分離,這就必須引入糾偏機(jī)制。
糾偏機(jī)制,主要應(yīng)對兩大核心問題:一是文題差異,二是評價不一。這種機(jī)制,應(yīng)在文題命制之初建立,在文題評價之時啟用。中考作為高利害的考試,雖然實(shí)行的是區(qū)域化考查,但應(yīng)當(dāng)建立全國通行的糾偏機(jī)制。糾偏機(jī)制,屬于高利害考試的上位設(shè)計,它和試題設(shè)計、評價設(shè)計同等重要,起到自我調(diào)節(jié)和自我完善的作用。一套成熟完備的高利害的測評體系,必須內(nèi)含糾偏機(jī)制。
隨著“二選一”文題的廣泛使用,科學(xué)、完備的糾偏機(jī)制必將建立。同樣高利害考試的高考,等級賦分作為成熟的糾偏機(jī)制已被普遍使用,它給“二選一”文題評價以很好的樣板參照。
二、等級賦分及引入“二選一”文題評價的意義
1.等級賦分的內(nèi)涵
等級賦分,簡而言之,就是將考生的原始分?jǐn)?shù)換算成等級再評價,它需要綜合等級的細(xì)化標(biāo)準(zhǔn)和考試的原始分?jǐn)?shù)。現(xiàn)行的高考等級賦分,不同的省份等級劃分的標(biāo)準(zhǔn)各有不同,但有三點(diǎn)共識:都拒絕以原始分直接評價,都需要將原始分進(jìn)行等級轉(zhuǎn)換,都關(guān)注原始分在群體中的位次和占比。它們的差異在于細(xì)化標(biāo)準(zhǔn)和轉(zhuǎn)換方式有所不同,但評價的精神指向完全一致。下面以浙江省、上海市、北京市、天津市和山東省的等級賦分為例,略作說明。
從表1可清晰看出,各省制定的細(xì)則標(biāo)準(zhǔn)均有不同,山東和上海的等級最少,浙江的等級最多,北京和天津大致相同。所有省市都將原始分進(jìn)行了二次轉(zhuǎn)化和定級,只是級數(shù)和占比各有不同。
由此可見,等級賦分是一種相對性評價,尤為關(guān)注原始分在考群中的位次和占比。通過技術(shù)處理和轉(zhuǎn)換,它更能直觀地反映原始分的位次,而非原始分本身。而過往的傳統(tǒng)評價,是絕對性評價,只關(guān)注原始考分,不關(guān)注也不反映原始分的位次。
高利害的高考為何要引入等級賦分呢?2014年9月,國務(wù)院頒布《國務(wù)院關(guān)于深化考試招生制度改革的實(shí)施意見》,提出了高考改革新方案,明確要求全國各省實(shí)行“3+3”必考加選考的高考模式。2014年浙江和上海率先試點(diǎn)(2017年執(zhí)行),選考科目,浙江實(shí)行“7選3”,上海實(shí)行“6選3”,浙江各種選科組合達(dá)35種,上海各種選科組合達(dá)20種。選考組合如此之多,而不同科目的考分差異可能很大,這就嚴(yán)重影響了考試的公平性?;诖?,浙江和上海率先采用了等級賦分。2017年第二批新高考改革啟動(2020年執(zhí)行)的山東、天津、北京、海南四省,選科考試也采用了等級賦分,2018年第三批新高考改革啟動(2021年執(zhí)行)的湖南、湖北、河北、遼寧、重慶、江蘇、福建和廣東八省,選科考試同樣采用了等級賦分??梢?,等級賦分已被各省廣泛認(rèn)可,大家都把目光聚焦到選考科目之間的差異性和可比性,都不約而同地追求評價的科學(xué)與公平。
2.引入等級賦分的意義
等級賦分和“二選一”文題評價所缺失的糾偏機(jī)制有何關(guān)系呢?從本質(zhì)來說,等級賦分就是一種糾偏機(jī)制,是為了防止和消除選科評價中的不合理,兩者的目的都是為了糾偏。從環(huán)境來說,它們所面臨的都是高利害的考試,一個是高考,另一個是中考,都涉及萬千考生的切身利益,被高度關(guān)注。從背景來說,它們都因選擇的多樣而帶來評價的差異,都是為了平抑差異而設(shè)立糾偏機(jī)制。從意圖上說,都希望科學(xué)測量,力求評價的科學(xué)公允。綜上所述,等級賦分完全可以成為“二選一”文題評價的必要引入。
引入等級賦分的目的在于平抑“二選一”文題評價的差異。從技術(shù)上講,等級賦分的核心意圖是解決原始分的可比性問題,引入等級賦分正是將其核心思想運(yùn)用到“二選一”文題評價中:根據(jù)等級賦分的標(biāo)準(zhǔn),用等級和占比來重新?lián)Q算原始分,以達(dá)到可比和平抑的目的。
引入等級賦分可以切實(shí)有效地營創(chuàng)科學(xué)公平的評價環(huán)境。近年來,“二選一”文題雖廣被采用,但評價各行其道,彼此失聯(lián),又廣遭質(zhì)疑。引入等級賦分便可以糾正顧此失彼的評價現(xiàn)狀,讓兩者的評價充分溝通和互動起來。若這樣,文題的難度、選題的多寡和兩題的標(biāo)準(zhǔn),就不再是考生擔(dān)憂的因素。依據(jù)等級賦分細(xì)則對原始分進(jìn)行轉(zhuǎn)換再評價,遠(yuǎn)比單題的原始分評價要科學(xué)得多,公允得多。如此,科學(xué)公平的評價環(huán)境也就隨之而至。
引入等級賦分有助于建立長效評價機(jī)制。等級賦分引入和運(yùn)用到高考評價之初,就是從大處著眼,屬于評價的頂層設(shè)計。這種設(shè)計科學(xué)、周密,易于理解和接受,可操性強(qiáng),能切實(shí)解決選科評價中可比性不強(qiáng)的問題,具有很強(qiáng)的針對性和實(shí)效性?!岸x一”文題評價將等級賦分引入進(jìn)來,也正是從上位進(jìn)行頂層設(shè)計:無論兩道文題怎樣組合,無論兩題難度如何差異,無論兩題評價標(biāo)準(zhǔn)怎樣不同,都得按此頂層設(shè)計進(jìn)行轉(zhuǎn)換再評價。這樣,長效評價機(jī)制的建立便水到渠成。
三、“二選一”文題評價引入等級賦分的構(gòu)想
等級賦分作為糾偏機(jī)制,盡管在高考中已廣泛運(yùn)用,它也可以彌補(bǔ)“二選一”文題評價的漏洞與不足,但能將其直接照搬到“二選一”文題評價中嗎?具體的標(biāo)準(zhǔn)該如何建立?兩道文題的原始分?jǐn)?shù)又該如何轉(zhuǎn)換?我們的應(yīng)對策略如下。
1.參照高考等級賦分標(biāo)準(zhǔn)
等級賦分,是為了平抑高考政治、歷史、地理、物理、化學(xué)、生物6門或7門(信息技術(shù))選科成績差異而設(shè)立的評價系統(tǒng)。在新高考三種賦分的區(qū)分程度上,海南實(shí)行的是“標(biāo)準(zhǔn)分制”,山東等第三批新高考改革區(qū)實(shí)行的是“等比例轉(zhuǎn)換法”,上海、浙江、天津和北京實(shí)行的是“固定等級比例賦分制”[3]。統(tǒng)而言之,三種賦分方式是按不同的建模方法精確計算的結(jié)果,都有科學(xué)的測量標(biāo)準(zhǔn),都經(jīng)得起實(shí)踐的檢驗(yàn)。它們只是算法不同而已,各有優(yōu)勢。從理論上說,可以將等級賦分直接引入到“二選一”文題評價。
然而,等級賦分比“二選一”文題評價亟需的糾偏機(jī)制要復(fù)雜得多:等級賦分和高考選科、未來專業(yè)有高度關(guān)聯(lián),而“二選一”文題評價則沒有;等級賦分的對象是高考6門或7門選考學(xué)科,而“二選一”文題的賦分對象只有兩道文題;高考等級賦分,除上海外,其他省份轉(zhuǎn)換后的滿分都為100分,而中考作文大多地區(qū)的滿分為50分;高考等級賦分的標(biāo)準(zhǔn),所定的級數(shù)較多,浙江達(dá)21級,而中考作文大多地區(qū)按5類文賦分。
綜合以上信息可知,各省的等級賦分雖有差異,但都有科學(xué)可靠的定級賦分的標(biāo)準(zhǔn)。要將等級賦分引入到“二選一”文題評價,只需靈活地降格處理,也就是把等級賦分的精髓運(yùn)用到“二選一”文題評價中即可。
2.明晰等級賦分精髓
為了更好地將等級賦分引入“二選一”文題評價,必須先厘清等級賦分的精髓。教育部頒布的《教育部關(guān)于普通高中學(xué)業(yè)水平考試的實(shí)施意見》明確規(guī)定:以等級呈現(xiàn)成績的一般分為五個等級,位次由高到低為A、B、C、D、E。原則上各省(區(qū)、市)各等級人數(shù)所占比例依次為:A等級15%,B等級30%,C等級30%,D、E等級共25%。E等級為不合格,具體比例由各?。▍^(qū)、市)根據(jù)基本教學(xué)質(zhì)量要求和命題情況等確定[4]。這是教育部對等級賦分要求的總綱,從上位設(shè)定了考分轉(zhuǎn)換的等級占比。不管科目考試的難易程度和原始分如何,都必須按此執(zhí)行。這就從根本上平抑了不同科目因難度系數(shù)和原始考分的高低不平而帶來的差異。等級賦分的程序大致如下。
(1)根據(jù)上位設(shè)計,先劃等級
由表1可見,各省所劃的等級有所不同:浙江、北京和天津劃為5等21級,上海為5等11級,山東為8等80級。各省做法雖有不同,但都進(jìn)行了精確的等級劃分,且所有選考科目都按此執(zhí)行。這是科學(xué)測量和有效區(qū)分的第一道屏障。
(2)劃好等級,再定占比
不同的等級,占比各有不同。以浙江為例,1級占比1%,2級占比2%,3級占比3%,6級占比6%,7級占比7%,8級占比8%,9級占比7%,10級占比7%。同為5等21級的北京和天津,大多等級的占比和浙江完全相同,而有的等級占比就略有不同,比如北京和天津6級占比都為7%,7級占比浙江和天津都為7%,而北京為8%。總體而言,各級占比差異較小,和教育部上位規(guī)定的整體占比大體一致。這是科學(xué)測量和有效區(qū)分的第二道屏障。
(3)按比賦分
按比賦分,就是將原始分按等級位次所對應(yīng)的占比重新?lián)Q算成新的考分。還以表1的浙江為例,不論原始考分是多少,占比前1%就為1級,對應(yīng)等級重新賦分為100分,占比在1%和2%之間就是2級,對應(yīng)等級重新賦分為97分,具體賦分詳見表1。
綜上可見,等級賦分的精髓就是先劃等級,再定占比,按比賦分。一言以蔽之,根據(jù)原始分的位次占比重新賦分。等級賦分看重的是原始考分的區(qū)間占比,而非原始考分本身。
3.重建等級賦分標(biāo)準(zhǔn)
“二選一”文題評價引入等級賦分不是將各省所定的細(xì)則標(biāo)準(zhǔn)直接拿來,而是取其精髓,重新劃分等級確定占比和按比賦分,也就是重新建立標(biāo)準(zhǔn),重做等值處理。這里涉及以下兩個問題。
(1)原標(biāo)準(zhǔn)的處理
重建新標(biāo)準(zhǔn)并不意味著廢棄原有的評價標(biāo)準(zhǔn),而是兩道文題對應(yīng)兩套評價標(biāo)準(zhǔn),不同的文題按照不同的標(biāo)準(zhǔn)分別評價。原有的評價標(biāo)準(zhǔn)專業(yè)性很強(qiáng),要避免外力的干擾。這種專業(yè)性很強(qiáng)的原始評價是科學(xué)測評的原始防線,不可丟棄,丟棄了原始防線,等級賦分也就從根本上失去了意義。從這個意義上可以說,原標(biāo)準(zhǔn)是新標(biāo)準(zhǔn)的基石。
(2)新標(biāo)準(zhǔn)的建立
建立新標(biāo)準(zhǔn)就是要從上位設(shè)計一套科學(xué)的等級換算的標(biāo)準(zhǔn)。高考的等級賦分所設(shè)的等級較多,原因是選考科目為100分制(上海除外)。而中考作文大多為50分制,因此劃分的等級可以相對少一些。至于占比的確定,需要綜合樣本透視、難度系數(shù)、均值分?jǐn)?shù)、考分分布、區(qū)分要求等諸多因素。劃分等級和確定占比是最為關(guān)鍵的兩步,它們共同決定了分?jǐn)?shù)轉(zhuǎn)換的標(biāo)準(zhǔn)尺度和區(qū)分力度,需要專業(yè)人士的廣泛參與,包括作文評測和建模測量兩類專家的合力共建,并且還需要經(jīng)過反復(fù)實(shí)驗(yàn)和反復(fù)檢驗(yàn)。依據(jù)中考作文評價的特點(diǎn)而建立的科學(xué)可靠的數(shù)學(xué)模型就是一套成熟的等值轉(zhuǎn)換的評價系統(tǒng),也正是“二選一”文題評價所缺失的糾偏機(jī)制。有了這套系統(tǒng),計算機(jī)便可以依據(jù)標(biāo)準(zhǔn)將原始分重新科學(xué)賦分。唯其如此,“二選一”文題評價才能真正邁入科學(xué)與公平的康莊大道。
參考文獻(xiàn)
[1] 葉麗新.讀寫測評:理論與工具[M].上海:上海教育出版社,2020:220.
[2] 楊志明.完善新高考學(xué)業(yè)水平等級考試賦分方案的三種策略[J].教育測量與評價,2018(12):5-10.
[3]? 程偉,王雨欣.新高考選考科目賦分方式的比較分析[J].河北師范大學(xué)學(xué)報:教育科學(xué)版,2020(01):28-32.
[4] 中華人民共和國教育部.教育部關(guān)于普通高中學(xué)業(yè)水平考試的實(shí)施意見(教基二[2014]10號)[Z].(2014-12-16)http://www.moe.gov.cn/srcsite/A06/s3732/201808/t20180807_344610.html.
該文為江蘇省2020年度“333”工程科研資助課題“基于思維品質(zhì)提升的統(tǒng)編初中語文教材寫作教學(xué)研究”(BRA2020099)的研究成果