趙靜宇 佟威 漆成明
(1.教育部考試中心,北京 100084;2.華南師范大學(xué),廣州 510631)
寫作試題的歷史可以追溯至唐高宗時期進(jìn)士科加試帖經(jīng)、雜文。寫作試題誕生之初受到士子重視的原因在于:它的區(qū)分效果優(yōu)于其他試題:“惟對策多可抄襲,帖經(jīng)惟資記誦,別高下定優(yōu)劣,以詩賦文律為最宜,故聰明才思亦奔湊于此也?!盵1]新中國成立以來,高考語文寫作試題一直是高考各科試卷中賦分最高的試題,但寫作試題的區(qū)分效果與所占的分值并不相稱。為了最大程度地發(fā)揮寫作試題在高考選拔中的作用,正向引導(dǎo)高中寫作教學(xué),研究者提出了多種解決方案,閱讀與寫作合卷分時考查是其中之一。這種方法是否有效,不僅需要理論的推導(dǎo),也需要實(shí)證的檢驗(yàn)。
與國外其他考試的寫作試題采用等級制的評分方式不同,我國高考語文寫作試題采用計(jì)分制,通常為60分,占總分的40%。寫作試題所占的分?jǐn)?shù)比重與寫作能力的重要性是匹配的。隨著21世紀(jì)全球化、信息化的知識經(jīng)濟(jì)時代的到來,寫作能力對一個人的全面發(fā)展、終身發(fā)展是必不可少的。無論是經(jīng)合組織(OECD)構(gòu)建的《成功生活和健全社會的核心素養(yǎng)指標(biāo)框架》、歐盟(EU)發(fā)布的《終身學(xué)習(xí)核心素養(yǎng):歐洲參考框架》,還是聯(lián)合國教科文組織(UNESCO)發(fā)布的《全球?qū)W習(xí)領(lǐng)域框架》,都將母語表達(dá)能力列為重要的內(nèi)容。寫作試題所占的分值雖高,有效分值卻偏低。60分的寫作試題,分?jǐn)?shù)呈正態(tài)分布時理論上最優(yōu)的標(biāo)準(zhǔn)差應(yīng)達(dá)到10分,實(shí)際的標(biāo)準(zhǔn)差卻往往不超過5分。寫作試題的標(biāo)準(zhǔn)差小,學(xué)生成績的離散效果不理想,影響了寫作試題在選拔過程中應(yīng)起的作用,造成的直接后果就是高中不重視寫作教學(xué)。許多高中一線教師和學(xué)生存在這樣的心理:寫作練不練分?jǐn)?shù)差不多,練多練少分?jǐn)?shù)差不多,不如省下時間去提高數(shù)學(xué)、英語成績。與之相反,高校教師普遍認(rèn)為,學(xué)生論文寫作存在較大的問題,有些甚至做不到基本的文通字順,無法清晰地表達(dá)自己的觀點(diǎn);他們希望高考加大對寫作能力的考查力度,以此推動高中的寫作教學(xué),提高學(xué)生的寫作能力。高考作為連接高等教育和基礎(chǔ)教育的橋梁,應(yīng)發(fā)揮其選拔功能和反撥作用,切實(shí)提高寫作試題的區(qū)分功能。
根據(jù)2014年9月國務(wù)院頒布的《關(guān)于深化考試招生制度改革的實(shí)施意見》和各省市陸續(xù)公布的新高考方案,全國統(tǒng)一高考科目只剩語文、數(shù)學(xué)、外語3科。在這種形勢下,只有提高高考語文的區(qū)分度,才能防止或緩解在后續(xù)招生錄取過程中可能出現(xiàn)的學(xué)生分?jǐn)?shù)拉不開差距的問題。高達(dá)60分的寫作試題更是責(zé)無旁貸。
影響寫作試題區(qū)分功能的原因較為復(fù)雜,以下3種觀點(diǎn)較為常見。一是高考語文測試的是母語表達(dá)能力,學(xué)生在母語表達(dá)能力方面并沒有明顯的高低之分,寫作分?jǐn)?shù)拉不開差距是正常的。假如這種觀點(diǎn)成立,那么,高考語文作為選拔性考試,要做的不是嘗試提高寫作區(qū)分效果,而是適當(dāng)降低寫作分值,增加其他可以增加區(qū)分效果的考試內(nèi)容的分值。因此,這種假設(shè)并不成立。因?yàn)閺倪^程評價的結(jié)果看,日常教學(xué)中學(xué)生反映出來的寫作水平差別非常大,從文質(zhì)兼美到錯字病句累累,各個層次均有相當(dāng)數(shù)量的學(xué)生。二是學(xué)生寫作水平差別較大,但閱卷打“保險(xiǎn)分”的心理造成分?jǐn)?shù)趨中,導(dǎo)致寫作試題的區(qū)分效果不佳。這一問題較為復(fù)雜,本文不作討論。
本文關(guān)注的是第3種觀點(diǎn)。越來越多的一線教師和學(xué)者持有第3種觀點(diǎn)。他們認(rèn)為,學(xué)生實(shí)際寫作水平差別較大,在考場上表現(xiàn)出的寫作水平卻大致趨同,造成兩者之間存在較大差異的原因在于寫作試題受到閱讀試題的擠壓,作答時間嚴(yán)重不足。解決這一問題的方法是將目前閱讀與寫作合卷合時考查的模式改為合卷分時考查,即閱讀試題與寫作試題依然在同一張?jiān)嚲砩铣尸F(xiàn),但作答時間分別加以限定。2014年1月,在教育部考試中心組織召開的高考改革研討會上,多位心理測量專家、語文教育專家提及這一方案。在2014年兩會期間,全國政協(xié)委員、華東師范大學(xué)歷史系章義和教授就此專門撰寫了政協(xié)提案[2]。這里需要注意的是,高考語文除閱讀試題和寫作試題外,還有其他試題,如語言知識應(yīng)用試題。對寫作造成影響的主要是耗時較長、分值較高的閱讀試題,因此,討論閱讀與寫作合卷分時考查時,指的其實(shí)是非寫作試題與寫作試題的合卷分時考查。
從理論推導(dǎo)和經(jīng)驗(yàn)判斷的角度看,這種觀點(diǎn)是正確的。在高考語文試卷中,寫作試題是試卷的最后一道試題,必然受到前面試題,特別是文字量和思維量較大的閱讀試題的影響。早在20世紀(jì)80年代,高考語文命題組專家已經(jīng)認(rèn)識到合卷合時考查模式下閱讀與寫作會產(chǎn)生矛盾:“現(xiàn)代文閱讀能力的考查應(yīng)兼顧速度問題,這是毫無疑義的,但在閱讀、作文共屬一張?jiān)嚲淼那闆r下,閱讀材料篇幅過長,會相應(yīng)地影響作文的時間。”[3]當(dāng)時的解決辦法是縮減閱讀材料的長度。在信息化時代的今天,二者矛盾再次凸顯。一方面,無論是高校學(xué)習(xí)、社會工作,還是日常生活,都要求學(xué)生必須具備一定的閱讀速度,能夠在規(guī)定時間內(nèi)快速地從繁雜的材料來源中提取出有效的信息,并經(jīng)過判斷、處理為己所用;另一方面,寫作要求學(xué)生就相關(guān)問題進(jìn)行深入思考,構(gòu)思文章,再從形之于心到形之于文。學(xué)生沒有充裕的時間展示自己真實(shí)的寫作水平,來不及構(gòu)思、匆忙下筆,呈現(xiàn)出來的作文千卷一面,相差無幾。據(jù)此推理,將閱讀試題與寫作試題分開考查,應(yīng)該可以達(dá)到限定閱讀時長、考查閱讀速度和保證寫作時間充裕、讓學(xué)生體現(xiàn)出真實(shí)的寫作水平的雙重目的。
從考試測量的角度來講,寫作能力是較為獨(dú)立的一種能力,單獨(dú)限定時間更有利于精準(zhǔn)測量。國外成熟的語言測試類考試,如英國的A-Level、IELTS,美國的SAT、ACT、GRE無一不是寫作單獨(dú)考查,并在成績報(bào)告單中提供單獨(dú)的寫作成績。
合卷分時考查模式能否提高寫作試題的區(qū)分功能?是否會帶來其他問題?可否真正應(yīng)用到高考改革的實(shí)踐?為了回答上述問題,教育部考試中心于2017年在某省進(jìn)行測試和問卷調(diào)查,并對數(shù)據(jù)進(jìn)行了細(xì)致的梳理和分析。
進(jìn)行測試的目的,一是了解合卷分時模式對學(xué)生作答時間分配策略的影響;二是了解合卷分時模式對高考語文總分、寫作試題和非寫作試題分?jǐn)?shù)及區(qū)分效果的影響。
為了獲得學(xué)生作答時間信息,測試采用機(jī)考模式,分為實(shí)驗(yàn)組和對照組。其中,實(shí)驗(yàn)組采用合卷分時模式,非寫作部分限時90分鐘,寫作部分限時60分鐘,非寫作部分提交成功后方可作答寫作部分;對照組采用合卷合時模式,試卷限時150分鐘,學(xué)生可自由分配答題時間。
為了保證測試的數(shù)據(jù)對高考具有借鑒作用,測試卷依據(jù)2017年高考語文大綱命制,試卷的結(jié)構(gòu)、題型、題量與2017年正式使用的高考語文試卷大致相仿,寫作試題采用常規(guī)的材料作文。圍繞測試目的,設(shè)計(jì)了調(diào)查問卷,了解學(xué)生的作答感受。
評卷與高考正式評卷的流程、要求相同。寫作試題除了采用傳統(tǒng)的綜合評分方式外,還采用了分項(xiàng)評分方式,以消除評卷誤差產(chǎn)生的影響。綜合評分的評分量表是多年來高考一直沿用的評分量表,分項(xiàng)評分的評分量表則是在綜合評分的評分量表的基礎(chǔ)上修訂而成的,評價的維度和標(biāo)準(zhǔn)與綜合評分一致。評卷教師不直接給分,而是根據(jù)各維度將作文劃分出不同等級,由計(jì)算機(jī)后臺按照一定的規(guī)則自動計(jì)算分?jǐn)?shù),以此降低打“保險(xiǎn)分”的心理造成的評卷誤差。
根據(jù)測試目的和設(shè)計(jì),選取信息技術(shù)條件較好的6所高中學(xué)校作為測試的樣本校,覆蓋質(zhì)量較好、中等和一般的學(xué)校。采取整班抽樣的方法,每所高中學(xué)校選取至少100名高二年級或高三年級學(xué)生參加測試,其中30~50名學(xué)生參加分卷測試。參與測試的學(xué)生共832名。由于系統(tǒng)原因?qū)е乱徊糠謱W(xué)生數(shù)據(jù)不全,剔除掉這部分?jǐn)?shù)據(jù)后,最終收集到629份有效數(shù)據(jù),其中分卷測試即實(shí)驗(yàn)組168份,整卷測試即對照組461份。
測試完成后,對收集到的分?jǐn)?shù)、時間、問卷調(diào)查結(jié)果數(shù)據(jù)進(jìn)行綜合分析。
根據(jù)計(jì)算機(jī)后臺記錄的學(xué)生作答時間,無論是實(shí)驗(yàn)組,還是對照組,學(xué)生的平均作答時間都在125分鐘以內(nèi),見表1。語文考試時間為150分鐘,學(xué)生答完全部試題后,還有約25分鐘的時間剩余。僅從表1判斷,合卷分時模式不會對學(xué)生作答時間產(chǎn)生太大的影響。
表1 學(xué)生作答時間統(tǒng)計(jì)
進(jìn)一步對作答時間進(jìn)行細(xì)分后,發(fā)現(xiàn)事實(shí)并非如此。學(xué)生的閱讀速度、答題速度和寫作速度存在較大的差異。合卷合時模式改為合卷分時模式后,雖然總體作答時間不變,但是學(xué)生在整張?jiān)嚲碇械臅r間分配策略出現(xiàn)顯著的變化。將非寫作部分與寫作部分的作答時間分開,作出學(xué)生作答時間分布圖(見圖1和圖2)。在圖1中,在對非寫作試題進(jìn)行作答時,相較對照組,實(shí)驗(yàn)組學(xué)生的時間分布上出現(xiàn)了明顯的雙峰,集中在85分鐘和90分鐘左右。可以推測,實(shí)驗(yàn)組部分學(xué)生因時間限制改變了考試策略,在系統(tǒng)預(yù)設(shè)的90分鐘內(nèi)規(guī)劃作答;部分學(xué)生因時間限制未能及時調(diào)整考試策略,90分鐘時被迫中斷作答。在圖2中,在對寫作試題進(jìn)行作答時,相較對照組,實(shí)驗(yàn)組學(xué)生時間分布上有一個明顯的斷崖,出現(xiàn)在60分鐘??梢酝茰y,實(shí)驗(yàn)組部分學(xué)生因時間限制,在系統(tǒng)預(yù)設(shè)的60分鐘時被迫中斷作答。在對照組中,非寫作部分超出90分鐘和寫作部分超出60分鐘的學(xué)生都不在少數(shù)。但在合卷合時模式下,學(xué)生有選擇優(yōu)先作答哪一部分試題和根據(jù)自己情況安排作答時間的自由。在合卷分時模式下,這種自由將會部分喪失。
圖1 學(xué)生非寫作試題用時分布
圖2 學(xué)生寫作試題用時分布
預(yù)設(shè)采用合卷分時模式的實(shí)驗(yàn)組學(xué)生普遍感到寫作時間變得充裕的情況并沒有出現(xiàn)。在對調(diào)查問卷中“是否有足夠時間完成寫作”的問題進(jìn)行統(tǒng)計(jì)時(見圖3),實(shí)驗(yàn)組選擇“輕松完成”的學(xué)生僅占29.90%,60.82%的學(xué)生“勉強(qiáng)完成”,9.28%的學(xué)生選擇了“無法完成”,雖然優(yōu)于對照組,但效果并不明顯。
圖3 “是否有足夠時間完成寫作”問題的調(diào)查結(jié)果
寫作時間可以分為3種。第一種是考試規(guī)定的寫作時間。在合卷合時模式下,考試規(guī)定的寫作時間理論上可以長達(dá)150分鐘;在合卷分時模式下,考試規(guī)定的寫作時間是60分鐘。第二種是學(xué)生預(yù)期需要的寫作時間,即學(xué)生根據(jù)平時的練習(xí)預(yù)計(jì)自己將會使用的寫作時間。第三種是學(xué)生實(shí)際使用的寫作時間。在理想狀態(tài)下,3種寫作時間是一致的,但在現(xiàn)實(shí)中,常常存在較大差異。比如,在實(shí)驗(yàn)組,考試規(guī)定的寫作時間是60分鐘,學(xué)生出于留出檢查時間等心理,將預(yù)期的寫作時間定為50分鐘,但實(shí)際使用的寫作時間可能僅有45分鐘。在這種情況下,雖然考試規(guī)定的時間尚未用完,但學(xué)生依然會有緊迫感。上述推測可以在調(diào)查問卷中另一個問題的數(shù)據(jù)中得到佐證。學(xué)生考試實(shí)際使用的寫作時間與日常訓(xùn)練花費(fèi)的時間之間存在較大的差異:實(shí)際考試用時明顯低于日常訓(xùn)練用時(見圖4)。習(xí)慣的養(yǎng)成非一日之功,時間分配策略的改變也不可能一蹴而就。在本次測試中,合卷分時模式改變的是考試規(guī)定的寫作時間,學(xué)生實(shí)際考試用時隨之調(diào)整,但學(xué)生預(yù)期的寫作時間卻沒有改變。這是實(shí)驗(yàn)組學(xué)生即使擁有60分鐘時間用于寫作卻依然感覺時間緊張的原因。
圖4 學(xué)生寫作試題實(shí)際用時與日常訓(xùn)練用時對比
從測試的結(jié)果看(見表2),實(shí)驗(yàn)組的平均分和標(biāo)準(zhǔn)差都略高于對照組。寫作試題部分未出現(xiàn)預(yù)期的平均分?jǐn)?shù)和標(biāo)準(zhǔn)差都明顯提高的情況。采用分項(xiàng)評分,實(shí)驗(yàn)組平均分比對照組高0.77分,標(biāo)準(zhǔn)差比對照組高0.41分;采用傳統(tǒng)的綜合評分,實(shí)驗(yàn)組平均分比對照組高0.51分,標(biāo)準(zhǔn)差比對照組高0.66分。有趣的是,相較實(shí)驗(yàn)組和對照組之間的差異,分項(xiàng)評分和綜合評分之間的差異更為顯著。在實(shí)驗(yàn)組,分項(xiàng)評分方式下的平均分比綜合評分低3.37分,標(biāo)準(zhǔn)差高2.52分;在對照組,分項(xiàng)評分方式下的平均分比綜合評分低3.63分,標(biāo)準(zhǔn)差高2.77分。
表2 試卷分?jǐn)?shù)及離散程度統(tǒng)計(jì)
在綜合評分方式下,實(shí)驗(yàn)組和對照組寫作試題分?jǐn)?shù)分布的曲線幾乎重合,特別是36分以上的部分(見圖5)。
圖5 寫作試題分?jǐn)?shù)分布(綜合評分)
在分項(xiàng)評分方式下,雖然實(shí)驗(yàn)組和對照組的平均分相差無幾,但分?jǐn)?shù)分布卻出現(xiàn)了較大差異(見圖6)。首先是實(shí)驗(yàn)組的分?jǐn)?shù)峰值變低,分?jǐn)?shù)的整體分布更加均勻。在30分以下,對照組分?jǐn)?shù)分布更加均勻,在30分以上,實(shí)驗(yàn)組分?jǐn)?shù)分布更加均勻。在50分以上的高分段,實(shí)驗(yàn)組人數(shù)比例明顯高于對照組。
圖6 寫作試題分?jǐn)?shù)分布(分項(xiàng)評分)
在非寫作試題部分,實(shí)驗(yàn)組和對照組的分?jǐn)?shù)分布均呈正態(tài)。相較對照組,實(shí)驗(yàn)組分?jǐn)?shù)略有提高。但在72分以上的高分段,對照組人數(shù)比例明顯高于實(shí)驗(yàn)組(見圖7)。
圖7 非寫作試題分?jǐn)?shù)分布
根據(jù)上述分析,可以得出以下結(jié)論。
第一,在分卷合時模式下,學(xué)生因模式更改調(diào)整了時間分配策略,但未明顯感到寫作時間的充裕。
第二,在分卷合時模式下,寫作試題和非寫作試題的平均分和標(biāo)準(zhǔn)差略有提高,但不明顯。
第三,在分卷合時模式下,分?jǐn)?shù)分布更加均勻,寫作試題高分段人數(shù)增加,非寫作試題高分段人數(shù)減少。
第四,評分方式改變對平均分和標(biāo)準(zhǔn)差的影響大于考試時間模式改變造成的影響。
在本次測試中,合卷分時模式產(chǎn)生的影響不如預(yù)期那樣明顯,主要是由于學(xué)生長期養(yǎng)成的時間分配策略較為穩(wěn)定,不會因一次考試的改變而改變。要充分發(fā)現(xiàn)和利用合卷分時考查的預(yù)期優(yōu)勢,應(yīng)在測試前即對實(shí)驗(yàn)組學(xué)生進(jìn)行合卷分時模式的考試練習(xí),使他們形成該模式下最適宜的考試時間分配策略,然后再比較實(shí)驗(yàn)組與對照組的異同。
合卷分時考查是一個涉及因素較多、較為復(fù)雜的實(shí)證問題。由于本次測試的樣本量較小,測量獲得的數(shù)據(jù)和統(tǒng)計(jì)分析結(jié)果僅可作為參考。在提高寫作試題區(qū)分功能方面,需要嘗試和探索更多的新方法。
[1]錢穆.國史大綱[M].北京:北京商務(wù)印書館,1996:430.
[2]人民政協(xié)報(bào).在滬全國政協(xié)委員“前瞻”全國政協(xié)十二屆二次會議[N].人民政協(xié)報(bào),2014-03-02(1).
[3]高考命題組.關(guān)于1986年高考各科命題的說明[J].人民教育,1986(9):24.