對教育專家來說寫作評價一直被認(rèn)為是有問題的領(lǐng)域,Speck&Jones(說“問題多在答案、閱卷員之間的可靠性、一個閱卷員的一致、分配給閱卷員的職責(zé)?!庇捎诎延⒄Z作為第二語言(ESL)學(xué)生的語言和文化背景的差異,對他們的英語寫作評價比對母語學(xué)生的寫作評價問題更多。一方面,許多因素影響ESL學(xué)生的寫作,包括他們英語能力、母語、國家文化及書面交流方式。另一方面,閱卷員在評價ESL學(xué)生的作文時可能從不同角度考慮這些因素。實(shí)證研究發(fā)現(xiàn)評價ESL學(xué)生作文的閱卷員行為不同,他們的背景、母語、經(jīng)驗(yàn)、參加培訓(xùn)的次數(shù)及寫作的類型和難度都影響對ESL學(xué)生作文的評價。這些因素的影響導(dǎo)致對ESL學(xué)生寫作評分的準(zhǔn)確、精確和得分的公平等。
公平是教育評估領(lǐng)域的重點(diǎn)問題,教育組織、學(xué)校和專家都應(yīng)該對不同民族、性別和種族背景的應(yīng)試學(xué)生盡可能地公平。由于在過去的20年里到北美學(xué)校的ESL學(xué)生數(shù)量激增,對于他們的寫作評價的公平問題越來越重要。ESL學(xué)生不得不參加和母語學(xué)生一樣的考試,并希望他們能成功地展示他們的寫作技能或完成高風(fēng)險的寫作考試。
一、寫作評分的信度與效度
閱卷員之間或閱卷員自身的信度、一致性在ESL學(xué)生寫作評分中尤其重要,因?yàn)樵谠u分員當(dāng)中和閱卷員自身的易變,所以,分?jǐn)?shù)中可能存在不需要的易變。不同的閱卷員常常給同一份作文不同的分?jǐn)?shù),同一名閱卷員可能在不同的時間給同一篇作文不同的分?jǐn)?shù)。這兩個變量引起的問題不同程度地影響學(xué)生得分的信度和效度。
1.信度
根據(jù)傳統(tǒng)的測試?yán)碚?,考試者的?shí)得分?jǐn)?shù)由“真實(shí)分?jǐn)?shù)”和“錯誤分?jǐn)?shù)”構(gòu)成。在傳統(tǒng)的測試?yán)碚摽蚣苤?,每個人之間的實(shí)得分?jǐn)?shù)變量等于參加考試者的真實(shí)分?jǐn)?shù)和錯誤分?jǐn)?shù)的變量總和。如果變量里沒有預(yù)言性,閱卷員之間和他們自身的易變構(gòu)成了隨機(jī)測量錯誤,多種錯誤的來源有助于錯誤分?jǐn)?shù)的變化。Spearman把信度解釋為真實(shí)分?jǐn)?shù)變量和全部分?jǐn)?shù)變化的比率。所以,如果錯誤分?jǐn)?shù)變化小,那么信度就高,接近1.0。相反,如果錯誤分?jǐn)?shù)變化大,那么信度就低。假設(shè)閱卷員之間和評他們自身的隨機(jī)變化有助于錯誤分?jǐn)?shù)的變化,這個隨機(jī)變量促成了較低的信度。結(jié)果,降低閱卷員之間和他們自身的信度并試圖減少不必要的變化來源。確保高水平的評卷員的信度也是至關(guān)重要的,因?yàn)樗砻鲗SL學(xué)生寫作評分的精確度。
2.效度
效度也是學(xué)生寫作評價的一個重點(diǎn)。Messick把效度描述為對等級的綜合評價,對此用實(shí)驗(yàn)性證據(jù)和基本理論證明了基于測試分?jǐn)?shù)的推理和行為的充分性和適當(dāng)性。從這個意義上說,在寫作測試中得分高的學(xué)生被認(rèn)為是能力強(qiáng)的作者,得分低的學(xué)生被認(rèn)為是能力低的作者。
重要的是如果存在系統(tǒng)測量誤差的來源,就會混淆對一個寫作分?jǐn)?shù)的解釋。如果系統(tǒng)誤差的性質(zhì)提高了實(shí)得分?jǐn)?shù),那么實(shí)得分?jǐn)?shù)就會對真實(shí)分?jǐn)?shù)評價過高。另一種方案是如果系統(tǒng)誤差的性質(zhì)降低了實(shí)得分?jǐn)?shù),那么真實(shí)分?jǐn)?shù)就會被低估。由于系統(tǒng)資源的變化降低了對實(shí)得分?jǐn)?shù)解釋的效度,這與相應(yīng)的真實(shí)分?jǐn)?shù)的評價一樣。
許多因素都有助于造成閱卷員對寫作評分的誤差。就ESL寫作來說,這些因素包括閱卷員的語言和學(xué)科背景、閱卷員的嚴(yán)厲、對錯誤的容忍、閱卷員的培訓(xùn)、寫作任務(wù)的類型和難度。
效度研究和信度研究一樣重要,它表明在寫作評分中是否存在偏見。同樣,效度和公平密切相關(guān)。Cole和Moss證明公平是效度的一個方面,一個無效的作文分?jǐn)?shù)會對學(xué)生不公平并且產(chǎn)生多種后果。所以,確保對學(xué)生作文的有效評分至關(guān)重要。
信度和效度與公平密切相關(guān),需要把公平放在首位。在討論語言評分的信度、效度和公平方面,Kunnan證明“如果一次測試不公平,其中信度和效度,甚至真實(shí)的互動就沒有什么價值。”
二、影響ESL寫作評分的因素
以北美學(xué)校為研究對象,考察影響ESL寫作評價的準(zhǔn)確度、信度和效度的多種因素,如寫作任務(wù)的種類、ESL和NE(母語)學(xué)生的比例數(shù)、閱卷員的數(shù)量、閱卷員的職稱等級、培訓(xùn)和評定法。此因素可以分成兩類:與閱卷員相關(guān)的因素包括評分方法、評分標(biāo)準(zhǔn)、閱卷員的學(xué)科、職業(yè)經(jīng)驗(yàn)、語言背景對錯誤的容忍、感知和期望以及對閱卷員的培訓(xùn);與任務(wù)相關(guān)的因素包括寫作任務(wù)的類型和難度。下面就這些因素進(jìn)行探討。
1.評分方法
整體性和分析性評分在寫作評估實(shí)踐中獲得廣泛接受。在整體性評分中,每個閱卷員根據(jù)一個評分標(biāo)準(zhǔn)對總的寫作能力進(jìn)行評估。然而,在分析性評估中,寫作成績可以分成可確認(rèn)的組成部分,如結(jié)構(gòu)和內(nèi)容,每部分按照一個評分標(biāo)準(zhǔn)分別評分。
這兩種方法各有其優(yōu)點(diǎn)和缺點(diǎn)HjLAhR5kVpCVkxQDFUQIiC7+XG6eAmEj3JUo5RVp30Q=。既然綜合寫作能力是評估的概念,那么整體性評分具有最高的結(jié)構(gòu)效度,是精通和研究測試的工具,但它“對信度有威脅”。它極其主觀是由于“偏見、疲倦、閱卷員自身缺少信度、學(xué)生原有的知識以及從一份試卷到另一份試卷的變化?!狈治鲂栽u估允許學(xué)生看見他們在每部分的得分,提供診斷信息。盡管分析性評估比整體性評估產(chǎn)生的信度高,但是太耗費(fèi)時間。
實(shí)證研究發(fā)現(xiàn)兩種評分方法都可能影響ESL作文評估的信度和效度。英語專業(yè)教師給的整體分?jǐn)?shù)和ESL教師給的整體分?jǐn)?shù)之間有明顯的差異,因?yàn)橛⒄Z專業(yè)教師給出作文較高的分?jǐn)?shù),他們使用分析方法批閱作文時更注重寫作范文的整體內(nèi)容和修辭特征的質(zhì)量。
2.評分標(biāo)準(zhǔn)
評分標(biāo)準(zhǔn)是對參加考試學(xué)生的書面答卷的具體評分標(biāo)準(zhǔn)??偟膩碚f,運(yùn)用語言的技能(文章結(jié)構(gòu)、風(fēng)格、會話性質(zhì)),語言(語法結(jié)構(gòu)、句法和詞匯),內(nèi)容(學(xué)科知識、論點(diǎn)展開、主題相關(guān)、事實(shí)論證),被認(rèn)為是評價ESL和NE作文的三個主要的標(biāo)準(zhǔn)。
閱卷員在評ESL和NE學(xué)生作文時對標(biāo)準(zhǔn)重視不同。閱卷員(正在高中教英語和有資格在高中、大學(xué)教英語的教師,或者是研究生助教)按照下面三個不同的標(biāo)準(zhǔn)評估ESL和NE學(xué)讓的作文:“內(nèi)容的展開和結(jié)構(gòu)”、“句子”、“詞匯。”例如,句子錯誤對ESL學(xué)生作文分?jǐn)?shù)的負(fù)面影響極大。閱卷員可能會不公平地關(guān)注評卷指南里的一兩個標(biāo)準(zhǔn),或者使用他們自己的內(nèi)化標(biāo)準(zhǔn)來批閱ESL的作文。當(dāng)閱卷員從整體角度評ESL學(xué)生作文時,他們只重視語言的使用,這恰恰是ESL學(xué)生的弱點(diǎn)。然而,同樣的閱卷員用分析方法評閱同一些ESL的作文時,他們會驚奇地發(fā)現(xiàn)這些作文的內(nèi)容和結(jié)構(gòu)是非常有說服力的。
最后,在不同類型和質(zhì)量的ESL作文評估中,不同的閱卷員可能使用不同的標(biāo)準(zhǔn)。Weigleetal發(fā)現(xiàn)不同學(xué)科的教授往往使用不同的標(biāo)準(zhǔn)評價ESL作文。例如,ESL和英語系的閱卷員經(jīng)常認(rèn)為語法是話題作文和基于閱讀材料的作文不及格的最重要因素。這個研究結(jié)果表明ESL學(xué)生可能因?yàn)樵谠掝}作文里較差的語言能力而得低分。相反,心理學(xué)專業(yè)的閱卷員認(rèn)為內(nèi)容是話題作文和基于文本題材的作文評價的主要因素。同樣,Sweedler-Brown發(fā)現(xiàn)沒有受培訓(xùn)的閱卷員強(qiáng)調(diào)作文的語言特征勝過作文的修辭特征。
綜上所述,文章的風(fēng)格、語言的運(yùn)用、內(nèi)容、詞匯和句法能力都是閱卷員評分時關(guān)注的要點(diǎn)。當(dāng)然閱卷員的語言背景,學(xué)科、觀念和期望、職業(yè)經(jīng)驗(yàn)、對錯誤的容忍和閱卷員的培訓(xùn)、寫作任務(wù)的類型和難度、閱卷員和任務(wù)之間的互動也影響ESL寫作的評價,由于這些因素使得ESL作文在某種程度上沒有公平地得到應(yīng)得的分?jǐn)?shù)。
通過分析影響ESL作文評分的準(zhǔn)確性、信度和效度等因素,筆者認(rèn)為ESL學(xué)生應(yīng)該從中汲取經(jīng)驗(yàn),更多地了解寫作評價標(biāo)準(zhǔn)和閱卷員的評分特點(diǎn),按照合適的寫作標(biāo)準(zhǔn)提高自己的寫作能力。教師應(yīng)該懂得如何教授英文寫作課程,使學(xué)生在寫作中懂得如何使用語言(語法結(jié)構(gòu)、句法和詞匯);讓學(xué)生了解北美教師在寫作評分時的關(guān)注點(diǎn)所在,即是重視運(yùn)用充足的事實(shí)、例證、數(shù)據(jù)和理由對論點(diǎn)展開合理的論述,只有這樣才能在寫作中獲得高分,尤其是正在北美讀書的中國學(xué)生和即將出國讀書的學(xué)生更應(yīng)該懂得西方文化背景下的ESL教師對華人學(xué)生的寫作期待什么。隨著ESL人數(shù)在北美學(xué)校里不斷增加,探討對學(xué)生寫作評價有影響的這些因素,確保對他們寫作評分的公平是十分重要的。
參考文獻(xiàn)
[1] Bachman,L.(2000).Modem language testingat the tum of the century:Assuring that what we countcounm.Language Testing,17(1),1-42.
[2] Cumming,A.(1990a).Application of contrastlve rhetoric in advanced ESL。thwriting.Paper presented at the 24 Annual TESOL Conference,San Francisco,CA.
(責(zé)任編輯劉永慶)