楊 洪, 潘崇堃
(北京化工大學(xué) 文法學(xué)院, 北京 100029)
英語寫作教學(xué)中的反饋與評價受到學(xué)術(shù)界和一線教師持續(xù)關(guān)注。教師評價由于其權(quán)威性常被賦予重要角色,但單一的教師評價,特別是終結(jié)性教師評價已無法滿足形成性評價和促學(xué)評價等評價理論對教學(xué)實(shí)踐的要求。因此,符合形成性評價理念的過程教學(xué)法已成為英語寫作教學(xué)的主流。作為過程教學(xué)法的重要環(huán)節(jié),同伴評價一直是研究熱點(diǎn)。同伴評價為學(xué)生提供就近發(fā)展區(qū),促進(jìn)學(xué)生在多方面提升自己,包括寫作水平、讀者意識、思辨能力。隨著教育技術(shù)的進(jìn)步和應(yīng)用,特別是寫作自動評價系統(tǒng)AWE(Automatic Writing Evaluation)的發(fā)展,機(jī)器評價憑借高效性已融入越來越多的寫作課堂。不同于教師評價、同伴評價、機(jī)器評價等他者評價,自我評價是一種相對主動的評價方式,能激發(fā)學(xué)生對學(xué)習(xí)過程和學(xué)習(xí)成果的反思,從而引發(fā)研究者濃厚興趣。為實(shí)現(xiàn)評價促學(xué)效果最大化,一些學(xué)者開始嘗試在寫作課堂構(gòu)建多元評價體系,把教師評價、同伴評價、機(jī)器評價和自我評價融入其中。作為學(xué)習(xí)主體,學(xué)生對多元評價體系的認(rèn)知和情感對評價體系的實(shí)施效果必然會產(chǎn)生重要影響,值得深入研究。
機(jī)器評價往往依靠寫作自動評價系統(tǒng)完成。寫作自動評價系統(tǒng)是一種基于網(wǎng)絡(luò)平臺的教育技術(shù),其主要功能是對作文進(jìn)行評價和打分。在國內(nèi)為數(shù)不多的寫作自動評價系統(tǒng)中,中國外語教育研究中心和外語教學(xué)與研究出版社推出的iWrite英語寫作教學(xué)與評閱系統(tǒng)得到了業(yè)界的認(rèn)可。實(shí)證研究發(fā)現(xiàn),iWrite的信度和效度可以媲美人工閱卷[1-2],已經(jīng)達(dá)到可推廣水平,可以在考試及日常寫作教學(xué)中使用[3]。對寫作自動評價系統(tǒng)的應(yīng)用研究發(fā)現(xiàn),iWrite在提升學(xué)生學(xué)習(xí)主體性和自主學(xué)習(xí)方面發(fā)揮了重要作用[4]。
自我評價基于建構(gòu)主義、自主學(xué)習(xí)等理論,體現(xiàn)了從總結(jié)性評價到形成性評價的轉(zhuǎn)變,反映以評促學(xué)的學(xué)習(xí)評價理念。在評價過程中,學(xué)生依據(jù)學(xué)習(xí)目標(biāo)或標(biāo)準(zhǔn)對學(xué)習(xí)過程和學(xué)習(xí)成果進(jìn)行反思和評價。其目的并不是要證明學(xué)習(xí)者對某一科目的掌握情況,而是收集足夠的關(guān)于自我學(xué)習(xí)方面的知識、技能、信念、動機(jī)、目標(biāo)、策略、效果等信息,利用這些信息,找出最適合自己的學(xué)習(xí)方式,提高學(xué)習(xí)能力[5]。在寫作教學(xué)實(shí)踐中,自我評價常常采用反思日志、評價表等形式。學(xué)生根據(jù)事先制定的寫作要求和標(biāo)準(zhǔn)找出存在的優(yōu)缺點(diǎn),強(qiáng)化對寫作標(biāo)準(zhǔn)的認(rèn)識和理解,并對作文進(jìn)行相應(yīng)修改。
多項(xiàng)研究表明,自我評價在英語寫作學(xué)習(xí)中產(chǎn)生了積極影響。首先,自我評價有助于提高學(xué)生對寫作技巧的意識,加深學(xué)生對寫作任務(wù)的理解[6],提高學(xué)生寫作能力和綜合英語水平[7]。其次,自我評價有助于培養(yǎng)學(xué)生的元認(rèn)知能力,幫助學(xué)生明確寫作發(fā)展階段[8],促進(jìn)自主學(xué)習(xí)能力的發(fā)展。最后,相對于教師評價,自我評價大大減少了評價給學(xué)生造成的壓迫感[9],能起到促進(jìn)自我效能提升的作用。
鑒于機(jī)器評價和自我評價的促學(xué)屬性,一些學(xué)者開始嘗試將這類評價融入寫作教學(xué)。例如:高滿滿等[10]以促學(xué)評價理論為指導(dǎo),將多元評價引入寫作課程。其課程形成性評價包括機(jī)器評價、學(xué)生互評、教師評價及自我評價,權(quán)重分別為10%、10%、50%和30%。不過對于學(xué)生如何看待多元評價,特別是學(xué)生是否接受各類型評價的權(quán)重,文章中并未詳述。作為學(xué)習(xí)主體,學(xué)生對教學(xué)活動的認(rèn)知和情感往往直接影響其成效,也可為教學(xué)效果進(jìn)一步提升提供思路,需認(rèn)真對待。此外,多元評價是否適用于其他英語課程的寫作環(huán)節(jié),也值得進(jìn)一步探究。
本研究試圖從學(xué)生視角探討英語寫作多元評價在非寫作課的接受度,回答下列兩個問題:①對于非寫作課采用寫作多元評價,學(xué)生的接受度如何;②有哪些因素影響學(xué)生對寫作多元評價的接受度。
研究對象為北京市某理工院校英語專業(yè)77名大一學(xué)生和76名大三學(xué)生,共153人。該專業(yè)大一學(xué)生的《綜合英語》和大三學(xué)生的《高級英語閱讀》為綜合課程,教學(xué)大綱均包含寫作訓(xùn)練,寫作成績占課程總成績的5%~10%。經(jīng)授課教師同意,研究人員針對這兩門課開展了寫作多元評價。
參與研究項(xiàng)目教學(xué)工作的有三名教師,均擁有超過10年的英語教學(xué)經(jīng)歷,在項(xiàng)目初期小組焦點(diǎn)訪談中均表示對多元評價的支持。教師A和教師B講授《綜合英語》,教師C講授《高級英語閱讀》。在他們看來,機(jī)器評價能給學(xué)生作文提供及時反饋,替代教師提供比較科學(xué)合理的反饋和分?jǐn)?shù),大大降低課程作業(yè)批改量。同時,采用自動評閱系統(tǒng)也可緩解既想給學(xué)生創(chuàng)造更多寫作訓(xùn)練機(jī)會,又怕無法完成批閱、及時反饋的狀況。學(xué)生自我評價與機(jī)器評價是互補(bǔ)關(guān)系,這種主觀評價結(jié)合客觀評價的方式更全面。自我評價也能幫助學(xué)生更好地了解優(yōu)秀作文標(biāo)準(zhǔn)。三位教師均不認(rèn)同加入同伴評價,認(rèn)為在現(xiàn)有作業(yè)量基礎(chǔ)上增加比自我評價更加費(fèi)時費(fèi)力的同伴評價可能會引起學(xué)生的反感,影響多元評價效果。至于各類評價類型的比重,三名教師同意將機(jī)器評價和自我評價分別設(shè)定為70%和30%,其主要原因在于機(jī)器評價的相對客觀性和自我評價的相對主觀性和功利心。
按照研究計(jì)劃,每結(jié)束一個學(xué)習(xí)單元,授課教師布置一次命題作文,學(xué)生在提交作文終稿前需自行完成機(jī)器評價和自我評價。機(jī)器評價由學(xué)生在iWrite 2.0英語寫作與評閱系統(tǒng)上完成。在作文提交時間截止前,學(xué)生在iWrite上進(jìn)行多次提交,完成評價與修改,作文最終成績?yōu)樗刑峤话姹局凶罡叻?。自我評價是學(xué)生對終稿的評價,由學(xué)生在學(xué)校在線學(xué)習(xí)平臺上根據(jù)自我評價表完成。自我評價表基于Andrade等編制的評價表[11]進(jìn)行了適當(dāng)調(diào)整,涉及內(nèi)容、語言和格式各方面。學(xué)生根據(jù)每項(xiàng)標(biāo)準(zhǔn)描述對自己的作文完成情況進(jìn)行打分。
本研究為定量和定性相結(jié)合的混合式研究。定量研究以問卷調(diào)查為主,旨在發(fā)現(xiàn)研究對象對寫作多元評價的接受程度。定性研究獲取研究對象反思日志文本,通過文本分析得出研究對象對寫作多元評價的接受程度,其結(jié)果可與問卷調(diào)查結(jié)果相互印證,同時挖掘影響接受度的潛在因素。
調(diào)查問卷旨在發(fā)現(xiàn)研究對象對非寫作課程寫作多元評價體系的認(rèn)識和態(tài)度。調(diào)查問卷包含三部分:調(diào)查對象個人信息、多元評價體系接受度、各類型評價權(quán)重接受度與理想占比。其中,多元評價體系接受度包含三個問題:分別調(diào)查學(xué)生對現(xiàn)有多元評價體系、機(jī)器評價、同伴評價的接受度。各類型評價權(quán)重接受度與理想占比包含如下問題:分別了解學(xué)生對現(xiàn)有評價體系中兩種評價類型權(quán)重的總體接受度,對現(xiàn)有評價體系中機(jī)器評價占比的意見及其理想占比,對現(xiàn)有評價體系中自我評價占比的意見及其理想占比,對現(xiàn)有評價體系中增加同伴評價的意愿及其理想占比。調(diào)查問卷大部分問題采用李克特五級量表,要求研究對象根據(jù)所給陳述作出判斷選擇,1表示完全不同意,5表示完全同意。
調(diào)查問卷在學(xué)生完成第三次寫作任務(wù)后通過在線問卷平臺發(fā)布,共回收問卷128份,回收率為83.7%?;厥諉柧砗?問卷數(shù)據(jù)先經(jīng)過在線問卷平臺完成描述性統(tǒng)計(jì)分析,然后使用SPSS 20.0進(jìn)行推斷性統(tǒng)計(jì)分析,借以探討學(xué)生學(xué)習(xí)經(jīng)歷和寫作水平對多元評價接受度的影響。
反思日志由研究對象在完成第三次寫作任務(wù)后,通過在線學(xué)習(xí)平臺自愿提交。要求研究對象回顧經(jīng)歷的三次機(jī)器評價和自我評價,并如實(shí)匯報對多元評價的認(rèn)識與感受,最終收到反思日志41份。獲得反思日志文本后,兩名研究人員分別進(jìn)行初步文本分析。經(jīng)過反復(fù)閱讀反思日志文本、商討文本分析初步結(jié)果,提煉出多個一級編碼和二級編碼,最終合并成為五個三級編碼----主題編碼,包括多元評價體系總體評價、機(jī)器評分必要性、自我評分必要性、評價類型增加、iWrite使用問題。
調(diào)查問卷結(jié)果顯示,92%的學(xué)生對多元評價體系表示認(rèn)可或不排斥。41%的學(xué)生建議在現(xiàn)有評價體系中增加同伴評價,34%的學(xué)生反對增加,其他學(xué)生持中立態(tài)度。80%以上的學(xué)生認(rèn)為有必要或不排斥把機(jī)器評分和自我評分納入寫作成績。
問卷調(diào)查結(jié)果與反思日志分析結(jié)果基本一致。反思日志表明,98%的學(xué)生表示對多元評價體系認(rèn)可,98%的學(xué)生認(rèn)為有必要把機(jī)器評分納入寫作成績,66%的學(xué)生認(rèn)為有必要把自我評分納入寫作成績。關(guān)于是否增加評價類型的問題,超過一半的學(xué)生在反思日志中建議增加同伴評價,與問卷調(diào)查結(jié)果相當(dāng)。值得注意的是,關(guān)于增加評價類型的結(jié)果與研究項(xiàng)目參與教師的預(yù)期有一定差距。三位教師并不看好同伴評價,擔(dān)心增加學(xué)生作業(yè)量,但研究結(jié)果表明反對增加評價類型的學(xué)生只占少數(shù)。相對于同伴評價需付出的額外時間和精力,學(xué)生可能更看重反饋多樣性和真實(shí)讀者視角。
調(diào)查問卷結(jié)果顯示,62%的學(xué)生認(rèn)為多元評價體系中的iWrite評分和自我評分各自比重合理,31%的學(xué)生對各類型占比持中立態(tài)度。總體而言,大部分學(xué)生接受或不排斥當(dāng)前各類型評分的權(quán)重分配。
41%的學(xué)生認(rèn)為當(dāng)前iWrite評分占比(70%)偏高,iWrite評分理想占比平均值為60%。74%的學(xué)生對當(dāng)前自我評分占比(30%)無異議,自我評分理想占比平均值為32%,與當(dāng)前自我評分權(quán)重并無明顯差異。如果在現(xiàn)有多元評價體系中增加同伴評價,學(xué)生認(rèn)為iWrite評分理想權(quán)重平均值為46%,自我評分理想權(quán)重平均值為26%,同伴評分理想權(quán)重平均值為16%。由此可見,學(xué)生最認(rèn)可iWrite評價,其次是自我評價,最后是同伴評價。
(1) 接受多元評價的主要原因。根據(jù)反思日志,對多元評價的認(rèn)可主要源于評價體系在公正性、自主學(xué)習(xí)、客觀高效、自我效能等方面的綜合優(yōu)勢。不少學(xué)生認(rèn)為多元評價融合客觀評價和主觀評價,評價結(jié)果比較公正。例如:學(xué)生S1表示,“這兩種評價方式相結(jié)合的評價模式較單一評價來講,較為客觀公正……若使用單一的iWrite系統(tǒng)評價,則評價模式過于客觀、死板,機(jī)械的評分事實(shí)上并不能反映出學(xué)生所投入的時間精力及用心程度。”分開來看,學(xué)生認(rèn)為機(jī)器評價能夠增加課后寫作學(xué)習(xí)機(jī)會,促進(jìn)自主學(xué)習(xí);iWrite知名度高、打分公平、效率高;機(jī)器評價是發(fā)展趨勢,應(yīng)該順應(yīng)這一潮流。
學(xué)生S2: “對于我們平時鍛煉寫作有一個更直接方便的途徑,因?yàn)槌藢懽髡n之外,好像尋求別人的評價和幫助的途徑很少?!?/p>
學(xué)生S3: “系統(tǒng)評價比較客觀,對待每一個同學(xué)都是以一樣的標(biāo)準(zhǔn),這樣有利于評分的公平?!?/p>
學(xué)生S4: “隨著科技的不斷進(jìn)步,很多官方考試都由人評變成了機(jī)評,機(jī)評將成為一種時代趨勢?!?/p>
即使在機(jī)器評價出現(xiàn)誤差時,不少學(xué)生仍然抓住了自主學(xué)習(xí)機(jī)會。雖然有個別學(xué)生為了迎合機(jī)器反饋以提高作文分?jǐn)?shù),但更多的學(xué)生對于機(jī)器反饋并未全盤接受,而是以批判的眼光,通過查閱字典等參考資料驗(yàn)證機(jī)器反饋的合理性。學(xué)生S5就表現(xiàn)出較好的批判意識,他表示,“我就相應(yīng)問題通過字典和其他途徑進(jìn)行查證。在確認(rèn)自己表達(dá)無誤后我選擇對iWrite系統(tǒng)提出的意見置之不理?!?/p>
對于自我評價,除了督促反思、促進(jìn)自主學(xué)習(xí)的作用,學(xué)生還強(qiáng)調(diào)自我評分能激發(fā)責(zé)任感,體現(xiàn)自我肯定,彌補(bǔ)機(jī)器評分的不足。
學(xué)生S6: “自我評價也讓從多維度進(jìn)行自我反思成為可能。學(xué)生可以看到自己哪里存在不足,下次可以進(jìn)行改進(jìn)?!?/p>
學(xué)生S7: “將自我評分納入最終成績會給學(xué)生帶來一種責(zé)任感與使命感,因?yàn)檫@時,學(xué)生要開始以某種特定的標(biāo)準(zhǔn)來客觀地看待和衡量自己的作品?!?/p>
學(xué)生S8: “機(jī)器評分比較死板……對那些結(jié)構(gòu)新穎且優(yōu)秀的文章可能會產(chǎn)生誤判,給出一個低于學(xué)生們預(yù)期的分?jǐn)?shù)。增加自我評價可以彌補(bǔ)學(xué)生心理的落差?!?/p>
學(xué)生S9: “這是學(xué)生基于一定客觀事實(shí)給出的自我評價,是學(xué)生對自己認(rèn)可度的一個體現(xiàn)?!?/p>
由此可見,學(xué)生清楚地認(rèn)識到自我評價可以對學(xué)習(xí)投入進(jìn)行評價、提升自我效能。自我評價是學(xué)生的自然訴求,學(xué)生學(xué)習(xí)的動力和意義不僅在于知識的增長和智慧的錘煉,更在于通過有效的學(xué)習(xí)發(fā)現(xiàn)自我、評價自我、強(qiáng)化自我[12]。
從上述研究結(jié)果也可發(fā)現(xiàn),無論是機(jī)器評價還是自我評價,學(xué)生都能從中抓住評價提供的自主學(xué)習(xí)機(jī)會。這一發(fā)現(xiàn)也印證了前人的研究結(jié)果。在對印度尼西亞學(xué)生的一項(xiàng)研究中發(fā)現(xiàn),自我評價讓學(xué)生清楚認(rèn)識到寫作標(biāo)準(zhǔn),學(xué)會如何獨(dú)立完成作文修改,養(yǎng)成學(xué)習(xí)責(zé)任感,進(jìn)而更加積極主動地投入寫作學(xué)習(xí)[13]。
另外,學(xué)生認(rèn)為增加同伴評價能夠更好地發(fā)揮多元評價的作用。同伴評價可以增加反饋視角,更重要的是同伴評價能提供真實(shí)的讀者視角。如學(xué)生S10所說:“作文是非常主觀的一個作品,雖然機(jī)器評價確實(shí)有它的評分標(biāo)準(zhǔn),但作文面向的是讀者,而不是機(jī)器。如果我的作文是給機(jī)器看的,我會喪失一點(diǎn)寫作文的熱情?!?/p>
(2) 質(zhì)疑多元評價的主要原因。盡管學(xué)生對多元評價的總體接受度比較高,但也存在質(zhì)疑。反思日志顯示,他們的質(zhì)疑并非針對多元評價這一概念,而是針對構(gòu)成多元評價體系的機(jī)器評價和自我評價在實(shí)操層面的問題。具體而言,學(xué)生認(rèn)為機(jī)器評價在評價準(zhǔn)確性、針對性等方面還存在不足,自我評價的問題主要體現(xiàn)在主觀性、功利心、評價表等方面。
首先,機(jī)器評價存在評語籠統(tǒng)、缺乏針對性的問題。學(xué)生S11表示,“系統(tǒng)評語會顯示語句不夠流暢,但是卻沒有給出任何修改意見。這種只說你寫得不好,卻又不告訴怎么提升的建議是極其不負(fù)責(zé)任的。”類似的機(jī)器評價恐怕會大大影響學(xué)生對寫作任務(wù)的行為投入和情感投入。正如學(xué)生S12所說:“如果我不能收獲評價者及時、用心、有價值的反饋,我完成這項(xiàng)任務(wù)的熱情與擬投入的時間、精力都會隨之下降?!?/p>
機(jī)器評價更嚴(yán)重的問題是錯誤的反饋意見,影響機(jī)器評價的可信度。46%的學(xué)生反映機(jī)器評價脫離語境,提供錯誤的反饋意見,有時候錯誤還比較明顯。例如:學(xué)生S13在使用iWrite過程中發(fā)現(xiàn),“機(jī)器批改時經(jīng)?!?dāng)嗾氯×x’。”iWrite對該學(xué)生作文某處的反饋是介詞錯用,指出“of建議改為for……for good表示‘永久地,永遠(yuǎn)地’”。但在學(xué)生作文中,“making them extraordinary candidates of good husbands”這個短語中的“of good”跟“永久地,永遠(yuǎn)地”語義不符,機(jī)器評價實(shí)為誤判。
其次,機(jī)器評分不夠準(zhǔn)確,一個主要原因是機(jī)器評分標(biāo)準(zhǔn)失衡,詞匯、語法權(quán)重過高。學(xué)生S14表示,“iWrite系統(tǒng)對于語法簡單但內(nèi)容深刻的文章較不友好,評分占比過于注重結(jié)構(gòu)、長短等,對于內(nèi)容的思辨性、深刻性考慮較少?!?學(xué)生S15也反映了相似感受,“看過一些其他同學(xué)的文章,有道翻譯得挺明顯的,但是語法錯誤很少,分?jǐn)?shù)反而很高,對于真正寫的有思想的文章,分?jǐn)?shù)卻沒有傾斜?!?/p>
學(xué)生對自我評價的質(zhì)疑可歸納為主觀和客觀兩個層面。主觀層面主要是對評價態(tài)度和評價能力兩方面的質(zhì)疑。有些學(xué)生對自己的評價能力持懷疑態(tài)度,而更多學(xué)生指出評價主觀性和功利心的負(fù)面影響。
學(xué)生S16: “以我為例,我并不覺得自己有能力評判一篇文章的好壞,也看不出其中的區(qū)別。”
學(xué)生S17: “不同的學(xué)生對優(yōu)秀、良好和一般的標(biāo)準(zhǔn)認(rèn)定也是不同的,因此自我評價有時候也是有點(diǎn)主觀了。”
學(xué)生S18: “為了追求評分,同學(xué)們有盲打滿分的傾向,這使得自評這一個環(huán)節(jié)變了味。”
在客觀條件層面,自我評價還存在一些問題。有的學(xué)生反映,評價表有些標(biāo)準(zhǔn)的描述不夠清楚;有的學(xué)生反映,自己不能完全理解評價標(biāo)準(zhǔn)。例如:學(xué)生S19表示,“怎樣才算是有好的連貫性,詞匯怎樣才算使用恰當(dāng)……這些問題僅靠自我評價很難做到客觀?!?/p>
學(xué)生提出的上述自評問題應(yīng)得到教師的充分重視。關(guān)于自評信心問題,教師可在自我評價開始前通過培訓(xùn)等形式降低學(xué)生的焦慮感,增強(qiáng)自評熟悉度,逐步提升學(xué)生自信心。針對評價表標(biāo)準(zhǔn)描述的問題,教師可以通過課堂講解的方式讓學(xué)生熟悉評價表的每一項(xiàng)標(biāo)準(zhǔn)描述;帶領(lǐng)學(xué)生一起依照評價表討論多篇學(xué)生習(xí)作,幫助學(xué)生積累評價經(jīng)驗(yàn)。教師還可嘗試讓學(xué)生加入評價標(biāo)準(zhǔn)的制定,形成大家都理解和認(rèn)可的評價標(biāo)準(zhǔn)[14]。研究發(fā)現(xiàn),學(xué)生不僅愿意參與到評價標(biāo)準(zhǔn)制定中,而且樂于把此標(biāo)準(zhǔn)應(yīng)用到自我評價中[15]。最后,為抵消評價主觀性和功利心導(dǎo)致的負(fù)面影響,可增加書面反思環(huán)節(jié),或用書面反思替換自評打分。教師根據(jù)反思內(nèi)容的用心程度和論述充分性進(jìn)行打分。
(3) 學(xué)習(xí)經(jīng)歷和寫作水平對多元評價接受度的影響。研究對象所在專業(yè)于大二開設(shè)了專門的英文寫作課,采用多稿制、多元評價,給予學(xué)生系統(tǒng)化寫作訓(xùn)練和指導(dǎo)。參與本研究的大三學(xué)生已修過寫作課,而大一學(xué)生還未選修該課程。大三學(xué)生在英文寫作課上的體驗(yàn)可能會影響他們對非寫作課多元評價的感受。為探究兩組學(xué)生英語寫作學(xué)習(xí)經(jīng)歷和寫作水平對多元評價接收度的影響,本研究對相關(guān)問卷結(jié)果進(jìn)行了推斷性統(tǒng)計(jì)分析。
大一學(xué)生和大三學(xué)生多元評價接受度兩組數(shù)據(jù)為非正態(tài)分布,因此,選擇非參數(shù)檢驗(yàn)方法“Mann-Whitney U”以考察兩個年級對多元評價的接受度是否存在顯著差異。檢驗(yàn)結(jié)果表明,p值為0.84,說明兩組數(shù)據(jù)之間的差異有84%的可能性由抽樣誤差導(dǎo)致,即大一學(xué)生和大三學(xué)生在多元評價接受度方面不存在顯著差異。
研究對象在回答調(diào)查問卷時,對自己的英語寫作水平進(jìn)行了評價,分為低、中、高三組。三組接受度數(shù)據(jù)均為非正態(tài)分布,因此,選擇非參數(shù)檢驗(yàn)方法“Kruskal-Wallis H”以考察不同寫作水平的三組對多元評價的接受度是否存在顯著差異。檢驗(yàn)結(jié)果表明,p值為0.81,說明三組數(shù)據(jù)之間的差異有81%的可能性由抽樣誤差導(dǎo)致,即不同寫作水平的三組在多元評價接受度方面不存在顯著差異。
由此可見,不管學(xué)生是否有過多元評價的學(xué)習(xí)經(jīng)歷,對這種評價體系的接受度都比較高。在本研究中,寫作水平由研究對象自己評判,并未參考他們的寫作考試成績,評判結(jié)果不一定符合實(shí)際情況。雖然本研究發(fā)現(xiàn)研究對象寫作水平自評等級對多元評價接受度并無顯著影響,但學(xué)生寫作水平對多元評價接受度的影響仍需進(jìn)一步驗(yàn)證。
通過分析調(diào)查問卷和反思日志,發(fā)現(xiàn)大部分研究對象對機(jī)器評價和自我評價構(gòu)成的多元評價體系表示認(rèn)可。建議增加其他評價類型的人數(shù)多于反對的人數(shù);研究對象同意把機(jī)器評分和自我評分納入寫作成績,認(rèn)為機(jī)器評分的比重應(yīng)大于自我評分。研究對象還認(rèn)為,多元評價具備公正、客觀、高效等特點(diǎn),能夠提供多元讀者視角、促進(jìn)自主學(xué)習(xí)和提升自我效能。同時,研究對象表達(dá)了對機(jī)器評價反饋效用等方面的質(zhì)疑,也指出評價表設(shè)計(jì)等客觀條件及學(xué)生主觀性和功利心等主觀原因引發(fā)的自我評價問題。因此,當(dāng)前的多元評價體系還存在較大提升空間。此外,研究還發(fā)現(xiàn)研究對象過去是否參與多元評價及寫作水平高低對多元評價體系接受度并無顯著影響。
研究發(fā)現(xiàn)對非寫作課寫作多元評價體系構(gòu)建具有以下幾點(diǎn)啟示。首先,多元評價體系可在不同年級實(shí)施,應(yīng)盡可能涵蓋各種評價類型,以發(fā)揮各類評價的作用。每一種評價類型的設(shè)置都應(yīng)該遵循促學(xué)原則。其次,雖然自動評價系統(tǒng)近些年發(fā)展迅猛,但仍存在不可忽視的技術(shù)問題。教師在課堂應(yīng)用機(jī)器評價時仍需謹(jǐn)慎,不能因噎廢食,亦不能盲目信任;應(yīng)鼓勵學(xué)生利用好機(jī)器評價失誤時的自主學(xué)習(xí)機(jī)會,培養(yǎng)批判思維,鞏固語言知識和寫作知識。再次,為避免自我評價的弊端,教師可在自我評價啟動前對學(xué)生進(jìn)行相關(guān)培訓(xùn),幫助學(xué)生樹立自評信心、熟悉評價標(biāo)準(zhǔn),也可鼓勵學(xué)生加入評價標(biāo)準(zhǔn)制定,亦可用反思日志替代評價表。最后,多元評價體系中各類評分權(quán)重可設(shè)置為“機(jī)器評價>自我評價>同伴評價”,還可以結(jié)合學(xué)生認(rèn)知、情感和學(xué)習(xí)經(jīng)歷等實(shí)際情況進(jìn)行靈活調(diào)整。