王帆
摘? 要:在第二語(yǔ)言寫作考試中,寫作評(píng)分是研究者們頗為關(guān)心的問題。其影響因素包括主客觀兩個(gè)方面,涉及命題式作文本身存在的誤差問題和評(píng)分標(biāo)準(zhǔn)問題。提高第二語(yǔ)言寫作評(píng)分的客觀化,首先要提高評(píng)分標(biāo)準(zhǔn)的科學(xué)性和合理性,其次要盡量避免或最大程度降低評(píng)分員效應(yīng)。機(jī)改作文能夠較好地解決這個(gè)問題,與此相伴的則是如何量化指標(biāo)。因此,評(píng)分標(biāo)準(zhǔn)不僅應(yīng)該與寫作和寫作水平相對(duì)應(yīng),還應(yīng)該盡量提出更多客觀的可量化標(biāo)準(zhǔn)。
關(guān)鍵詞:寫作評(píng)分;客觀化;詞匯影響
一、問題的提出
寫作屬于學(xué)習(xí)者的產(chǎn)出性技能。在第二語(yǔ)言寫作考試中,評(píng)分問題是研究者們頗為關(guān)心的。影響寫作評(píng)分結(jié)果的因素主要有以下兩個(gè)方面:
一是命題式作文本身存在的誤差問題。首先是題目取樣誤差問題,不同考生由于個(gè)人背景和知識(shí)結(jié)構(gòu)等方面的不同,對(duì)同一話題的熟悉度、興趣和知識(shí)背景等都存在著較大的差異,而這種差異有時(shí)會(huì)導(dǎo)致測(cè)試的內(nèi)容發(fā)生改變,即測(cè)試的真正內(nèi)容脫離了對(duì)學(xué)生語(yǔ)言能力測(cè)試的目的。其次是評(píng)分人的誤差問題,該誤差產(chǎn)生的主要原因是由于評(píng)分人個(gè)人偏好及態(tài)度而帶來的測(cè)試誤差。
二是評(píng)分標(biāo)準(zhǔn)的問題,包括評(píng)分標(biāo)準(zhǔn)的制定和使用兩個(gè)方面。在主觀性題型中,評(píng)分者需要根據(jù)一定的評(píng)分標(biāo)準(zhǔn)進(jìn)行評(píng)分,一個(gè)科學(xué)合理、具有可操作性的評(píng)分標(biāo)準(zhǔn)是寫作評(píng)分能夠達(dá)到較高信度的首要保障,也是評(píng)分工作的指南。評(píng)分標(biāo)準(zhǔn)若是制定不清楚就會(huì)導(dǎo)致評(píng)分員的主觀區(qū)間被放大,評(píng)分工作也會(huì)因此受到影響。同時(shí),評(píng)分員對(duì)評(píng)分標(biāo)準(zhǔn)的把握也是影響寫作評(píng)分結(jié)果的主要因素。因此,從評(píng)分標(biāo)準(zhǔn)上來說,寫作的評(píng)分標(biāo)準(zhǔn)的制定需要依據(jù)一定的原則以確保其科學(xué)性,標(biāo)準(zhǔn)的使用則需要經(jīng)過一定的培訓(xùn),以最大限度地減少寫作評(píng)分中的主觀性。如用第一語(yǔ)言進(jìn)行寫作的學(xué)習(xí)者與用第二語(yǔ)言寫作的學(xué)習(xí)者是不能也不適合用同樣的標(biāo)準(zhǔn)進(jìn)行評(píng)分的,而未經(jīng)培訓(xùn)的評(píng)分人員對(duì)評(píng)分標(biāo)準(zhǔn)的理解也會(huì)因個(gè)體因素而不同。
綜上可知,影響寫作評(píng)分結(jié)果的因素包括主客觀兩個(gè)方面。寫作本身就是一種主觀型試題,完全抹去命題的誤差問題和評(píng)分過程中評(píng)分員的主觀性是不現(xiàn)實(shí)的,但通過制定更加科學(xué)合理的評(píng)分標(biāo)準(zhǔn),挖掘評(píng)分標(biāo)準(zhǔn)中客觀化的可量化因素則可以進(jìn)一步提高寫作評(píng)分的信度。
漢語(yǔ)寫作評(píng)分的客觀化并非完全排斥寫作過程中的主觀性,而是要最大限度地減少寫作評(píng)分的隨意性,這主要在于評(píng)分標(biāo)準(zhǔn)的制定和理解上。制定評(píng)分標(biāo)準(zhǔn)時(shí),要注意在關(guān)注測(cè)試目標(biāo)的基礎(chǔ)上,盡量選取可量化的指標(biāo),在描述上需具有較強(qiáng)的明確性和區(qū)別性,以確保該標(biāo)準(zhǔn)在實(shí)施中具有可操作性。寫作本身是一種產(chǎn)出性的交際,因此,評(píng)分標(biāo)準(zhǔn)應(yīng)以交際任務(wù)為準(zhǔn)繩,以便于評(píng)分員理解和操作為原則;在評(píng)分標(biāo)準(zhǔn)的把握上,應(yīng)當(dāng)以是否便于評(píng)分員理解為標(biāo)準(zhǔn),即評(píng)分標(biāo)準(zhǔn)的理解不應(yīng)該因人而異,而應(yīng)基本一致。
寫作評(píng)分的詞匯影響是對(duì)評(píng)分標(biāo)準(zhǔn)的量化指標(biāo)方面所做出的初步嘗試,主要是通過考察學(xué)生作文中所使用詞匯的數(shù)量及其所體現(xiàn)的詞匯水平與其最終成績(jī)之間的關(guān)系,對(duì)寫作評(píng)分的客觀化進(jìn)行一定的補(bǔ)充。在具體操作中,寫作評(píng)分的詞匯影響建立在評(píng)分員對(duì)詞匯的不自覺關(guān)注上。通過對(duì)寫作測(cè)試和寫作能力的探討,我們擬提出一套漢語(yǔ)作為第二語(yǔ)言寫作的評(píng)分標(biāo)準(zhǔn),并對(duì)該標(biāo)準(zhǔn)進(jìn)行實(shí)際操作檢驗(yàn),進(jìn)一步探究詞匯使用與寫作水平之間的關(guān)系,為寫作評(píng)分的客觀化提供新的思路。
二、客觀化評(píng)分標(biāo)準(zhǔn)的提出及詞匯影響
(一)寫作的理論定義
Hamp-Lyons & Kroll指出,“寫作是發(fā)生在一定情境下,完成某一特定目標(biāo),并要為預(yù)期讀者做出適當(dāng)調(diào)整的行為。”[1]李慶本認(rèn)為,“一般而言,學(xué)習(xí)一種非母語(yǔ)的語(yǔ)言,首先需要掌握這種語(yǔ)言一定數(shù)量的語(yǔ)音、詞匯和語(yǔ)句,然后才能運(yùn)用這些語(yǔ)言知識(shí)進(jìn)行交際。前者是基礎(chǔ),后者是提高?!盵2](272-276)作者指出,前者是語(yǔ)言能力,后者屬于言語(yǔ)能力,是用某種語(yǔ)言進(jìn)行交際的能力。由此可見,寫作是一種社會(huì)性交際活動(dòng),其基礎(chǔ)固然是在于對(duì)于語(yǔ)言要素的掌握,但更重要的應(yīng)該是完成特定的交際性任務(wù)。
(二)寫作水平的操作性定義
寫作測(cè)試的主要目的是考察應(yīng)試者的寫作能力,但對(duì)于寫作能力是什么,目前學(xué)界并沒有統(tǒng)一的結(jié)論[3]。在操作性定義上,體現(xiàn)寫作能力的寫作水平集中體現(xiàn)在不同的等級(jí)水平量表中。從目前有關(guān)第二語(yǔ)言寫作能力量表來看,它主要分為總體量表和分項(xiàng)量表兩種,每一量表之下又分為若干等級(jí)。在歐洲語(yǔ)言共同參考框架中,將寫作能力分為總體寫作能力、創(chuàng)造性的寫作能力、寫報(bào)告和作文的能力,對(duì)于每一個(gè)部分又采用“能夠做什么”的方式進(jìn)行描述[4]。美國(guó)外語(yǔ)教學(xué)委員會(huì)(ACTFL)大綱以語(yǔ)言的表達(dá)和交際任務(wù)為目的,將寫作能力劃分為四個(gè)等級(jí),四個(gè)等級(jí)之間依次以詞和短語(yǔ)的表達(dá)、句子表達(dá)、成段表達(dá)和不受拘束的篇章表達(dá)為區(qū)別性特征?!秶?guó)際漢語(yǔ)能力標(biāo)準(zhǔn)》則將寫作能力分為五個(gè)等級(jí),在每個(gè)等級(jí)中以詞、短語(yǔ)和篇章等為特征,以滿足不同場(chǎng)景的交際任務(wù)為目的進(jìn)行細(xì)致劃分?,F(xiàn)行HSK考試與國(guó)際漢語(yǔ)能力標(biāo)準(zhǔn)相對(duì)應(yīng),寫作部分大多圍繞交際任務(wù)開展,形成了話題式作文、材料式作文、縮寫、改寫等測(cè)試形式[5]??偟膩碚f,目前寫作能力等級(jí)量表普遍將寫作作為一種產(chǎn)出型技能對(duì)其進(jìn)行描述,不僅關(guān)注其語(yǔ)言要素,更關(guān)注其言語(yǔ)要素,并以運(yùn)用該語(yǔ)言進(jìn)行交際以解決實(shí)際問題為目的。不過,量表本身對(duì)每一等級(jí)的描述較為含糊,無法完全擺脫寫作評(píng)分過程中的主觀性影響。
在評(píng)分方式上,寫作能力的等級(jí)量表體現(xiàn)為綜合式和分項(xiàng)式兩種評(píng)分方式,即究竟是從整體寫作水平出發(fā)進(jìn)行評(píng)分,還是從寫作的不同表現(xiàn)方式出發(fā)進(jìn)行評(píng)分。一般來說,綜合式評(píng)分是評(píng)分員基于考生作文的整體印象進(jìn)行打分;分項(xiàng)式評(píng)分則是將寫作成績(jī)劃分為多個(gè)維度,并對(duì)每個(gè)維度下的具體內(nèi)容和權(quán)重進(jìn)行規(guī)定,評(píng)分者根據(jù)具體內(nèi)容進(jìn)行評(píng)分后,依據(jù)權(quán)重得出最終成績(jī)。總的來說,綜合式評(píng)分效率高,但分?jǐn)?shù)解釋性較弱;分項(xiàng)式評(píng)分信度高,但效率低,效度難以保證。因此,一般大型考試在寫作評(píng)分中會(huì)將二者有機(jī)結(jié)合,形成以綜合評(píng)分為主、分項(xiàng)評(píng)分為輔的評(píng)分方式,即對(duì)評(píng)分標(biāo)準(zhǔn)進(jìn)行分項(xiàng)描述,但不賦予每個(gè)分項(xiàng)具體權(quán)重與分值,要求評(píng)分員基于整體印象打分的同時(shí),充分考慮每一個(gè)分項(xiàng)的具體要求。
筆者認(rèn)為,寫作評(píng)分客觀化重在定義,首先是對(duì)于寫作的定義,即怎樣的寫作算是達(dá)到了掌握一門語(yǔ)言的要求;其次是對(duì)于寫作測(cè)量的定義,即什么樣的測(cè)量工具能夠測(cè)出學(xué)習(xí)者是真正的掌握了一門語(yǔ)言。因此,在評(píng)分標(biāo)準(zhǔn)上,筆者傾向于采取綜合式評(píng)分和分項(xiàng)式評(píng)分相結(jié)合的方法,既規(guī)定寫作評(píng)分中每個(gè)分項(xiàng)的具體內(nèi)容,又對(duì)每個(gè)分項(xiàng)賦予具體權(quán)重。同時(shí),評(píng)分員只需基于整體進(jìn)行評(píng)分,不需要對(duì)每個(gè)分項(xiàng)評(píng)分,使得評(píng)分標(biāo)準(zhǔn)在詳細(xì)化、集中化的同時(shí),不會(huì)過多加重評(píng)分任務(wù)負(fù)擔(dān)。
寫作評(píng)分標(biāo)準(zhǔn)確定后,需要進(jìn)一步考慮的是究竟哪些分項(xiàng)可以說明寫作水平,這是另外一個(gè)值得思考的問題??偟膩碚f,現(xiàn)行的分項(xiàng)式評(píng)分標(biāo)準(zhǔn)主要分為以下三種:首先是將評(píng)價(jià)內(nèi)容分為切題、內(nèi)容、語(yǔ)篇、語(yǔ)言要素和語(yǔ)用五個(gè)部分,忽略具體文本所存在的差異,對(duì)寫作交際性作用關(guān)注不夠,如GRE、SET、A-LEVEL等考試均屬于這種類型;其次是基于任務(wù)型的評(píng)價(jià),這種評(píng)價(jià)方式主要強(qiáng)調(diào)的是考生是否向特定讀者明確地傳達(dá)了所需傳達(dá)的信息,該評(píng)價(jià)方式立足于寫作的交際性,而不僅僅是將評(píng)價(jià)范圍局限在語(yǔ)言要素本身,如BEC、IELTS等寫作考試均采用這種評(píng)分方式;最后一種則是基于整體印象進(jìn)行評(píng)分,該評(píng)分方式是以綜合式為主、分項(xiàng)式為輔的測(cè)驗(yàn)方式,評(píng)分標(biāo)準(zhǔn)往往會(huì)對(duì)交際性、表達(dá)性、語(yǔ)言要素等多個(gè)角度進(jìn)行規(guī)定,但考生最終所得成績(jī)是評(píng)分員基于對(duì)作文的主觀性印象而給出的,現(xiàn)行HSK作文評(píng)分就是采用這種評(píng)分機(jī)制。
(三)客觀化評(píng)分標(biāo)準(zhǔn)及其權(quán)重
根據(jù)國(guó)內(nèi)外各項(xiàng)寫作的評(píng)分標(biāo)準(zhǔn)內(nèi)容及其權(quán)重,筆者擬采用準(zhǔn)確性、豐富性、流暢性、得體性、規(guī)范性,對(duì)漢語(yǔ)寫作的評(píng)分標(biāo)準(zhǔn)進(jìn)行衡量。具體如表1所示:
準(zhǔn)確性 15% 準(zhǔn)確性包含詞匯和語(yǔ)法兩個(gè)方面。其中,詞匯方面主要包括考生在具體使用過程中詞形是否正確,詞義使用是否合理;語(yǔ)法方面則主要指句式及語(yǔ)法點(diǎn)的使用是否符合語(yǔ)言規(guī)范。
豐富性 15% 豐富性包含詞匯和語(yǔ)法兩個(gè)方面。其中,詞匯方面主要包括考生在寫作中所使用詞匯對(duì)應(yīng)的HSK詞匯等級(jí)及詞匯量大小;語(yǔ)法方面主要包括考生所使用語(yǔ)法的豐富性和多樣性。
流暢性 40% 流暢性指考生所產(chǎn)出的語(yǔ)句及篇章整體上符合事理邏輯,前后銜接自然,條理清楚,層次分明。
得體性 20% 得體性主要是指考生所產(chǎn)出的語(yǔ)言內(nèi)容符合交際任務(wù)要求,與特定的社會(huì)文化和交際行為要求相一致,符合考試內(nèi)容所規(guī)定的交際話題及自身行文過程中所產(chǎn)生的語(yǔ)境。
規(guī)范性 10% 規(guī)范性主要是指考生所寫篇章符合文體要求,書寫格式規(guī)范,標(biāo)點(diǎn)符號(hào)使用得當(dāng)。
如前所述,寫作測(cè)試是對(duì)一門語(yǔ)言掌握程度的測(cè)試,也是對(duì)考生使用該語(yǔ)言完成交際任務(wù)的能力測(cè)試。因此,評(píng)分標(biāo)準(zhǔn)不僅要關(guān)注語(yǔ)言能力,更要關(guān)注言語(yǔ)能力,且重點(diǎn)應(yīng)放在對(duì)言語(yǔ)能力的測(cè)試上。方緒軍認(rèn)為,“對(duì)說和寫的技能測(cè)試有許多共性,兩者都需要以交際任務(wù)分析為前提,兩者通常涉及書寫和格式的規(guī)范性、語(yǔ)言使用的準(zhǔn)確性和豐富性、語(yǔ)言組織的條理性和連貫性、語(yǔ)言使用的靈活性和得體性以及書面表達(dá)的有效性等方面?!盵6](P131)其中,語(yǔ)言組織的條理性和連貫性與語(yǔ)言的流暢性息息相關(guān),語(yǔ)言使用流暢,必然要求邏輯上的條理性和連接上的連貫性;從一定程度上來說,語(yǔ)言使用的靈活性和得體性則是在面對(duì)具體交際環(huán)境和交際任務(wù)時(shí)產(chǎn)出適當(dāng)?shù)恼Z(yǔ)言,可以總體概括為語(yǔ)言使用的得體性。流暢性和得體性這兩個(gè)分項(xiàng)歸根究底是為了達(dá)到交際目的,實(shí)現(xiàn)書面表達(dá)的有效性。語(yǔ)言的準(zhǔn)確性和豐富性是從語(yǔ)言要素的角度出發(fā)的;語(yǔ)言的流暢性和得體性則是從言語(yǔ)要素出發(fā)的。同時(shí),由于寫作測(cè)試與聽力及閱讀測(cè)試不同,其本身對(duì)于考生所使用的文體及格式有一定要求,所以將規(guī)范性單獨(dú)列出。
在各項(xiàng)內(nèi)容的權(quán)重上,筆者考慮到寫作測(cè)試的目的是體現(xiàn)寫作能力,突出考生的言語(yǔ)能力,因此,在評(píng)分標(biāo)準(zhǔn)的制定過程中,優(yōu)先突出言語(yǔ)要素,其次考慮語(yǔ)言要素,再次考慮寫作特點(diǎn)。在突出寫作要求的流暢性,并對(duì)其得體性進(jìn)行關(guān)注的同時(shí),對(duì)寫作的準(zhǔn)確性和豐富性給予同等權(quán)重,并將寫作測(cè)試本身的特點(diǎn)納入考量。
三、實(shí)驗(yàn)方法、過程及結(jié)果
(一)實(shí)驗(yàn)方法
1.被試的樣本數(shù)量及分布
這次實(shí)驗(yàn)的樣本取自于上海交通大學(xué)人文學(xué)院高一年級(jí)與高二年級(jí)語(yǔ)言進(jìn)修生于2019年6月所進(jìn)行的期末寫作試卷,其中,高一年級(jí)試卷24份,高二年級(jí)試卷18份。
根據(jù)上海交通大學(xué)所制定的《語(yǔ)言生層級(jí)與HSK對(duì)應(yīng)情況》,可以得知受試學(xué)生的漢語(yǔ)水平能力。具體如表2所示:
2.試卷結(jié)構(gòu)
本次測(cè)試評(píng)采取百分制計(jì)分,高一年級(jí)與高二年級(jí)的作文均為話題式作文。其話題分布如表3所示:
3.實(shí)驗(yàn)方案
本次實(shí)驗(yàn)采取定量分析與定性分析相結(jié)合的方法。在實(shí)驗(yàn)前,研究人員根據(jù)評(píng)分標(biāo)準(zhǔn)對(duì)試卷進(jìn)行整理,初步將試卷分為優(yōu)秀、中等、一般三個(gè)等級(jí),并給出每個(gè)等級(jí)試卷中的標(biāo)桿試卷,即最能代表該水平的試卷。根據(jù)上文所提出的評(píng)分標(biāo)準(zhǔn),選取三名均為語(yǔ)言學(xué)背景并具有一定經(jīng)驗(yàn)的評(píng)分員,對(duì)他們統(tǒng)一進(jìn)行評(píng)分標(biāo)準(zhǔn)的培訓(xùn)。
培訓(xùn)結(jié)束后,為防止評(píng)分員個(gè)人主觀因素對(duì)實(shí)驗(yàn)結(jié)果造成偏差,要求評(píng)分員在一天之內(nèi)完成評(píng)分,并提交成績(jī)。為防止光環(huán)效應(yīng),兩周后,打亂實(shí)驗(yàn)材料順序,讓評(píng)分員根據(jù)考生作文中所使用的詞匯進(jìn)行單獨(dú)評(píng)分。這次評(píng)分不做具體要求,只需要評(píng)分員根據(jù)自己的把握給出詞匯成績(jī)。等到得出實(shí)驗(yàn)數(shù)據(jù)后,再與三位評(píng)分員分別進(jìn)行訪談,了解評(píng)分員在評(píng)分標(biāo)準(zhǔn)的具體實(shí)施過程中所出現(xiàn)的問題。
(二)評(píng)分員間信度檢驗(yàn)
為探究三名評(píng)分員對(duì)評(píng)分標(biāo)準(zhǔn)的把握是否一致,將三名評(píng)分員所給出的原始成績(jī)進(jìn)行等級(jí)轉(zhuǎn)換,使用肯德爾和諧系數(shù)對(duì)評(píng)分員間的信度進(jìn)行檢驗(yàn)。具體如表4所示:
從spss23.0檢驗(yàn)結(jié)果來看,其概率P小于0.05,由此可知學(xué)生試卷成績(jī)的平均值存在顯著差異,即W檢驗(yàn)的假設(shè)不成立;W協(xié)同系數(shù)為0.710,較接近于1,可見,三位評(píng)分員對(duì)評(píng)分標(biāo)準(zhǔn)的把握是較為一致的。
(三)詞匯與成績(jī)的關(guān)聯(lián)
為進(jìn)一步探討詞匯與作文評(píng)分之間的聯(lián)系,筆者采用皮爾遜相關(guān)系數(shù),分別對(duì)三位評(píng)分員各自給出的總成績(jī)與詞匯成績(jī)進(jìn)行分析,從而得到詞匯成績(jī)和總成績(jī)的相關(guān)性。具體如表5~表7所示:
從表5~表7可以看出,三位評(píng)分員的**.均在0.01級(jí)別(雙尾),這表明詞匯成績(jī)和總成績(jī)的相關(guān)性顯著。
(四)訪談結(jié)果
對(duì)三位評(píng)分員的訪談,可以歸結(jié)為三個(gè)方面:
1.三位評(píng)分員在第一次打分時(shí),均未單獨(dú)將學(xué)生的詞匯使用作為評(píng)分標(biāo)準(zhǔn)。
2.三位評(píng)分員在第二次單獨(dú)對(duì)詞匯進(jìn)行打分時(shí),所依據(jù)的主要標(biāo)準(zhǔn)是詞匯量、是否使用高級(jí)詞匯及詞匯使用是否正確,其中,評(píng)分員2表示自己特別關(guān)注詞語(yǔ)語(yǔ)法的使用。
3.有評(píng)分員認(rèn)為,本次評(píng)分標(biāo)準(zhǔn)在具體項(xiàng)目上,雖然都采用了客觀化標(biāo)準(zhǔn),但是在具體評(píng)分過程中,個(gè)人主觀判斷區(qū)域仍然較大,從而導(dǎo)致評(píng)分過程中出現(xiàn)部分難以把握的問題,進(jìn)而出現(xiàn)評(píng)分誤差。
四、討論
(一)客觀化評(píng)分標(biāo)準(zhǔn)的可行性
從三位評(píng)分員的成績(jī)數(shù)據(jù)與評(píng)分員間信度的檢驗(yàn)來看,肯德爾和諧系數(shù)達(dá)到了0.710,這說明評(píng)分員對(duì)評(píng)分標(biāo)準(zhǔn)的把握具有一定的一致性;同時(shí),其指數(shù)未達(dá)到0.90以上,這說明該評(píng)分仍然缺乏一定的客觀性。這可能是由兩個(gè)方面的原因所導(dǎo)致的:
第一,如果僅僅是從寫作測(cè)試目的和寫作水平出發(fā),來制定評(píng)分標(biāo)準(zhǔn)的話,就會(huì)缺乏一定的可量化的標(biāo)準(zhǔn)。在第二語(yǔ)言寫作領(lǐng)域內(nèi),從最早的以內(nèi)容、組織、詞匯、語(yǔ)言運(yùn)用、技巧等五個(gè)部分,到通過實(shí)證提出無錯(cuò)誤的T-unit個(gè)數(shù)、無錯(cuò)誤的T-unit所含的字?jǐn)?shù)、每個(gè)T-unit的錯(cuò)誤總數(shù)和總的錯(cuò)誤個(gè)數(shù)這四項(xiàng)可量化指標(biāo)來測(cè)量被試寫作能力,分項(xiàng)式評(píng)分亦經(jīng)歷了從主觀性較強(qiáng)到客觀化、可量化的發(fā)展過程[8],說明了作文評(píng)分的客觀化是具有一定可行性的。筆者雖然對(duì)所提出的評(píng)分標(biāo)準(zhǔn)進(jìn)行了規(guī)定與描述,并選取了相對(duì)易于量化的指標(biāo)作為分項(xiàng)式評(píng)分的依據(jù),不過,這一評(píng)分體系仍缺乏具體的量化標(biāo)準(zhǔn),導(dǎo)致評(píng)分員在具體評(píng)分過程中的主觀發(fā)揮空間略大。
第二,評(píng)分權(quán)重不夠細(xì)致,缺乏一定的實(shí)踐支撐。筆者雖然對(duì)所提出的評(píng)分標(biāo)準(zhǔn)進(jìn)行了一定說明,并對(duì)每一分項(xiàng)進(jìn)行了權(quán)重衡量,但這一權(quán)重大多是基于理論之上的主觀性劃分,缺乏實(shí)踐的反復(fù)驗(yàn)證和支撐。
總的來說,以本次實(shí)驗(yàn)結(jié)果為依據(jù),根據(jù)前人對(duì)于寫作評(píng)分客觀化的研究,對(duì)實(shí)驗(yàn)中各分項(xiàng)評(píng)分內(nèi)容及權(quán)重進(jìn)行調(diào)整,在語(yǔ)言要素和言語(yǔ)要素之間尋求平衡的同時(shí),加大可量化指標(biāo)的權(quán)重,盡可能減少評(píng)分員個(gè)人主觀區(qū)間是今后實(shí)驗(yàn)需要改進(jìn)的地方。
(二)詞匯與客觀化評(píng)分之間的關(guān)系
通過訪談,我們發(fā)現(xiàn),三位評(píng)分員均對(duì)詞匯給予了一定的關(guān)注。在量化分析中,三位評(píng)分員所給出的總成績(jī)和詞匯成績(jī)的相關(guān)性均達(dá)到顯著水平,這說明考生的詞匯水平對(duì)其作文整體成績(jī)具有較大的影響。彭星源等通過實(shí)驗(yàn)證明,基于詞匯的作文評(píng)分是一項(xiàng)有效的評(píng)分方式[8]。黃志娥等通過對(duì)1992—2005年HSK作文答卷的分析,認(rèn)為作文長(zhǎng)度、詞匯使用和成段表達(dá)三個(gè)特征與考生作文成績(jī)之間相關(guān)性較強(qiáng)[9]。由此可知,在漢語(yǔ)作為第二外語(yǔ)的寫作中,利用詞匯來預(yù)測(cè)考生作文成績(jī)是具有一定的可行性的。不過,選取哪些可量化的詞匯標(biāo)準(zhǔn),如何科學(xué)地制定相關(guān)標(biāo)準(zhǔn),以提高寫作評(píng)分的客觀化水平,是今后寫作評(píng)分研究中應(yīng)當(dāng)關(guān)注的內(nèi)容。
除詞匯水平外,是否還存在其他可量化的指標(biāo),以更好地提高寫作評(píng)分的客觀化?就目前的現(xiàn)狀來看,在以英語(yǔ)為第二外語(yǔ)的寫作中,存在一些機(jī)改作文的成功案例,如句酷批改網(wǎng)就是在基于語(yǔ)料庫(kù)的大背景下,對(duì)文本的各項(xiàng)內(nèi)容進(jìn)行量化,以突出寫作評(píng)分的客觀化。在漢語(yǔ)作為第二外語(yǔ)的寫作中,是否可以通過可量化的指標(biāo)來制定寫作評(píng)分標(biāo)準(zhǔn),這也是今后應(yīng)當(dāng)關(guān)注的方向。
寫作作為一項(xiàng)重要的產(chǎn)出型技能,反映著一個(gè)人語(yǔ)言習(xí)得水平的高低,就此而言,寫作評(píng)分的客觀化研究是具有深遠(yuǎn)意義和廣闊前景的。提高第二語(yǔ)言寫作評(píng)分的客觀化,首先要提高評(píng)分標(biāo)準(zhǔn)的科學(xué)性和合理性。從這一點(diǎn)上來說,尋求可量化的指標(biāo),研究它們與考生寫作能力之間的相關(guān)性,是一個(gè)很好的解決辦法。其次是評(píng)分員的問題,亦即如何降低或盡量避免評(píng)分員效應(yīng)的問題。筆者發(fā)現(xiàn),機(jī)改作文能夠較好地解決這一問題,但是與此相伴的問題仍然是量化指標(biāo)的問題。筆者認(rèn)為,在第二語(yǔ)言寫作中,評(píng)分標(biāo)準(zhǔn)不僅應(yīng)該與寫作和寫作水平相對(duì)應(yīng),還應(yīng)該盡量提出更多客觀的可量化標(biāo)準(zhǔn)。
參考文獻(xiàn):
[1]Hamp-Lyons,L. & Kroll,B.Issues in ESL Writing Assessmnet:An Overview[J].College ESL,1996,(1).
[2]李慶本.作文作為高等漢語(yǔ)水平主觀性考試?yán)碚撘罁?jù)和命題原則[A].劉鐮力主編.漢語(yǔ)水平測(cè)試研究[C].北京:北京語(yǔ)言文化大學(xué)出版社,1997.
[3]馬明霞.對(duì)外漢語(yǔ)三種寫作測(cè)驗(yàn)方式的效度實(shí)證研究[D].上海:復(fù)旦大學(xué)碩士學(xué)位論文,2012.
[4]歐洲理事會(huì)文化合作教育委員會(huì).歐洲語(yǔ)言共同參考框架:學(xué)習(xí)、教學(xué)、評(píng)估[S].劉駿,傅榮譯.北京:外語(yǔ)教學(xué)與研究出版社,2008.
[5]國(guó)家漢語(yǔ)國(guó)際推廣領(lǐng)導(dǎo)小組辦公室.國(guó)際漢語(yǔ)能力標(biāo)準(zhǔn)[S].北京:外語(yǔ)教學(xué)與研究出版社,2007.
[6]方緒軍.漢語(yǔ)測(cè)試與評(píng)估[M].上海:復(fù)旦大學(xué)出版社, 2013.
[7]劉國(guó)偉.留學(xué)生漢語(yǔ)短文寫作中的客觀性成分及其對(duì)評(píng)分影響的分析[D].上海:華東師范大學(xué)碩士學(xué)位論文, 2005.
[8]彭星源,柯登峰,趙知,陳振標(biāo),徐波.基于詞匯評(píng)分的漢語(yǔ)作文自動(dòng)評(píng)分[J].中文信息學(xué)報(bào),2012,(2).
[9]黃志娥,謝佳莉,荀恩東.HSK自動(dòng)作文評(píng)分的特征選取研究[J].計(jì)算機(jī)工程與應(yīng)用,2014,(6).
A Study on Objectification of Writing Grading and Its Lexical Influence
Wang Fan
(School of Humanities, Shanghai Jiao Tong University, Shanghai 200030, China)
Abstract:In the second language writing test, writing grading is the most important issue for researchers. The influencing factors include subjective and objective aspects, including the error of the propositional composition itself and the scoring standard. First, it is necessary to improve the scientificity and rationality of the scoring standard to improve the objectification of second language writing, and secondly, it is necessary to avoid or minimize the grader effect. This problem can be solved better by correcting the composition by machine, but the problem is how to quantify the index. Therefore, the grading criteria should not only correspond to the writing and writing level, but also try to present more objective and quantifiable criteria.
Key words:writing grading;objectification;lexical influence