關(guān)于口語考試和評判的思考

2012-01-28 14:36:40喬輝劉慶思

中國考試 2012年6期

喬輝劉慶思

關(guān)于口語考試和評判的思考

喬輝劉慶思

本文通過介紹和總結(jié)外語口語考試的題型，分析了口語評判時應(yīng)該注意的問題，在對口語進(jìn)行評判時，除選用合適的評分標(biāo)準(zhǔn)進(jìn)行評判以外，要綜合考慮包括口試題型、評分信度、口試效度以及后效作用等各種因素的影響。

口語評判；評分標(biāo)準(zhǔn)；評分信度；效度

在語音測試領(lǐng)域，關(guān)于口語測試的研究和實踐是測試領(lǐng)域內(nèi)一個較為年輕的分支。隨著中國基礎(chǔ)教育的進(jìn)一步發(fā)展，尤其是2001年教育部關(guān)于英語課程標(biāo)準(zhǔn)的推行，英語口語教學(xué)和測試都面臨新的挑戰(zhàn)。正因為口語有其獨特性，口語考試及其評判就顯得更加復(fù)雜和多變。本文將對口語的特性、口試的題型、口試的評分標(biāo)準(zhǔn)以及評判時應(yīng)該注意的問題進(jìn)行探討。

1 口語的特性

口試的評判對象是考生的口語。作為一種獨特的評判對象，口語有其獨特性。人們在說話時會自主地或非自主地用自己的言語向聽者塑造自己的形象。不同的說話速度、停頓、音調(diào)、音高的變化以及語調(diào)都是言語的一個很重要的特點。人們的言語或發(fā)音是有含義的，這也是口語考試的主要目的所在。（Luoma,2005：10）。

口語包括很多說話時的特征，比如單音的發(fā)音、音高、音量、語速、停頓、重音和語調(diào)等。所有這些都是口語評判時應(yīng)該考慮的因素。這些因素能否都放在同一個標(biāo)準(zhǔn)中進(jìn)行評判以及應(yīng)該更看重考生的發(fā)音還是更看重考生的表述能力等問題一直是研究的熱點。

在外語學(xué)習(xí)中存在一種標(biāo)準(zhǔn)發(fā)音的說法往往受到質(zhì)疑，一方面，是因為對于一門比較國際化的語言來說，很難定義哪一種發(fā)音是標(biāo)準(zhǔn)的、地道的。每一門語言都有其因地域不同而產(chǎn)生的差異性。有時甚至不同的目的也會造成一門語言發(fā)音的變化，而這也給口語評判造成了很大的困難；另一方面，對外語學(xué)習(xí)者的學(xué)習(xí)過程研究發(fā)現(xiàn)，無論一個外語學(xué)習(xí)者如何努力，只有為數(shù)極少的人的發(fā)音能夠達(dá)到說本族語的人的水平，但他們的言語作為交際來說卻已遠(yuǎn)遠(yuǎn)足夠。

2 考查口語的題型

一項初級層次外語口語考試經(jīng)常包括朗讀、跟讀等題型，可以看出這些考試都注重對發(fā)音的考查。發(fā)音的準(zhǔn)確度是口語考試中一個很重要的評判因素，但整個言語的可理解程度（包括語速、語調(diào)、重音和節(jié)奏）有時候顯得更為重要。

隨著測試研究者對口語考試的深入研究，考查口語的題型也越來越多樣化。一般來說，經(jīng)常在口試中見到的題型包括：朗讀、重復(fù)句子、就一定的情景提問和回答問題、信息交換、連續(xù)性表達(dá)、角色扮演以及控制性訪談等（Fulcher,2003;Luoma,2004;武尊民,2002）。不同的題型在不同的口語考試中扮演著不同的角色，對保證整套試卷的信度和效度起到不同的作用。根據(jù)Luoma（2004：48-51）的研究，可以將口試題型劃分成兩大類：開放式（open-ended）題型和封閉式（structured）題型。

2.1 開放式題型

開放式題型的目的是要求考生能靈活使用所掌握的語言來完成一項任務(wù)，如演講和角色扮演等。開放式題型能讓考生綜合表現(xiàn)出自己的能力，且能準(zhǔn)確地評判出考生的口語能力，但這類試題往往耗時較長，在評判時由于完全是人工評分，評分信度難以得到保證，受評分者的主觀性印象給分的影響較大。

2.2 封閉式題型

封閉式題型中，考生的回答相對較短，朗讀題、簡答題等可以歸為這一類。封閉式試題由于題型的限制，考查的能力也相對比較單一，單憑一兩道試題很難看出考生的口語能力，在一份口語試卷中需要綜合使用。封閉式試題在評判時比開放式題型更為客觀，受人為因素影響較小。對于考查考生的語音語調(diào)和語法知識非常有效。

不同的考試會將不同的題型進(jìn)行組合形成一套合理的口試試卷。交際語言能力強調(diào)交談是發(fā)生在特定的社會交往環(huán)境中，交談雙方有交際的目的和需求，這反映在口語試題上就是試題任務(wù)應(yīng)與具體的交際情景緊密聯(lián)系在一起，考生之間因為有交談的需求，即“信息溝”，才會發(fā)生交談（Fulcher,2003:51）。

不同的題型在不同的口語考試中扮演著不同的角色。就目前來說，高考中經(jīng)常采用的題型包括朗讀、就一定情景提問和回答問題以及連續(xù)性表達(dá)等；而大學(xué)英語四、六級考試等考查相對較高層次口語能力的考試則包含控制性訪談和討論等題型。

3 口語評判應(yīng)該注意的問題

口語考試的效度較高，但口語考試的信度比較低，而且組織十分困難?？谡Z考試采用主觀性試題，很難保證評分的客觀性和一致性；口語考試的規(guī)模也在很大程度上受到面試形式的制約。如同其他的考試成績一樣，口試成績必須是可信的，公平的，且對于其使用者來說是有用的，因此口語評判的評分標(biāo)準(zhǔn)、信度和效度顯得尤為重要。

3.1 評分標(biāo)準(zhǔn)

在評分過程中，評分標(biāo)準(zhǔn)的要求應(yīng)該與教學(xué)要求相吻合，應(yīng)符合語言測試?yán)碚摰幕驹瓌t。既要考慮到整個考試的信度、效度，又要考慮到考試的可操作性及后效作用（劉慶思,2009）。口語測試主要是主觀性測試，因此，如果幾個評分員對于評分標(biāo)準(zhǔn)的掌握有差異，或者持續(xù)長時間的工作使某位評分員評分不穩(wěn)定，都會給考試的信度帶來影響。評分標(biāo)準(zhǔn)是衡量考生考試表現(xiàn)的尺度。評分標(biāo)準(zhǔn)的文字說明應(yīng)該跟撰寫公文一樣，在不需要參照任何其他的標(biāo)準(zhǔn)的情況下，做到簡潔、清楚、明確、易懂（Council of Europe,2001）。

目前國內(nèi)外較有影響力的大型考試口試部分采用的評分方法大致可分為分項評分和綜合評分。文秋芳（1999）指出分項評分側(cè)重語言結(jié)構(gòu)和語法規(guī)則的正確性，而綜合評分強調(diào)語言的交際功能和交際效果。分項評分的典范是美國的托福（TOEFL）考試口試部分，它所采用的評分標(biāo)準(zhǔn)包括語音、語法、流利度等，每一項分幾個等級。分項評分的信度較高，能向考生提供更加細(xì)化的反饋信息，但其同時忽略了考生的總體表現(xiàn)。綜合評分的代表是英國的雅思（IELTS）考試口試部分。雅思口試評分標(biāo)準(zhǔn)分為9級，對各等級水平的交際總體特征進(jìn)行描述。綜合評分省時、快速，但其評分很大程度上依賴評分員的經(jīng)驗和專業(yè)素養(yǎng)。我國全國英語等級考試（PETS）1～5級的口試采用分項評分和綜合評分相結(jié)合的評分方式，采用兩位口試教師面對兩名考生，由兩位口試教師對考生的口語能力進(jìn)行評價的形式。主持口試的教師給出一個綜合分，不參與交談的教師根據(jù)分項評分標(biāo)準(zhǔn)給出分項分（教育部考試中心，2010a；教育部考試中心，2010b）。PETS所采用的綜合評分與分項評分相結(jié)合的方式可以在一定程度上避免口試成績受口試教師主觀性的影響，在一定程度上保證了口試評分的信度。

3.2 評分信度

對于口語評判來說，很重要的兩個技術(shù)指標(biāo)就是信度和效度（Luoma,2004）。

信度通常被定義為分?jǐn)?shù)的一致性，指的是一項考試的分?jǐn)?shù)是否可信。如果同一考生在相近的兩個時間段內(nèi)參加相同的考試，他應(yīng)該獲得相同的分?jǐn)?shù)。Bachman和Palmer（1996）歸納了導(dǎo)致評分信度降低的三個因素：評分人員對評分標(biāo)準(zhǔn)的理解不同；評分人員嚴(yán)格程度不同；與評分不相關(guān)因素的干擾，如考生外形、口音、在一些問題上的立場等。口語考試的信度需要高質(zhì)量的評判工具和評判過程來保證?？荚嚱M織者往往使用以下幾種方式來保證考試的信度。

3.2.1 培訓(xùn)口試教師

準(zhǔn)備參加口試評判的教師在正式考試前會被考試組織者集中起來進(jìn)行統(tǒng)一的培訓(xùn)。培訓(xùn)的主要內(nèi)容為考試的要求和具體的評分標(biāo)準(zhǔn)。其目的是統(tǒng)一評分標(biāo)準(zhǔn)，使得所有參加過培訓(xùn)并獲得資格的教師能夠按照所規(guī)定的評分標(biāo)準(zhǔn)公平地對考生的口語進(jìn)行評判。培訓(xùn)材料和使用的樣卷由考試組織者事先聘請相關(guān)專家給出分?jǐn)?shù)并寫出具體的評注。經(jīng)過培訓(xùn)的教師會參與一些口試樣卷的評判，并根據(jù)打分表現(xiàn)決定其是否有能力進(jìn)行正式閱卷。

3.2.2 標(biāo)準(zhǔn)設(shè)定

標(biāo)準(zhǔn)設(shè)定是根據(jù)評分標(biāo)準(zhǔn)來確定及格分?jǐn)?shù)和其他分?jǐn)?shù)檔次。標(biāo)準(zhǔn)設(shè)定經(jīng)常采用兩種方式；一種是根據(jù)同一檔次的成績較好和成績較差的兩組考生的表現(xiàn)來確定及格分?jǐn)?shù)；另一種是通過讓學(xué)科專家描述不同水平的考生在各個檔次上的具體表現(xiàn)來確定及格分?jǐn)?shù)。

3.2.3 評分監(jiān)控

通過監(jiān)控口試閱卷過程來保證口試評分的信度主要涉及兩個指標(biāo)：評分員內(nèi)部一致性（Intra-rat?er Consistency），即同一評分員在較長一段時間內(nèi)對不同考生評判時對標(biāo)準(zhǔn)把握的一致性情況；評分員間的一致性（Inter-rater Consistency），即不同評分員評判不同的考生表現(xiàn)時的評分一致性情況。這兩個指標(biāo)的高低都會直接影響到考試的信度。因此，保證評分信度的一項重要內(nèi)容是以各種方法將這兩個指標(biāo)控制在可接受的范圍之內(nèi)。

3.3 口試的效度

效度是衡量一項考試是否充分考查到應(yīng)考查內(nèi)容的指標(biāo)。在口語評判中，對評分標(biāo)準(zhǔn)的評估是一項考試效度研究的重要組成部分（Luoma,2004）。首先，評分標(biāo)準(zhǔn)必須與考試的目的、考試的能力構(gòu)想以及試題任務(wù)相一致。Fulcher（2003）強調(diào)應(yīng)將能力構(gòu)想作為制定評分標(biāo)準(zhǔn)的核心。其次，評分標(biāo)準(zhǔn)應(yīng)該意義明確、通俗易懂。評分標(biāo)準(zhǔn)是否經(jīng)過不斷的修改和完善，評分尺度是否經(jīng)過專家不斷地討論和修訂都是效度檢驗的重要參考資料。

在口語考試的效度檢驗過程中，考試的實施過程和評分過程也是不可或缺的一部分。這主要表現(xiàn)在考試實施和評分與考試內(nèi)容架構(gòu)的一致性和連貫性上。這方面的效驗數(shù)據(jù)包括評分員的評分報告、評分教師培訓(xùn)資料、評分教師的資格認(rèn)證等資料。

4 總結(jié)

口語考試及其評判是一項很復(fù)雜的工作，需要考慮多方面的因素。如何針對不同的考試目的選擇合適的口試題型來組卷、采用哪種評分標(biāo)準(zhǔn)、如何保證評分信度等一系列的問題都需要做出綜合性的全面考慮。

口語評判是英語教學(xué)和測試中的一項日?；顒樱刃枰u判人員準(zhǔn)確地掌握相關(guān)的評分標(biāo)準(zhǔn)，更要求評判人員有足夠的責(zé)任心和耐心。口語評判方式方法的正確選定一方面有利于提高考試的質(zhì)量，另一方面也會對英語教學(xué)產(chǎn)生良好的反撥作用。

[1]Luoma,Sari.Assessing Speaking[M].Cambridge:Cambridge Uni?versity Press.2004.

[2]Fulcher,G.Testing Second Language Speaking[M].London:Pear?son Education Limited.2003.

[3]武尊民.英語測試的理論與實踐[M].北京：外語教學(xué)與研究出版社.2002.

[4]劉慶思.關(guān)于中學(xué)生英語作文批判方法的思考.[J]中小學(xué)外語教學(xué)（中學(xué)篇）,2009(3):1-4.

[5]Council of Europe.Common European Framework of Reference for languages:Learning,Teaching,Assessment[M].Cambridge Uni?versity Press.2001.

[6]文秋芳.英語口語測試與教學(xué)[M].上海：上海外語教育出版社.1999.

[7]教育部.全日制義務(wù)教育普通高級中學(xué)英語課程標(biāo)準(zhǔn)（實驗稿）[M].北京：北京師范大學(xué)出版社.2001.

[8]教育部考試中心.全國英語等級考試第一級考試大綱[M].北京：高等教育出版社.2006.

[9]Bachman&Palmer.language Testing in Practice[M].Oxford:Ox?ford University Press.1996.

Reflections on the Testing and Marking of Language Speaking

QIAO Hui and LIU Qingsi

Starting from the characteristics of language speaking,the paper introduces different test types of foreign language speaking tests and analyzes the issues concerning speaking tests marking:marking schemes,reliability and validity.It is pointed in the end that the marking of speaking tests is a complicated process which should take many factors into consideration,and which needs scorers’accurately understanding the marking schemes,their responsibility and patience.

Marking Speaking Tests;Marking Scheme;Reliability;Validity

G405

1005-8427(2012)06-0020-4

教育部考試中心

99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

關(guān)于口語考試和評判的思考

1 口語的特性

2 考查口語的題型

2.1 開放式題型

2.2 封閉式題型

3 口語評判應(yīng)該注意的問題

3.1 評分標(biāo)準(zhǔn)

3.2 評分信度

3.2.1 培訓(xùn)口試教師

3.2.2 標(biāo)準(zhǔn)設(shè)定

3.2.3 評分監(jiān)控

3.3 口試的效度

4 總結(jié)