朱薇
(重慶師范大學(xué)涉外商貿(mào)學(xué)院,重慶 401520)
語(yǔ)言測(cè)試的信度效度
朱薇
(重慶師范大學(xué)涉外商貿(mào)學(xué)院,重慶 401520)
語(yǔ)言測(cè)試是檢驗(yàn)學(xué)習(xí)者習(xí)得成果的重要手段,同時(shí)也是教學(xué)中的重要環(huán)節(jié)。信度和效度是語(yǔ)言測(cè)試中的基本概念。本文介簡(jiǎn)單介紹了信度和效度的定義,分析了他們的影響因素及相互關(guān)系,得出了良好的測(cè)試是信度和效度的合理平衡的結(jié)論。
測(cè)試;信度;效度;關(guān)系
(一)什么是信度
信度是指測(cè)試結(jié)果的可信程度,是衡量測(cè)驗(yàn)穩(wěn)定性,可靠性的重要指標(biāo)。語(yǔ)言測(cè)試信度主要衡量語(yǔ)言測(cè)試結(jié)果對(duì)語(yǔ)言受試者的真實(shí)的語(yǔ)言水平的反映程度,例如語(yǔ)言測(cè)試的成績(jī)與語(yǔ)言受試者的真實(shí)語(yǔ)言水平如果保持一致,則此考試的信度最大,反之則最小。
(二)影響信度的因素
語(yǔ)言測(cè)試的每個(gè)環(huán)節(jié)都不可避免的會(huì)受到一些偶然因素的影響,這些偶然因素必然會(huì)對(duì)測(cè)試的信度有影響,影響越大,信度就越低。因此在組織與實(shí)施測(cè)試過(guò)程中,對(duì)全部的受試者都應(yīng)該保持環(huán)境與條件的一致,以取得比較高的信度;在測(cè)試的評(píng)分環(huán)節(jié)中,同一項(xiàng)測(cè)試的評(píng)分標(biāo)準(zhǔn)應(yīng)該客觀,必須保持一致且穩(wěn)定,這樣才能保證取得較高信度;另外評(píng)分者同樣是影響語(yǔ)言測(cè)試信度的重要因素,因?yàn)樵u(píng)分者會(huì)將自己的主觀意愿移植到評(píng)分過(guò)程中。
除了已提到的因素之外,就試卷本身而言,影響信度的因素主要還有:1)抽取樣本的大小,抽取的樣本越大,就越具有廣泛性,那么測(cè)試的信度當(dāng)然也就越高,反之越低;2)試題的長(zhǎng)度,就一份試卷而言,如果題量越大,則信度也會(huì)越大;3)試卷的同質(zhì)性程度,試卷同質(zhì)性程度越高,則信度也越高;4)試題的難度,試題的適宜度是否和受試者的水平匹配合適。
(一)什么是效度
測(cè)試效度是指語(yǔ)言測(cè)試的真實(shí)性和準(zhǔn)確性,也就是此測(cè)驗(yàn)與旨在測(cè)量的目的相符合一致的程度。也就是說(shuō)該測(cè)試是否有效度在于它是否真實(shí)地測(cè)試出它想要考察的內(nèi)容。如果測(cè)試和測(cè)試內(nèi)容的相關(guān)系數(shù)為0,表明測(cè)試內(nèi)容是無(wú)效的;如果相關(guān)系數(shù)小于0.4,表明效度很低;相關(guān)系數(shù)在0.4~0.7區(qū)間,表明測(cè)試有效;換言之,相關(guān)系數(shù)越接近1,則說(shuō)明考試的效度越高,反之則越低。
(二)影響效度的因素
所有對(duì)測(cè)試準(zhǔn)確性和真實(shí)性構(gòu)成偏差的因素都對(duì)效度有影響:1)試卷題目的要求不清楚,考生會(huì)因?yàn)椴幻鞔_要求而降低了成績(jī);2)試卷題目的適宜度太差,沒(méi)能在受試者的合適的水平上測(cè)試想要測(cè)試的內(nèi)容;3)試卷選擇項(xiàng)目含糊不清,同1)一樣會(huì)使受試者因模棱兩可的選擇而降低成績(jī);4)測(cè)試內(nèi)容與測(cè)試目的不符合或者沒(méi)有足夠的題目來(lái)代表測(cè)試內(nèi)容;5)受試者的心理因素:例如測(cè)試題目一開(kāi)始太難導(dǎo)致受試者因受挫而影響后面的發(fā)揮;6)測(cè)試選項(xiàng)不合理:如多想選擇里,正確答案很容易被考生以某種技巧識(shí)別。
Bachman(1996)和Fiske都對(duì)語(yǔ)言測(cè)試信度和效度的關(guān)系做過(guò)相關(guān)的研究和闡述。Bachman認(rèn)為信度和效度測(cè)試是影響測(cè)試分?jǐn)?shù)的兩個(gè)很重要的因素,此二者相互補(bǔ)充和限制。信度可以反映出測(cè)量隨機(jī)誤差在考試結(jié)果不一致的原因中所占的比重;而效度則是反映出測(cè)試結(jié)果與測(cè)試的參照標(biāo)準(zhǔn)之間的相關(guān)性。換一種說(shuō)法就是,信度是考察考試結(jié)果的影響因素那些想考的內(nèi)容以外的因素;而效度則是考察考試結(jié)果的差異哪些是由受試者語(yǔ)言能力所引起。
在語(yǔ)言測(cè)試中,信度和效度的關(guān)系是互為依卻又互為排斥的;信度是效度的前提條件,一個(gè)效度高的考試必然有較高的信度;否則該考試就不是真實(shí)的反應(yīng)了受試者的語(yǔ)言水平,當(dāng)然也就沒(méi)有達(dá)到測(cè)試目的;但是,同樣的一份試卷卻很難同時(shí)兼顧信度和效度兩方面;測(cè)試信度的提高有可能導(dǎo)致測(cè)試效度的降低,反之亦如此;信度和效度在語(yǔ)言測(cè)試中似乎存在不可調(diào)和的矛盾;因此,現(xiàn)代語(yǔ)言測(cè)試以測(cè)試目的為最基本的出發(fā)點(diǎn),在信度和效度之間努力尋找一個(gè)最佳平衡點(diǎn),避免一味的將二者對(duì)立起來(lái)。例如托??荚囀切睦頊y(cè)量學(xué)-結(jié)構(gòu)主義語(yǔ)言測(cè)試思想的重要產(chǎn)物,但托福的TSE考試設(shè)計(jì)卻充分體現(xiàn)了交際語(yǔ)言測(cè)試思想,其考試評(píng)分標(biāo)準(zhǔn)通過(guò)考察考生能否有效而得體的使用規(guī)定語(yǔ)言完成規(guī)定的交際任務(wù)來(lái)進(jìn)行定性的評(píng)判;現(xiàn)代語(yǔ)言測(cè)試在實(shí)踐中不斷的融合新舊兩種體系的測(cè)試思想,試圖在測(cè)試中盡量兼顧信度和效度兩方面,達(dá)到一個(gè)合理的平衡。
效度和信度的測(cè)試是評(píng)定語(yǔ)言測(cè)試中必不可少的兩個(gè)重要指標(biāo),它反映的是語(yǔ)言測(cè)試的本質(zhì)性問(wèn)題,對(duì)評(píng)定是否達(dá)到預(yù)期教學(xué)目的和指導(dǎo)教學(xué)具有重要的參考意義,但只有二者達(dá)到合理的平衡,相互補(bǔ)充,才能保證考試的可靠性和準(zhǔn)確性,從而達(dá)到測(cè)試目的,提高測(cè)試質(zhì)量。
[1]桂詩(shī)春.標(biāo)準(zhǔn)化考試——理論、原則與方法[M].廣州:廣東高等教育出版社,1986.
[2]劉朝杰.問(wèn)卷的信度與效度評(píng)價(jià)[J].中國(guó)慢性病預(yù)防與控制,1997,5(4):174-177.
[3]楊惠中.大學(xué)英語(yǔ)四、六級(jí)考試效度研究[M].上海:上海外語(yǔ)教育出版社,1998.
G42:
A
1005-5312(2014)14-0246-01