王萌 宋岳禮
摘 要:英語(yǔ)教學(xué)和英語(yǔ)測(cè)試密不可分。本研究基于教育測(cè)量和統(tǒng)計(jì)分析理論,結(jié)合2011級(jí)農(nóng)學(xué)專(zhuān)業(yè)《大學(xué)英語(yǔ)4》期末考試情況,用SPSS軟件對(duì)試卷的難度、區(qū)分度、信度和效度進(jìn)行定量分析。統(tǒng)計(jì)分析表明:本次測(cè)試較好地達(dá)到了測(cè)試的目的,基本反映了學(xué)生的實(shí)際水平,但信度有待進(jìn)一步提高。從而為改進(jìn)教學(xué)方法和完善大學(xué)英語(yǔ)試題庫(kù)提供科學(xué)依據(jù)。
關(guān)鍵詞:語(yǔ)言測(cè)試;信度;效度;難度;區(qū)分度
大學(xué)英語(yǔ)教學(xué)是高等教育的一個(gè)有機(jī)組成部分,大學(xué)英語(yǔ)是為非英語(yǔ)專(zhuān)業(yè)本科生開(kāi)設(shè)的一門(mén)公共基礎(chǔ)課。而考試是考查和評(píng)價(jià)學(xué)生對(duì)所學(xué)知識(shí)掌握程度的一種有效手段,對(duì)教與學(xué)都有較大的影響。本文以我校2011級(jí)農(nóng)學(xué)專(zhuān)業(yè)本科生在2012—2013年度第二學(xué)期大學(xué)英語(yǔ)期末考試為例,用定量化的方法從試卷的難度、區(qū)分度、信度和效度四個(gè)方面對(duì)試卷進(jìn)行分析評(píng)價(jià)。
一、研究設(shè)計(jì)
(一)研究對(duì)象
本文的研究對(duì)象為西北農(nóng)林科技大學(xué)農(nóng)學(xué)院2011級(jí)農(nóng)學(xué)專(zhuān)業(yè)1班和2班大學(xué)英語(yǔ)第四冊(cè)期末考試試卷,共50份。本次試卷總題目為86道,全卷滿(mǎn)分為100分。其中客觀題(快速閱讀、閱讀理解、詞匯語(yǔ)法、完型填空)為80道,分值為75分;主觀題(翻譯、寫(xiě)作)為6道,分值為25分。
(二)研究方法
試卷的評(píng)判根據(jù)提前制定的評(píng)卷標(biāo)準(zhǔn)和標(biāo)準(zhǔn)答案,按照流水方式進(jìn)行閱卷。數(shù)據(jù)處理:將50名學(xué)生每個(gè)人的總成績(jī)和每小題的答題情況輸入計(jì)算機(jī),用SPSS18.0統(tǒng)計(jì)軟件包進(jìn)行數(shù)據(jù)處理和統(tǒng)計(jì)分析。
三、研究結(jié)果與討論
(一)試卷的描述性統(tǒng)計(jì)分析
試卷滿(mǎn)分為100分,平均成績(jī)?yōu)?3.5分,標(biāo)準(zhǔn)差為8.5分,最高分為92.0分,最低分為43.5分,全距為48.5分,不及格率為4.0%。學(xué)生成績(jī)分布的直方圖顯示學(xué)生在各分?jǐn)?shù)段的人數(shù)分布呈現(xiàn)中間多、兩頭小的趨勢(shì),基本上符合正態(tài)分布。
(二)試卷質(zhì)量檢驗(yàn)指標(biāo)分析
衡量試卷質(zhì)量的主要檢驗(yàn)指有難度、區(qū)分度、信度和效度。
1.難度
試題的難度是指題目的難易程度,指答對(duì)題目人數(shù)所占的比例,也叫“容易度”。難度一般用字母P表示,P越大表示題目越簡(jiǎn)單,P越小表示題目越難。本次試卷難題和較難題所占的比例(40.5%)與容易題與較容易題所占的比例(42%)基本相當(dāng)。
2.區(qū)分度
區(qū)分度是區(qū)分應(yīng)試者能力水平高低的指標(biāo),用字母D表示。區(qū)分度高的試題能將不同水平的考生區(qū)分開(kāi)來(lái),即學(xué)業(yè)水平高的考生得分高,學(xué)業(yè)水平低的考生得分低。其中區(qū)分度很好和良好的題目共13道,分值占32%;區(qū)分度尚可的題目有17道,分值占20%;區(qū)分度較差和差的題目共56道,分值占48%。又對(duì)每大題的難度和區(qū)分度綜合分析,此次測(cè)試區(qū)分度D值為0.20,區(qū)分度尚可。區(qū)分度偏低,要作為競(jìng)賽的試題應(yīng)作適當(dāng)?shù)男薷?,但作為期末考試,是?duì)學(xué)生基礎(chǔ)知識(shí)的考察,能兼顧不同程度的學(xué)生,可以考慮采用。其中完型填空難度是0.67,區(qū)分度是0.03,屬于較難題,區(qū)分度差,此題出的不好。
3.信度
信度是測(cè)試結(jié)果的穩(wěn)定性和可靠性。在語(yǔ)言測(cè)試學(xué)中對(duì)試卷信度的檢驗(yàn)一般采用內(nèi)在信度檢驗(yàn)中的Cronbach Alpha系數(shù)檢驗(yàn)。Cronbach Alpha系數(shù)介于0和1之間,系數(shù)越高,表明內(nèi)在一致性越強(qiáng),測(cè)試的結(jié)果就越可靠。運(yùn)用SPSS軟件對(duì)測(cè)試結(jié)果進(jìn)行內(nèi)在信度檢驗(yàn),可知整個(gè)試卷的信度系數(shù)為0.512。根據(jù)測(cè)試學(xué)有關(guān)理論,Alpha達(dá)到0.80以上,則表明試卷的信度是理想的。此次考試整個(gè)試卷的信度系數(shù)為0.512,遠(yuǎn)低于0.80的標(biāo)準(zhǔn),說(shuō)明本試卷的信度系數(shù)有待提高。
4.效度
測(cè)試的效度指測(cè)試是否考查了原定需要考查的內(nèi)容,考試的結(jié)果能不能用來(lái)評(píng)判預(yù)定要測(cè)試的語(yǔ)言能力。本次測(cè)試,測(cè)試的內(nèi)容與教學(xué)大綱、教學(xué)內(nèi)容基本保持一致??v觀全卷,可發(fā)現(xiàn)本試卷對(duì)讀、寫(xiě)、譯的能力有充分的反映,而未涉及到聽(tīng)和說(shuō)的能力測(cè)試,故在這兩方面無(wú)有效性。試卷構(gòu)成共六大題,滿(mǎn)分100分,其中客觀題四道,占總分75%,主觀題兩道,占總分25%。從題型來(lái)看,主客觀相結(jié)合且比例恰當(dāng),既全面考查了學(xué)生各方面的能力,又保證了評(píng)分的客觀性。
四、研究結(jié)論
通過(guò)從各個(gè)角度對(duì)試卷分類(lèi)分項(xiàng)分析,評(píng)析了試題質(zhì)量,分析結(jié)果表明:
(一)從整個(gè)試卷看,本次測(cè)試總體是可信的、有效的,基本反映了學(xué)生的實(shí)際水平。
(二)從試題的難度和區(qū)分度看,整套試卷難度居中,區(qū)分度尚可,能在一定程度上鑒別學(xué)生的學(xué)習(xí)能力;快速閱讀、詞匯語(yǔ)法、翻譯是比較簡(jiǎn)單的題目,影響了試題的區(qū)分度。
(三)從試卷的信度和效度看,試題符合大綱要求,考點(diǎn)覆蓋教學(xué)內(nèi)容,主客觀題比例恰當(dāng),但試卷的信度不高。命題時(shí)應(yīng)該注意避免太簡(jiǎn)單的題目,完型填空命題要加強(qiáng)。
五、結(jié)語(yǔ)
總之,英語(yǔ)教學(xué)和測(cè)試密不可分,要充分發(fā)揮測(cè)試對(duì)英語(yǔ)教與學(xué)的正面反撥效應(yīng)(positive washback)。教師要在提高教學(xué)效果和教學(xué)質(zhì)量上狠下工夫,不斷完善科學(xué)、規(guī)范的試題庫(kù),使考試能真正反映學(xué)生對(duì)英語(yǔ)的全面掌握和實(shí)際運(yùn)用情況。
參考文獻(xiàn):
[1]魏紅梅.SPSS對(duì)語(yǔ)言測(cè)試題信度和效度的檢測(cè)分析[J].四川教育學(xué)院學(xué)報(bào),2007(11).
[2]武尊民.英語(yǔ)測(cè)試的理論與實(shí)踐[M].北京:外語(yǔ)教學(xué)與研究出版社,2008.
作者簡(jiǎn)介:王萌(1990–),女,河南焦作人,碩士研究生,研究方向:二語(yǔ)習(xí)得;宋岳禮(1965–),女,陜西戶(hù)縣人,副教授、碩士生導(dǎo)師,研究方向:二語(yǔ)習(xí)得。