王雪琪
【摘 要】隨著世界政治經(jīng)濟(jì)的全球化,英語水平已經(jīng)成為國家選拔人才最重要的參考指標(biāo)之一。全國各高中均十分重視英語教學(xué),并圍繞高考考綱及教學(xué)大綱實(shí)施了許多測試。本文以北京市海淀區(qū)某中學(xué)高三前測英語試卷為研究對(duì)象,通過運(yùn)用經(jīng)典測量理論對(duì)學(xué)生成績、試題難度、區(qū)分度及信度等進(jìn)行分析,得出該試卷試題效度較高、難度適中、信度較好、區(qū)分度一般的結(jié)論,進(jìn)而為英語教學(xué)和試題設(shè)計(jì)提出反饋建議。
【關(guān)鍵詞】英語;試卷分析;信度;難度;區(qū)分度
【中圖分類號(hào)】424.7 【文獻(xiàn)標(biāo)識(shí)碼】A
【文章編號(hào)】2095-3089(2018)12-0060-02
一、引言
自改革開放以來,國家越來越需要外語人才,因此英語在高考中有舉足輕重的地位。由于高考對(duì)高中教學(xué)具有指導(dǎo)作用,因此查漏補(bǔ)缺統(tǒng)籌全局的高三總復(fù)習(xí)能很大程度影響學(xué)生在高考中的表現(xiàn)。因此,好的試卷能夠有效反映學(xué)生的水平和教師教學(xué)效果,從而指導(dǎo)教師在高三總復(fù)習(xí)階段的教學(xué)和大綱的制定,高三英語前測試卷分析對(duì)高三英語總復(fù)習(xí)具有十分重要的意義。二、研究方法和研究對(duì)象
1.研究方法。
本研究采用經(jīng)典測量理論的方法,通過使用EXCEL2013和SPSS2.1對(duì)全年級(jí)364人成績進(jìn)行數(shù)據(jù)處理和統(tǒng)計(jì)分析,并以試題的難度、區(qū)分度、信度、效度等作為評(píng)價(jià)試題質(zhì)量的主要指標(biāo)。
2.研究對(duì)象。
本文的研究對(duì)象為北京市海淀區(qū)某高級(jí)中學(xué)理科英語高三前測試卷??荚囈源缶V為依據(jù),以檢驗(yàn)學(xué)生掌握情況為目的,考試規(guī)模較小,教師在教務(wù)處的組織下自行命題、施測、評(píng)分,因此該測試類型為非標(biāo)準(zhǔn)化的成績測試。研究數(shù)據(jù)為該年級(jí)364名學(xué)生的考試成績,由該校高三某英語教師提供。三、成績?cè)u(píng)議與試卷分析
1.成績?cè)u(píng)議。
本次試卷滿分為150分,最高分為136.5分,最低分為40分,全距為96.5分。平均分為99.68分,標(biāo)準(zhǔn)差為17.6。成績離散較大、全距較大,學(xué)生成績整體呈現(xiàn)偏低的情況。
2.試卷分析。
(1)試題結(jié)構(gòu)。
試卷共有五個(gè)題型,其類型和比重分別為:聽力理解30分(20%);單項(xiàng)選擇15分(10%);完形填空30分(20%);閱讀理解40分(26.67%);書面表達(dá)35分(23.33%)。從試題考察學(xué)生語言能力的角度來看,單項(xiàng)選擇為分立式測試,占比10%;完形填空和閱讀理解為綜合性測試,占比46.67%;書面表達(dá)和聽力理解為交際性測試,占比43.33%??偟膩砜?,本試卷注重測試學(xué)生的綜合能力和交際能力,符合教學(xué)大綱對(duì)高中學(xué)生英語能力的要求,即綜合運(yùn)用知識(shí)進(jìn)行交際的能力。
(2)效度。
效度是指試卷的有效性和準(zhǔn)確程度,它反映了測量結(jié)果和索要測量的內(nèi)容之間的符合程度。
從表面效度上來看,本試卷中除個(gè)別小題較難以外,沒有出現(xiàn)偏題怪題,且考察知識(shí)點(diǎn)較全面、無缺漏。此外,試題答案在ABCD四個(gè)選項(xiàng)中分布均勻,且各小題答案之間均無暗示。因此,本試卷表面效度較高。
從內(nèi)容效度上來看,本試卷中,聽力理解題考察了學(xué)生聽音辨音、信息篩選和單詞拼寫等能力。選擇題考察了學(xué)生非謂語動(dòng)詞、時(shí)態(tài)語態(tài)、動(dòng)副短語、近義詞辨析、虛擬語氣等常考知識(shí)點(diǎn)。完形填空考察了情態(tài)動(dòng)詞、動(dòng)介短語等知識(shí)和語意連貫、猜詞等能力。閱讀理解所選取的文章涉及記敘文、信件、說明文、議論文等高考??嘉捏w,且考察內(nèi)容涉及信息獲取、內(nèi)容理解、猜測推理、語意連貫等能力。書面表達(dá)考查了學(xué)生圖片理解能力、語言組織能力和應(yīng)用文寫作等綜合性交際能力。全卷涉及知識(shí)點(diǎn)緊緊圍繞教學(xué)大綱和考綱展開,考察細(xì)致全面,內(nèi)容效度較高。
從結(jié)構(gòu)效度上來看,試卷中分立式測試占比10%,考察學(xué)生對(duì)于單個(gè)知識(shí)點(diǎn)的掌握情況。綜合性測試占比47%,考察學(xué)生綜合運(yùn)用知識(shí)的能力。交際性測試占試卷總比重的43%,考察學(xué)生的交際能力。試題編排和不同題型占比符合教學(xué)大綱提出的對(duì)學(xué)生綜合運(yùn)用語言知識(shí)及提升交際能力的要求,因此結(jié)構(gòu)效度較高。
(3)信度。
信度是指試卷的穩(wěn)定性和可靠性程度,取值范圍為0-1,信度值越大表示該試卷的測試結(jié)果可靠性越高。一般來說,影響信度的因素有試卷的題量、施測的標(biāo)準(zhǔn)程度和評(píng)分的客觀性等因素。
本試卷是在教務(wù)處的組織下由教師統(tǒng)一命題、施測、評(píng)分,且采取流水方式進(jìn)行閱卷,題量適中,因此能夠有效提高信度。此外,筆者通過計(jì)算科倫巴赫α系數(shù)來評(píng)估內(nèi)部一致性信度。公式為:α=[K/(K-1)][1-(∑S2i)/S2x ]。其中,K為試卷中題目的總數(shù), S2i為第i題得分的題內(nèi)方差,S2x為全部題目總得分的方差。通過計(jì)算,本試卷的內(nèi)部一致性α系數(shù)為0.86,說明試卷的內(nèi)部一致性較高??偟膩碚f,本試卷信度較高、測試結(jié)果比較可靠。
(4)難度。
難度是反映試題難易程度的重要指標(biāo)之一,取值范圍為0-1,難度值越大表示試題越容易。本研究采用通過率和平均得分率來計(jì)算難度值。若試題是客觀題,則以通過率表示難度值,即答對(duì)的人數(shù)除以總?cè)藬?shù);若試題為主觀題,則以平均得分率表示難度值,即該題的平均得分除以總分。一般來說,試題難度應(yīng)在0.5-0.7之間。
通過計(jì)算,筆者得出本試卷的總體難度值為0.66,在0.5-0.7之間。此外,還得出本試卷中不同題型題目的難度值見表1。
表1 不同體型題目的難度值
〖HTSS〗〖BG(!〗〖BHDFG1*2,F(xiàn)K4,K4。4,K4F〗題型〖〗聽力〖〗單選〖〗完形〖〗閱讀〖〗寫作
〖BHD〗難度〖〗0.830〖〗0.679〖〗0.728〖〗0.641〖〗0.485〖BG)F〗
從圖中我們可以看出,難度由高到低依次為寫作、閱讀理解、單項(xiàng)選擇、完形填空、聽力理解。其中,聽力理解較簡單,應(yīng)用文寫作略難,而單項(xiàng)選擇、完形填空和閱讀理解難度適中。本試卷不同題型難度分布情況合理,基本符合高考考綱的難度要求。
(5)區(qū)分度。
區(qū)分度又稱鑒別力,是指試題對(duì)不同水平考生加以區(qū)分的能力,即考題是否能拉開學(xué)生成績的層次,它能反映出個(gè)分?jǐn)?shù)段學(xué)生對(duì)所學(xué)知識(shí)的掌握程度。本研究采取點(diǎn)二列相關(guān)法計(jì)算區(qū)分度,即將全體考生的總成績按高低順序進(jìn)行排列,前27%的考生為高分組,后27%的考生為低分組,將高分組考生答對(duì)某題項(xiàng)的百分比減去低分組考生答對(duì)某題項(xiàng)的百分比即為該題項(xiàng)的區(qū)分度。一般來說,區(qū)分大于0.4時(shí)為優(yōu)秀試題,多見于選拔性考試。區(qū)分度在0.3-0.4之間為良好,多見于課程合格性考試。區(qū)分度在0.2-0.3之間即為可。區(qū)分度小于0.2則是劣等試題。
通過計(jì)算,筆者得到本試卷總體區(qū)分度為0.28,區(qū)分度尚可。同時(shí),筆者還得到不同題型題目的區(qū)分度見表2。
表2 不同題型題目的區(qū)分度
〖HTSS〗〖BG(!〗〖BHDFG1*2,F(xiàn)K4,K4。4,K4F〗題型〖〗聽力〖〗單選〖〗完形〖〗閱讀〖〗寫作
〖BHD〗區(qū)分度〖〗0.27〖〗0.27〖〗0.31〖〗0.34〖〗0.23〖BG)F〗
從圖中可以看出,聽力理解、單項(xiàng)選擇和寫作區(qū)分度均處于0.2-0.3之間,尚可。完形填空和閱讀理解的區(qū)分度在0.3-0.4之間,為良好??偟膩碚f,本試卷區(qū)分度尚可,符合高三前測查漏補(bǔ)缺的特點(diǎn)。四、研究結(jié)論與啟示
1.研究結(jié)論。
(1)從試卷總體來看,本試卷難度為0.66,區(qū)分度為0.28,信度為0.86,是一套難度適中、信度較高、區(qū)分度尚可的試卷。具體來看,不同題型題目難度高低分布大致符合考綱中對(duì)于不同題型難度要求的標(biāo)準(zhǔn),不同題型題目區(qū)分度高低分布基本符合考綱中對(duì)題型區(qū)分能力的要求??偟膩碚f,試卷符合高三前測對(duì)全體學(xué)生無差別查漏補(bǔ)缺的目的,能夠比較準(zhǔn)確地反映學(xué)生近期的學(xué)習(xí)情況。
(2)從試卷結(jié)構(gòu)來看,本試卷中分立式測試占試卷總分的10%,綜合性測試分?jǐn)?shù)占試卷總分的47%,交際性測試分?jǐn)?shù)占試卷總分的43%。從表面山看,試題結(jié)構(gòu)合理,符合教學(xué)大綱對(duì)學(xué)生綜合運(yùn)用知識(shí)的能力和運(yùn)用所學(xué)知識(shí)進(jìn)行交際能力的要求。但是定性分析具體題目可以發(fā)現(xiàn),完形填空(屬綜合性測試)中有將近半數(shù)的題目考察的是不需要根據(jù)上下文判斷的詞語或短語辨析。此外,在聽力理解(屬交際性測試)中,除最后一道小題是通過聽篇章選擇答案以外,其余題目均未創(chuàng)設(shè)真實(shí)交際所需要的情境。題目考查知識(shí)技能里與題型要求能力不完全符合,試題設(shè)計(jì)緊緊圍繞考試大綱而非教學(xué)大綱,雖能夠有效反映出該校高三學(xué)生目前在英語考試方面存在的問題和不足,但無法反映學(xué)生真實(shí)的交際能力。這也反映了應(yīng)試教育下高考考綱引導(dǎo)教學(xué)大綱的特點(diǎn)。
(3)從學(xué)生成績來看,本試卷滿分為150分,在全年級(jí)364人的考試成績中最高分為136.5分,最低分為40分,平均分為99.68分,均呈現(xiàn)偏低的情況。結(jié)合對(duì)試題的觀察可以發(fā)現(xiàn),試題的內(nèi)容符合高考考綱所規(guī)定的知識(shí)考察點(diǎn),試題的結(jié)構(gòu)符合高考考綱所定制的試題結(jié)構(gòu)。因此,可以得出該年級(jí)學(xué)生在英語學(xué)習(xí)上仍存在問題,高三復(fù)習(xí)階段教師應(yīng)抓好學(xué)生知識(shí)薄弱點(diǎn)各個(gè)攻克。
2.啟示。
(1)從試卷分析的角度來說,判定一份試卷的優(yōu)劣要綜合考量效度、信度、區(qū)分度、難度并將定量分析和定性分析相結(jié)合以達(dá)到預(yù)期的標(biāo)準(zhǔn),不能簡單地以自身的主觀經(jīng)驗(yàn)為判斷試卷優(yōu)劣的依據(jù)。教師應(yīng)該以更加科學(xué)的測量和評(píng)價(jià)手段對(duì)試卷進(jìn)行分析,不斷完善科學(xué)規(guī)范的試題庫,從而更好地定制試題從而測出學(xué)生的真實(shí)水平。
(2)從設(shè)計(jì)試卷的角度來說,試卷的設(shè)計(jì)首先應(yīng)該保證考察知識(shí)點(diǎn)全面,盡量避免在篇頭篇末設(shè)空,盡量避免偏題、怪題的出現(xiàn)。其次,試卷的設(shè)計(jì)應(yīng)該緊緊圍繞教學(xué)大綱展開。但從本試卷的分析可以看出,原本為了考查學(xué)生能力、指導(dǎo)教學(xué)的前測考試實(shí)質(zhì)上是以高考為導(dǎo)向的,這和目前我國應(yīng)試教育的特點(diǎn)分不開。因此為了學(xué)生長久的發(fā)展,在設(shè)計(jì)試卷的時(shí)候更應(yīng)考慮將教學(xué)大綱對(duì)測試學(xué)生綜合能力、交際能力的要求與高考考綱對(duì)測試學(xué)生知識(shí)能力的要求結(jié)合起來。
(3)從教學(xué)的角度來說,高三前測是一次階段性測試,能夠從一定程度上反映出學(xué)生的能力水平和存在的問題。但是據(jù)筆者觀察,該校階段性測試的頻率為一學(xué)期一次。僅依據(jù)高三前測這一次階段性測試來指導(dǎo)高三階段的英語教學(xué)是遠(yuǎn)遠(yuǎn)不夠的,應(yīng)該適當(dāng)提高階段性測試的頻率,以便教師及時(shí)調(diào)整教學(xué)計(jì)劃和教學(xué)重點(diǎn),從而更好的幫助學(xué)生為高考做好準(zhǔn)備。
參考文獻(xiàn)
[1]陳熙,吳成秋,賀棟梁. 試卷分析與評(píng)價(jià)的指標(biāo)體系及其應(yīng)用[J]. 西北醫(yī)學(xué)教育,2006,14(05):542+589.
[2]黃穎,林端宜. 試卷分析研究現(xiàn)狀綜述[J]. 西北醫(yī)學(xué)教育,2005,13(01):39-40.
[3]孔超.大學(xué)英語試卷分析與評(píng)議[J].中國科技信息,2007(1).