吳延科 張朝霞
摘 要:考試是學校教學的重要環(huán)節(jié),低質量的試題只是對知識的簡單重復,徒增師生的負擔。因此,提高試卷質量是提高學生學習效率和教師教學質量的一種科學有效的途徑,研究試卷質量對學生的成績影響具有重要的現(xiàn)實意義。教師以廣東省湛江市某中學2017屆學生的10次考試成績?yōu)闃颖?,討論試卷質量對考生成績的影響。
關鍵詞:試卷質量;考試評價;學生成績
中圖分類號:G63 文獻標識碼:A 文章編號:1673-9132(2018)17-0049-02
DOI:10.16657/j.cnki.issn1673-9132.2018.17.030
試卷質量對考試的影響是多方面的。文獻一[1]認為難度系數(shù)、區(qū)分度系數(shù)、信度、效度及覆蓋度等測評指標是分析試卷質量的重要指標。文獻二[2]提出了衡量試卷質量的四個指標,介紹了用數(shù)理統(tǒng)計方法對試卷如何進行科學的評價。文獻三[3]構建了以效度驗證為根本,以目標性、測量學、結構性、規(guī)范性、統(tǒng)計性評價指標為支撐,以證據(jù)收集為手段,以德爾菲法為價值判斷方法的高考試卷質量評價體系。
一、試卷質量評價指標
我們使用難度、區(qū)分度、信度、效度和覆蓋度五個指標對試卷進行分析。難度系數(shù)評價的是試題或試卷的難易程度,其值越大,意味著試題或試卷越難。試卷的難度系數(shù)定義為試卷平均得分與滿分值的比值。區(qū)分度也稱鑒別力,一般可以使用高低分方法進行計算,即先把成績進行降序排列,分別取最高和最低的27%個考生記錄,計算平均得分之差與總分值的比例即為區(qū)分度。信度系數(shù)是測試可靠性的指標,表示所得結果的一致性,一般使用克朗巴赫α值進行計算。效度指的是考試的有效性程度,反映的是考試所能夠達到的目的的程度。試題的效度是使用該題得分與某一效標得分的相關系數(shù)來衡量。由于同一份試卷中的試題具有同質性,主要是測量學生同一部分的知識點的掌握程度,因而一般可以取試卷總得分作為效標。這樣,試題的效度就等于該題得分與試卷總得分的相關系數(shù),它表示的是該題與試卷總體具有的內在一致性。覆蓋度表示試題對教學大綱規(guī)定內容的覆蓋程度。各題得分的相關系數(shù)可反映各題間內容的相似程度,如果各題間相關系數(shù)大,說明各題內容相關性大,否則說明各題的內容相對獨立,因此試題的覆蓋度可通過與試卷中各題間的相關系數(shù)的平均值之差來反映。試卷覆蓋度越大,試卷的內容效度越高。
二、試卷質量分析
我們選取廣東省湛江市某中學2017屆學生的10次各類考試成績?yōu)闃颖?,通過對10次考試考生平均分、偏度和峰度的調查統(tǒng)計,得出一份好的試卷應該使考生成績近似服從正態(tài)分布,其偏度應該接近0,而峰度應該接近3。從這個角度來講,有的模擬試卷比較理想,有的模擬試卷不理想。
10次考試的難度分別為:
0.5679,0.4361,0.5018,0.3654,0.4818,
0.4537,0.5270,0.5952,0.5282,0.6380;
區(qū)分度分別為:
0.4640,0.4415,0.5321,0.4132,0.4958,
0.5421,0.5249,0.4408,0.4601,0.4579;
信度分別為:
0.7280,0.7474,0.7913,0.7156,0.8012,
0.7874,0.7553,0.6957,0.7274,0.6490;
效度分別為:
0.8256,0.8167,0.8483,0.8321,0.8749,
0.8672,0.8514,0.8120,0.8308,0.7998;
覆蓋度分別為:
0.5122,0.5054,0.4275,0.5256,0.3889,
0.4125,0.4337,0.5364,0.5051,0.6139。
通過對10次考試難度、區(qū)分度、信度、效度、覆蓋度的具體研究,結合前述分析結果,我們給出如下命題建議:
1.難度對考生平均得分的影響最大,并且對各類考生的影響基本一致。因此,試卷命題人需要重點控制試卷難度,這一點與我們的經(jīng)驗一致,大多數(shù)試卷命題人都能夠留意到。
2.為了提高試卷質量,還需要有效控制試卷的效度。由于試卷的效度是各題效度的加權平均,而各題的效度等于該題得分與試卷總得分的相關系數(shù),因此,為提高試卷效度,就需要盡量使每一題的難度與試卷整體難度一致,即不能夠使各題的難度系數(shù)差別過大。
3.試卷信度對考生平均成績的影響同樣不能忽視。為了提高試卷信度,需要減小各題的得分方差,而增大總得分方差,這顯然不能兼顧。由統(tǒng)計學知識可知,總得分方差可以分解為各題得分方差與各題間得分方差之和。因此,減小各題得分方差和增大各題間得分方差是增大信度的兩種途徑。實際操作中,由于客觀題的數(shù)量和分值是固定的,可以把主觀題分解為幾個小題,難度循序漸進,這樣不但可以減小各題的得分方差,而且能夠增大主觀題與客觀題間的得分方差,從而有效增大試卷的信度。
4.覆蓋度也是評價試卷質量的重要指標。增大覆蓋度需要減小各題間的相關系數(shù),一個有效途徑就是盡量使各題考查的知識點不相同。
5.區(qū)分度對成績的影響最具規(guī)律性,成績越好的考生,大的區(qū)分度對其越有利。由于區(qū)分度是使用高分段和低分段考生的平均成績之差來度量的,顯然,試題難度過大或過小都會使得區(qū)分度變小。而適當?shù)脑囶}難度會增大區(qū)分度,這對提高試卷質量具有指導意義。
參考文獻:
[1] 吳承禎,何麗華,林立群等.試卷質量分析方法及其應用[J].中國林業(yè)教育,2008(3):26.
[2] 伊繼東,劉江,姜家雄.用數(shù)理統(tǒng)計方法分析試卷質量[J].云南師范大學學報(自然科學版), 1995(Z1):40.
[3] 付慧宇.高考試卷質量評價體系初探[J].天津師范大學學報(基礎教育版),2011(2):70.