預防醫(yī)學考試試題質(zhì)量評價

2010-10-17 07:14:48陳麗麗高曉華

衛(wèi)生職業(yè)教育 2010年24期

關鍵詞：單選題區(qū)分度覆蓋度

曹佳，孫艷，陳麗麗，高曉華

（哈爾濱醫(yī)科大學公共衛(wèi)生學院，黑龍江哈爾濱 150081）

預防醫(yī)學考試試題質(zhì)量評價

曹佳，孫艷，陳麗麗，高曉華

（哈爾濱醫(yī)科大學公共衛(wèi)生學院，黑龍江哈爾濱 150081）

目的評價預防醫(yī)學考試試題質(zhì)量，以便科學地命題，理想地檢驗學生成績，使成績考核能真實地反映教學質(zhì)量。方法運用統(tǒng)計學方法對試題難度、覆蓋度、區(qū)分度、可信度進行分析。結果試題難度適當，覆蓋度欠佳，區(qū)分度尚好，可信度良好。結論在出題時，要注意試題難度和難度分配，增加試題類型和數(shù)量，提高覆蓋度和區(qū)分度。

預防醫(yī)學；考試試題；質(zhì)量評價

如何科學地命題，理想地檢驗學生成績，是值得教師認真思考的問題。為檢驗并提高試題質(zhì)量，同時也檢驗教學上存在的問題，我們對近年來公共事業(yè)管理本科學生預防醫(yī)學試卷質(zhì)量進行評價，為以后教學命題提供借鑒。教學質(zhì)量涉及到教學的整個過程，而檢驗教學質(zhì)量的重要手段就是成績考核，而成績考核能否真實地反映教學質(zhì)量，命題顯得特別重要。試題過難、過偏，會出現(xiàn)學生成績偏低；命題過易，勢必降低了教學大綱所規(guī)定的目標，使得學生成績偏高，無法區(qū)分開學生成績的優(yōu)劣。

1 對象與方法

1.1 對象

2001級、2002級公共事業(yè)管理本科學生103人的預防醫(yī)學試卷103份。

1.2 方法

試題類型共分6種，分別是概念題（10分）、判斷題（15分）、單選題（15分）、多選題（25分）、簡答題（15分）、論述題（20分）。經(jīng)統(tǒng)計學方法處理，根據(jù)考試成績對各試題得分進行分析。

假設試卷題目類型個數(shù)為n，P為得分（百分制評分），n個類型題目的滿分值分別為

設抽查全體學生數(shù)為N，樣本值用x1，x2，…，xn表示。這就是所抽查到的N個學生的考試成績。用xij表示第i個學生第j題的實際得分分別表示第j題的均值和方差。

為了統(tǒng)一檢驗量綱和提高各題間的可比性，把各題的得分標準化，令，則 sij為第 i個學生第 j題的標準分。這個過程實際上就是把符合正態(tài)分布的學生成績轉化為標準正態(tài)分布的過程。令aj、bj分別表示第j題滿分和0分的標準分。

采用4項指標即難度、覆蓋度、區(qū)分度和可信度[1]作為評價試題質(zhì)量的主要指標。

覆蓋度：用各題之間相關矩陣表示，即r=（rij）n×n，其中

這種描述的基本思想是試題覆蓋面越廣，則各題之間的交叉相關性越小，反之則越大。相關系數(shù)的實質(zhì)就是反映試題覆蓋面大小。通常以 rij＜0.2 為覆蓋面大（i，j=1，2，…，n）。

區(qū)分度：第i題的區(qū)分度Gj為

其中，Hj，Lj分別表示樣本中高分組、低分組第j題的平均分。高分組和低分組各占樣本容量的25%、30%為宜。試卷總區(qū)分度Gj為各題區(qū)分度的加權平均，即

區(qū)分度是標志試題能否將學生成績拉開距離，真正從分數(shù)上將好、中、差的學生區(qū)分開來。區(qū)分度G>0.4為可，G<0.2為差。

可信度描述了試卷總分差在排除了各題隨機誤差之后，余下部分占總方差的百分比。各題隨機誤差小，則試卷可信度就高，反之則可信度低。一般情況下，試卷可信度可達0.5。

2 結果

（1）103份試卷成績統(tǒng)計情況（見表1）。卷面分為56.2～95.5分，平均分為（76.44±4.4）分趨于正態(tài)分布?？傠y度D值為0.21，試卷難度適當；總方差為129，則可信度B=0.63，試卷可信度良好。

表1 103名學生成績統(tǒng)計（分）

（2）試卷各題相關系數(shù)矩陣。

從矩陣上看，概念題與判斷題、單選題的相關系數(shù)基本滿足＜0.2的要求，判斷題、單選題與論述題的相關系數(shù)基本滿足＜0.2的要求，其他各題間的相關系數(shù)均＞0.2，試卷覆蓋度不夠好。

（3）對學生考試成績原始數(shù)據(jù)按從高分到低分排列，取前25名和后25名學生成績作為高分組和低分組（見表2）。試題總區(qū)分度為D=0.76。試卷區(qū)分度總體上較好。

表2 高分組與低分組間各題區(qū)分度

3 討論

考試是教學中不可缺少的環(huán)節(jié)，是檢查和評價教學質(zhì)量的必要手段。通過對考試成績和試卷的分析，及時發(fā)現(xiàn)教學中存在的問題，不斷完善命題工作，使考試在教學中發(fā)揮應有的作用。

從難度D值上看，多選題和論述題較難，難度均＞0.2。這2個題型的確是教學重點和難點，難度設置較為理想。其余各題型難度均<0.2，特別是概念題和單選題，屬于基本概念題和容易判斷的選擇題，提示今后在同類班次的教學中，應增加這2個題型的難度。從覆蓋度上看，判斷題和多選題間以及多選題和簡答題間相關系數(shù)較高，說明試卷覆蓋度不夠好，今后在出題時，應注意授課的覆蓋面，避免在教學的重點地方反復出題。另外，作為結束考試，只出了6個類型題，覆蓋面也難達到高的要求，以后應增加試題類型，提高試題覆蓋度。試卷總區(qū)分度較好，但概念題和單選題區(qū)分度為0.09（＜0.2），區(qū)分度較差，幾乎不可取用，應提高概念題和單選題區(qū)分度，可增加其難度。

綜上所述，試題難度較為理想，個別試題難度偏低；覆蓋度較差；總區(qū)分度良好，個別試題區(qū)分度較差；可信度良好。這只是從學生試題成績數(shù)據(jù)進行分析和評價，實際上影響學生成績的因素很多，如命題難易程度、命題合理性、學生掌握程度、考場紀律、授課人與命題人的關系等。要提高試題質(zhì)量，應注意以下幾點：（1）注意試題難度和難度分配。在出題時，應將試題平均難度控制在0.5（0.4～0.7）左右。另外，應把難度分配做到相對平均又有所側重。（2）增加試題類型和數(shù)量。通過提高信度反過來提高難度和區(qū)分度。（3）加強試題質(zhì)量評價。

[1]羅伯特·L·艾伯爾著，漆書清譯.教育測量綱要[M].南昌：江西師范大學高等教育研究室，1979.

G40-03

1671-1246（2010）24-0041-02