曹 佳,孫 艷,陳麗麗,高曉華
(哈爾濱醫(yī)科大學公共衛(wèi)生學院,黑龍江 哈爾濱 150081)
預防醫(yī)學考試試題質(zhì)量評價
曹 佳,孫 艷,陳麗麗,高曉華
(哈爾濱醫(yī)科大學公共衛(wèi)生學院,黑龍江 哈爾濱 150081)
目的 評價預防醫(yī)學考試試題質(zhì)量,以便科學地命題,理想地檢驗學生成績,使成績考核能真實地反映教學質(zhì)量。方法 運用統(tǒng)計學方法對試題難度、覆蓋度、區(qū)分度、可信度進行分析。結果 試題難度適當,覆蓋度欠佳,區(qū)分度尚好,可信度良好。結論 在出題時,要注意試題難度和難度分配,增加試題類型和數(shù)量,提高覆蓋度和區(qū)分度。
預防醫(yī)學;考試試題;質(zhì)量評價
如何科學地命題,理想地檢驗學生成績,是值得教師認真思考的問題。為檢驗并提高試題質(zhì)量,同時也檢驗教學上存在的問題,我們對近年來公共事業(yè)管理本科學生預防醫(yī)學試卷質(zhì)量進行評價,為以后教學命題提供借鑒。教學質(zhì)量涉及到教學的整個過程,而檢驗教學質(zhì)量的重要手段就是成績考核,而成績考核能否真實地反映教學質(zhì)量,命題顯得特別重要。試題過難、過偏,會出現(xiàn)學生成績偏低;命題過易,勢必降低了教學大綱所規(guī)定的目標,使得學生成績偏高,無法區(qū)分開學生成績的優(yōu)劣。
2001級、2002級公共事業(yè)管理本科學生103人的預防醫(yī)學試卷103份。
試題類型共分6種,分別是概念題(10分)、判斷題(15分)、單選題(15分)、多選題(25分)、簡答題(15分)、論述題(20分)。經(jīng)統(tǒng)計學方法處理,根據(jù)考試成績對各試題得分進行分析。
假設試卷題目類型個數(shù)為n,P為得分(百分制評分),n個類型題目的滿分值分別為
設抽查全體學生數(shù)為N,樣本值用x1,x2,…,xn表示。這就是所抽查到的N個學生的考試成績。用xij表示第i個學生第j題的實際得分分別表示第j題的均值和方差。
為了統(tǒng)一檢驗量綱和提高各題間的可比性,把各題的得分標準化,令,則 sij為第 i個學生第 j題的標準分。這個過程實際上就是把符合正態(tài)分布的學生成績轉化為標準正態(tài)分布的過程。令aj、bj分別表示第j題滿分和0分的標準分。
采用4項指標即難度、覆蓋度、區(qū)分度和可信度[1]作為評價試題質(zhì)量的主要指標。
覆蓋度:用各題之間相關矩陣表示,即r=(rij)n×n,其中
這種描述的基本思想是試題覆蓋面越廣,則各題之間的交叉相關性越小,反之則越大。相關系數(shù)的實質(zhì)就是反映試題覆蓋面大小。通常以 rij<0.2 為覆蓋面大(i,j=1,2,…,n)。
區(qū)分度:第i題的區(qū)分度Gj為
其中,Hj,Lj分別表示樣本中高分組、低分組第j題的平均分。高分組和低分組各占樣本容量的25%、30%為宜。試卷總區(qū)分度Gj為各題區(qū)分度的加權平均,即
區(qū)分度是標志試題能否將學生成績拉開距離,真正從分數(shù)上將好、中、差的學生區(qū)分開來。區(qū)分度G>0.4為可,G<0.2為差。
可信度描述了試卷總分差在排除了各題隨機誤差之后,余下部分占總方差的百分比。各題隨機誤差小,則試卷可信度就高,反之則可信度低。一般情況下,試卷可信度可達0.5。
(1)103份試卷成績統(tǒng)計情況(見表1)。卷面分為56.2~95.5分,平均分為(76.44±4.4)分趨于正態(tài)分布??傠y度D值為0.21,試卷難度適當;總方差為129,則可信度B=0.63,試卷可信度良好。
表1 103名學生成績統(tǒng)計(分)
(2)試卷各題相關系數(shù)矩陣。
從矩陣上看,概念題與判斷題、單選題的相關系數(shù)基本滿足<0.2的要求,判斷題、單選題與論述題的相關系數(shù)基本滿足<0.2的要求,其他各題間的相關系數(shù)均>0.2,試卷覆蓋度不夠好。
(3)對學生考試成績原始數(shù)據(jù)按從高分到低分排列,取前25名和后25名學生成績作為高分組和低分組(見表2)。試題總區(qū)分度為D=0.76。試卷區(qū)分度總體上較好。
表2 高分組與低分組間各題區(qū)分度
考試是教學中不可缺少的環(huán)節(jié),是檢查和評價教學質(zhì)量的必要手段。通過對考試成績和試卷的分析,及時發(fā)現(xiàn)教學中存在的問題,不斷完善命題工作,使考試在教學中發(fā)揮應有的作用。
從難度D值上看,多選題和論述題較難,難度均>0.2。這2個題型的確是教學重點和難點,難度設置較為理想。其余各題型難度均<0.2,特別是概念題和單選題,屬于基本概念題和容易判斷的選擇題,提示今后在同類班次的教學中,應增加這2個題型的難度。從覆蓋度上看,判斷題和多選題間以及多選題和簡答題間相關系數(shù)較高,說明試卷覆蓋度不夠好,今后在出題時,應注意授課的覆蓋面,避免在教學的重點地方反復出題。另外,作為結束考試,只出了6個類型題,覆蓋面也難達到高的要求,以后應增加試題類型,提高試題覆蓋度。試卷總區(qū)分度較好,但概念題和單選題區(qū)分度為0.09(<0.2),區(qū)分度較差,幾乎不可取用,應提高概念題和單選題區(qū)分度,可增加其難度。
綜上所述,試題難度較為理想,個別試題難度偏低;覆蓋度較差;總區(qū)分度良好,個別試題區(qū)分度較差;可信度良好。這只是從學生試題成績數(shù)據(jù)進行分析和評價,實際上影響學生成績的因素很多,如命題難易程度、命題合理性、學生掌握程度、考場紀律、授課人與命題人的關系等。要提高試題質(zhì)量,應注意以下幾點:(1)注意試題難度和難度分配。在出題時,應將試題平均難度控制在0.5(0.4~0.7)左右。另外,應把難度分配做到相對平均又有所側重。(2)增加試題類型和數(shù)量。通過提高信度反過來提高難度和區(qū)分度。(3)加強試題質(zhì)量評價。
[1]羅伯特·L·艾伯爾著,漆書清譯.教育測量綱要[M].南昌:江西師范大學高等教育研究室,1979.
G40-03
B
1671-1246(2010)24-0041-02