中醫(yī)學專業(yè)內經選讀試卷質量分析與教學反思※

2016-04-22 06:09:57丁曉潔董正平王醊恩孔祥勇

中國中醫(yī)藥現代遠程教育 2016年6期

關鍵詞：難度區(qū)分度信度

丁曉潔　董正平　王醊恩　孔祥勇

（濱州醫(yī)學院中西醫(yī)結合學院，煙臺　264003）

中醫(yī)學專業(yè)內經選讀試卷質量分析與教學反思※

丁曉潔董正平王醊恩孔祥勇

（濱州醫(yī)學院中西醫(yī)結合學院，煙臺264003）

摘要：目的評估中醫(yī)學專業(yè)本科生內經選讀期末考試試卷質量，為改革教學方法，提高教學質量，促進試題庫建設提供依據。方法對60名中醫(yī)學專業(yè)本科生內經選讀期末考試成績，運用SPSS19.0軟件進行統(tǒng)計分析，得出難度、區(qū)分度和信度。結果學生成績呈正態(tài)分布，難度系數0.27，區(qū)分度0.636，信度0.734。結論本次考試成績分布較合理，試題較容易，區(qū)分度和可信度較高，能反映學生的真實水平和個體差異。教師在教學方法和命題方面需要進一步改進。

關鍵詞：內經選讀；試卷質量分析；難度；區(qū)分度；信度；教學法

內經選讀課程是培養(yǎng)中醫(yī)藥專門人才，提高中醫(yī)藥文化素質的重要課程，是中醫(yī)學專業(yè)本科的必修課程，也是最重要的基礎課程。學生對《內經選讀》這門課程的掌握程度直接關系到中醫(yī)學人才培養(yǎng)的質量。高等醫(yī)學院校必修課程的考試是對學生知識的理解和掌握程度重要測評工具，試卷質量和學生的考試成績是衡量教與學質量的主要手段和方法[1]。通過對內經選讀試卷進行質量分析，不僅可以反映學生對這門課程掌握的真實水平[2]，還可以評價試題質量、發(fā)現教學中存在的問題，為完善試題庫建設、改進教學方式、提高教學水平提供指導。

1　資料與方法

1.1一般資料采用中國中醫(yī)藥出版社出版的全國中醫(yī)藥行業(yè)高等教育“十二五”規(guī)劃教材(第九版），選取我校中醫(yī)學專業(yè)2012級中醫(yī)3班內經選讀期末考試試卷為研究對象。參加考試人數60人，共60份有效試卷，考試采用的是終結性評價。試卷包括5類題型，試卷結構如表1。試題由專業(yè)授課教師根據學科培養(yǎng)方案、課程教學大綱命題。試卷的評判依據命題教師制定的標準答案及評分標準，嚴格按照標準完成閱卷。

表1　試題題型分值分布表?。ǚ郑?/p>

1.2統(tǒng)計學方法利用Excel 2003將60份試卷按每個學生的學號、姓名、各題的得分及總分情況雙份輸入，并經仔細核查與修訂。然后將Excel表格中數據導入到SPSS19.0軟件，在數據視圖中定義變量名分別為學號、姓名、單選題、多選題、填空題、默寫原文題、論述題、總分，在變量視圖中檢查數據類型，學號和姓名定義為字符型，長度為8；各題得分和總分定義為數值型，長度為8，小數點后長度為0。然后進行統(tǒng)計描述和統(tǒng)計推斷，通過計算難度、區(qū)分度和信度進行試卷質量分析。

2　結果

2.1成績基本統(tǒng)計描述考試成績的基本統(tǒng)計描述指標選擇均值、中值、標準差、偏度、峰度、極大值和極小值等統(tǒng)計量。輸出描述統(tǒng)計結果如表2和圖1。平均分為72.8，標準差為13.173，標準差值較大，說明學生個體之間存在較大的差異。

表2　學生試卷成績的統(tǒng)計描述部分指標　（分）

圖1　學生試卷成績頻數分布

2.2正態(tài)檢驗考試成績一般要求符合正態(tài)分布，若不符合正態(tài)分布，說明考試結果不理想，出現低分數段人數太多（正偏態(tài)分布）或高分數段人數太多（負偏態(tài)分布）兩種情況[3]。從成績分布的直方圖可以初步判斷，學生的考試成績近似服從正態(tài)分布，進一步用單樣本K-S檢驗來判斷，檢驗結果顯示sig值為0.796，大于0.05，可以認為學生成績呈正態(tài)分布。

2.3難度分析難度是指試題的難易程度，它是衡量試題質量的一個重要指標參數。計算公式為P=1—x/w（P為難度系數，x為某題得分的平均分數均值，w為該題的滿分。難度系數P值越小表明試題越容易，難度系數P值越大表明試題越難，最小值為0，最大值為1。一般認為，試題的難度系數在0.3～0.7之間比較合適，整份試卷的平均難度最好在0.5左右。在數據視圖中，將表1中各類型試題的滿分、總分和表2中各類型試題的均值、總分的均值直接錄入，并定義變量名為“滿分”和“均值”。然后點擊轉換-變量計算，在目標變量中輸入難度系數P，在數學表達式中輸入公式1-均值/滿分，計算出各個試題和試卷的難度系數。結果如表3。

表3　試題難度系數

由表3可以看出，多選題難度系數最大，為最難題型；默寫原文題難度系數最小，為最易題型。整個試卷難度系數為0.27<0.3，說明難度偏小，試題較易。提示應該適當增加試題難度，特別是單選題、默寫原文題和論述題。

2.4區(qū)分度分析區(qū)分度（D)是指試題對學生實際水平的鑒別能力，是一種區(qū)別學生成績優(yōu)劣的統(tǒng)計指標，一般與試題的難度系數一起來分析。對試卷進行區(qū)分度分析時，常以考試總分作為學生的實際能力水平，學生在某題的得分與總分的相關系數作為該題的區(qū)分度。對于客觀題來說，一般使用Spearman相關分析；對于主觀題來說，一般使用Pearson相關分析。這些分析在SPSS中都有相應菜單命令。整個試卷的區(qū)分度由各題的區(qū)分度求加權算術均數。一般要求試題的區(qū)分度在0.3以上。區(qū)分度在-1至1之間。D≥0.4時，說明該題目的區(qū)分度很好；D≤0.2時，說明該題目的區(qū)分性很差。D值為負數時，說明試題或答案有問題。本次考試的區(qū)分度結果如表4。

表4　試題區(qū)分度

由表4可以看出，本試卷各題型的區(qū)分度較高，整個試卷的區(qū)分度為0.636，能區(qū)分出學生之間的實際水平差異。結合前面的難度系數分析，提示成績較低的學生要加強學習的自覺性。

2.5信度分析信度是指測驗結果的一致性、穩(wěn)定性及可靠性。試卷的信度分析可以反映試卷測試結果是否代表學生的真實水平。信度系數取值范圍為0～1，其值越大，信度越高，表示該測驗的結果愈一致、穩(wěn)定與可靠。試卷信度分析可以采用SPSS中的可靠性分析，選用α模型。本次考試的試卷信度為0.734，說明試卷的信度較高，較真實的反映了該班學生的學習狀況和實際水平。

3　結論與建議

本次考試成績分布符合正態(tài)分布，平均分為72.8，標準差為13.173，標準差值較大，說明學生個體之間存在較大的差異。在難度分析中，試題難度偏小，試題較易，提示應該適當增加試題難度，特別是單選題、默寫原文題和論述題。在區(qū)分度分析中，試卷的區(qū)分度較高，能區(qū)分出學生之間的實際水平差異，提示成績較低的學生要加強學習的自覺性。在信度分析中，試卷的信度較高，較真實的反映了該班學生的學習狀況和實際水平。本次試卷質量分析可以比較客觀的反映教師與學生“教”與“學”的水平與效果，可以看出有個別學生上課不認真聽講，課后也不下功夫復習，導致學生個體之間差異較大。提示教師在今后的教學和命題方面需要進一步改進，調整試題的難易度，改革教學方法，關注考試成績低的這些考生，想辦法調動他們的學習積極性，從而提高學習成績。另外，通過SPSS對試卷進行質量分析，具有方便、快捷、準確的優(yōu)點，也可進一步篩選試題、修訂試卷，提高試卷命題質量，并為建立和完善試題庫提供參考。

參考文獻

[1]楊文清，郭克峰.五年制臨床醫(yī)學專業(yè)康復醫(yī)學試卷分析與思考[J].醫(yī)學教育探索，2009，8(6):648-650.

[2]杜玉霞，梁武，方玲玲.SPSS軟件在高等數學試卷成績分析中的應用[J].洛陽師范學院學報，2015，34(2):89-91.

[3]黃松林，岳青.基于SPSS17的護理專業(yè)預防醫(yī)學試卷分析[J].教育與教學研究，2012，26(6):83-85.

Analysis and Teaching Reflection on Examination Paper Quality of Neijing Selected Readings of Traditional Chinese Medicine Specialty

DING Xiaojie, DONG Zhengping, WANG Zhuien; KONG Xiangyong
(College of Integrated Traditional Chinese and Western Medicine, Binzhou Medical University, Shandong Province, Yantai 264003, China)

Abstract:Objective To assess final examination paper quality of Neijing Selected Readings of undergraduates in traditional Chinese medicine specialty, and to provide the basis for reforming teaching methods, improving teaching quality and promoting item bank construction. Methods Obtaining difficult coefficient, discrimination and reliability by using SPSS19.0 software for Statistical analysis of final examination results of Neijing Selected Readings of 60 undergraduates in traditional Chinese medicine specialty. Results Students' score normally distributed, difficult coefficient was 0.27, discrimination was 0.636, and reliability was 0.734. Conclusion The test scores distribution is reasonable, this test is easier, and discrimination and reliability are higher. This test could reflect the students' real level and individual differences. Teachers need further improvement in teaching methods and setting questions.

Keywords:Neijing Selected Readings; examination paper quality analysis; difficult coefficient; discrimination; reliability; teaching method

收稿日期：（本文編輯：張文娟本文校對：楊毅2015-12-17）

基金項目：※山東省本科高校教學改革研究項目（No：2015M028）；濱州醫(yī)學院中西醫(yī)結合學院教學改革項目（No：BYZXY201406）

doi:10.3969/j.issn.1672-2779.2016.06.002

文章編號：1672-2779（2016）-06-0003-03

中醫(yī)學專業(yè)內經選讀試卷質量分析與教學反思※

1 資料與方法

2 結果

3 結論與建議

1　資料與方法

2　結果

3　結論與建議