王艷萍
(仰恩大學(xué),福建泉州362014)
教育測量學(xué)視角下的高校平時考試管理探討
王艷萍
(仰恩大學(xué),福建泉州362014)
平時成績是為彌補(bǔ)考試制度的不足而設(shè)計(jì)出的主要措施。以考試數(shù)據(jù)的統(tǒng)計(jì)和解析為基礎(chǔ),將平時成績進(jìn)行數(shù)量化,分析平時成績的影響因素,并以此提高平時考核的質(zhì)量,加強(qiáng)考試管理。
平時成績;定量分析;影響因素
考試是檢查教學(xué)效果、評定學(xué)生學(xué)業(yè)成績、促進(jìn)教育目標(biāo)實(shí)現(xiàn)的重要手段。在高等學(xué)校里,考試作為教學(xué)管理的一個重要環(huán)節(jié),具有很強(qiáng)的導(dǎo)向性。
衡量考試的質(zhì)量通常有四個重要的指標(biāo):即考試的效度、信度、試題的難度和區(qū)分度,四者相互關(guān)聯(lián)。對于在每門課程總成績中占15-30%比例的平時成績來說,其考核質(zhì)量如何,足以影響該門課程的整體考核水平。但由于平時考核隨日常教學(xué)分散進(jìn)行,而且不同課程之間以及不同教師之間,在平時考核的方法、內(nèi)容、次數(shù)等方面差別很大,相對于期末考試而言,平時考核方式不可能統(tǒng)一,質(zhì)量難以評價。所以,目前幾乎所有課程的成績分析都局限于期末考試,基本上演變成期末單純的“試卷分析”,普遍缺少對平時成績的關(guān)注,更難見到對平時考核質(zhì)量的量化評價。那么,現(xiàn)在的平時成績考核質(zhì)量如何,誤差到底有多大?能否找到可行的科學(xué)評價方法,定量分析平時成績,以提高平時考核質(zhì)量,也是一個值得探討的問題。
我們從某校某學(xué)年某學(xué)期全校課程中抽取部分有代表性課程的考試資料,借用教育測量中的試卷分析基本方法,嘗試計(jì)算各門課程平時成績的難度與區(qū)分度。進(jìn)而分析平時成績的考核質(zhì)量。
1.我們按照課程類型,分別從公共必修課、專業(yè)必修課、公共選修課、專業(yè)選修課中,抽取有代表性的12門課程進(jìn)行分析。
2.12門課程的成績單、平時考核記錄是我們分析所依據(jù)的主要資料。
3.計(jì)算平時成績的難度、區(qū)分度。
眾所周知,試題的難度是試題對于考生來說難易程度的指標(biāo),是一種試題性能指標(biāo)。以得分率作為難度系數(shù)來表示的,具體算法是,用參加考試的人平均分除以試題的總分,得分率越高即難度系數(shù)越大,則表示試題越容易。區(qū)分度是指測試題目對所測試的屬性的鑒別力,也就是測試的效度??煞从吃囶}對考生素質(zhì)的區(qū)分情況。在不限題型情況下,為了簡單計(jì)算,我們可以使用下面的一種方法進(jìn)行計(jì)算區(qū)分度:先將分?jǐn)?shù)排序,P1=27%高分組的難度,P2=27%低分組的難度,區(qū)分度D=(27%高分組的平均分-27%低分組的平均分)÷滿分值[1]。
根據(jù)區(qū)分度評價題目性能的標(biāo)準(zhǔn)如表1所示。
表1 試題區(qū)分度評價標(biāo)準(zhǔn)[2][3]
試題難度系數(shù)在一個定的范圍內(nèi),而且有相對高的區(qū)分度時,試題就被認(rèn)為是質(zhì)量好的試題。試題質(zhì)量是由該試題的難度和區(qū)分度共同構(gòu)成的。如表2所示。
表2 試題區(qū)分度與難度的關(guān)系[3]
在教師最后提交的成績單上,平時成績是若干次平時考核結(jié)果的匯總成績,我們視為一道特殊試題的得分,按照一般試題分析方法,計(jì)算其難度與區(qū)分度。計(jì)算時忽略各門課程平時考核方法和次數(shù)的差別以及選課學(xué)生人數(shù)差異。如下表:
表3 部分課程平時成績分析表
4.訪問相關(guān)教師和學(xué)生,了解平時成績的具體考核方式、過程,聽取體會、感受和評價。
1.總體上平時考核標(biāo)準(zhǔn)不高,難度不大
各門課程平時成績的難度普遍地明顯偏低。在12個分析對象中,難度系數(shù)只有2個低于0.8,平均達(dá)0.84。這說明平時成績的考核標(biāo)準(zhǔn)不高、難度不大,與課程考核的總成績比較,無論專業(yè)必修課還是公共必修課,無論是專業(yè)選修課還是公共選修課,無論平時成績在總成績中所占比例如何,學(xué)生都能比較容易地獲得平時成績。
2.總體上平時成績的區(qū)分度偏低,檢測作用不大
各門課程平時成績的區(qū)分度普遍偏低。在12個分析對象中,高于0.2的只有2個,低于0.1的,卻也有2個,最低的只有0.008。這說明學(xué)生的平時成績比較接近,無論學(xué)習(xí)效果好壞,平時成績差距不大,只有少數(shù)課程拉開檔次。個別課程的平時成績偏高而且分?jǐn)?shù)非常接近。這樣的平時考核或許可以督促學(xué)生出勤,有利于日常教學(xué)組織與管理,但已經(jīng)喪失了檢測學(xué)生學(xué)習(xí)效果的功能,其鑒別作用幾乎蕩然無存。
3.總體看試題需要修改
將表3和表1、表2對照可以看出,與理想試題還有一定的距離。
4.個別課程的平時成績區(qū)分度異常
同類課程的平時成績區(qū)分度總體上相近,但個別課程的平時成績的區(qū)分度明顯異于同類其他課程,顯然受到特殊因素影響。
從以上所得結(jié)論可以看出,各門課程的平時成績的考核質(zhì)量參差不齊,影響因素可能是多方面的。結(jié)合師生調(diào)查所獲得的信息綜合分析,影響因素主要是:
教師教學(xué)過程中是否嚴(yán)格考核,是影響平時成績考核質(zhì)量的關(guān)鍵因素。調(diào)查中發(fā)現(xiàn),有的教師嚴(yán)格認(rèn)真,其給出的平時成績,有多次考核記錄,無論作業(yè)、還是專題綜述,都詳細(xì)閱批、記載,因此,平時成績的難度、區(qū)分度均較好。有的教師平時考核不多,記載不詳,或憑大致印象給分,最后,平時成績往往既偏高又拉不開檔次。這里,除了教師個人工作作風(fēng)起作用外,還與教師對不同類型課程的態(tài)度有關(guān),比如,選修課的任課教師中本不乏認(rèn)真之人,但可能是教師對選修課的重視程度不夠,或者遷就即將畢業(yè)的高年級學(xué)生考研、找工作,出于無奈,平時考核便“高抬貴手”。
正常情況下,低年級學(xué)生對必修課普遍予以充分重視,平時學(xué)習(xí)精力投入較大,學(xué)習(xí)效果較好,教師比較滿意,所以平時成績相對偏高一些,當(dāng)屬正?,F(xiàn)象。高年級部分學(xué)生不重視選修課,有的甚至“混學(xué)分”,選修課的平時成績按理說應(yīng)該相對偏低而且拉開檔次。但目前選修課的平時成績并非如此,未能反映真實(shí)狀態(tài)。
專業(yè)必修課相比公共必修課,往往教學(xué)班額較小,教師教學(xué)自由度較大,特別是結(jié)合教師科學(xué)研究成果,前沿性教學(xué)內(nèi)容有深度,綜合性作業(yè)有廣度,學(xué)生學(xué)習(xí)效果因?qū)W習(xí)難度增加而差距明顯,因此,平時成績應(yīng)該有較大的難度與較好的區(qū)分度。
有的教師沒有認(rèn)真設(shè)計(jì)平時考核內(nèi)容,測試目標(biāo)不明確,考核隨機(jī)性過大,這些都影響平時考核質(zhì)量。
另外,對于“考勤”應(yīng)不應(yīng)該作為考核內(nèi)容,存在不同看法。目前多數(shù)學(xué)校規(guī)定“出勤”是平時考核的一項(xiàng)內(nèi)容,“上課點(diǎn)名”是平時考核的一種方式,但一般對“出勤”在平時成績中所占比例不做具體規(guī)定。實(shí)施過程中,教師在“考勤”的掌握上差別很大,有的教師平時考核的項(xiàng)目較多,出勤只占平時成績的一小部分,有的教師平時考核的項(xiàng)目較少,主要以“點(diǎn)名”方式確定平時成績。更有甚者,以“某一次簽到”作為整個課程是否及格的依據(jù),以致引發(fā)師生沖突。對此有人質(zhì)疑:學(xué)習(xí)過程不等同于學(xué)習(xí)效果,特別是在學(xué)分制條件下,把學(xué)習(xí)紀(jì)律換算成學(xué)習(xí)成績,顯然缺乏科學(xué)性,應(yīng)該深入研究,尋求完善。
量化分析發(fā)現(xiàn),在有的課程的低分組學(xué)生中,個別學(xué)生的平時成績呈現(xiàn)“高異?!?,與期末考試成績形成明顯反差,似有提分之嫌。這反映出目前可能存在一些其他因素影響平時考核,有的教師或許顧及人情,或許考慮及格率,以平時成績做調(diào)控砝碼,導(dǎo)致平時成績失真。
綜上所述,借鑒教育測量中試卷分析的基本方法,計(jì)算平時成績的難度與區(qū)分度,能夠獲得許多平時考核工作信息,參考常規(guī)評價經(jīng)驗(yàn),根據(jù)平時考核特點(diǎn),可以初步做出某些質(zhì)量判斷(比如,比較理想的試卷的的區(qū)分度應(yīng)該>0.4)。但對于各門課程千差萬別的平時考核方式而言,肯定沒有劃分考核質(zhì)量優(yōu)劣的絕對數(shù)值。任何分?jǐn)?shù)變異或難度與區(qū)分度異常,都有其原因,有的可能與課程特有的考核方式有關(guān),應(yīng)該具體情況具體分析。
[1]康乃美.考試管理技術(shù)[M].武漢:華中師范大學(xué)出版社,2008:134-135.
[2]雷新勇.考試數(shù)據(jù)的統(tǒng)計(jì)分析和解析[M].上海:華東師范大學(xué)出版社,2007:247-248.
[3]李顯峰,王淵.考試質(zhì)量量化分析與評價方法[J].西北醫(yī)學(xué)教育,2009(4).
[4]許成安,王家新.大學(xué)課程平時成績評定依據(jù)的比較研究[J].中國大學(xué)教學(xué),2005(7).
[5]侯志強(qiáng).平時成績的評定方法研究[J].科技資訊,2007(26).
[6]封進(jìn),黎孟珠.平時成績量化管理的教學(xué)探索[J].航天工業(yè)高等??茖W(xué)校學(xué)報2010(1).
Anal y sing the Usual Performance to Strengthen the Management of Examination
WANG Yan-ping
(Yang-En University,Quanzhou,F(xiàn)ujian,362014,China)
The usual performance is the major measure to make up the defect of the test system.Based on the statistics and analysis of the examination data,the article gives an amount to the usual performance,analyses the factors influenced the usual performance and tries to improve the quality of the usual assessment and strengthen the management of the examination.
usual performance;quantitative analysis;in fuenced factor
G642.47
A
1009-2277(2011)02-0084-03
2011-02-18
王艷萍(1963-),女,福建仰恩大學(xué)助理研究員,學(xué)士。從事教學(xué)管理和考試研究。
責(zé)任編校:鄧小妮