摘 要:文中簡要介紹網(wǎng)上閱卷概念、工作原理及優(yōu)點,重點指出高校網(wǎng)上閱卷在客觀題識別,評分質(zhì)量監(jiān)控,成績趨中,網(wǎng)上閱卷數(shù)據(jù)利用等方面的問題。針對這些問題,文中提出對評卷員評分質(zhì)量進行考量的維度及監(jiān)控方法。指出造成成績趨中這現(xiàn)象的主要原因,并提出一套適應高校網(wǎng)上閱卷的成績計算方法。面對網(wǎng)上閱卷產(chǎn)生的大量數(shù)據(jù),文中指出如何利用這些分析數(shù)據(jù)來指導教學和提高命題質(zhì)量。
關(guān)鍵詞:網(wǎng)上閱卷;評分質(zhì)量監(jiān)控;分析數(shù)據(jù);命題質(zhì)量
與傳統(tǒng)的人工紙筆閱卷模式相比,客觀題自動評分,主觀題網(wǎng)上閱卷的閱卷模式更受人們喜愛,它既保留了多年積累的閱卷經(jīng)驗,又實現(xiàn)了計算機輔助控制評分誤差。不僅高考、中考等大型考試,越來越多高校也采取網(wǎng)上閱卷來組織實施閱卷。網(wǎng)上閱卷不僅可以節(jié)省大量人力物力,提高閱卷效率,而且可以提高閱卷的準確性,真正實現(xiàn)閱卷的公平公正,因此它代表著未來閱卷工作的主要方向。
1 網(wǎng)上閱卷的概念和特點
網(wǎng)上閱卷是以高速掃描技術(shù)、計算機網(wǎng)絡技術(shù)、圖像處理技術(shù)和數(shù)據(jù)庫技術(shù)為依托,評卷人可以在網(wǎng)上對電子化的考生答卷進行評閱的一種閱卷手段。網(wǎng)上閱卷采取試卷隨機分發(fā)、多人評閱、專家仲裁的評卷模式。
網(wǎng)上閱卷由計算機對考生答題卡,通過掃描儀以圖像的方式掃描到計算機,按照既定的程序進行圖像切割、編碼,存入服務器。客觀題部分進行OMR識別,并對比標準答案給分。主觀題部分則通過終端計算機屏幕顯示相應的答題圖像,圖像隱去答題以外的任何信息。評卷員依據(jù)評分標準,通過鍵盤與鼠標進行評閱[1]。網(wǎng)上閱卷與人工閱卷的區(qū)別在于試卷隨機分發(fā),屏蔽了除閱卷試題外的任何信息,且是在電子化的圖像上閱卷,因此,它具有如下優(yōu)點:
1)閱卷的公平性。網(wǎng)上閱卷屏蔽考生信息,隨機分發(fā)考生答卷,使得閱卷更加透明化,有效避免了人為干預考試分數(shù)的可能性,保證評卷過程公平公正[2]。
2)成績的準確性。閱卷系統(tǒng)通過雙評或多評的誤差控制機制,保證閱卷的科學準確性;系統(tǒng)的自動登分與統(tǒng)分功能,避免人工操作可能導致的錯誤[2]。
3)閱卷的高效率性。網(wǎng)上閱卷實現(xiàn)客觀題自動評分,主觀題網(wǎng)上評閱,評閱完成,系統(tǒng)自動統(tǒng)分,極大程度的減少工作量,提高工作效率。
4)閱卷的可監(jiān)控性。網(wǎng)上閱卷實時全程監(jiān)控,隨時查詢閱卷的總體進度、每位評卷員的閱卷評分情況,這些便捷的閱卷工作檢查和監(jiān)控方式,是傳統(tǒng)閱卷方式無法達到的。
5)強大的數(shù)據(jù)分析功能。網(wǎng)上閱卷系統(tǒng)能夠及時地提供考試后的數(shù)據(jù)分析,可以輕松的計算試卷(各題)難度、區(qū)分度、信度、標準差,以及學生在每道小題的答題情況都能清晰的反映出來。
2 高校網(wǎng)上閱卷現(xiàn)狀及問題
2.1 OMR系統(tǒng)識別缺陷
網(wǎng)上閱卷用到OMR有兩個方面,一是考生信息的OMR區(qū)域識別,考生信息填涂不清晰,不正確和漏填,都需要考試工作人員耗費不少人力物力來檢查信息填寫情況。二是客觀題OMR塊識別,OMR塊識別就是統(tǒng)計OMR塊內(nèi)的黑色像素百分比,如果達到某個值就認為某選項被學生選中,填涂過淡或過濃的試卷容易導致識別率降低。
2.2 評分質(zhì)量監(jiān)控不到位
高??荚嚲哂幸?guī)模小,課程多的特點。而且,它是參照性考試,考查的是學生對課程知識的掌握情況,參照點局限于優(yōu)良率,及格率,平均分,知識模塊得分率等信息。高??荚嚨奶攸c、規(guī)模限定了它在如下提高閱卷質(zhì)量監(jiān)控措施方面相對薄弱:1)組織專家細化評分細則,制定合理的評分標準;2)制定合理的評分誤差值;3)對評分員進行閱卷前培訓;4)組織專家組與評卷員試評,對比分析評分結(jié)果來檢驗評卷員對評分標準掌握情況;5)組織專家組對試卷進行抽查,復評;6)一些檢測評分誤差控制質(zhì)量的硬件設施等。如上環(huán)節(jié)少有高校有正規(guī)的組織檢查,且少有高校網(wǎng)上閱卷有對評卷員評分質(zhì)量監(jiān)控,評分質(zhì)量一致性檢查。有些閱卷系統(tǒng)自身有簡單的對評卷員評分質(zhì)量監(jiān)控,但也很少高校重視這些數(shù)據(jù)。這些現(xiàn)狀導致主觀題評分受評卷員業(yè)務知識水平,教學工作經(jīng)驗,對問題敘述方式愛好,評卷時工作態(tài)度影響極大。
2.3 趨中效應加劇問題
高??荚嚾藗冴P(guān)注的是少量高分,不及格人員信息,不會太關(guān)注成績中等考生具體分數(shù),高校主要從平均分、優(yōu)良率、及格率,某題得分率等角度來評價課程教學情況和學生對知識掌握情況,這些導致打中間分就成為高校網(wǎng)上閱卷常見現(xiàn)象。
趨中效應加劇是評分員打中間分和成績計算方法采取平均分法等因素造成的。由于人力物力等現(xiàn)實狀況限制,高校網(wǎng)上閱卷基本采取雙評,用平均分法計算考生成績,很少用三評、四評。這些因素導致高校一些主觀題占主導的課程既沒有高分,也沒有低分,加劇了分數(shù)集中,不利于考生能力區(qū)分。
2.4 利用網(wǎng)上閱卷數(shù)據(jù)對命題組卷指導不夠
網(wǎng)上閱卷提供全樣本量的全部分數(shù),為命題和題庫建設提供詳細的統(tǒng)計數(shù)據(jù)。目前少有研究如何利用這些統(tǒng)計數(shù)據(jù)來指導命題質(zhì)量和題庫建設質(zhì)量。
2.5 利用網(wǎng)上閱卷數(shù)據(jù)對教學指導不夠
如何利用網(wǎng)上閱卷強大的分析數(shù)據(jù),更加深入的分析學生學業(yè)質(zhì)量,從而更加有效地指導日常教學。目前鮮少有人從這個角度進行較為深入的探討和研究,從而導致當前的情況基本上是網(wǎng)上閱卷得到的數(shù)據(jù)和日常教學相互分離的狀態(tài)。
3 應對措施
3.1 增強OMR識別
提高OMR識別率,系統(tǒng)采取設置兩個有效填涂黑度值,在掃描識別時使用兩個不同的值進行圖像識別,以找出填涂過淡的客觀題。OMR識別有效填涂黑度值的大小根據(jù)OMR塊圖像中的黑色素來設置,不足之處是值得大小的把握目前沒有好的方便快捷的方法,基本上是依靠經(jīng)驗或通過重復的測試與驗證。提高OMR識別準確性,在網(wǎng)上閱卷系統(tǒng)中增加客觀題的查錯與校正模塊,并使用視圖和存儲過程將可能的問題卷提取出來,用人工的方式進行校正。
3.2 評分員評分質(zhì)量監(jiān)控
對評分員閱卷質(zhì)量的監(jiān)控一般采取計算評分員的標準差、平均分、全距、評分速度、有效評分率等質(zhì)量來進行考量[3-6]。
1)標準差。標準差代表了評卷員評分的離散程度,標準差越大,說明給分越分散,其評分結(jié)果可能不夠穩(wěn)定,標準差越小,說明給分越集中,有可能出現(xiàn)打中間分情況。
2)平均分。通過對評卷員在某題的平均分與該題所有評卷員的平均分進行比較分析,可以判斷出該評卷員評分的寬嚴程度。
3)全距。評卷員評分的最高分與最低分只差叫全距,全距越低,可能出現(xiàn)打中間分情況。
4)評分速度。評卷員的評分速度過快,超出正常范圍,就有可能出現(xiàn)打中間分情況。
5)有效評分率。評卷員對某試題的評分與其他評卷員評分的差值不超出評分誤差閾值,則這份試卷屬于有效評卷。該評分員的有效評卷數(shù)量與其評卷總數(shù)量的比率稱有效評分率,該值越大,說明評卷質(zhì)量越好。
評卷員評分質(zhì)量監(jiān)控方法有三種。一是在不同時段,或一定工作量內(nèi),對部分評卷員評卷的標準差、平均分、有效度和評卷速度等進行綜合比較分析,數(shù)據(jù)越接近,說明穩(wěn)定性越好;二是抽取部分評分速度快、全距小的評卷員試卷,尤其是分值相同試卷,由專家進行復評,比較評卷員與專家評分分布,檢測評卷員的評分標準把握情況及嚴寬程度;三是隨機抽取部分評分速度快、全距小的評卷員的已評試卷,尤其相同分值試卷,重新發(fā)給本人重新評分,比較兩次評分差值,差值越小或者零差值,說明其一致性好。
3.3 控制趨中效應加劇
由于人力物力和文中上述提到的種種現(xiàn)實因素導致高校主觀題為主課程分數(shù)集中,區(qū)分度低。主要原因:一是評分要點不明確,沒有合理評分標準;對評卷員評分沒有約束機制,評卷員打分隨意,打中間分現(xiàn)象常見。針對這些情況,可以采取制定合理的評分標準,采用上述監(jiān)控評卷員評分質(zhì)量方法加以控制。二是成績計算方法不合理。平均值法對評分要點,評分標準明確的計算類題型,影響不大,但對于論述題,寫作題,這種評分方式就有一定的局限性。
設置評分誤差A(取總分1/6),X1,X2為評卷員對同一題的評分,該題優(yōu)秀分數(shù)值設為E(試題總分的85%),及格分數(shù)值P(試題總分60%),成績計算方法:| X1-X2|A,若X1,X2中一值大于E,一值小于P,則說明該題兩評卷員評分存在較大爭議,那這兩次評分作廢,該試卷重新投入到未評試卷中重新評閱;否則進行三評,成績?yōu)閄3,當| X1-X3| 3.4 網(wǎng)上閱卷對提高命題質(zhì)量作用 高校課程考試試卷每年考題是可以出現(xiàn)類似或重題,若組卷系統(tǒng)和網(wǎng)上閱卷系統(tǒng)之間兼容,評分誤差控制閾值A可以采取試題總分1/6,也可以采取更精準的誤差值(歷年網(wǎng)上閱卷該題或相似試題評分誤差平均值)。網(wǎng)上閱卷該題批改所計算的難度、區(qū)分度、效度等評價試題質(zhì)量的指標數(shù)據(jù)反饋與組卷系統(tǒng),組卷系統(tǒng)統(tǒng)計該題或相似試題總考核次數(shù),原難度、原區(qū)分度,本次難度,本次區(qū)分度,效度等,及時修正試題庫該題的各項指標值。通過這些指標值可以篩選出一些不合理試題,還能為智能組卷系統(tǒng)提供可靠、科學的參考數(shù)據(jù),提高命題質(zhì)量。 3.5 網(wǎng)上閱卷對教學指導 目前人們對網(wǎng)上閱卷數(shù)據(jù)基本局限于平均分、分數(shù)段人數(shù)等,這些統(tǒng)計結(jié)果往往只能體現(xiàn)出校與校、班與班之間的大體差異。通過網(wǎng)上閱卷數(shù)據(jù)可以計算班級、個人在某知識點、某題的得分情況,比較班級、個人在具體知識點、章節(jié)、某題的差異。如:利用網(wǎng)上閱卷各題的具體得分情況,可以計算章節(jié)、知識點的得分率,能有效評價教師該章節(jié)、知識點的教學質(zhì)量。提供的具體考生在各題的具體得分,可以精確計算出考生在具體章節(jié)、知識點的得分率,可用于指導考生找出學習的薄弱環(huán)節(jié)。網(wǎng)上閱卷提供的大量的具體的數(shù)據(jù),需要我們利用不同方法、算法,從多角度多層次進行分析,從而指導教與學。 4 結(jié)束語 網(wǎng)上閱卷是未來閱卷發(fā)展的總體方向和趨勢,其發(fā)展前景是從局域網(wǎng)網(wǎng)上評卷發(fā)展到遠程網(wǎng)網(wǎng)上評卷,從固定場所集中閱卷發(fā)展為分散的個體化評卷。面對這樣的趨勢,人們只有完善網(wǎng)上閱卷評分質(zhì)量,加強對網(wǎng)上閱卷數(shù)據(jù)大量分析數(shù)據(jù)的利用,才能更好的幫助教師了解學生學習情況、發(fā)現(xiàn)日常教學中存在的問題,進行總結(jié)與反思,調(diào)整和改進教學方法。 參考文獻 [1]李美華.網(wǎng)上閱卷工作原理與誤差控制[J].中國考試,2005(10):46-47. [2]王文成.“人機對抗”視域下主觀題評分誤差控制策略研究[J].中國考試,2013(9):11-19. [3]賈志先.基于譜聚類的網(wǎng)上閱卷質(zhì)量控制研究[J].智能計算機與應用,2014(5):76-79. [4]曹建莉,張強.評卷質(zhì)量監(jiān)控模型及其統(tǒng)計分析[J].統(tǒng)計與決策,2012(18):29-31. [5]劉建華,馬睿等.主觀題網(wǎng)上評分員隊伍建設與誤差控制研究[J].中國考試,2012(9):32-39. [6]宋濤.網(wǎng)上閱卷評分員閱卷質(zhì)量評價分析體系及模型研究[D].河南大學碩士畢業(yè)論文,2010. 作者簡介 許小紅(1979-),女,漢族,江西萬安,碩士,講師,研究方向:考試管理。