考試分析中最主要的指標為考試“四度”,即難度、區(qū)分度、信度和效度?,F(xiàn)就廣大教師普遍反映的如何分析這四個指標以及如何通過這四個指標進行科學合理的命題進行簡要闡述。
一、難度
試題的難度是評價試題質量的重要指標,難度是指試題或試卷的難易程度,是評估試題或試卷質量的主要指標之一。難度系數是用正答率或平均得分率表示。從這個意義上來看,將其稱之為“易度”似乎更確切。近來有不少學者已將難度改為錯答率或平均失分率,即難度系數越大,答錯的人越多,答對的人越少,即難度越大。
1.影響試題難度的幾個因素
影響試題難度的因素有許多,以下是幾個主要的因素。
?。?)題目內容要求的不同
每門課程的各章節(jié)對學生的要求不同,一般分為掌握、熟悉和了解等。要求學生必須掌握的內容,學生學得必然要好,則題目的答對率就高,反之,只要求學生了解的內容,則答對率低。此外,常見的和直接從教材取材的題目,學生容易做,難度就??;反之難度就大。
?。?)題目信息量的多少
如果題目的信息量太多,條理不清,會影響學生對題意的理解,使題目的難度增加。
?。?)題目結構的繁簡程度
題目的類型、知識的綜合程度和知識間聯(lián)系的復雜程度等,都會對題目的難度產生影響。比如選項多的題要比選項少的難度大,多項選擇題要比單項選擇題的難度大。
?。?)題目的變化程度
題目的迷惑性、干擾性、題目設置的靈活程度等,都會對題目的難度產生影響。
命題者在設定試題難度時,應考慮上述各方面的因素。從單個題目來說,可以出現(xiàn)難易的偏差,但試卷總難度系數應控制在較好的程度。
2.試卷難度水平的確定
試卷難度水平的確定取決于考試的性質和目的。就選拔性考試而言,應該使試卷的難度系數接近錄取率。然而,各學校大多的考試都是各門課程的期末考試,當然不同于選拔型考試,因此,設置試卷的難度時就應遵循以下原則。
第一,試卷中應有一定數量的難度較低的題目,用于考查學生對最基本知識的掌握,這部分題目可以不必過多地考慮難度,但數量不應太多,30%左右為宜。難度系數在0.8-0.7之間。
第二,試卷中另有一部分題目,是中等水平的考生才會做的,屬于中等難度題,應是要求掌握或熟悉的內容,難度系數應控制在0.7-0.4左右,題量應占整個試卷的50%以上。
第三,試卷中較難的題目,占整卷的10%左右,主要考察優(yōu)秀的學生,它的難度系數可控制在0.4-0.2之間。
各種難度的題目的所占的比例,應依據各門課程的考試大綱要求而定。
二、區(qū)分度
區(qū)分度是指試題或試卷對學生實際水平的區(qū)分程度或鑒別能力,用于判定試題能否把學習成績優(yōu)與劣的學生區(qū)分開來的指標。測量理論對考試的區(qū)分度十分重視,稱之為判斷考試是否有效的指示器,并作為評價試題質量、對試題進行篩選的主要依據。最常用的是極端分組法。
1.區(qū)分度的高低應取決于不同的考試要求
選拔性考試對試題的區(qū)分度要求較高,而學校課程考試主要是依照考試大綱要求編制試卷,因而,只要試題的內容符合考試大綱的要求即可,不必要求試題有高區(qū)分度,甚至在要求學生必須掌握的內容中出現(xiàn)難度值為零,區(qū)分度為零的試題也是允許的。但對于區(qū)分度小于零的情況我們必須進行分析,如總成績較好的學生為何在某道題上的得分低于總成績差的學生,原因可能是此題難度過大,或是該題的答案存在錯誤。
2.區(qū)分度是試題對不同考生的知識能力水平的鑒別程度
如果一個題目的測試結果使水平高的考生答對,而水平低的考生答錯,說明該題能夠將水平高和水平低的考生區(qū)分開來,則它的區(qū)分能力就很強。通過我們的考試分析認為,區(qū)分度大于0.4的為優(yōu)秀題目,達到0.3以上的為良好題目,達到0.2以上可以接受,而低于0.2的題目則區(qū)分能力差。
3.區(qū)分度與難度的聯(lián)系
區(qū)分度與難度是兩個不同的概念,但是兩者之間存在著一定的聯(lián)系。一般來說,難度適中的題目往往有較高的區(qū)分度。通過我們的分析表明,難度系數在0.5的試題具有最好的區(qū)分度。
三、信度
信度是指測量結果的穩(wěn)定性和可靠性,即學生的考試成績與學生的真實水平相一致的程度。信度通常用一種相關系數來表示,相關系數越大,表明測量的可信程度越大,則信度則越高。當系數為1時,說明測試的可靠性達到最高程度;而系數是0時,則測試的可靠性降到最低程度。在一般情況下,系數不會高到1,也不會降到0。對信度系數的要求因測試類別的不同而不同,通常對標準化測試的信度系數要求在0.9以上,而一般的考試信度系數以0.7-0.8為宜。在實際應用中,信度主要有再測信度、等值復本信度、分半信度、評分者信度等。較常用的是克倫巴赫(Cronbach)的α-系數公式。
1.決定試卷信度的幾個要素
?。?)試卷結構和長度是否合理
試題數量的多少,試題樣本選擇的正確與否,試卷能否覆蓋考查的內容,各種題型搭配是否合理,能否做到重點突出,難易得當,直接影響考試信度。
(2)試題答案是否正確可信
客觀題的答案具有唯一性,可信程度高。主觀題由于受到一些不穩(wěn)定因素的影響,信度不及客觀題高。在設計標準答案時,也要做到正確無誤。
?。?)閱卷者的知識水平及綜合素質是否可靠
諸如知識經驗、業(yè)務水平、責任心、職業(yè)道德、精力體力等。試卷評閱者的信度反映了評分能夠穩(wěn)定反映考生真實水平的程度。
2.保證試卷信度的相應措施
?。?)合理安排試卷的結構
根據考試大綱規(guī)定的考試范圍和要求,將考核內容合理劃分,形成合理的試題結構。
?。?)合理采用不同的題型
包括選擇題(單選、多選)、填空題、名詞解釋、簡答題、論述題等,主觀題和客觀題的比例要恰當。單選題的選項應不少于四個,而是非判斷題應不用或盡量少用,因為受猜測因素影響太大。
(3)合理制定參考答案及評分標準及細則
客觀題的答案不會受人為因素的影響,但要注意制定答案不要出現(xiàn)錯誤,配分要合理。對主觀題要做出合理答題要點并相應配分,盡可能使主觀題的答案客觀化、標準化,以減少評分者主觀因素的影響。
?。?)加強考試閱卷各環(huán)節(jié)的管理
考試保密措施有效,嚴格考試紀律,防止舞弊。完善評分程序,對評卷人員要依照程序嚴格進行挑選,評卷前要進行集中培訓。對一些較復雜的主觀題要先進行試評,并通過討論來減少分歧。要采取集體流水作業(yè)評卷形式,盡量做到評分的準確一致,并認真進行復核。
四、效度
效度是指試卷的有效性,是考試誤差或準確度大小估計的一個統(tǒng)計學指標,也就是說,效度是衡量考試結果對考試目標的實現(xiàn)程度,即試卷是否達到了考試的目的。最主要的為以下兩個方面。
1.內容效度
指一套試題是否測試了應該測試的內容,也就是說所測試的內容是否反映了測試的要求,即測試的代表性和覆蓋面的程度。檢驗內容效度就是檢驗由概念到指標的經驗推演是否符合邏輯,是否有效。試卷要具備較好的內容效度,必須滿足兩個條件:①要有確定好的內容范圍,并使全部題目都落在這一范圍之內。②試卷題目應是已界定的內容范圍的代表性樣本,即題目能代表所測的內容范圍的主要方面,且各部分題目所占比例恰當。
2.效標關聯(lián)效度
效標關聯(lián)效度是指考試結果與效標之間的相關程度。效標是檢驗考試效度的一個參照標準,它可以是①另一種考試(同類的標準考試)成績,這份試卷的權威性必須很高,是專家公認的效度高的試卷,能很好地反映該門課程的性質和特點。以該份標準試卷為標準來檢查其它試卷的效度。但由于客觀上的許多原因,有效的效標難以確定,因此,不少學者采用求平均區(qū)分度來代替試卷的效度。
平時考試的效度一般能達到0.4以上,即可認為實現(xiàn)了考試目標。
3.信度和效度的關系
信度和效度是兩個相互關聯(lián)的重要標準。信度是對結果一致性和穩(wěn)定性的評價標準。效度是對結果正確性的評價標準,把兩者的作用結合起來看,信度和效度是考試結果具有科學價值和意義的保證。
?。ㄘ熑尉庉嬋魏殂X)