• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      區(qū)分度在中考試題質(zhì)量分析中的應(yīng)用

      2011-12-27 06:46:04鄒麗華
      大連教育學(xué)院學(xué)報 2011年4期
      關(guān)鍵詞:區(qū)分度區(qū)分測驗

      鄒麗華

      (大連教育學(xué)院 學(xué)習(xí)質(zhì)量監(jiān)測中心,遼寧 大連 116021)

      區(qū)分度在中考試題質(zhì)量分析中的應(yīng)用

      鄒麗華*

      (大連教育學(xué)院 學(xué)習(xí)質(zhì)量監(jiān)測中心,遼寧 大連 116021)

      闡述了區(qū)分度的內(nèi)涵和作用,探討了在經(jīng)典測量理論和項目反應(yīng)理論中三種常用區(qū)分度的計算方法及其應(yīng)用。

      中考試題;質(zhì)量分析;區(qū)分度

      根據(jù)對測驗結(jié)果使用目的的不同,一般可以把測驗劃分為常模參照性測驗和標準參照性測驗。常模參照性測驗的目的是對參加考試的考生進行挑選和選拔;標準參照性測驗的目的是檢測學(xué)生經(jīng)過一段時間學(xué)習(xí)之后是否達到了學(xué)科課程標準要求掌握的基本知識和能力水平的程度。在我國高考、中考和會考等大規(guī)??荚囍?,高考是常模參照性測驗,體現(xiàn)考試的選拔功能;中考和會考等屬于標準化測驗,但部分省市中考屬于標準化測驗和常模參照性測驗(兩考合一),兼顧學(xué)生學(xué)業(yè)水平考試和選拔兩種功能。

      區(qū)分度是定量分析試題質(zhì)量的重要參數(shù)。測驗?zāi)康牟煌捎玫膮^(qū)分度計算方法也不同。本文采用大連市2011年中考模擬考試數(shù)據(jù),用三種方法對試題區(qū)分度進行計算,并對結(jié)果進行分析,以確定試題區(qū)分功能的類型。

      一、區(qū)分度內(nèi)涵分析

      1.經(jīng)典測量理論(CTT)下試題的區(qū)分度

      區(qū)分度是指測驗項目對被試心理品質(zhì)水平差異的區(qū)分能力。[1]77區(qū)分度高的項目,能將不同水平的被試區(qū)分開來;區(qū)分度低的項目,則不能很好地鑒別被試水平。項目區(qū)分度也稱之為項目的效度,它是評價項目質(zhì)量、篩選項目的主要指標和依據(jù)。鑒別指數(shù)(D)是鑒別項目測量有效性的指標,D值越大,項目越有效。美國測量專家愛伯爾根據(jù)大量測量實踐經(jīng)驗提出了用鑒別指數(shù)評價題目性能的標準。D值在0.4以上,認為試題很好;D值在0.30~0.39范圍內(nèi),試題為良好,修改會更好;D值在0.20~0.29范圍內(nèi),尚可,仍需要修改;0.19以下,試題劣,必須淘汰或加以修改。[2]243

      用點二列相關(guān)法計算項目的相關(guān)系數(shù)需進行顯著性檢驗,才能確定其意義。也可以根據(jù)相關(guān)系數(shù)的大小直接評價項目的區(qū)分性能,項目區(qū)分度評價標準見表1。[3]

      表1 項目區(qū)分度評價標準

      一般來說,試題的難度是相對的,同樣試題區(qū)分度也具相對性,它體現(xiàn)在四個方面:不同的計算方法,所得區(qū)分度不同;樣本容量大小影響區(qū)分度的大??;極端組劃分的標準影響鑒別指數(shù)值(D),通常取27%作為分組標準;被試樣本的同質(zhì)性程度影響區(qū)分度的大小。因此,項目區(qū)分度的大小是相對特定團體而言的。[1]85

      2.項目反應(yīng)理論(IRT)下的項目區(qū)分度

      在項目反應(yīng)理論中,項目區(qū)分度與項目特征曲線拐點處的斜率有關(guān)。圖1是三參數(shù)logistic模型項目特征曲線圖。項目區(qū)分度ai表示項目i的區(qū)分度參數(shù),它是曲線在拐點bi(項目難度)處切線的斜率。曲線在bi附近越陡峭,區(qū)分度ai值越大。當被試能力稍微偏離試題難度值時,被試正確作答項目的概率就迅速增大或變小,表現(xiàn)出很強的區(qū)分作用。

      圖1 項目反應(yīng)理論下區(qū)分度參數(shù)的含義

      在項目反應(yīng)理論下,被試能力水平和項目難度在同一量尺上。模型擬合結(jié)果不僅可以估計項目參數(shù)(即難度、區(qū)分度),繪出項目特征曲線和信息函數(shù)曲線I(θ),還能估計出各被試的能力參數(shù)(θ)。項目參數(shù)與被試樣本無關(guān),被試的能力參數(shù)與項目無關(guān)。

      二、區(qū)分度的作用

      1.區(qū)分度影響測驗的質(zhì)量

      衡量測驗好與壞重要的統(tǒng)計指標是試卷的信度和效度。測驗的信度與項目的區(qū)分度有著密切的關(guān)系。整個測驗中各項目區(qū)分度的平均值越高,測驗的信度就越高。因此,要保證測驗達到較理想的測驗信度,必須提高每個項目的區(qū)分度。一般大型考試試卷的信度在0.8以上才認為本次測驗是有效的,否則就視為無效測驗。因此,項目區(qū)分度對測驗質(zhì)量有著重要影響。

      2.區(qū)分度影響測驗項目的質(zhì)量

      測驗項目區(qū)分度(ai)越大,偽機遇水平(ci)值越小,估計標準誤就越小,測量就越準確。[4]在偽機遇水平一定的情況下,項目區(qū)分度的大小決定了該項目測量的準確程度。項目區(qū)分度越大就越能測出考生掌握的真實知識和能力水平。

      3.確定項目的區(qū)分功能類型

      在項目反應(yīng)理論下,選擇適當?shù)膮?shù)擬合模型,對項目測量數(shù)據(jù)進行擬合,得到項目參數(shù)估值和項目特征曲線及信息函數(shù)曲線,據(jù)此可以對項目進行區(qū)分功能的細化,確定項目區(qū)分度功能類型。從項目特征曲線和信息函數(shù)曲線還可以得到有關(guān)試卷和試題統(tǒng)計結(jié)果方面的重要信息,如對什么能力水平的考生試題提供的區(qū)分度最大、提供的信息量最大,測量誤差最小。

      三、區(qū)分度計算方法

      1.經(jīng)典測量理論中的極端分組法

      極端分組法是將學(xué)生能力按照測驗總分排序,確定一定比例的高分組和低分組人數(shù),然后根據(jù)高、低分組在某道題目上通過率或平均得分率的差值(D=PH-PL,即該題鑒別指數(shù))來衡量試題的優(yōu)劣。該方法宜于理解,計算方便,但由于部分數(shù)據(jù)不參與計算而使計算結(jié)果不夠準確,一般在教師自編測驗中使用。

      2.經(jīng)典理論中的相關(guān)法

      相關(guān)法是指以某一項目分數(shù)與效標分數(shù)或測驗總分的相關(guān)作為該項目區(qū)分度的指標,相關(guān)越高,該項目區(qū)分度越高。[2]246常用方法有極差相關(guān)法、點二列相關(guān)法、二列相關(guān)法和Φ相關(guān)法等。由于中考試卷選擇題居多,測驗總分是連續(xù)變量,試題變量為真正的二分變量,應(yīng)采用pearson點二列相關(guān)法。

      用相關(guān)法可從兩個角度對試題區(qū)分功能進行評價:一是依據(jù)相關(guān)系數(shù)評價題目性能標準(見表1);二是對相關(guān)系數(shù)進行t檢驗,確定各題與總分的相關(guān)是否顯著。用SPSS軟件可直接計算出試題的相關(guān)系數(shù),并同時顯示試題與總分間的相關(guān)是否達到顯著水平。樣本相關(guān)系數(shù)的大小與選用樣本大小有關(guān),選用大樣本計算試題相關(guān)系數(shù),各試題與總分的相關(guān)性往往呈現(xiàn)顯著水平。

      3.項目反應(yīng)理論中的極大似然法

      極大似然法是使已知反應(yīng)模式的似然函數(shù)值達到最大,是對未知參數(shù)估計的一種重要方法。項目反應(yīng)理論下區(qū)分度參數(shù)的估計較經(jīng)典測量理論下區(qū)分度的計算要復(fù)雜得多。參數(shù)估計需要眾多數(shù)學(xué)模型、較多的參數(shù)估計方法及特殊應(yīng)用軟件的支持。在項目反應(yīng)理論中,二值評分項目的單維基礎(chǔ)模型有雙參正態(tài)肩形曲線模型、拉希模型和羅杰斯蒂(Logistic)模型;多值評分項目的單維模型有稱名選項模型、等級反應(yīng)模型和部分評分模型。

      四、計算結(jié)果分析

      以大連市2011年中考物理模擬考試成績?yōu)闃颖荆颖救萘繛?6146),用極端分組法和點二列相關(guān)法計算區(qū)分度,用三參數(shù)Logistic部分評分模型,使用PARSCAL4.1軟件,采用牛頓極大似然法(ML)和Partial分步評分模型進行項目參數(shù)估計,同時做先驗分布檢驗。其結(jié)果包括估計項目難度、區(qū)分度、信息量等項目參數(shù)及被試能力參數(shù)。模型參數(shù)估計的最后擬合指數(shù)為-2 LOG LIKELIHOOD=687824.238。三種方法計算結(jié)果見表2。表2中第2~5列分別顯示各題目的難度系數(shù)、鑒別指數(shù)(D)、各題與總分的相關(guān)系數(shù)(rpb)及相關(guān)程度,第6和7列呈現(xiàn)的是用極大似然法得到的項目參數(shù)估計值。

      1.從經(jīng)典測量理論角度分析

      由表2第3列數(shù)據(jù)可知,試題鑒別指數(shù)范圍在0.05~0.66,第3題的鑒別指數(shù)最小,第9題的鑒別指數(shù)最大,主觀題第28、30題鑒別指數(shù)小于0.19,試題對考生能力的區(qū)分程度較差。按鑒別指數(shù)評價試題性能標準,有29%的試題為劣質(zhì)試題。顯然對于標準參照考試,用鑒別指數(shù)評價試題質(zhì)量的好壞不公平。極端分組法尤其不適用于標準參照考試中客觀題區(qū)分度的計算。

      由表2第3和4列可知,用Person點二列相關(guān)方法計算區(qū)分度與用極端分組法計算鑒別指數(shù)是不等值的,差值有大有小,且各試題的相關(guān)系數(shù)大于鑒別指數(shù)。如第1題r=0.31,D=0.05。

      表2 項目區(qū)分度

      從表2第4列數(shù)據(jù)看,相關(guān)系數(shù)范圍從0.17到0.85。試題與總分的相關(guān)程度:有3道題是高度相關(guān),24道題是中度相關(guān),12道題是低度相關(guān),1題(第12題)是弱相關(guān),它們分別占總題量的9.68%、45.16%、41.94%和3.23%。第12題與總分幾乎不相關(guān),第25題對考生的區(qū)分程度最高。而用點二列相關(guān)t檢驗的結(jié)果:物理試卷31個項目與總分相關(guān),都呈顯著性水平(P<0.05),表明所有項目與總分間都有很好的內(nèi)部一致性。

      2.從項目反應(yīng)理論角度分析

      項目難度和區(qū)分度參數(shù)估計結(jié)果見表2第6列和第7列。以項目5為例,圖2和圖3分別是項目5的特征曲線和信息函數(shù)曲線。項目5的區(qū)分度參數(shù)a=1.436,難度參數(shù)b=-0.025,猜測概率c=0.406。通過計算可得出:當被試能力θmax=0.149時,項目5提供的信息量I(θ)最大,I(θ)=0.67。項目5的低能力被試答對的可能性(c=0.406)不為0,猜測度偏高。

      按項目區(qū)分度參數(shù)估值大小劃分項目區(qū)分性能。項目區(qū)分度a<0.30,認為是弱區(qū)分項目;0.30≤a<0.50項目為中度區(qū)分,a≥0.50認為項目是強區(qū)分。根據(jù)項目5的項目參數(shù)和項目特征曲線,同一項目對不同能力水平的被試試題提供的區(qū)分程度是不同的。對能力水平約在-1.0~1.2范圍內(nèi)的考生都有一定的區(qū)分,對能力水平處于0.149的考生區(qū)分能力最強。因此,該項目區(qū)分類型是屬于中段強區(qū)分項目。其他項目的區(qū)分類型見表2中第8列所示。

      從表2中數(shù)據(jù)可知,項目區(qū)分度參數(shù)a≥0.50的強區(qū)分項目有15個,占總題量的48.4%,其中第9、31題屬于難題,其他試題屬于中檔題和容易題;中度區(qū)分的項目有13個,占總題量的41.9%,其中第11、26、27題屬于難題;a<0.30的弱區(qū)分項目有3個,即第6、7、12題,其中第6、7題屬于容易題,第12題屬于難題。

      五、區(qū)分度應(yīng)用需注意的問題

      1.正確認識區(qū)分度指標要求

      對項目區(qū)分度指標的要求應(yīng)根據(jù)測驗?zāi)康亩?,若測驗?zāi)康脑谟谶x拔,主要評判被試的個別差異,那么區(qū)分度要求高一些;若測驗只是考察被試對所學(xué)知識的掌握情況,就不用過多地考慮區(qū)分度。對于兼顧上述兩個目的的測驗,雖然對大部分試題區(qū)分度沒有要求,但對承載選拔功能試題區(qū)分度的要求要高些。

      2.恰當選擇區(qū)分度計算方法

      在實際項目質(zhì)量分析中采用何種區(qū)分方法,應(yīng)根據(jù)測驗?zāi)康囊约绊椖坑浄趾蜏y驗總分兩個變量的性質(zhì)。方法不同,試題區(qū)分功能評價標準及結(jié)果也不同,有時也可以同時使用不同方法相互驗證,確保統(tǒng)計分析結(jié)果的實效性和準確性。

      3.合理運用項目區(qū)分功能類型

      細化項目區(qū)分功能類型是對項目的綜合評價,它給出某一項目適合考查什么樣能力水平的被試,區(qū)分是強區(qū)分、弱區(qū)分還是中度區(qū)分。根據(jù)試題區(qū)分功能類型可對項目進行篩選、修改,挑選合適的題目組成試卷,為試題進行等值研究和題庫建設(shè)等提供技術(shù)支持。

      [1]戴海崎,張鋒,陳雪楓.心理與教育測量[M].廣州:暨南大學(xué)出版社,2010.

      [2]朱德全,宋乃慶.現(xiàn)代教育統(tǒng)計與測評技術(shù)[M].重慶:西南師范大學(xué)出版社,1998.

      [3]王力賓.多元統(tǒng)計分析:模型、案例及SPSS應(yīng)用[M].北京:經(jīng)濟科學(xué)出版社,2010:31.

      [4]漆書青,戴海琦,丁樹良.現(xiàn)代教育與心理測量學(xué)原理[M].北京:高等教育出版社,2002:159.

      On Effect of Differentiation Index in Quality Analysis of High School Entrance Examination Questions

      ZOU Li-h(huán)ua
      (StudyQualityMonitoringCenter,DalianEducationUniversity,Dalian116021,China)

      Expounding the effect and connotation of differentiation index,the paper discusses calculating methods and application of three common differentiation indexes in classical testing theory and item response theory.

      high school entrance examination question;quality analysis;differentiation index

      G424.79 < class="emphasis_bold">文獻標識碼:A文章編號:

      1008-388X(2011)04-0027-04

      2011-09-30

      本文為遼寧省教育科學(xué)“十二五”規(guī)劃課題“初中終結(jié)性考試學(xué)科難度常模構(gòu)建及應(yīng)用研究”(JG11CB052)階段性研究成果。

      鄒麗華(1963-),女,吉林吉林人,中學(xué)高級教師。

      閱力]

      猜你喜歡
      區(qū)分度區(qū)分測驗
      區(qū)分“旁”“榜”“傍”
      你能區(qū)分平衡力與相互作用力嗎
      淺談試卷分析常用的幾個參數(shù)及其應(yīng)用
      圖形推理測量指標相關(guān)性考察*
      江淮論壇(2018年4期)2018-08-24 01:22:30
      《新年大測驗》大揭榜
      趣味(語文)(2018年7期)2018-06-26 08:13:48
      教你區(qū)分功和功率
      淺觀一道題的“區(qū)分度”
      兩個處理t測驗與F測驗的數(shù)學(xué)關(guān)系
      考試周刊(2016年88期)2016-11-24 13:30:50
      單維參數(shù)型與非參數(shù)型項目反應(yīng)理論項目參數(shù)的比較研究*
      罪數(shù)區(qū)分的實踐判定
      淮滨县| 宁海县| 马关县| 陇西县| 甘南县| 荔浦县| 乌鲁木齐县| 晋江市| 安仁县| 平昌县| 嘉义县| 民和| 万宁市| 宁强县| 大化| 滦南县| 于田县| 洛隆县| 札达县| 白银市| 泾源县| 曲水县| 北海市| 浙江省| 通化县| 香港 | 东海县| 梁河县| 从江县| 武隆县| 鄄城县| 四子王旗| 高淳县| 陇南市| 赤城县| 垫江县| 砚山县| 泰州市| 天柱县| 通海县| 辽宁省|