• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      高考的公平性再分析

      2019-06-20 05:59張麗強(qiáng)
      內(nèi)蒙古教育·綜合版 2019年5期
      關(guān)鍵詞:主觀題等值公平性

      張麗強(qiáng)

      高考是我國(guó)重要的人才選拔考試,也是目前國(guó)內(nèi)影響力最大、影響面最廣的考試。它一頭關(guān)乎著國(guó)家社稷的發(fā)展和未來(lái),另一頭維系著千家萬(wàn)戶的期盼和希望。由此,高考的公平就成為社會(huì)關(guān)注的焦點(diǎn),成為社會(huì)公平的重要組成部分,成為百姓心目中敏感脆弱、不能觸碰的底線。

      近年來(lái),隨著高考制度改革的深入,人們對(duì)于高考公平性的關(guān)注度持高不下。事實(shí)上,人們更多的是從社會(huì)學(xué)的角度來(lái)關(guān)注高考的公平性,關(guān)注的是形式上的、外在的、顯性的公平,如考試的內(nèi)容、考生的身份、加分的類型等。其實(shí),考試的公平性是一個(gè)復(fù)合型的概念,不僅有形式上的公平,還有實(shí)質(zhì)上的公平,不僅有外在的公平,還有內(nèi)在的公平,不僅有顯性的公平,還有隱性的公平。分析的角度也是多元的,不僅可以從社會(huì)學(xué)的角度來(lái)分析,還可以從教育測(cè)量學(xué)的角度來(lái)分析,如主觀性試題評(píng)分質(zhì)量的控制、項(xiàng)目功能差異(DIF)檢測(cè)、分?jǐn)?shù)調(diào)整和等值、分?jǐn)?shù)組合方式的選擇以及作弊的防范和雷同答卷甄別,等等。這樣,考試的公平性分析就會(huì)更加立體,更加全面,也有助于加深人們對(duì)于高考的認(rèn)識(shí),增強(qiáng)人們對(duì)于高考改革的認(rèn)同感,有利于進(jìn)一步維護(hù)高考的公平公正。

      一、主觀題的評(píng)分質(zhì)量控制

      主觀題是相對(duì)于客觀題而言的,泛指無(wú)固定答案、采用多級(jí)計(jì)分的題目。主觀題的命題角度比較靈活,可以多維度測(cè)查考生能力,能展現(xiàn)考生的作答反應(yīng)過(guò)程,因而是很多考試中必不可少的題型。比如簡(jiǎn)答題、論述題、作文等都是考試中常用的題型。

      然而,主觀題也有其自身的弊端,由于評(píng)分員對(duì)于評(píng)分標(biāo)準(zhǔn)的理解和把握不同,加上疲勞效應(yīng)等因素的影響,評(píng)分的信度和效度偏低。但是,高考中很多科目如政治、歷史、地理等都會(huì)采用主觀題的題型,語(yǔ)文中的作文其分值在整卷中更是占到了相當(dāng)大的比重。高考,一分之差就可能影響錄取的結(jié)果,所以需要對(duì)主觀題的評(píng)分高度重視。

      目前,高考主觀題的評(píng)閱大都采用了網(wǎng)上評(píng)閱系統(tǒng)來(lái)評(píng)分,會(huì)采用“2+1”評(píng)分模式來(lái)控制評(píng)分誤差,評(píng)分的質(zhì)量得到了有效控制。但是,趨中評(píng)分等問(wèn)題依然凸顯,主觀題評(píng)分質(zhì)量的控制還任重道遠(yuǎn)。

      隨著計(jì)算機(jī)技術(shù)的飛速發(fā)展和人工智能的廣泛應(yīng)用,計(jì)算機(jī)自動(dòng)評(píng)分(Computer-Automated Scoring,CAS)應(yīng)運(yùn)而生。計(jì)算機(jī)自動(dòng)評(píng)分相較于人工打分,穩(wěn)定性好,效率高。目前,一些省市已將自動(dòng)評(píng)分系統(tǒng)作為質(zhì)檢系統(tǒng)用于高考之中,檢測(cè)空白卷、疑似抄襲、特殊作答,對(duì)人工評(píng)分進(jìn)行糾偏等。未來(lái),隨著人工智能實(shí)現(xiàn)從感知智能到認(rèn)知智能的飛躍,通過(guò)計(jì)算機(jī)對(duì)人類的語(yǔ)義理解、知識(shí)表示、邏輯推理和自主學(xué)習(xí)的模擬和學(xué)習(xí),計(jì)算機(jī)自動(dòng)評(píng)分技術(shù)將會(huì)實(shí)現(xiàn)質(zhì)的飛躍,評(píng)分質(zhì)量會(huì)顯著提高,應(yīng)用的范圍也將逐步擴(kuò)大。人機(jī)結(jié)合的評(píng)分方法將成為主流,主觀題評(píng)分的準(zhǔn)確性和可靠性將會(huì)大大提高,考試的公平將會(huì)得到技術(shù)上的保障。

      二、項(xiàng)目功能差異檢測(cè)

      評(píng)分員會(huì)影響到考生的成績(jī),題目質(zhì)量的好壞更是直接關(guān)系著考生答題、考生錄取等環(huán)節(jié),因而高考的題目質(zhì)量需要得到保證。題目質(zhì)量可以用難度、區(qū)分度以及項(xiàng)目功能差異(Differential Item Functioning,簡(jiǎn)稱DIF)等指標(biāo)來(lái)衡量。在高考這種選拔性的考試中,考試目的是要對(duì)考生的能力水平進(jìn)行區(qū)分。如果題目過(guò)難或過(guò)易都會(huì)失去鑒別的意義,因而要以難度適中的題目為主。此外,還需要檢測(cè)題目是否存在DIF。DIF指的是某題目在不同群體間表現(xiàn)出與測(cè)驗(yàn)?zāi)康臒o(wú)關(guān)的功能性差異。這個(gè)指標(biāo)跟考試的公平性密切相關(guān)。但高考的考生樣本量龐大,在實(shí)際操作中進(jìn)行DIF檢測(cè)會(huì)很復(fù)雜。盡管如此,還是要對(duì)可能存在DIF的題目引起注意。

      高考題目雖然經(jīng)過(guò)了層層把關(guān),但由于考生人數(shù)多,可能由于無(wú)法兼顧不同考生群體的差異,而存在DIF。比如2015年陜西省高考語(yǔ)文的作文題是:一位父親在高速公路上開(kāi)車(chē)打電話,孩子一再提醒不要打電話,可是父親不聽(tīng)勸阻,最終孩子選擇報(bào)警,警察來(lái)后對(duì)父親進(jìn)行批評(píng)教育。題目要求考生給父親、孩子或者相關(guān)部門(mén)寫(xiě)一封信。有人認(rèn)為這道題對(duì)于不了解高速公路及高速上不能打電話等規(guī)定的農(nóng)村學(xué)生不公平。這是由于城鄉(xiāng)差異而引發(fā)的爭(zhēng)議。至于該題目是否存在DIF,則需要進(jìn)一步研究。事實(shí)上,由于作文題材的不同,對(duì)不同性別的考生來(lái)說(shuō)可能也是不公平的。假如給考生的作文題目是關(guān)于球賽的,那么這個(gè)題目對(duì)于男生來(lái)說(shuō)是有利的,因?yàn)榇蠖鄶?shù)男生比女生對(duì)于球賽的問(wèn)題更感興趣。假如給考生的作文題目是關(guān)于美妝的,那么這個(gè)題目對(duì)于女生來(lái)說(shuō)是有利的,因?yàn)榇蠖鄶?shù)女生比男生更關(guān)注美妝方面的問(wèn)題。因而題目在性別層面就可能會(huì)存在差異,對(duì)某一群體造成不公平。

      題目存在DIF一般不受題型的影響。作文是多級(jí)計(jì)分的題目,而判斷題、單選題則屬于二級(jí)計(jì)分的題目。其實(shí),國(guó)內(nèi)對(duì)二級(jí)計(jì)分題目的DIF的研究更多,對(duì)于多級(jí)計(jì)分題目的DIF的研究并不成熟,所以多級(jí)計(jì)分題目的DIF檢測(cè)方法仍有待進(jìn)一步開(kāi)發(fā)。運(yùn)用檢測(cè)DIF的方法,關(guān)鍵在于如何判定兩組被試是否具有相同的能力,即確定匹配變量。然后根據(jù)地區(qū)、性別、專業(yè)、民族等方面的不同,將兩組被試分為目標(biāo)組和參照組。目標(biāo)組通常是可能被不公平對(duì)待的群體,參照組通常是用作比較的對(duì)象。DIF分析實(shí)際上就是在比較這兩組被試與測(cè)驗(yàn)?zāi)康臒o(wú)關(guān)的差異。比如有一道用英文表述的數(shù)學(xué)題,如果這道題本質(zhì)上是要考查被試的數(shù)學(xué)知識(shí),但由于題目是英文的表達(dá),而導(dǎo)致很多英語(yǔ)不好的被試做不對(duì)這道數(shù)學(xué)題目。那么,這道用英文表述的數(shù)學(xué)題就存在DIF。那是不是存在DIF的題目就是一道不好的題目?答案是否定的。這要看施測(cè)者要測(cè)查被試哪方面的能力。如果只是單純要測(cè)被試的數(shù)學(xué)能力,即測(cè)驗(yàn)是單維度的,那么這道題目就是不合適的;如果要同時(shí)考查被試的英語(yǔ)水平和數(shù)學(xué)能力,即測(cè)驗(yàn)是多維度的,那么這道題目就沒(méi)有問(wèn)題。對(duì)于用DIF檢測(cè)方法得出的結(jié)論,屬于統(tǒng)計(jì)意義上的判斷。要想判定題目是否存在DIF,還要參考專家的意見(jiàn)。DIF分析為測(cè)驗(yàn)的公平性提供了重要參考依據(jù),它與測(cè)驗(yàn)的效度也有直接關(guān)聯(lián),是證明測(cè)驗(yàn)有效性的重要證據(jù)。試題的DIF檢驗(yàn)是標(biāo)準(zhǔn)化測(cè)驗(yàn)研發(fā)的重要環(huán)節(jié),可以通過(guò)對(duì)題目進(jìn)行DIF檢測(cè)以減少測(cè)驗(yàn)的偏差。所以,多角度關(guān)注高考題目的質(zhì)量,會(huì)進(jìn)一步提高考試的公平性。

      三、分?jǐn)?shù)的調(diào)整和等值

      為了使考試更具科學(xué)性和公平性,往往需要進(jìn)行分?jǐn)?shù)調(diào)整和等值。等值(equating)指的是將難度、分?jǐn)?shù)分布不同的試卷得分轉(zhuǎn)換到一個(gè)統(tǒng)一量表上的過(guò)程,是分?jǐn)?shù)連接(linking)的一種方式。相比于連接的其他方式,等值要求更為嚴(yán)格,需測(cè)驗(yàn)間構(gòu)念相同、難度相似、信度相同以及考生目標(biāo)總體基本相同。顯而易見(jiàn),對(duì)于同一科目的測(cè)驗(yàn)而言,有能夠進(jìn)行等值的可能,但是不同的科目間,只能進(jìn)行分?jǐn)?shù)的連接。

      在一些省份,高考英語(yǔ)采用一年兩考的方式。由于很難確保兩次考試難度一致,因此是需要進(jìn)行分?jǐn)?shù)調(diào)整的。等值就是對(duì)考后的分?jǐn)?shù)進(jìn)行調(diào)整的一種手段。等值有兩種收集數(shù)據(jù)的方法,一種圍繞“共同題”展開(kāi),共同題又叫作錨題;另一種圍繞“共同組”展開(kāi)。其中,在共同題的等值設(shè)計(jì)中,等值在拼卷的時(shí)候就已經(jīng)開(kāi)始了。即在不同試卷中加入共同題,通過(guò)共同題進(jìn)行等值。但是,高考不可能在前后兩次考試中出現(xiàn)相同的題目,這很不現(xiàn)實(shí)。對(duì)于高考英語(yǔ),可以采用共同組的等值設(shè)計(jì)方法,即認(rèn)為前后兩次測(cè)驗(yàn)的考生能力分布水平大致相同,從而實(shí)現(xiàn)等值的目的。

      從現(xiàn)實(shí)情況來(lái)看,高考很難滿足不同科目之間進(jìn)行等值的條件。但是,可以對(duì)高考進(jìn)行分?jǐn)?shù)連接。根據(jù)高考改革方案,河北、遼寧等八省市將從2018年秋季入學(xué)的高中一年級(jí)學(xué)生開(kāi)始實(shí)施“3+1+2”的模式?!?”是指全國(guó)統(tǒng)考科目語(yǔ)文、數(shù)學(xué)和外語(yǔ);“1”是指首選科目,考生要在物理、歷史中選擇1門(mén);“2”是指再選科目,考生可在化學(xué)、生物、思想政治和地理4個(gè)科目中選擇兩科。因?yàn)樗械目忌紩?huì)參加語(yǔ)文、數(shù)學(xué)和外語(yǔ)考試,因而可以把這三科的考試當(dāng)作錨測(cè)驗(yàn),以此來(lái)進(jìn)行高考分?jǐn)?shù)的連接。當(dāng)然,由于語(yǔ)文、數(shù)學(xué)和英語(yǔ)的構(gòu)念、難度等條件與其他考試科目不同,以這三科的成績(jī)來(lái)作為錨測(cè)驗(yàn)的效果不一定很理想。因此,還要探求更為科學(xué)合理的分?jǐn)?shù)調(diào)整方式,以維護(hù)高考公平。

      四、分?jǐn)?shù)的組合

      在評(píng)分員完成評(píng)分之后,如果分?jǐn)?shù)結(jié)果沒(méi)有問(wèn)題,還要對(duì)測(cè)驗(yàn)分?jǐn)?shù)進(jìn)行組合。分?jǐn)?shù)組合的方式會(huì)直接影響到考生最后的總成績(jī),進(jìn)而影響到錄取公平。

      分?jǐn)?shù)組合的方式有很多種。比如臨床判斷、原始分直接相加、多重分段和多重回歸等方法。在高考中,分?jǐn)?shù)組合采用的是原始分直接相加的方法。

      原始分相加從理論上來(lái)說(shuō)需要滿足三個(gè)基本假設(shè):(1)這兩個(gè)測(cè)驗(yàn)測(cè)量的是同一種心理特質(zhì)。這指的是所測(cè)量事物的屬性是一樣的,就像測(cè)量長(zhǎng)度的單位不能與測(cè)量重量的單位等同,不能把兩公斤和兩米進(jìn)行相加。在考試中,就如同不能直接把語(yǔ)文成績(jī)和數(shù)學(xué)成績(jī)相加一樣。很明顯,語(yǔ)文考試跟數(shù)學(xué)考試要測(cè)試的構(gòu)念不同,或者說(shuō)不是同一種心理特質(zhì),因而將二者進(jìn)行簡(jiǎn)單相加是不合適的。(2)相加的兩個(gè)量應(yīng)該有相等的單位。如果所測(cè)量的事物屬性相同,單位也應(yīng)該相同。比如不能直接用一米跟一厘米進(jìn)行相加。在考試中,將不同分測(cè)驗(yàn)的分?jǐn)?shù)相加也是不科學(xué)的。因?yàn)橐坏纼煞值呐袛囝}與一道三分的選擇題同樣都是組成試卷的一部分,會(huì)因這兩部分答對(duì)數(shù)目的不同而導(dǎo)致總分不同。(3)對(duì)于取自同一樣本的兩個(gè)變量,應(yīng)有相同的變異才能相加。否則,兩個(gè)量相加時(shí),變異程度大的變量對(duì)結(jié)果的影響大。比如對(duì)于文科生而言,數(shù)學(xué)成績(jī)好的學(xué)生可能會(huì)有優(yōu)勢(shì),因?yàn)閿?shù)學(xué)不好的同學(xué)跟數(shù)學(xué)好的同學(xué)的數(shù)學(xué)成績(jī)差距大。但是,語(yǔ)文的分?jǐn)?shù)相對(duì)比較集中,不會(huì)有數(shù)學(xué)那么大的分?jǐn)?shù)差距。對(duì)于以上三個(gè)假設(shè),現(xiàn)行的原始分?jǐn)?shù)直接組合的做法并不滿足。因此,從分?jǐn)?shù)組合上就可以看出最終考生的分?jǐn)?shù)是有誤差的。

      除了原始分直接相加,高考還采用過(guò)用標(biāo)準(zhǔn)分相加的方式。但用標(biāo)準(zhǔn)分相加,不包含各個(gè)分測(cè)驗(yàn)有相同變異的假設(shè),也就是說(shuō)各個(gè)考試科目會(huì)被平等對(duì)待。但是用標(biāo)準(zhǔn)分相加的方式未能避免前兩個(gè)假設(shè),仍然具有不合理的地方。加之計(jì)算過(guò)程比較復(fù)雜,大眾理解起來(lái)較困難,因而沒(méi)有實(shí)行開(kāi)來(lái)。高考一直在探索更加科學(xué)的分?jǐn)?shù)組合方式,以確??荚嚬?。

      五、試后雷同答卷的甄別

      高考作為我國(guó)最重要的選拔性考試之一,難免會(huì)有一些人因?yàn)槔骝?qū)動(dòng)而進(jìn)行作弊。隨著科技的發(fā)展,作弊技術(shù)也在不斷升級(jí),有時(shí)很難被發(fā)現(xiàn)。除了有個(gè)人作弊的行為,還有作弊團(tuán)伙聯(lián)合作弊的現(xiàn)象。通過(guò)互聯(lián)網(wǎng),甚至可以把作弊范圍擴(kuò)展至全國(guó)。這嚴(yán)重違背了考試公平、公正的原則,損害了其他考生的利益。

      高考對(duì)作弊行為是零容忍的態(tài)度,在打擊作弊行為方面已經(jīng)做了很大的努力。比如,《中華人民共和國(guó)刑法修正案(九)》明確了對(duì)于作弊行為的懲戒辦法,這對(duì)作弊群體具有強(qiáng)有力的震懾作用。為防止考生作弊,在高考前會(huì)做很多工作。如考前簽署誠(chéng)信保證書(shū),考試時(shí)使用屏蔽儀器、監(jiān)控器等設(shè)備。除了考前防患于未然,考后進(jìn)行雷同答卷的甄別,更能確保考試安全。常見(jiàn)的雷同檢測(cè)方法有錯(cuò)同率方法、g2方法、Kappa方法,以及K指數(shù)方法等。在我國(guó),錯(cuò)同率方法因運(yùn)算速度快而成為被較多使用的一種方法。在實(shí)際操作中,應(yīng)該使用多種雷同檢測(cè)方法,以提高檢測(cè)結(jié)果的精準(zhǔn)性??蓪?duì)于高考而言,公平和效率是需要同時(shí)兼顧的。從當(dāng)前條件來(lái)看,高考的規(guī)模大、考生數(shù)量多,運(yùn)用雷同答卷弊甄別技術(shù)需要很大的成本。這樣做雖可以維護(hù)考試公平,但卻犧牲了效率。不過(guò),高考在雷同檢測(cè)方面可以試著逐步推進(jìn)。

      高考公平與否,關(guān)系到考生能否平等地享有高等教育的入學(xué)機(jī)會(huì),甚至關(guān)乎考生的個(gè)人命運(yùn)。此外,還關(guān)涉一系列社會(huì)公平問(wèn)題。所以高考的公平性受到了高度重視。在維護(hù)高考公平性方面,已經(jīng)做了大量的工作,但仍然需要繼續(xù)從教育測(cè)量學(xué)的角度來(lái)探尋制約考試公平的因素。當(dāng)然,還要不斷進(jìn)行改革和完善,維護(hù)高考公平。

      猜你喜歡
      主觀題等值公平性
      淺談“立體幾何主觀題”的復(fù)習(xí)備考
      淺談高中政治“認(rèn)識(shí)類”主觀題答題技巧
      極坐標(biāo)方程主觀題考點(diǎn)分析
      異步電動(dòng)機(jī)等值負(fù)載研究
      一種提高TCP與UDP數(shù)據(jù)流公平性的擁塞控制機(jī)制
      電網(wǎng)單點(diǎn)等值下等效諧波參數(shù)計(jì)算
      關(guān)于公平性的思考
      基于戴維南等值模型的靜穩(wěn)極限在線監(jiān)視
      漢語(yǔ)國(guó)俗語(yǔ)義在維吾爾語(yǔ)中的等值再現(xiàn)
      華東理工大學(xué)學(xué)報(bào)(自然科學(xué)版)(2014年1期)2014-02-27
      紫阳县| 安溪县| 唐山市| 会理县| 吉木萨尔县| 商南县| 左权县| 临漳县| 荃湾区| 镇远县| 来凤县| 五常市| 宁城县| 榆社县| 柏乡县| 黄大仙区| 石柱| 南部县| 上栗县| 晋州市| 汉中市| 弋阳县| 报价| 博罗县| 安国市| 桃园县| 洱源县| 襄垣县| 潜山县| 花莲市| 朝阳市| 合阳县| 珲春市| 防城港市| 开封县| 会泽县| 赤城县| 汝州市| 施甸县| 阿拉尔市| 霍州市|