董鋼鐵 王 峰 王國(guó)祥
課程考試是學(xué)校最經(jīng)常、最重要的考試,它是科學(xué)評(píng)價(jià)學(xué)生對(duì)所學(xué)知識(shí)掌握程度的主要手段。能夠完整準(zhǔn)確地反映學(xué)生真實(shí)水平的課程考試,對(duì)正確評(píng)價(jià)人才、評(píng)價(jià)教學(xué)質(zhì)量、衡量辦學(xué)水平、反饋教學(xué)質(zhì)量信息,有著十分重要的意義。但是,現(xiàn)行的課程考試多數(shù)是近百年來(lái)的經(jīng)驗(yàn)作法,遠(yuǎn)不能適應(yīng)形勢(shì)發(fā)展的需要,特別是教育測(cè)量理論日臻完善和計(jì)算機(jī)技術(shù)迅猛發(fā)展,使課程考試的問(wèn)題日益突出:一是考試成績(jī)的客觀性缺乏準(zhǔn)確判斷的科學(xué)依據(jù)。學(xué)生課終成績(jī)的評(píng)價(jià),由不同教師命題,將得到不同結(jié)果,哪個(gè)結(jié)果更能準(zhǔn)確地描述學(xué)生的課終成績(jī),只能憑經(jīng)驗(yàn)和感覺(jué)認(rèn)定。二是不能科學(xué)地量化評(píng)價(jià)試卷質(zhì)量,已成為命題現(xiàn)代化的重要障礙。當(dāng)前,各類各級(jí)考試主管部門都非常重視利用計(jì)算機(jī)技術(shù)使考試命題科學(xué)化、現(xiàn)代化。但是,國(guó)內(nèi)外尚無(wú)符合教育測(cè)量理論的科學(xué)的量化評(píng)價(jià)試卷質(zhì)量的數(shù)學(xué)模型,無(wú)法使計(jì)算機(jī)準(zhǔn)確地把握試卷質(zhì)量,嚴(yán)重制約了其發(fā)展。圍繞上述問(wèn)題,我們緊緊把握課程考試的測(cè)量特性,以命題質(zhì)量為主要研究對(duì)象,在廣泛吸收、借鑒國(guó)內(nèi)外教育測(cè)量方面的理論成果,認(rèn)真總結(jié)提煉傳統(tǒng)考試的有效做法的基礎(chǔ)上,建立了一個(gè)科學(xué)性、可行性良好的課程考試科學(xué)化命題體系。
一、科學(xué)化命題研究的基本思路
考試作為教育測(cè)量的主要手段,對(duì)其結(jié)果的評(píng)價(jià)與其它物理測(cè)量具有相同的共性,這就是測(cè)量的穩(wěn)定和有效性。按照考生觀測(cè)分?jǐn)?shù)是由真值和誤差組成的基本假設(shè),經(jīng)典測(cè)驗(yàn)理論對(duì)測(cè)量穩(wěn)定性的控制就是要減小測(cè)量誤差,力爭(zhēng)觀測(cè)分?jǐn)?shù)與真值的接近。教育理論認(rèn)為,用與考生水平相適應(yīng)的試卷測(cè)量學(xué)生將取得最小的測(cè)量誤差,這一點(diǎn)在經(jīng)典理論中有定性描述,而項(xiàng)目反理論卻明確給出了測(cè)量誤差與項(xiàng)目難度、考生水平的數(shù)學(xué)關(guān)系表達(dá)式,證實(shí)了定性描述的正確性。經(jīng)典測(cè)驗(yàn)理論的設(shè)計(jì)思想就是控制測(cè)量誤差,用與考生水平相適應(yīng)的試卷組織施測(cè),這樣就把試卷與考生的作用結(jié)合在一起,提出評(píng)價(jià)考試質(zhì)量的指標(biāo)體系及一整套計(jì)算方法,形成了自己的理論體系。
課程考試是水平考試,不同于選拔性考試,有其自身的特點(diǎn)??荚嚹康氖且疾閷W(xué)生達(dá)到教學(xué)大綱要求的程度,它要求不同時(shí)間、地點(diǎn)的考生掌握相同、穩(wěn)定的考核標(biāo)準(zhǔn)。這個(gè)標(biāo)準(zhǔn)就是教學(xué)大綱對(duì)教學(xué)目標(biāo)的要求。照搬經(jīng)典測(cè)驗(yàn)理論用于學(xué)校的課程考試必然使命題水平受試測(cè)樣本的影響,不能把握穩(wěn)定的考試標(biāo)準(zhǔn),違背教育測(cè)量特性。
我們開(kāi)展課程考試命題的研究,按課程考試的測(cè)量特性,從真值是達(dá)到測(cè)量標(biāo)準(zhǔn)程度的反映,嚴(yán)格把握測(cè)量標(biāo)準(zhǔn)入手,建立科學(xué)的試卷質(zhì)量評(píng)價(jià)體系。其基本思路是:引入模糊數(shù)學(xué)的思想方法,把教學(xué)大綱對(duì)教學(xué)目標(biāo)的要求看作是一個(gè)模糊集合,試卷作為抽樣是一個(gè)樣本集合,用模糊貼近度描述試卷與大綱的_致性程度,達(dá)到控制試卷質(zhì)量的目的。
二、科學(xué)化命題試卷質(zhì)量的評(píng)價(jià)體系
按照我們科學(xué)化命題研究的基本思路,需要計(jì)算試卷與大綱一致性程度。試卷與大綱的一致性程度表征為兩個(gè)方面,一是由試題難易程度及其搭配所表征的試卷水平,二是試卷所反映的考試內(nèi)容,前者我們稱之為水平貼近度,后者稱之為內(nèi)容貼近度。
(一)試卷水平貼近度
我們首先引進(jìn)標(biāo)準(zhǔn)試卷的期望均值和期望方差的概念。
假設(shè)存在一份能準(zhǔn)確反映考試目標(biāo)要求的標(biāo)準(zhǔn)試卷,在測(cè)量實(shí)施者正確地掌握并能夠正確地使用測(cè)量工具的情況下,對(duì)理想的考生組(在正常的教學(xué)環(huán)境下,經(jīng)過(guò)正常的教學(xué)過(guò)程)進(jìn)行測(cè)試,所得結(jié)果(即分?jǐn)?shù)),反映了考生的實(shí)際水平(真值)。如果用幾份不同的、但與標(biāo)準(zhǔn)試卷完全等價(jià)的試卷對(duì)上述考生組進(jìn)行測(cè)試,所得結(jié)果對(duì)某個(gè)考生來(lái)說(shuō)應(yīng)相同,而對(duì)于一個(gè)總體來(lái)說(shuō)其平均分應(yīng)一致、方差應(yīng)一致,都應(yīng)等于理想考生組真值的均值和方差。
我們稱理想考生組真值的均值和方差,為試卷的期望均值和期望方差。它們是在理想情況下引入的衡量試卷測(cè)量結(jié)果的兩個(gè)指標(biāo),與平常考試的統(tǒng)計(jì)測(cè)量考生的總體均值與方差很相似,但在本質(zhì)上二者不僅數(shù)值不同,概念也不同。前者是用等價(jià)試卷對(duì)理想考生組反復(fù)測(cè)試的統(tǒng)計(jì)量,是對(duì)考生總體均值和方差的數(shù)學(xué)期望,后者只是一次測(cè)驗(yàn)樣本的統(tǒng)計(jì)結(jié)果。
期望均值與期望方差是在試卷作用于考生之前就客觀存在的,是通過(guò)考試表現(xiàn)出來(lái)的,是描述學(xué)校課程考試學(xué)生真分?jǐn)?shù)分布理想模型的兩個(gè)統(tǒng)計(jì)量,是試卷準(zhǔn)確反映教學(xué)大綱要求程度的期望值。其現(xiàn)實(shí)意義在于為編制試卷確立了一個(gè)客觀的參照標(biāo)準(zhǔn)。試卷的均值和方差越趨近于期望均值和期望方差,說(shuō)明試卷與教學(xué)大綱的要求越貼近。這樣,試卷的水平貼近度就可以理解為編制試卷與標(biāo)準(zhǔn)試卷的一致程度。
下面我們用量化的形式描述兩試卷的一致性程度。(略)
(二)試卷內(nèi)容貼近度
我們把教學(xué)大綱的要求看作是一個(gè)模糊集合,試卷反映教學(xué)大綱要求的程度看作是另一個(gè)模糊集合,用模糊貼近度來(lái)定義試卷的內(nèi)容貼近度。(略)
采用兩曲線距離描述試卷水平貼近度和采用兩向量距離描述試卷內(nèi)容貼近度,突破了考試命題質(zhì)量評(píng)價(jià)的難點(diǎn),為考前綜合評(píng)價(jià)試卷質(zhì)量提供了依據(jù)。它能根據(jù)同一教學(xué)目標(biāo),制定復(fù)份等價(jià)試卷,實(shí)現(xiàn)不同時(shí)間、不同地點(diǎn)的考生使用不同的試卷(復(fù)份等價(jià)),其成績(jī)等值可比。特別是為計(jì)算機(jī)題庫(kù)建設(shè)提供了評(píng)判試卷質(zhì)量的專家智能,使得計(jì)算機(jī)能產(chǎn)生高質(zhì)量試卷。
三、課程考試科學(xué)化命題的主要環(huán)節(jié)
按照課程考試測(cè)量特性及試卷質(zhì)量指標(biāo)計(jì)算的要求,課程考試科學(xué)化命題應(yīng)包括以下主要環(huán)節(jié):
(一)制定學(xué)科考試大綱,將教學(xué)要求轉(zhuǎn)化為測(cè)試要求
考試大綱是聯(lián)系教學(xué)大綱與試卷的橋梁,這個(gè)作用決定了這一工作應(yīng)根據(jù)教學(xué)大綱的要求緊緊圍繞教學(xué)大綱的教學(xué)目標(biāo)制定,即教學(xué)大綱一考試大綱相互配套??荚嚧缶V在內(nèi)容上一般應(yīng)包括:考試目標(biāo)、考試內(nèi)容和考試標(biāo)準(zhǔn)。另外,鑒于考試大綱與教學(xué)大綱的不同,在考試大綱中還應(yīng)對(duì)考試方法做明確規(guī)定,如考試時(shí)限、所用題型、作答要求、樣卷等。
考試目標(biāo)就是檢查學(xué)生實(shí)現(xiàn)教學(xué)目標(biāo)的程度??荚嚹繕?biāo)原則上應(yīng)與教學(xué)目標(biāo)相同,考慮到教學(xué)大綱確定的有些教學(xué)目標(biāo)難以通過(guò)考試來(lái)測(cè)量,因此應(yīng)認(rèn)真分析教學(xué)目標(biāo)的要求并使之轉(zhuǎn)化為可測(cè)的,以實(shí)現(xiàn)檢查學(xué)生實(shí)現(xiàn)教學(xué)目標(biāo)的程度。
考試內(nèi)容就是教學(xué)內(nèi)容。為了能為考試命題提供具體、清晰的標(biāo)準(zhǔn),需要將教學(xué)大綱規(guī)定的教學(xué)要求轉(zhuǎn)化為具體的測(cè)試項(xiàng)目。鑒于目前的教學(xué)大綱中,對(duì)傳授知識(shí)與培養(yǎng)能力分別提出了明確的要求,因此,考試內(nèi)容可按學(xué)科知識(shí)的部分和心理能力的層次,分別確定試題的占分比例:
1.將教學(xué)大綱中教學(xué)內(nèi)容的要求轉(zhuǎn)化為主要教學(xué)內(nèi)容考查點(diǎn),根據(jù)各考查點(diǎn)內(nèi)容在教學(xué)大綱中的地位,確定考試分?jǐn)?shù)比例。
2.根據(jù)學(xué)科特點(diǎn)確定能力層次比例。一般情況下能力層次可分為識(shí)記、領(lǐng)會(huì)、簡(jiǎn)單應(yīng)用、綜合應(yīng)用、靈活應(yīng)用等,也可根據(jù)學(xué)科的特點(diǎn)按教學(xué)大綱中培養(yǎng)能力的要求分類。
3.考試標(biāo)準(zhǔn)就是根據(jù)考試目標(biāo)規(guī)定的關(guān)于考試范圍、深淺程度等方面的具體要求。這里應(yīng)盡可能減少使用“理解”、“了解”、“掌握”、“領(lǐng)會(huì)”等描述性語(yǔ)言,應(yīng)該以判斷學(xué)生在所要求的行為方面所發(fā)生的變化程度為標(biāo)準(zhǔn),如考生應(yīng)能做什么,或具備哪些特征等。
(二)建立學(xué)科試題庫(kù),確定試題要求度
試題要求度是根據(jù)試題所屬的考核能力層次、知識(shí)面和深度、解題技巧等諸多因素綜合加以評(píng)定的指標(biāo),是相對(duì)教學(xué)目標(biāo)而言,是試題內(nèi)容重要性和復(fù)雜性的體現(xiàn)。
試題要求度通常由專家組綜合評(píng)判得出。
(三)確定學(xué)科大樣本情況下的統(tǒng)計(jì)常數(shù)(略)
(四)配制試卷,計(jì)算質(zhì)量指標(biāo)
1.試卷水平貼近度的計(jì)算。(略)
2.試卷內(nèi)容貼近度的計(jì)算。(略)
至此,從理論研究設(shè)計(jì)到實(shí)際操作運(yùn)行,形成了一個(gè)較為完整的體系,為學(xué)校這種大量的、經(jīng)常性的考試提供了一個(gè)科學(xué)性、可行性良好的樣本。隨著實(shí)踐不斷深入,理論逐步完善,科學(xué)化命題的理論和方法必將產(chǎn)生較大的社會(huì)效益。
第一作者系空軍第二航空學(xué)院院長(zhǎng)(長(zhǎng)春130002)
責(zé)任編輯:邵英