李勇
關(guān)于考試機(jī)構(gòu)命題工作專業(yè)化建設(shè)的思考
李勇
教育考試機(jī)構(gòu)的命題專業(yè)化建設(shè)既是教育改革的客觀要求,也是考試機(jī)構(gòu)自身發(fā)展的迫切需要。從發(fā)展趨勢(shì)看,要順應(yīng)時(shí)代的要求由經(jīng)驗(yàn)化命題走向?qū)I(yè)化命題,將命題組織模式由會(huì)議式命題轉(zhuǎn)向題庫式命題,將人員角色定位由命題教師主導(dǎo)轉(zhuǎn)向?qū)W科秘書主導(dǎo),將專業(yè)能力建設(shè)由偏重學(xué)科背景走向偏重評(píng)估背景。
考試機(jī)構(gòu);命題;專業(yè)化
命題是體現(xiàn)考試質(zhì)量與公平的核心環(huán)節(jié),是確??荚囎陨砜茖W(xué)有效的根本。命題專業(yè)化建設(shè)既是教育改革的客觀要求,也是教育考試機(jī)構(gòu)自身發(fā)展的迫切需要。
目前,我國(guó)考試機(jī)構(gòu)的命題大多還停留在經(jīng)驗(yàn)化命題階段,缺少實(shí)證性的試題和試卷質(zhì)量保證手段??荚囎鳛橐环N測(cè)量工具,正如測(cè)量身高的尺子。試想在動(dòng)手測(cè)量之前,這把尺子是否合格,尺度是否穩(wěn)定,誤差有多大不得而知,考后即使發(fā)現(xiàn)問題,也只能將錯(cuò)就錯(cuò)。這種狀況與現(xiàn)代教育測(cè)量基本理論的要求相去甚遠(yuǎn),也嚴(yán)重制約著我國(guó)教育考試事業(yè)的繁榮發(fā)展。
在教育領(lǐng)域綜合改革的時(shí)代背景下,以高考改革為代表的考試招生改革對(duì)考試的安全性、科學(xué)性、公平性提出了更高要求。2013年,十八屆三中全會(huì)審議通過的《中共中央關(guān)于全面深化改革若干重大問題的決定》,明確提出了考試招生改革的方向:“推進(jìn)考試招生制度改革,探索招生和考試相對(duì)分離、學(xué)生考試多次選擇、學(xué)校依法自主招生、專業(yè)機(jī)構(gòu)組織實(shí)施、政府宏觀管理、社會(huì)參與監(jiān)督的運(yùn)行機(jī)制,從根本上解決一考定終身的弊端。探索全國(guó)統(tǒng)考減少科目、不分文理科、外語等科目社會(huì)化考試一年多考?!贝舜胃母锏臎Q心和力度前所未有,勢(shì)必對(duì)考試機(jī)構(gòu)多年來形成的固有模式和經(jīng)驗(yàn)造成沖擊。這種影響既是挑戰(zhàn),更是機(jī)遇。具體表現(xiàn)在兩個(gè)方面:一是“招生和考試相對(duì)分離”,“外語等科目社會(huì)化考試”,預(yù)示著考試及考試機(jī)構(gòu)的社會(huì)化將成為趨勢(shì)。社會(huì)化必然要求產(chǎn)品和服務(wù)的專業(yè)化。其中,命題的專業(yè)化將是保證考試項(xiàng)目質(zhì)量,提升考試機(jī)構(gòu)核心競(jìng)爭(zhēng)力的關(guān)鍵。二是“學(xué)生考試多次選擇”,“外語等科目社會(huì)化考試一年多考”,不只表面上會(huì)大大增加考試機(jī)構(gòu)的工作量,更在實(shí)質(zhì)上推動(dòng)現(xiàn)代命題質(zhì)量觀的落實(shí)。比如考試難度的穩(wěn)定性,多次考試的分?jǐn)?shù)等值,量表分?jǐn)?shù)的轉(zhuǎn)換等,傳統(tǒng)的命題組織模式恐怕無力應(yīng)對(duì)。目前,進(jìn)行高校考試招生綜合改革試點(diǎn)的“一省一市”中,浙江方案提出:外語和選考科目實(shí)行一年兩考[1];上海方案更是提出:英語實(shí)行一年兩考,建設(shè)外語標(biāo)準(zhǔn)化考試題庫,外語考試要為今后其他科目逐步推行標(biāo)準(zhǔn)化考試積累經(jīng)驗(yàn)[2]。這種基于題庫的命題組織模式是實(shí)施一年多考的有效方式,也最能體現(xiàn)以“效度論證”為核心的現(xiàn)代考試質(zhì)量觀。
在以高考為代表的選拔性考試之外,考試機(jī)構(gòu)還開展著很多證書考試、等級(jí)考試等社會(huì)性考試項(xiàng)目。這類考試的質(zhì)量、考試證書的公信力與“含金量”,都必須接受社會(huì)的檢驗(yàn),得到社會(huì)的認(rèn)可。只有被社會(huì)接受和認(rèn)可的考試項(xiàng)目,才具有生存和發(fā)展活力。[3]社會(huì)考試往往涉及等級(jí)標(biāo)準(zhǔn)的設(shè)定與維持、多等級(jí)間梯度的合理設(shè)置等問題,技術(shù)難度要求較高,命題質(zhì)量標(biāo)準(zhǔn)相比選拔性考試更為嚴(yán)苛。此外,一些考試機(jī)構(gòu)近年來還積極開展教育質(zhì)量監(jiān)測(cè)項(xiàng)目。這類考試以國(guó)際學(xué)生評(píng)估項(xiàng)目(PISA)、國(guó)際數(shù)學(xué)和科學(xué)趨勢(shì)研究(TIMSS)、國(guó)際閱讀素養(yǎng)進(jìn)展研究(PIRLS)、美國(guó)國(guó)家教育進(jìn)展評(píng)估(NAEP)等為代表,通過監(jiān)測(cè)考試輔以各類調(diào)查問卷,從跟蹤比較和教育研究的視角,對(duì)一個(gè)國(guó)家或地區(qū)的教育進(jìn)行系統(tǒng)分析,并找尋原因,提出建議。監(jiān)測(cè)考試的技術(shù)難度是所有考試類型中相對(duì)較高的,其對(duì)命題質(zhì)量的要求更不低。
可以說,無論以高考為代表的政策性考試,還是面向市場(chǎng)的社會(huì)性考試,以及為政府決策與問責(zé)服務(wù)的監(jiān)測(cè)性考試,都越來越需要專業(yè)化命題的支撐。命題能力建設(shè)將是考試機(jī)構(gòu)由專門向?qū)I(yè),管理向服務(wù)轉(zhuǎn)型的關(guān)鍵支點(diǎn)。
要由傳統(tǒng)的經(jīng)驗(yàn)化命題走向?qū)I(yè)化命題,首先要革新命題工作的組織模式。傳統(tǒng)的命題組織模式一般是將命題教師短期集中,編寫試卷并反復(fù)研磨后,直接印刷使用,可以稱為會(huì)議式命題。也有研究者稱其為任務(wù)式、會(huì)議任務(wù)式、入闈式、集中式命題。
題庫建設(shè)是對(duì)考試機(jī)構(gòu)命題工作模式的革新,代表了現(xiàn)代考試機(jī)構(gòu)專業(yè)化發(fā)展的方向。[4]正如教育部考試中心題庫工作小組所總結(jié),題庫模式至少有三個(gè)方面的優(yōu)越性。第一,管理學(xué)上的優(yōu)越性,即高效、靈活、高度保密。對(duì)于考試安全性來說,會(huì)議式命題的安全保密完全依靠命題教師的法律意識(shí)和自覺性,存在很大風(fēng)險(xiǎn)。此外,入闈期間如果發(fā)生自燃災(zāi)害,或者發(fā)生諸如食物中毒等事件,當(dāng)年命題任務(wù)將難以完成,后果不堪設(shè)想。題庫式命題將命題工作日?;皇悄軌?qū)⒈C墉h(huán)節(jié)和涉密人員減至最少,二是增強(qiáng)了應(yīng)對(duì)突發(fā)事件的能力。第二,測(cè)量學(xué)上的優(yōu)越性,即高質(zhì)量、可預(yù)控、等值可比、穩(wěn)定一致。會(huì)議式命題限制性強(qiáng),所需時(shí)間長(zhǎng),管理嚴(yán)格,高水平教師越來越難聘請(qǐng)到,從而造成試題質(zhì)量波動(dòng)。題庫式命題有利于擴(kuò)大試題來源。另外積累一定數(shù)量的試題后,可以進(jìn)行部分試測(cè),并進(jìn)行科學(xué)的等值研究,從測(cè)量學(xué)指標(biāo)上進(jìn)一步保證試題質(zhì)量。第三,計(jì)算機(jī)實(shí)現(xiàn)技術(shù)的先進(jìn)性,即試題的動(dòng)態(tài)管理和試卷的自動(dòng)生成和分發(fā)。題庫式命題提高了試題管理的便捷性,有利于依托功能強(qiáng)大的計(jì)算機(jī)技術(shù)研究設(shè)計(jì)更多靈活、新穎的題型和試題,更好地引導(dǎo)學(xué)生的學(xué)習(xí),培養(yǎng)創(chuàng)新精神和創(chuàng)造能力,也為今后實(shí)現(xiàn)計(jì)算機(jī)化自適應(yīng)考試奠定基礎(chǔ)。[5]
從命題工作實(shí)務(wù)角度進(jìn)一步分析,題庫式命題還解決了會(huì)議式命題的幾個(gè)突出矛盾。第一,命題教師全能與專一的矛盾。傳統(tǒng)命題模式下,命題教師不但負(fù)責(zé)編寫試題,還要負(fù)責(zé)編制或修訂命題藍(lán)圖,以及后期試題組卷。命題藍(lán)圖的編制需要一定的課程理論修養(yǎng),而組卷能力需要較強(qiáng)的測(cè)量專業(yè)知識(shí)。此外,命題教師既要對(duì)試題內(nèi)容負(fù)責(zé),又要對(duì)格式編排負(fù)責(zé)。在題庫式命題模式下,命題教師專心負(fù)責(zé)編寫試題,無須為試卷設(shè)計(jì)和編排分心,可以更好地發(fā)揮其長(zhǎng)處避免其不足。第二,考試內(nèi)容保持穩(wěn)定與推陳出新的矛盾。傳統(tǒng)命題模式下,為了保持考試的穩(wěn)定,命題藍(lán)圖一經(jīng)確定往往不再會(huì)有大的調(diào)整。每次命題也都會(huì)參照上次試卷,甚至于考核某個(gè)知識(shí)點(diǎn)的試題多年一直出現(xiàn)在試卷相同位置,一直使用相同的題型。如果某個(gè)知識(shí)點(diǎn)由于試卷題量限制沒有被命題藍(lán)圖覆蓋到,則可能一直得不到考查??荚嚈C(jī)構(gòu)對(duì)于推陳出新一般持謹(jǐn)慎態(tài)度,因?yàn)榭己诵轮R(shí)點(diǎn)或采用新題型,就可能造成難度的較大波動(dòng)。從測(cè)量學(xué)角度看,試卷是對(duì)考試內(nèi)容的抽樣,因此,命題藍(lán)圖不應(yīng)一成不變。采用題庫模式,通過抽題組卷,一方面可以提高考試內(nèi)容抽樣的靈活性,讓考試與教學(xué)的聯(lián)系更加緊密;另一方面通過試題已知參數(shù)可以準(zhǔn)確維持難度,避免推陳出新的風(fēng)險(xiǎn)。第三,擴(kuò)大試題來源與降低安全風(fēng)險(xiǎn)的矛盾。傳統(tǒng)命題模式下,由于試卷當(dāng)次即用,所以命題人員越少越有利于保密管理。而在題庫式命題模式下,可面向社會(huì)廣泛征集試題,經(jīng)修訂和驗(yàn)證后入庫擇機(jī)使用。這種方式一是擴(kuò)大了試題來源,可以保證更多合格試題的出現(xiàn);二是將命題工作日?;?,有利于教師的命題與教學(xué)保持緊密聯(lián)系,促進(jìn)更多優(yōu)質(zhì)試題的涌現(xiàn);三是當(dāng)參與征題的教師隊(duì)伍規(guī)模足夠大,題庫不斷補(bǔ)充和更新試題,由于每位命題教師對(duì)其被征集的試題是否被采用,被修訂為何樣,何時(shí)使用并不知情,可以有效提高考試安全性。
目前,在考試機(jī)構(gòu)的命題實(shí)踐中,題庫建設(shè)已漸成潮流。教育部考試中心自2006年全面啟動(dòng)題庫建設(shè)工作,其負(fù)責(zé)的國(guó)家教育統(tǒng)一考試所有項(xiàng)目和科目,全部列入題庫工作范疇。[5,6]浙江省教育考試院自2013年開展開放性征題工作,啟動(dòng)試題庫建設(shè),向社會(huì)廣泛征集學(xué)業(yè)水平考試、高考試題。[7]可以預(yù)見,隨著教育體制改革的深入推進(jìn),考試社會(huì)環(huán)境的逐步改善,題庫式命題模式將逐漸成為主流。
在會(huì)議式命題模式下,試題內(nèi)容大多交由學(xué)科命題教師負(fù)責(zé)。作為考試機(jī)構(gòu)工作人員的學(xué)科秘書,從其稱謂上就可看出,主要是承擔(dān)組織協(xié)調(diào),輔助命題工作,一般不對(duì)試題內(nèi)容作出裁決。在題庫式命題模式下,學(xué)科秘書應(yīng)從偏管理向管理與業(yè)務(wù)并重發(fā)展,成為真正意義上的學(xué)科主管,全程主導(dǎo)命題工作,并對(duì)試題質(zhì)量負(fù)責(zé)。由考試機(jī)構(gòu)學(xué)科主管主導(dǎo)命題是國(guó)際專業(yè)考試機(jī)構(gòu)的通行模式,對(duì)于我國(guó)考試機(jī)構(gòu)的學(xué)科秘書而言,大多也有相關(guān)專業(yè)訓(xùn)練,并有大量命題實(shí)踐經(jīng)驗(yàn),完全有能力向這一角色轉(zhuǎn)換。
命題教師主導(dǎo)命題的弊端存在于兩個(gè)方面。一是命題教師一般是外聘人員,屬于臨時(shí)兼職從事命題工作。從管理角度看,人員的穩(wěn)定性難以保證,且與考試機(jī)構(gòu)無直接人事隸屬關(guān)系,一旦出現(xiàn)命題質(zhì)量問題,也難以對(duì)其進(jìn)行問責(zé)或處理。二是命題教師一般是學(xué)科教學(xué)或研究背景,非長(zhǎng)期專職從事命題研究與實(shí)踐工作,從業(yè)務(wù)角度看,往往存在能力缺陷。正如上海教育考試院周群所指出,由于命題工作非常態(tài)化,使命題教師培訓(xùn)缺乏系統(tǒng)性。以上海為例,高考命題伊始首先對(duì)命題教師集中進(jìn)行命題技術(shù)和要求方面的培訓(xùn),培訓(xùn)時(shí)間一般為2小時(shí)。審題前也有相應(yīng)培訓(xùn),主要是解讀試題、試卷質(zhì)量標(biāo)準(zhǔn)。命審題教師培訓(xùn)以授課講解為主,時(shí)間局促,根本沒有操練學(xué)習(xí)的可能?,F(xiàn)實(shí)狀況是,命題教師不能自覺遵循考試機(jī)構(gòu)提供的命題規(guī)范的規(guī)定命題,而是選擇自己熟悉的學(xué)科知識(shí)和材料撰寫試題,試題編制出來后,再確定試題的測(cè)量目標(biāo)。審題教師也沒有足夠的能力從教育測(cè)量學(xué)的角度審閱試題,導(dǎo)致與命題規(guī)范不一致,測(cè)量目標(biāo)模糊的試題時(shí)有出現(xiàn)。[8]
學(xué)科秘書要成為考試命題的主導(dǎo)者,至少要在以下三方面發(fā)揮作用。第一,掌握考試標(biāo)準(zhǔn)的制定和解釋權(quán)。以往的考試標(biāo)準(zhǔn),如考試大綱、考試說明、命題藍(lán)圖,一般是由命題教師通過開會(huì)研討,根據(jù)經(jīng)驗(yàn)編制。學(xué)科秘書要通過借鑒國(guó)內(nèi)外學(xué)科考試標(biāo)準(zhǔn),梳理學(xué)科測(cè)試的理論成果,分析課程標(biāo)準(zhǔn)、教材等工作,承擔(dān)起考試標(biāo)準(zhǔn)研制的研究任務(wù)。并通過向命題教師、課標(biāo)專家、測(cè)量專家等多方征詢的方式,修訂完善考試標(biāo)準(zhǔn)。第二,指導(dǎo)并參與試題編寫工作。學(xué)科秘書要從考試設(shè)計(jì)理念、試題編寫原則、教育目標(biāo)分類理論等角度培訓(xùn)指導(dǎo)命題教師命題。最好具備對(duì)征集的試題進(jìn)行修訂,獨(dú)立編寫部分試題的能力。第三,開展題目分析、組卷等工作。學(xué)科秘書要承擔(dān)起試卷層面的相關(guān)工作,從而解放命題教師,讓其專注于試題層面工作。
學(xué)科秘書角色的轉(zhuǎn)換需要內(nèi)在能力的支撐。以往一種誤解是學(xué)科秘書只要具備學(xué)科背景即可。其實(shí),考試作為一種評(píng)估活動(dòng),與教學(xué)活動(dòng)的能力要求相差很大。學(xué)科秘書應(yīng)該首先是一名評(píng)估專家,而非教學(xué)專家。因此,具備教育測(cè)量專業(yè)背景,以及支撐教育測(cè)量的教育心理、教育統(tǒng)計(jì)等背景更為重要。
試題的質(zhì)量可以分為三個(gè)逐步遞升的層級(jí),即科學(xué)、規(guī)范、優(yōu)質(zhì)。科學(xué)是指無科學(xué)性錯(cuò)誤;規(guī)范是指符合教育測(cè)量規(guī)范;優(yōu)質(zhì)是指命題思路精巧??茖W(xué)層級(jí)一般要由命題教師來保證,規(guī)范層級(jí)更多要通過學(xué)科秘書來保證,而優(yōu)質(zhì)層級(jí)則比較難以達(dá)到,需要命題教師和學(xué)科秘書的共同努力。目前,由于傳統(tǒng)觀念的影響,學(xué)科秘書和命題教師普遍存在重視學(xué)科背景,輕視測(cè)量專業(yè)能力提升的心態(tài)。正如上海教育考試院雷新勇指出:綜觀近年來各自主命題省市的高考試卷,可以發(fā)現(xiàn),盡管從學(xué)科的角度看,試題、試卷沒有科學(xué)性問題,但從教育測(cè)量學(xué)的角度看,很多試題和試卷都存在問題。高校和高中的學(xué)科教師對(duì)教育測(cè)量科學(xué)知之甚少,命題時(shí)都只關(guān)注試題考查的知識(shí)點(diǎn),很少關(guān)注試題的認(rèn)知要求,更不關(guān)注試題的認(rèn)知能力要求與考試考查的心理特質(zhì)及其行為表現(xiàn)的一致性。教育考試機(jī)構(gòu)要提高考試的科學(xué)性就必須組建一支專業(yè)化的學(xué)科秘書隊(duì)伍。學(xué)科秘書不但需要具備學(xué)科知識(shí),更重要的是要逐步掌握教育測(cè)量學(xué)知識(shí),以專業(yè)的知識(shí)、技能和方法從事考試設(shè)計(jì)、命題管理和考試評(píng)價(jià)。[9]
對(duì)學(xué)科秘書能力的另一種誤解是強(qiáng)調(diào)必須有一線教學(xué)實(shí)踐經(jīng)驗(yàn)。當(dāng)然,學(xué)科秘書具有教學(xué)經(jīng)驗(yàn)勢(shì)必對(duì)命題工作有幫助,但這種既有實(shí)踐又有理論,既懂教學(xué)又專評(píng)估的人才畢竟非常少。學(xué)科秘書可以通過將工作重心放在以下四個(gè)方面,來有效規(guī)避這方面的不足。一是總結(jié)命題思路,即從教師提供的試題中,總結(jié)出常見的命題套路;二是收集試題素材,即收集試題的情境設(shè)計(jì),包括文字描述和圖片素材;三是分析典型錯(cuò)誤,即分析試題的錯(cuò)誤作答類型,了解各類錯(cuò)誤在實(shí)際教學(xué)中發(fā)生的頻率大??;四是建設(shè)材料庫,如對(duì)字詞書寫的考查,可以盡量收集所有容易書寫錯(cuò)誤的字詞,組成材料庫供使用。學(xué)科秘書通過上述工作,就可以很容易地了解教學(xué)實(shí)際,舉一反三,編制試題。
總之,就像修建一座建筑,傳統(tǒng)的模式是讓命題教師生產(chǎn)磚,并負(fù)責(zé)設(shè)計(jì)建筑圖紙,再按圖紙搭建成型,而更好的模式是命題教師只負(fù)責(zé)提供磚坯,由學(xué)科秘書負(fù)責(zé)設(shè)計(jì)建筑圖紙,并篩選和修改磚坯后,將之燒制成磚,再按圖紙搭建成型。這樣的好處是讓命題教師和學(xué)科秘書分工合作,命題教師發(fā)揮學(xué)科特長(zhǎng),學(xué)科秘書發(fā)揮評(píng)估特長(zhǎng),不但有助于學(xué)科秘書的專業(yè)成長(zhǎng),考試機(jī)構(gòu)命題能力的建設(shè),也有助于穩(wěn)步提升考試項(xiàng)目的質(zhì)量。
參考文獻(xiàn)
[1]浙江省人民政府.浙江省人民政府關(guān)于印發(fā)浙江省深化高??荚囌猩贫染C合改革試點(diǎn)方案的通知[EB/OL].[2014.9.19].http: //www.zj.gov.cn/art/2014/9/22/art_12460_178621.html.
[2]上海市人民政府.市政府關(guān)于印發(fā)《上海市深化高等學(xué)校考試招生綜合改革實(shí)施方案》的通知[EB/OL].[2014.9.19].http://www. shanghai.gov.cn/nw2/nw2314/nw2319/nw10800/nw11407/nw31810/ u26aw40261.html.
[3]王志武.社會(huì)考試社會(huì)化發(fā)展的模式與機(jī)制研究[J].中國(guó)考試,2012(8):39-44.
[4]漆書青.題庫和題庫的建設(shè)與應(yīng)用[J].湖北招生考試,2002(20):6-8.
[5]教育部考試中心題庫工作小組.談教育考試國(guó)家題庫建設(shè)[J].中國(guó)考試,2008(4):9-12.
[6]教育部考試中心題庫工作小組.談教育考試國(guó)家題庫建設(shè)現(xiàn)狀及展望[J].中國(guó)考試,2008(6):53-56.
[7]吳若茜.充分發(fā)揮人才隊(duì)伍在建設(shè)專業(yè)化教育考試機(jī)構(gòu)中的作用[J].教育與考試,2014(2):40-44.
[8]周群.基于效度的中美大學(xué)入學(xué)考試開發(fā)比較研究[J].中國(guó)高教研究,2010(11):58-61.
[9]雷新勇.高考,誰來命題更科學(xué)[N].中國(guó)教育報(bào),2010-12-15.
Discussions on Professional Construction of Examination Authority’s Test Development
LI Yong
Professional construction of the educational examination authority’s Test Development meet the needs of both educational examination and enrollment reform and examination authority’s own development.From the development trend,to comply with the requirements of the times,the experienced test development method must be replaced by specialized test development method,organizational model must from conference to item-banking,role of the personnel must from discipline teacher-led to discipline secretary dominant,and the professional capacitybuilding emphasis by the biased disciplinary backgrounds to assessment background.
Examination Authority;Test Development;Professional Construction
G405
A
1005-8427(2015)11-0049-5
李勇,男,天津市教育招生考試院,助理研究員(天津 300387)