任 濤 扈 巖 張青華 丁秀濤
自主課程建設(shè)實驗學(xué)校學(xué)業(yè)水平考試試卷評價標(biāo)準(zhǔn)研究
任 濤 扈 巖 張青華 丁秀濤
考試評價研究的科學(xué)、全面發(fā)展,對促進基礎(chǔ)教育的均衡發(fā)展、減輕學(xué)生負擔(dān)、彰顯學(xué)校辦學(xué)特色,提高教育教學(xué)質(zhì)量都將產(chǎn)生重要影響。試卷評價體系是衡量和評估試卷是否公平科學(xué)、準(zhǔn)確規(guī)范,學(xué)生學(xué)業(yè)質(zhì)量是否達標(biāo)的標(biāo)尺。本文以自主課程建設(shè)實驗學(xué)校學(xué)業(yè)水平考試試卷評價標(biāo)準(zhǔn)的探究為切入點,通過建立命題藍圖評價量表,使試卷藍圖科學(xué)化;通過建立試卷質(zhì)量評價量表,使評價過程標(biāo)準(zhǔn)化,評價結(jié)果可量化,評價報告可讀性強。
課程標(biāo)準(zhǔn);學(xué)業(yè)水平考試;命題藍圖;考試評價標(biāo)準(zhǔn)
《國家中長期教育改革和發(fā)展規(guī)劃綱要(2010—2020)》和《國務(wù)院深化考試招生制度改革的實施意見》提出“建立科學(xué)的教育質(zhì)量評價體系,全面實施高中學(xué)業(yè)水平考試”。普通高中學(xué)業(yè)水平考試制度作為我國教育制度的重要組成部分,是基礎(chǔ)教育考試評價體系的核心內(nèi)容。開展普通高中課程改革實驗,是貫徹國家及北京市中長期教育改革和發(fā)展規(guī)劃綱要,推進素質(zhì)教育的根本要求,也是落實國家及北京市普通高中課程方案,推進具有首都特色和充滿活力的普通高中課程體系,促進學(xué)生全面而有個性發(fā)展,促進教師素質(zhì)整體優(yōu)化和普通高中教育質(zhì)量不斷提高的重要手段。
北京市自2007年開展普通高中自主排課實驗(以下簡稱“自主實驗”),自主實驗學(xué)??筛鶕?jù)課程進度安排和學(xué)校實際能力選擇科目進行學(xué)業(yè)水平考試組考(以下簡稱“自主會考”)。允許部分普通高中開展自主實驗,賦予學(xué)校合理而充分的課程自主權(quán)是為了更好地落實課改實驗總目標(biāo),為學(xué)校創(chuàng)造性地實施國家課程、因地制宜地開發(fā)校本課程,為學(xué)生自主選擇個性課程提供保障,切實探索一套完整的“以校為本”的新課程實驗體系,為推進北京市高中課改起到示范和引領(lǐng)作用。先期進入自主課程實驗的學(xué)校共有10所,如北京二中、北京四中、中國人民大學(xué)附屬中學(xué)和北京十一學(xué)校等全國知名的示范性高中。
為推進高中課改健康發(fā)展,保證課改質(zhì)量,完善自主實驗學(xué)校學(xué)業(yè)水平考試管理機制,依據(jù)北京市教委《關(guān)于進一步推進學(xué)校自主課程建設(shè)實驗有關(guān)事項的通知》(京教基二[2012]20號)精神,以及《北京市自主課程建設(shè)實驗學(xué)校學(xué)業(yè)水平考試(會考)管理方案》,從2013年夏季開始北京市參加自主會考的學(xué)校增加14所,加上先期進入的10所,共有24所示范性高中進行自主排課實驗,自行組織學(xué)業(yè)水平考試,即這24所中學(xué)均要進行高中會考語文、數(shù)學(xué)、英語、物理、化學(xué)、生物、思想政治、歷史和地理9個學(xué)科的自主命題工作。
自主會考是開展自主課程實驗的重要組成部分,是落實課程計劃、檢驗和評價課程實驗、達成實驗?zāi)繕?biāo)的重要環(huán)節(jié),允許自主考試是北京市教委為實現(xiàn)自主實驗?zāi)繕?biāo)、課程計劃、教學(xué)內(nèi)容、保障教學(xué)時間的基本手段。尤其需要指出的是,自主會考是北京市為推進普通高中課程改革實驗,推進具有首都特色和充滿活力的普通高中課程體系,而進行的新改革舉措。對自主會考進行科學(xué)的、體系化的評價研究,對于北京市建立和完善普通高中教育質(zhì)量監(jiān)測體系具有積極的意義。因此,從省市級層面加強對自主考試的監(jiān)控與評價極其重要和必要。
試卷評價體系是衡量和評估試卷是否科學(xué)公平、準(zhǔn)確規(guī)范,學(xué)生學(xué)業(yè)質(zhì)量是否達標(biāo)的標(biāo)尺。開展自主會考試卷評價體系研究工作,主要目的是加強對自主會考的監(jiān)控與評價,保證自主考試與自主課程建設(shè)實驗的一致性,確保統(tǒng)一考試的公平性。對24所學(xué)校會考9個學(xué)科進行自主命題的評價,意味著北京市每年將有約200份的試卷評價報告需要撰寫,工作量很大。因此編制評價量表,對試卷評價進行系統(tǒng)化處理,將使北京市的自主會考評價研究工作科學(xué)、高效、便捷。
北京市針對全市會考已開展多年試題質(zhì)量、學(xué)生學(xué)業(yè)水平及教學(xué)質(zhì)量分析研究,在對試題評價分析中,已構(gòu)建并逐步完善了考試評價的統(tǒng)計指標(biāo)和教育測量指標(biāo)體系。
自主會考試卷評價的依據(jù)是:“高中課程標(biāo)準(zhǔn)”、“北京市普通高中會考考試說明”、學(xué)科試卷命題藍圖,并適當(dāng)參照北京市統(tǒng)一會考試卷的難度水平。因此,自主會考試卷評價量表研究就是結(jié)合教育測量學(xué)中質(zhì)性評價的定量、定性分析方法,在每次考試后對考試試卷進行全卷以及題目的分析,并對命題提出有針對性的建議。
3.1 對試卷命題藍圖的評價
命題藍圖是試卷命制的計劃或規(guī)劃,一份“好”的命題藍圖是命制一份高質(zhì)量試卷的前提,因此對于各校各學(xué)科試卷的命題藍圖的評價非常重要。根據(jù)學(xué)科課程標(biāo)準(zhǔn)、學(xué)校自主課程實驗方案,參照北京市會考考試說明,從以下幾方面對各學(xué)校提供的自主會考學(xué)科命題藍圖進行評價,見表1。
表1 命題藍圖評價量表
對于1~5題,請學(xué)科專家進行等級評分,最高為10分,最低為0分。8~10分為滿足要求,6~7分為基本滿足要求,3~5分為基本不符合要求,0~2分為完全不符合要求,并用定性化的語言進行說明或描述。對第6項給予明確評價意見,簡要概述此命題藍圖涉及的學(xué)科模塊內(nèi)容和該學(xué)科命題的主要特點,并簡述改進意見和措施。不同專家“背靠背”的對試卷命題藍圖進行“盲審”,藍圖是否有問題,有什么樣的問題,該如何改進,建議和措施等就會顯現(xiàn)在評價量表上,提供給自主會考學(xué)校進行改進和完善。
3.2試卷質(zhì)量評價標(biāo)準(zhǔn)
不論是常模參照性考試或標(biāo)準(zhǔn)參照性考試,對試卷評價的角度主要有四個方面,即科學(xué)性、準(zhǔn)確性、規(guī)范性和公平性。根據(jù)自主會考的水平性考試性質(zhì)和特點,首先聘請一線學(xué)科教師和命題專家等30余人對試卷質(zhì)量標(biāo)準(zhǔn)進行訪談,并對訪談記錄進行編碼,之后整合為編碼結(jié)果。整理后的結(jié)果共分成兩大類,一類為考查內(nèi)容及要求,主要是對考試試卷所涉及的內(nèi)容范圍進行評分;第二類為命題技術(shù)規(guī)范。將這兩類問題進行合并整理,選取頻率最高的編制問卷,采用因素分析,從考查內(nèi)容要求、命題技術(shù)規(guī)范、難度設(shè)置和總體質(zhì)性評價四個維度進行試卷質(zhì)量評價。
表2 試卷質(zhì)量評價量表
試卷評價專家參考表2中的20個方面來對試卷進行評價,并給予分項說明。首先,對表2“試卷質(zhì)量評價量表”進行量化打分,共20項,每項5分;采用五級評分制,把5分細化為五檔,即完全滿足要求5分、能夠滿足要求4分、基本滿足要求3分、基本不符合要求2分、完全不符合要求0~1分。同時,對試卷質(zhì)性評價的等級性進行描述:優(yōu)秀等級試卷為完全符合表2中列出的所有方面,試卷中大部分試題屬于原創(chuàng)性試題或改編試題,命題有學(xué)校自主方案特色;良好等級為基本符合表2中列出的所有方面,試卷有部分原創(chuàng)試題,具有一定的學(xué)校自主方案特色;合格等級為能夠符合表2中列出的大部分內(nèi)容,試卷具有一定的特點;不合格等級為不符合表2中列出的大部分內(nèi)容,或包含以下問題如:試卷未按照命題藍圖命題,試卷有科學(xué)性“硬傷”,試題無原創(chuàng)性或改編試題,試卷沒有反映學(xué)校自主方案的特點,等等。
不同專家“背靠背”對試卷進行“盲審”,尤其對低于3分等級的要給出確切原因說明,最后根據(jù)試卷20項總得分,給出試卷質(zhì)量總體評價,見表3。通過這樣定量與定性的評價過程,一份自主會考試卷的特色和不足就完全展現(xiàn)在評價量表上。
3.3 評價報告內(nèi)容框架設(shè)計
結(jié)合試卷質(zhì)量評價量表,設(shè)計試卷質(zhì)性評價報告,共分為三部分:
第一部分為對試卷的整體評價,內(nèi)容包含三方面:一是對學(xué)科命題質(zhì)量的總體評價,內(nèi)容可結(jié)合表3描述;二是評價試卷與命題藍圖的一致性,內(nèi)容可結(jié)合表1進行說明;三是總體評價結(jié)果(優(yōu)秀、良好、合格和不合格),屬于定性和定量評價相結(jié)合,用表3的結(jié)論。
第二部分為試卷分析,依據(jù)課程標(biāo)準(zhǔn)、會考考試說明和命題藍圖,并參照北京市會考試卷難度進行分析。內(nèi)容包含:試卷特點、試卷結(jié)構(gòu)、難度控制和題目科學(xué)性等方面。主要參考表2中所列出的20個方面的內(nèi)容,突出重點進行評價分析。定性評價語言要求體現(xiàn)特色、言簡意賅。
第三部分為建議與改進,主要根據(jù)表2(評定為3分等級以下的內(nèi)容原因和說明)和表3中的改進建議,針對試卷的優(yōu)點及不足,給出改進試卷命題的合理化建議。
表3 試卷質(zhì)量總體評價量表(質(zhì)性評價)
經(jīng)過近三年的實踐,本研究有效控制了自主會考試卷命題質(zhì)量,使不合格試卷的數(shù)量逐步減少,自主排課學(xué)校更加重視試卷的命題工作,到2015年,優(yōu)秀和良好試卷的比例遠遠高于標(biāo)準(zhǔn)制定時第一年的數(shù)量,在一定程度上保證了北京市高中畢業(yè)會考的公平公正,同時也使北京市的此項教育改革得到了質(zhì)量監(jiān)控。表4給出了2013年和2014年度試卷不同等級的評價結(jié)果。
通過對自主會考試卷建立評價指標(biāo)標(biāo)準(zhǔn)體系,主要達成了如下結(jié)論。
4.1 使試卷藍圖科學(xué)化,命題設(shè)計規(guī)范化
通過建立命題藍圖評價量表(表1),使試卷從設(shè)計和規(guī)劃之初的階段,就有監(jiān)督、有標(biāo)準(zhǔn)和有方向,并且對命題有反饋和改進。解決了部分自主命題學(xué)校不能保持優(yōu)質(zhì)的命題水平、部分試卷未按照藍圖命題的突出問題,降低了命題的隨意性和盲從性。
4.2 使評價過程標(biāo)準(zhǔn)化,評價結(jié)果可量化
通過建立試卷質(zhì)量評價量表(表2)和質(zhì)性總體評價量表(表3),初步建構(gòu)了學(xué)業(yè)水平性考試的評價標(biāo)準(zhǔn)。通過打分量化評價等級和給出定性的評價結(jié)果,不僅監(jiān)控了教師評價的過程,使評價過程標(biāo)準(zhǔn)量化、有據(jù)可依,同時也將試卷的特點和不足完全展現(xiàn)在評價量表上,使教育管理者或命題教師能夠一目了然地知悉試卷診斷反映出的問題,以便下次命題時改進。從實踐效果來看,試卷評價量表指出了試題表述不嚴(yán)謹(jǐn)、存在的科學(xué)性錯誤;試卷存在題目與其答案不匹配、答案不規(guī)范、評分標(biāo)準(zhǔn)不清晰的瑕疵;有的試卷使用歷年會考原題數(shù)量過高,原創(chuàng)或改編試題數(shù)量太少,致使試卷效度差;有的試卷存在排版不規(guī)范,格式不統(tǒng)一;有的試卷沒有反映學(xué)校自主方案的特點等現(xiàn)象或突出問題。
4.3 使評價報告高效化,可讀性強
每年對24所學(xué)校會考9個學(xué)科進行自主命題的評價,有約200份的試卷評價報告需要撰寫,工作量很大,通過編制試卷評價量表,評價教師撰寫評價報告就有據(jù)可依,極大地提高了評價工作效率。同時,也減少了評價報告不客觀、不規(guī)范、不嚴(yán)謹(jǐn),評價語言隨意性的問題,增加了評價報告的可讀性,使北京市的自主會考評價研究工作科學(xué)、客觀、高效、便捷。
表4 試卷等級評價結(jié)果
面對未來即將進行的普通高中學(xué)業(yè)水平考試,進行自主課程實驗的學(xué)校要加強對學(xué)業(yè)水平考試命題及命題藍圖設(shè)計等的思考和設(shè)計研究,使教師切實掌握命題的基本操作程序和規(guī)范要求,同時鼓勵積極命制原創(chuàng)題,通過原創(chuàng)試題體現(xiàn)新一輪考試改革和“走班制”教學(xué)特點以及學(xué)校教學(xué)水平與特色。采取有效措施,提高校本審命題技術(shù)的培訓(xùn),探索考試與教學(xué)良性互動的新型關(guān)系,使自主會考對優(yōu)質(zhì)高中有創(chuàng)意的學(xué)科教學(xué)的診斷評價功能得到更充分的發(fā)揮。
[1]戴家干.教育考試與評價制度創(chuàng)新 理論研究與實踐探索[M].北京:高等教育出版社,2010,4.
[2]楊向東.關(guān)于高中學(xué)業(yè)水平考試的比較研究[J].全球教育展望,2010(4):7-13.
[3]朱宇.高中學(xué)業(yè)水平考試:功能、命題與成績使用[J].考試研究,2008(4).
[4]雷新勇,周群.從基于標(biāo)準(zhǔn)的基礎(chǔ)教育改革的視角審視課程標(biāo)準(zhǔn)和學(xué)業(yè)水平考試[J].考試研究,2009(5).
[5]劉慶思.建立穩(wěn)定量表 服務(wù)中學(xué)教學(xué)——談高考評價功能的開發(fā)[J].中國考試,2009(5).
Research on Academic Level Test Paper Evaluation Standard in the Independent Course Construction Experimental Schools
REN Tao,HU Yan,ZHANG Qinghua&DING Xiutao
The scientific and all-round development of research in measurement and assessment will be very helpful in promoting the balanced development of basic education,reducing the workload of students, demonstrating the uniqueness of school governance and improving the quality of both education in general and instructions in the classroom in particular.The test paper evaluation system is a promising tool used for assessing not only whether the test paper is scientific,fair,accurate and standard but also whether students have attained the required proficiency level.Using as a starting point discussions of the academic level test paper evaluation standard in the independent course construction experimental schools,the article is intended not only to help to make the test paper design scientific by establishing a scale for assessing the blueprint for test writing,but also to help to make the evaluation process standardized,the evaluation outcomes measurable and the evaluation reports readable.
Curriculum Standard;Academic Level Test;Test Development Blueprint;Test Paper Evaluation Standard
G405
A
1005-8427(2016)05-0031-5
本文系北京教育規(guī)劃重點課題“北京市學(xué)業(yè)水平考試(會考)評價體系研究”(立項編號:AHA14168)的階段性研究成果。
任 濤,男,北京教育考試院,科研辦副主任,副研究員(北京 100083)
扈 巖,男,北京教育考試院,助理研究員(北京 100083)
張青華,女,北京教育考試院,副研究員(北京 100083)
丁秀濤,女,北京教育考試院,科研辦主任,研究員(北京 100083)