耿建
摘要:傳統(tǒng)測試命題是基于經(jīng)典測驗(yàn)理論的,因而是基于知識與能力立意的。新課改背景下,借鑒TIMSS及PISA 測試項(xiàng)目的特點(diǎn),構(gòu)建以核心素養(yǎng)立意的“雙向細(xì)目表”,嘗試基于素養(yǎng)立意命制高中物理學(xué)業(yè)水平測試題,來體現(xiàn)、評價學(xué)生的素養(yǎng)水平。
關(guān)鍵詞:命題;核心素養(yǎng);雙向細(xì)目表;高中物理;學(xué)業(yè)水平測試
課程改革不可回避的一個環(huán)節(jié)就是評價,評價離不開測試(考試),測試離不開命題。只有命題與測試真正體現(xiàn)課改意圖,才能使課改進(jìn)入“深水區(qū)”。筆者嘗試在分析傳統(tǒng)測試命題假設(shè)及流程的基礎(chǔ)上,借鑒TIMSS及PISA 測試項(xiàng)目的特點(diǎn),構(gòu)建以核心素養(yǎng)立意的“雙向細(xì)目表”,研制能夠體現(xiàn)學(xué)生素養(yǎng)水平的測試題目。
一、傳統(tǒng)測試命題的假設(shè)及流程
傳統(tǒng)測試命題是基于經(jīng)典測驗(yàn)理論的。經(jīng)典測驗(yàn)理論提供了評價每個題目的難度、區(qū)分度的指標(biāo),也提供了評價測驗(yàn)質(zhì)量高低的信度和效度指標(biāo)。但是,這些指標(biāo)均建立在樣本理論的基礎(chǔ)上,對樣本的依賴性大,難以評價項(xiàng)目層面上的猜測程度,更無法估計被試的能力水平及其精度。尤其是,該理論關(guān)于被試的能力不論高低,測量誤差都相同的假定是不盡合理的。這樣的命題的假設(shè)是學(xué)生應(yīng)該掌握相應(yīng)的知識和能力,并且所測試的各種知識和能力應(yīng)該達(dá)到相應(yīng)的水平要求。這樣,命題的流程首先是根據(jù)測試的性質(zhì),擬定考查的范圍、試卷的結(jié)構(gòu)、試卷的整體難度、各考查內(nèi)容的能力要求、各試題的難度等,這些集中體現(xiàn)在“雙向細(xì)目表”中。傳統(tǒng)基于知識和能力立意命題的“雙向細(xì)目表”的大致結(jié)構(gòu)如表1所示。
傳統(tǒng)測試命題在構(gòu)建“雙向細(xì)目表”的基礎(chǔ)上,分別命制各道試題。以高中物理測試為例,題型一般分為客觀題和主觀題,客觀題包括單項(xiàng)選擇題和多項(xiàng)選擇題,主觀題包括填空題和計算論述題等。每道試題的命制以相應(yīng)預(yù)設(shè)的考查內(nèi)容為線索,構(gòu)建與之匹配的物理模型或物理情境,進(jìn)而圍繞考查的知識點(diǎn)和能力要求完善試題。在逐題命制完成后,再整體把握試卷的難度,判斷是否符合該種性質(zhì)類型的測試。
根據(jù)傳統(tǒng)測試命題思路和方式命制的試題和試卷,普遍存在兩個方面的問題。首先,試題以知識點(diǎn)為命題的切入點(diǎn),以能力立意為命題的價值取向。試卷是以一組相對獨(dú)立的、無關(guān)聯(lián)的試題來呈現(xiàn)的,各試題也僅僅檢測學(xué)生對某一知識點(diǎn)單一維度的理解、單一層次的能力水平,不能體現(xiàn)知識形成的脈絡(luò)和能力發(fā)展的進(jìn)階情況,測試過程帶有偶然性。這種碎片化的考核方式不能真實(shí)反映考生在某一知識點(diǎn)或能力方面的發(fā)展水平層次。其次,測試成績能反映學(xué)生對學(xué)科掌握的整體情況,但不能反映學(xué)生對學(xué)科知識與能力掌握的精細(xì)化程度,不能體現(xiàn)測試成績由哪些方面的素養(yǎng)組成,也就不能表明學(xué)生知識、能力或素養(yǎng)的發(fā)展現(xiàn)狀。
二、高中物理學(xué)業(yè)水平測試命題的設(shè)想
國際教育評價研究和測評項(xiàng)目中影響范圍較廣的是TIMSS和PISA。TIMSS科學(xué)評價特別注重測評學(xué)生在一定的情境(無論熟悉的、陌生的、復(fù)雜的)中應(yīng)用知識和解決實(shí)際問題的能力。PISA測評框架由情境、能力、知識、態(tài)度四個指標(biāo)構(gòu)成,且測評的主要內(nèi)容是在一定的情境中學(xué)生展現(xiàn)受到知識和態(tài)度影響的科學(xué)素養(yǎng)的具體能力。這兩個測評項(xiàng)目具有3個共同點(diǎn):一是更注重融入真實(shí)的情境;二是更關(guān)注科學(xué)實(shí)踐的測評;三是更系統(tǒng)的知識分類和分級。與這兩種測評項(xiàng)目相比,我國傳統(tǒng)的測評則呈現(xiàn)出試題的孤立性、測試內(nèi)容的片面性和測試結(jié)果的偶然性等不足。這就需要依據(jù)一定的理論或標(biāo)準(zhǔn)作出改變和調(diào)整。參照TIMSS及PISA項(xiàng)目的試題特點(diǎn),結(jié)合當(dāng)下普通高中課程標(biāo)準(zhǔn)提出的學(xué)科核心素養(yǎng)發(fā)展目標(biāo),嘗試基于素養(yǎng)立意命題。
(一)基于素養(yǎng)立意命題的假設(shè)及流程
基于素養(yǎng)立意命題的假設(shè)是學(xué)生應(yīng)該具備相應(yīng)的素養(yǎng),對應(yīng)的素養(yǎng)是可以通過測試來評價的,不同性質(zhì)的測試能反映素養(yǎng)的不同內(nèi)容和不同水平。在這樣的命題假設(shè)基礎(chǔ)上,基于素養(yǎng)立意命題的流程預(yù)設(shè)如下:首先,根據(jù)測試的性質(zhì)確定考查的素養(yǎng)內(nèi)容及水平;其次,命制能反映素養(yǎng)內(nèi)容的試題;再次,檢查各試題所檢測素養(yǎng)的覆蓋面、水平情況及交叉情況等;最終,組卷成稿。如此命題流程,集中體現(xiàn)在如表2所示的基于素養(yǎng)立意命題的“雙向細(xì)目表”中。
基于素養(yǎng)立意命題,應(yīng)該具備以下幾個特點(diǎn)。其一,要考慮試卷各試題的素養(yǎng)指向覆蓋面。傳統(tǒng)測試命題主要考慮學(xué)科知識點(diǎn)的覆蓋面,現(xiàn)在應(yīng)該同時考慮對各核心素養(yǎng)考查的覆蓋面。當(dāng)然,核心素養(yǎng)的考查離不開具體的知識點(diǎn),即在命題過程中要考慮相應(yīng)知識點(diǎn)與核心素養(yǎng)的對應(yīng)情況。目前,精準(zhǔn)、全面地在紙筆測試中體現(xiàn)核心素養(yǎng),還處于探索與實(shí)踐階段。但命題從能力立意轉(zhuǎn)向素養(yǎng)立意,才能完整地體現(xiàn)本次課程改革的初衷。其二,要考慮試題考查的素養(yǎng)水平與考試性質(zhì)的匹配。合格性考試和等級考試對素養(yǎng)水平的要求不同。試題如何科學(xué)、準(zhǔn)確地對應(yīng)核心素養(yǎng)水平,還有待于進(jìn)一步探索與研究,需要有一個從主觀感性判斷到客觀理性標(biāo)準(zhǔn)確立的過程。其三,核心素養(yǎng)需要不同試題的多維度呈現(xiàn),同一試題也可以體現(xiàn)不同的核心素養(yǎng)。這需要考慮試題的呈現(xiàn)方式、問題的設(shè)置方式及問題的解答方式。傳統(tǒng)的相對獨(dú)立的試題檢測功能比較單一,可以嘗試基于背景材料的“問題群”或“答案群”,來多維度地考查不同的核心素養(yǎng)或同一核心素養(yǎng)的不同水平。
(二)基于素養(yǎng)立意命題舉隅
基于素養(yǎng)立意命制的試題,從來源看有兩種類型:一種是任務(wù)主題型的試題,即圍繞某一任務(wù)設(shè)置問題;另一種是情境主題型的試題,即圍繞某一情境設(shè)置問題。不論哪種類型的試題都具有情境性、學(xué)科性、結(jié)構(gòu)性等特點(diǎn)。情境性是指試題的材料來源于現(xiàn)實(shí),或是經(jīng)過合理抽象、加工、提煉的現(xiàn)實(shí)材料。學(xué)科性是指試題的背景材料具有學(xué)科特性,與學(xué)科知識、方法等有關(guān)聯(lián)。結(jié)構(gòu)性是指試題提供的材料或設(shè)問具有多維度、多層次的特點(diǎn),各維度或?qū)哟尉哂嘘P(guān)聯(lián)、遞進(jìn)等關(guān)系。因此,基于素養(yǎng)立意命制的試題,其呈現(xiàn)方式不再是孤立的單個問題,而是“問題群”或“答案群”?!皢栴}群”或“答案群”的功能有兩種:一是能測評某一核心素養(yǎng)的多個水平,即基于試題背景材料,利用一組問題來檢測某一核心素養(yǎng)的多個水平;二是能對兩個或兩個以上的核心素養(yǎng)進(jìn)行測評。
題1現(xiàn)有相同的紙片若干、面值不同的硬幣若干、大小不同的小球若干。利用所提供的器材探究“物體下落快慢的規(guī)律”。
這是圍繞“物體下落快慢的規(guī)律”這一主題而命制的試題。對于該試題的評價可以進(jìn)行如下預(yù)設(shè),即對于該問題存在不同水平的“答案群”。
水平一:沒有利用所提供的實(shí)驗(yàn)器材就直接給出物體下落規(guī)律的結(jié)論。
水平二:只選擇紙片、硬幣、小球中的某一種器材進(jìn)行實(shí)驗(yàn),就給出物體下落規(guī)律的結(jié)論。
水平三:選擇所提供的器材中的某兩種進(jìn)行一次對比實(shí)驗(yàn),給出物體下落規(guī)律的結(jié)論。
水平四:選擇所提供的器材進(jìn)行兩次對比實(shí)驗(yàn),給出物體下落規(guī)律的結(jié)論。
水平五:選擇所提供的器材進(jìn)行兩次以上的對比實(shí)驗(yàn),建立理想模型,給出物體下落規(guī)律的結(jié)論。
這五個水平的評價與四個維度的物理學(xué)科核心素養(yǎng)的對應(yīng)關(guān)系如表3所示。
題2如圖1所示,質(zhì)量均為m的物塊A和B疊放在水平地面上,左邊緣對齊。A與B、B與地面間的動摩擦因數(shù)均為μ。先敲擊A,A立即獲得水平向右的初速度,在B上滑動距離L后停下。接著敲擊B,B立即獲得水平向右的初速度,A、B都向右運(yùn)動,左邊緣再次對齊時恰好相對靜止,此后兩者一起運(yùn)動至停下。最大靜摩擦力等于滑動摩擦力,重力加速度為g。
(1)描述以上過程中A、B兩個物體運(yùn)動的情況;
(2)根據(jù)以上過程能夠求出哪些物理量?嘗試求出相應(yīng)的物理量。
這是圍繞給定的物理情境而設(shè)置的試題。兩個問題的參考答案可進(jìn)行分層評價。第(1)小題不同水平的參考答案如下:
水平一:第一階段,A向右勻減速運(yùn)動。
水平二:第一階段,A向右勻減速運(yùn)動,B靜止不動。
水平三:第一階段,A向右勻減速運(yùn)動,B靜止不動;第二階段,A向右勻加速運(yùn)動,B向右勻減速運(yùn)動。
水平四:能用vt圖像準(zhǔn)確地描述兩個物體的運(yùn)動過程。
第(1)小題四個水平的參考答案與核心素養(yǎng)的對應(yīng)關(guān)系如表4所示。
第(2)小題不同水平的參考答案如下:
水平一:利用單一的公式求出單一的物理量,如A被敲擊后獲得的加速度、A被敲擊后在B上向右運(yùn)動過程中摩擦產(chǎn)生的熱量等。
水平二:利用兩個關(guān)聯(lián)的公式求出某一物理量,如A被敲擊后獲得的初速度、B被敲擊后獲得的加速度等。
水平三:利用兩個以上的關(guān)聯(lián)公式求出某一物理量,如B被敲擊后獲得的初速度、B被敲擊后至系統(tǒng)停下摩擦產(chǎn)生的熱量等。
水平四:利用轉(zhuǎn)變參照物、整體分析或圖像分析的方法求解相關(guān)物理量。
第(2)小題四個水平的參考答案與核心素養(yǎng)的對應(yīng)關(guān)系如下頁表5所示。
傳統(tǒng)測試命題的情境是確定的,問題是明確的,答案是唯一的;問題解答過程的思路基本是一定的,所選用的解決方法也基本固定;從問題到答案是一個封閉的、相對確定的過程。這樣孤立、確定的試題,只能檢測某一水平的核心素養(yǎng)。如果某一試題定位于考查水平三層次的核心素養(yǎng),而在該問題背景下,學(xué)生只具備水平二層次的核心素養(yǎng),則該試題就不能準(zhǔn)確反映學(xué)生的實(shí)際情況。而諸如例1、例2這樣的試題,可以通過學(xué)生對主題性、情境性或開放性問題的解答情況,客觀評價他們已經(jīng)具備的核心素養(yǎng)水平,從而實(shí)現(xiàn)科學(xué)、連續(xù)地對學(xué)生核心素養(yǎng)水平達(dá)成情況的評價。
參考文獻(xiàn):
[1] 張麗娜,張一平.多項(xiàng)選擇題與填空題對測量效果的影響——在項(xiàng)目反應(yīng)理論框架內(nèi)答題方式的比較研究[J].考試研究,2017(3).
[2] 教育部考試中心.注重理論聯(lián)系實(shí)際加強(qiáng)物理學(xué)科素養(yǎng)考查——2019年高考物理試題評析[J].中國考試,2019(7).
[3] 曾兵芳.TIMSS2015科學(xué)測評框架的特點(diǎn)與反思[J].教育測量與評價(理論版),2015(8).
[4] 黃健毅.國際基礎(chǔ)教育科學(xué)學(xué)業(yè)測評的新趨向——基于PISA與TIMSS的比較研究[J].中小學(xué)教師培訓(xùn),2017(9).
本文系江蘇省中小學(xué)教學(xué)研究第十三期課題“普通高中物理關(guān)鍵能力水平特征、培養(yǎng)途徑及測評研究”(編號:2019JK13L192)的階段性研究成果。