李玉冰 丁格曼,2
(1.華南師范大學(xué)物理與電信工程學(xué)院,廣東 廣州 510006;2.華南師范大學(xué)物理學(xué)科基礎(chǔ)課實(shí)驗教學(xué)示范中心,廣東 廣州 510006)
哲學(xué)家基切爾和薩爾蒙曾說過:“為自然現(xiàn)象提供假設(shè)是科學(xué)探究的基本目的”.[1]隨著時代發(fā)展,科學(xué)的本質(zhì)從探究與實(shí)驗逐漸改變?yōu)榻忉屌c論證.[2]這樣的社會背景下,在《普通高中物理課程標(biāo)準(zhǔn)(2017年版)》中,科學(xué)解釋被納為物理學(xué)科核心素養(yǎng)中科學(xué)探究的一個重要組成要素.[3]由此可見,基于物理學(xué)科背景,評價并診斷學(xué)生的科學(xué)解釋能力發(fā)展情況顯得尤為重要.因此,本研究在Rasch模型的基礎(chǔ)上,開發(fā)物理實(shí)驗探究過程中的科學(xué)解釋能力測評工具,并對測評工具進(jìn)行質(zhì)量檢驗,嘗試測評高一學(xué)生在物理實(shí)驗探究過程中的科學(xué)解釋能力,并分析其特點(diǎn).
筆者初始分析國內(nèi)外學(xué)者對科學(xué)解釋、能力、實(shí)驗探究的相關(guān)研究,[4-7]其中黃蕙歡[7](2017)學(xué)者在科學(xué)解釋CER框架的基礎(chǔ)上界定了學(xué)生物理科學(xué)解釋能力.本文沿用該框架,細(xì)化界定物理實(shí)驗探究過程中的科學(xué)解釋能力,即學(xué)生在物理實(shí)驗探究過程中能利用已有的物理知識和從觀察、實(shí)驗或模型中獲取的新證據(jù)、對問題或現(xiàn)象通過邏輯推理的方式進(jìn)行判斷、說明的能力,具體包括實(shí)驗論斷提出能力、證據(jù)提取能力、科學(xué)推理能力和輔助能力,如表1所示將其再進(jìn)行細(xì)分.
表1 物理實(shí)驗探究過程中的科學(xué)解釋能力
此外,學(xué)生在實(shí)驗探究過程中的科學(xué)解釋能力是所界定的各部分能力彼此作用下的綜合情況,不能簡單地加減各部分能力.
在界定什么是科學(xué)解釋能力后,要想測評學(xué)生在物理實(shí)驗探究過程中的科學(xué)解釋能力,還需要對該能力進(jìn)行水平劃分.考慮到SOLO分類理論具有較強(qiáng)的可操作性,[8]并且可以將質(zhì)性評價與量性評價相結(jié)合,[9]本文結(jié)合SOLO分類理論以及《普通高中物理課程標(biāo)準(zhǔn)(2017版)》中學(xué)業(yè)質(zhì)量水平部分關(guān)于科學(xué)解釋的劃分,考慮到抽象拓展水平有時候連專家都不一定可以達(dá)到,故將科學(xué)解釋能力劃分成4個水平,具體如表2所示.
表2 物理實(shí)驗探究過程中的科學(xué)解釋能力水平劃分
物理實(shí)驗探究過程中的科學(xué)解釋能力是一種內(nèi)隱的、從后天習(xí)得的能力類型.該能力可以依據(jù)學(xué)生回答問題的思維方式進(jìn)行測量與評價.在比較訪談法、問卷調(diào)查法、紙筆測試法等常見且行之有效的測量方法后,考慮到紙筆測試法容易獲取大量數(shù)據(jù),并且與學(xué)生的適配性較強(qiáng),測試時學(xué)生容易發(fā)揮出正常、真實(shí)的水平,因此本研究采用紙筆測試法對學(xué)生在實(shí)驗探究過程中的科學(xué)解釋能力進(jìn)行測評.題目類型選擇開放式問題和封閉式問題相結(jié)合.
而為保證所開發(fā)的測量工具具有較好的信效度,本文選擇項目反應(yīng)理論作為理論支撐,其基本思想是展現(xiàn)被測試的對象在各個試題上的回答情況與其內(nèi)在的某種品質(zhì)之間的關(guān)系,其項目特征曲線就是用來表示這種關(guān)系的.[10]如圖1項目特征曲線所示,其顯示具有θ能力的被試者答對某個項目的概率為P.利用該理論建立起具有固定不變的參數(shù)的測評項目,統(tǒng)一對比不同的測驗量表分?jǐn)?shù).
圖1 IRT理論的項目特征曲線
上文已經(jīng)劃分了學(xué)生在實(shí)驗探究過程中的科學(xué)解釋能力水平層次,而科學(xué)解釋在實(shí)驗探究過程中主要體現(xiàn)在對實(shí)驗進(jìn)行假設(shè)、分析實(shí)驗數(shù)據(jù)、解釋實(shí)驗現(xiàn)象和形成實(shí)驗結(jié)論等環(huán)節(jié)上.故本研究圍繞科學(xué)地解釋實(shí)驗情況、對實(shí)驗中的變化情景做出解釋性假設(shè)、分析實(shí)驗證據(jù)和總結(jié)實(shí)驗結(jié)論、論證和辯護(hù)自己的實(shí)驗觀點(diǎn),通過舉例、使用圖像或模型等方法輔助說明實(shí)驗問題等內(nèi)容進(jìn)行試題命制.
根據(jù)測評內(nèi)容和要求命制試題后,邀請物理教學(xué)研究者和部分骨干教師對試題提出修改意見,并邀請部分學(xué)生進(jìn)行試做后提出答題體驗,結(jié)合兩者的意見對試題進(jìn)行修改后試測.統(tǒng)計試測結(jié)果后運(yùn)用 Winsteps軟件進(jìn)行數(shù)據(jù)分析,基于Rasch模型檢驗試題的信度、效度、區(qū)分度以及數(shù)據(jù)—模型擬合參數(shù)等,對不符合要求的試題進(jìn)行修正后再進(jìn)行實(shí)測.
本文在試測對象上選擇高一年級中選修物理科目的A班、B班兩個班級的學(xué)生,其中A班為重點(diǎn)班,B班為平行班,該群體學(xué)生的物理成績跨越30分到100分,具有較好的代表性.本輪共發(fā)放120份試題,回收的有效試卷為70份,試卷的有效回收率為68%.根據(jù)各個題目的評分標(biāo)準(zhǔn),對學(xué)生的回答進(jìn)行賦分,從而得到本研究的數(shù)據(jù).
由于本測評工具具有較多的開放性試題,為保證評分者賦分的可靠性,本文運(yùn)用Kendall's W(肯德爾和諧系數(shù))考查評分者評分的一致性.在評分過程中隨機(jī)抽取10份試卷,利用SPSS數(shù)據(jù)處理軟件統(tǒng)計3位評分者間的肯德爾和諧系數(shù)為0.893,漸近顯著性系數(shù)為0.004,說明此份試題的評分標(biāo)準(zhǔn)比較公平公正,受主觀因素影響較?。ū?).
表3 初測評分者信度統(tǒng)計表
在此基礎(chǔ)上,將所得到的數(shù)據(jù)輸入Winsteps軟件,檢測所編制的測評工具是否符合Rasch模型.結(jié)果表明,該測評工具的整體信度為0.97,分離度為5.70(正常需要大于2),總體的數(shù)據(jù)—模型擬合參數(shù)MNSQ接近1、ZSTD接近0,說明該試題的信度比較理想,同時分離度也較好,符合Rasch模型的要求,可進(jìn)一步進(jìn)行分析.而從單維性檢驗上看,試題的總體單維性較好,但有4道試題不符合單維性要求,需要進(jìn)行調(diào)整.而對各道試題進(jìn)行單獨(dú)分析發(fā)現(xiàn),只有項目7的數(shù)據(jù)與模型不擬合,說明有部分能力水平低的測試對象回答正確,部分能力較好的測試對象卻在此題上回答錯誤.
實(shí)測選擇了廣州市某高中高一年級的5個物理班級,其中2個為重點(diǎn)班,3個為平行班.本次共回收130份測評試題,有效份數(shù)為112份,有效回收率為86.2%,其中男生樣本57份,女生樣本55份.首先,再次檢驗該試題的有效性和可靠性,其中利用SPSS計算其評分者信度為0.952,漸近顯著性系數(shù)為0.002,符合要求.而利用Winsteps軟件計算其信度為0.98,區(qū)分度為6.52,除項目9和項目1的非加權(quán)標(biāo)準(zhǔn)差均方略超出-2到2的可接受區(qū)間外,其余均符合Rasch模型的使用要求.然后繼續(xù)檢驗單維性、項目—被試反應(yīng)、點(diǎn)—測相關(guān)系數(shù)、模擬標(biāo)準(zhǔn)誤差均大致滿足Rasch模型的使用要求,適合用此模型進(jìn)行后續(xù)分析.
Rasch模型可以通過將原始分轉(zhuǎn)換為logit得分,將被試能力、項目難度放在同一把量尺上進(jìn)行比較.表4是實(shí)測學(xué)生科學(xué)解釋能力分布情況的統(tǒng)計數(shù)據(jù),樣本學(xué)生的最高logit得分和最低logit得分相差3.14,說明測試對象具有較廣的科學(xué)解釋能力水平分布;而標(biāo)準(zhǔn)差為0.64,說明測試對象的科學(xué)解釋能力水平存在較為顯著的差異.如圖2,依據(jù)學(xué)生的logit得分繪制各個分?jǐn)?shù)的頻率分布直方圖,可以發(fā)現(xiàn)所測對象的科學(xué)解釋能力整體呈正態(tài)分布.
圖2 學(xué)生logit得分的頻率分布直方圖
表4 學(xué)生logit得分的描述性統(tǒng)計
另外,本研究根據(jù)整體懷特圖來劃分樣本學(xué)生在實(shí)驗探究過程中的科學(xué)解釋能力,劃定的水平分界值具體如下:處于水平4的學(xué)生應(yīng)該是大部分項目得3分的,logit≥1;處于水平3的學(xué)生應(yīng)該大部分項目得2分,-0.67≤logit<1;處于水平2的學(xué)生應(yīng)該是大部分項目得1分的,-1.88≤logit<-0.67;處于水平1的學(xué)生,logit<-1.88.
根據(jù)劃定的能力值范圍,統(tǒng)計樣本學(xué)生數(shù),得到學(xué)生在各個能力水平上的百分比如圖3所示.由圖可發(fā)現(xiàn),學(xué)生的科學(xué)解釋能力水平集中在水平2和水平3,占總?cè)藬?shù)的94.64%.
圖3 學(xué)生實(shí)驗探究過程中的科學(xué)解釋能力水平分布情況
將所測學(xué)生的科學(xué)解釋能力得分和其物理成績進(jìn)行相關(guān)分析,運(yùn)用學(xué)生高一上學(xué)期期末考試的物理成績作為本次物理成績的衡量標(biāo)準(zhǔn),該階段學(xué)生已經(jīng)具備此份科學(xué)解釋能力測評試題所需的全部知識,且高一上學(xué)期期末考試學(xué)生相對比較重視,故用此份成績作為學(xué)生的物理成績進(jìn)行分析.
根據(jù)圖4的散點(diǎn)圖可以大致看出學(xué)生在實(shí)驗探究過程中的科學(xué)解釋能力與物理成績之間存在線性相關(guān)關(guān)系.在此基礎(chǔ)上進(jìn)行科學(xué)解釋能力和物理成績間的雙變量相關(guān)分析.表5、表6為皮爾遜相關(guān)的分析結(jié)果.
表5 描述性統(tǒng)計資料
表6 相關(guān)性統(tǒng)計數(shù)據(jù)
續(xù)表
圖4 科學(xué)解釋能力得分與物理成績的相關(guān)散點(diǎn)圖
從表中可以看出,學(xué)生物理成績平均分為60.46,能力測評平均分為12.13,雙變量相關(guān)性檢驗得到的皮爾遜相關(guān)系數(shù)為0.475,在0.01水平上顯著相關(guān),說明學(xué)生在實(shí)驗探究過程中的科學(xué)解釋能力與學(xué)生的物理成績具有正相關(guān)性,平時物理成績較好的學(xué)生在實(shí)驗探究過程中的科學(xué)解釋能力也比較好.這是因為進(jìn)行科學(xué)解釋其實(shí)是需要一定的科學(xué)知識作為依托的,但兩者間的相關(guān)性系數(shù)小于0.5,說明并不具備強(qiáng)烈相關(guān)性,也就是并不是平時物理成績好的學(xué)生就一定具備良好的科學(xué)解釋能力.
將男生和女生的科學(xué)解釋能力進(jìn)行獨(dú)立樣本T檢驗,看看兩者之間是否存在顯著性差異.
從表7中數(shù)據(jù)上看,男生的科學(xué)解釋能力平均值為12.44分,女生的科學(xué)解釋能力平均值為11.82分,男生的能力均值比女生高0.62分,說明男生的表現(xiàn)比女生稍微要好.但從方差齊次檢驗結(jié)果顯示,如表8中數(shù)據(jù),對于學(xué)生的能力水平,其F值為0.942,顯著性概率為0.334,大于顯著性水平0.05,符合方差齊次.而均值方程的t檢驗結(jié)果顯示,雙側(cè)顯著性概率為0.417,大于0.05,說明男生和女生之間在實(shí)驗探究過程中的科學(xué)解釋能力無顯著性差異.
表7 不同性別學(xué)生實(shí)驗探究過程中科學(xué)解釋能力的描述性統(tǒng)計
表8 獨(dú)立樣本T檢驗
考慮到物理課堂是學(xué)生實(shí)驗探究過程中的科學(xué)解釋能力的主要培養(yǎng)陣地,本研究設(shè)計了針對教師的科學(xué)解釋能力培養(yǎng)調(diào)查問卷.該問卷涉及對科學(xué)解釋的認(rèn)識和科學(xué)解釋的培養(yǎng)現(xiàn)狀兩方面的內(nèi)容,經(jīng)過一周的網(wǎng)絡(luò)問卷發(fā)放后,共回收81份有效問卷,其中教齡10年以上的教師占69.51%,35.37%的調(diào)查對象是高級教師,40.24%的調(diào)查對象是中學(xué)一級教師.他們多是教學(xué)經(jīng)驗豐富的教師,對中學(xué)物理教學(xué)較為熟悉.
將調(diào)查結(jié)果回收統(tǒng)計發(fā)現(xiàn),高達(dá)91.36%的教師認(rèn)為在實(shí)驗探究過程中很需要科學(xué)解釋能力,肯定了培養(yǎng)學(xué)生科學(xué)解釋能力的重要性,但實(shí)際上仍有54.32%的教師對科學(xué)解釋了解甚少.而在培養(yǎng)現(xiàn)狀上,61.73%的教師認(rèn)為自己在日常教學(xué)中會較為注重學(xué)生科學(xué)解釋能力的發(fā)展,但仍會因考學(xué)壓力、課時緊張、系統(tǒng)性理論指導(dǎo)的匱乏以及沒有具體的實(shí)施方案等多種影響因素,無法順利培養(yǎng)學(xué)生的科學(xué)解釋能力.
本文以測評學(xué)生在物理實(shí)驗探究過程中的科學(xué)解釋能力為目標(biāo),構(gòu)建測評框架并開發(fā)相應(yīng)的測評工具,通過檢驗發(fā)現(xiàn)設(shè)計的測評工具符合Rasch模型的相關(guān)質(zhì)量指標(biāo),具有可信度.而分析被試在實(shí)測過程中的科學(xué)解釋能力表現(xiàn)可發(fā)現(xiàn),總體來看被試在實(shí)驗探究過程中的科學(xué)解釋能力得分呈正態(tài)分布,絕大多數(shù)學(xué)生都處于水平2和水平3,并且其能力與物理成績具有正相關(guān)性,但并不是強(qiáng)烈相關(guān).雖然男生被試在實(shí)驗探究過程中的科學(xué)解釋能力測試得分略高于女生被試,但不同性別的被試在實(shí)驗探究過程中的科學(xué)解釋能力無顯著性差異.而從被試的答題情況上分析發(fā)現(xiàn)具有3點(diǎn)不足:一是被試在解釋過程中依賴于定性分析,定量解釋上欠缺明顯;二是部分學(xué)生在科學(xué)解釋過程中難以抓住關(guān)鍵研究量,避開干擾量;三是部分學(xué)生在嘗試解釋過程中存在證據(jù)與推理混亂的現(xiàn)象,無法準(zhǔn)確獲取證據(jù)信息并運(yùn)用其進(jìn)行推理解釋.
科學(xué)解釋能力作為物理核心素養(yǎng)中的重要組成部分,將會影響學(xué)生的未來成長以及對復(fù)雜問題的應(yīng)對情況.而物理課堂是學(xué)生實(shí)驗探究過程中的科學(xué)解釋能力的主要培養(yǎng)陣地,在剖析教師調(diào)查數(shù)據(jù)后可察覺,部分教師不太了解科學(xué)解釋,自身對于科學(xué)解釋的知識儲備也不足,雖能意識到科學(xué)解釋的重要性但缺乏實(shí)踐,因此提出以下建議.
(1)吸納相關(guān)知識,聯(lián)動互補(bǔ)共建.
培養(yǎng)學(xué)生的科學(xué)解釋能力首先需要教師具備充足的科學(xué)解釋知識,筆者認(rèn)為可以從教師的繼續(xù)教育出發(fā):一方面是可以利用線上、線下等多種形式進(jìn)行科學(xué)解釋的相關(guān)研討,疫情期間各大線上會議軟件的頻繁使用,無疑也給現(xiàn)階段的教學(xué)研討提供新的方式,通過組織線上的分享會、研討會聯(lián)系教師們進(jìn)行科學(xué)解釋材料的相關(guān)分享與研讀;線下則可以參與各地的名師工作室、教師培養(yǎng)計劃等,從中汲取相關(guān)知識,使科學(xué)解釋培養(yǎng)有法可施、有路可循;另一方面是教育主管部門或?qū)W??梢赃m當(dāng)召開關(guān)于科學(xué)解釋培養(yǎng)、核心素養(yǎng)解讀的相關(guān)教育培訓(xùn),有意識地為提高學(xué)生的科學(xué)解釋能力出謀劃策,落實(shí)立德樹人的培養(yǎng)目標(biāo).
(2)顯化科學(xué)解釋,營造解釋氛圍.
要想培養(yǎng)學(xué)生的科學(xué)解釋能力,最先要在課堂上顯化科學(xué)解釋,讓學(xué)生知道科學(xué)解釋包括論斷、證據(jù)、推理等三要素,并且要嘗試運(yùn)用教學(xué)語言為學(xué)生們示范如何進(jìn)行科學(xué)解釋,引導(dǎo)學(xué)生在之后的實(shí)驗探究環(huán)節(jié)中如何形成有依據(jù)的論斷、如何獲取證據(jù)、如何從證據(jù)中總結(jié)規(guī)律、如何基于有效的邏輯推理解釋實(shí)驗現(xiàn)象或結(jié)論等,在實(shí)驗探究的過程中落到實(shí)處、強(qiáng)化培養(yǎng)學(xué)生的科學(xué)解釋能力.此外,在教學(xué)中,教師可以適當(dāng)改變以往傳統(tǒng)的命題方式,創(chuàng)設(shè)情景設(shè)計結(jié)構(gòu)不良試題,引導(dǎo)學(xué)生在解決真實(shí)物理問題的過程中鍛煉科學(xué)解釋.