楊玉琴
摘要:界定了“模型認知”能力其及水平層次,應用Rasch模型開發(fā)和優(yōu)化了測量工具。根據(jù)大樣本測試數(shù)據(jù)對中學生“模型認知”能力現(xiàn)狀進行了分析。結果顯示,中學生的“模型認知”能力平均水平較弱,高一學生與高二學生之間無顯著性差異,但皆與高三學生之間存在顯著性差異,男生的水平顯著高于女生。
關鍵詞:“模型認知”能力;Rasch模型;測量和評價
文章編號:1005–6629(2017)7–0009–06 中圖分類號:G633.8 文獻標識碼:B
1 問題的提出
在自然科學研究中,當客觀對象并不能直接研究時,在進行了一定的觀察、實驗和對所獲得的科學事實進行初步的概括之后,常常要利用想象、抽象、類比等方法,建構一個簡化的又能集中反映客體本質關系的模型,并通過對模型的研究揭示原型客體的形態(tài)、本質和特征,此即模型方法[1]?;瘜W是在原子、分子水平上研究物質性質及其變化的科學,原子、分子不可見,化學客觀規(guī)律、物質性質及其變化的解釋亦十分抽象,所以化學家需要通過建構模型加以認知和把握。通過模型,化學家可以“看到”他們所試圖研究的實體或過程,據(jù)此進行實驗設計和探索活動,有力支持他們的思維推理和知識建構[2]。
模型(model)與建模(modeling)是科學發(fā)展的重要元素,也是科學學習中不可或缺的認知與能力[3]。化學學習中的模型認知活動能促使學生全面深刻地理解化學模型的性質、作用、使用范圍及其局限性等,并學會建構、檢驗模型,使用多種模型來表達、解釋同一現(xiàn)象等[4]。美國《下一代科學教育標準》將“建構和應用模型”作為8個重要的科學與工程實踐活動之一。我國目前進行的高中化學課程標準修訂中亦將“模型認知”作為化學核心素養(yǎng)的重要組成部分[5]。對學生模型認知能力的測量與評價將有助于我們認識學生能力發(fā)展現(xiàn)狀,為改進教學提供證據(jù)。
2 研究的理論框架
2.1 “模型認知”能力的界定
化學中的模型更多的是以觀念形態(tài)描述原型的某些特征、性質、規(guī)律的抽象概念或理論模型,如分子、原子模型,理想氣體模型,有效碰撞理論等等,所以我們將模型方法看成是一種科學認知方式。中學生的“模型認知”能力是指能夠運用模型描述化學研究對象、解釋化學現(xiàn)象和規(guī)律、預測可能的結果,并能夠建構模型展示自己對化學事實的理解和解釋的能力。
2.2 “模型認知”能力水平的構建
國外課程標準對“模型”的學習要求涉及到對模型本身的認識和理解、運用多種模型去表征和解釋現(xiàn)象以及建構模型并評價模型等。綜合國外對于“模型”學習進程的研究以及課程文件中對“模型”學習要求的規(guī)定,參照布盧姆教育目標分類學(修訂版)對認知維度的劃分,將“模型認知”能力水平劃分為以下由低到高的4個水平:
水平1:認識模型。學生認識化學中的主要模型,并能以適當?shù)姆绞奖碚髂P汀?/p>
水平2:理解模型。學生理解模型描述的對象、模型的本質、模型的性質等。
水平3:運用模型。學生能夠利用模型描述物理或化學變化過程,解釋化學事實,根據(jù)模型預測物質的性質和變化等。
水平4:建構模型。學生能夠建構模型來展示和解釋現(xiàn)象是如何發(fā)生的,討論模型的適用范圍和局限性,根據(jù)證據(jù)或批判性思維精致模型以提高模型的解釋力等。
2.3 “模型認知”能力測量原理
以項目反應理論之Rasch模型作為測量工具開發(fā)、設計的框架。通過項目和被試信度、評分者一致性、誤差、分離度等指標分析和檢驗工具的信度,通過單維性檢驗、項目-被試對應、數(shù)據(jù)-模型擬合、點-測量相關、選項反應模式及評分等級概率結構等指標來分析和檢驗工具的效度。
3 研究方法
根據(jù)“模型認知”能力從低到高的4個水平要求,編制測量工具。運用Rasch模型分析軟件Bond & Fox Steps1.0.0對工具的信度、效度等進行分析,并對測量工具進行修改和優(yōu)化,直至工具符合Rasch模型要求,再進行大樣本測試。
3.1 研究工具
經過兩輪試測及Rasch模型檢驗、優(yōu)化后,形成了如表1所示的測驗卷(以下簡稱M測驗卷),其中M1~M14是選擇題,M15~M20是建構反應題。
具體項目與模型認知能力水平的對應如表1所示,以下各舉一例作簡要分析說明。
例1 下圖表示封閉在某容器中的少量液態(tài)水的微觀示意圖(容器的活塞可以左右移動)。煮沸后,液態(tài)水變成水蒸氣。在這一過程中,發(fā)生的變化是( )
例2 以下關于原子的說法正確的是( )
A.在高倍顯微鏡下我們可以看到原子
B.原子是球形的
C.原子核外電子都是同樣大小的
D.原子核外最外層有一層殼
說明:該題屬于“水平2:理解模型”能力的考查內容,旨在考查學生對模型所描述的對象及其本質的理解。
例3 如圖,將盛有濃氨水的燒杯(B)及盛有蒸餾水和酚酞的燒杯(A)同罩于一個大燒杯中,一會兒燒杯A中由無色變?yōu)榧t色。你能用圖示的方法解釋這一現(xiàn)象嗎?可輔以一定的文字說明。
說明:該題屬于“水平3:運用模型”能力的考查內容,旨在考查學生運用模型解釋現(xiàn)象的能力。這是一道開放題,要求學生對發(fā)生的現(xiàn)象進行解釋,學生需要使用圖畫配以文字說明加以表達,以充分反映學生頭腦中關于化學反應的心智模型。本題并沒有限定學生運用什么樣的模型表征方式進行回答,學生運用模型的能力越高,越能夠運用涉及化學反應微觀本質的模型進行回答,越能夠運用多種模型表征方式(符號的、語言的、圖示的)來進行解釋。
例4 燃素說是形成于17世紀末、18世紀初的一個解釋燃燒現(xiàn)象甚至整個化學的理論模型。燃素說假定可燃燒的物質包含著燃素,以解釋一切燃燒現(xiàn)象乃至所有的化學變化。如,“金屬煅燒,逸去燃素而留下灰渣;灰渣與富有燃素的木炭共熱,又還原為金屬;金屬溶于酸,則放出燃素(氫氣),而留下灰渣等”。
如圖所示,將精確測定質量的汞浮于一種液體之上,并用玻璃罩將其罩住,利用凸透鏡聚集太陽光對玻璃罩內的汞加熱。
(1)根據(jù)燃素理論模型,在該實驗中應該出現(xiàn)的現(xiàn)象是什么?但你認為實際出現(xiàn)的現(xiàn)象會是什么?
(2)該實驗現(xiàn)象與燃素模型所預測的現(xiàn)象并不一致,請你利用一種與燃素理論不同的模型來解釋。
(3)為了證明你所利用的模型是正確的,請具體說明你會如何做。
說明:該題屬于“水平4:建構模型”能力的考查內容,旨在考查學生能否根據(jù)提供的化學事實建構模型來展示和解釋現(xiàn)象是如何發(fā)生的,討論當預測現(xiàn)象與實際現(xiàn)象并不一致時如何改進模型,并能夠根據(jù)證據(jù)利用批判性思維精致模型以提高模型的解釋力。
3.2 研究樣本
本研究共進行了三輪測驗,被試組成如表2所示。第一輪試測用于初步考察測量工具的質量。經過Rasch模型檢驗分析后,對工具進行修改,再進行第二輪試測,根據(jù)第二輪試測結果的質量分析決定修改后的測驗卷能否用于大樣本測試。因第一輪、第二輪試測主要用于考察工具的質量,所用樣本較小,也沒有從高三年級中選擇被試。大樣本測試采取分層抽樣的形式,在某省選取了三所不同層次的中學作為樣本來源學校,分別在高一、高二、高三隨機抽取被試。
3.3 數(shù)據(jù)分析
運用Bond & Fox steps1.0.0分析測驗工具的信、效度,將項目難度與學生能力轉換成具有等距意義的logit分,再運用SPSS18.0軟件進行統(tǒng)計分析。因篇幅有限,以下只呈現(xiàn)第三輪測試結果的分析。
4 結果分析
4.1 測量工具信、效度分析
如表3所示的總體統(tǒng)計數(shù)據(jù)顯示,項目估計的標準誤較小,被試和項目的數(shù)據(jù)擬合指數(shù)都較為理想,MNSQ都在理想值1附近,ZSTD亦在理想值0左右,說明測驗與理論模型的期望較為吻合;項目信度接近1,分離度較大,說明項目能較好地區(qū)分不同能力的被試;被試的信度大于0.5,分離度較大,說明被試的能力分布較為分散,有一定的層次性。
圖1所示的單維性檢驗結果表明,只有AM04、a-M17略超出-0.4~0.4的范圍,說明工具測量的皆為學生的一種主要心理特質——模型認知能力,符合Rasch模型的基本假設。項目—被試對應圖(圖2)顯示,測試題分布較廣,顯示出明顯的難度層次結構。各項目的難度水平與預期假設基本一致,學生能力分布較為理想,近似正態(tài)分布。各個項目的擬合、誤差統(tǒng)計結果亦顯示,除了M19的點測量相關較低外,絕大多數(shù)項目的估計誤差都很小,項目擬合指數(shù)在許可范圍內,點測量相關較高[6]。
綜上可知,測量工具具有良好的信度和效度。
4.2 學生“模型認知”能力分析
4.2.1 不同年級學生測驗成績比較分析
(1)總體比較
表4是三個年級模型認知能力測驗的描述性統(tǒng)計結果。最高值出現(xiàn)在高二,最低值出現(xiàn)在高三,高二年級的全距最大。而高二年級的均分比高一年級略小,高三年級的均分最大。
進一步檢驗三組均數(shù)差異的顯著性,結果如表5所示,1、3組之間的相伴概率為0.000,2、3組之間的相伴概率為0.000,皆小于極顯著性水平0.01,具有顯著性差別。而1、2組之間的相伴概率為0.341,大于顯著性水平,說明1、2組之間沒有顯著性差別。由以上統(tǒng)計分析可知,對于“模型認知”能力而言,高一年級的平均水平雖略高于高二年級,但并沒有顯著性差異,而高一年級與高三年級、高二年級與高三年級皆具有顯著性差異。
(2)在各個水平層次上的比較
Rasch模型通過將原始分轉換為logit分,從而將被試能力、項目難度放在同一把量尺上進行比較。將M卷中各個項目的難度估計進行平均可得到每個水平的難度平均值,如表6所示,以此平均值作為判斷學生“模型認知”能力水平的依據(jù)。當學生的能力值低于-1.88時,則認為學生的能力水平低于水平1;當學生的能力值為-1.88~0.11時,則位于水平1;當學生的能力值為0.11~1.26時,則位于水平2;當學生的能力值為1.26~2.51時,則位于水平3;當學生的能力值大于2.51時,則位于水平4。
本研究被試樣本中高一、高二、高三3個年級學生M卷的平均分分別為0.68、0.62、1.03(見表4),結合表6,可以認為高一、高二、高三3個年級學生的平均模型認知能力皆處于水平2——理解模型。三個年級在不同能力水平上的人數(shù)及比例如表7所示。