余 菲 涂 泓 郭長江
(上海師范大學 數(shù)理學院 上海 200234)石作晶(上海市盧灣中學 上海 200023)
《基礎教育課程改革綱要》指出“國家課程標準是教材編寫、教學、評估和考試命題的依據(jù),是國家管理和評價課程的基礎”[1].我國與國際上基礎教育課程改革類似,都是基于標準的改革.在這場世界范圍的基于標準的教育改革中,許多課程改革專家進行了系統(tǒng)的理論和實踐研究,獲得一系列成果.這些成果都表明:課程、教學、考試三者的一致性水平越高,學生的學業(yè)成就越高[2].考試能對教師教學和學生學習產(chǎn)生明顯的影響.所以使得這三者一致的最好辦法就是開發(fā)基于標準的考試,考試能提供學生學業(yè)成就信息和教師教學績效信息,促進課程、教學的調(diào)整,使之與課程標準保持一致.
美國在基于標準的教育改革中成果最為突出,包括Webb模式、“SEC”模式、Achieve模式等等有關課程標準與學業(yè)評價的一致性分析模式.本研究將借鑒美國“SEC”一致性分析模式,檢驗上海市初中畢業(yè)統(tǒng)一學業(yè)考試物理試卷與《上海市中學物理課程標準(試行稿)》是否一致,期望能夠引導我們進一步思考導致學業(yè)考試與課程標準之間不一致的深層原因,如何改進學業(yè)考試,使之與課程標準保持一致,發(fā)揮導向作用,從而能真正引導初中物理的教與學也遵循課程標準.
“SEC”(Surveys of Enacted Curriculum)一致性分析模式,也稱為Porter一致性分析模式.該模式是美國安德魯·波特(Andrew Porter)和約翰·史密森(John Smithson)在借鑒諾曼·韋伯(Norman L. Webb)在評價與課程標準一致性領域的研究成果即Webb分析模式的基礎上開發(fā)的一種模式.“SEC”分析模式從內(nèi)容主題和認知層次兩個維度來檢驗,將課程標準和試卷用相同方式進行編碼,然后賦值到具有相同結構的“內(nèi)容主題×認知層次”的二維矩陣中.為了方便比較,兩個二維矩陣中的全部單元格值都要進行歸一化,轉(zhuǎn)化成總和為1的比率,根據(jù)兩個比率矩陣的對應部分的權重,比較試卷與課程標準的差異,得出兩者的一致性水平.“SEC”分析模式使用常規(guī)的二維矩陣,有確切的一致性系數(shù),可以運用圖表描述數(shù)據(jù)的結果等,這種靈活直觀量化的優(yōu)點,在一致性分析上具有廣泛的應用[3].
其中衡量一致性水平的Porter系數(shù)定義如下
式中n為矩陣元的總個數(shù),i代表矩陣中的某個特定值,其取值范圍從1到n.Xi和Yi分別是兩個矩陣對應的第i個矩陣元,它們都是從零到1的比率值.X1到Xn的總和為1,Y1到Yn的總和也為1.Porter一致性系數(shù)取值范圍是0~1,0表示試卷與課程標準的差異最大,1表示二者完全一致[4].比如在本研究中,n=16,i的取值范圍從1~16.Xi表示2010年至2013年上海市初中物理學業(yè)考試試卷的比率矩陣,Yi表示上海市物理課程內(nèi)容標準的比率矩陣.
基于標準的教育考試一是強調(diào)考試與課程內(nèi)容標準的一致性,二是強調(diào)根據(jù)表現(xiàn)標準報道考試的結果.我國的課程標準只有內(nèi)容標準,沒有表現(xiàn)標準.我國的課程內(nèi)容標準強調(diào)三維目標——知識與技能、過程與方法、情感態(tài)度與價值觀.過程與方法的評價主要是形成性評價,情感態(tài)度與價值觀這樣的心理特質(zhì)也主要通過長期觀察記錄等,不便于通過學業(yè)考試來評價.所以本研究僅從知識與技能的角度分析學業(yè)考試與課程內(nèi)容標準的一致性.
物理試卷選取的是2010~2013年上海市初中畢業(yè)統(tǒng)一學業(yè)考試物理試卷.考試說明指出“物理試卷以《上海市中學物理課程標準(試行稿)》為依據(jù),旨在反映初中畢業(yè)生在物理學習方面所達到的水平,體現(xiàn)義務教育階段學生學業(yè)的基本要求”[5].因此物理試卷能夠作為研究對象研究其與課程標準的一致性.
物理課程內(nèi)容標準選取的是上海市教育委員會2004年10月頒布的《上海市中學物理課程標準(試行稿)》初中階段基礎型課程部分的內(nèi)容標準.課程標準中規(guī)定了基礎型課程、拓展型課程、研究型課程3類課程,只有基礎型課程是全體學生必須學習的[6].
課程標準中將內(nèi)容主題劃分“物質(zhì)”、“機械運動”、“電磁運動”和“能量”4個主題[6],同時還對物理實驗進行了單獨劃分,由于物理實驗是以物理內(nèi)容知識點為載體,因此本研究中將物理實驗歸入了上述4個主題中.課程標準中將認知層次劃分為“知道”、“理解”、“掌握”和“應用”4個層次,對這4個層次進行了如下界定.
表1 課程標準對認知層次的界定[6]
根據(jù)課程標準的內(nèi)容主題和認知層次劃分,把課程標準知識點條目歸入“內(nèi)容主題×認知層次”的二維矩陣中,如表2.
表2 課程內(nèi)容標準
根據(jù)Porter一致性研究方法,為便于比較課程標準與學業(yè)考試的一致性程度,將表2化成各單元格比率值之和為1的比率表,如表3.
表3 課程內(nèi)容標準的比率
2010年至2013年上海市初中物理學業(yè)考試試卷包括選擇題、填空題、作圖題、計算題和實驗題5個大題,共26個小題,滿分90分.對物理試卷從內(nèi)容主題和認知層次兩個維度進行編碼,形成與課程標準結構相同的“內(nèi)容主題×認知層次”的二維矩陣.編碼過程很關鍵,首先要確定試題的每一空主要考查哪幾個知識點,涉及哪些內(nèi)容主題,然后細化解題過程,找出得分點,確定學生在解題時需要達到的認知層次,最后把每一道題考查的知識點及對應分值歸入“內(nèi)容主題×認知層次”二維矩陣中.以2013年試卷為例,如表4所示.
表4 2013年上海市初中畢業(yè)統(tǒng)一學業(yè)考試物理試卷
根據(jù)Porter一致性研究方法,為便于比較課程標準與學業(yè)考試的一致性程度,將二維矩陣進行歸一化.以2013年試卷為例,如表5所示.
表5 2013年上海市初中畢業(yè)統(tǒng)一學業(yè)考試物理試卷比率
把經(jīng)過編碼歸一化的表格數(shù)據(jù)代入Porter一致性系數(shù)計算公式,計算得出2010年至2013年上海市初中物理學業(yè)考試試卷與課程標淮之間的Porter一致性系數(shù),并求出4年的平均系數(shù),結果如表6.歷年物理試卷與課程標準的Porter一致性系數(shù)在0.580~0.700之間,平均值為0.631.表明2010年至2013年上海市初中物理學業(yè)考試試卷與課程標準之間不具備顯著的一致性.
表6 2010年至2013年物理試卷與課程內(nèi)容標準之間的Porter一致性系數(shù)
圖1 物理試卷與課程內(nèi)容標準的內(nèi)容主題分布比較
為了直觀呈現(xiàn)歷年試卷與課程標準之間的內(nèi)容主題分布異同情況,作出試卷與課程標準在內(nèi)容主題上分布的直方圖,如圖1.從圖中可知,試卷與課程標準在內(nèi)容主題上的一致性程度較高.“物質(zhì)”主題,4年試卷與課程標準之間的一致性最好,有3年是基本一致,有1年是略微高于.“機械運動”主題,4年試卷與課程標準之間的一致性較好,有1年是基本一致,有3年是略微低于.“電磁運動”主題,4年試卷與課程標準之間的一致性較差,有1年是基本一致,有3年是大幅度高于,歷年試卷加大了對這一主題的考查力度.“能量”內(nèi)容主題,4年試卷與課程標準之間的一致性較差,有1年是基本一致,有3年是大幅度低于,歷年試卷降低了對這一主題的考查力度.
課程標準明確提出“拓展基礎內(nèi)涵,加強課程整合”的課程理念,并強調(diào)“重視物理課程內(nèi)容的基礎性和可持續(xù)性,精心挑選學生畢生學習必不可少的基礎內(nèi)容”.[6]而物理試卷在內(nèi)容主題方面,加大了對“電磁運動”主題的考查,降低了對“能量”主題的考查.
為了直觀呈現(xiàn)歷年試卷與課程標準之間的認知層次分布異同情況,作出試卷與課程標準在認知層次上分布的直方圖,如圖2.從圖中可知,試卷與課程標準在認知層次上的一致性程度較差.“知道”層次,4年試卷與課程標準之間的一致性較差,均低于標準中這一層次知識點數(shù)目所占比率,還好呈逐漸遞增趨勢.“理解”層次,4年試卷與課程標準之間的一致性較差,有1年是基本一致,有2年是略微低于,有1年是大幅度低于標準中這一層次知識點數(shù)目所占比率,還好呈逐漸遞增趨勢.“掌握”層次,4年試卷與課程標準之間的一致性較差,均高于標準中這一層次知識點數(shù)目所占比率,還好呈逐漸遞減趨勢.“應用”層次,4年試卷與課程標準之間的一致性較差,均高于標準中這一層次的知識點數(shù)目所占比率,并呈逐漸遞增趨勢.
圖2 物理試卷與課程內(nèi)容標準的認知層次分布比較
課程標準在認知層次上,從低認知層次向高認知層次的要求呈遞減趨勢,側(cè)重考查學生較低層次的認知層次,這符合剛接觸物理學習的初中生的認知特點和思維發(fā)展水平,而歷年物理試卷側(cè)重考查學生更高層次的認知層次,均大幅度降低了“知道”和“理解”層次知識點所占比率,加大了“掌握”與“應用”層次知識點所占比率.
平均分是教育和心理測量中表征考試分數(shù)趨中程度的一個集中統(tǒng)計量.試題的平均分是指在同一次考試中“被試分數(shù)之和除以分數(shù)的個數(shù)”.
表7 2010年至2013年物理試卷的Porter一致性系數(shù)與平均分的相關比較[7~10]
2010年2011年2012年2013年P值0.5850.5800.7000.660平均分74.2773.7976.7975.14
將2010年至2013年上海市初中物理學業(yè)考試歷年平均分與本研究得出的Porter一致性系數(shù)作對比,如表7,不難發(fā)現(xiàn):2012年試卷P值最高,平均分也最高;2011年試卷P值最低,平均分也最低.P值與平均分之間成正相關.說明學業(yè)考試與課程標準之間的一致性程度越高,學生成績越高.基于標準的教育改革的核心思想就是要制定嚴格的課程標準,建立與課程標準調(diào)整一致的考試,同時教師基于課程標準開展教學活動.如果只有教師按照課程標準進行教學,而考試不按照課程標準進行考核,那么考試結果就不能正確反映學生的學業(yè)水平.教師往往都很重視學業(yè)考試涉及的內(nèi)容,如果學業(yè)考試與課程標準不一致,則教師可能不教或少教課程標準所要求學習的內(nèi)容.如果兩者的一致,教師就會重視課程標準規(guī)定的內(nèi)容,改進教學使之達到課程標準規(guī)定的要求.本研究充分說明了學業(yè)考試與課程標準的重要性,只有兩者一致,學生才能有更高的學業(yè)成就.
標準差是教育和心理測量中表征考試分數(shù)離散程度的一個差異統(tǒng)計量.標準差指示的是所有考試分數(shù)與平均分的平均距離.考試分數(shù)變化越大,標準差也越大.標準差反映了考生水平的差異情況.
表8 2010年至2013年物理試卷的Porter一致性系數(shù)與標準差的相關比較[7~10]
2010年2011年2012年2013年P值0.5850.5800.7000.660標準差11.0212.539.4611.59
將2010年至2013年上海市初中物理學業(yè)考試歷年標準差與本研究得出的Porter一致性系數(shù)作對比,如表8,不難發(fā)現(xiàn):2012年試卷P值最高,標準差最??;2011年試卷P值最小,標準差最大.P值與標準差之間成負相關.2012年考生之間的差異最小,更符合學業(yè)水平考試的性質(zhì).學業(yè)考試是標準參照考試,不同于常模參照考試,常模參照考試的目的是要對學生進行排序,強調(diào)考生的差異性,其標準差較大.標準參照考試是根據(jù)考生在標準確定的目標上的表現(xiàn)水平來評價考生,注重考試與標準的一致性,目的是要確定學生學會了哪些知識和技能,其標準差相對于常模參照考試應該較小[2].初中物理學業(yè)考試是“義務教育階段的終結性考試”,是為了反映初中畢業(yè)生所達到的物理學科學習水平,考試不應該突出強調(diào)考生之間的差異性.本研究充分說明學業(yè)考試與課程標準一致的重要性,只有兩者一致,考試才能弱化其選拔性的一面,才能“有利于減輕學生過重的學業(yè)負擔,有利于促進學生全面和諧、富有個性地發(fā)展”.[6]
本研究結果表明,2010年至2013年上海市初中物理學業(yè)考試與《上海市中學物理課程標準》之間不具備顯著的一致性.歷年試卷與課程標準的Porter一致性系數(shù)在0.580~0.700之間,平均值為0.631.之前國內(nèi)有學者對全國18個省市的中考物理試卷與《全日制義務教育物理課程標準》之間的一致性進行了研究,結果表明它們之間的Porter一致性系數(shù)在0.37~0.54之間,平均值僅為0.45[11].從本研究結果可見上海市中考物理試卷與課程標準的一致性水平比全國大部分省市好.上海屬于我國經(jīng)濟發(fā)達地區(qū),教育水平高,高校資源豐富,升學壓力比全國大部分省市小,其物理中考試題側(cè)重選拔與甄別的成分比全國大部分省市小,因此其學業(yè)考試比全國大部分省市更能體現(xiàn)課程標準的要求.下面就學業(yè)考試與課程標準不一致原因,從課程標準與學業(yè)考試角度的進行分析與建議.
課程標準是各學科教材編寫的依據(jù),是教師進行教學的依據(jù),是對各學段學生進行學業(yè)評價以及考試命題的依據(jù).課程標準要成為這些的依據(jù),就必須對學生應該做什么和能做什么有清晰而明確的闡述.而我國由于課程標準實施得較晚,在標準的具體化和清晰度上還存在很多問題:課程目標的定位與陳述都不是很清晰;內(nèi)容標準與表現(xiàn)標準的混雜;教學建議與評價建議籠統(tǒng)模糊等[12].這些都不利于基于標準的教育改革的實施.只有當標準規(guī)定的內(nèi)容要求具體清晰時,學業(yè)評價的目標才可能是明確清晰的,才可能對學生知識與技能、過程與方法、情感態(tài)度與價值觀這三個維度的目標進行可靠有效的評價.完善課程標準,使之更加具體清晰,成為推進學業(yè)評價改革當務之急.
另學業(yè)評價方面,我國現(xiàn)階段紙筆考試仍然是學業(yè)評價的主要形式和工具.物理學是一門以實驗為基礎的自然科學,與社會生活生產(chǎn)實踐聯(lián)系緊密.物理實驗著眼于知識技能的落實,并重視科學探究過程及其伴隨科學方法的考核,不但要求學生關注所觀察到的物理現(xiàn)象,還要求理解物理現(xiàn)象所表明的物理實質(zhì).僅僅通過紙筆考試不能較好的對學生科學探究等能力進行評價,過程與方法和情感態(tài)度與價值觀的目標也不能僅靠紙筆考試來考查.物理考試的內(nèi)容上應該加強對過程、能力和方法的考核,考試的形式應該有筆試、口試、操作、活動等多種形式.開發(fā)具有物理學科特點的學業(yè)評價顯得尤其重要.
參考文獻
1 中華人民共和國教育部. 基礎教育課程改革綱要(試行).教基〔2001〕17號,2001-06-08
2 雷新勇. 基于標準的教育考試——命題、標準設置和學業(yè)評價.上海:上??茖W技術出版社,2011
3 Porter.A.C.,Smithson,J.Blank,R.,&K.Zeidner,T.Align-
ment as a teacher variable.Applied Measurement in Edu-
cation,2007,20(1):27~51
4 Porter,A.C..How SEC.Measures Alignment.Education Researcher.1997(5): 5~8
5 成曉俊. 上海市初中畢業(yè)生統(tǒng)一學業(yè)考試解讀物理. 上海:上海教育出版社,2011
6 上海教育委員會. 上海市中學物理課程標準(試行稿).上海:上海教育出版社,2004
7 上海市教育考試院. 2010年上海市初中畢業(yè)統(tǒng)一學業(yè)考試試題分析與評價.上海:上海教育出版社,2010
8 上海市教育考試院. 2011年上海市初中畢業(yè)統(tǒng)一學業(yè)考試試題分析與評價.上海:上海教育出版社,2011
9 上海市教育考試院. 2012年上海市初中畢業(yè)統(tǒng)一學業(yè)考試試題分析與評價.上海:上海教育出版社,2012
10 上海市教育考試院. 2013年上海市初中畢業(yè)統(tǒng)一學業(yè)考試試題分析與評價.上海:上海教育出版社,2013
11 羅瑩,王宏博,張薇薇,等. 2010年中考物理試卷與課程標準一致性分析. 基礎教育課程,2011(3):70~75
12 崔允漷,王少非,夏雪梅. 基于標準的學生學業(yè)成就評價. 上海:華東師范大學出版社,2008