黃正正 郭亞歌
學(xué)校因素對學(xué)生數(shù)學(xué)素養(yǎng)成績影響的跨文化比較
——基于PISA2012多水平分析的結(jié)果
黃正正 郭亞歌
本研究采用PISA2012的數(shù)據(jù),使用多水平線性模型方法,比較中國上海地區(qū)、美國、芬蘭、日本四個國家(地區(qū))的學(xué)??陀^特征因素和校長領(lǐng)導(dǎo)力對學(xué)生數(shù)學(xué)素養(yǎng)成績的預(yù)測效應(yīng)。結(jié)果發(fā)現(xiàn):學(xué)校的客觀特征變量在不同國家對學(xué)生數(shù)學(xué)素養(yǎng)的影響不盡相同;學(xué)生層面和學(xué)校層面的社會經(jīng)濟(jì)文化水平指標(biāo)對數(shù)學(xué)素養(yǎng)有著正向的預(yù)測效果;在控制學(xué)生背景變量的情況下,學(xué)校層面的校長領(lǐng)導(dǎo)力指標(biāo)對數(shù)學(xué)素養(yǎng)無顯著預(yù)測作用。
學(xué)校因素;數(shù)學(xué)素養(yǎng);多水平分析;PISA2012
自從學(xué)校成為制度化教育組織以來,人們一直都認(rèn)為學(xué)生的學(xué)業(yè)成就與學(xué)校的領(lǐng)導(dǎo)與管理因素存在著密不可分的聯(lián)系。校長是學(xué)校教育教學(xué)和質(zhì)量管理的第一責(zé)任人,校長對教育教學(xué)的領(lǐng)導(dǎo)是影響學(xué)校教育質(zhì)量的關(guān)鍵。20世紀(jì)70年代,美國興起了“有效學(xué)校運動”。學(xué)者在對有效學(xué)校的研究中發(fā)現(xiàn),“強(qiáng)有力的領(lǐng)導(dǎo)”被證實為有效學(xué)校的重要特征,并由此成為學(xué)校效能研究中的過程變量,而學(xué)生學(xué)業(yè)成就則常常被視為客觀而重要的結(jié)果變量。很多研究結(jié)果顯示:校長的領(lǐng)導(dǎo)力對學(xué)生的學(xué)業(yè)成績有重要影響(Witziers,Bosker&Kruger,2003;Leithwood,Karen&Steohen,2004)。Kaplan、Owings和Nunnery(2005)發(fā)現(xiàn)在學(xué)校領(lǐng)導(dǎo)標(biāo)準(zhǔn)中評比較高的校長,其學(xué)生成就也較高;Cotton(2003)也指出校長領(lǐng)導(dǎo)和學(xué)生學(xué)業(yè)成就之間具有正相關(guān)。Leithwood和Jantzi(2000)認(rèn)為校長領(lǐng)導(dǎo)對學(xué)生學(xué)習(xí)的影響占了學(xué)校層面影響的四分之一以上。
但隨著研究的深入,學(xué)者們對校長領(lǐng)導(dǎo)與學(xué)生成就的關(guān)系有了不同的發(fā)現(xiàn)。近年來,國際上發(fā)展出了多種跨國家、大規(guī)模的標(biāo)準(zhǔn)化學(xué)生成就測試,主要有:由經(jīng)濟(jì)合作與發(fā)展組織(The Organization for Economic Co-operation and Development,OECD)舉辦的PISA項目;由國際教育成就評價協(xié)會(Inter?national Association for the Evaluation of Achieve?ment)舉辦的國際數(shù)學(xué)與科學(xué)成就趨勢調(diào)查(Trends for International Mathematics and Science Study)和國際學(xué)生閱讀素養(yǎng)進(jìn)展調(diào)查(Progress in International Reading Literacy Study)等。在經(jīng)歷過去十年的多輪測驗后,學(xué)生在學(xué)科領(lǐng)域的表現(xiàn)得到評估并公之于眾。基于這些數(shù)據(jù),產(chǎn)生了大量探索學(xué)生成就影響因素的研究。這些研究的結(jié)果促使教育界人士改變現(xiàn)有的學(xué)校政策或者制定新的教育措施以提高學(xué)生成績。但是,學(xué)者們經(jīng)過研究發(fā)現(xiàn),對于校長領(lǐng)導(dǎo)力和學(xué)生成就之間的關(guān)系卻常常相互矛盾。
Shin和Slater(2010)通過分析TIMSS數(shù)據(jù)庫8個國家的數(shù)據(jù)發(fā)現(xiàn),很少有一致的數(shù)據(jù)證明校長領(lǐng)導(dǎo)力和學(xué)生數(shù)學(xué)成績的關(guān)系,這項研究發(fā)現(xiàn)很難建立起校長領(lǐng)導(dǎo)力和學(xué)生成績之間的關(guān)系。同時,以往的大多數(shù)跨國大規(guī)模教育評價的數(shù)據(jù)調(diào)查,也發(fā)現(xiàn)校長領(lǐng)導(dǎo)力和學(xué)生的成績之間沒有顯著的關(guān)系(Backhoff,Andrade,Bouzas,Santos del Real,2009)。Charles L.Slater和Backhoff(2013)通過分析美國、韓國、墨西哥三國的PISA2009的數(shù)學(xué)成績發(fā)現(xiàn),校長知覺的領(lǐng)導(dǎo)力和對學(xué)生成績的預(yù)測效應(yīng)差異很大,在文章里作者也很難解釋差異產(chǎn)生的原因。
縱觀以往有關(guān)校長領(lǐng)導(dǎo)和學(xué)生成就之間關(guān)系的研究發(fā)現(xiàn),很多研究或者在單一水平上考察兩者之間的關(guān)系,而沒有考慮數(shù)據(jù)的嵌套結(jié)構(gòu);或者數(shù)據(jù)樣本量有限,代表性不足;而且眾多歷史研究得到的結(jié)論并不統(tǒng)一。因此,本研究采用PISA 2012的數(shù)據(jù),試圖從國際比較(美國、芬蘭、日本和上海地區(qū))的視角在考慮數(shù)據(jù)嵌套結(jié)構(gòu)的情況下,使用兩水平線性模型(two-level linear model)的方法,探討在學(xué)校層面,學(xué)校管理和校長領(lǐng)導(dǎo)因素在美國、芬蘭、日本和中國上海這四個國家/地區(qū)對學(xué)生數(shù)學(xué)素養(yǎng)成績的預(yù)測效應(yīng),為我國基礎(chǔ)教育未來的改革與發(fā)展提供參考建議。
PISA是OECD于1997年發(fā)起的為OECD成員國協(xié)作監(jiān)控教育成效的評價項目。PISA應(yīng)用現(xiàn)代教育測量理論測試發(fā)達(dá)國家或地區(qū)義務(wù)教育結(jié)束階段15歲學(xué)生在閱讀、數(shù)學(xué)、科學(xué)領(lǐng)域的發(fā)展水平,配套調(diào)查問卷進(jìn)而評價各參與國家或地區(qū)的教育成效,進(jìn)行國際比較,是世界上頗具影響的國際教育評價項目之一。
該項目自2000年開始每隔三年實施一次,評價領(lǐng)域包括數(shù)學(xué)、閱讀和科學(xué)素養(yǎng),每次側(cè)重一個領(lǐng)域,依據(jù)評價年命名。PISA2012的主評價領(lǐng)域是數(shù)學(xué)素養(yǎng),其將數(shù)學(xué)素養(yǎng)界定為:數(shù)學(xué)素養(yǎng)是個體在各種情境中進(jìn)行數(shù)學(xué)表述、數(shù)學(xué)運用和數(shù)學(xué)闡釋的能力,它包含數(shù)學(xué)推理,運用數(shù)學(xué)概念、數(shù)學(xué)步驟、數(shù)學(xué)事實和數(shù)學(xué)工具來描述、解釋和預(yù)測數(shù)學(xué)現(xiàn)象。它幫助個體認(rèn)識數(shù)學(xué)在現(xiàn)實世界中所起到的作用,作出有根據(jù)的判斷和決策,以成為具有建設(shè)性、參與意識和反思能力的公民(OECD,2013)。
除對三個科目的測評外,PISA 2012同時通過問卷調(diào)查的方式來收集學(xué)生和學(xué)校的背景信息,從學(xué)生、教師、學(xué)校等層面來分析成績的影響因素。為保證測試工具的科學(xué)性,PISA從檢測工具開發(fā)、檢測標(biāo)準(zhǔn)設(shè)定、檢測數(shù)據(jù)處理到檢測結(jié)果判斷等各環(huán)節(jié)的操作都嚴(yán)密可行、規(guī)范有效。同時由于PISA采用量表化技術(shù),不同輪次研究得到的評價結(jié)果可以直接進(jìn)行數(shù)值上的比較。因此,PISA的結(jié)果是有效且高度可信的(OECD,2013)。
本研究所用的數(shù)據(jù)均來自PISA官方網(wǎng)站(http://www.pisa.oecd.org)。
本研究選取了PISA2012數(shù)據(jù)庫中中國上海地區(qū)和美國、芬蘭、日本四個國家/地區(qū)的數(shù)據(jù)。選取這四個國家/地區(qū)首先是由于他們數(shù)學(xué)素養(yǎng)成績的代表性,上海地區(qū)數(shù)學(xué)素養(yǎng)均分為613分位列第一,芬蘭和日本的數(shù)學(xué)素養(yǎng)均分(519分和536分)都高于OECD均值484分,美國的數(shù)學(xué)素養(yǎng)均分(481分)低于OECD均值。另外在跨文化研究中,美國以其強(qiáng)大的國家實力往往作為國際比較研究的基準(zhǔn);芬蘭則在PISA的既往測試中保持了很高的教育水平和教育公平性;日本是亞洲的發(fā)達(dá)國家,同時也是東亞文化圈的代表,與我國具有文化傳統(tǒng)上的相似性。
表1 被試量的描述統(tǒng)計
表1為剔除相應(yīng)變量缺失值后四個國家參與研究的學(xué)生和學(xué)校數(shù)量,共計23 543名15歲在校學(xué)生和766所學(xué)校被納入了本文的研究,各個國家的男女學(xué)生比例都接近1∶1。
本研究從PISA2012學(xué)生問卷和學(xué)校問卷數(shù)據(jù)所構(gòu)成的嵌套關(guān)系中,在控制其他學(xué)生水平變量和學(xué)校水平變量的基礎(chǔ)上,考察校長知覺的領(lǐng)導(dǎo)力對數(shù)學(xué)素養(yǎng)成績的影響。因變量是學(xué)生的數(shù)學(xué)素養(yǎng)成績,自變量則分為兩層:第一層是學(xué)生水平變量,包括學(xué)生性別和其家庭社會經(jīng)濟(jì)文化水平(在PISA中簡稱為ESCS)(OECD,2012);第二層是學(xué)校水平變量,合計為10個變量。包括PISA2012校長問卷中呈現(xiàn)的四種校長領(lǐng)導(dǎo)力,分別是教學(xué)領(lǐng)導(dǎo)力(In?structional leadership)、構(gòu)建傳達(dá)教學(xué)目標(biāo)和課程發(fā)展(Framing and communicating the school’s goals and curricular development)、促進(jìn)教學(xué)改善和專業(yè)發(fā)展(Promoting instructional improvements and profes?sional development)、教師參與(teach participation)(OECD,2013)。此外還有6個學(xué)??陀^特征變量,包括學(xué)校類型、學(xué)校規(guī)模、班級規(guī)模、生師比、學(xué)校教育資源質(zhì)量和學(xué)校ESCS均值。自變量的說明與計分方式見表2。
表2 自變量的說明及計分方式
本研究采用多水平線性模型方法對數(shù)據(jù)進(jìn)行分析。使用SPSS20.0進(jìn)行數(shù)據(jù)的整理與轉(zhuǎn)換;使用HLM6.08實現(xiàn)對學(xué)生樣本的加權(quán)和對似真值(Plau?sible Value)的計算,并對處理過的數(shù)據(jù)進(jìn)行多水平分析。
從表1和表3可以看出:
(1)學(xué)生水平變量中,上海地區(qū)學(xué)生的數(shù)學(xué)素養(yǎng)成績最高,其次是日本和芬蘭,美國學(xué)生的數(shù)學(xué)素養(yǎng)成績最低;學(xué)生的ESCS水平從高到低依次為芬蘭、美國、日本和上海。
(2)學(xué)校水平變量中,上海地區(qū)的學(xué)校規(guī)模和班級規(guī)模均為最大,而芬蘭的學(xué)校規(guī)模和班級規(guī)模都是最小的;生師比方面美國在17左右,上海地區(qū)、芬蘭和日本則都在12左右;學(xué)校教育資源質(zhì)量方面日本和美國的情況較好,芬蘭和上海地區(qū)則相對較差;四種校長領(lǐng)導(dǎo)力上的表現(xiàn)也各不相同,美國的四種校長領(lǐng)導(dǎo)力分值均較高,上海地區(qū)和芬蘭的四種校長領(lǐng)導(dǎo)力均較低,日本則是除了LEADINST以外得分都很低。
表3 四個國家學(xué)生變量和學(xué)校變量描述統(tǒng)計(均值/標(biāo)準(zhǔn)差)
表4 學(xué)生的數(shù)學(xué)素養(yǎng)成績變異在學(xué)校間和學(xué)校內(nèi)的估計
根據(jù)多水平線性模型的統(tǒng)計原理,以學(xué)生的數(shù)學(xué)素養(yǎng)成績?yōu)橐蜃兞?,將影響學(xué)生數(shù)學(xué)素養(yǎng)成績的變量分為兩層,第一層為學(xué)生水平變量,第二層為學(xué)校水平變量。首先建立不加入任何預(yù)測變量的零模型,考察學(xué)校間變異和學(xué)校內(nèi)變異對學(xué)生成績總變異的貢獻(xiàn)。具體模型為:
表4為四個國家學(xué)生的數(shù)學(xué)素養(yǎng)成績變異在學(xué)校間和學(xué)校內(nèi)的估計,學(xué)校間變異與學(xué)校內(nèi)變異之和為學(xué)生成績的總變異。對表中數(shù)據(jù)進(jìn)行運算可知,美國、芬蘭、日本和上海地區(qū)的組內(nèi)相關(guān)系數(shù)(ICC)分別為0.25、0.12、0.54和0.47。ICC代表了群組內(nèi)的相似性程度,Cohen(1988)認(rèn)為當(dāng)ICC大于0.059時就不能忽略群組內(nèi)相似性的存在,而必須考慮采用多水平分析Bryk&Rauden bush(1992)和Verbek&Molen berghs(2000)也認(rèn)為如果此時使用傳統(tǒng)的多元回歸,發(fā)生I型錯誤的概率會大幅增加。另外從各國不同的組內(nèi)相關(guān)系數(shù),也可以看出日本和上海地區(qū)的學(xué)校間變異所占的比重較大,說明這兩個國家的學(xué)生成績差異可以更多的由學(xué)校間因素解釋;芬蘭和美國的學(xué)校間變異所占的比重要小一些,尤以芬蘭為最,這表明學(xué)校內(nèi)的變量,例如學(xué)生的自身因素,更能解釋這兩個國家內(nèi)的學(xué)生成績差異,這也表明芬蘭和美國具有更好的教育公平性和均衡性。這些結(jié)論與之前PI?SA多次評測的結(jié)果也是一致的(OECD,2007;OECD,2010)。
表5 學(xué)生數(shù)學(xué)素養(yǎng)成績影響因素的多層線性回歸分析
將學(xué)生背景變量和學(xué)校層面變量加入到模型中建立完整模型,考察兩個水平的變量對學(xué)生數(shù)學(xué)素養(yǎng)成績的影響。這里僅考察隨機(jī)截距模型的情況。各個變量對學(xué)生數(shù)學(xué)素養(yǎng)成績的影響如表5。具體模型如下:
(1)完整模型中學(xué)生水平變量的結(jié)果分析
從表4和表5可以看出,學(xué)生水平變量的加入解釋了一部分學(xué)校內(nèi)變異。美國、芬蘭、日本和上海地區(qū)學(xué)生數(shù)學(xué)素養(yǎng)成績的學(xué)校內(nèi)變異分別下降的百分比是6.88%、7.98%、1.41%和1.91%。
由表5可以看出,美國(=7.90)、日本(=16.45)和上海地區(qū)(=14.08)的數(shù)學(xué)素養(yǎng)成績都存在顯著的性別差異,男生比女生的成績表現(xiàn)要好;芬蘭(=0.45)在數(shù)學(xué)素養(yǎng)成績上則不存在性別差異。
學(xué)生的ESCS水平對四個國家學(xué)生的數(shù)學(xué)素養(yǎng)成績都有顯著的正向預(yù)測作用,即學(xué)生的ESCS水平越高,取得的數(shù)學(xué)素養(yǎng)成績也越高。由該變量對數(shù)學(xué)成績影響的系數(shù)可以發(fā)現(xiàn),美國和芬蘭學(xué)生受家庭社會經(jīng)濟(jì)文化地位的影響最大,學(xué)生的ESCS水平每提高一單位,數(shù)學(xué)素養(yǎng)成績增加分別達(dá)到了24.08分和29.86分;日本和上海地區(qū)學(xué)生受家庭社會經(jīng)濟(jì)文化地位的影響則較小,學(xué)生的ESCS水平每提高一單位,數(shù)學(xué)素養(yǎng)成績增加分?jǐn)?shù)分別為3.92分和9.27分。
(2)完整模型中學(xué)校水平變量的結(jié)果分析
加入第二層學(xué)校水平變量后,四個國家的學(xué)校間變異也都有不同程度的下降。美國、芬蘭、日本和上海地區(qū)學(xué)校間變異分別下降了65.42%、45.84%、75.31%和66.58%,表明第二層變量解釋了四個國家較大一部分學(xué)校間變異。
從表5我們可以發(fā)現(xiàn),在控制學(xué)生背景變量的情況下,只有學(xué)校ESCS均值這個變量對四個國家都具有顯著的正向預(yù)測作用,其他變量的效果則不盡相同。
具體而言,對美國來說學(xué)校類型(=-29.94)對學(xué)生數(shù)學(xué)素養(yǎng)成績有著顯著的負(fù)向預(yù)測作用,即公立學(xué)校的學(xué)生比私立學(xué)校的學(xué)生平均成績要低29.94;學(xué)校ESCS均值(=43.89)對學(xué)生數(shù)學(xué)素養(yǎng)成績有顯著的正向預(yù)測作用,學(xué)校ESCS均值上升1個單位,學(xué)生數(shù)學(xué)素養(yǎng)成績上升43.89分。對芬蘭來說,班級規(guī)模(=2.34)和學(xué)校ESCS均值(=22.06)對學(xué)生數(shù)學(xué)素養(yǎng)成績都有著顯著的正向預(yù)測作用。對日本來說,學(xué)校類型(=-42.37)對學(xué)生數(shù)學(xué)素養(yǎng)成績有著顯著的負(fù)向預(yù)測作用;班級規(guī)模(=1.37)和學(xué)校ESCS均值(156.43)對學(xué)生數(shù)學(xué)素養(yǎng)成績有著顯著的正向預(yù)測作用。上海地區(qū)只有學(xué)校ESCS均值對學(xué)生數(shù)學(xué)素養(yǎng)成績有著顯著的正向預(yù)測作用。
PISA2012中新增加的四個校長領(lǐng)導(dǎo)力指標(biāo),對本研究中的四個國家都沒有顯著的預(yù)測作用。
許多以往的研究都表明男生在數(shù)學(xué)成績上要高于女生,本研究中的美國、日本和上海地區(qū)也都表現(xiàn)出了這一特點:在控制了其他變量之后,這三個國家的男生數(shù)學(xué)素養(yǎng)成績?nèi)匀伙@著優(yōu)于女生。但是值得指出的是,在PISA2012中,芬蘭的男女生數(shù)學(xué)素養(yǎng)成績并無顯著差異。而在PISA2006中,芬蘭的男生數(shù)學(xué)成績是顯著高于女生的。這表明男女生之間的數(shù)學(xué)成績差異并非一定存在或者無法克服的。
PISA經(jīng)過多年的研究發(fā)現(xiàn),學(xué)生表現(xiàn)的性別差異可以大幅縮小,因為所有國家(地區(qū))的男女生都顯示他們能在所有三個領(lǐng)域上取得成功。男生和女生在數(shù)學(xué)、閱讀和科學(xué)上的表現(xiàn)水平不同,但同一性別內(nèi)的表現(xiàn)差異顯著大于不同性別間的差異。在許多國家(地區(qū)),數(shù)學(xué)表現(xiàn)上性別差異很大——男生高于女生,但有很多例外,差別的程度也不一樣。PISA2012研究發(fā)現(xiàn),一些國家成功地縮小了數(shù)學(xué)表現(xiàn)上的性別差異。與此同時,有證據(jù)顯示,在許多國家(地區(qū)),最低表現(xiàn)的學(xué)生中的男生比女生多,其中一些國家(地區(qū))需要在提高男生的數(shù)學(xué)參與度方面做更多。(OECD,2013)。
自從20世紀(jì)60年代《科爾曼報告》發(fā)布之后,學(xué)生的家庭社會經(jīng)濟(jì)文化地位對成績的影響開始被廣泛關(guān)注,盡管大家對這一變量的具體定義和測量方法會有所出入,但是大量的研究都表明這種影響是存在且深刻的。本研究的結(jié)果再次印證了這一點:對不同文化背景的國家來說,學(xué)生的家庭社會經(jīng)濟(jì)文化地位對數(shù)學(xué)成績的影響都有著正向的預(yù)測作用。
本研究在學(xué)校水平選取了6個學(xué)??陀^特征變量:學(xué)校類型、學(xué)校規(guī)模、班級規(guī)模、生師比、學(xué)校教育資源質(zhì)量和學(xué)校ESCS均值。通過多水平分析我們發(fā)現(xiàn),在控制了學(xué)生水平變量之后,這些學(xué)??陀^特征變量對不同國家學(xué)生數(shù)學(xué)素養(yǎng)成績的影響差異較大,但也表現(xiàn)出了一些共同之處。
首先,學(xué)校類型對學(xué)生數(shù)學(xué)素養(yǎng)成績的影響方向是一致的,其中美國、日本的私立學(xué)校數(shù)學(xué)素養(yǎng)成績顯著高于公立學(xué)校,且幅度較大;但在上海地區(qū)和教育均衡性最優(yōu)的芬蘭,學(xué)校類型造成的學(xué)生素養(yǎng)差異并不顯著,表明公辦教育也可以取得與私立學(xué)校相近的成績。
其次,學(xué)校ESCS均值對學(xué)生數(shù)學(xué)素養(yǎng)成績都有著顯著的正向預(yù)測作用。通常而言,學(xué)校ESCS均值較高表明學(xué)校所在地區(qū)經(jīng)濟(jì)較為發(fā)達(dá),或者學(xué)校吸納了其所在地區(qū)內(nèi)社會經(jīng)濟(jì)文化地位較高的那部分學(xué)生。實際上也就是學(xué)校變得“強(qiáng)者愈強(qiáng)”。
PISA經(jīng)過多年的研究發(fā)現(xiàn),社會經(jīng)濟(jì)背景會影響到學(xué)校的布局和學(xué)生特征,造成一定的“馬太效應(yīng)”。世界上其他國家為消除教育的區(qū)域、城鄉(xiāng)和校際差異,充分利用政策杠桿調(diào)整學(xué)校的布局,通過學(xué)校合并、建立新校(如磁石學(xué)校和教育行動區(qū))減少社會經(jīng)濟(jì)背景對于學(xué)生成績的影響。當(dāng)前,教育部門應(yīng)該充分利用學(xué)齡人口變化的有利時機(jī),調(diào)整學(xué)校布局,削弱社會經(jīng)濟(jì)背景對于學(xué)校和學(xué)生成績差異的影響。PISA全球趨勢報告顯示,“學(xué)校的質(zhì)量不會超越其教師和校長的質(zhì)量”,所有高表現(xiàn)的國家無一例外地制定了提高教師隊伍質(zhì)量的政策,并確保將教師分配到他們能做出最大改變的學(xué)校和學(xué)生中去。
本研究的結(jié)果表明PISA2012提出的四種校長領(lǐng)導(dǎo)力,對學(xué)生數(shù)學(xué)素養(yǎng)成績都無顯著預(yù)測效果。
這可能是由于PISA的抽樣只涉及學(xué)校中的校長和學(xué)生兩類群體,而關(guān)于校長領(lǐng)導(dǎo)力等因素來說,校長或許并不是最合適的信息提供者。校長問卷屬于自陳量表,表面效度過高,降低了結(jié)果的有效性。以往的研究表明,從教師視角收集的校長領(lǐng)導(dǎo)力問卷提供的數(shù)據(jù)最有效。如Hallinger開發(fā)的校長教學(xué)領(lǐng)導(dǎo)力測量問卷分為三個平行的版本,校長自我評估版本,教師版本和督學(xué)版本。三個版本的題目完全相同,只是填寫問卷的群體是不一樣的。早期的研究發(fā)現(xiàn),不同群體間的看法存在顯著差異(Hallinger&Murphy,1985;Krug,1986)。在美國進(jìn)行的驗證研究表明,教師視角的PIMRS版本在三個版本中提供了最有效的數(shù)據(jù)(Hallinger,2011)。教師是學(xué)校中對校長最為了解的群體,校長自評的分?jǐn)?shù)往往是不太客觀的,而督學(xué)對校長的了解比較少,在這種情況下,教師版的PIMRS是最為合適的。
而且,校長領(lǐng)導(dǎo)力是通過教師、學(xué)校氣氛等中介變量對學(xué)生學(xué)習(xí)成就產(chǎn)生影響,可能正由于這種中介作用,導(dǎo)致變量間的相互作用變得復(fù)雜而交錯。另外,根據(jù)OECD的報告(OECD,2013),PISA呈現(xiàn)的四種校長領(lǐng)導(dǎo)力之間具有高度的相關(guān)性,這可能會導(dǎo)致共線性問題(collinearity),從而產(chǎn)生更大的II型錯誤,從而導(dǎo)致最后的結(jié)果不佳。
PISA2012年美國、芬蘭、日本和上海地區(qū)的數(shù)據(jù)結(jié)果表明:
(1)在控制學(xué)生背景變量和學(xué)校社會經(jīng)濟(jì)文化水平之后,學(xué)校層面變量對學(xué)生數(shù)學(xué)素養(yǎng)成績的關(guān)系在四個國家之間存在差異:學(xué)校類型與美國學(xué)生數(shù)學(xué)素養(yǎng)成績存在顯著的負(fù)向關(guān)系;班級規(guī)模與芬蘭學(xué)生數(shù)學(xué)素養(yǎng)成績存在顯著的正向關(guān)系;學(xué)校類型與日本學(xué)生數(shù)學(xué)素養(yǎng)成績存在顯著的負(fù)向關(guān)系,班級規(guī)模則與日本學(xué)生數(shù)學(xué)素養(yǎng)成績存在顯著的正向關(guān)系。
(2)在控制學(xué)生背景變量后,PISA2012中的四種校長領(lǐng)導(dǎo)力指標(biāo)對四個國家的學(xué)生數(shù)學(xué)素養(yǎng)成績均無顯著預(yù)測力。這一事實背后可能存在更深刻的原因:“校長領(lǐng)導(dǎo)力”是一個寬泛的概念,PISA問卷對它的界定尚不夠精確,是否可以分為四種校長領(lǐng)導(dǎo)力仍然值得商榷;另外對于校長領(lǐng)導(dǎo)力這樣的指標(biāo),采用自陳量表的方式可能并不太妥當(dāng),使用教師問卷這樣的他評量表來進(jìn)行測量會更加合理。
[1]Backhoff,E.,Andrade,A.,Bouzas,R.,Santos del Real,A.,&San?tibanezL..Teaching andLearning International Survey(TALIS)[M].Mexico City,Mexico:Secretaria de EducacionPublica,2009.
[2]Bryk,A.S.,&Raudenbush,S.W..Hierarchical linear models[M].Newbury Park,CA:Sage,1992.
[3]Beretvas,N..Hierarchical Linear Modeling.IN J.P.Stevens(Eds.),Applied Multivariate Statistics for the Social Sciences[M].New York,NY:Routledge,2009:505-536.
[4]Cotton,K..Principals and student achievement:What the research says[M].Alexandria,VA:Association for Supervision and Curricu?lum Development,2003.
[5]Cohen,J..Statistical power analysis for the behavioral sciences[M].Hillsdale,NJ:Eribaum,1988.
[6]Hallinger,P..A Review of Three Decades of Doctoral Studies Using the Principal Instructional Management Rating Scale:A Lens on Methodological Progress in Educational Leadership[J].Educational?Administration Quarterly,2011,47(2):271-306.
[7]Hallinger,P.,&Murphy,J..Assessing the instructional leadership behavior of principals[J].Elementary School Journal,1985,86(2):217-248.
[8]Kaplan,L.S.,Owings,W.A.,&Nunnery,J..Principal quality:A Virginia study connecting interstate school leaders licensure consor?tium standards with student achievement[J]NASSP Bulletin,2005,89(643):28-44.
[9]Krug,F..The relationship between the instructional management be?havior of elementary school principals and student achievement[D].Retrieved from ERIC database.(ED8722942).
[10]Leithwood,K.,&Jantzi,D..The effects of transformation leadership on student engagement with school[J].Journal of Educational Ad?ministration,2000,38(2):112-129.
[11]Leithwood,Kenneth,Karen Seashore Louis,Stephen Anderson,and Kyla Wahlstrom.Review of research:How leadership influences student learning[R].New York:The Wallace Foundation.2004.
[12]OECD.PISA 2012 Results:What Makes Schools Successful?Re?sources,Policies and Practices(Volume IV)[M].PISA,OECD Pub?lishing,2013.
[13]OECD.PISA 2009 Technical Report[M].PISA,OECD Publishing,2012.
[14]OECD.PISA 2009Results:Overcoming Social Background Equity in Learning Opportunities and Outcomes(Volume II)[M].PISA,OECD Publishing,2010.
[15]OECD.PISA 2006 Results:Science competencies for tomorrow’s world(Volume I:Analysis)[M].PISA,OECD Publishing,2007.
[16]Charles L.Slater&Seon-Hi Shin,Backhoff.Principal Perceptions and Student Achievement in Reading in Korea,Mexico,and the United States:Educational Leadership,School Autonomy,and Use of Test Results[J].Educational Administration Quarterly,2013,49(3):489-527.
[17]Shin,S.,&Slater,C.L..Principal leadership and mathematics achievement:An international comparative study[J].School Leader?ship&Management,2010,30(4):317-334.
[18]Verbeke,G.,&Molenberghs,G..Springer series in statistics:Linear mixed models for longitudinal data[M].New York,NY:Springer-Verlag,2000.
[19]Witziers,B.,Bosker,R.J.&Kruger.M.L..Educational leadership and student achievement:The elusive search for an association[J].Educational Administration Quarterly,2003,39,(3):398-425.
(責(zé)任編輯 吳四伍)
Cross-cultural Comparison of School Factors Affecting Students’Achievement in Mathematical Literacy:Based on the Multilevel Analysis of PISA2012
HUANG Zhengzheng and GUO Yage
This study investigated the predictive effect of school objective factors and principal leadership on students’achievement in mathematical literacy by employing two-level Linear Models from an international comparison perspective.Four countries/regions including shanghai-China,United States,Finland and Japan were selected from the international PISA 2012 database.The findings indicated that:The Influence of the objective variables of school on students’mathematical achievement is not the same in different countries;The indicator of socio-economic and cultural at the student’s and school’s level has positive predictive effect on mathematical literacy;With students’background controlled,the indicator of principal leadership at the school level has no significant predictive effect on mathematical literacy.
School Factors;Mathematical Achievement;Hierarchical Linear Model;PISA 2012
G405
A
1005-8427(2014)10-0047-9
本文系國家教育體制改革領(lǐng)導(dǎo)小組研究項目“研提OECD組織PISA測試項目經(jīng)驗啟示”的研究成果之一。
黃正正,男,湖北中醫(yī)藥大學(xué)人文學(xué)院,助教(武漢 430065)
郭亞歌,女,北京師范大學(xué),碩士研究生(北京 100875)