于洋 余海晴
摘? ?要:在經(jīng)濟全球化逐漸深入發(fā)展的背景下,為了評估國家教育體系的運行狀況,越來越多的國家參與到國際性的教育評估項目中。美國國家教育統(tǒng)計中心(NCES)根據(jù)這些國際項目提供的最新信息,制定了2015年度國際教育績效指標(biāo)報告。分析發(fā)現(xiàn),2015年度國際教育績效指標(biāo)報告的特點呈現(xiàn)出評價覆蓋的全面性、報告的客觀性、評價維度的多樣性和層次性、評價標(biāo)準(zhǔn)注重普適性和針對性相結(jié)合、評價指標(biāo)的動態(tài)性和靜態(tài)性相結(jié)合、關(guān)注性別在教育中的差異及影響。借鑒NCES 2015年度國際教育績效指標(biāo)報告的經(jīng)驗,我國應(yīng)從國家層面建立可持續(xù)的教育績效評價體系和制度,建立多元、立體的評價維度,選擇符合我國教育核心特點的評價指標(biāo)以及重視性別因素。
關(guān)鍵詞:NCES國際指標(biāo)報告 教育績效 績效評價 國際比較 指標(biāo)體系
教育績效是考核教育成效的重要方面,是教育過程本身的效率,它通過衡量公共教育資源的投入和產(chǎn)出,反映一國的教育情況和水平,對國家教育目標(biāo)的制定、教育資源的配置和教育過程的調(diào)整有著重要的指導(dǎo)和參考作用。自20世紀(jì)60年代以來,美國就建立了教育評價體系,即“美國國家教育進展評估”(National Assessment of Educational Progress,NAEP),并且不斷完善發(fā)展至今。美國國家教育統(tǒng)計中心(National Center for Education Statistics,NCES)負(fù)責(zé)全國公立和非公立學(xué)校的各種科目的NAEP評估[1],對NAEP的評估進行信息分析、績效比較和報告。NAEP側(cè)重于監(jiān)測美國國內(nèi)基礎(chǔ)教育質(zhì)量以及發(fā)展趨勢,而NCES近年來更傾向?qū)H績效進行系統(tǒng)的比較研究,這一統(tǒng)計研究目前是走在世界前列的。本文選取NCES 2015年度國際教育績效指標(biāo)報告,總結(jié)該報告的特點,以期為我國教育績效評價體系的完善和發(fā)展提供參考。
一、NCES和國際教育績效指標(biāo)報告測度
(一)NCES
NCES隸屬于美國聯(lián)邦教育部和教育科學(xué)研究所,由國會授權(quán),是收集、整理、分析和報告美國和其他國家教育相關(guān)數(shù)據(jù)的主要聯(lián)邦機構(gòu),并且進行編寫和發(fā)布、審查和報告國際教育動態(tài)的工作[2]。截至目前,NCES的專員辦公室由3個部門和2個工作人員小組構(gòu)成:評估部門、抽樣調(diào)查部門、數(shù)據(jù)管理部門、統(tǒng)計標(biāo)準(zhǔn)和數(shù)據(jù)保密人員組、年度報告和信息人員組。評估部門下設(shè)報告和宣傳處、行政支持與服務(wù)處、國家評估處和國際評估處;抽樣調(diào)查部門下設(shè)縱向跟蹤調(diào)查處和橫斷面調(diào)查處;數(shù)據(jù)管理部門下設(shè)州縱向跟蹤數(shù)據(jù)系統(tǒng)處、高等教育處和基礎(chǔ)教育處[3]。發(fā)展至今,NCES為美國的教育事業(yè)提供了大量的數(shù)據(jù)源和研究資料,極大地增強了美國各級各類教育的管理、監(jiān)督、評價和協(xié)調(diào)能力,提高了美國教育的透明度[4]。因此,NCES不僅在美國國內(nèi)發(fā)揮著協(xié)調(diào)、支持、服務(wù)的重要作用,也在國際評估中扮演著重要角色。
自2002年開始,NCES每隔幾年都會發(fā)布一次國際教育績效指標(biāo)報告,目前已有2002、2004、2006、2009、2011、2015年度的六份報告,其中,2015年度的國際教育績效指標(biāo)報告是NCES目前最新發(fā)布的一份報告。
(二)國際教育績效指標(biāo)報告的數(shù)據(jù)來源
2015年度國際教育績效指標(biāo)報告中約2/3的數(shù)據(jù)來源于教育評價系統(tǒng)工會(INES)、國際閱讀素養(yǎng)進展研究(PIRLS)、國際數(shù)學(xué)與科學(xué)趨勢研究(TIMSS)、國際學(xué)生評估項目(PISA)和國際成人能力評估項目(PIAAC),其余1/3的數(shù)據(jù)來自經(jīng)濟合作與發(fā)展組織(OECD)2013年版《教育概覽》中的匯編數(shù)據(jù)以及數(shù)據(jù)庫中的國際教育數(shù)據(jù)。
1. INES
20世紀(jì)80年代中期,OECD開始設(shè)立專門的監(jiān)測機構(gòu),負(fù)責(zé)為34個成員國以及20個友好國提供監(jiān)測數(shù)據(jù),以修正和完善教育體系。INES作為OECD教育發(fā)展監(jiān)測指標(biāo)項目的主要負(fù)責(zé)機構(gòu),于1991年首次發(fā)布了《教育概覽:OECD指標(biāo)》,現(xiàn)已成為全世界教育信息的權(quán)威來源之一[5]。INES的數(shù)據(jù)主要來自O(shè)ECD的年度數(shù)據(jù),而成員國的數(shù)據(jù)則來自各國數(shù)據(jù)源,包括行政數(shù)據(jù)收集、學(xué)校調(diào)查、家庭調(diào)查和國家財務(wù)報告。美國的INES指標(biāo)數(shù)據(jù)大多來自美國人口普查局的人口調(diào)查、NCES通用核心數(shù)據(jù),NCES高等教育綜合數(shù)據(jù)系統(tǒng)以及NCES學(xué)校和人員調(diào)查。INES的數(shù)據(jù)庫主要呈現(xiàn)第三方監(jiān)測、多主體聯(lián)合監(jiān)測和三角架構(gòu)運行的特點[6],因此INES能夠保證評估的客觀性、評估指標(biāo)的實踐性以及組織的穩(wěn)定性。
2. PIRLS
PIRLS是在國際教育成就評價協(xié)會(IEA)的主持下,對四年級學(xué)生閱讀素養(yǎng)進行的評估。自2001年以來,由波士頓學(xué)院TIMSS和PIRLS國際學(xué)習(xí)中心指導(dǎo),每五年進行一次,被公認(rèn)為是評估四年級學(xué)生閱讀成就趨勢的全球標(biāo)準(zhǔn)[7]。該項目的監(jiān)測內(nèi)容包括學(xué)生的閱讀成績、閱讀行為和閱讀態(tài)度,并主要從閱讀目的、理解過程、閱讀行為和態(tài)度三個維度對檢測結(jié)果進行評估[8]。除閱讀評估外,PIRLS還通過向?qū)W校、教師、學(xué)生和家庭發(fā)放問卷以收集有關(guān)家庭和學(xué)校環(huán)境因素中有關(guān)閱讀教學(xué)的信息。NCES 2015年度國際教育績效指標(biāo)報告中的指標(biāo)主要借鑒了2011年、2006年和2001年的周期數(shù)據(jù)。
3. TIMSS
TIMSS是在IEA的主持下,對四年級和八年級學(xué)生在數(shù)學(xué)和科學(xué)方面的成就進行的國際評估。由波士頓學(xué)院TIMSS和PIRLS國際學(xué)習(xí)中心指導(dǎo),每四年進行一次,提供有關(guān)四年級和八年級學(xué)生在數(shù)學(xué)和科學(xué)方面表現(xiàn)的權(quán)威說明[9]。該項目的檢測內(nèi)容主要指向?qū)W生的數(shù)學(xué)和科學(xué)成就及其影響因素,并集中考察四年級和八年級學(xué)生對基本概念的掌握和推理應(yīng)用的情況[10]。參加多個TIMSS周期的國家可以監(jiān)測學(xué)生成績的趨勢,評估課程、教學(xué)和其他影響學(xué)習(xí)因素的變化。NCES 2015年度國際教育績效指標(biāo)報告中的指標(biāo)主要借鑒了2011年、2007年和1995年的周期數(shù)據(jù)。
4. PISA
PISA是由OECD主持的國際協(xié)作性教育評價項目,評估15歲學(xué)生利用其閱讀、數(shù)學(xué)和科學(xué)知識與技能來應(yīng)對現(xiàn)實生活中的挑戰(zhàn)的能力。從2000年開始,評估周期為3年,PISA 2018是第七輪評估。PISA測試用于評估學(xué)生在閱讀、數(shù)學(xué)和科學(xué)方面的知識和技能,每次評估選擇其一為主題,并對其他兩個方面進行匯總評估[11]。在過去的20年中,PISA已成為衡量各國中學(xué)生學(xué)習(xí)成果質(zhì)量、公平和效率的主要標(biāo)準(zhǔn),為各國的教育改革政策和智庫發(fā)展提供了重要參考。NCES 2015年度國際教育績效指標(biāo)報告中的指標(biāo)主要借鑒了2012年、2009年、2006年、2003年和2000年的數(shù)據(jù)。
5. PIAAC
PIAAC是OECD的一項新評估項目,重點測評成人能力,包括在技術(shù)豐富的環(huán)境中的讀寫、計算和解決問題的能力,目標(biāo)是評估和比較基本技能以及廣泛范圍內(nèi)世界各地成年人的能力。2011年,OECD首次面向24個國家和地區(qū)開展PIAAC,測量16~65歲的成人在關(guān)鍵信息加工技能上的水平及其在工作中的使用情況,并為各國制定技能戰(zhàn)略提供了大量翔實準(zhǔn)確的數(shù)據(jù),在國際上有著重要的影響力[12]。在PIAAC第一周期(2011—2018年)中,有39個國家/地區(qū)的經(jīng)濟體參加了評估,并分成三輪進行數(shù)據(jù)收集;PIAAC第二周期的評估將于2018—2023年舉行,有30多個國家/經(jīng)濟體參加。數(shù)據(jù)收集將于2021—2022年進行,結(jié)果將于2023年發(fā)布。[13]
二、NCES 2015年度
國際教育績效指標(biāo)報告結(jié)果
相較之過去的報告只覆蓋了八國集團(G8,即加拿大、法國、德國、意大利、日本、俄羅斯、英國和美國),2015年度的報告擴大了參與范圍,涵蓋了二十國集團(G20,即阿根廷、澳大利亞、巴西、加拿大、中國、法國、德國、印度、印度尼西亞、意大利、日本、墨西哥、韓國、俄羅斯、沙特阿拉伯、南非、土耳其、英國、美國和歐盟)。
NCES 2015年度的國際教育績效指標(biāo)報告由5大關(guān)鍵指標(biāo)構(gòu)成:人口和入學(xué)率、學(xué)習(xí)成績、學(xué)習(xí)環(huán)境、教育支出、教育回報。五個部分又劃分為不同的指標(biāo)(見表1)。
(一)人口和入學(xué)率
人口和入學(xué)率的指標(biāo)主要反映了受教育的人口和國家對教育的潛在需求。
從學(xué)齡人口來看,所有參與報告的G20國家學(xué)齡人口在總?cè)丝谥兴嫉谋壤加兴陆担@與各國總?cè)丝谠鲩L率高于學(xué)齡人口增長率有關(guān)。
從正規(guī)教育入學(xué)率來看,各國正規(guī)教育入學(xué)率存在顯著差異,并且不同階段的正規(guī)教育入學(xué)率也存在差異。學(xué)前教育階段,土耳其最低(12%),法國最高(99%);小學(xué)和初中階段,除俄羅斯(92%)和印度尼西亞(94%)外,其余國家入學(xué)率均在95%以上;高中教育階段,德國最高(92%),中國最低(34%);高等教育階段,澳大利亞最高(33%),印度尼西亞最低(10%)。在正規(guī)教育入學(xué)率指標(biāo)中,各國15~19歲的入學(xué)人數(shù)差異較大,反映了不同國家對于義務(wù)教育終止年齡的不同政策的影響。
從高等教育的國際學(xué)生(international students)①和外國學(xué)生(foreign students)②來看,國際學(xué)生入學(xué)率最高的是澳大利亞(20%),最低的是美國(3%,但國際學(xué)生的絕對數(shù)量最大);外國學(xué)生入學(xué)率較高的有法國(12%)和南非(7%),其余國家均低于5%。
(二)學(xué)習(xí)成績
學(xué)習(xí)成績的指標(biāo)主要反映了接受正規(guī)教育的學(xué)生在不同特定領(lǐng)域的成績表現(xiàn)和成績變化,以及成年人在不同技能領(lǐng)域的表現(xiàn),以考察G20國家學(xué)生和成年人在不同階段、不同領(lǐng)域內(nèi)學(xué)習(xí)的相對優(yōu)勢和劣勢。學(xué)習(xí)成績主要通過國際基準(zhǔn)的評價來體現(xiàn)不同階段學(xué)生所對應(yīng)的能力水平,國際基準(zhǔn)分為五個水平:低基準(zhǔn)以下、低基準(zhǔn)、中基準(zhǔn)、高基準(zhǔn)和先進基準(zhǔn)(見表2)。這部分的指標(biāo),不僅提供了同一階段學(xué)生在國際間的比較,也從總體上描述了學(xué)生在不同學(xué)科發(fā)展差異的共性規(guī)律。
從四年級學(xué)生的閱讀、數(shù)學(xué)和科學(xué)表現(xiàn)的指標(biāo)來看,韓國達(dá)到高基準(zhǔn)的學(xué)生最多,沙特阿拉伯沒有達(dá)到中基準(zhǔn)的學(xué)生最多。在八年級學(xué)生的數(shù)學(xué)和科學(xué)表現(xiàn)指標(biāo)中,從不同技能水平的學(xué)生分布占比來看,每個國家八年級學(xué)生在數(shù)學(xué)、科學(xué)技能上的差異顯著,且較四年級的差異更為明顯:沙特阿拉伯仍處于末位,韓國仍較靠前。
15歲學(xué)生的閱讀、數(shù)學(xué)和科學(xué)素養(yǎng)表現(xiàn)上,從整體上看,每個國家的15歲學(xué)生的閱讀、科學(xué)和數(shù)學(xué)素養(yǎng)的表現(xiàn)存在較為明顯的差異,低收入國家的學(xué)生表現(xiàn)處在末端,且各國技能水平的分布也有所不同。在閱讀方面,日本能力強的學(xué)生占比最高(24%),印度尼西亞能力弱的學(xué)生占比最高(55%)。在數(shù)學(xué)方面,韓國成績高的學(xué)生占比最高(31%),而阿根廷、巴西和墨西哥只占不到1%。除了各國15歲學(xué)生的表現(xiàn)存在差異外,各國的數(shù)學(xué)技能水平分布也有所不同。德國雖然達(dá)到高水平的學(xué)生有17%,排在第三,但其處于低水平的學(xué)生仍有18%。在科學(xué)素養(yǎng)方面,能力強的學(xué)生占比較高的仍為日本(18%),最低的仍是阿根廷、巴西和墨西哥(不到1%)。
在技術(shù)含量高的環(huán)境中成人主要技能表現(xiàn)指標(biāo)中,各國成人在讀寫、算術(shù)和解決問題上的表現(xiàn)存在差異,日本的表現(xiàn)最為突出。
(三)學(xué)習(xí)環(huán)境
學(xué)習(xí)環(huán)境指標(biāo)主要反映了不同性別的學(xué)生對于不同學(xué)科的學(xué)習(xí)態(tài)度,即學(xué)習(xí)興趣和學(xué)習(xí)動機的差異以及教師的行為和態(tài)度。
在學(xué)習(xí)態(tài)度的性別差異指標(biāo)中,從總體上看,學(xué)生的學(xué)習(xí)態(tài)度在不同學(xué)科上存在著較明顯的性別差異,女生在閱讀上的興趣、動機和信心高于男生,男生在數(shù)學(xué)和科學(xué)上的興趣高于女生。在閱讀方面,所有G20國家的四年級女生喜歡閱讀的比例均高于男生;在數(shù)學(xué)方面,除俄羅斯、英國(英格蘭和北愛爾蘭)和美國外,其余參與國四年級男生喜歡數(shù)學(xué)的比例均高于女生,八年級和15歲學(xué)生的結(jié)果也是如此;在科學(xué)方面,大部分國家的四年級和八年級學(xué)生中喜歡科學(xué)的男生比例高于女生。
教師教學(xué)策略的指標(biāo),主要通過教師對學(xué)生學(xué)習(xí)的協(xié)助和教師自身合作與發(fā)展進行考察(見表3)。結(jié)果顯示,在四年級教師協(xié)助閱讀困難學(xué)生的策略方面,參與國的教師主要選擇前兩種教學(xué)策略。在數(shù)學(xué)教學(xué)策略方面,該指標(biāo)用四年級和八年級數(shù)學(xué)教師在不同方面的互動頻率來反映合作程度,以此考察協(xié)作改善教學(xué)的程度:有時合作、合作、非常合作。達(dá)到“非常合作”程度教師最多的國家是美國(49%),最低的是沙特阿拉伯(16%)。在教師專業(yè)發(fā)展方面,四年級教師參與比例最高的是俄羅斯,八年級教師參與比例最高的是美國,意大利和土耳其的八年級教師參與專業(yè)發(fā)展的比例均低于50%,明顯低于G20的其他國家。從總體來看,八年級教師參與專業(yè)發(fā)展的比例高于四年級,顯示了高年級的教師主動參與專業(yè)發(fā)展的需求和訴求更高。
(四)教育支出
教育支出的指標(biāo)主要從公立學(xué)校教師起薪和每名學(xué)生的公共和私人教育支出以及年度教育支出的變化中反映教育投入。
從公立學(xué)校教師的起薪來看,公立小學(xué)和初中教師、高中教師平均起薪最高的是德國,分別為4.7萬美元和5.74萬美元,其次是美國,分別為3.76萬美元和3.8萬美元;最低的是印度尼西亞,分別為1600美元和2000美元。此外,指標(biāo)中還提供了公立學(xué)校教師的平均起薪與人均國內(nèi)生產(chǎn)總值(GDP)之比,結(jié)果反映,大多數(shù)G20國家公立教師的起薪低于該國的平均收入水平。
在年度教育支出指標(biāo)上,各國存在明顯差異,這與每個國家的總體經(jīng)濟產(chǎn)出存在正相關(guān)關(guān)系。從整體看,每個國家的年度教育支出變化呈穩(wěn)定或增長的趨勢,且所有提供數(shù)據(jù)的G20國家在中小學(xué)階段的教育支出占國內(nèi)生產(chǎn)總值的比例高于高等教育階段的教育支出。
(五)教育回報
教育回報部分指標(biāo)主要反映了G20國家成年人的教育程度,以及教育與就業(yè)、收入的關(guān)系,還探討了性別在學(xué)歷上的差異及其與就業(yè)、收入的關(guān)系。
按性別劃分的畢業(yè)率指標(biāo)結(jié)果顯示,畢業(yè)率相對較高的國家,男女之間的差異相對較小,男女之間畢業(yè)率差異較大的是美國和墨西哥。在博士研究生教育以下的學(xué)術(shù)型高等教育中,除了日本和土耳其,其余國家的女性畢業(yè)率均高于男性。
在成年人受教育程度的指標(biāo)上,各國成年人的受教育程度存在明顯差異,這與國家經(jīng)濟發(fā)展水平相關(guān)。在勞動年齡人口(25~64歲)中,接受高等教育比例最高的是俄羅斯(53%),最低的是中國(4%);接受高中教育比例最高的是德國(59%),最低的是土耳其(18%);接受初中及以下教育比例最高的是中國(78%)。
在就業(yè)率方面,G20國家都表現(xiàn)出了就業(yè)率隨接受教育程度的升高而增加的現(xiàn)象,表明就業(yè)率與受教育水平存在高度相關(guān)。在性別方面,男性的就業(yè)率普遍比女性高。
在按教育和收入劃分的人口分布上,調(diào)查以25~64歲群體為研究對象,將其受教育程度與高于中等收入的人口比例進行關(guān)系反映,結(jié)果呈現(xiàn)收入隨受教育水平提高而提高的趨勢(見表4)。
三、NCES 2015年度
國際教育績效指標(biāo)報告的特點
(一)評價覆蓋的全面性
2015年度國際教育績效指標(biāo)報告評價覆蓋的全面性主要體現(xiàn)在參與國家的范圍、教育績效指標(biāo)的選擇以及評價主體這三個方面。
1.參與國范圍的全面性
NCES 2015年度國際教育績效指標(biāo)與往年一個最大的不同在于此次評價的參與方從最初的G8擴大到G20。這20個國家/集團被認(rèn)為在世界上工業(yè)化程度最高,并且經(jīng)濟發(fā)展相似[14],從數(shù)量上和性質(zhì)上都有利于保證教育績效評價比較的國際參考價值。
2.教育績效評價指標(biāo)的全面性
在NCES 2015年度國際教育績效指標(biāo)報告中,除了五個關(guān)鍵指標(biāo)外,每個關(guān)鍵指標(biāo)下都劃分了子指標(biāo),如學(xué)習(xí)成績指標(biāo)下還劃分了不同年級在不同學(xué)科上的成績表現(xiàn),教育投入指標(biāo)下又從公立學(xué)校教師起薪和年度教育支出變化兩個方面考察,更加具體準(zhǔn)確地報告各國的教育情況。同時,教育績效評價指標(biāo)涵蓋了教育的背景、投入、過程以及產(chǎn)出,評價指標(biāo)的覆蓋范圍具有全面性。
3.教育績效評價主體的全面性
從教育過程看,教育績效評價涉及的主體包含了教育中最主要的兩個主體,即從學(xué)生和教師兩個主體的各個方面來進行教育評價,比如考察學(xué)生在不同學(xué)科的學(xué)習(xí)成績表現(xiàn),考察教師幫助學(xué)生學(xué)習(xí)的策略、合作教學(xué)、自身專業(yè)發(fā)展等,同時也包含了教與學(xué)這兩個方面。從教育的不同階段來看,評價主體不僅包括正處在教育過程中的學(xué)生,還包括完成正規(guī)教育后的成人,從個體成長階段上體現(xiàn)了評價主體的全面性。
(二)報告的客觀性
從數(shù)據(jù)的來源上看,NCES 2015年度國際教育績效指標(biāo)報告的數(shù)據(jù)均來自第三方,并且數(shù)據(jù)源多樣,比如INES、PIRLS、TIMSS、PISA、PIAAC和OECD的數(shù)據(jù)庫。通過第三方的數(shù)據(jù),并且綜合多個較有權(quán)威性的國際評價項目,有利于報告的客觀性和教育的國際比較。從NCES機構(gòu)的設(shè)置上看,NCES 既隸屬于聯(lián)邦教育部,又相對獨立于聯(lián)邦教育部,進而為其統(tǒng)計活動免受聯(lián)邦教育部的直接干預(yù),保持中立性和客觀性提供了行政保障[15]。同時,NCES實行了“統(tǒng)計標(biāo)準(zhǔn)計劃”(Statistical Standards Program),該計劃制定統(tǒng)計和分析產(chǎn)品質(zhì)量的標(biāo)準(zhǔn),審查中心產(chǎn)品,協(xié)調(diào)NCES統(tǒng)計標(biāo)準(zhǔn)的修訂并發(fā)起、監(jiān)督或參與長期的統(tǒng)計和方法研究項目[16]。數(shù)據(jù)的來源、機構(gòu)的設(shè)置以及相應(yīng)的職能都保證了NCES國際教育績效指標(biāo)報告的科學(xué)性、獨立性和客觀性。
(三)評價維度的多樣性和層次性
在NCES 2015年度的報告中,教育績效評價包含了知識與技能,過程與方法,情感、態(tài)度和價值觀這三個維度的評價,使得教育績效的評價不僅僅停留在最基本的知識層面,而更具多樣性和層次性。一是量化的成績和分?jǐn)?shù)表現(xiàn),比如四年級、八年級、15歲學(xué)生在閱讀、數(shù)學(xué)和科學(xué)方面的成績,以及成人在讀寫、算術(shù)和解決問題能力上的考察,這一層面是知識與技能維度的評價;二是在教育過程中教師的教學(xué)策略和方法考察,比如四年級教師協(xié)助閱讀困難學(xué)生的策略、教師進行教學(xué)合作等指標(biāo),這一層面是過程與方法維度的評價;三是學(xué)生和教師態(tài)度方面的考察,比如學(xué)生的學(xué)習(xí)動機和學(xué)習(xí)興趣,以及教師的工作滿意度等,這一層面是情感、態(tài)度和價值觀維度的評價。這三個維度評價的結(jié)合,使得對于教育績效的評價更加具體、科學(xué)和立體。
(四)評價標(biāo)準(zhǔn)注重適用性和針對性相結(jié)合
評價標(biāo)準(zhǔn)的適用性體現(xiàn)在運用同一國際評價基準(zhǔn)來評價所有的參與國,比如在評價四年級學(xué)生數(shù)學(xué)成績表現(xiàn)時,利用TIMSS根據(jù)學(xué)生不同數(shù)學(xué)水平統(tǒng)一劃分的國際基準(zhǔn)進行考察。
評價標(biāo)準(zhǔn)的針對性體現(xiàn)在對于不同階段、不同考核領(lǐng)域具有不同的、具體的標(biāo)準(zhǔn)。比如,四年級數(shù)學(xué)成績表現(xiàn)的評價標(biāo)準(zhǔn)和科學(xué)成績表現(xiàn)的評價標(biāo)準(zhǔn)不同;在數(shù)學(xué)成績表現(xiàn)的評價內(nèi),不同能力水平有具體的可參照的不同標(biāo)準(zhǔn);在科學(xué)成績領(lǐng)域,四年級的評價標(biāo)準(zhǔn)又和八年級的不同。這種適用性和針對性相結(jié)合的評價標(biāo)準(zhǔn),有利于具體、有效的進行客觀的教育國際比較。
(五)評價指標(biāo)的靜態(tài)性和動態(tài)性相結(jié)合
評價指標(biāo)的靜態(tài)性體現(xiàn)在某一確定時間點的某個指標(biāo)評價,比如四年級學(xué)生在2001年的數(shù)學(xué)成績表現(xiàn)。評價指標(biāo)的動態(tài)性體現(xiàn)在某個時間段內(nèi)某個指標(biāo)評價結(jié)果的變化,比如四年級學(xué)生的數(shù)學(xué)成績變化,主要是通過2011年的成績和2006年、2001年成績表現(xiàn)進行對比而得出的。重視歷史數(shù)據(jù)的縱向比較和同期數(shù)據(jù)的橫向比較,指標(biāo)既反映了歷史的延續(xù)性又具有國際可比性[17]。評價指標(biāo)靜態(tài)性和動態(tài)性的結(jié)合,使報告不僅能反映某個時間點的成績表現(xiàn),還能反映成績表現(xiàn)的變化,由此可以更加準(zhǔn)確地分析教育發(fā)揮的作用。
(六)關(guān)注性別在教育中的差異以及影響
在衡量教育產(chǎn)出結(jié)果的時候,很多指標(biāo)其實不僅受教育投入和過程的影響,還有很多其他因素,而報告當(dāng)中關(guān)注到了性別差異這一重要因素。報告中關(guān)注性別差異在教育過程和教育回報中都有所體現(xiàn),比如在關(guān)注學(xué)生對于閱讀和數(shù)學(xué)的學(xué)習(xí)動機以及學(xué)習(xí)興趣時,在關(guān)注勞動年齡人口的畢業(yè)率和就業(yè)率時,都關(guān)注了性別差異這一因素,從而為我們對教育績效的評定提供了一個重要而特別的視角。
四、啟示
2000年的達(dá)喀爾世界教育論壇推動了基礎(chǔ)教育質(zhì)量監(jiān)測在世界范圍內(nèi)的開展。2015年世界教育論壇通過的《仁川宣言》進一步強調(diào)了基礎(chǔ)教育的重要性,發(fā)展有質(zhì)量的基礎(chǔ)教育、推動基礎(chǔ)教育質(zhì)量監(jiān)測,是世界教育改革發(fā)展的大趨勢。中共中央、國務(wù)院印發(fā)的《中國教育現(xiàn)代化2035》中指出“構(gòu)建教育質(zhì)量評估監(jiān)測機制”“建立全過程、全方位人才培養(yǎng)質(zhì)量反饋監(jiān)控體系”。2015年,我國發(fā)布《國家義務(wù)教育質(zhì)量監(jiān)測方案》,義務(wù)教育質(zhì)量監(jiān)測制度正式建立,體現(xiàn)了黨和國家對基礎(chǔ)教育質(zhì)量監(jiān)測工作的高度重視。我國的教育績效評價體系正處在起步和發(fā)展階段,還需要各國各類實踐經(jīng)驗的借鑒和指導(dǎo)。NCES國際教育績效指標(biāo)報告體系較為完備,其教育績效評價體系值得我國參考。
(一)從國家層面上建立科學(xué)、可持續(xù)的教育績效評價指標(biāo)體系和監(jiān)測制度
美國教育評價體系以NAEP為依托,發(fā)展至今,體系較為完備,而NCES國際教育績效指標(biāo)報告也不斷發(fā)展完善,并且進行周期性發(fā)布。我國的教育績效評價體系可以借鑒此經(jīng)驗,綜合考慮以下幾個方面因素,建立可持續(xù)的教育績效評價體系和監(jiān)測制度。
1.注重指標(biāo)的全面性
指標(biāo)的全面性是指所建立的指標(biāo)體系應(yīng)覆蓋較廣泛的范圍、階段和主體。在我國,傳統(tǒng)的教育評價往往只關(guān)注于學(xué)校、學(xué)生成績,存在著單一化和片面化的傾向。而教育的過程不僅包含學(xué)生成績,還應(yīng)包含教育背景以及教育過程中的其他方面,通過指標(biāo)來分析當(dāng)前人口、社會、經(jīng)濟發(fā)展與教育的關(guān)系,從而使教育決策在社會大背景下合理定位教育的發(fā)展規(guī)模、速度和職能[18]。因此,指標(biāo)的設(shè)立不僅要涵蓋教育的投入、過程以及產(chǎn)出,在主體上還要涵蓋教師和學(xué)生以及社會各方群體,在教育階段上要涵蓋學(xué)前教育、小學(xué)教育、中等教育以及高等教育。
2.注重指標(biāo)的特殊性
指標(biāo)的特殊性是指針對教育評價中的不同階段、不同對象和不同領(lǐng)域采用針對性的評價指標(biāo)。指標(biāo)的特殊性要求對各個所要評價的對象有全面和深刻的了解,進而制定出具有可操作性、有測量價值的指標(biāo),比如根據(jù)學(xué)生不同年齡階段的認(rèn)知水平和能力建立不同的適應(yīng)性指標(biāo),根據(jù)不同的學(xué)科領(lǐng)域所需要掌握的技能和方法建立不同的針對性指標(biāo)等。
3.開發(fā)多元的評價項目
教育在不同領(lǐng)域、不同階段的目標(biāo)是不同的,教育的不同目標(biāo)又反映了不同主體的利益訴求,因此教育質(zhì)量的監(jiān)測也應(yīng)是多元的。只有設(shè)計多種評價項目才能滿足不同主體的需求,真正體現(xiàn)監(jiān)測制度對于實現(xiàn)教育管理從粗放到精細(xì)、從基于經(jīng)驗到基于實證轉(zhuǎn)變的促進作用,從而為國家教育質(zhì)量的可持續(xù)發(fā)展提供保障[19]。因此,我國應(yīng)開發(fā)多元的教育評價項目,不僅要開發(fā)基本的教育教學(xué)質(zhì)量和成效的評價,更要有從社會大背景下考察教育評價;不僅有定性的成績評價,還要有成績與學(xué)習(xí)動機、態(tài)度相結(jié)合的定量與定性相結(jié)合的評價;不僅有橫向的評價,還要有深度追蹤的縱向評價。通過開發(fā)多維度、多種類的評價項目,從不同方面來滿足各類群體對教育數(shù)據(jù)的需求。
(二)建立嚴(yán)謹(jǐn)科學(xué)的教育統(tǒng)計標(biāo)準(zhǔn)和監(jiān)測審查制度
NCES的產(chǎn)品從最初設(shè)計到最終分析都會受到來自 NCES、教育科學(xué)研究所(IES)和教育社區(qū)的統(tǒng)計專家及議題專家嚴(yán)格的技術(shù)審查[20]。例如,最初教育評價指標(biāo)的選擇與設(shè)計應(yīng)具有適用性與嚴(yán)密性;統(tǒng)計工具以及手段的選擇應(yīng)具有科學(xué)性與可行性;數(shù)據(jù)采集應(yīng)有具體、統(tǒng)一的標(biāo)準(zhǔn);教育統(tǒng)計工作過程應(yīng)具有相應(yīng)的規(guī)范性;對于采集數(shù)據(jù)的分析、解讀以及產(chǎn)品的開放與報告都應(yīng)由專業(yè)人士進行監(jiān)督和審查。建立嚴(yán)謹(jǐn)科學(xué)的教育統(tǒng)計標(biāo)準(zhǔn)和審查制度,有利于為收集、分析和報告數(shù)據(jù)提供有效的指導(dǎo),并對產(chǎn)品進行嚴(yán)格審查,以保證數(shù)據(jù)的高質(zhì)量和可靠性。我國的教育績效評價制度應(yīng)不斷改進統(tǒng)計的方法和標(biāo)準(zhǔn),并對收集的數(shù)據(jù)和統(tǒng)計結(jié)果進行嚴(yán)格的審查,以確保數(shù)據(jù)的真實性和有效性。
(三)增強教育信息數(shù)據(jù)的服務(wù)性
NCES的指標(biāo)數(shù)據(jù)用途廣泛,可以為國家了解教育系統(tǒng)狀況、制定教育規(guī)劃方案、配置教育資源,為學(xué)術(shù)機構(gòu)提供規(guī)劃和研究,為學(xué)校和地區(qū)提供橫向比較,為媒體、公眾了解教育情況等提供重要的數(shù)據(jù)基礎(chǔ),同時以多種形式發(fā)布研究結(jié)果和信息,包括數(shù)據(jù)工具、數(shù)據(jù)文件、報告、表格、圖表、問卷、發(fā)布的項目和博客文章[21]。借鑒NCES的經(jīng)驗,我國在建立教育信息數(shù)據(jù)庫的時候可以增強數(shù)據(jù)的服務(wù)功能,通過“互聯(lián)網(wǎng)+教育”的數(shù)據(jù)平臺,為各方提供所需的教育數(shù)據(jù)。例如,首先為學(xué)校教育提供數(shù)據(jù),促進教育信息技術(shù)與實際教育教學(xué)深度融合發(fā)展,同時為具體的課程教學(xué)和學(xué)??傮w教育改革提供數(shù)據(jù)依據(jù);其次,為國家層面的政府機構(gòu)在進行教育評估和教育決策時提供數(shù)據(jù)指導(dǎo),以保證評估的客觀性和決策的科學(xué)性;最后,增強教育信息數(shù)據(jù)的國際服務(wù)性,通過國際間教育數(shù)據(jù)的互通與共享,加強國際間教育的交流與相互促進,同時增強我國教育文化的國際影響力與競爭力。
(四)教育績效評價應(yīng)堅持本土化和國際化相結(jié)合的原則
在NCES 2015年度國際教育績效指標(biāo)報告中,有部分指標(biāo)缺乏中國的數(shù)據(jù),特別是缺少我國整體的教育數(shù)據(jù),如我國四年級學(xué)生的閱讀、數(shù)學(xué)和科學(xué)表現(xiàn),八年級學(xué)生的數(shù)學(xué)和科學(xué)表現(xiàn),15歲學(xué)生的閱讀、數(shù)學(xué)和科學(xué)素養(yǎng)表現(xiàn)只提供了部分地區(qū)的測評數(shù)據(jù),而它并不能作為整個國家的成績表現(xiàn)。我們應(yīng)更加積極地參與國際性教育評價項目,同時,也應(yīng)該構(gòu)建我國本土的、符合中國特色社會主義制度的教育績效指標(biāo)評價體系。構(gòu)建本土化的教育績效評價體系的出發(fā)點,一在于國情,二在于創(chuàng)新。NCES的機構(gòu)設(shè)置、資金投入、評估過程,都符合美國的行政機構(gòu)設(shè)置和教育管理制度。對于我國而言,教育是由國家統(tǒng)一協(xié)調(diào)、安排和支持的,結(jié)合我國的國情特點以及教育評價傳統(tǒng)建立的教育績效評價體系更具有適用性和針對性。同時,我國本土化與國際化相結(jié)合的教育評價體系,也是對國際上教育評價體系的創(chuàng)新,對于其他國家的教育改革也具有一定的借鑒意義。此外,通過我國的教育績效評價體系和監(jiān)測制度收集我國有關(guān)教育數(shù)據(jù),再進行國際比較,能夠更直觀地突顯我國與其他各國的比較優(yōu)勢和問題所在。
(五)重視性別和地區(qū)差異因素
2015年聯(lián)合國可持續(xù)發(fā)展峰會發(fā)布的《變革我們的世界:2030年可持續(xù)發(fā)展議程》中提到,“要確保包容和公平的優(yōu)質(zhì)教育”“實現(xiàn)性別平等,增強所有婦女和兒童的權(quán)利”;NCES 2015年度國際教育績效指標(biāo)報告中也關(guān)注了教育領(lǐng)域中性別這一重要因素。同時,我國幅員遼闊,各地域的經(jīng)濟水平不一,文化傳統(tǒng)也存在著地區(qū)差異,教育發(fā)展水平差異很大。在我國推進教育績效指標(biāo)評價時,應(yīng)關(guān)注各地區(qū)的教育差異,考察各地區(qū)的教育實際情況。在我國教育績效評價指標(biāo)的建立中,也應(yīng)關(guān)注性別因素和地區(qū)差異,促進教育的性別公平和區(qū)域公平,發(fā)展公平、優(yōu)質(zhì)的教育。
注釋:
①國際學(xué)生是指為了學(xué)習(xí)而離開其原籍國(即他們接受先前教育的地方)的學(xué)生。
②外國學(xué)生是指不是所在國家公民,但可能是長期居民或出生在該國家的學(xué)生。
參考文獻(xiàn):
[1]NCES.NAEP assessments[EB/OL].(2020-04-16)[2020-07-14].https://nces.ed.gov/nationsreportcard/assessments/.
[2][3]NCES.About us[EB/OL].[2020-02-05].https://nces.ed.gov/about/.
[4][20]左明章,鄧果,李莎莎.美國國家教育統(tǒng)計中心對我國教育基礎(chǔ)信息數(shù)據(jù)庫建設(shè)的啟示[J].中國電化教育,2012(8):30-34.
[5][6]李桂榮,尤莉.試析經(jīng)濟合作與發(fā)展組織基礎(chǔ)教育發(fā)展監(jiān)測機制[J].比較教育研究,2016,38(5):50-55.
[7]PIRLS.Progress in International Reading Literacy Study[EB/OL].[2020-02-16].https://www.iea.nl/index.php/studies/iea/pirls.
[8][10]劉建偉.國際組織開展基礎(chǔ)教育質(zhì)量監(jiān)測評估項目的經(jīng)驗及其啟示[J].教學(xué)與管理,2019(33):114-116.
[9]TIMSS.Trends in International Mathematics and Science Study[EB/OL].[2020-02-16].https://www.iea.nl/index.php/studies/iea/timss.
[11]OECD.PISA2018 insights and interpretations[DB/OL].(2019-12-04)[2020-02-16].http://www.oecd.org/pisa/PISA%202018%20Insights%20and%20Interpretations%20FINAL%20PDF.
[12]董甜園,王正青.國際成人能力評估項目(PIAAC)的調(diào)查框架與結(jié)果分析[J].職教論壇,2017(3):66-71.
[13]OECD.Survey of Adult Skills:About PIAAC 2nd Cycle[EB/OL].[2020-02-16].http://www.oecd.org/skills/piaac/about/piaac2ndcycle/.
[14]NCES.Introduction[EB/OL].(2016-12-01)[2020-04-12].https://nces.ed.gov/pubs2016/2016100/intro.asp.
[15]吳旻瑜,郭海駿,盧蓓蓉,等.美國國家教育統(tǒng)計中心對我國教育管理信息化建設(shè)的啟示[J].世界教育信息,2014,27(3):13-19.
[16]NCES.Statistical Standards Program[EB/OL].[2020-08-20].https://nces.ed.gov/statprog/.
[17]任曉輝.美國教育統(tǒng)計和指標(biāo)體系探究[J].高等教育與學(xué)術(shù)研究,2006(1):172-175.
[18]曹榮軍.1999-2007年度美國教育指標(biāo)體系特征及啟示[J].現(xiàn)代教育管理,2009(2):95-97.
[19]李凌艷,蔡靜,鄭巧.美國國家基礎(chǔ)教育質(zhì)量監(jiān)測制度設(shè)計及啟示[J].比較教育研究,2016,38(5):43-49.
[21]IAP.About NCES role in U.S. participation[EB/OL]. [2020-04-30].https://nces.ed.gov/surveys/international/about-nces-role.asp.
編輯 朱婷婷? ?校對 王亭亭