摘 ? 要:開展大規(guī)模有組織教育評價是促進教育發(fā)展、提高教育質(zhì)量的重要途徑,而我國目前相關(guān)的理論研究和實踐案例相對較少。文章通過分析PISA的形成與發(fā)展、指標的更新與完善,分析PISA的運行機制,發(fā)現(xiàn)PISA具有從人力資本理論出發(fā)建立觀測維度、基于現(xiàn)代化標準構(gòu)建評價指標體系、呈現(xiàn)國際教育質(zhì)量評價結(jié)果與參考標準等程序與步驟。我國可加強現(xiàn)有大規(guī)模教育評價研究平臺與資源的整合、提升大規(guī)模教育評價的科學性和規(guī)范性、堅持中國特色的大規(guī)模教育評價價值理念、促進現(xiàn)代信息技術(shù)與大規(guī)模教育評價的緊密融合。
關(guān)鍵詞:大規(guī)模 有組織 教育評價 運行機制 PISA
中共中央、國務(wù)院印發(fā)的《深化新時代教育評價改革總體方案》提出:“系統(tǒng)推進教育評價改革。堅持科學有效,改進結(jié)果評價,強化過程評價,探索增值評價,健全綜合評價?!边M入新時代,在推進教育高質(zhì)量發(fā)展與建設(shè)高質(zhì)量教育體系的背景下,提高教育評價的科學性、專業(yè)性、客觀性尤為重要。在過去的半個世紀,國外關(guān)于大規(guī)模有組織的教育評價不斷發(fā)展。以國際學生評估項目(PISA)為例,其開展20多年來,對參與國家和地區(qū)產(chǎn)生重要影響。PISA發(fā)起的原因主要是發(fā)達國家對基礎(chǔ)教育質(zhì)量的反思以及應(yīng)對知識社會、信息社會和經(jīng)濟全球化帶來新挑戰(zhàn)的需要。[1]后來經(jīng)過經(jīng)濟合作與發(fā)展組織(OECD)的大力支持與推動,PISA在世界范圍內(nèi)得到廣泛的認同與支持,其為全球基礎(chǔ)教育發(fā)展作出重要貢獻,也可為我國開展大規(guī)模有組織教育評價提供借鑒。
一、大規(guī)模有組織教育評價要義
克隆巴赫在20世紀60年代提出:“評價是一個搜集和報告對課程研制有指導(dǎo)意義的信息的過程”。[2]我國學者認為,教育評價是依據(jù)社會的需要對教育活動的“社會價值”進行判斷的活動。[3]從本質(zhì)上來說,評價是一種價值判斷的活動,是對客體滿足主體需要程度的判斷。教育評價是對教育活動滿足社會與個體需要的程度做出判斷的活動,是對教育活動現(xiàn)實的或潛在的價值做出判斷,以期達到教育價值增值的過程。例如,評價教師的工作就是對教師是否對社會作出了貢獻、做出多大貢獻的一個價值判斷,教師評價的目的是進一步促進教學和教育質(zhì)量的提高,使教師的工作產(chǎn)生更大的價值。[4]在教育評價的各種界定中,美國學者格朗蘭德在1971年提出的表述十分值得注意。格朗蘭德認為,評價可以簡單地用下列公式表述:評價=測量(量的記述)或非測量(質(zhì)的記述)+價值判斷。[5]即評價是在量(或質(zhì))的記述的基礎(chǔ)上進行價值判斷的活動。
相對于國家內(nèi)某一區(qū)域或某一學校的教育評價而言,本文探討的大規(guī)模有組織評價的覆蓋范圍更廣、樣本數(shù)量更大,是在官方組織或第三方機構(gòu)的領(lǐng)導(dǎo)協(xié)調(diào)下開展的教育評價。自20世紀90年代開始,國際教育成就評價協(xié)會(IEA)、OECD等國際組織開始實施大規(guī)模有組織國際教育評價。國際組織開展的大規(guī)模教育評價往往致力于服務(wù)政府的教育決策、績效問責,推動區(qū)域教育治理,創(chuàng)設(shè)“全球教育政策空間”。[6]隨著國際大規(guī)模有組織教育評價的開展,也有部分學者對其持批評意見,認為其誤導(dǎo)教育者將可測量的教育結(jié)果當成教育目的,以國際大規(guī)模教育評價結(jié)果為指揮棒所定義的“好教育”其實并非真正的好教育。[7]
二、PISA的發(fā)展歷程
20世紀90年代以后,在全球開展大規(guī)模有組織教育評價受到越來越多發(fā)達國家的關(guān)注與研究。OECD、世界銀行、聯(lián)合國教科文組織等國際組織開始關(guān)注全球教育評價與基礎(chǔ)教育的國別比較研究。
(一)產(chǎn)生與發(fā)展
PISA于1995年首次提出,OECD成員國希望能夠通過大規(guī)模有組織的教育評價,及時掌握關(guān)于各國基礎(chǔ)教育階段學生在技能學習、日常表現(xiàn)、知識掌握等方面的可靠一手調(diào)查資料和數(shù)據(jù)。PISA應(yīng)用信息化教育測量手段對相關(guān)國家和地區(qū)基礎(chǔ)教育階段學生的數(shù)學、閱讀、科學的學習情況進行測評,采用調(diào)查問卷對學生學業(yè)情況組織大規(guī)模的評價,并以此為依據(jù)對參評國家的基礎(chǔ)教育發(fā)展水平進行排名,得出相應(yīng)的結(jié)論,進行國際比較。[8]OECD開展PISA主要是對基礎(chǔ)教育階段高年級學生的知識掌握和解決問題能力等方面進行系統(tǒng)評估,以此評價學生在階段性學習之后各方面能力的提升情況。因此,PISA不只是對學生掌握階段性知識程度的評估,還是綜合學生多項學習能力的過程性評價。1997年底,OECD正式啟動PISA,2000年在部分國家和地區(qū)進行了首輪測評,之后按照每三年一輪的頻率在相關(guān)國家和地區(qū)開展測評。每輪測評的參評國家和地區(qū)從科學、閱讀、數(shù)學三門學科中選擇一門進行主要測評,另外兩門作為次要測評。PISA在標準的制定、測評的方法、評估的理念等層面凸顯出科學規(guī)范的價值內(nèi)涵,在全球范圍內(nèi)得到廣泛的認可。
2000年以來,PISA通過對不同國家和地區(qū)的學生在學習能力素養(yǎng)方面的表現(xiàn)和水平進行排名,呈現(xiàn)不同國家和地區(qū)的學生在科學、閱讀、數(shù)學學科領(lǐng)域的學習發(fā)展水平。與此同時,OECD基于學生學習的背景情況,在與相關(guān)學生學業(yè)素養(yǎng)的指標之間構(gòu)建統(tǒng)計模型,開展相關(guān)性分析。OECD還基于人力資本理論,通過分析教育投入與產(chǎn)出的相關(guān)性,判斷國家和地區(qū)教育發(fā)展的總體水平及其在全球的競爭力,這種測評打破了傳統(tǒng)的以理性思辨進行評價分析的方法,開創(chuàng)了以建立統(tǒng)計模型和開發(fā)監(jiān)測指標為主要評價手段的實證主義評估。
(二)指標的更新與完善
教育評價工作是各國教育改革發(fā)展工作的重中之重,相關(guān)測評數(shù)據(jù)的分析可以支撐教育政策的制定、執(zhí)行和完善。同時,指標體系的研發(fā)對于教育數(shù)據(jù)的監(jiān)測至關(guān)重要,可通過量化的形式讓決策者和研究者了解教育發(fā)展的現(xiàn)狀。對于PISA而言,測評指標的更新和完善可為評估的科學性打下良好的基礎(chǔ),科學系統(tǒng)的評價指標體系可為教育部門和教育研究者研判教育發(fā)展狀況、了解教育發(fā)展存在的問題和困境以及做出相應(yīng)的決策提供支持與幫助。PISA1997年確定了采集成員國和地區(qū)學生數(shù)學、閱讀、科學三個方面的指標數(shù)據(jù)。之后,PISA的價值內(nèi)涵和目標也在變化,越來越關(guān)注評估教育與社會發(fā)展的關(guān)系以及學生適應(yīng)現(xiàn)代社會發(fā)展所需能力,從而引領(lǐng)學生適應(yīng)時代發(fā)展新變化帶來的對于人的生活技能的新需求。例如,2015年增加對同伴協(xié)作解決問題能力的相關(guān)測試;2018年,為評估學生是否具有從不同視角看問題、理解跨文化背景下的不同思想并有效交流互動等方面的能力,增加了全球勝任力指標。近年來,PISA開始逐步關(guān)注學生微觀層面能力的測評,如幸福感、對學校的歸屬感等。
三、PISA運行機制
面對新時代對人才培養(yǎng)的新要求和新挑戰(zhàn),加強對教育系統(tǒng)質(zhì)量的實時、有效監(jiān)控尤為重要[9],通過數(shù)據(jù)監(jiān)測推動教育高質(zhì)量發(fā)展受到各國教育關(guān)注。
基于舒爾茨的人力資本理論,OECD通過PISA對全球一些國家和地區(qū)的教育質(zhì)量進行大規(guī)模評估,建構(gòu)了評價標準和相關(guān)指標,為這些國家評估教育發(fā)展質(zhì)量以及教育決策和政策制定提供支撐。
(一)從人力資本理論出發(fā)建立觀測維度
有學者就OECD關(guān)于教育指標維度的建立進行了研究,認為OECD測評的理論基礎(chǔ)是“人力資本理論”,也就是說其評估的邏輯起點在于將學生作為重要的人力資源。這種邏輯與價值觀念關(guān)注教育對促進經(jīng)濟社會發(fā)展的貢獻度。從教育與經(jīng)濟的關(guān)系來看,教育可以從三個方面促進經(jīng)濟增長。一是教育可以提高個體單位時間的勞動生產(chǎn)率,從而提升固有的人力資本,以此推動單位時間產(chǎn)出水平的快速增長。二是通過發(fā)展教育推動科技創(chuàng)新,以此推動經(jīng)濟發(fā)展的更新?lián)Q代,通過教育研究促進生產(chǎn)技術(shù)的更新,同時帶動知識的創(chuàng)新。三是教育可以促進文化知識的傳遞和傳播,以此提升人們使用新產(chǎn)品的價值取向和不斷增長的新需求,從而推動經(jīng)濟的快速增長。哈努謝克(Hanushe)等人運用PISA的相關(guān)數(shù)據(jù),通過使用增長評估模型預(yù)測教育發(fā)展與經(jīng)濟增長之間的關(guān)系。[10]其研究表明,經(jīng)濟增長與教育質(zhì)量的提升有明顯正相關(guān)性。基于PISA結(jié)果可以發(fā)現(xiàn),數(shù)學、科學等學科的指標測評對于經(jīng)濟發(fā)展有顯著正相關(guān)性。
(二)基于現(xiàn)代化標準構(gòu)建評價指標體系
PISA指標體系設(shè)計理念在于解決三個方面的問題:面對時代發(fā)展的新變局,年輕一代如何應(yīng)對新的挑戰(zhàn)與要求;在全球化背景下,年輕一代如何更加高效地溝通、理解與交流;面對知識爆炸和技術(shù)更新?lián)Q代的加速,年輕一代是否具備終身學習和不斷提升自我的能力和意識。通過預(yù)判學生面對未來社會發(fā)展所需應(yīng)具備的核心素養(yǎng),從而構(gòu)建相應(yīng)的指標體系,在此基礎(chǔ)上通過運用現(xiàn)代測評工具和統(tǒng)計研究方法,對學生相關(guān)核心素養(yǎng)的達成度進行評估,進而發(fā)現(xiàn)影響學生核心素養(yǎng)養(yǎng)成的相關(guān)指標。PISA通過整體設(shè)計、科學論證、系統(tǒng)測評,嚴格控制測試的全過程誤差,并提供數(shù)據(jù)支撐,從而達成評估目標,進而推動教育體制機制改革。
1. 指標體系構(gòu)建的適切性
PISA在測評之前需要構(gòu)建一套系統(tǒng)的評價指標體系,這套指標體系要充分考慮不同國家的經(jīng)濟、文化、教育發(fā)展水平的差異,具有更強的包容性和可推廣性。世界各國在學制規(guī)定、學生入學年齡限制、教材編排等方面差異較大,PISA選取基礎(chǔ)教育高年級階段學生作為樣本,運用科學的抽樣方法,確保不同國家和地區(qū)采用統(tǒng)一的抽樣標準。此外,PISA通常采用單參數(shù)項目反應(yīng)理論(IRT)模型對采集的學生成績進行分析,之后分別進行各個指標項的評分與計分,使用統(tǒng)一的評分標準對學生樣本進行測評。這一整套規(guī)范化程序使PISA減少無效數(shù)據(jù)的采集,將測評結(jié)果誤差降到最低。
2. 指標體系構(gòu)建的導(dǎo)向性
PISA運行的關(guān)鍵步驟是把需要解決的教育問題通過指標進行量化,使其更易被觀察和識別,以數(shù)據(jù)反映復(fù)雜教育現(xiàn)象。綜合來看,PISA各項指標是依據(jù)學生、家長、學校等要素建立的。學生方面一般涉及個人基本信息、認知能力、學習動機、職業(yè)規(guī)劃、自我效能感等;家長方面涉及學生家庭背景、家長對于學校教育的參與度、家校協(xié)同情況、家長對學生教育重視程度等;學校方面涵蓋學校的基本辦學條件、辦學類型、教育資源豐富度、課程設(shè)置、班級管理等。例如,根據(jù)不同教育要素的具體類型,通過指標測試等方式進行數(shù)據(jù)采集,匯總研發(fā)出與學生相關(guān)的指標,如職業(yè)規(guī)劃、學習興趣、課堂參與度、內(nèi)在動機、成就感、自我提升、社會認知、參與課外補習時間等指標,然后借助回歸模型的建立,開展對各要素之間的相關(guān)性分析,綜合評估各個國家和地區(qū)相關(guān)學齡段學生的表現(xiàn)。
3. 指標體系構(gòu)建的規(guī)范性
在每輪測評研發(fā)指標之前,OECD會確定該年度測評重點,如數(shù)學素養(yǎng)、科學素養(yǎng)、閱讀素養(yǎng)等,該素養(yǎng)的評估不僅涉及學科知識的掌握,還涉及學生掌握學習技能、推廣應(yīng)用知識的能力,以及邏輯推理、有效交流和解決各種復(fù)雜問題的能力。在此基礎(chǔ)上,OECD設(shè)計每輪PISA測評的重點。例如,2009年P(guān)ISA主要考查學生的閱讀、科學、數(shù)學三方面核心素養(yǎng),均強調(diào)學生對基本知識和相關(guān)技能的掌握程度。[11]
(三)呈現(xiàn)國際教育質(zhì)量評價結(jié)果與參考標準
學界通常所講的教育質(zhì)量涉及日常教育實踐活動的諸多要素,包括學校、教師、學生、課程設(shè)置、教學場所、教學手段、教育活動等。國際通用的教育質(zhì)量界定標準有:一是教育的投人產(chǎn)出比,二是學生學業(yè)成績,三是學習過程和結(jié)果。此外,隨著參與PISA的國家和地區(qū)越來越多,PISA結(jié)果展現(xiàn)的學生在數(shù)學、科學、閱讀等方面的素養(yǎng)達成度成為各國教育部門和研究機構(gòu)衡量其教育發(fā)展水平和教育質(zhì)量的重要參考依據(jù)。
四、啟示
我國多個城市通過參加PISA在國際上嶄露頭角,基礎(chǔ)教育得到國際社會的好評與認可。然而我國基礎(chǔ)教育規(guī)模大、區(qū)域發(fā)展不均衡的問題依然存在。在建設(shè)高質(zhì)量教育體系的背景下,開展大規(guī)模有組織的教育評價成為不可或缺的一環(huán),以教育評價與數(shù)據(jù)監(jiān)測推動教育質(zhì)量提升,為教育體制機制改革和教育決策提供數(shù)據(jù)支撐與保障。PISA的發(fā)展歷程和具體運行機制對我國開展相關(guān)教育評價和監(jiān)測有以下啟示。
(一)加強現(xiàn)有大規(guī)模教育評價研究平臺與資源整合
我國重視教育質(zhì)量監(jiān)測與評估,已有多個基礎(chǔ)教育質(zhì)量評價監(jiān)測平臺。2006年教育部基礎(chǔ)教育監(jiān)測中心在上海市教育科學研究院揭牌。2007年教育部基礎(chǔ)教育質(zhì)量監(jiān)測中心在北京師范大學揭牌。2012年中國基礎(chǔ)教育質(zhì)量監(jiān)測協(xié)同創(chuàng)新中心成立。目前,國內(nèi)大規(guī)模教育質(zhì)量監(jiān)測評估機構(gòu)在評價目標、方法和理念上各有不同,這不利于更大規(guī)模有組織教育評價和協(xié)同評價的開展,可進一步整合有關(guān)平臺和資源,使教育評價從松散型評價走向集約式發(fā)展。
(二)提升大規(guī)模教育評價的科學性和規(guī)范性
教育評價和測量以教育學、統(tǒng)計學、部分自然科學和實驗科學為理論基礎(chǔ),涉及教育評價的目標、內(nèi)容、方法、手段、數(shù)據(jù)統(tǒng)計分析、報告撰寫等內(nèi)容。分析PISA的運行機制可以看出,其整體測評包括要素設(shè)計、維度設(shè)定、指標研發(fā)、問卷調(diào)查、數(shù)據(jù)采集、統(tǒng)計分析等諸多科學規(guī)范環(huán)節(jié)。因此,我國開展大規(guī)模有組織教育評價也需要依托教育評價、教育統(tǒng)計、教育哲學等學科理論指導(dǎo),開發(fā)符合國情和教育發(fā)展狀況的指標體系。此外,加強理論支撐、堅持價值導(dǎo)向、設(shè)計科學維度、規(guī)范評價過程、深入分析結(jié)果也是提升大規(guī)模有組織教育評價效果和質(zhì)量的核心要素。
(三)堅持中國特色的教育評價價值理念
各國際組織和國家開展教育評價和監(jiān)測都有各自的價值訴求。教育評價是專業(yè)性和科學性較強的研究工作,在開展教育評價之前需要確立評價價值理念。我國開展教育評價須堅持中國特色社會主義道路,培養(yǎng)德智體美勞全面發(fā)展的社會主義建設(shè)者和接班人,不能照搬國際組織或發(fā)達國家開展大規(guī)模教育評價的價值理念,要根據(jù)中國教育發(fā)展的基本現(xiàn)狀和人才培養(yǎng)的價值追求設(shè)計有中國特色的教育評價指標體系與監(jiān)測機制。
(四)促進現(xiàn)代信息技術(shù)與大規(guī)模教育評價的緊密融合
隨著信息通信技術(shù)和媒體移動終端的快速發(fā)展,越來越多的評價和監(jiān)測活動開始依托現(xiàn)代信息技術(shù)。實現(xiàn)信息技術(shù)與測評活動的緊密融合已經(jīng)成為當前大規(guī)模教育評價活動發(fā)展的趨勢之一,也是促進大規(guī)模有組織教育評價更加高效和科學的保障。PISA依靠多種網(wǎng)絡(luò)平臺進行即時管理、開發(fā)專業(yè)化軟件用于大規(guī)模抽樣和數(shù)據(jù)采集分析、使用計算機進行各種測試和自動化評價報告生成等工作,這些環(huán)節(jié)大都以現(xiàn)代信息技術(shù)為重要支撐?,F(xiàn)代信息技術(shù)可為我國開展大規(guī)模有組織的教育評價提供更多便利,支撐我國大規(guī)模有組織教育評價的發(fā)展。
參考文獻:
[1]張民選,陸璟,占勝利,等. 專業(yè)視野中的PISA[J].教育研究,2011(6):3-10.
[2]CRONBACH L J. Course improvement through evaluation[M].Boston:Kluwer-Nijhoff,1983:101-135.
[3]陳玉琨,李如海.我國教育評價發(fā)展的世紀回顧與未來展望[J].華東師范大學學報(教育科學版),2000(1):6.
[4]陳玉琨.教育評價學[M].北京:人民教育出版社,2019:15.
[5]格朗蘭德. 教育測量與評價[M].鄭軍,譯.石家莊:河北教育出版社,1991:321-337.
[6]RUTKOWSKI L. Handbook of international large-scale assessment[M]. Taylor&Francis Group,2014: 32,58.
[7]Biesta G J J. Good education in an age of measurement:ethics,politics,democracy[M].Boulder:London Paradigm Publishers,2010:10.
[8]王蕾.基于大規(guī)模考試的教育質(zhì)量評價[J].教育科學研究,2010(11):37.
[9]蔣德仁.國際學生評價(PISA)概說[M].杭州:浙江教育出版社,2012:1.
[10]HANUSHEK E A,WOESSMANN L. The knowledge capital of nations:education and the economics of growth[M]. Cambridge:MIT Press,2015:146.
[11]陸璟.PISA測評的理論和實踐[M].上海:華東師范大學出版社,2013:13-15.
編輯 朱婷婷 ? 校對 王亭亭
作者簡介:袁晶,陜西科技大學教育學院講師
基金項目:陜西省教育科學“十四五”規(guī)劃2021年度青年項目“陜西教育高質(zhì)量發(fā)展要素及指標體系研究”(編號:SGH21Q022)