羅文蔚
摘要 NAEP(National Assessment of Educational Progress)即教育質(zhì)量評價體系,是美國目前最具引導(dǎo)性的教育評價體系,這一體系為學(xué)生受到科學(xué)教育提供了可靠保證。通過對該評價體系進行梳理、剖析,對我國建立科學(xué)、有效的教育評價體系具有良好的啟示作用。
關(guān)鍵詞 NAEP 教育質(zhì)量評價體系 啟示
美國教育質(zhì)量評價體系(NAEP)被喻為“皇家成績通知單”,是美國極具代表性、權(quán)威性和影響力的教育評價體系,在美國教育界擁有不可替代的地位,在各國建立教育質(zhì)量體系時具有標桿式作用,是各國爭相借鑒和模仿的榜樣,在全球范圍內(nèi)擁有極高的影響力。
一、美國教育質(zhì)量評價體系概述
1.NAEP簡介
美國是一個教育高度自治的國家,聯(lián)邦政府對教育的干預(yù)也是建立在民主的基礎(chǔ)上,NAEP是美國民主教育的典型代表,已形成國內(nèi)、州內(nèi)聯(lián)動的有機體系。NAEP是一個多維度的、立體全方位的評價體系,能夠?qū)逃|(zhì)量給予最客觀、中肯、有效的評價。
NAEP由主要評價、長期趨勢評價和專項評估三個層次構(gòu)成。主要評價重在評估學(xué)生當前的學(xué)習(xí)成果,目的是對國內(nèi)、州內(nèi)的學(xué)生在核心領(lǐng)域的學(xué)習(xí)情況進行評估。在國內(nèi)進行的主要評估頻率為一年一次,評估的對象為4年級、8年級和12年級的學(xué)生,隨機抽取reading、maths、science、writing、history、econoIIHCS、civics、geography和an 9個科目中的三個科目,抽取兩個年級的學(xué)生參加;在州內(nèi)進行的主要評估頻率為兩年一次,樣本群來自4年級和8年級的學(xué)生,評估科目分為必選科目和自選科目。長期趨勢評價側(cè)重評估學(xué)生的未來發(fā)展趨勢,目的是搜集學(xué)生在學(xué)科成績方面的未來發(fā)展信息,其評估頻率是四年一次,樣本群來自9歲、13歲和17歲的學(xué)生群體,評估科目涉及maths、science、reading和writing。專項評估則具有補充性作用,進行輔助性的專題研究,涉及實驗性評價、成績單評價、口語研究等等,主要針對特定的學(xué)生群體,如私立學(xué)校、特許實驗學(xué)校、印第安人、中學(xué)生等。
2.NAEP評價系統(tǒng)
第一階段為框架設(shè)計。主要負責機構(gòu)是美國國家評價管理委員會(NAGB),統(tǒng)領(lǐng)整個評價體系的設(shè)計與實施??蚣茉O(shè)計經(jīng)過各界專家以及公眾的反復(fù)論證,充分考慮學(xué)生的心理測試標準、教育的公平測試標準和國家頒布的統(tǒng)計標準。
第二階段為工具設(shè)計。主要負責機構(gòu)是美國教育考試服務(wù)中心(ETS)。按照標準化流程在評估體系的框架下進行試題開發(fā),試題需要經(jīng)過編寫設(shè)計、審核、修改、試測、復(fù)測、再修改等過程,形成評價試題冊的最終版本。
第三階段為學(xué)生樣本選取。主要由美國國家教育統(tǒng)計中心(NCES)負責。學(xué)生樣本選取的依據(jù)有區(qū)域劃分、城鄉(xiāng)區(qū)別、種族、貧富群體、學(xué)校性質(zhì)等等,按照事先約定的比例從指定的年級中隨機抽取學(xué)生。
第四階段為評價測試。由西斯特(Westat)公司負責NAEP數(shù)據(jù)采集和實施評價。由于NAEP國內(nèi)評價和州評價的工作量大,為了保證樣本數(shù)據(jù)來源的真實性和數(shù)據(jù)處理的準確性,主要評價耗時近2個月,而長期趨勢評價會在春季、秋季、冬季舉行。
第五階段為評分。主要負責機構(gòu)是美國國家計算機系統(tǒng)(NcS)??陀^題采取“機評”的方式,即使用光電閱讀器評分;主觀題則邀請有經(jīng)驗的專家依據(jù)評分指南和量表進行評分。為盡量避免評分者的主觀意向,NCS針對NAEP創(chuàng)新性地開發(fā)了電子圖像識別評分系統(tǒng),不僅將主觀題以圖像的形式客觀化,評分系統(tǒng)還會給予一個評分區(qū)間。
第六階段為成績輸出。scale score和achievement levels是NAEP中每一個學(xué)科教學(xué)成果評估的主要表現(xiàn)方式。scale score依據(jù)項目反映匯總,而achievement levels則以基礎(chǔ)、熟練和高級三個等級體現(xiàn)。
3.NAEP發(fā)展歷程
自美國成立以來,州政府和地區(qū)學(xué)區(qū)擁有很高的教育實權(quán),二戰(zhàn)后美國開始重新審視自身的教育地位,美國聯(lián)邦政府開始逐步集中對教育的主導(dǎo)權(quán),開始正式干預(yù)教育,NAEP應(yīng)運而生。NAEP主要經(jīng)歷了以下四個發(fā)展階段。
第一,起步階段(1963-1969)。1963年NAEP的雛形開始呈現(xiàn),但遭到諸多教育組織的質(zhì)疑和反對,歷時6年沖破重重阻礙后,NAEP最終被確定由教育委員會(ECS)負責管理。1969年,第一次全國性評估得以實施,但此時評估只涉及國內(nèi)評估而非州內(nèi)評估。
第二,探索階段(1969-1983)。在相對平穩(wěn)的探索階段,投資比例決定話語權(quán)。美國聯(lián)邦政府通過逐年增加對NAEP的直接投資,于1972年正式成為NAEP的唯一注資者,成功從ECS手中接過NAEP的管理權(quán),監(jiān)控權(quán)也由國家教育研究發(fā)展中心平穩(wěn)過渡給了NCES。
第三,突破階段(1983-2001)。一是管理權(quán)從ECS到ETS的進一步轉(zhuǎn)移;二是擴大評估層級,增加州內(nèi)評估;三是NAGB的建立,標志著NAEP有了專門而獨立的管理機構(gòu),為NAEP在教育領(lǐng)域的主導(dǎo)地位奠定基礎(chǔ)。
第四,發(fā)展階段(2001至今)。2001年《一個都不能少》(NCLB)的法案要求所有州必須將NAEP納人州內(nèi)評估管理。至此,NAEP從一個自愿參與的評估體系演變?yōu)楸仨殔⑴c執(zhí)行的評估體系,開啟了美國教育質(zhì)量評估的新篇章。
二、美國教育質(zhì)量評價體系的特征
1.基于學(xué)業(yè)標準建立
基于學(xué)業(yè)標準建立是NAEP框架中的亮點之一,通過樣本群體的劃分以及科目的選擇,有效規(guī)避了學(xué)校和學(xué)生個人信息的公布,整個測試過程到評估結(jié)果發(fā)布都有效遵循了低利害性的特征,避免評估主體——學(xué)校、學(xué)生受到評估結(jié)果的暗示,規(guī)避引導(dǎo)教育資源的趨利流動,從而導(dǎo)致教育資源的分配不均。這一特征是NAEP教育質(zhì)量評估體系得以被大眾接受的重要特性。
2.為國家教育決策和改革服務(wù)
在NAEP的設(shè)立過程中,其開放性也在逐漸升級,主要體現(xiàn)在形式的公開,即歷年的評估框架和試題均公開,這一方式既增加了NAEP的公信力,又不會降低NAEP的保密性,使得NAEP的開放性和保密性達到完美平衡。在提高用戶滿意度的同時,更加客觀的反映需要特別關(guān)注的領(lǐng)域和需要重視的問題,使教育決策者更直觀地看到問題所在,更好地為國家教育決策和改革服務(wù)。
3.以提升個體發(fā)展為目標
美國NAEP教育質(zhì)量評價體系的初衷是為學(xué)生建立公平、公開、透明的教育體系。提升個體發(fā)展是NAEP的價值回歸,NAEP評估制度選擇不同的樣本群體,建立州際之間的橫向?qū)Ρ群蜌v年的縱向比較體系,多維度、全方位的反映教育質(zhì)量的變化。NAEP不僅僅關(guān)心學(xué)生的成績,更關(guān)心在不同環(huán)境下不同受教育群體的成就分布,以及獲得這些成就的公平程度。NAEP提升個體發(fā)展的特征充分體現(xiàn)了美國“卓越始于平等”的戰(zhàn)略目標。
三、美國教育質(zhì)量評價體系的啟示
1.保障教育質(zhì)量評估的公平性
教育的公平性一直是我們關(guān)注的問題,其中涉及教育質(zhì)量的公平性、教育資源的公平性和教育監(jiān)測的公平性。一方面,NAEP的樣本群體涵蓋全面。不僅涉及普通學(xué)生,也涉及特殊學(xué)生,而特殊學(xué)生在樣本群體大約占據(jù)10%的比例,這樣的體系建立為教育監(jiān)測公平性提供了支持;另一方面,NAEP體系的構(gòu)成和實踐建立在科學(xué)的標準和目標之上,能夠在政府、中介機構(gòu)的保障下實現(xiàn)檢測的公平性。NAEP為我國建立教育質(zhì)量評價體系提供重要參考,我國也應(yīng)堅持長期進行、廣泛取樣,充分考慮國家統(tǒng)一性標準與不同地區(qū)的特殊性標準,城市與農(nóng)村地區(qū)、不同學(xué)科、不同時期之間存在的差異性,協(xié)調(diào)完善新課程標準改革,切實保障教育質(zhì)量評估的公平性。
2.國家層面對于教育質(zhì)量監(jiān)測的重要性
追溯NAEP的發(fā)展歷程,美國聯(lián)邦政府通過逐年增加對NAEP的直接投資,正式成為NAEP的唯一注資者,成功從ECS手中接過NAEP的管理權(quán)。與此同時,其監(jiān)控權(quán)也發(fā)生了轉(zhuǎn)移,由國家教育研究發(fā)展中心平穩(wěn)過渡給了NCES。充分體現(xiàn)了國家層面對教育質(zhì)量監(jiān)測的重要性,一個體系的建立需要諸多專家的參與,一個體系的維護更需要國家機構(gòu)的支持,因此,美國聯(lián)邦政府不僅是唯一注資者,更是NAEP最直接的監(jiān)管者。人才的培養(yǎng)是教育的基本內(nèi)容,而促進教育事業(yè)的進一步發(fā)展,提高教育質(zhì)量,需要國家層面作為強有力的推手。比如通過廣泛取樣、全面評估,制定系統(tǒng)完善的全國性教育評估與評價方案,為國家層面的課程決策提供具有操作性的指導(dǎo),并不斷加大科技研發(fā),提升教育質(zhì)量監(jiān)測和教育評估體系的技術(shù)手段。
3.教育質(zhì)量監(jiān)測充分體現(xiàn)實用性
美國國內(nèi)、州內(nèi)之所以能夠持續(xù)改善教學(xué)品質(zhì),是得益于實證數(shù)據(jù)采集,NAEP持續(xù)數(shù)年收集學(xué)生樣本數(shù)據(jù),已經(jīng)建立一個強大的隨時更新的數(shù)據(jù)庫。這樣NAEP不僅可以為評估者提供實時監(jiān)控的可能,還可以提高數(shù)據(jù)的橫縱向比較,實現(xiàn)普適性與地方性相結(jié)合,使學(xué)生評估監(jiān)測標準高度貼合國內(nèi)實際情況,使監(jiān)測內(nèi)容具有廣泛性和針對性。如果我國能夠借鑒NAEP建立起一個大型的教育數(shù)據(jù)庫,通過數(shù)年的積累、收集、整理和應(yīng)用,必然能夠通過豐富的教育研究信息數(shù)據(jù),為教育質(zhì)量的實時監(jiān)測提供強大的即時學(xué)生數(shù)據(jù)資料,為教育理念創(chuàng)新、教學(xué)方式改革發(fā)展以及改進學(xué)生學(xué)業(yè)成就提供系統(tǒng)的數(shù)據(jù)支撐,形成較為科學(xué)可行的高效機制,將有助于提升我國教育質(zhì)量評價的技術(shù)性和實用性。
4.評估標準提高目標性
研制評估標準是實現(xiàn)教育成效目標的關(guān)鍵。NAEP為不同年齡段、不同學(xué)科設(shè)計了非常具體的評估標準,制定了非常清晰明確的目標要求,這樣在進行具體的評估之后,老師、學(xué)生、評估者以及決策者可以通過不同學(xué)生的評估結(jié)果來充分了解學(xué)生在學(xué)業(yè)及學(xué)習(xí)上的優(yōu)勢和不足,也進一步明確了其加強改進的方向及目標。結(jié)合我國的實際教育教學(xué)情況,新課改的實施促使中小學(xué)各科的課程標準陸續(xù)頒布,課程標準不僅包含了教材編寫的具體要求和原則,還體現(xiàn)了教師教學(xué)成果及學(xué)生學(xué)習(xí)成果的具體標準。因此,我國可以參考美國NAEP的評估標準,在課程標準和學(xué)生學(xué)業(yè)水平測試上體現(xiàn)更為具體深入的差異性目標,著重建立一套成熟的學(xué)生水平評價主體多元、評價內(nèi)容全面、評價方式多樣的與科學(xué)課程相配套的評價體系,進一步完善課程標準,強調(diào)學(xué)業(yè)評價以標準為依據(jù),并對評價標準的目標性作出科學(xué)界定,便于掌握真實的學(xué)生學(xué)業(yè)水平。
5.評估結(jié)果提高科學(xué)性
NAEP基于項目反應(yīng)理論,通過科學(xué)真實有效的參數(shù)估計軟件針對不同的科學(xué)學(xué)業(yè)項目進行客觀的參數(shù)估計,并以“基礎(chǔ)、熟練和高級”三個等級來劃分學(xué)生的科學(xué)學(xué)業(yè)成就,同時根據(jù)學(xué)生不同的預(yù)測變量(如性別、年齡、種族等)來綜合客觀全面地對學(xué)生的能力值進行評估。這樣的評估結(jié)果方式對我國僅僅以學(xué)期成績、學(xué)年成績、中考成績、高考成績對學(xué)生的水平等級一概而論產(chǎn)生極大的影響,因此,我們可以科學(xué)地細化當前的學(xué)業(yè)水平評價標準,對學(xué)生的知識技能、學(xué)習(xí)方式、學(xué)習(xí)態(tài)度等進行全方位地考察,強化對學(xué)生學(xué)習(xí)結(jié)果的可觀察性。我國教育部門應(yīng)創(chuàng)新學(xué)生學(xué)業(yè)水平評價標準,通過科學(xué)的測量手段、測量設(shè)備使各項水平測試客觀可量,盡量減少主觀人為性。
當前我國的學(xué)業(yè)水平評價主要以同年級對比為主,而NAEP通過垂直鏈接來對比各年級學(xué)生的最終成績,有助于形成縱向?qū)Ρ?,形成更為全面立體的評價。我們也可以參考這樣的縱向年級比較方式,承前啟后,互相補充、激勵,提高科學(xué)性。
NAEP教育質(zhì)量評價體系可謂全球范圍內(nèi)教育質(zhì)量評價體系的典范。項目反應(yīng)理論(IRT)量表在NAEP中的應(yīng)用更加提高了NAEP評估的精度,評估報告的焦點會繼續(xù)停留在“等距分數(shù)”的設(shè)定(用以分析不同成就水平學(xué)生的百分比)。NAEP的框架設(shè)計、體系構(gòu)造、樣本取樣方式為我國搭建符合我國國情的教育質(zhì)量評價體系提供了很好的借鑒,NAEP在評估過程中體現(xiàn)出的公平性、開放性也為我國教育評估起到了很好的啟示作用。
[責任編輯 郭振玲]