姜 華 王 淼
(大連理工大學(xué) 高等教育研究院,遼寧 大連 116024)
2020年,中共中央國(guó)務(wù)院印發(fā)《深化新時(shí)代教育評(píng)價(jià)改革總體方案》,方案指出,要扭轉(zhuǎn)不科學(xué)的教育評(píng)價(jià)導(dǎo)向,堅(jiān)持科學(xué)有效,改進(jìn)結(jié)果評(píng)價(jià),強(qiáng)化過(guò)程評(píng)價(jià),探索增值評(píng)價(jià),健全綜合評(píng)價(jià),提高教育評(píng)價(jià)的科學(xué)性、專(zhuān)業(yè)性、客觀性。其中,增值評(píng)價(jià)成為對(duì)學(xué)生進(jìn)行學(xué)業(yè)評(píng)估的重要手段和內(nèi)容。當(dāng)前高等教育評(píng)價(jià)忽視了對(duì)作為教育主體的學(xué)生學(xué)習(xí)與發(fā)展成效的評(píng)估,不能體現(xiàn)“以學(xué)生發(fā)展為本”的教育理念,不利于促進(jìn)學(xué)生發(fā)展。增值評(píng)價(jià)通過(guò)對(duì)學(xué)生學(xué)業(yè)成就進(jìn)步程度的測(cè)量與分析,進(jìn)而對(duì)高校教師教學(xué)質(zhì)量、高校人才培養(yǎng)質(zhì)量進(jìn)行評(píng)估,更好地發(fā)揮教育評(píng)價(jià)的作用,促進(jìn)高等教育評(píng)價(jià)朝著全面又公平的方向發(fā)展[1-2]。
“增值”本身是經(jīng)濟(jì)學(xué)中的一個(gè)術(shù)語(yǔ),也被稱(chēng)作“附加值”。對(duì)增值進(jìn)行測(cè)量與評(píng)價(jià)即增值評(píng)價(jià)的內(nèi)涵。研究者們對(duì)高等教育領(lǐng)域的增值評(píng)價(jià)有著不同的看法。美國(guó)高等教育評(píng)估家阿斯汀提出:學(xué)生從入學(xué)到畢業(yè)期間各方面發(fā)生的變化都是增值評(píng)價(jià)關(guān)注的焦點(diǎn),這些變化包括思維方式、認(rèn)知水平、人際交往等[3]。他認(rèn)為,學(xué)生的培養(yǎng)質(zhì)量是大學(xué)辦學(xué)水平高低的根本指標(biāo)。學(xué)校教育質(zhì)量的高低取決于學(xué)生在校期間各方面產(chǎn)生“增量”的大小。高等教育所帶給學(xué)生的“增值”體現(xiàn)在學(xué)生在經(jīng)過(guò)大學(xué)教育之后,對(duì)其走出校園后的生活及工作所帶來(lái)的積極影響,對(duì)這種影響程度的評(píng)估即增值評(píng)價(jià)的內(nèi)涵所在[4]。上述對(duì)于增值評(píng)價(jià)的理解在整體上基本一致,所謂的“增值”從學(xué)生角度來(lái)講,指學(xué)生在接受一段時(shí)間教育后在知識(shí)、技能、能力和其他方面所取得的進(jìn)步[5];從學(xué)校層面來(lái)講,增值也可以定義為學(xué)校對(duì)學(xué)生在一段時(shí)間內(nèi)朝著既定的教育目標(biāo)前進(jìn)所作出的貢獻(xiàn)。增值評(píng)價(jià)則是對(duì)這種變化程度進(jìn)行測(cè)量與評(píng)價(jià),以此來(lái)評(píng)估學(xué)校的教學(xué)質(zhì)量。
增值評(píng)價(jià)主要有以下特點(diǎn)。
首先,增值評(píng)價(jià)是一種縱向評(píng)價(jià),也是一種過(guò)程性評(píng)價(jià),這是增值評(píng)價(jià)最顯著的特征。傳統(tǒng)教育評(píng)價(jià)方式往往將某一個(gè)時(shí)間節(jié)點(diǎn)學(xué)生的平均成績(jī)或升學(xué)率作為評(píng)價(jià)指標(biāo),來(lái)衡量教師工作或?qū)W校辦學(xué)的效率。這種橫向比較不僅缺少一定的說(shuō)服力且會(huì)造成“唯分?jǐn)?shù)”的弊端。增值評(píng)價(jià)關(guān)注的則是一段時(shí)間以來(lái)學(xué)生的成長(zhǎng)進(jìn)步以及學(xué)校的發(fā)展變化,其評(píng)價(jià)結(jié)果對(duì)學(xué)生、教育工作者、學(xué)校都更具指導(dǎo)性[6]。
其次,增值評(píng)價(jià)是一種更為公平的評(píng)價(jià)?,F(xiàn)有的評(píng)價(jià)傾向于對(duì)學(xué)生在某一時(shí)間點(diǎn)所取得的成績(jī)進(jìn)行評(píng)價(jià),并以此作為學(xué)校對(duì)學(xué)生學(xué)習(xí)成就的貢獻(xiàn)。由于學(xué)生入學(xué)時(shí)的知識(shí)和技能水平有所差異,僅以達(dá)到某一標(biāo)準(zhǔn)的學(xué)生的百分比來(lái)評(píng)價(jià)每個(gè)學(xué)校對(duì)學(xué)生成就的貢獻(xiàn)是不公平的。增值評(píng)價(jià)不用同一把尺來(lái)度量不同的學(xué)生以及辦學(xué)差異較大的學(xué)校,而是基于學(xué)生自身的進(jìn)步程度以及學(xué)校教育質(zhì)量的增值來(lái)作出價(jià)值判斷,體現(xiàn)了教育評(píng)價(jià)的公平性[7]。
再次,增值評(píng)價(jià)是一種多元評(píng)價(jià)。學(xué)生的學(xué)業(yè)成績(jī)往往受到多重因素的影響,每一次成績(jī)都是各種因素共同作用的結(jié)果[8]。這些因素包括學(xué)生自身的基礎(chǔ)水平、教師的教學(xué)水平、家庭經(jīng)濟(jì)狀況、學(xué)校辦學(xué)條件等。增值評(píng)價(jià)則將多種因素納入進(jìn)來(lái),并利用統(tǒng)計(jì)分析技術(shù),挖掘?qū)W校對(duì)學(xué)生學(xué)業(yè)成績(jī)的相關(guān)影響因素,得到學(xué)校在學(xué)生成長(zhǎng)發(fā)展中的“凈效應(yīng)”,以此衡量學(xué)校、教師對(duì)學(xué)生發(fā)展產(chǎn)生的具體作用[9]。
最后,增值評(píng)價(jià)是一種促進(jìn)發(fā)展的評(píng)價(jià)。增值評(píng)價(jià)本身是針對(duì)一段時(shí)間的縱向評(píng)價(jià),其具有跟蹤觀察的特征,是一種過(guò)程性評(píng)價(jià)。它關(guān)注學(xué)生、教師、學(xué)校的發(fā)展,其評(píng)價(jià)結(jié)果對(duì)于學(xué)生、教師、學(xué)校發(fā)現(xiàn)問(wèn)題極為重要,起到一定的引導(dǎo)作用。學(xué)生可以從評(píng)價(jià)結(jié)果中看到自身進(jìn)步狀況,及時(shí)做出調(diào)整,取得更大進(jìn)步。教師與學(xué)??梢岳迷u(píng)價(jià)結(jié)果更好地掌握學(xué)生狀況,及時(shí)采取措施,改善辦學(xué)質(zhì)量。
在20世紀(jì)60年代的美國(guó),當(dāng)時(shí)人們普遍認(rèn)為學(xué)校缺乏效率,因此一些學(xué)者開(kāi)始對(duì)學(xué)校效率問(wèn)題展開(kāi)調(diào)查,其中以詹姆斯·科爾曼為代表的學(xué)者們提出了著名的《關(guān)于教育機(jī)會(huì)平等性的報(bào)告》,即“科爾曼報(bào)告”。這一報(bào)告表明學(xué)校對(duì)學(xué)生學(xué)業(yè)成就的影響程度不大,也印證了人們的擔(dān)心。除此之外,原有的評(píng)價(jià)方式關(guān)注橫向比較,使得具有較好生源的學(xué)校始終具有顯著優(yōu)勢(shì),而生源較差的學(xué)校,其在學(xué)生成長(zhǎng)過(guò)程中的效應(yīng)無(wú)法體現(xiàn)出來(lái),不利于學(xué)校的發(fā)展;原有評(píng)價(jià)方式更加關(guān)注結(jié)果性評(píng)價(jià),以某次考試成績(jī)作為評(píng)判學(xué)生的標(biāo)準(zhǔn),這種評(píng)價(jià)方式造成學(xué)生無(wú)法得知自己的真實(shí)進(jìn)步情況,也無(wú)法計(jì)算學(xué)校層面對(duì)學(xué)生學(xué)業(yè)成就增長(zhǎng)的凈效應(yīng),不利于學(xué)生的成長(zhǎng)。由于公眾對(duì)于學(xué)校效率問(wèn)題的關(guān)注以及原有評(píng)價(jià)方式的不足,人們迫切需要一種關(guān)注縱向評(píng)價(jià)的評(píng)價(jià)方式,從而催生了增值評(píng)價(jià)在教育領(lǐng)域中的應(yīng)用[10]。
1983年,美國(guó)出臺(tái)了《國(guó)家處于危機(jī)之中:教育改革勢(shì)在必行》報(bào)告,這一報(bào)告主要針對(duì)美國(guó)中小學(xué)教學(xué)質(zhì)量滑坡、學(xué)生學(xué)業(yè)成就下降的現(xiàn)狀,強(qiáng)調(diào)各州要開(kāi)始大力推行教育改革,核心目標(biāo)就是提升教學(xué)質(zhì)量。為評(píng)估教育改革的效果,增值評(píng)價(jià)開(kāi)始被使用。1992年,美國(guó)田納西州簽署了《教育改進(jìn)法案》,法案中指出:增值性評(píng)價(jià)將成為教育問(wèn)責(zé)制的重要一部分。這部法案的頒布使得增值評(píng)價(jià)從理念層面真正落到實(shí)處,標(biāo)志著增值評(píng)價(jià)在具體運(yùn)用上邁出了重要一步[11]。在此之后,增值評(píng)價(jià)受到了教育研究者及教育工作者的廣泛關(guān)注,逐漸成為教育評(píng)價(jià)的一種主要方式。2001年,美國(guó)出臺(tái)《不讓一個(gè)孩子掉隊(duì)》法案,明確規(guī)定學(xué)校評(píng)價(jià)要使用“年度進(jìn)步值”這一關(guān)鍵指標(biāo),要求通過(guò)高標(biāo)準(zhǔn)和效益核定來(lái)實(shí)現(xiàn)教育平等。到2010年,田納西州頒布“捷足先登”計(jì)劃,該計(jì)劃旨在對(duì)中小學(xué)教師評(píng)價(jià)進(jìn)行新一輪改革,計(jì)劃明確指出要形成增值性評(píng)價(jià)與其他評(píng)價(jià)方式相結(jié)合的綜合評(píng)價(jià)模式。增值評(píng)價(jià)一步步地發(fā)展起來(lái)。由于增值評(píng)價(jià)對(duì)統(tǒng)計(jì)技術(shù)的要求較高,其最初在英美等國(guó)家發(fā)展起來(lái),且增值評(píng)價(jià)最初應(yīng)用于美國(guó)K-12教育中(基礎(chǔ)教育階段)[1 2 -1 3]。增值評(píng)價(jià)提出的初衷旨在通過(guò)更加精準(zhǔn)的統(tǒng)計(jì)分析方法解決教師評(píng)價(jià)中的一些難題。之后教育研究者發(fā)現(xiàn)增值評(píng)價(jià)不僅僅是一種評(píng)價(jià)方式,更是一種教育理念,增值評(píng)價(jià)可以解決傳統(tǒng)教育中的不足,彌補(bǔ)以往對(duì)學(xué)生的結(jié)果性評(píng)價(jià)及橫向評(píng)價(jià)的缺陷。此外,還有研究者提出站在學(xué)校效能的角度看,增值評(píng)價(jià)可以從影響學(xué)生成長(zhǎng)發(fā)展的眾多因素中剝離非學(xué)??煽匾蛩?,進(jìn)一步測(cè)量學(xué)生在一段時(shí)間內(nèi)的進(jìn)步程度,從而得出學(xué)校對(duì)學(xué)生成就影響的凈效應(yīng),促進(jìn)學(xué)校評(píng)價(jià)更加公平[14]。
大學(xué)生在高等教育背景中呈現(xiàn)出與基礎(chǔ)教育階段不同的特點(diǎn),其學(xué)習(xí)過(guò)程與身心發(fā)展更加多元化。皮特·尤厄爾認(rèn)為:“大學(xué)生的學(xué)習(xí)成果是指學(xué)生在經(jīng)過(guò)一段時(shí)間的學(xué)習(xí)后,其在知識(shí)、能力、思維等方面所取得的進(jìn)步,包括認(rèn)知與非認(rèn)知的收獲、心理與行為上的收獲?!盵15]目前獲取大學(xué)生學(xué)習(xí)成果數(shù)據(jù)可以通過(guò)標(biāo)準(zhǔn)化測(cè)試與自陳式量表來(lái)收集[16]。
標(biāo)準(zhǔn)化測(cè)試主要針對(duì)大學(xué)生的核心認(rèn)知能力,具有直接、客觀等特點(diǎn)。一般來(lái)講,大學(xué)生核心認(rèn)知能力包括批判思維能力、書(shū)面交流能力、邏輯推理能力等。目前美國(guó)具有代表性的標(biāo)準(zhǔn)化測(cè)試有以下幾種:《大學(xué)學(xué)習(xí)評(píng)估》(The Collegiate Learning Assessment,簡(jiǎn)稱(chēng)CLA)[17]、《大學(xué)生學(xué)術(shù)熟練程度評(píng)估》(Collegiate Assessment of Academic Proficiency,簡(jiǎn)稱(chēng)CAAP)[18]、《大學(xué)生學(xué)術(shù)熟練度與進(jìn)步測(cè)量》(Measure of Academic Proficiency and Progress,簡(jiǎn)稱(chēng)MAPP)[19]、《基礎(chǔ)學(xué)科測(cè)試》(Basic Academic Subjects Examination,簡(jiǎn)稱(chēng)BASE)[20]等。其中,美國(guó)的《大學(xué)學(xué)習(xí)評(píng)估》(簡(jiǎn)稱(chēng)CLA)測(cè)試對(duì)學(xué)生的評(píng)價(jià)主要包括三方面:閱讀寫(xiě)作能力、分辨推理能力和問(wèn)題解決能力,可以在測(cè)試中通過(guò)模擬真實(shí)性情景來(lái)考察學(xué)生的三種能力,測(cè)試中可以為學(xué)生提供必要的數(shù)據(jù)、新聞報(bào)刊、研究成果的摘要等內(nèi)容,學(xué)生根據(jù)自身需要對(duì)材料進(jìn)行處理后解決測(cè)試中給出的現(xiàn)實(shí)問(wèn)題。在學(xué)生完成測(cè)試后,根據(jù)其回答判斷學(xué)生綜合能力掌握的級(jí)別標(biāo)準(zhǔn),通過(guò)縱向測(cè)試,即入學(xué)時(shí)和畢業(yè)時(shí),或者每一年度進(jìn)行一次測(cè)試,從而完成對(duì)學(xué)生核心認(rèn)知能力的增值評(píng)價(jià)[17]。國(guó)際組織也開(kāi)發(fā)出相關(guān)的標(biāo)準(zhǔn)化測(cè)試,稱(chēng)為《高等教育學(xué)習(xí)成果評(píng)估》(Assessment of Higher Education Learning Outcomes,簡(jiǎn)稱(chēng)AHELO)[21],該標(biāo)準(zhǔn)化測(cè)試不僅可以用來(lái)測(cè)試通用技能,還可以用來(lái)測(cè)試不同專(zhuān)業(yè)的專(zhuān)業(yè)知識(shí)與技能。
自陳式量表是根據(jù)學(xué)生的自我報(bào)告來(lái)實(shí)現(xiàn)的,學(xué)生通過(guò)問(wèn)卷等形式對(duì)自己在課內(nèi)外活動(dòng)中的感受與收獲、個(gè)體發(fā)展情況以及進(jìn)步情況進(jìn)行自我陳述和自我評(píng)價(jià)。當(dāng)前美國(guó)高等教育評(píng)估中,使用較多的自陳式量表有:美國(guó)大學(xué)生學(xué)習(xí)經(jīng)歷調(diào)查(the National Survey for Student Engagement,NSSE)[22]、全美大學(xué)生滿(mǎn)意度調(diào)查(National Student Satisfaction Study,NSSS)[23]、大學(xué)生就讀經(jīng)驗(yàn)調(diào)查(The College Student Experiences Questionnaire,簡(jiǎn)稱(chēng)CSEQ)[24]、《加州大學(xué)本科生就讀經(jīng)驗(yàn)調(diào)查》(University of California Undergraduate Experience Survey,簡(jiǎn)稱(chēng)UCUES)[25]等。
有研究者認(rèn)為標(biāo)準(zhǔn)化測(cè)試不能全面反映學(xué)校對(duì)學(xué)生發(fā)展變化所產(chǎn)生的作用,其忽略了學(xué)生的家庭背景、經(jīng)濟(jì)狀況、自身經(jīng)歷與學(xué)校特征對(duì)學(xué)生學(xué)習(xí)成果的影響;自陳式量表則彌補(bǔ)了標(biāo)準(zhǔn)化測(cè)試的缺陷,將影響學(xué)生發(fā)展變化的諸多因素納入考慮。由于自陳式量表基于學(xué)生的自我匯報(bào),一些研究者認(rèn)為其準(zhǔn)確性可能會(huì)受到影響,并且可能存在低回收率的問(wèn)題。因此,在增值評(píng)價(jià)數(shù)據(jù)收集時(shí),應(yīng)充分考慮以上兩種方式的結(jié)合,盡可能保證數(shù)據(jù)的準(zhǔn)確性與完整性[26]。
高校在對(duì)學(xué)生的相關(guān)數(shù)據(jù)進(jìn)行采集之后,則會(huì)面臨技術(shù)問(wèn)題。這一問(wèn)題就是如何對(duì)所獲取的數(shù)據(jù)進(jìn)行分析。增值評(píng)價(jià)中分析數(shù)據(jù)的主要工具為增值模型,其是在統(tǒng)計(jì)分析技術(shù)基礎(chǔ)上設(shè)計(jì)的。教育中使用的增值模型與基礎(chǔ)教育階段使用的增值模型在許多方面有所不同,這是因?yàn)閷W(xué)生的發(fā)展情況與數(shù)據(jù)的可用性不同?;A(chǔ)教育階段所使用的絕大多數(shù)增值模型都是基于多年來(lái)對(duì)同一學(xué)生和同一科目相關(guān)的縱向數(shù)據(jù)開(kāi)發(fā)的。這種帶有重復(fù)測(cè)量設(shè)計(jì)的縱向方法在高等教育中很少見(jiàn),目前在高等教育增值評(píng)價(jià)計(jì)算中主要采用橫截面設(shè)計(jì),即接受測(cè)試的大一新生和大四畢業(yè)生并非同一組學(xué)生。以下是高等教育中使用的四種不同的增值模型,四種模型對(duì)增值分?jǐn)?shù)的詳細(xì)計(jì)算各不相同,但它們均為橫截面設(shè)計(jì)[27]。
如上所述,所謂“增值”是指大學(xué)教育對(duì)學(xué)生學(xué)業(yè)成就所帶來(lái)的積極影響。從實(shí)證研究角度來(lái)講,“增值”主要體現(xiàn)為橫向研究中不同年級(jí)學(xué)生群體間的差異,殘差模型則是通過(guò)學(xué)生學(xué)習(xí)成果的平均變化值與方差來(lái)表示增值的幅度大小及其變異程度[28]。
普通最小二乘(OLS)回歸方法首次用于2004~2005年的美國(guó)大學(xué)生學(xué)習(xí)評(píng)估(CLA)中。
OLS線(xiàn)性回歸模型是將大一學(xué)生和大四學(xué)生的平均學(xué)業(yè)增長(zhǎng)與具有類(lèi)似入學(xué)學(xué)習(xí)能力的學(xué)生群體作比較,即是否接近或高于“預(yù)期”考試分?jǐn)?shù)或總體平均測(cè)試。
為了衡量“預(yù)期”考試成績(jī),該模型將大一和大四學(xué)生當(dāng)前的平均考試成績(jī)(在美國(guó)一般采用CLA標(biāo)準(zhǔn)化測(cè)試成績(jī))分別對(duì)他們的平均入學(xué)能力成績(jī)(如SAT平均分)進(jìn)行回歸。OLS線(xiàn)性回歸模型的典型公式為:
(1)
變式為:
(2)
該模型的優(yōu)點(diǎn)是依賴(lài)于OLS線(xiàn)性回歸模型和簡(jiǎn)單的減法,易于實(shí)現(xiàn),結(jié)果也相當(dāng)直觀。此外,與縱向設(shè)計(jì)相比,采用橫斷面設(shè)計(jì)進(jìn)行增值測(cè)量的成本更低,可行性更高[2 8,3 1,3 3]。
但是,該模型在使用中存在一些問(wèn)題:第一,由于該方法的計(jì)算是在學(xué)校層面上,這樣會(huì)忽略學(xué)生層面的相關(guān)信息,可能會(huì)造成結(jié)果的不準(zhǔn)確性。第二,該模型使用時(shí)是將不同類(lèi)型的學(xué)校集中在一起進(jìn)行增值分析,而忽略了學(xué)校本身的特征。不同學(xué)校對(duì)于學(xué)生的學(xué)業(yè)成就產(chǎn)生的影響也不盡相同,該模型未將學(xué)校特征作為影響因素納入分析中。
多元線(xiàn)性回歸法是分析一個(gè)因變量與多個(gè)自變量之間線(xiàn)性關(guān)系最常用的統(tǒng)計(jì)方法,也是估計(jì)觀測(cè)值與期望值之間殘差值的標(biāo)準(zhǔn)統(tǒng)計(jì)技術(shù)。與上述基于OLS線(xiàn)性回歸的模型一樣,該模型同樣根據(jù)殘差的差值計(jì)算各學(xué)校的增值分?jǐn)?shù)。然而,該模型不同于OLS線(xiàn)性回歸模型,該模型采用了多層方法[33],采用二級(jí)HLM(層次線(xiàn)性模型)來(lái)計(jì)算大一學(xué)生成績(jī)和大四學(xué)生成績(jī)的殘差??紤]到學(xué)生是嵌套在學(xué)校內(nèi)的,學(xué)生的成績(jī)會(huì)受到不同學(xué)校特點(diǎn)的影響,因此增值模型需要反映分層的數(shù)據(jù)結(jié)構(gòu),并在評(píng)估每個(gè)學(xué)校對(duì)學(xué)生學(xué)術(shù)成就的貢獻(xiàn)時(shí)考慮學(xué)校特征的影響。
HLM模型分兩級(jí):第一級(jí)的分析單元是學(xué)生,每個(gè)學(xué)生的考試成績(jī)都是以一組個(gè)體特征的函數(shù)來(lái)表示的。第二級(jí)的分析單元是學(xué)校,每個(gè)學(xué)校的1級(jí)回歸系數(shù)被認(rèn)為是因變量,假設(shè)這些因變量取決于不同的學(xué)校特征[34]。
該模型的簡(jiǎn)單版本如下。
第一級(jí)(學(xué)生):
(3)
第二級(jí)(學(xué)校):
β0j=γ00+γ0sWsj+u0j,
(4)
β1j=γ10,
(5)
其中,γij表示學(xué)生i在學(xué)校j中的考試成績(jī);SATij表示學(xué)生i在學(xué)校j中的入學(xué)成績(jī);SATj表示j學(xué)校SAT成績(jī)的平均分;β0j表示學(xué)校j目前的平均成績(jī)(第一級(jí)的截距);β1j學(xué)生入學(xué)學(xué)業(yè)能力得分的第一級(jí)回歸斜率;εij表示假設(shè)殘差是正態(tài)分布且獨(dú)立于第一級(jí)協(xié)變量;Wsj表示學(xué)校j的制度特征;γ00表示第二級(jí)截距;γ0s表示學(xué)校特征的二級(jí)回歸斜率;u0j表示假設(shè)殘差是正態(tài)分布且獨(dú)立于二級(jí)協(xié)變量。總殘差由兩部分構(gòu)成:即總殘差=εij+u0j。該模型采用多層模型來(lái)反映高等教育中嵌套的數(shù)據(jù)結(jié)構(gòu),從而更精確地測(cè)量學(xué)校效應(yīng)[30]。
該模型彌補(bǔ)了基于OLS線(xiàn)性回歸的差值模型的不足,將學(xué)生層面與學(xué)校層面同時(shí)納入分析,一方面HLM考慮到群體水平的差異,可以更好地估計(jì)個(gè)體效應(yīng)。另一方面,其充分考慮學(xué)校因素對(duì)于學(xué)生成績(jī)的影響,可以獲得更加準(zhǔn)確的增值成績(jī)。
上述兩個(gè)增值模型,都是通過(guò)計(jì)算新生和大四學(xué)生成績(jī)殘差的差值來(lái)衡量學(xué)校的增值分?jǐn)?shù),即通過(guò)“觀察到的”平均測(cè)試分?jǐn)?shù)減去“預(yù)期”測(cè)試分?jǐn)?shù)得到的。換句話(huà)說(shuō),這兩個(gè)模型關(guān)注的是各學(xué)校入學(xué)新生和大四學(xué)生的學(xué)業(yè)增長(zhǎng)量,并將學(xué)校的學(xué)業(yè)增長(zhǎng)量與所有學(xué)校錄取的入學(xué)能力相似的學(xué)生的總體增長(zhǎng)量進(jìn)行比較。
剩余分析模型比較的是每所大學(xué)大四學(xué)生的平均考試成績(jī)(如CLA測(cè)試),而不是新生和大四學(xué)生之間的分?jǐn)?shù)差。該模型通過(guò)控制入學(xué)學(xué)生的學(xué)術(shù)能力(如大四學(xué)生的入學(xué)能力、大四學(xué)生的SAT平均成績(jī)等),根據(jù)大四學(xué)生的平均考試成績(jī)超出或低于預(yù)期成績(jī)的程度來(lái)測(cè)量增值分?jǐn)?shù)[31]。例如,如果某學(xué)校的大四學(xué)生在成績(jī)測(cè)試中比其他學(xué)校有類(lèi)似學(xué)術(shù)能力的大四學(xué)生成績(jī)更好,那么就可以說(shuō)該校學(xué)生的學(xué)術(shù)能力增長(zhǎng)超過(guò)預(yù)期,該校教育增值程度更高。
為了探究制度對(duì)學(xué)生學(xué)術(shù)成就的影響,該方法結(jié)合了兩個(gè)層次的分析。在第一級(jí),分析單元是學(xué)生,大四學(xué)生當(dāng)前的考試成績(jī)是關(guān)于學(xué)生入學(xué)學(xué)術(shù)能力分?jǐn)?shù)(如SAT分?jǐn)?shù))的函數(shù)。在第二級(jí),分析單元是機(jī)構(gòu),每個(gè)學(xué)校的第一級(jí)回歸系數(shù)是因變量。
第一級(jí)(學(xué)生):
(6)
第二級(jí)(學(xué)校):
(7)
β1j=γ10,
(8)
該模型提高了分析學(xué)校特征對(duì)于學(xué)生學(xué)業(yè)成就影響的可靠性與準(zhǔn)確性,但使用該模型時(shí)需要較大的樣本量,若樣本量不足,測(cè)量出的增值結(jié)果會(huì)產(chǎn)生偏差[35]。
以上三個(gè)模型在使用時(shí)都需要對(duì)學(xué)生進(jìn)行標(biāo)準(zhǔn)化測(cè)試來(lái)控制學(xué)生的初始學(xué)業(yè)成就水平,這就要求標(biāo)準(zhǔn)化測(cè)試具有普遍性以及全面又合適的考量指標(biāo),否則模型將無(wú)法使用。此外,若要大范圍開(kāi)展增值評(píng)價(jià),則需要對(duì)標(biāo)準(zhǔn)化測(cè)試進(jìn)行統(tǒng)一設(shè)計(jì)與認(rèn)定,標(biāo)準(zhǔn)化測(cè)試的內(nèi)容與考核方式需有嚴(yán)格的標(biāo)準(zhǔn)與規(guī)定,確??荚嚨臏?zhǔn)確性與公平性,避免對(duì)增值分析產(chǎn)生影響。不同的學(xué)校應(yīng)采用相同的標(biāo)準(zhǔn)化測(cè)試對(duì)學(xué)生進(jìn)行考核,這樣對(duì)學(xué)校進(jìn)行評(píng)估時(shí)才具有可比性。
該模型旨在對(duì)學(xué)生多方面成績(jī)進(jìn)行聯(lián)合增值分析,并探究它們之間的內(nèi)在相關(guān)性。馬丁等人使用哥倫比亞大學(xué)數(shù)據(jù)庫(kù),對(duì)多維增值模型進(jìn)行了探究[36]。其中學(xué)生成績(jī)包含以下幾個(gè)方面:定量推理、批判性閱讀、英語(yǔ)語(yǔ)言、公民能力和書(shū)面交流。該模型的開(kāi)發(fā)是基于矩量法的。所收集的數(shù)據(jù)包括兩類(lèi):一類(lèi)是學(xué)生入學(xué)時(shí)參加的入學(xué)考試成績(jī);另一類(lèi)是大學(xué)畢業(yè)時(shí)參加的國(guó)家考試成績(jī)。每一門(mén)考試都包含幾個(gè)方面(例如,定量推理、批判性閱讀、英語(yǔ)等),將它們稱(chēng)之為模塊。
該模型的一個(gè)基本結(jié)構(gòu)公式為:
假設(shè)用Ymj=(Y1mj,Y2mj,…,Ynjmj)T表示j學(xué)校中m模塊最終成績(jī)的nj個(gè)向量,則對(duì)于每所學(xué)校來(lái)講,多維模型表示為:
E(Ymj|Zmj,γmj)=Zmjβm+γmjιnj,
(9)
其中,Ymj表示學(xué)生j在模塊m中的考試成績(jī);用Zmj表示大小為K的列向量,它包含了入學(xué)考試的分?jǐn)?shù)和所有其他協(xié)變量,包括可能的截距;γmj表示隨機(jī)變量,用來(lái)解釋M測(cè)試分?jǐn)?shù)中存在的異質(zhì)性,它不能用觀察到的學(xué)生和大學(xué)的特征來(lái)解釋?zhuān)籰nj=(1,1,…,1)T,表示1的n維列向量。
該模型相比于其他模型的優(yōu)點(diǎn)在于:之前的增值模型只對(duì)一維分?jǐn)?shù)進(jìn)行計(jì)算,但不同的學(xué)校在培養(yǎng)學(xué)生時(shí),會(huì)根據(jù)他們對(duì)理論訓(xùn)練和實(shí)踐訓(xùn)練的重視程度而有所不同。因此,為了對(duì)評(píng)估學(xué)校的增值指標(biāo)做出公正的判斷,該模型可以基于所有可衡量技能的分?jǐn)?shù)進(jìn)行增值測(cè)量,使得評(píng)估更加細(xì)化、更加全面公平。
在使用增值模型對(duì)學(xué)生的學(xué)業(yè)成績(jī)?cè)鲋颠M(jìn)行評(píng)價(jià)時(shí),往往有很多無(wú)法排除的干擾因素可能會(huì)造成結(jié)果的不準(zhǔn)確。因此,如何盡可能控制這些因素的干擾成為目前需要解決的問(wèn)題。以下是幾種可能的干擾因素。
(1) 學(xué)生的動(dòng)機(jī):當(dāng)考試結(jié)果對(duì)學(xué)生的學(xué)術(shù)地位或畢業(yè)沒(méi)有什么影響時(shí),學(xué)生缺乏在考試中表現(xiàn)良好的動(dòng)機(jī),可能會(huì)對(duì)考試分?jǐn)?shù)的有效性和考試結(jié)果解釋的準(zhǔn)確性產(chǎn)生一定影響[3 7-3 8]。如果一所學(xué)校中學(xué)生的動(dòng)機(jī)普遍較低,那該校在學(xué)生學(xué)業(yè)成果增值性評(píng)估中產(chǎn)生的增值分?jǐn)?shù)就更低[3 9-4 1]。為了避免這樣的問(wèn)題,學(xué)校必須制定適當(dāng)?shù)臋C(jī)制,利用各種激勵(lì)手段鼓勵(lì)學(xué)生,提高參與率,讓學(xué)生以積極的態(tài)度對(duì)待考試[42]。
(2) 學(xué)生的流動(dòng)性:高等教育的學(xué)生往往會(huì)改變課程,如休假甚至中途輟學(xué)等,這導(dǎo)致很難跟蹤學(xué)生數(shù)年。不同學(xué)校的學(xué)生流動(dòng)率各不相同。當(dāng)一所學(xué)校的學(xué)生流動(dòng)性大于其他學(xué)校時(shí),增值模型所產(chǎn)生的學(xué)校效應(yīng)可能存在偏差。例如,一些學(xué)生可能在考試之前離開(kāi)學(xué)校,或者在學(xué)校的時(shí)間不足以納入分析,那么學(xué)校對(duì)這類(lèi)學(xué)生學(xué)業(yè)成績(jī)的增值效應(yīng)無(wú)法體現(xiàn)出來(lái)。因此,有必要考察增值模型中學(xué)生流動(dòng)率如何影響學(xué)校對(duì)學(xué)生成績(jī)影響的測(cè)量,并尋找合適的方式來(lái)反映模型中各學(xué)校的學(xué)生流動(dòng)率水平[43]。
(3) 增值分?jǐn)?shù)的波動(dòng):在增值模型中最重要的問(wèn)題之一是學(xué)校效應(yīng)的穩(wěn)定性[30]。當(dāng)然,學(xué)校對(duì)學(xué)生成績(jī)的影響每年都會(huì)有所不同,但如果學(xué)校效應(yīng)發(fā)生了根本性變化則會(huì)導(dǎo)致一些問(wèn)題。如果學(xué)校效應(yīng)每年波動(dòng)很大,那么學(xué)校對(duì)學(xué)生成績(jī)的影響程度就很難具備說(shuō)服力。因此,在選擇增值模式后,應(yīng)檢查每個(gè)學(xué)校每年的增值分?jǐn)?shù)之間的一致性。如果增值分?jǐn)?shù)在各年之間發(fā)生了根本性變化,則應(yīng)考慮哪些因素造成了這些變化,并將這些因素納入到增值模型中。此外,樣本量會(huì)影響增值模型的準(zhǔn)確性,要保證一定的樣本量才可以得出較為準(zhǔn)確的數(shù)據(jù)[44]。
《深化新時(shí)代教育評(píng)價(jià)改革總體方案》明確提出了探索增值評(píng)價(jià)。然而我國(guó)教育領(lǐng)域引入增值評(píng)價(jià)的時(shí)間并不長(zhǎng),對(duì)高等教育領(lǐng)域增值評(píng)價(jià)的研究目前大多停留在理論層面,相關(guān)的實(shí)證研究較少,且所用的增值評(píng)價(jià)模型引自國(guó)外,本土對(duì)增值模型的開(kāi)發(fā)處于起步階段。面對(duì)這些現(xiàn)狀,應(yīng)從以下方面著手。
(1) 以增值評(píng)價(jià)促教育公平。2020年國(guó)務(wù)院政府工作報(bào)告中提出要推動(dòng)教育公平發(fā)展和質(zhì)量提升。教育公平包括起點(diǎn)公平、過(guò)程公平及結(jié)果公平。在推進(jìn)教育公平的舉措中,除強(qiáng)調(diào)教育資源配置公平外,評(píng)價(jià)方式不同也會(huì)對(duì)教育的公平性產(chǎn)生影響。評(píng)價(jià)方式更關(guān)注過(guò)程公平與結(jié)果公平,關(guān)注教育本身所帶給學(xué)生的收獲和影響。以往教育評(píng)價(jià)方式與指標(biāo)側(cè)重于學(xué)校辦學(xué)條件、教師教學(xué)能力、學(xué)生考試成績(jī)和升學(xué)率,而忽略了學(xué)生個(gè)體的獲得與進(jìn)步程度,造成教育評(píng)價(jià)的不公平。增值評(píng)價(jià)提供了一種新的教育評(píng)價(jià)理念,以教學(xué)效果作為衡量學(xué)校教育效率以及教師教學(xué)能力的指標(biāo),這對(duì)于現(xiàn)有評(píng)價(jià)中的“弱勢(shì)學(xué)校”更加公平。教育的本質(zhì)是促進(jìn)學(xué)生發(fā)展,增值評(píng)價(jià)以學(xué)生的學(xué)業(yè)成績(jī)進(jìn)步程度為指標(biāo),能使學(xué)校更加關(guān)注學(xué)生發(fā)展,從而提高教育質(zhì)量,更好地促進(jìn)教育公平。
(2) 構(gòu)建完善的增值評(píng)價(jià)體系。首先,評(píng)價(jià)理念落實(shí)到實(shí)踐需要有完善的體系支撐。增值評(píng)價(jià)可以從影響學(xué)生學(xué)業(yè)成就的諸多因素中剝離出學(xué)校效應(yīng)的影響,得到學(xué)校對(duì)學(xué)生影響的“凈效應(yīng)”,因此指標(biāo)的合理性至關(guān)重要。評(píng)價(jià)前需要對(duì)影響學(xué)生學(xué)業(yè)成就的因素進(jìn)行全面分析,選擇出合理的指標(biāo)。其次,增值評(píng)價(jià)對(duì)數(shù)據(jù)的依賴(lài)性強(qiáng),需要對(duì)樣本數(shù)據(jù)進(jìn)行縱向長(zhǎng)時(shí)間追蹤,這就要求有強(qiáng)大的數(shù)據(jù)采集工具支撐,開(kāi)發(fā)增值評(píng)價(jià)適用的教育大數(shù)據(jù)中心。此外,增值評(píng)價(jià)對(duì)于數(shù)據(jù)的處理分析大多通過(guò)統(tǒng)計(jì)分析模型來(lái)實(shí)現(xiàn),要開(kāi)發(fā)更加準(zhǔn)確的增值評(píng)價(jià)模型,并且在實(shí)施時(shí)選擇最適合學(xué)校特點(diǎn)的模型,以促進(jìn)評(píng)價(jià)結(jié)果的準(zhǔn)確性與公平性。
(3) 調(diào)動(dòng)多元協(xié)同評(píng)價(jià)。目前增值評(píng)價(jià)在我國(guó)還沒(méi)有大規(guī)模推廣,應(yīng)調(diào)動(dòng)各方積極性、整合多方力量開(kāi)展和參與增值評(píng)價(jià)。高??梢詮膬蓚€(gè)方面來(lái)入手:一方面,學(xué)校內(nèi)部應(yīng)充分調(diào)動(dòng)學(xué)生參與評(píng)價(jià)的積極性,學(xué)生的積極性會(huì)直接影響數(shù)據(jù)的準(zhǔn)確度,并且在選擇指標(biāo)時(shí)應(yīng)充分聽(tīng)取學(xué)生意見(jiàn),確保評(píng)價(jià)指標(biāo)的全面性。另一方面,學(xué)校應(yīng)聯(lián)合校外技術(shù)部門(mén)以及教育相關(guān)部門(mén)共同實(shí)施評(píng)價(jià),在獲得技術(shù)支持之外,相關(guān)教育部門(mén)應(yīng)對(duì)評(píng)價(jià)過(guò)程起到一定監(jiān)督作用,以確保評(píng)價(jià)過(guò)程的公正進(jìn)行。
(4) 科學(xué)把握評(píng)價(jià)結(jié)果,合理利用評(píng)價(jià)結(jié)果。評(píng)價(jià)的最終目的是給出反饋,引導(dǎo)發(fā)展。評(píng)價(jià)結(jié)果需要具備一定的科學(xué)性與準(zhǔn)確性。應(yīng)當(dāng)建立問(wèn)責(zé)監(jiān)督機(jī)構(gòu),對(duì)評(píng)價(jià)結(jié)果進(jìn)行監(jiān)督與反饋,從而規(guī)范學(xué)校行為,引導(dǎo)學(xué)生發(fā)展。對(duì)于高校來(lái)講,教師應(yīng)對(duì)評(píng)價(jià)結(jié)果進(jìn)行充分分析,發(fā)現(xiàn)問(wèn)題與優(yōu)點(diǎn),從而改進(jìn)教學(xué)過(guò)程,及時(shí)引導(dǎo)學(xué)生。學(xué)??梢怨膭?lì)學(xué)生根據(jù)評(píng)價(jià)結(jié)果撰寫(xiě)分析報(bào)告,使學(xué)生對(duì)自身學(xué)業(yè)成績(jī)有更加清晰的了解,并且培養(yǎng)學(xué)生的自我反思能力。學(xué)生的反饋結(jié)果也可作為調(diào)整評(píng)價(jià)指標(biāo)的重要依據(jù)。對(duì)于相關(guān)教育部門(mén)來(lái)講,應(yīng)充分對(duì)評(píng)價(jià)結(jié)果進(jìn)行剖析,將評(píng)價(jià)結(jié)果作為制定相關(guān)教育政策的來(lái)源與依據(jù),促進(jìn)教育公平公正發(fā)展。