安潔 王寶琴 張飛龍 梁皓
摘 要:大學(xué)英語分級教學(xué)已成為大學(xué)英語教學(xué)改革的重要方向,但分級教學(xué)中評價公平性的質(zhì)疑制約著分級教學(xué)的發(fā)展,垂直等值以學(xué)生能力估計為目標(biāo),可以將不同級別的測試分?jǐn)?shù)轉(zhuǎn)化到相同的評價尺度,從而為分級教學(xué)評價提供了參考。結(jié)合本校大學(xué)英語分級教學(xué),探討了垂直等值在分級教學(xué)評價中的應(yīng)用方法。
關(guān)鍵詞:大學(xué)英語;分級教學(xué);評價方法;垂直等值
根據(jù)《大學(xué)英語課程教學(xué)要求》中“分類指導(dǎo)、因材施教”的要求,各高校在大學(xué)英語教學(xué)中普遍開展分級教學(xué),即在學(xué)生入學(xué)之初,按照成績高低將學(xué)生分成高、低兩個等級或高、中低三個等級,進(jìn)行差異化教學(xué)。這一模式根據(jù)學(xué)生個體差異,在課程設(shè)置、教學(xué)內(nèi)容、教學(xué)實(shí)施等方面進(jìn)行分類指導(dǎo),滿足學(xué)生個性化的學(xué)習(xí)需求,體現(xiàn)了因材施教,在提高教學(xué)效率,改善教學(xué)質(zhì)量等方面起到了積極作用,逐漸成為大學(xué)英語教學(xué)改革的重要方向。但是,在分級教學(xué)中也存在一些不可避免的問題。針對不同級別、不同水平的學(xué)生,仍然采用傳統(tǒng)的“一刀切”的測試評價方式,在有效性和公平性方面飽受質(zhì)疑,嚴(yán)重制約了分級教學(xué)的發(fā)展。針對這樣的問題,引入心理測量學(xué)研究領(lǐng)域中的垂直量表化方法,建立垂直量表體系,能夠?yàn)榻鉀Q大學(xué)英語分級教學(xué)的測試評價問題提供思路。
一、大學(xué)英語分級教學(xué)測試評價現(xiàn)狀
評價是教學(xué)系統(tǒng)中一個重要環(huán)節(jié),是教師獲取教學(xué)反饋信息,改進(jìn)教學(xué)管理、保證教學(xué)質(zhì)量的重要依據(jù),也是學(xué)生調(diào)整學(xué)習(xí)策略,改進(jìn)學(xué)習(xí)方法、提高學(xué)習(xí)效率的重要手段。隨著分級教學(xué)的開展,如何進(jìn)行科學(xué)、公平的評價也逐漸引起人們重視,開展了廣泛的研究。劉懷生[1]構(gòu)建了大學(xué)英語分級教學(xué)形成性評價體系,張愛玲[2]提出采用分階段性評價和影響因子等方法實(shí)現(xiàn)分級教學(xué)多元多層次綜合評價,以克服評價過程中多因素差異性評價帶來的不公,達(dá)到客觀公正。劉艷[3]研究了大學(xué)英語分級教學(xué)教師教學(xué)效果評價方案。
目前,分級教學(xué)評價通常采用形成性評價和考試評價相結(jié)合的方法,但是,由于分級教學(xué)在教材選擇、內(nèi)容安排、知識點(diǎn)設(shè)置、目標(biāo)要求等方面存在一定的差異,考核評價時,如果采用相同的試卷,題目的難易程度較難把握,題目較難對于低級別的學(xué)生有失公平,題目容易則難以反應(yīng)因材施教的效果;而如果按照不同級別采用不同的試卷進(jìn)行考核,英語單科成績可能會影響到一個學(xué)生的綜合測評,畢竟A級中85分和B級中的85分所代表的能力是不同的。因此,實(shí)現(xiàn)不同級別間分級考核成績的等值,對于解決分級考核公平性問題具有重要的意義。
二、垂直等值
垂直等值開始于心理學(xué)研究領(lǐng)域,由法國心理學(xué)家比奈提出,也叫垂直等值或垂直鏈接。垂直等值是通過將不同水平測試的試題等值到同一量表上,估計每個級別每位考生的能力,將學(xué)生在各個級別水平測試的表現(xiàn)轉(zhuǎn)換到同一分?jǐn)?shù)尺度上,使不同水平的測試結(jié)果能夠進(jìn)行比較。
目前,垂直量表化已成為大規(guī)模標(biāo)準(zhǔn)化測驗(yàn)中不可或缺的一個重要環(huán)節(jié)。美國在2002年就開始采用垂直量表體系,將不同年級的評估結(jié)果放到一個共同的量表中進(jìn)行衡量從而來檢測學(xué)生進(jìn)步,TOFEL和GRE更是測試領(lǐng)域垂直量表化應(yīng)用的典范。而在我國,如何使測試評價體系更公正一直備受關(guān)注,但從現(xiàn)有的文獻(xiàn)我們可以發(fā)現(xiàn),多數(shù)研究側(cè)重于水平量表的研究,而垂直量表的研究相對較少,2010年王燁暉[]等提到了垂直等值的概念,此后,關(guān)寧[4]等對垂直量表體系在大學(xué)英語分級測試中的可行性進(jìn)行了探討,但真正實(shí)現(xiàn)大學(xué)英語分級測試的垂直量表化還需要大量研究工作。
三、垂直等值在大學(xué)英語分級教學(xué)評價中的應(yīng)用
本研究旨在將探討垂直等值在大學(xué)英語分級教學(xué)評價中的應(yīng)用,探討不同級別之間等值方法,并為學(xué)生發(fā)展性量表的建立提供數(shù)據(jù)基礎(chǔ),因此,在構(gòu)建過程中結(jié)合本校大學(xué)英語分級教學(xué)辦法,將學(xué)生分為A、B兩個級別,其中A級為高級別,B級為低級別??紤]到成長性量表的構(gòu)建,將兩個年級同時納入評價范圍,將其分為A1,A2,B1,B2四個級別。各級別能力要求按照A2>B2>A1>B1。
構(gòu)建垂直量表通常包括數(shù)據(jù)收集方案設(shè)計、模型選擇、參數(shù)估計方法選擇、構(gòu)建垂直等值量表四大步驟。每個步驟都對等值結(jié)果產(chǎn)生一定的影響,因此,在設(shè)計過程中,要充分考慮各種因素,減小等值誤差。
(一)數(shù)據(jù)收集方案設(shè)計
垂直等值有三種基本的數(shù)據(jù)收集設(shè)計方案:錨題設(shè)計、等組設(shè)計和錨測試設(shè)計。其中,錨題設(shè)計不需要額外的測試,最容易實(shí)施,應(yīng)用也較為廣泛。
錨題是各級別之間的鏈接,錨題的質(zhì)量直接關(guān)系到等值的可靠性,黎光明[5]認(rèn)為,當(dāng)錨題比例為30%時,垂直等值的精度相對最高,產(chǎn)生的等值誤差相對最小,因此,在不考慮其它條件影響的情況下,錨題比例設(shè)為30%。錨題設(shè)計如圖1所示:
在題型選擇上,大學(xué)英語測試通常包括:聽力、詞匯、閱讀、翻譯、寫作等五部分內(nèi)容,其中,聽力、詞匯、閱讀為客觀性試題,題目較多,評分客觀,較容易滿足等值條件,但容易引入猜測誤差;翻譯、寫作為主觀性試題,能夠反映學(xué)生的真實(shí)能力,但等值難度較大,評分容易受到評分者效應(yīng)影響,等值難度較大,目前尚缺乏有效的方法,因此,在錨題選擇上采用客觀性試題進(jìn)行鏈接。并在題目選擇上,選取難度、區(qū)分度適中的題目,避免過難或過容易的題目。
(二)等值模型選擇。垂直等值有三種基本分?jǐn)?shù)轉(zhuǎn)換方法,即Thurstone方法、Hieronymus方法和項(xiàng)目反應(yīng)理論(簡稱IRT)方法。IRT方法根據(jù)被試者的作答模式估計被試者的能力值,不需要考慮被試的能力分布,因此,該方法已逐漸成為垂直等值量表構(gòu)建的主要方法。
(三)參數(shù)估計
參數(shù)估計是把不同能力的測試數(shù)據(jù)轉(zhuǎn)換到同一尺度上,以構(gòu)建共同量表。常用的估計方法有分別估計和同時估計。分別估計對每個級別成績的參數(shù)進(jìn)行估計,然后利用鏈接,通過回歸法、平均數(shù)法、標(biāo)準(zhǔn)差法、Stocking-Lord法等方法,將項(xiàng)目參數(shù)估計放在同一量表上,是一種比較保險的方法。同時估計將所有級別的測試數(shù)據(jù)同時進(jìn)行估計,一般能產(chǎn)生穩(wěn)定的結(jié)果。
(四)垂直等值量表的構(gòu)建
能力水平的估計是在等值量表的基礎(chǔ)上估計學(xué)生的能力水平,構(gòu)建垂直量表,常用的方法有極大似然估計、期望后驗(yàn)估計和極大后驗(yàn)估計等方法估算各級別所有考生的能力值,然后采用線性轉(zhuǎn)換公式,可計算出各級別考生在新量表上的平均分和標(biāo)準(zhǔn)差將其轉(zhuǎn)換為常規(guī)分?jǐn)?shù)。從而講各個級別的分?jǐn)?shù)統(tǒng)一到相同的尺度上。
(五)垂直量表在評價中的應(yīng)用
為體現(xiàn)評價公平性,尤其是學(xué)生關(guān)心的分?jǐn)?shù)對獎學(xué)金評比,評優(yōu)、評比等問題,應(yīng)用垂直等值量表對于同一年級不同級別的學(xué)生進(jìn)行等值。同時,構(gòu)建不同年級、級別之間的等值量表,對跨年級級別之間的量表分?jǐn)?shù)進(jìn)行比較,檢驗(yàn)學(xué)生是否該級別達(dá)到該級別預(yù)期的目標(biāo),作為學(xué)生進(jìn)步幅度的評價指標(biāo)。
四、結(jié)論
在本校大學(xué)英語分級教學(xué)中,結(jié)合期末考試探索了垂直量表在分級教學(xué)中的應(yīng)用,構(gòu)建了不同年級、級別之間的等值垂直量表,其結(jié)果可以為學(xué)生分級評價及發(fā)展評價提供參考。但是由于垂直量表構(gòu)建過程中影響因素較多,如:分級測試中樣本量、錨題質(zhì)量、題目難度、區(qū)分度、方法的選擇等都會影響等值的效果,目前尚缺少統(tǒng)一有效的方法,有待于進(jìn)一步進(jìn)行研究。
參考文獻(xiàn)
[1]劉懷生,劉光成.大學(xué)英語分級教學(xué)形成性評價體系構(gòu)建[J],課程研究,2019.07:46-47.
[2]張愛玲,陶華.高職英語分級教學(xué)中差異化評價的公平性研究[J],江蘇建筑職業(yè)技術(shù)學(xué)院學(xué)報,2019.12:58-61.
[3]劉艷.大學(xué)英語分級教學(xué)教師教學(xué)效果評價方案的研究[J].遼寧科技學(xué)院學(xué)報,2017,19(5):58-59.
[4]黎光明,梁正妍.錨題比例與年級離散度對垂直等值的影響[J].江西師范大學(xué)學(xué)報(自然科學(xué)版),2019.1:52-58.
[5]關(guān)寧,陳福明.大學(xué)英語分級測試垂直量表體系構(gòu)建的可行性探析[J].黑龍江教育(高教研究與評估),2016.06:54-55.
課題信息:“本文系2017年河北省高等學(xué)校社科研究年度基金項(xiàng)目(項(xiàng)目編號SQ171190)研究成果”