垂直等值在大學(xué)英語分級教學(xué)評價中的應(yīng)用研究

2020-10-20 07:21:31安潔王寶琴張飛龍梁皓

錦繡·上旬刊 2020年6期

安潔王寶琴張飛龍梁皓

摘要：大學(xué)英語分級教學(xué)已成為大學(xué)英語教學(xué)改革的重要方向，但分級教學(xué)中評價公平性的質(zhì)疑制約著分級教學(xué)的發(fā)展，垂直等值以學(xué)生能力估計為目標(biāo)，可以將不同級別的測試分?jǐn)?shù)轉(zhuǎn)化到相同的評價尺度，從而為分級教學(xué)評價提供了參考。結(jié)合本校大學(xué)英語分級教學(xué)，探討了垂直等值在分級教學(xué)評價中的應(yīng)用方法。

關(guān)鍵詞：大學(xué)英語;分級教學(xué);評價方法;垂直等值

根據(jù)《大學(xué)英語課程教學(xué)要求》中“分類指導(dǎo)、因材施教”的要求，各高校在大學(xué)英語教學(xué)中普遍開展分級教學(xué)，即在學(xué)生入學(xué)之初，按照成績高低將學(xué)生分成高、低兩個等級或高、中低三個等級，進(jìn)行差異化教學(xué)。這一模式根據(jù)學(xué)生個體差異，在課程設(shè)置、教學(xué)內(nèi)容、教學(xué)實(shí)施等方面進(jìn)行分類指導(dǎo)，滿足學(xué)生個性化的學(xué)習(xí)需求，體現(xiàn)了因材施教，在提高教學(xué)效率，改善教學(xué)質(zhì)量等方面起到了積極作用，逐漸成為大學(xué)英語教學(xué)改革的重要方向。但是，在分級教學(xué)中也存在一些不可避免的問題。針對不同級別、不同水平的學(xué)生，仍然采用傳統(tǒng)的“一刀切”的測試評價方式，在有效性和公平性方面飽受質(zhì)疑，嚴(yán)重制約了分級教學(xué)的發(fā)展。針對這樣的問題，引入心理測量學(xué)研究領(lǐng)域中的垂直量表化方法，建立垂直量表體系，能夠?yàn)榻鉀Q大學(xué)英語分級教學(xué)的測試評價問題提供思路。

一、大學(xué)英語分級教學(xué)測試評價現(xiàn)狀

評價是教學(xué)系統(tǒng)中一個重要環(huán)節(jié)，是教師獲取教學(xué)反饋信息，改進(jìn)教學(xué)管理、保證教學(xué)質(zhì)量的重要依據(jù)，也是學(xué)生調(diào)整學(xué)習(xí)策略，改進(jìn)學(xué)習(xí)方法、提高學(xué)習(xí)效率的重要手段。隨著分級教學(xué)的開展，如何進(jìn)行科學(xué)、公平的評價也逐漸引起人們重視，開展了廣泛的研究。劉懷生[1]構(gòu)建了大學(xué)英語分級教學(xué)形成性評價體系，張愛玲[2]提出采用分階段性評價和影響因子等方法實(shí)現(xiàn)分級教學(xué)多元多層次綜合評價，以克服評價過程中多因素差異性評價帶來的不公，達(dá)到客觀公正。劉艷[3]研究了大學(xué)英語分級教學(xué)教師教學(xué)效果評價方案。

目前，分級教學(xué)評價通常采用形成性評價和考試評價相結(jié)合的方法，但是，由于分級教學(xué)在教材選擇、內(nèi)容安排、知識點(diǎn)設(shè)置、目標(biāo)要求等方面存在一定的差異，考核評價時，如果采用相同的試卷，題目的難易程度較難把握，題目較難對于低級別的學(xué)生有失公平，題目容易則難以反應(yīng)因材施教的效果;而如果按照不同級別采用不同的試卷進(jìn)行考核，英語單科成績可能會影響到一個學(xué)生的綜合測評，畢竟A級中85分和B級中的85分所代表的能力是不同的。因此，實(shí)現(xiàn)不同級別間分級考核成績的等值，對于解決分級考核公平性問題具有重要的意義。

二、垂直等值

垂直等值開始于心理學(xué)研究領(lǐng)域，由法國心理學(xué)家比奈提出，也叫垂直等值或垂直鏈接。垂直等值是通過將不同水平測試的試題等值到同一量表上，估計每個級別每位考生的能力，將學(xué)生在各個級別水平測試的表現(xiàn)轉(zhuǎn)換到同一分?jǐn)?shù)尺度上，使不同水平的測試結(jié)果能夠進(jìn)行比較。

目前，垂直量表化已成為大規(guī)模標(biāo)準(zhǔn)化測驗(yàn)中不可或缺的一個重要環(huán)節(jié)。美國在2002年就開始采用垂直量表體系，將不同年級的評估結(jié)果放到一個共同的量表中進(jìn)行衡量從而來檢測學(xué)生進(jìn)步，TOFEL和GRE更是測試領(lǐng)域垂直量表化應(yīng)用的典范。而在我國，如何使測試評價體系更公正一直備受關(guān)注，但從現(xiàn)有的文獻(xiàn)我們可以發(fā)現(xiàn)，多數(shù)研究側(cè)重于水平量表的研究，而垂直量表的研究相對較少，2010年王燁暉[]等提到了垂直等值的概念，此后，關(guān)寧[4]等對垂直量表體系在大學(xué)英語分級測試中的可行性進(jìn)行了探討，但真正實(shí)現(xiàn)大學(xué)英語分級測試的垂直量表化還需要大量研究工作。

三、垂直等值在大學(xué)英語分級教學(xué)評價中的應(yīng)用

本研究旨在將探討垂直等值在大學(xué)英語分級教學(xué)評價中的應(yīng)用，探討不同級別之間等值方法，并為學(xué)生發(fā)展性量表的建立提供數(shù)據(jù)基礎(chǔ)，因此，在構(gòu)建過程中結(jié)合本校大學(xué)英語分級教學(xué)辦法，將學(xué)生分為A、B兩個級別，其中A級為高級別，B級為低級別?？紤]到成長性量表的構(gòu)建，將兩個年級同時納入評價范圍，將其分為A1，A2，B1，B2四個級別。各級別能力要求按照A2>B2>A1>B1。

構(gòu)建垂直量表通常包括數(shù)據(jù)收集方案設(shè)計、模型選擇、參數(shù)估計方法選擇、構(gòu)建垂直等值量表四大步驟。每個步驟都對等值結(jié)果產(chǎn)生一定的影響，因此，在設(shè)計過程中，要充分考慮各種因素，減小等值誤差。

（一）數(shù)據(jù)收集方案設(shè)計

垂直等值有三種基本的數(shù)據(jù)收集設(shè)計方案：錨題設(shè)計、等組設(shè)計和錨測試設(shè)計。其中，錨題設(shè)計不需要額外的測試，最容易實(shí)施，應(yīng)用也較為廣泛。

錨題是各級別之間的鏈接，錨題的質(zhì)量直接關(guān)系到等值的可靠性，黎光明[5]認(rèn)為，當(dāng)錨題比例為30%時，垂直等值的精度相對最高，產(chǎn)生的等值誤差相對最小，因此，在不考慮其它條件影響的情況下，錨題比例設(shè)為30%。錨題設(shè)計如圖1所示：

在題型選擇上，大學(xué)英語測試通常包括：聽力、詞匯、閱讀、翻譯、寫作等五部分內(nèi)容，其中，聽力、詞匯、閱讀為客觀性試題，題目較多，評分客觀，較容易滿足等值條件，但容易引入猜測誤差;翻譯、寫作為主觀性試題，能夠反映學(xué)生的真實(shí)能力，但等值難度較大，評分容易受到評分者效應(yīng)影響，等值難度較大，目前尚缺乏有效的方法，因此，在錨題選擇上采用客觀性試題進(jìn)行鏈接。并在題目選擇上，選取難度、區(qū)分度適中的題目，避免過難或過容易的題目。

（二）等值模型選擇。垂直等值有三種基本分?jǐn)?shù)轉(zhuǎn)換方法，即Thurstone方法、Hieronymus方法和項(xiàng)目反應(yīng)理論（簡稱IRT）方法。IRT方法根據(jù)被試者的作答模式估計被試者的能力值，不需要考慮被試的能力分布，因此，該方法已逐漸成為垂直等值量表構(gòu)建的主要方法。

（三）參數(shù)估計

參數(shù)估計是把不同能力的測試數(shù)據(jù)轉(zhuǎn)換到同一尺度上，以構(gòu)建共同量表。常用的估計方法有分別估計和同時估計。分別估計對每個級別成績的參數(shù)進(jìn)行估計，然后利用鏈接，通過回歸法、平均數(shù)法、標(biāo)準(zhǔn)差法、Stocking-Lord法等方法，將項(xiàng)目參數(shù)估計放在同一量表上，是一種比較保險的方法。同時估計將所有級別的測試數(shù)據(jù)同時進(jìn)行估計，一般能產(chǎn)生穩(wěn)定的結(jié)果。

（四）垂直等值量表的構(gòu)建

能力水平的估計是在等值量表的基礎(chǔ)上估計學(xué)生的能力水平，構(gòu)建垂直量表，常用的方法有極大似然估計、期望后驗(yàn)估計和極大后驗(yàn)估計等方法估算各級別所有考生的能力值，然后采用線性轉(zhuǎn)換公式，可計算出各級別考生在新量表上的平均分和標(biāo)準(zhǔn)差將其轉(zhuǎn)換為常規(guī)分?jǐn)?shù)。從而講各個級別的分?jǐn)?shù)統(tǒng)一到相同的尺度上。

（五）垂直量表在評價中的應(yīng)用

為體現(xiàn)評價公平性，尤其是學(xué)生關(guān)心的分?jǐn)?shù)對獎學(xué)金評比，評優(yōu)、評比等問題，應(yīng)用垂直等值量表對于同一年級不同級別的學(xué)生進(jìn)行等值。同時，構(gòu)建不同年級、級別之間的等值量表，對跨年級級別之間的量表分?jǐn)?shù)進(jìn)行比較，檢驗(yàn)學(xué)生是否該級別達(dá)到該級別預(yù)期的目標(biāo)，作為學(xué)生進(jìn)步幅度的評價指標(biāo)。

四、結(jié)論

在本校大學(xué)英語分級教學(xué)中，結(jié)合期末考試探索了垂直量表在分級教學(xué)中的應(yīng)用，構(gòu)建了不同年級、級別之間的等值垂直量表，其結(jié)果可以為學(xué)生分級評價及發(fā)展評價提供參考。但是由于垂直量表構(gòu)建過程中影響因素較多，如：分級測試中樣本量、錨題質(zhì)量、題目難度、區(qū)分度、方法的選擇等都會影響等值的效果，目前尚缺少統(tǒng)一有效的方法，有待于進(jìn)一步進(jìn)行研究。

參考文獻(xiàn)

[1]劉懷生，劉光成.大學(xué)英語分級教學(xué)形成性評價體系構(gòu)建[J]，課程研究，2019.07：46-47.

[2]張愛玲，陶華.高職英語分級教學(xué)中差異化評價的公平性研究[J]，江蘇建筑職業(yè)技術(shù)學(xué)院學(xué)報，2019.12：58-61.

[3]劉艷.大學(xué)英語分級教學(xué)教師教學(xué)效果評價方案的研究[J].遼寧科技學(xué)院學(xué)報，2017，19（5）：58-59.

[4]黎光明，梁正妍.錨題比例與年級離散度對垂直等值的影響[J].江西師范大學(xué)學(xué)報（自然科學(xué)版），2019.1：52-58.

[5]關(guān)寧，陳福明.大學(xué)英語分級測試垂直量表體系構(gòu)建的可行性探析[J].黑龍江教育（高教研究與評估），2016.06：54-55.

課題信息：“本文系2017年河北省高等學(xué)校社科研究年度基金項(xiàng)目（項(xiàng)目編號SQ171190）研究成果”