王戰(zhàn)旗
摘要: 在中小學(xué)英語閱讀理解命題生詞率控制方面,教師普遍缺乏簡單、高效的生詞率檢測工具,已有生詞率統(tǒng)計(jì)方式或者效率低、誤差大,或者流程復(fù)雜。為解決此問題,特編制一個(gè)專門用于生詞率統(tǒng)計(jì)的工具,內(nèi)嵌人教版小學(xué)、初中、高中三套教材的單元詞表,直觀呈現(xiàn)閱讀理解題中的單詞以及生詞,避免因生詞量過大導(dǎo)致題目區(qū)分度下降、教學(xué)效果不明顯,以及學(xué)生學(xué)習(xí)積極性不高等。
關(guān)鍵詞:中小學(xué)英語;閱讀理解;測試命題;生詞率;統(tǒng)計(jì)工具
英語教學(xué)中,測試具有多方面的作用,比如幫助教師了解學(xué)生學(xué)習(xí)進(jìn)度,為教師教學(xué)效果提供評(píng)價(jià)依據(jù),幫助學(xué)生發(fā)現(xiàn)學(xué)習(xí)中的不足,指明下一步學(xué)習(xí)方向等??梢?,測試在英語教學(xué)中占據(jù)非常重要的地位,并對(duì)教學(xué)產(chǎn)生重要影響。如果測試題的編制出現(xiàn)問題,不僅會(huì)導(dǎo)致師生無法很好地實(shí)現(xiàn)預(yù)期的測試目標(biāo),有時(shí)還會(huì)對(duì)教師教學(xué)產(chǎn)生不利的影響[1]。而測試出現(xiàn)問題,有時(shí)是因?yàn)榻處熑狈碚撝笇?dǎo),有時(shí)則是因?yàn)槿狈侠淼氖侄魏凸ぞ摺?/p>
閱讀理解是中小學(xué)英語測試中的一種重要題型,它考查的是學(xué)生的閱讀能力。很多研究表明,影響學(xué)生閱讀能力的因素很多,文本中的生詞量則是影響閱讀理解效果的重要因素[2-4]。一項(xiàng)實(shí)證研究發(fā)現(xiàn),在不借助詞典等工具閱讀虛構(gòu)文本的情況下,當(dāng)生詞率為20%時(shí),被試的閱讀理解情況不佳;當(dāng)生詞覆蓋率為5%和10%時(shí),只有極少部分人的閱讀理解情況尚可,大部分人的閱讀理解情況依然不理想。經(jīng)過對(duì)數(shù)據(jù)進(jìn)行回歸分析,該研究認(rèn)為只有當(dāng)生詞率在2%以內(nèi)時(shí),閱讀者才能不借助任何工具順利地完成閱讀[5]。國內(nèi)的一項(xiàng)研究也得出了類似結(jié)論[6]。
既然詞匯量對(duì)閱讀理解的影響如此之大,那么英語測試就要注意把生詞控制在合理的范圍內(nèi),以免學(xué)生覺得生詞過多、試題過難,出現(xiàn)“地板效應(yīng)”。當(dāng)然,也要避免應(yīng)檢測的新學(xué)詞匯沒有呈現(xiàn),使試題過于簡單,出現(xiàn)“天花板效應(yīng)”。
那么,國內(nèi)教師在英語測試閱讀理解命題中生詞率控制方面的觀念和做法如何呢?本研究首先對(duì)我國英語教師進(jìn)行了問卷調(diào)查,發(fā)現(xiàn)教師普遍缺乏簡單、高效檢測生詞率的方法,然后介紹目前常見的生詞率統(tǒng)計(jì)方式,最后介紹本研究嘗試編制的計(jì)算機(jī)生詞率統(tǒng)計(jì)工具。
一、我國教師英語測試閱讀理解命題中生詞率控制現(xiàn)狀調(diào)查和結(jié)果分析
為了解國內(nèi)教師在英語測試閱讀理解命題中生詞率控制方面的觀念和實(shí)際做法,筆者在2021年9月做了一次網(wǎng)絡(luò)問卷調(diào)查,共收到來自全國17個(gè)?。ㄗ灾螀^(qū)、直轄市)的有效問卷708份。被調(diào)查者基本信息見表1。
調(diào)查結(jié)果表明,在708名英語教師和教研員中,54.9%的人(389人)參加過英語測試命題。在這部分被調(diào)查者中,99.2%的人(386人)認(rèn)為“應(yīng)該把閱讀理解題的生詞率控制在一定范圍內(nèi)”。持此觀點(diǎn)的386人中,98.2%的人(382人)稱在英語試題編制時(shí)會(huì)對(duì)閱讀理解題的生詞率進(jìn)行控制。但是在這382人中,63.1%的人(241人)控制生詞率的方式是“進(jìn)行大致估計(jì),不進(jìn)行量化判斷”,只有36.9%的人(141人)“通過量化計(jì)算”來控制生詞率。其中,62.4%的人(88人)通過人工統(tǒng)計(jì)的方式計(jì)算生詞率,37.6%的人(53人,占參與過命題者人數(shù)的13.6%)使用計(jì)算機(jī)工具計(jì)算生詞率。
對(duì)于使用計(jì)算機(jī)工具控制生詞率的情況,調(diào)查問卷進(jìn)一步提供6個(gè)選項(xiàng)(多選題):Word、Excel、安東尼(Anthony)開發(fā)的Ant Word Profiler、希特利(Heatley)等人開發(fā)的Range、自己開發(fā)的工具,以及其他情況。這些選項(xiàng)涵蓋普通的文字工具以及專業(yè)的詞匯分析工具,并提供自定義選項(xiàng)。由被調(diào)查者的選擇統(tǒng)計(jì)情況可知(如圖1),絕大部分人用的是非專業(yè)的文字處理工具,如Word、Excel等,使用Ant Word Profiler、Range等專業(yè)詞匯分析工具的人非常少,也沒有自主研發(fā)工具控制生詞率。
由本次調(diào)查可知,英語教師基本上都認(rèn)為英語測試中的閱讀理解題需要控制生詞率,在實(shí)踐中也以某種方式實(shí)施。但是大多數(shù)教師只是憑感覺和經(jīng)驗(yàn)進(jìn)行大致判斷,只有少數(shù)教師通過計(jì)算機(jī)工具進(jìn)行量化統(tǒng)計(jì)。在使用的工具中,絕大部分教師用的是Word、Excel,只有極個(gè)別教師使用比較專業(yè)的詞匯分析工具,如Ant Word Profiler、Range等。那么,這些工具是否適用于英語測試題編制中的生詞率統(tǒng)計(jì)呢?下面對(duì)這些工具的使用方法進(jìn)行分析。
二、教師常用生詞率統(tǒng)計(jì)工具比較
(一)利用Word統(tǒng)計(jì)生詞率
用Word進(jìn)行生詞率統(tǒng)計(jì),基本流程如下:教師準(zhǔn)備一份截至目標(biāo)檢測單元已學(xué)單詞的詞表,對(duì)閱讀理解題的語篇逐詞查看并判斷,對(duì)生詞進(jìn)行特殊標(biāo)記,比如用某種顏色突出顯示;對(duì)語篇全部完成標(biāo)記后統(tǒng)計(jì)生詞數(shù)量;然后利用Word的“字?jǐn)?shù)統(tǒng)計(jì)”功能得出總單詞數(shù)(在“審閱”選項(xiàng)卡“校對(duì)”區(qū),對(duì)英文單詞數(shù)的統(tǒng)計(jì)是統(tǒng)計(jì)信息中的“字?jǐn)?shù)”,注意不是“字符數(shù)”),生詞總數(shù)除以總字?jǐn)?shù),即可得出生詞率。
(二)利用Excel統(tǒng)計(jì)生詞率
使用Excel統(tǒng)計(jì)生詞率的流程比較復(fù)雜。以下是其中一種統(tǒng)計(jì)生詞率的方法。這種方法同樣要求教師準(zhǔn)備如前所述的詞表,并且對(duì)于任何截至目標(biāo)單元學(xué)生應(yīng)該掌握的英語屈折變化形式都要包括進(jìn)來。首先,利用Word的查找替換功能把要檢測生詞率的閱讀理解語篇用空格替換為回車符,使文本呈現(xiàn)一個(gè)單詞一行的格式,去掉無關(guān)的標(biāo)點(diǎn)符號(hào);然后,選擇全部文本,粘貼到Excel表格的一列中(比如A列);接著,把準(zhǔn)備好的詞表按一個(gè)單詞一行的方式放至另一列(比如B列),之后在另一個(gè)空列(比如C列)用函數(shù)功能對(duì)比A列每一個(gè)單詞是否出現(xiàn)在B列中,如果出現(xiàn)代表學(xué)生學(xué)過該詞,未出現(xiàn)則代表這是一個(gè)生詞。具體實(shí)現(xiàn)對(duì)比的函數(shù)可以有不同的方式,一種方式如“IF(ISERROR(MATCH(A1, $B$1:$B$X, 0)), "", A1) ”,注意把函數(shù)中的X替換為詞匯表的實(shí)際長度,即把該公式輸入C列第一行單元格,然后通過快速單元格復(fù)制到和語篇列表具有同樣的數(shù)量。這個(gè)公式利用了Excel的三個(gè)函數(shù)嵌套實(shí)現(xiàn)對(duì)比,并把詞表中包含的詞寫入C列,然后計(jì)算C列的空格數(shù),除以A列總單詞數(shù),即可得到語篇的生詞率。
(三)利用Ant Word Profiler統(tǒng)計(jì)生詞率
除了用常見的文字和電子制表工具統(tǒng)計(jì)生詞率外,教師還可用專業(yè)的詞匯分析軟件計(jì)算生詞率??梢詫?shí)現(xiàn)該功能的軟件有安東尼編制的Ant Word Profiler[7]和希特利等人編制的Range[8]等。
使用Ant Word Profiler統(tǒng)計(jì)生詞率,和運(yùn)用Excel統(tǒng)計(jì)生詞率方法一樣,需要準(zhǔn)備同樣的詞表,然后按照軟件要求的格式對(duì)詞表進(jìn)行處理(每個(gè)單詞的原形形式獨(dú)立一行,每個(gè)屈折變化形式另起一行后加TAB符后列出),最后把詞表放入一個(gè)文本文件。接著,把要分析的閱讀理解題放入另一文本文件并保存。在軟件主界面,清空左下角的分級(jí)詞表列表,選擇前面做的詞表文本文件作為詞匯分析的基礎(chǔ)詞表。之后,在左上角的用戶文件區(qū)點(diǎn)擊“Choose”按鈕選擇要分析的閱讀語篇文本文件加載,單擊下邊列表框中列出的相應(yīng)文件,點(diǎn)擊“View”按鈕,彈出新窗口,點(diǎn)擊“Non-Level List Word”,在右上角的“Token Coverage”中顯示的數(shù)字即為該語篇的生詞率(如圖2)。
通過對(duì)以上三種生詞率統(tǒng)計(jì)方法的介紹,我們可以很明顯地看出它們各有優(yōu)缺點(diǎn)。用Word統(tǒng)計(jì)生詞率流程簡單,但是判斷生詞時(shí)需要人工,耗時(shí)耗力,效率極低,誤差大。用Excel統(tǒng)計(jì)生詞率準(zhǔn)確率高,但是操作復(fù)雜:一是須和Word軟件配合使用;二是需要準(zhǔn)備復(fù)雜的詞表;三是需要掌握Excel函數(shù)的使用方法。用Ant Word Profiler統(tǒng)計(jì)生詞率的流程比較簡單,但同樣需要準(zhǔn)備復(fù)雜的詞表,而且詞表需要按照軟件要求格式處理,對(duì)使用者的能力要求較高。實(shí)際上,制作已學(xué)詞表耗時(shí)費(fèi)力,且不同的單元都需要做新的詞表,對(duì)于教師而言過于繁雜。
由上述分析可知,目前教師使用的生詞率統(tǒng)計(jì)方式或者效率太低、誤差大,或者流程復(fù)雜,且需要教師制作多個(gè)已學(xué)詞表(如果是以單元檢測為目的,每個(gè)單元都需要編制一個(gè)詞表)。這或許也解釋了本研究問卷調(diào)查中發(fā)現(xiàn)的一個(gè)有趣的現(xiàn)象:教師普遍接受需要控制生詞率這一理念,但在實(shí)際操作中對(duì)生詞率只進(jìn)行大致估計(jì),而不進(jìn)行量化。為了解決此問題,筆者編制了一個(gè)專門用于統(tǒng)計(jì)生詞率的工具,內(nèi)嵌人教版小學(xué)、初中、高中三套教材的單元詞表,使用者只需簡單的操作就能快速便捷地計(jì)算出閱讀理解題語篇的生詞率,從而根據(jù)生詞率情況進(jìn)行相應(yīng)調(diào)整,如用簡單的詞改寫、括注生詞等。下面對(duì)該工具的編制及使用進(jìn)行說明。
三、生詞率統(tǒng)計(jì)工具的開發(fā)與應(yīng)用
(一)詞表的編制
要編制具有生詞率統(tǒng)計(jì)功能的軟件工具,首先要解決的是詞表問題。有了詞表,才能用編程手段對(duì)比并統(tǒng)計(jì)生詞率。現(xiàn)行國家課程標(biāo)準(zhǔn)對(duì)義務(wù)教育階段及高中階段學(xué)生應(yīng)該掌握的詞匯有明確的規(guī)定,教材是以課程標(biāo)準(zhǔn)的規(guī)定為依據(jù)編寫的[9],詞匯也是根據(jù)課標(biāo)規(guī)定系統(tǒng)安排的,并在學(xué)段結(jié)束時(shí)完成相應(yīng)課標(biāo)詞匯的呈現(xiàn)和復(fù)現(xiàn)。因此,編制英語測試題對(duì)詞匯的考查也應(yīng)結(jié)合教材及教學(xué)進(jìn)度進(jìn)行。也就是說,制作詞表需要統(tǒng)計(jì)教材各單元依次呈現(xiàn)的所有課標(biāo)詞匯。這里說的“所有課標(biāo)詞匯”,既包括單詞原形,也包括按照教材編寫中相應(yīng)單元要求學(xué)生掌握的單詞的屈折變化形式,如名詞單復(fù)數(shù)變化,動(dòng)詞的原形、第三人稱單數(shù)、過去式、過去分詞、現(xiàn)在分詞,形容詞和副詞的原形、比較級(jí)、最高級(jí)等。
基于上述分析,本研究編制了包含33568個(gè)英語詞條(lemma)的普通單詞詞表,加上單詞的屈折變化形式共72221個(gè)詞型(word type),如詞條take包含原形take、動(dòng)詞第三人稱單數(shù)takes、動(dòng)詞過去式took、過去分詞taken及現(xiàn)在進(jìn)行時(shí)taking共5個(gè)詞型。為了更好地識(shí)別專有名詞,本研究還編制了包含17677個(gè)人名的人名詞表和包含549個(gè)常見地名的地名詞表,然后收集了人教版小學(xué)英語(PEP)、初中新目標(biāo)英語,以及2019年版普通高中英語的全部文本,編制軟件提取出各單元的課標(biāo)詞匯。
(二)工具的編制和說明
1.工具的編制思路
本研究編制的生詞率統(tǒng)計(jì)軟件的工作原理很直觀:首先,使用者輸入文本并指定教材和目標(biāo)單元信息,即檢測的是哪套教材的哪個(gè)單元(如果是期末檢測,選擇最后一個(gè)單元即可);其次,運(yùn)用計(jì)算機(jī)程序調(diào)入對(duì)應(yīng)教材對(duì)應(yīng)單元的課標(biāo)詞表,并把使用者提供的文本去掉無關(guān)符號(hào)后切分為一個(gè)一個(gè)的單詞,然后將每一個(gè)詞與詞表做對(duì)比;最后,統(tǒng)計(jì)出所有不在詞表里的單詞數(shù)量,除以文本總字?jǐn)?shù),即可得到生詞率。
2.工具的操作說明
考慮到國內(nèi)一般使用者的需求,本研究編制的生詞率統(tǒng)計(jì)軟件工具以視窗(Windows)系統(tǒng)為目標(biāo)平臺(tái)。由于本工具解決的首要問題就是易用性,這也是目前國內(nèi)教師面臨的最大挑戰(zhàn),因此在用戶交互界面設(shè)計(jì)方面盡量簡潔。本工具的開發(fā)以計(jì)算機(jī)語言C#實(shí)現(xiàn),程序主界面左側(cè)上邊是使用者操作區(qū)。使用者只需把編制好的閱讀理解題放入特定文本文件,點(diǎn)擊“打開文件”,選擇該文件,即可把文件里的文本載入右邊的文本框(使用者也可從其他文本編輯界面把要分析的內(nèi)容直接拷貝并粘貼到該文本框)。然后,使用者選擇測驗(yàn)針對(duì)的教材和目標(biāo)單元,點(diǎn)擊“開始統(tǒng)計(jì)”,該文本的生詞率即可很快顯示在信息輸出區(qū)。本工具能自動(dòng)識(shí)別出已學(xué)的課標(biāo)詞匯和人名、地名等專有名詞以及生詞,將其分別列在“已學(xué)+排除詞”和“未學(xué)詞”兩個(gè)列表中。實(shí)際應(yīng)用中,如果出現(xiàn)一些未包含在軟件詞表中的人名、地名,或者已經(jīng)括注了的生詞,或者教師認(rèn)為學(xué)生根據(jù)學(xué)習(xí)過的構(gòu)詞法知識(shí)能夠理解的派生詞,可以手動(dòng)把這些詞調(diào)整到右側(cè)的“已學(xué)+排除詞”列表,生詞率也會(huì)實(shí)時(shí)自動(dòng)重新計(jì)算。
3.工具使用過程說明
本工具開發(fā)完成后,筆者挑選了現(xiàn)有的一些閱讀理解題,首先人工仔細(xì)計(jì)算生詞率,然后用本工具進(jìn)行統(tǒng)計(jì),對(duì)比結(jié)果表明,該工具效率高,準(zhǔn)確性也很可靠。下面以2021年全國新高考英語試卷I的一篇閱讀理解題為例說明使用該工具統(tǒng)計(jì)生詞率的過程,并提出一些統(tǒng)計(jì)的基本原則(如圖3)。
首先,點(diǎn)擊“打開文件”導(dǎo)入該篇閱讀理解題,在“選擇測試目標(biāo)”部分選擇“高中”,并勾選“畢業(yè)考試”,接著點(diǎn)擊“統(tǒng)計(jì)”按鈕。運(yùn)用統(tǒng)計(jì)工具進(jìn)行統(tǒng)計(jì)后,在下面列出文本中需要使用者判斷的同形異義詞。這里列出的同形異義詞是軟件無法根據(jù)拼寫自動(dòng)判斷的詞,比如does可以表示助動(dòng)詞do的第三人稱單數(shù)形式,也可以表示名詞doe的復(fù)數(shù)形式,因此需要人工手動(dòng)判斷。使用者選擇判斷后,點(diǎn)擊下邊的按鈕確認(rèn),列表中被判定為義務(wù)教育和高中課標(biāo)詞表以外的詞和其他直接被軟件對(duì)比判斷為義務(wù)教育和高中課標(biāo)詞表以外的詞一起被列出,使用者可根據(jù)具體情況調(diào)整。
在尚未處理未學(xué)詞列表的時(shí)候,我們可以看到統(tǒng)計(jì)結(jié)果顯示的生詞率是15.85%,但在這些列出的未學(xué)詞里,有些是可以根據(jù)構(gòu)詞法規(guī)則和上下文推斷其意義的。實(shí)際上,課程標(biāo)準(zhǔn)明確要求學(xué)生應(yīng)掌握一定的構(gòu)詞法知識(shí),包括合成法、派生法、轉(zhuǎn)化法、縮寫和簡寫等[10]?!读x務(wù)教育英語課程標(biāo)準(zhǔn)(2011年版)》設(shè)定的語言技能目標(biāo)也要求學(xué)生能根據(jù)上下文和構(gòu)詞法推斷與理解生詞的含義。因此,對(duì)于課標(biāo)詞的常見合成詞、派生詞等,應(yīng)視為對(duì)學(xué)生構(gòu)詞法知識(shí)的考查,所以要從未學(xué)詞表中排除。具體方法是在界面上的未學(xué)詞列表中選中該詞,點(diǎn)擊下邊的按鈕,下方統(tǒng)計(jì)區(qū)會(huì)實(shí)時(shí)顯示重新計(jì)算的生詞率。在上述例子中,首先排除閱讀語篇注釋過的詞emotional、perspective等,然后排除課標(biāo)詞的簡單派生詞,如accurately、cheater、re-evaluate等,以及基于常見的合成法構(gòu)詞規(guī)則構(gòu)成的單詞,如makeup、skill-based等。排除后可以看到調(diào)校后的生詞率是4.58%。這個(gè)比例基本符合外語教育領(lǐng)域研究者對(duì)合理生詞率的研究結(jié)論[11][12]。如果需要輸出統(tǒng)計(jì)信息,可點(diǎn)擊下方的“輸出結(jié)果至剪貼板”,在其他文本編輯器中按Ctrl+V即可把總單詞數(shù)、生詞率、排除的和未排除的詞、目標(biāo)單元(或?qū)W段)的課標(biāo)詞等信息輸出至編輯區(qū)。
另外,軟件里還內(nèi)置了課標(biāo)詞的4280個(gè)常見派生詞,如果勾選了未學(xué)詞表下邊的“自動(dòng)設(shè)定已學(xué)課標(biāo)詞的派生詞為已知詞”復(fù)選框,程序可以自動(dòng)排除截至目標(biāo)單元/學(xué)段已學(xué)課標(biāo)詞的派生詞。比如上述應(yīng)用案例中,accurately、cheater等7個(gè)未學(xué)詞匯因被判斷為課標(biāo)詞accurate、cheat等的派生詞,在勾選了復(fù)選框后,被自動(dòng)認(rèn)定為已學(xué)詞匯。當(dāng)然,使用者要一一核對(duì)軟件自動(dòng)排除的單詞,以確保無誤。
本研究編制的生詞率統(tǒng)計(jì)工具嘗試解決目前教師缺乏高效生詞率統(tǒng)計(jì)工具的問題。它可以使教師方便地把握閱讀理解文本在詞匯方面的呈現(xiàn)情況。首先,教師可以直觀地看出閱讀理解題中呈現(xiàn)出哪些單詞,方便實(shí)時(shí)調(diào)整。其次,教師還能直觀地看到試題中有多少生詞。如果生詞比超過合理范圍,教師就要考慮對(duì)其中個(gè)別生詞進(jìn)行適當(dāng)處理,如改寫、括注等,從而降低生詞率,避免生詞量過大導(dǎo)致題目區(qū)分度下降、測驗(yàn)無法很好體現(xiàn)教學(xué)效果以及打消學(xué)生學(xué)習(xí)積極性等不良后果。
注:本文系人民教育出版社課程教材研究所“計(jì)算機(jī)輔助英語教材詞表制作軟件的研制及應(yīng)用”(課題批準(zhǔn)號(hào):KC2020-022)的階段性研究成果。
參考文獻(xiàn)
[1] Hughes A. Testing for Language Teachers[M]. UK: Cambridge University Press,1989:1-6.
[2][6]王金巴.生詞密度對(duì)大學(xué)英語閱讀理解的影響研究[J].外語界,2015(3):33-40.
[3] 楊穎,范向陽.農(nóng)村初中英語閱讀理解的實(shí)驗(yàn)研究——不同生詞密度與主題熟悉性對(duì)閱讀的影響[J].貴州師范大學(xué)學(xué)報(bào):自然科學(xué)版,2007(4):29-34.
[4][5][11]?? Hu M, Nation P. Unknown Vocabulary Densityand Reading Comprehension [J]. Reading in a Foreign Language,2000(1):403-430.
[7] Anthony L. Ant Word Profiler: version 1.5.1[CP/OL].(2021-03-04)[2021-09-12].https://www.laurenceanthony.net/software/antwordprofiler/.
[8] Heatley A, Nation P, Coxhead A. RANGE and FREQUENCY Programs: version 1.32[CP/OL].(2005-02-07)[2021-09-12].https://www.wgtn.ac.nz/lals/resources/paul-nations-resources/vocabulary-analysis-programs.
[9][10]中華人民共和國教育部.普通高中英語課程標(biāo)準(zhǔn):2017年版2020年修訂[S].北京:人民教育出版社,2020.
[12]Laufer B. What Percentage of Text-lexis is Essentialfor Comprehension[M].Special Language: From Humans Thinking to Thinking Machines,1989:316-323.
(作者系人民教育出版社課程教材研究所英語課程教材研究開發(fā)中心主任編輯)
責(zé)任編輯:孫建輝