摘要: 本文介紹了用語(yǔ)料庫(kù)軟件VocabProfile制作高考考綱基礎(chǔ)詞表(baseword)的操作方法,并通過(guò)分析2012年全國(guó)高考英語(yǔ)(新課標(biāo))試題的詞匯特點(diǎn),幫助教師掌握使用該軟件的基本功能,在高考復(fù)習(xí)中確定適合的材料,提高復(fù)習(xí)效率。
關(guān)鍵詞: 考綱詞匯 基礎(chǔ)詞匯表 詞匯分析
1.引言
VocabProfile是新西蘭維多利亞大學(xué)的Paul Nation和Averil Coxhead設(shè)計(jì)的語(yǔ)料庫(kù)分析軟件。利用它制作出在對(duì)文章或高考試題進(jìn)行分析時(shí)參照的《高考大綱詞匯》的基礎(chǔ)詞表(basewrod),就能夠準(zhǔn)確地判斷某套試題或文本的用詞在大綱詞匯表中的分布情況,所以它是對(duì)高考英語(yǔ)試題中詞匯特點(diǎn)進(jìn)行分析和高考復(fù)習(xí)中用以確定詞匯范圍及文章難易度不可缺少的實(shí)用軟件。
2.基礎(chǔ)詞匯表(Baseword list)的制作
VocabProfile軟件由Range和Frequency兩個(gè)部分組成。Range用以制作基礎(chǔ)詞匯表,分析文本中詞匯的分布情況及文本難度等;Frequency只能輸出詞頻及其累積百分比,其結(jié)果可按字母或詞頻順序輸出。
本文在制作基礎(chǔ)詞匯表時(shí)選用了國(guó)際權(quán)威的Range BNC(British National Corpus英國(guó)國(guó)家語(yǔ)料庫(kù))中附帶的16個(gè)基礎(chǔ)詞匯表(baseword),按詞頻從高到低為Baseword1到Baseword16,實(shí)際只用了1到14的詞匯表,第15為人名地名詞,第16為感嘆詞;在baseword1到baseword14中每個(gè)詞匯表有1000個(gè)詞簇(word family),總共有14000詞簇,共含有50598個(gè)詞類符(type)。下面以制作在試卷詞匯特點(diǎn)分析時(shí)要用的《2012年新課標(biāo)高考英語(yǔ)大綱詞匯》(以下簡(jiǎn)稱“考綱詞匯”)基礎(chǔ)詞表為例說(shuō)明其使用方法。
?。?)建立一個(gè)名為“高考常用詞庫(kù)”的文件夾,將Range BNC復(fù)制并解壓到這一文件夾,并將“考綱詞匯.txt”整理好后保存在這一文件夾,整理過(guò)的文件中不能有漢字和拼寫錯(cuò)誤的單詞;
?。?)運(yùn)行Range32.exe文件,在文件菜單(file)中打開(open)“考綱詞匯.txt”,然后在文件菜單中點(diǎn)擊保存(save),給文件起名為“考綱詞匯”,如果不先保存文件,軟件運(yùn)行時(shí)就會(huì)報(bào)錯(cuò);
(3)為使自制的基礎(chǔ)詞表盡可能包含考綱中的所有單詞,在基礎(chǔ)詞表數(shù)(Number of Baseword files)中填入14,勾選“更新基礎(chǔ)詞匯(Update BaseWords)”和“零基礎(chǔ)詞匯(Zero BaseWords)”,其余選項(xiàng)使用程序默認(rèn)方式(如下圖所示);
(4)按Process files按鈕運(yùn)行程序,在右框中顯示運(yùn)行狀態(tài),結(jié)果文件“考綱詞匯_range.txt”保存在所選文件夾,然后打開這一文件,可看到考綱詞匯表在軟件14個(gè)詞匯表中的分布情況,結(jié)果如下表。
名詞解釋:形符(Token)指任何詞匯形式,同一個(gè)單詞出現(xiàn)幾次就計(jì)算為幾個(gè)形符、文本中有多少單詞就有多少形符;類符(Type)指詞形相同的形符,所有詞形相同的形符都只能算一個(gè)類符,例如:do,did,done,doing,does的類符為do;詞簇(family)是指單詞的不同語(yǔ)法形式的集合,如:act,acted,acting,action,inaction,actions,actionable,acts,actor,actors,actress,actresses這12詞是以act為頭詞(head word)的一個(gè)詞簇。
從上表中可以看出“考綱詞匯”共有1965個(gè)形符,1957個(gè)類符和1710個(gè)詞簇。在BNC詞匯表的第一個(gè)1000常用詞的baseword1中有842個(gè)詞簇,第二個(gè)1000詞中的baseword2中有511個(gè)詞簇,第三個(gè)1000詞的baseword3中有209個(gè)詞簇,并逐漸減少,在12、14中沒(méi)有單詞,并在not in the lists中有8個(gè)在詞簇中沒(méi)有的單詞。
?。?)在文件菜單中點(diǎn)擊Move/Copy Baseword選項(xiàng),在“復(fù)制(Copy)”后的方框中每次要填寫從1、2…到14的數(shù)字,“單詞(Words)”后有三個(gè)選項(xiàng),勾選“大于(Greater than)”項(xiàng),方框中每次都填“0”;“輸出到文件(to file)”后的方框中“基礎(chǔ)詞(baseword)”后的數(shù)字以大于16的數(shù)為宜,如果小于16,就會(huì)將原程序所帶的基礎(chǔ)詞表覆蓋掉,如下圖所示,本文中將制作的基礎(chǔ)詞表命名為baseword31~baseword44。
?。?)點(diǎn)擊OK完成第一個(gè)自制詞匯表,重復(fù)以上步驟,制作其余的13個(gè)詞表,在制作時(shí)一定要注意copy后方框中的baseword后數(shù)字(從1到14)和to file后的方框中baseword后數(shù)字(例如從baseword31到baseword44)要不斷對(duì)應(yīng)更改。
?。?)打開自制的baseword31到baseword44,可以看到從原程序中拷貝出來(lái)的高考大綱詞匯表詞簇(family)中的headwords和詞的types,把這14個(gè)文件復(fù)制粘貼到一個(gè)文件中,注意文中不要有空行,為了避免和程序自帶的baseword相混淆或被覆蓋掉,建議單獨(dú)命名保存,如:考綱詞匯baseword.txt,使用該詞匯表進(jìn)行文本分析時(shí)要更名為baseword1。
3.高考試題詞匯的特點(diǎn)分析
下面我們用制作好的“考綱詞匯基礎(chǔ)詞匯表”來(lái)分析2012年全國(guó)高考英語(yǔ)試題(新課標(biāo)卷)的詞匯特點(diǎn)。先整理試題,去掉試卷中的漢字及數(shù)學(xué)等非英文字符,保存為txt文檔。將已制作好的“考綱詞匯baseword.txt”改名為baseword1,并和“2012年全國(guó)高考英語(yǔ)試題(新課標(biāo)卷)”放在同一文件夾,運(yùn)行range32,打開試題,并起名保存,在Number of Baseword List后填1,運(yùn)行程序,結(jié)果如上表所示。從表中可以看出,該試題包括聽力材料共有4187個(gè)單詞形符(tokens),1068個(gè)單詞類符(types),有667個(gè)已知詞簇;在高考考綱詞匯表中,有3739個(gè)形符,占總數(shù)的89.30%,有941個(gè)類符,占88.11%,有667詞簇;問(wèn)號(hào)“?”表明沒(méi)有找到詞簇的單詞,共有127個(gè)。進(jìn)一步分析127個(gè)生詞,有50個(gè)人名地名詞等專有名詞,27個(gè)合成詞,41個(gè)超綱詞,其中有10個(gè)做了漢語(yǔ)標(biāo)注,真正的超綱生詞依然保持在30個(gè)詞左右,這樣全卷共有724個(gè)詞簇。
由以上分析可知,2012年全國(guó)高考英語(yǔ)試題(新課標(biāo)卷)詞匯總量適中,試題在“考綱詞匯表”中的分布也較為理想,占89.30%,超綱詞匯不多,試題難度不大,命題緊扣考綱詞匯,超綱詞僅為1.62%,嚴(yán)格控制在全卷總詞量的3%以內(nèi),所以高考備考復(fù)習(xí)首先要熟練掌握占考題高達(dá)90%的高考考綱詞匯,特別是對(duì)于英語(yǔ)基礎(chǔ)較差的中下等學(xué)生,要從基礎(chǔ)抓起,切記好高騖遠(yuǎn)漫無(wú)目標(biāo)地?cái)U(kuò)大詞匯量,這樣才能在有限的時(shí)間內(nèi)取得較為理想的成績(jī)。
感興趣的讀者可以制作本省考綱詞匯的基礎(chǔ)詞表,縱向?qū)Ρ韧皇》莶煌攴莞呖荚囶}的詞匯特點(diǎn)或橫向?qū)Ρ确治霾煌》莞呖荚囶}中的詞匯特點(diǎn),并可通過(guò)輸出的結(jié)果文件,列出高考試題中以出現(xiàn)頻率排序的高頻單詞,制作出高考試題詞匯分級(jí)詞頻表,在復(fù)習(xí)中針對(duì)不同水平的學(xué)生要求識(shí)記不同頻級(jí)的單詞,以取得詞匯復(fù)習(xí)的高效率。
參考文獻(xiàn):
?。?]雷蕾,韋瑤瑜.VocabProfile在英語(yǔ)教學(xué)中的應(yīng)用.外語(yǔ)電化教學(xué)[J].2005(4).
?。?]何安平.語(yǔ)料庫(kù)在外語(yǔ)教育中的應(yīng)用:理論與實(shí)踐[C].廣州:廣東高等教育出版社,200