洪令凱
【摘 要】閱讀理解是英語專業(yè)四級(jí)考試的重要組成部分。利用語料庫相關(guān)檢索軟件,從詞匯和句法兩個(gè)層面對(duì)《綜合英語》第二版教材和專四閱讀語言難度進(jìn)行對(duì)比研究,分析具體差異,并據(jù)此提出相關(guān)教學(xué)建議。
【關(guān)鍵詞】語料庫;專業(yè)四級(jí);綜合教程;閱讀理解;語言難度
一、引言
英語專業(yè)四級(jí)考試(TEM4)是由我國高等學(xué)校外語專業(yè)教學(xué)指導(dǎo)委員會(huì)組織,英語專業(yè)四級(jí)命題小組負(fù)責(zé)命題與實(shí)施,為檢測本科英語專業(yè)教學(xué)大綱執(zhí)行情況而進(jìn)行的本科教學(xué)考試。該考試是一種測試應(yīng)試者單項(xiàng)和綜合語言能力的水平參照性考試。考試的范圍包括大綱所規(guī)定的聽、讀、寫、譯四個(gè)方面的技能。其中,“讀”占有很高比重?!伴喿x部分短文詞語豐富,語法覆蓋全面,是檢測學(xué)生詞匯、語法及語篇理解能力的重要手段?!迸c此相應(yīng),如何提高學(xué)生的閱讀理解能力也隨之成為外語教師的熱點(diǎn)研究課題?!毒C合教程》1至4冊(cè)第二版作為英語專業(yè)基礎(chǔ)階段教材,其特點(diǎn)在于所使用的語言材料是系統(tǒng)的、精選的,技能訓(xùn)練是綜合的。所用教材的文章都選自第一手英文資料,盡可能保留了原文的風(fēng)貌,是原汁原味的英語語言素材。目的是為了培養(yǎng)和提高學(xué)生綜合運(yùn)用英語的能力,難點(diǎn)是提高學(xué)生語篇理解分析能力。當(dāng)然,也是為了通過專業(yè)四級(jí)做準(zhǔn)備。通過查詢中國知網(wǎng)筆者發(fā)現(xiàn),目前的研究大多集中于閱讀感知、理解過程、閱讀教學(xué)和閱讀模式等方面,而針對(duì)閱讀測試難度方面的研究,尤其是針對(duì)英語專業(yè)四級(jí)的閱讀語篇難度研究較少,將其與教材語篇難度作對(duì)比研究更少。此外,傳統(tǒng)的閱讀理解研究多以定性為主,缺乏定量研究。鑒于此,本研究擬使用語料庫手段,將定量研究和定性研究相結(jié)合,試圖從句法和詞匯兩個(gè)層面對(duì)TEM4閱讀理解部分和《綜合教程》的課文語言難度進(jìn)行對(duì)比分析,并據(jù)此為閱讀教學(xué)提供建議。
二、相關(guān)文獻(xiàn)綜述
目前,國內(nèi)針對(duì)閱讀測試的語言難度研究尚處于起步階段,研究方法和標(biāo)準(zhǔn)不一。詹宏偉、黃四宏從句法角度對(duì)比了不同句法難度的文本對(duì)閱讀理解產(chǎn)生的影響,并據(jù)此提出教學(xué)建議。唐美華采用語言統(tǒng)計(jì)學(xué)方法,從文本結(jié)構(gòu)、語義復(fù)雜性和可讀性三個(gè)層面對(duì)2004年英語專業(yè)四、八級(jí)新考試大綱施行后TEM4和TEM8中的閱讀理解部分的難度進(jìn)行了對(duì)比研究。然而,由于該研究各自只選取了12篇短文作為樣本,其研究結(jié)果缺乏普遍性,不足以描述TEM4和TEM8 的閱讀文本難度差異。胡萍英通過問卷調(diào)查,指出語法隱喻與語篇難度之間的關(guān)系。劉冰、陳建生利用語料庫語言學(xué)技術(shù),對(duì)大學(xué)英語四六級(jí)考試中的閱讀理解部分進(jìn)行了對(duì)比分析,并對(duì)未來的四六級(jí)測試和外語教學(xué)工作提出了建議。郝偉麗、馮筠等參照Bachman和Palmer的考試任務(wù)特征模式,分析了2013年12月大學(xué)英語四級(jí)閱讀理解試題的內(nèi)容效度。王金巴探討了大學(xué)英語閱讀理解中生詞密度和文本難度之間的關(guān)系。綜上可以看出:在研究方法方面,傳統(tǒng)閱讀研究大都以定性研究為主,缺乏客觀、詳實(shí)的數(shù)據(jù)支持;在研究對(duì)象方面,傳統(tǒng)研究的文本選擇結(jié)構(gòu)單一,語料規(guī)模較小。因此,其研究結(jié)果具有一定的局限性。
三、研究方法
(一)研究方法與步驟
本研究通過定性和定量相結(jié)合的統(tǒng)計(jì)方法,以語料庫語言學(xué)手段對(duì)《綜合教程》教材與專業(yè)四級(jí)閱讀試題語言難度進(jìn)行整體對(duì)比。
詞匯特征和語法特征是語料庫語言學(xué)用來衡量語言難度的主要手段。以詞匯層面為界,本研究分為兩部分:一是詞匯層面的研究,包括詞匯難度和詞匯差異;二是詞匯以上層面的研究,包括平均句長和語法隱喻(被動(dòng)語態(tài)和名詞化)。
(二)語料庫及研究工具
為了分析《綜合教程》教材與專業(yè)四級(jí)閱讀試題語言的難度,筆者建立了兩個(gè)小型語料庫。一個(gè)語料庫(以下簡稱《綜合教程》閱讀庫)的語料來自于上海外語教育出版社出版的《綜合教程》1至4冊(cè)第二版的48篇TEXT 1課文文本(約46563詞),該書是大多數(shù)高校英語專業(yè)一二年級(jí)的基礎(chǔ)英語課的教學(xué)用書。另一個(gè)語料庫(以下簡稱專四閱讀庫)取材于2009年到2018年全國英語專業(yè)四級(jí)考試閱讀理解部分的篇章,共計(jì)37篇(約18553詞)。為了便于研究,刪除了兩個(gè)語料庫中所有短文內(nèi)超綱詞的中文注釋。此外,還對(duì)這兩個(gè)語料庫分別做了自動(dòng)詞性附碼,采用的是分類詳細(xì)的CLAWS7詞性附碼集。這兩個(gè)語料庫分別保存為語料庫軟件容易識(shí)別的.txt文件。使用的研究工具包括WordSmith Tools 4.0,UltraEdit32,AntConc和Range32等軟件。
Range軟件是語料庫研究中的一個(gè)常用工具,由新西蘭語言學(xué)家Paul Nation開發(fā),主要用來分析詞匯的跨文本分布。Range軟件自帶三個(gè)詞匯底表,一級(jí)詞匯底表(BASEWRD1.txt)包括英語中最常用的1000詞族,二級(jí)詞匯底表(BASEWRD2.txt)包括英語中次常用的1000詞族,前兩級(jí)詞匯底表中的約2000個(gè)詞族來源于Michael West(Longman, London 1953)的通用英語詞匯表(A General Service List of English Words)。三級(jí)詞匯底表(BASEWRD3.txt)來自Coxhead (1998, 2000)的學(xué)術(shù)英語詞匯表(Academic Word List),是高中和大學(xué)各學(xué)科的常用詞匯,涵蓋教育、語言學(xué)、金融、商務(wù)管理等多個(gè)專業(yè),共570個(gè)英語詞族。Range軟件的一個(gè)主要功能就是可將研究的文本與詞匯底表相對(duì)比,分析出文本中詞匯在各級(jí)詞底表中所占比例以及不包含在詞表中的詞匯所占比例,還可用來對(duì)比兩個(gè)文本的詞匯,分析出兩個(gè)文本所用的相同和不同詞匯。
四、研究結(jié)果
(一)《綜合教程》閱讀庫與專四閱讀庫詞匯難度對(duì)比
在語料庫研究中,型符(token)指語料庫中出現(xiàn)的每一個(gè)詞的數(shù)量,能反映語料庫的總的詞數(shù)。型符/%即指出現(xiàn)在某詞匯底表中型符的數(shù)量以及在占總型符數(shù)量的百分比。類符(type)指語料庫文本中首次單獨(dú)出現(xiàn)的詞型,類符/%指出現(xiàn)在某詞匯底表中類符的數(shù)量以及占總類符數(shù)量的百分比。一個(gè)詞族(family)由主詞(headword)及其派生形式和曲折形式構(gòu)成,例如單詞develop,其曲折形式developed,develops, developing 以及派生形式development都是屬于以develop為主詞的詞族成員。
通過Range32對(duì)《綜合教程》閱讀庫與專四閱讀庫分別進(jìn)行處理,得出詞匯分析結(jié)果為:《綜合教程》閱讀庫中總型符數(shù)為46563,類符數(shù)為6876,詞族數(shù)為2044;專四閱讀庫中總型符數(shù)為18553,類符數(shù)為3957,詞族數(shù)為1588。(見表1、表2)
Paul Nation在做詞匯分析時(shí),多利用詞族信息來判斷詞匯難度和覆蓋度。仇家金等(2010)認(rèn)為類符的三級(jí)及詞表外詞匯是更可靠的難度判別標(biāo)準(zhǔn)。三級(jí)詞匯表中的第三級(jí)和詞表外詞匯能更好地反映文本的詞匯難度。由表1和表2可以看出,從詞族來看,在《綜合教程》閱讀庫中,有393個(gè)詞族屬于第三級(jí)詞匯底表,在專四閱讀庫中,有276個(gè)詞族屬于第三級(jí)詞匯底表。從類符列來看,在專四閱讀庫中,有1584個(gè)類符屬于第三級(jí)詞匯底表和詞表外詞匯,占總類符數(shù)的40.03%;在《綜合教程》閱讀庫中,有3443個(gè)類符屬于第三級(jí)詞匯底表和詞表外詞匯,占總類符數(shù)的50.08%。因此,從類符來看,專四閱讀庫中屬于三級(jí)詞匯底表和詞表外詞匯的比例要低于《綜合教程》閱讀庫中三級(jí)詞匯底表和詞表外詞匯的比例,也就是專四閱讀庫中屬于一、二級(jí)詞匯底表的詞匯比例要高于《綜合教程》閱讀庫。從詞族來看,專四閱讀庫中的詞族總數(shù)量和三級(jí)詞匯底表中的詞族數(shù)量也均低于《綜合教程》閱讀庫。由此我們可以推斷,專四閱讀的詞匯難度要低于《綜合教程》課文的詞匯難度。
(二)《綜合教程》閱讀庫與專四閱讀庫詞匯差異對(duì)比
一般情況下,英語文本中的虛詞即功能詞應(yīng)用頻率最高,如限定詞a/an, the, that等,介詞(如of, on, in, to , with等),代詞(I, he, they等)。在統(tǒng)計(jì)文本詞頻時(shí),這些詞往往排在最前面,屬于高頻詞匯,但這些詞的使用頻率無法反映文本的具體詞匯應(yīng)用特色。為了排除這些功能詞的干擾,我們?cè)诮y(tǒng)計(jì)文本的高頻詞匯時(shí),應(yīng)將這些詞排除在外。Range 軟件本身自帶一個(gè)功能詞表,其中涵蓋了常用的各種功能詞309個(gè)。筆者應(yīng)用Range軟件的Stop list功能,去除了英語文本中常見的功能詞,得出文本中實(shí)詞的使用情況。
詞表外詞匯反映文本不同的主題內(nèi)容
詞表外詞匯能較好地反映出文本的內(nèi)容傾向。《綜合教程》閱讀庫中屬于詞表外詞匯的前 20 個(gè)高頻詞族包括:BRIDE, STORYTELLER, GROOM, AMERICAN, KIDS, CHINESE, BUDDIES, INTERNET, JESUS, FRENCH, HOLLYWOOD, MOVIE, PANTS, VERMONT, NAGASAKI, PARIS, VALENTINE, ATMOSPHERE, CALIFORNIA, FOLKS。專四閱讀庫中屬于詞表外詞匯的使用頻率最高的前20個(gè)實(shí)詞詞族包括:AWARDS, AMERICAN, PARENTING, HARRINGTON, RAINBOW, FAKE, ALDEN, CD, EMOTIONS, FISHER, INTERNET, LITERACY, OMIAI, PHILIP, ED, GRADUATION, ILLITERATE, JAPANESE, LITERATE, MICKEY?!毒C合教程》閱讀庫中使用頻率最高的詞匯基本都與地域相關(guān),如American, Chinese, French, Hollywood, Vermont, Nagasaki, Paris, California。但在專四閱讀材料中,我們就會(huì)發(fā)現(xiàn)使用頻率高的詞內(nèi)容較為分散,包括國家(American, Japanese)、教育(literacy, graduation, illiterate, literate, ED, parenting)、自然(rainbow, fisher)等。
(三)詞匯以上層面
(1)平均句長
平均句長是指一個(gè)語篇中句子的平均長度,以詞數(shù)為統(tǒng)計(jì)單位。一般來說,簡單句的句長較短,容易理解;并列句、復(fù)合句或并列復(fù)合句的句子較長,較難理解。因此,通過對(duì)平均句長的統(tǒng)計(jì)和對(duì)比可以從一個(gè)側(cè)面了解語篇的難度。通過對(duì)兩個(gè)語料庫的總句子數(shù)和平均句長統(tǒng)計(jì),《綜合教程》庫共有3205個(gè)句子,平均句長為14.53詞;專四庫共有1125 個(gè)句子,平均句長為16.49詞。兩個(gè)語料庫的平均句長存在差異,專四閱讀的平均句長比《綜合教程》課文句子長。
(2)語法隱喻
語法隱喻是影響語言材料難度的重要因素。Halliday區(qū)分了兩種語法結(jié)構(gòu)對(duì)語義的體現(xiàn)關(guān)系,一種是一致式,即語言結(jié)構(gòu)直接反映現(xiàn)實(shí)世界;另一種是隱喻式,即語言結(jié)構(gòu)不是直接反映現(xiàn)實(shí)世界,體現(xiàn)出了不同的語言單位之間的轉(zhuǎn)換過程。這種語法結(jié)構(gòu)對(duì)語義的不一致體現(xiàn)就是語法隱喻。
語法隱喻阻礙了學(xué)生閱讀理解的過程。范文芳分析了決定語篇難易度的因素,認(rèn)為在其它因素相同的情況下,語篇中語法隱喻的含量越高,語篇的難度就越大。Ravelli指出,外國學(xué)生在掌握英語語法隱喻時(shí)會(huì)比較困難。造成這些問題的根本原因就是語法隱喻的復(fù)雜性。Lassen 在研究專業(yè)技術(shù)手冊(cè)時(shí),曾提到語法隱喻的五種體現(xiàn)形式:名詞短語、被動(dòng)語態(tài)、定冠詞省略、非限定動(dòng)詞 V-ing 形式和省略句。通過韓禮德對(duì)語法隱喻的定義,語義的不一致表達(dá)形式都屬于語法隱喻的范疇。以下針對(duì)語法隱喻的幾個(gè)主要形式(被動(dòng)態(tài)和名詞化),分別對(duì)《綜合教程》庫和專四庫做統(tǒng)計(jì)分析和對(duì)比。被動(dòng)語態(tài)通過設(shè)計(jì)完善的正則表達(dá)式檢索項(xiàng),在經(jīng)過詞性附碼的兩個(gè)語料庫中檢索被動(dòng)語態(tài)謂語的使用情況。數(shù)據(jù)表明,兩個(gè)庫在被動(dòng)語態(tài)謂語的使用上沒有顯著性差異。
名詞化是指把別的詞類加上-tion、-ment、-ness、-ity(包括其復(fù)數(shù))等后綴轉(zhuǎn)化成名詞的語言現(xiàn)象。Halliday 認(rèn)為名詞化是語法隱喻的主要體現(xiàn),指出“名詞化是創(chuàng)建語法隱喻的唯一最強(qiáng)大的手段”。名詞化表達(dá)抽象的概念和過程。名詞化程度越高,語言越抽象,語言難度越大。由于統(tǒng)計(jì)兩個(gè)語料庫中全部名詞化現(xiàn)象有一定困難,本文只對(duì)幾個(gè)高頻名詞后綴進(jìn)行統(tǒng)計(jì)和比較。
表3數(shù)據(jù)表明,在對(duì)所選的幾個(gè)常用名詞后綴的統(tǒng)計(jì)中,《綜合教程》庫的名詞化現(xiàn)象與專四庫差異不大。因此從名詞化的角度分析,專四庫語言難度略高于綜合教程庫。在名詞化統(tǒng)計(jì)的過程中,檢索結(jié)果中存在噪音(noise),如nation是以-tion結(jié)尾的名詞,但不屬于名詞化。考慮到對(duì)兩個(gè)語料庫均采用未排除噪音的方法統(tǒng)計(jì),因此結(jié)果仍有效,且具有可比性。
五、本研究對(duì)教學(xué)和考試策略的啟示
本研究基于語料庫語言學(xué)的方法,通過詞匯和詞匯以上兩個(gè)層面對(duì)專業(yè)四級(jí)閱讀試題與《綜合教程》課文語言難度進(jìn)行比較。
詞匯層面上主要從詞匯難度和詞匯差異兩方面進(jìn)行分析比較。通過語料庫分析軟件Range32的分析結(jié)果,我們發(fā)現(xiàn)專業(yè)四級(jí)閱讀考試在詞匯廣度和深度上要略低于《綜合教程》課文。詞匯以上層面主要從平均句長和語法隱喻兩方面進(jìn)行分析比較。在平均句長方面,結(jié)果表明兩個(gè)語料庫的平均句長略有差異,專四庫的平均句長比綜合教程庫長;在語法隱喻方面,專四庫語言的名詞化現(xiàn)象與綜合教程庫差別不大,說明兩庫語言難度相當(dāng)。綜合上述兩個(gè)層面,專業(yè)四級(jí)閱讀試題與《綜合教程》課文語言難度相當(dāng),閱讀部分的試題難度符合基礎(chǔ)階段的教學(xué)水平,整體把控得非常到位。這個(gè)結(jié)果對(duì)未來的英語專業(yè)教學(xué)具有一定的指導(dǎo)意義。首先,從詞匯教學(xué)方面來講,教師應(yīng)當(dāng)根據(jù)學(xué)生不同的學(xué)習(xí)階段對(duì)教學(xué)重點(diǎn)進(jìn)行調(diào)整:對(duì)基礎(chǔ)階段的學(xué)生,教師可以在幫助他們擴(kuò)展基礎(chǔ)詞匯的同時(shí),講授一些相關(guān)的詞匯學(xué)知識(shí),如詞根、詞綴的變體及曲折變化等。其次,從句法教學(xué)方面來講,教師可以提供并督促學(xué)生閱讀更多的英美原版材料,并要求他們對(duì)其中出現(xiàn)的長難句型進(jìn)行分析和仿寫。此外,根據(jù)本研究所做的統(tǒng)計(jì)可知,英語專業(yè)四級(jí)閱讀語篇中語法隱喻的使用頻率不低。這就要求教師在對(duì)學(xué)生施教過程中,有意識(shí)地引入“語篇”概念,進(jìn)而引導(dǎo)學(xué)生更多地關(guān)注到語篇層面上的功能。具體來講,教師可以指導(dǎo)學(xué)生借助概念語法隱喻來分析理解難句,通過人際語法隱喻領(lǐng)會(huì)作者的言外之意,運(yùn)用語法隱喻把握語篇脈絡(luò)并正確理解篇章意義。
在考試策略方面,筆者針對(duì)性的提出一些意見和建議。
培養(yǎng)良好閱讀習(xí)慣:在閱讀過程中要從整體出發(fā)把握文章的結(jié)構(gòu)脈絡(luò),不要過分拘泥于語言的細(xì)節(jié);對(duì)于閱讀中遇到的生詞,要大膽去預(yù)測,并在之后的閱讀中不斷地修正猜測,不要急切地求助于字典;注意句子與句子之間的表面銜接,從邏輯語義上達(dá)到整體連貫一致。了解閱讀理解過程:閱讀理解過程至少分為三大層次,字面理解層、推論理解層、評(píng)論理解層,對(duì)閱讀理解過程的了解有助于把握三層次的相互關(guān)系和作用。字面理解層主要依靠語法能力或語言能力完成;推論理解層主要依靠閱讀技巧和語言能力完成;而評(píng)價(jià)理解層則是讀者與作者觀點(diǎn)交融糅合的過程。導(dǎo)入閱讀理解方法:擴(kuò)大詞匯量。利用詞綴來猜測生詞意義,如 im-,com-,dis-,-or,-tion等;利用上下文的語義聯(lián)系來推測詞的意義,如因果關(guān)系、反義關(guān)系等;運(yùn)用歸納法,把同一類詞歸納在一起,如把有關(guān)化學(xué)與醫(yī)藥的詞匯、貨幣與金融的詞匯歸納在一起。拓寬知識(shí)面,積累背景知識(shí)??佳虚喿x所選文章來源于英美國家各大報(bào)刊雜志,具有很強(qiáng)的時(shí)代性和文化性,所以必須擴(kuò)大閱讀量,積累背景知識(shí),熟悉西方思維模式,養(yǎng)成英語思維的習(xí)慣。掌握閱讀方式,糾正不良習(xí)慣。閱讀方式一般分為下列幾種:略讀、尋讀、細(xì)讀、評(píng)讀。通過前兩者進(jìn)行快速閱讀,后兩者準(zhǔn)確把握文章焦點(diǎn)、論據(jù)、推理過程,并對(duì)其做出評(píng)價(jià)。同時(shí)必須糾正不良閱讀習(xí)慣,如指讀、出聲讀、回視、譯成中文等。掌握閱讀理解技巧:正確處理速度與準(zhǔn)確性之間的矛盾。首先確保閱讀理解的準(zhǔn)確性,速度只有在準(zhǔn)確理解的基礎(chǔ)上才有意義。一味追求速度,囫圇吞棗,或者碰到難點(diǎn)就反復(fù)重讀,都是不可取的??忌仨毢侠矸峙鋾r(shí)間,二者兼顧。這可以在平時(shí)訓(xùn)練中,規(guī)定自己限時(shí)完成額定任務(wù),以加強(qiáng)時(shí)間分配意識(shí)。采用合理的解題步驟。一般有兩種方法:短文—看題—解題;看題—短文—解題。一般來說,先讀文章能夠較好地把握文章主旨大意。面對(duì)篇幅較長,問題較多的短文,可以選擇第二種方式。遇到篇幅短的短文,可以選擇第一種方式。具體采用哪種方式也是因人而異,隨文而變的。
六、結(jié)束語
本文利用語料庫語言學(xué)的方法,將定量研究與定性研究相結(jié)合,驗(yàn)證了《綜合教程》和專業(yè)四級(jí)考試閱讀試題在語言難度上的差異,并據(jù)此提出了相關(guān)的教學(xué)建議。由于篇幅所限,本研究除了從詞匯及詞匯以上兩個(gè)層面進(jìn)行研究外,并未涉及到語篇體裁和語言難度的關(guān)系,這一點(diǎn)有待繼續(xù)研究,從而使考生及英語教師對(duì)專業(yè)四級(jí)考試閱讀理解試題有一個(gè)更全面科學(xué)的認(rèn)識(shí)。
【參考文獻(xiàn)】
[1]梁茂成,李文中,許家金.語料庫應(yīng)用教程[M].北京:外語教學(xué)與研究出版社, 2010.
[2]Coxhead A A. New Academic Word List[J].TESOL Quarterly
[3]唐美華.英語專業(yè)等級(jí)考試中閱讀理解對(duì)比分析[J].吉林省教育學(xué)院學(xué)報(bào),2009(01).
[4]Ure J. Lexical density and register differentiation[M]./ /Perren G, Trim JLM (eds). Applications of Linguistics. London: Cambridge University Press, 1971: 443-452.
[5]Hu Zhuanglin.Linguistics:An Advanced Course Book[M].Beijing University Press,2002.
[6]薛鳳敏.基于語料庫的BEC中級(jí)閱讀詞匯難度分析[J].海外英語,2017(02).
[7]劉冰,陳建生.大學(xué)英語四六級(jí)閱讀語言難度對(duì)比---基于語料庫的研究[J].重慶交通大學(xué)學(xué)報(bào)(社科版),2013(5): 141-144.
[8]郝偉麗,馮筠,李寧等. CET4 閱讀理解試題的內(nèi)容效度分析[J].考試研究,2015(04).