熊煥力
自Sinclair提出“由詞之結伴而知詞”的概念以來,對于詞匯的相關語言學研究蓬勃發(fā)展。在英語詞匯中,近義詞占據著很大的比重,近義詞辨析對于理解內容、厘清概念和邏輯有著重要的作用,也是英語教學的重點。學生對近義詞的掌握總是不盡如人意,而事實上,教師在教學中對近義詞的把握也并非總是成竹在胸,所以常常成為教學中的難點。目前,常規(guī)英語教學中對近義詞一般從語法、語義兩個維度比較異同,方法本身并無不妥,但這樣的處理往往依賴教師個人的教學經驗甚至個人感受,或是查閱詞典之后的個人總結,缺乏大量真實語境提供數據支持。語料庫語言學的興起以大量真實語境為基礎,為近義詞的總結歸納提供大量真實數據支撐的結論。
本研究中,筆者選取了indict表示“控告”之意的動詞用法作為研究對象。使用COCA語料庫的在線檢索軟件,首先以詞頻作為基礎標準,選取indict的一組近義動詞。它們都有“控告”之意,所以日常很難區(qū)分它們的動詞用法。然后,本文將在COCA語料庫中進行檢索,統計這一組近義詞在共時的不同語域中的詞頻分布以及歷時的使用頻率,以期發(fā)現indict及其近義詞在不同語域中的出現規(guī)律以及歷時的使用頻率變化。并期望以此作為利用語料庫工具進行近義詞辨析的一個實例,嘗試初步展示語料庫在近義詞辨析方面的作用。
本文以COCA語料庫(the Corpus of Contemporary American English美國當代英語語料庫)為基礎,試圖研究以下問題:indict及其近義詞在共時的不同語域中,以及在歷時的使用頻率上有何異同以及變化?
COCA語料庫目前的庫容量為5.2億詞匯,是當今最大的英語平衡語料庫,覆蓋了美國1990年至2015年間的各種類型語料,并還在持續(xù)更新中。COCA規(guī)模龐大,持續(xù)更新且更新速度較快,并配有詞性標注。同時,該語料庫有五大子庫,所選語料來自美國口語、小說、各大流行報紙、雜志以及學術期刊五大類,在這五大子庫中基本呈現出均衡分布的特征。(汪興富,2008)這些特征都使得基于該語料庫的相關研究有著較為客觀可信的數據基礎。
采用COCA的在線檢索工具提取關于indict用法的索引行,然后對其進行觀察、描述和分析,研究其頻數、類聯接以及分布語域,以得出最后的研究結論。
以語料庫為基礎所進行的近義詞辨析,以大量真實語料所提供的分析為基礎,再通過定量分析統計的方式最終得出定性結論,這樣的方式將定性分析與定量分析相結合,得出的結論較之傳統的簡單定性的研究方法更為真實可靠。COCA語料庫不僅語料龐大,其配套的在線檢索功能也十分強大,支持復合表達式,可查詢任一指定詞匯的近義詞、頻數和分布語域。本研究以“indict”為中心詞,在COCA在線檢索界面輸入[=indict].[v*]的表達式,檢索indict的動詞近義詞,結果如表1所示。
表1 Indict的近義詞統計表
基于表1提取索引行進行分析,發(fā)現其中summon與indict的主要意義相去較遠。因此,本文將分析indict及其5個近義詞在本族語語料庫中的語域詞頻分布和搭配詞語,通過觀察檢索行所呈現的近義詞搭配特征,發(fā)現它們的類聯接、搭配特征、語義韻和語義偏好等語言特征。
在近義詞辨析方面,對其語域分布信息進行統計往往有助于從實際應用的層面,即語用層面區(qū)分開來,使學習者能夠更加準確地辨析近義詞在實際語用層面的異同。(張金福,2012)筆者就indict、charge、accuse、prosecute、impeach、arraign這組樣本近義詞進行分析。
表2 Indict及其近義詞在COCA語料庫中不同語域的詞頻分布統計表
由表2可以知,indict一共在COCA中出現了805次,每百萬詞的標準詞頻為1.51,在這一組近義詞中,出現的標準頻次位列第四;charge是出現標準頻次最高的一個,共7698次,每百萬詞的標準詞頻為14.42;其次是accuse,出現頻次為2473,標準頻次為4.63;impeach的總頻次為525,標準頻次為0.98,在這一組近義詞中排名第五;最后是arraign,出現總頻次僅為9,標準頻次為0.02。對總頻次數據進行初步分析,這組近義詞中,最常用的是charge,標準頻次為14.42,是accuse標準頻次的三倍多;accuse和prosecute的總頻數和標準頻次都非常接近;而indict出現的總頻數是525,標準頻次為0.98,大幅低于排名第二第三的兩個單詞;arraign出現的頻次非常低,在5億詞次的COCA語料庫中僅僅出現9次。
觀察這組詞在COCA語料庫中各子庫的分布和頻次可以發(fā)現,charge標準頻次出現最高的為 Newspaper子 庫(21.75)及 Magazine子 庫(18.60),其次是Spoken子庫(15.81),分布頻次最低的是Academic子庫,標準頻次為5.73,約為Newspaper子庫中標準頻次的1/4;accuse出現標準頻次最高的是Spoken子庫,為6.84,在其他子庫中的出現頻次都幾乎不超過spoken庫的一半;prosecute也是在Spoken子庫中出現頻次最高,明顯高于其他子庫,在Fiction子庫中最低;indict也同樣是在Spoken子庫中出現頻次最高,遠遠高于其他子庫;其余詞出現頻率過低,可以忽略。
由此可以看出,這一組近義詞中,charge最為常用,大幅多于其他詞,并且charge多出現在新聞類的材料中,同時在口語中也被廣泛使用,很少出現在學術類的材料中;accuse和prosecute接近,雖然使用頻率顯著大幅低于charge,但這兩個詞都屬于這組詞中較為常用的詞,而且大多出現在口語當中,其中prosecute很少在小說類文學作品中使用;indict的總體使用頻率也不高,常見于口語當中。
另外,COCA中使用chart功能還可以得到所查詢表達的歷時分布情況,這組近義詞的歷時分布情況如下:
從表3可以看出,總體上indict在每5年度期間的使用頻率變化不大,不過總體來說,從1995-1999年,indict的使用頻率比其他時間段都高。另外,這一組近義詞的縱向詞頻中普遍變化不大,除了indict外,impeach也在1995-1999年間有較大幅度詞頻上升。橫向上看,這一組近義詞中charge一直是顯著高頻出現,大幅高于其他近義詞;accuse和prosecute次之,出現頻率也比較高;arraign出現頻率一直很低,幾乎可以忽略。
表3 indict及其近義詞的歷時分布詞頻統計
計算機技術的飛速發(fā)展為人民從海量真實語料中總結規(guī)律提供了可能性。本文通過使用COCA(美國當代英語語料庫)對indict及其近義動詞進行了詞頻、語域分布、搭配、類聯接等方面的研究分析。根據本研究可以得出以下結論:第一,這一組近義詞中,charge是最為常用的,大幅多于其他詞,并且charge多出現在新聞類的材料中,同時在口語中也被廣泛使用,很少出現在學術類的材料中;第二,accuse和prosecute雖然使用頻率顯著低于charge,不及其一半,但這兩個詞都是屬于這組詞中較為常用的詞,并且大多出現在口語當中,prosecute很少在小說類文學作品中使用;第三,indict的總體使用頻率也不高,常見于口語當中;第四,這一組詞在縱向上的詞頻大多比較穩(wěn)定,只有1995-1999年間,indict和impeach的使用突然出現顯著上升。
本研究嘗試以這一組近義詞辨析為例,展示語料庫的優(yōu)勢,說明語料庫的參與給近義詞辨析乃至英語教學帶來全新的方式,應該鼓勵英語教學者和學習者運用語料庫,從大量具體真實的語料中獲得第一手信息,更好地學習、認識和掌握語言點。