李仕春,史梁櫻
(1.西南大學(xué) 文學(xué)院,重慶400715;2.廣西大學(xué) 文學(xué)院,廣西 南寧530004)
?
《現(xiàn)6》《牛8》多義詞義項(xiàng)數(shù)目異同研究
李仕春1,史梁櫻2
(1.西南大學(xué) 文學(xué)院,重慶400715;2.廣西大學(xué) 文學(xué)院,廣西 南寧530004)
摘要:《現(xiàn)6》、《牛8》多義詞義項(xiàng)數(shù)目的差別,反映了以《現(xiàn)漢》為代表的漢語類中型語文性詞典在常用詞義項(xiàng)方面的編纂水準(zhǔn)落后于以《牛8》為代表的同類別英語類詞典,主要表現(xiàn)在《現(xiàn)6》的編纂者忽略了用語料庫(kù)技術(shù)豐富并補(bǔ)充現(xiàn)代漢語常用詞義項(xiàng)分布情況的研究。運(yùn)用語料庫(kù)技術(shù)的方法,研究現(xiàn)代漢語中常用詞的義項(xiàng)分布情況,是一項(xiàng)刻不容緩的任務(wù)。
關(guān)鍵詞:《現(xiàn)6》;《牛8》;多義詞
一、引言
李仕春指出《現(xiàn)代漢語詞典》(本文簡(jiǎn)稱《現(xiàn)漢》)、《現(xiàn)代漢語學(xué)習(xí)詞典》、《現(xiàn)代漢語規(guī)范詞典》等漢語類詞典和《牛津高階英語詞典》(本文簡(jiǎn)稱《牛津》)、《牛津簡(jiǎn)明英語詞典》、《韋氏高階英語詞典》、《郎文高階英語詞典》等英語類詞典都是中型語文性詞典,并統(tǒng)計(jì)出:以《牛津》為代表的英語類詞典100核心詞的平均義項(xiàng)比以《現(xiàn)漢》為代表的漢語類詞典要多出5-7個(gè)義項(xiàng),據(jù)此認(rèn)為:長(zhǎng)期以來中國(guó)詞典的編纂者乃至研究現(xiàn)代漢語詞匯的學(xué)者忽視了現(xiàn)代漢語100核心詞義項(xiàng)分布的研究[1]。
本文用窮盡性的方法統(tǒng)計(jì)了《現(xiàn)6》、《牛8》*之所以選取這兩部詞典,是因?yàn)椤冬F(xiàn)代漢語詞典》(第6版)(本文簡(jiǎn)稱《現(xiàn)6》)是漢語詞典中最有代表性的中型語文性詞典,《牛津高階英語詞典》(第8版)(本文簡(jiǎn)稱《牛8》)是英語詞典中最有代表性的中型語文性詞典,并且兩部詞典的編纂體例相差較小。中多義詞義項(xiàng)數(shù)目,發(fā)現(xiàn)兩部詞典中多義詞義項(xiàng)數(shù)目差別很大,這種差別不但印證了上文觀點(diǎn),而且說明中國(guó)學(xué)者忽略了用語料庫(kù)技術(shù)豐富并補(bǔ)充現(xiàn)代漢語更多常用詞義項(xiàng)分布情況的研究。
二、《現(xiàn)6》《牛8》多義詞義項(xiàng)數(shù)目對(duì)比與分析
據(jù)蘇新春(2002)統(tǒng)計(jì),《現(xiàn)漢》(第3版)有12501個(gè)多義詞[2]。我們統(tǒng)計(jì)《現(xiàn)6》共有13849個(gè)多義詞,排除199個(gè)表示“姓”的義項(xiàng)后,《現(xiàn)6》共有13650個(gè)多義詞(《現(xiàn)6》中一些詞含有兩個(gè)義項(xiàng),一個(gè)是該詞的本義另一個(gè)表示“姓”,這兩個(gè)義項(xiàng)之間沒有引申關(guān)系,我們?cè)诮y(tǒng)計(jì)的時(shí)候不把這樣的詞看作多義詞,如:“鮑:名。①軟體動(dòng)物,貝殼橢圓形,生活在海中。貝殼可入藥,稱石決明。②(Bào)姓?!薄磅U”的義項(xiàng)①和②之間沒有引申關(guān)系,我們把它看作單義詞)。兩者的統(tǒng)計(jì)說明《現(xiàn)漢》多義詞義項(xiàng)數(shù)目基本穩(wěn)定。
國(guó)內(nèi)少有人運(yùn)用窮盡性統(tǒng)計(jì)的方法統(tǒng)計(jì)英語類詞典中多義詞義項(xiàng)數(shù)目,我們統(tǒng)計(jì)出《牛8》共有10027個(gè)多義詞?!冬F(xiàn)6》和《牛8》多義詞義項(xiàng)數(shù)目具體分布如下表:
《現(xiàn)6》《牛8》多義詞義項(xiàng)數(shù)目對(duì)比表*表中《現(xiàn)6》的多義詞區(qū)分為單音多義詞(簡(jiǎn)稱單音詞)和復(fù)音多義詞(簡(jiǎn)稱復(fù)音詞),其中復(fù)音多義詞義項(xiàng)數(shù)目最多有7個(gè),單音多義詞義項(xiàng)數(shù)目最多有24個(gè),是“點(diǎn)”和“打”?!杜?》中多義詞義項(xiàng)數(shù)目最多的詞是“run”,有50個(gè)。
上表顯示,《現(xiàn)6》、《牛8》中多義詞義項(xiàng)數(shù)目具體差別如下:
(一)2個(gè)義項(xiàng)的多義詞:《現(xiàn)6》有10253個(gè),占《現(xiàn)6》多義詞總數(shù)的74.08%,其中單音詞1888個(gè),復(fù)音詞8365個(gè);《牛8》有4664個(gè),占《牛8》多義詞總數(shù)的46.51%。
(二)3個(gè)義項(xiàng)的多義詞:《現(xiàn)6》有1976個(gè),占多義詞總數(shù)的14.48%,其中單音詞738條,復(fù)音詞1238條;《牛8》有2177個(gè),占多義詞總數(shù)的21.71%。
(三)4個(gè)義項(xiàng)的多義詞:《現(xiàn)6》有632個(gè),占多義詞總數(shù)的4.63%,其中單音詞424條,復(fù)音詞108條;《牛8》有1136個(gè),占多義詞總數(shù)的11.33%。
(四)5個(gè)義項(xiàng)的多義詞:《現(xiàn)6》有297個(gè),占多義詞總數(shù)的2.18%,其中單音詞233條,復(fù)音詞64條;《牛8》有573個(gè),占多義詞總數(shù)的5.71%。
(五)6個(gè)義項(xiàng)的多義詞:《現(xiàn)6》有182個(gè),占多義詞總數(shù)的1.33%,其中單音詞167條,復(fù)音詞15條;《牛8》有573個(gè),占多義詞總數(shù)的4.07%。
(六)7個(gè)義項(xiàng)的多義詞:《現(xiàn)6》有98個(gè),占多義詞總數(shù)的0.72%,其中單音詞91條,復(fù)音詞7條;《牛8》有256個(gè),占多義詞總數(shù)的2.55%。
(七)8個(gè)及8個(gè)以上義項(xiàng)的多義詞:《現(xiàn)6》有216個(gè),占多義詞總數(shù)的1.58%,這些多義詞全部是單音詞;《牛8》有815個(gè)占多義詞總數(shù)的8.13%。
由上可見,《現(xiàn)6》共有13650個(gè)多義詞,《牛8》共有10027個(gè),《現(xiàn)6》多義詞條目比《牛8》多3623個(gè),但多出的部分主要是2個(gè)義項(xiàng)的多義詞,且絕大多數(shù)是復(fù)音詞*《現(xiàn)6》中有兩個(gè)義項(xiàng)的多義詞的數(shù)目是10253個(gè),《牛8》中有兩個(gè)義項(xiàng)的多義詞數(shù)目是4664,前者比后者多5589個(gè)。。除此之外,《現(xiàn)6》多義詞義項(xiàng)數(shù)目都比《牛8》少:含有3個(gè)義項(xiàng)的多義詞,《現(xiàn)6》比《牛8》少201個(gè);含有4個(gè)義項(xiàng)的多義詞,《現(xiàn)6》比《牛8》少504個(gè);含有5個(gè)義項(xiàng)的多義詞,《現(xiàn)6》比《牛8》少276個(gè);含有6個(gè)義項(xiàng)的多義詞,《現(xiàn)6》比《牛8》少226個(gè);含有7個(gè)義項(xiàng)的多義詞,《現(xiàn)6》比《牛8》少391個(gè);含有7個(gè)義項(xiàng)的多義詞,《現(xiàn)6》比《牛8》少158個(gè);8個(gè)及以上義項(xiàng)的多義詞,《現(xiàn)6》比《牛8》少599個(gè)。
三、《現(xiàn)6》《牛8》多義詞義項(xiàng)數(shù)目異同原因分析
盡管《現(xiàn)6》比《牛8》多出3623個(gè)多義詞,但是除含有2個(gè)義項(xiàng)的多義詞《現(xiàn)6》比《牛8》的數(shù)目多之外,其他都是《現(xiàn)6》義項(xiàng)數(shù)少于《牛8》。兩部詞典多義詞義項(xiàng)數(shù)目的差別主要集中在4個(gè)義項(xiàng)到20個(gè)義項(xiàng)之間,《牛8》有4個(gè)及以上義項(xiàng)的多義詞共有3128個(gè),而《現(xiàn)6》僅有1418個(gè)?!冬F(xiàn)6》和《牛8》義項(xiàng)數(shù)目出現(xiàn)上述差別的主要原因在于《牛8》的編纂者在20世紀(jì)八九十年代就已經(jīng)用語料庫(kù)技術(shù)發(fā)現(xiàn)英語常用多義詞的新義項(xiàng)了,而《現(xiàn)漢》的編纂者卻沒有。
張志毅指出:“語料庫(kù)理念萌生于1959年倫敦大學(xué)語言學(xué)教授R. Quirk:幾年間建起涵蓋多種語體的上百萬字的‘英語用法語料庫(kù)’。1961年美國(guó)布朗大學(xué)建起第一個(gè)機(jī)讀的逾百萬字的‘布朗語料庫(kù)’。從20世紀(jì)80年代起,柯林斯等出版社和伯明翰等大學(xué)合作,創(chuàng)建了‘CO-BUILD語料庫(kù)’,由此開發(fā)了《柯林斯COBUILD英語詞典》?!杜=蚋唠A英語學(xué)習(xí)詞典》、《朗文當(dāng)代高級(jí)英語辭典》、《錢伯斯基礎(chǔ)英語詞典》等的最新版本,也都是以語料庫(kù)為依托編寫而成?!盵3]世界語言學(xué)自20世紀(jì)五六十年代進(jìn)入語料庫(kù)時(shí)代,英語詞典編纂者在20世紀(jì)八九十年代就把語料庫(kù)技術(shù)廣泛應(yīng)用于英語詞典的編纂與研究中了,他們非常重視用語料庫(kù)技術(shù)發(fā)現(xiàn)英語多義詞的新義項(xiàng),我們的統(tǒng)計(jì)顯示《牛津》1至8版中100核心詞的平均義項(xiàng)分別是7.55個(gè)、7.91個(gè)、7.03個(gè),8.25個(gè)、8.47個(gè),10.2個(gè)、10.47、10.61?!杜=颉?1至3版)分別出版于1948、1963、1974年,這三版中100核心詞的平均義項(xiàng)數(shù)目基本穩(wěn)定,這說明此段時(shí)間《牛津》詞典編纂者還沒有利用語料庫(kù)技術(shù)把豐富補(bǔ)充常用詞的義項(xiàng)作為重點(diǎn)修訂對(duì)象;《牛津》(4至6版)分別出版于1989、1995、2000年,這三版中100核心詞的平均義項(xiàng)數(shù)目有較大的變化,這說明這三版的詞典編纂者已經(jīng)利用語料庫(kù)技術(shù)把豐富補(bǔ)充常用詞的義項(xiàng)作為重點(diǎn)修訂對(duì)象;《牛津》(6至8版)分別出版于2000、2005、2012年,這三版100核心詞的平均義項(xiàng)數(shù)目基本穩(wěn)定下來,并且從第6版開始《牛津高階英語詞典》常用詞的編纂體例也發(fā)生了很大變化。
目前,占據(jù)英語辭書主要市場(chǎng)的牛津、韋氏、朗文與麥克米倫等英語詞典,都是在語料庫(kù)的基礎(chǔ)上編成的。在最新出版的英語類中型語文性詞典中,100核心詞的平均義項(xiàng)分別是:《牛津高階英語詞典》 (第8版)10.61個(gè),《牛津簡(jiǎn)明英語詞典》(第10版)12.81個(gè),《麥克米倫高階英語詞典》(第2版)11.68個(gè),《韋氏高階英語詞典》(2009年)11.43個(gè),《郎文當(dāng)代英語詞典》(第4版)10.35個(gè)。與傳統(tǒng)憑借語感編纂的詞典相比,建立在語料庫(kù)技術(shù)基礎(chǔ)上的英語類中型語文性詞典在多義詞義項(xiàng)劃分方面更加細(xì)化、義項(xiàng)收錄更加全面,在詞典編纂史上實(shí)現(xiàn)了里程碑式的跨越發(fā)展。
章宜華早在2010年就指出:“詞典語料庫(kù)是西方上世紀(jì)70—80年代的產(chǎn)物,而我們直到90年代才有這方面的成果發(fā)表,而至今大多仍只限于紙上談兵,沒有投入商業(yè)運(yùn)營(yíng)的大型詞典語料庫(kù);而在西方談?wù)Z料庫(kù)的建設(shè)和重要性已經(jīng)是個(gè)過時(shí)的話題。這些都值得學(xué)術(shù)界和出版界注意?!盵4]確實(shí),中國(guó)自20世紀(jì)90年代起就開始相繼建設(shè)了一批漢語語料庫(kù),最有代表性的如北京大學(xué)中國(guó)語言學(xué)研究中心研制的“CCL語料庫(kù)”,截止2015年9月18日現(xiàn)代漢語語料庫(kù)規(guī)模已達(dá)5.81億字,可以說,目前我國(guó)的語料庫(kù)已經(jīng)初步具備了詞典編纂所需要的規(guī)模。盡管如此,在當(dāng)今中國(guó),用語料庫(kù)技術(shù)發(fā)現(xiàn)漢語常用詞新義項(xiàng)的方法還沒有引起漢語詞典編纂者的足夠重視。例如:我們的統(tǒng)計(jì)顯示《現(xiàn)漢》1至6版中100核心詞的平均義項(xiàng)分別是4.85個(gè)、5.20個(gè)、5.18個(gè)、5.18個(gè)、5.20個(gè)、5.42個(gè),這表明,《現(xiàn)漢》(1至6版)并沒有把豐富補(bǔ)充常用詞的義項(xiàng)作為重點(diǎn)修訂對(duì)象,也就是說《現(xiàn)漢》(第6版)對(duì)100核心詞義項(xiàng)的劃分還和《現(xiàn)漢》(第1版)基本一致。與《現(xiàn)漢》同類別的其他漢語類詞典:《現(xiàn)代漢語規(guī)范詞典》(第2版)100個(gè)核心詞的平均義項(xiàng)是5.68個(gè),《現(xiàn)代漢語學(xué)習(xí)詞典》(2010版)5.9個(gè),《新華詞典》(最新修訂版)4.33個(gè),這說明漢語類中型語文性詞典中100核心詞乃至更多常用詞義項(xiàng)的劃分并沒有建立在大型語料庫(kù)的基礎(chǔ)上進(jìn)行成規(guī)模地系統(tǒng)修訂,也說明漢語類詞典中常用多義詞的義項(xiàng)至今依然處在20世紀(jì)五六十年代靠語感確定義項(xiàng)的編纂水準(zhǔn)。因此漢語類詞典中存在常用多義詞義項(xiàng)收錄不全的情況就在所難免了,從而導(dǎo)致漢語類中型語文性詞典義項(xiàng)的劃分比較粗疏、存在義項(xiàng)漏收的情況。
評(píng)價(jià)一部詞典是否優(yōu)劣的基本參數(shù)有兩個(gè):一是詞典的編纂體例,二是詞典中常用多義詞的釋義,而詞典編纂體例是否完善也最終體現(xiàn)在常用多義詞釋義方面,也即常用多義詞義項(xiàng)的精細(xì)度、常用多義詞義項(xiàng)的釋義用語、常用多義詞義項(xiàng)的排列等方面?!冬F(xiàn)漢》從20世紀(jì)五六十年代開始編纂,1978年發(fā)行第1版, 2012年發(fā)行第6版,但是半個(gè)世紀(jì)以來,《現(xiàn)漢》(1-6版)無論在編纂體例方面還是常用詞的釋義方面基本沒有變化,因此,按照上述標(biāo)準(zhǔn)評(píng)價(jià)以《現(xiàn)漢》為代表的漢語類詞典,我們很容易就會(huì)得出《現(xiàn)6》常用詞義項(xiàng)方面的編纂水準(zhǔn)至今仍處在20世紀(jì)五六十年代的水平,落后于英美國(guó)家同類型的詞典。
古今中外語文性詞典的差別主要體現(xiàn)在常用詞的釋義方面,《現(xiàn)漢》與同類別的英語詞典相比落后的主要原因在于《現(xiàn)漢》沒有用語料庫(kù)技術(shù)的方法豐富并補(bǔ)充常用詞的義項(xiàng)。用語料庫(kù)搜集語料與人工搜集語料相比具有許多優(yōu)越性,最重要的優(yōu)點(diǎn)就是用語料庫(kù)搜集語料具有里程碑式的、劃時(shí)代的方法論意義,以“黑”為例:用語料庫(kù)檢索的方法可以在16毫秒的時(shí)間內(nèi)得出“黑”在CCL現(xiàn)代漢語語料庫(kù)中有130831條。假設(shè)用人工閱讀的方法查找1條含有“黑”字的語句需要用1個(gè)小時(shí)(實(shí)際上有時(shí)候不止1個(gè)小時(shí)),那么要找130831條“黑”字語料則要用130831小時(shí)。經(jīng)過計(jì)算可以知道查找同樣多的語料的速度,用語料庫(kù)技術(shù)的方法約是人工閱讀的290多億倍,簡(jiǎn)直是神速。
我們可以根據(jù)有關(guān)字頻、詞頻的統(tǒng)計(jì)材料,確定3000個(gè)構(gòu)詞能力強(qiáng)、使用頻率高的常用詞作為主要研究對(duì)象,在語料庫(kù)基礎(chǔ)上以個(gè)案研究和系統(tǒng)研究相結(jié)合的形式著重探討現(xiàn)代漢語中3000常用詞的義項(xiàng)分布:一方面可以詳細(xì)描寫出每個(gè)常用詞在現(xiàn)代漢語中的義項(xiàng)分布情況,另一方面也可以歸納出同類詞在現(xiàn)代漢語中的義項(xiàng)分布規(guī)律。
如果說李仕春通過統(tǒng)計(jì)100核心詞的數(shù)據(jù)說明“長(zhǎng)期以來中國(guó)詞典的編纂者乃至研究現(xiàn)代漢語詞匯的學(xué)者忽視了現(xiàn)代漢語100核心詞乃至更多常用詞義項(xiàng)的研究”[1],那么本文則進(jìn)一步印證了這一觀點(diǎn)——《現(xiàn)6》的編纂者確實(shí)忽略了用語料庫(kù)技術(shù)豐富并補(bǔ)充現(xiàn)代漢語常用詞義項(xiàng)分布情況的研究。
四、結(jié)語
《現(xiàn)代漢語詞典》自問世以來,發(fā)行量大、應(yīng)用面廣,世所罕見,特別是進(jìn)入新世紀(jì)以來《現(xiàn)漢》每年的發(fā)行量大概在300萬至500萬冊(cè)之間,銷售額度在2—4億,可見其在國(guó)民學(xué)習(xí)生活中的重要作用,堪稱國(guó)典,然而卻還存在著落后的一面。李仕春《語料庫(kù)視野下的現(xiàn)代漢語“綠”字義項(xiàng)分布研究》[5]、《語料庫(kù)視野下的現(xiàn)代漢語“狗”字義項(xiàng)分布研究》[6]等系列文章,就以理論和實(shí)踐的形式說明漢語中常用詞的義項(xiàng)數(shù)目一點(diǎn)也不比英語中常用詞的義項(xiàng)數(shù)目少。因此,在漢英詞典的視角下,在已有漢語類詞典釋義的基礎(chǔ)上,運(yùn)用語料庫(kù)技術(shù)的方法,描寫出現(xiàn)代漢語中常用詞的義項(xiàng)分布情況,是一項(xiàng)刻不容緩的任務(wù)。這樣的研究成果有利于《現(xiàn)漢》的編纂水準(zhǔn)達(dá)到國(guó)際先進(jìn)的水平,是功在當(dāng)代利在千秋的利國(guó)利民的大好事。
[參考文獻(xiàn)]
[1]李仕春.漢英詞典100核心詞釋義對(duì)比研究[J].中南大學(xué)學(xué)報(bào):社會(huì)科學(xué)版,2013,(6):252-258.
[2]蘇新春.漢語釋義元語言研究[M].上海:上海教育出版社,2005:51.
[3]張志毅.辭書強(qiáng)國(guó)——辭書人任重道遠(yuǎn)的追求[J].辭書研究,2012,(1):1-9.
[4]章宜華.《辭書研究》與新時(shí)期詞典學(xué)理論和編纂方法的創(chuàng)新[J].辭書研究,2010,(1):57-69.
[5]李仕春.語料庫(kù)視野下的現(xiàn)代漢語“綠”字義項(xiàng)分布研究[J].山西大同大學(xué)學(xué)報(bào):社會(huì)科學(xué)版,2013,(5):62-66.
[6]李仕春,李蓓.語料庫(kù)視野下的現(xiàn)代漢語“狗”字義項(xiàng)分布研究[J].北華大學(xué)學(xué)報(bào):社會(huì)科學(xué)版,2013,(5):9-11.
[責(zé)任編輯:康邦顯]
中圖分類號(hào):H06
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1001-0238(2016)01-0109-04
[作者簡(jiǎn)介]李仕春(1973—),男,山東莒縣人,西南大學(xué)文學(xué)院教授,主要從事詞匯學(xué)、詞典學(xué)研究。
[基金項(xiàng)目]國(guó)家社會(huì)科學(xué)基金重點(diǎn)項(xiàng)目“語料庫(kù)視野下的現(xiàn)代漢語單音多義詞義項(xiàng)分布研究”(14AYY018);教育部規(guī)劃基金項(xiàng)目“山東方言表體范疇的語法化音變研究”(11YJA740048);西南大學(xué)科研基金資助項(xiàng)目“語料庫(kù)視野下的現(xiàn)代漢語單音多義詞義項(xiàng)分布研究”(SWU1509502)。
[收稿日期]2015-11-25