李 安
釋義從一定意義上說(shuō)是詞典編纂的中心工作。一部詞典的質(zhì)量高低很大程度上決定于釋義的質(zhì)量(胡明揚(yáng)1982)。加之詞義概括、多義詞義項(xiàng)劃分、釋義幾個(gè)過(guò)程都比較復(fù)雜,處置不當(dāng)容易導(dǎo)致諸如“肢解詞的完整理性意義”(鄒酆2003)、“義項(xiàng)關(guān)系不當(dāng)”(吳云芳,俞士汶 2006)等問(wèn)題。胡明揚(yáng)等(1982)指出:“詞義概括是否得當(dāng),義項(xiàng)劃分是否合理等問(wèn)題,其實(shí)是可以通過(guò)語(yǔ)料檢驗(yàn)的方法來(lái)發(fā)現(xiàn)并加以改進(jìn)的?!比欢~典釋義檢驗(yàn)有多大必要性、檢驗(yàn)方法應(yīng)如何設(shè)計(jì)、通過(guò)檢驗(yàn)可以解決哪些問(wèn)題等,尚少細(xì)致的討論。
我們?cè)谕瓿烧n題“基于國(guó)家語(yǔ)委‘通用語(yǔ)料庫(kù)’之上的漢語(yǔ)義頻詞庫(kù)的開(kāi)發(fā)(SCT)”過(guò)程中發(fā)現(xiàn),對(duì)詞典釋義的檢驗(yàn)不僅必要,而且不能隨意為之。課題的核心是計(jì)算機(jī)詞義自動(dòng)標(biāo)注,也就是使計(jì)算機(jī)根據(jù)詞典的義項(xiàng)設(shè)置,給使用中的多義詞自動(dòng)標(biāo)注一個(gè)合適的義項(xiàng)。課題使用的詞典是《現(xiàn)代漢語(yǔ)詞典》(1996年修訂版,以下簡(jiǎn)稱《現(xiàn)漢》),目前已經(jīng)完成了對(duì)3771個(gè)高頻、雙音節(jié)多義詞的研究。作為課題的一個(gè)子項(xiàng)目,我們研制了“驗(yàn)證庫(kù)”,即首先從大規(guī)模語(yǔ)料庫(kù)中為每個(gè)多義詞抽取一定量的句子形成語(yǔ)料庫(kù),然后由人模擬計(jì)算機(jī)標(biāo)注一個(gè)義項(xiàng),再由計(jì)算機(jī)自動(dòng)標(biāo)注義項(xiàng),兩相對(duì)照以檢驗(yàn)計(jì)算機(jī)標(biāo)注的正確率。在這個(gè)過(guò)程中發(fā)現(xiàn)部分句子難以標(biāo)注,原因有多種:有的是僅憑句內(nèi)上下文的確無(wú)法判斷詞義;有的是機(jī)用詞典與普通語(yǔ)文詞典的性質(zhì)與功能不同所致;也有的表現(xiàn)為語(yǔ)文詞典原有義項(xiàng)設(shè)置不合理。
在涉及詞典義項(xiàng)設(shè)置的問(wèn)題上,課題中對(duì)《現(xiàn)漢》調(diào)整有百余處,當(dāng)然這些調(diào)整主要緣于機(jī)用義項(xiàng)庫(kù)有著不同的性質(zhì)與功能,調(diào)整的類型、原則、方法在《機(jī)用義項(xiàng)庫(kù)在詞義標(biāo)注中的作用及其完善》一文中做了介紹(蘇新春等2010),然而其中也不乏傳統(tǒng)詞典本身可做改進(jìn)之處,從這個(gè)角度來(lái)說(shuō),我們認(rèn)為詞義標(biāo)注正是實(shí)踐了從詞典釋義回到言語(yǔ)實(shí)際的檢驗(yàn)過(guò)程,對(duì)詞義標(biāo)注的結(jié)果及其困難進(jìn)行深入分析就可以發(fā)現(xiàn)詞典存在的不當(dāng)之處。本文把詞義標(biāo)注相關(guān)課題中與語(yǔ)文詞典釋義相關(guān)的部分提取出來(lái),設(shè)計(jì)了一種詞典釋義的封閉式檢驗(yàn)方法,希望對(duì)一般詞典編纂中義項(xiàng)的設(shè)立和釋義有所幫助。下文就介紹這種檢驗(yàn)方法的詳細(xì)步驟,并舉例分析課題中發(fā)現(xiàn)的詞典釋義不當(dāng)之處。
封閉式檢驗(yàn)旨在于一個(gè)封閉的語(yǔ)料庫(kù)中,通過(guò)詞義標(biāo)注考察詞典義項(xiàng)設(shè)置是否合理,重點(diǎn)考察一個(gè)“詞形”所對(duì)應(yīng)的意義的整體范圍、義項(xiàng)關(guān)系、義項(xiàng)與語(yǔ)料的對(duì)應(yīng)關(guān)系,進(jìn)而分析詞典中義項(xiàng)的概括模式、粒度是否與語(yǔ)料契合,個(gè)體義項(xiàng)是否恰當(dāng)。有三個(gè)基本步驟:
建立大規(guī)模平衡語(yǔ)料庫(kù)作為基礎(chǔ)語(yǔ)料庫(kù),要能覆蓋一般語(yǔ)文詞典的基本范圍,語(yǔ)料構(gòu)成要與詞典的性質(zhì)、定位相對(duì)應(yīng)。我們的課題以現(xiàn)代漢語(yǔ)為研究對(duì)象,要求語(yǔ)料能反映現(xiàn)代漢語(yǔ)的基本狀況。研制的平衡語(yǔ)料庫(kù)有2億多字,主要包括三個(gè)部分:(1)國(guó)家語(yǔ)委研制的“現(xiàn)代漢語(yǔ)語(yǔ)料庫(kù)”;(2)部分人民日?qǐng)?bào)語(yǔ)料(2001年后的若干月份);(3)文學(xué)作品及部分教材語(yǔ)料。
“‘國(guó)家語(yǔ)委現(xiàn)代漢語(yǔ)語(yǔ)料庫(kù)’是一個(gè)大型的通用語(yǔ)料庫(kù)。該語(yǔ)料庫(kù)以語(yǔ)言文字的信息處理、語(yǔ)言文字規(guī)范和標(biāo)準(zhǔn)的制定、語(yǔ)言文字的學(xué)術(shù)研究、語(yǔ)文教育和語(yǔ)言文字的社會(huì)應(yīng)用為主要服務(wù)對(duì)象……選材有足夠的時(shí)間跨度,語(yǔ)料抽樣合理、分布均勻、比例適當(dāng),能夠比較科學(xué)地反映現(xiàn)代漢語(yǔ)全貌?!?靳光瑾等2005)“國(guó)家語(yǔ)委現(xiàn)代漢語(yǔ)語(yǔ)料庫(kù)”設(shè)計(jì)比較合理,我們采用了它的基本結(jié)構(gòu)和內(nèi)容,但其字?jǐn)?shù)略少,語(yǔ)料稍嫌陳舊,因而做了些補(bǔ)充。
隨機(jī)抽樣檢驗(yàn)是指從大規(guī)?;A(chǔ)語(yǔ)料庫(kù)中隨機(jī)抽取一定量的句子組成檢驗(yàn)語(yǔ)料庫(kù)。在SCT課題中確定抽樣句子數(shù)時(shí)考慮到了詞頻高低、詞義標(biāo)注規(guī)則復(fù)雜程度(一般標(biāo)注規(guī)則復(fù)雜的,其用法也就復(fù)雜,就需要更多的語(yǔ)料)、人工標(biāo)注任務(wù)量三個(gè)因素。對(duì)3771個(gè)多義詞,抽取的總句子數(shù)達(dá)493369個(gè),一個(gè)詞最多有233個(gè)句子,最少有100個(gè)句子。如此規(guī)模的語(yǔ)料量雖很難完全覆蓋生僻義、方言義、行業(yè)義等不常用的義項(xiàng),但覆蓋詞的常用義、較常用義,反映其基本面貌,則是沒(méi)有問(wèn)題的。
隨機(jī)抽取步驟主要從檢驗(yàn)方法的可行性方面考慮。在總語(yǔ)料庫(kù)中檢索3771個(gè)詞總共得到245萬(wàn)個(gè)句子,即便有計(jì)算機(jī)輔助也難以細(xì)致分析。檢驗(yàn)庫(kù)規(guī)模僅為原來(lái)的20%,既能保證充分反映原來(lái)大規(guī)?;A(chǔ)語(yǔ)料庫(kù)的特征,又大大減輕了檢驗(yàn)的工作量。
完全標(biāo)注是指在一個(gè)封閉的驗(yàn)證語(yǔ)料庫(kù)中,給每個(gè)例詞都標(biāo)注唯一的義項(xiàng),并保證標(biāo)注結(jié)果的一致性。如不能順利完成標(biāo)注,或者標(biāo)注結(jié)果不統(tǒng)一,則分析其根源,檢查是否為詞典詞義歸納、義項(xiàng)設(shè)置不當(dāng)所致。
封閉式檢驗(yàn)中對(duì)語(yǔ)料進(jìn)行義項(xiàng)標(biāo)注的過(guò)程,既是對(duì)使用中的多義詞義域規(guī)模、結(jié)構(gòu)進(jìn)行調(diào)查的過(guò)程,也是將詞典釋義與言語(yǔ)實(shí)際進(jìn)行對(duì)照,考察每個(gè)義項(xiàng)的義域在整體義域中的地位、比例以及與相鄰義項(xiàng)關(guān)系的過(guò)程。其核心意義在于把詞的實(shí)際義域、詞典釋義的義域、個(gè)體義項(xiàng)義域、個(gè)體義項(xiàng)間的關(guān)系這幾個(gè)要素綜合起來(lái),做定量考察。不僅可以檢驗(yàn)個(gè)別義項(xiàng)是否合理,是否有新義、漏收義,更可以從深層次發(fā)現(xiàn)詞典釋義中的義項(xiàng)粒度、義項(xiàng)關(guān)系等方面存在的不合理之處。下面舉例著重說(shuō)明在義項(xiàng)粒度、義項(xiàng)關(guān)系方面發(fā)現(xiàn)的問(wèn)題。
多數(shù)情況下義項(xiàng)粒度與詞典規(guī)模、用途有關(guān),在詞的整體義域一定的情況下,大型詞典義項(xiàng)粒度小,義項(xiàng)數(shù)多;小型詞典義項(xiàng)粒度大,義項(xiàng)數(shù)少,這種義項(xiàng)粒度大小不一的現(xiàn)象是合理的。
但是如果義項(xiàng)粒度過(guò)小則會(huì)導(dǎo)致詞典釋義覆蓋力不足,造成一定數(shù)量的語(yǔ)料無(wú)法標(biāo)注,這時(shí)就是不合理的。如在《現(xiàn)漢》中:“出場(chǎng) ①演員登臺(tái)(表演)。②運(yùn)動(dòng)員進(jìn)入場(chǎng)地(參加競(jìng)賽或表演)。”我們從大規(guī)模語(yǔ)料庫(kù)中隨機(jī)抽取了73個(gè)含“出場(chǎng)”的句子做測(cè)試,超過(guò)20%的句子無(wú)法標(biāo)注義項(xiàng),如:
(1)有人怕鬧事,開(kāi)始退場(chǎng),劇團(tuán)的領(lǐng)導(dǎo)出場(chǎng),懇求大家安靜。
(2)新式戰(zhàn)機(jī)隆重出場(chǎng)。
詞典以動(dòng)作發(fā)出者區(qū)別兩個(gè)義項(xiàng),而例句中“劇團(tuán)的領(lǐng)導(dǎo)”、“新式戰(zhàn)機(jī)”既不能歸入“演員”或“運(yùn)動(dòng)員”,也很難確定與哪個(gè)義項(xiàng)在語(yǔ)義上更相近,因而無(wú)法標(biāo)注。
再如:“過(guò)道 ①新式房子由大門(mén)通向各房間的走道。②舊式房子連通各個(gè)院子的走道,特指大門(mén)所在的一間或半間屋子?!痹谟行┚渥永餆o(wú)法標(biāo)注,如:
(3)草地的兩邊種了幾排桑樹(shù),中間露出一條寬的過(guò)道。
例句(3)里的“過(guò)道”既不屬于“新式房子”,也不屬于“舊式房子”,類似的還有“車廂過(guò)道”、“劇場(chǎng)過(guò)道”等都不在詞典釋義范圍內(nèi),也無(wú)法判斷這些義項(xiàng)與哪個(gè)更相近,因而無(wú)法標(biāo)注。
義項(xiàng)粒度過(guò)小還有一種表現(xiàn),即難以涵蓋詞義發(fā)生的一些新變化。
如:“封面 ①線裝書(shū)指書(shū)皮里面印著書(shū)名和刻書(shū)者的名稱等的一頁(yè)。②新式裝訂的書(shū)刊指最外面的一層,用厚紙、布、皮等做成。③特指新式裝訂的書(shū)刊印著書(shū)刊名稱等的第一面。也叫封一?!北M管以上三個(gè)義項(xiàng)釋義詳盡具體,然而不能覆蓋“專輯封面”、“相冊(cè)封面”、“簡(jiǎn)歷封面”等“新事物”。
以上幾個(gè)詞條的相同之處在于:(1)詞典釋義中每個(gè)義項(xiàng)都是完整的,都對(duì)應(yīng)一定量的語(yǔ)料。(2)詞典釋義不能覆蓋全部語(yǔ)料,很多語(yǔ)料的意思與相鄰的兩個(gè)義項(xiàng)都有相似之處,但是難以確定屬于哪個(gè)義項(xiàng)。(3)詞典釋義中每個(gè)義項(xiàng)的義域都十分狹窄,所指的動(dòng)作或事物都十分具體。(4)如果在原有義項(xiàng)粒度基礎(chǔ)上用增設(shè)義項(xiàng)的方式覆蓋所有語(yǔ)料,義項(xiàng)設(shè)置將十分繁雜。因此,這類詞的根本問(wèn)題不是漏收詞義,而是義項(xiàng)粒度過(guò)小,概括性不足?!傲x項(xiàng)的概括性要求這個(gè)義項(xiàng)具有普遍意義,即通過(guò)這個(gè)義項(xiàng)來(lái)解釋一系列相類似有時(shí)又有細(xì)微差別的語(yǔ)義現(xiàn)象,人們?cè)陂喿x過(guò)程中遇到與此義有關(guān)的語(yǔ)義,都應(yīng)從這個(gè)義項(xiàng)得到滿意的解釋,或者從這個(gè)義項(xiàng)中受到啟示,去求得這個(gè)詞的最確切的含義?!?汪耀楠1990)如果適當(dāng)“合并”義項(xiàng),增加概括度,釋義將更具解釋力,也更加簡(jiǎn)潔。
標(biāo)注結(jié)果不唯一是指在同一具體語(yǔ)境下,一個(gè)多義詞可以標(biāo)注為相鄰的兩個(gè)或多個(gè)義項(xiàng)。造成這種現(xiàn)象的原因有很多,如語(yǔ)境不充足等。但有時(shí)語(yǔ)境充足,仍然難以標(biāo)注唯一義項(xiàng),往往就反映出義項(xiàng)交叉覆蓋的問(wèn)題。
如:“發(fā)表 ①向集體或社會(huì)表達(dá)(意見(jiàn));宣布:~談話丨~聲明丨代表團(tuán)成員已經(jīng)確定,名單尚未正式~。②在刊物上登載(文章、繪畫(huà)、歌曲等):~論文?!毕旅娴木渥又小鞍l(fā)表”同時(shí)符合義項(xiàng)①②:
(4)閻世鐸在人民網(wǎng)發(fā)表談話勇敢面對(duì)中國(guó)足球前進(jìn)中的問(wèn)題。
句(4)既符合“向集體或社會(huì)表達(dá)”的特征,又是“以文章形式”“在刊物上登載”。進(jìn)一步分析發(fā)現(xiàn)造成這種狀況的原因是兩個(gè)義項(xiàng)意義相近卻沒(méi)有對(duì)立的區(qū)別性義素,如表1所示:
表1
動(dòng)作對(duì)象方面,義項(xiàng)②雖未做說(shuō)明,實(shí)際與義項(xiàng)①是一樣的;動(dòng)作方面,義項(xiàng)②的義素“登載”是義項(xiàng)①“表達(dá)”的一種形式;動(dòng)作內(nèi)容方面,義項(xiàng)①“意見(jiàn)”是從內(nèi)容方面說(shuō)的,義項(xiàng)②“文章”等是從載體方面說(shuō)的,“意見(jiàn)”也可以以“文章”的形式發(fā)表;動(dòng)作方式上,義項(xiàng)②說(shuō)明通過(guò)刊物,義項(xiàng)①?zèng)]有說(shuō)明??傊x項(xiàng)②的釋義比較明確地指出通過(guò)刊物“發(fā)表”,義項(xiàng)①卻不設(shè)范圍,大致包含了義項(xiàng)②的內(nèi)容。
那么原有的釋義能不能讓它形成具有區(qū)別特征的對(duì)立性釋義呢?應(yīng)該是可以的,如可在“發(fā)表”的方式上加以區(qū)別,義項(xiàng)①改為“口頭表達(dá)(意見(jiàn))”即可。
其他原因也可能造成義項(xiàng)間的交叉覆蓋,如“出門(mén)”有三個(gè)義項(xiàng):“①(~兒)外出。②(~兒)離家遠(yuǎn)行。③〈方〉出嫁。”義項(xiàng)①的釋義詞“外出”在同一詞典中的釋義為“到外面去,特指因事到外地去”。“到外面去”與“出門(mén)①”對(duì)應(yīng),“因事到外地去”與“出門(mén)②”對(duì)應(yīng),這樣實(shí)際上是導(dǎo)致了“出門(mén)①”同時(shí)包含義項(xiàng)①②的意思。如此,所有可標(biāo)為義項(xiàng)②的句子都可以標(biāo)為義項(xiàng)①,如:
(5)他想,出門(mén)一個(gè)多月,究竟發(fā)生了什么事呢?
以上兩詞出現(xiàn)的問(wèn)題比較隱蔽,在檢驗(yàn)中如果僅僅尋找典型例子很容易錯(cuò)過(guò),而唯有在一定量的語(yǔ)料的詞義標(biāo)注中,在人、機(jī)標(biāo)注結(jié)果的對(duì)比中才能發(fā)現(xiàn)問(wèn)題。
本文根據(jù)“基于國(guó)家語(yǔ)委‘通用語(yǔ)料庫(kù)’之上的漢語(yǔ)義頻詞庫(kù)的開(kāi)發(fā)”課題的詞義標(biāo)注實(shí)踐,概括出了可以應(yīng)用于語(yǔ)文詞典編纂中檢驗(yàn)義項(xiàng)設(shè)立、釋義是否得當(dāng)?shù)姆椒?,這種方法的實(shí)質(zhì)是對(duì)真實(shí)語(yǔ)料進(jìn)行窮盡式的調(diào)查,從而將產(chǎn)生于典型取樣的詞典釋義放到多義詞的實(shí)際語(yǔ)言運(yùn)用中,系統(tǒng)、量化地檢驗(yàn)其是否周全、均勻、對(duì)稱。這種方法的優(yōu)點(diǎn)主要有兩個(gè):其一,可以發(fā)現(xiàn)語(yǔ)文詞典義項(xiàng)、釋義中存在的一些潛在問(wèn)題;其二,利用語(yǔ)料庫(kù)與抽樣技術(shù),不需要投入過(guò)多的人力、物力。當(dāng)然上面分析的某些現(xiàn)象對(duì)現(xiàn)有的語(yǔ)文詞典來(lái)說(shuō)有點(diǎn)“苛刻”,但是這種檢驗(yàn)和討論可以使傳統(tǒng)詞典釋義更加貼近真實(shí)語(yǔ)料,有利于提高義項(xiàng)概括與釋義的科學(xué)性、可操作性。
1.胡明揚(yáng),謝自立,梁式中等.詞典學(xué)概論.北京:中國(guó)人民大學(xué)出版社,1982.
2.靳光瑾,肖航,富麗等.現(xiàn)代漢語(yǔ)語(yǔ)料庫(kù)建設(shè)及深加工.語(yǔ)言文字應(yīng)用,2005(2).
3.蘇新春,李安,洪桂治.機(jī)用義項(xiàng)庫(kù)在詞義標(biāo)注中的作用及其完善.廈門(mén)大學(xué)學(xué)報(bào),2010(3).
4.汪耀楠.詞典學(xué)研究.成都:四川辭書(shū)出版社,1990.
5.吳云芳,俞士汶.信息處理用詞語(yǔ)義項(xiàng)區(qū)分的原則和方法.語(yǔ)言文字應(yīng)用,2006(2).
6.鄒酆.辭書(shū)學(xué)叢稿.武漢:崇文書(shū)局,2003.