• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      《年度媒體高頻詞語(yǔ)表》對(duì)辭書(shū)編纂的價(jià)值*

      2019-07-22 12:03:16侯瑞芬
      辭書(shū)研究 2019年4期
      關(guān)鍵詞:高頻詞比薩辭書(shū)

      侯瑞芬

      國(guó)家語(yǔ)言資源監(jiān)測(cè)與研究中心對(duì)平面、有聲、網(wǎng)絡(luò)三種媒體的語(yǔ)料進(jìn)行監(jiān)測(cè),整理形成當(dāng)年的《年度媒體用字總表》、《年度媒體高頻詞語(yǔ)表》(以下簡(jiǎn)稱(chēng)《高頻詞表》)和《年度媒體新詞語(yǔ)表》等詞表,在教育部語(yǔ)言文字信息管理司組編的《中國(guó)語(yǔ)言生活狀況報(bào)告》中公布,至今已有八年。其中的《高頻詞表》是對(duì)每年的語(yǔ)料進(jìn)行分詞系統(tǒng)切分,將其中覆蓋率達(dá)到95%的詞語(yǔ)去掉時(shí)間表達(dá)式、數(shù)字表達(dá)式、專(zhuān)有名稱(chēng)后得到的。每年公布的高頻詞語(yǔ)數(shù)量在2.5—2.8萬(wàn)之間,并有逐年上升趨勢(shì)。《高頻詞表》不僅對(duì)于人們了解當(dāng)年的常用詞語(yǔ)狀況很有幫助,對(duì)漢語(yǔ)詞匯研究和辭書(shū)編纂來(lái)說(shuō)也是一份珍貴的資料。

      我們將在對(duì)《高頻詞表》中詞語(yǔ)的整體面貌進(jìn)行分析的基礎(chǔ)上,對(duì)比《高頻詞表》與《現(xiàn)代漢語(yǔ)詞典》(以下簡(jiǎn)稱(chēng)《現(xiàn)漢》)第7版中的詞語(yǔ)異同,并進(jìn)一步說(shuō)明《高頻詞表》對(duì)辭書(shū)編纂特別是收詞問(wèn)題的應(yīng)用價(jià)值。為了對(duì)詞語(yǔ)的發(fā)展變化有一個(gè)相對(duì)完整的了解,我們利用《人民日?qǐng)?bào)》1946創(chuàng)刊到2018年這七十多年的語(yǔ)料對(duì)相關(guān)詞語(yǔ)的使用進(jìn)行分析。

      一、 《高頻詞表》反映了當(dāng)今漢語(yǔ)詞匯的基本面貌和發(fā)展趨勢(shì)

      《高頻詞表》是當(dāng)年媒體語(yǔ)料中出現(xiàn)頻率最高的詞的集合,我們將2010年—2017年間的《高頻詞表》匯總在一起,除去字母詞外,8年間一共收錄33815個(gè)年度高頻詞,我們稱(chēng)為《高頻詞表》合收詞,8年中共同收錄的有22203個(gè)詞,我們稱(chēng)為《高頻詞表》共收詞。這22203個(gè)《高頻詞表》共收詞可以視為近幾年比較穩(wěn)定的高頻詞語(yǔ)的一個(gè)集合,反映了近年來(lái)漢語(yǔ)詞匯的基本面貌和發(fā)展趨勢(shì)。我們主要從詞長(zhǎng)和用字兩方面進(jìn)行分析。

      (一) 《高頻詞表》中詞語(yǔ)的詞長(zhǎng)分析

      我們對(duì)2010年—2017年《高頻詞表》的詞長(zhǎng)做了統(tǒng)計(jì),結(jié)果如下:

      表1 《高頻詞表》中詞語(yǔ)的詞長(zhǎng)統(tǒng)計(jì)

      可以看到,二字詞是漢語(yǔ)詞匯的主體,占有絕對(duì)優(yōu)勢(shì),其次是三字詞,五字及以上的詞很少。三字詞近年來(lái)的快速發(fā)展已經(jīng)引起不少學(xué)者的關(guān)注,在新產(chǎn)生的詞中,三字詞更是取代二字詞成為最主要的類(lèi)型。一些學(xué)者由此認(rèn)為“漢語(yǔ)將進(jìn)入一個(gè)以三音詞為主的發(fā)展階段”(陶原珂 2003;李海霞 2013等),但是通過(guò)對(duì)近8年來(lái)《高頻詞表》的分析,我們可以看到,與《高頻詞表》合收詞相比,《高頻詞表》共收詞中的二字詞比例增加,而三字詞比例減少。這表明漢語(yǔ)詞匯系統(tǒng)中穩(wěn)定的詞語(yǔ)仍是二字詞,而三字詞則是相對(duì)不穩(wěn)定的。

      (二) 《高頻詞表》中詞語(yǔ)的用字分析

      除單字之外的19577個(gè)共收的高頻詞是由3210個(gè)漢字構(gòu)成的,其中構(gòu)詞能力最強(qiáng)的20個(gè)漢字及它們的構(gòu)詞數(shù)量分別是:

      表2 《高頻詞表》中前20個(gè)高頻漢字的構(gòu)詞量

      應(yīng)該說(shuō),漢字的構(gòu)詞能力是相當(dāng)強(qiáng)的,常用漢字尤其如此,前20個(gè)高頻漢字的構(gòu)詞量都在100個(gè)以上?;蛟S這個(gè)數(shù)據(jù)可以促使我們反思現(xiàn)在的基礎(chǔ)教育中是否更應(yīng)注重詞匯教學(xué),擴(kuò)大學(xué)生的詞匯量,對(duì)學(xué)生詞典收字量的確定也有一定的啟發(fā)。

      二、 《高頻詞表》與詞典詞目的性質(zhì)同中有異

      在《高頻詞表》8年共同收錄的22203個(gè)高頻詞中,有17532個(gè)被《現(xiàn)漢》第7版收錄,占到了79.00%,但仍有4671個(gè)詞沒(méi)有被《現(xiàn)漢》第7版收錄。這一方面提醒我們《高頻詞表》與詞典的詞目有很大共性,都是一定時(shí)期內(nèi)社會(huì)群體所使用的比較穩(wěn)定的詞語(yǔ)集合,但也說(shuō)明它們同中有異,有比較明顯的差異。

      首先,《現(xiàn)漢》是為推廣普通話(huà),促進(jìn)漢語(yǔ)規(guī)范化服務(wù)的,它記錄的是現(xiàn)代漢語(yǔ)普通話(huà)詞匯的整體面貌。《現(xiàn)代漢語(yǔ)詞典編輯計(jì)劃綱要草案》指出:“這部詞典所收的通用的詞是物質(zhì)生活、文化生活和政治、經(jīng)濟(jì)生活中普通的詞,各行各業(yè)的普通的詞,各學(xué)科的普通的詞?!倍陡哳l詞表》是在媒體語(yǔ)料基礎(chǔ)上完成的,帶有鮮明的媒體語(yǔ)言的特點(diǎn),比如它最高頻的雙字詞是“記者”,排第二位的才是“我們”。一些當(dāng)年的熱點(diǎn)事物也會(huì)出現(xiàn)在當(dāng)年的《高頻詞表》中,如2017年的“氫彈”和“涉臺(tái)”,這都與它選取媒體語(yǔ)料的特點(diǎn)密不可分。

      其次,《現(xiàn)漢》中的詞目選擇是面向人的,而《高頻詞表》是機(jī)器分詞的結(jié)果。機(jī)器分詞看中結(jié)構(gòu)的凝固程度和復(fù)現(xiàn)率,而人的分詞考慮“意義的完整性和使用的獨(dú)立性”(蘇新春,顧江萍 2000)。不同的出發(fā)點(diǎn)決定了它們必然呈現(xiàn)出不同的詞匯面貌。

      《高頻詞表》的合收詞中未收入《現(xiàn)漢》第7版的4671個(gè)詞語(yǔ),有相當(dāng)一部分是由于兩種詞表的差異導(dǎo)致的。我們主要從三個(gè)方面對(duì)《高頻詞表》和《現(xiàn)漢》在收詞上的差異進(jìn)行分析。

      (一) 收詞單位

      《高頻詞表》對(duì)一些高頻組合的詞語(yǔ)會(huì)整體收錄,如“工作委員會(huì)”“本職工作”“不僅如此”都是《高頻詞表》中收錄的詞;而詞典以收詞為主,如果一個(gè)詞匯單位可以分解,而且分解后的單位具有一定的組合能力,詞典通常收錄更小的單位,這樣做的目的是為了以簡(jiǎn)馭繁,體現(xiàn)詞目的層級(jí)性和統(tǒng)轄性。

      比如對(duì)“雙音詞+于”的處理,《現(xiàn)漢》通常只收雙音詞,如“有賴(lài)、取決、來(lái)源”,然后通過(guò)括注的方式說(shuō)明它可以和“于”連用。這樣處理的好處是既可以涵蓋住雙音詞,又可以涵蓋住“雙音詞+于”,收詞效率更高。而《高頻詞表》則或者只收高頻出現(xiàn)的“雙音詞+于”形式,如“有賴(lài)于、無(wú)愧于、取決于”,或者同時(shí)收“雙音詞”和“雙音詞+于”形式,如“來(lái)源/來(lái)源于、致力/致力于、相當(dāng)/相當(dāng)于、甚至/甚至于”。

      再如對(duì)四字格的處理,《高頻詞表》一般會(huì)整體收錄,而《現(xiàn)漢》則會(huì)選取組合能力較強(qiáng)的構(gòu)成單位進(jìn)行收錄:

      表3 《現(xiàn)漢》第7版和《高頻詞表》對(duì)四字格的收錄差異(1)

      雙音詞連用的四字組,如果詞義等于兩個(gè)成詞語(yǔ)素之和,詞典一般只出雙音詞而不再出四字組,但《高頻詞表》則主要根據(jù)頻率來(lái)取舍。如:

      表4 《現(xiàn)漢》第7版和《高頻詞表》對(duì)四字格的收錄差異(2)

      《現(xiàn)漢》對(duì)四字格的這兩種處理方式都是為了提高收詞的效率。這類(lèi)簡(jiǎn)單的組合讀者可以根據(jù)各組成成分的意義,通過(guò)組合關(guān)系而自然理解,不必在詞典中整體收錄再做解釋。

      (二) 詞匯詞與詞法詞的區(qū)分

      《高頻詞表》與詞典詞目的差別也體現(xiàn)在對(duì)詞法詞的態(tài)度上。董秀芳(2004)指出,詞匯詞是需要列入詞庫(kù)的詞,詞法詞則是由詞法規(guī)則生成的詞。這種區(qū)分對(duì)詞典收詞非常重要,一方面詞法詞具有能產(chǎn)性,詞典不可能將全部的詞法詞都收入詞典;另一方面,詞典存在的首要目的就是為了解釋人們?cè)陂喿x理解中存在困難的詞,所以必須考慮詞語(yǔ)的釋義價(jià)值,而《高頻詞表》則不需要考慮這種區(qū)分。這種差別在重疊形式、序數(shù)詞、詞綴構(gòu)成的派生詞等的收錄中均有突出的表現(xiàn)。

      《高頻詞表》收錄了一些重疊形式,如AA式的“層層、村村”,AABB式的“高高興興、陸陸續(xù)續(xù)”,數(shù)量重疊形式“一步步、一點(diǎn)一點(diǎn)”等。對(duì)于重疊形式的收錄,詞典主要看基式與重疊式的意義有無(wú)較大變化和重疊式能否自由推廣。如“高高興興”和“高興”意義差別不大,詞典不會(huì)收錄,但“馬馬虎虎”除了“馬虎”的“不細(xì)心”義,還發(fā)展出“勉強(qiáng);湊合”義,詞典就會(huì)收錄;再如漢語(yǔ)雙音節(jié)動(dòng)詞的重疊形式是ABAB,如“打聽(tīng)打聽(tīng)”“了解了解”,這類(lèi)可以自由推廣的重疊形式詞典不收錄,但“躲躲閃閃”是無(wú)法類(lèi)推的,詞典就會(huì)收錄。

      《高頻詞表》著眼于詞的頻率,有些序數(shù)詞和表示序列的詞因?yàn)槌霈F(xiàn)頻率高而出現(xiàn)在《高頻詞表》中,如“第二、第三、第四、第六、第七、第八、第九、第十;第一季度、第二季度、第三季度、第四季度;第一版;大一、大二、大三;二月、三月、六月、七月、八月、九月”,等等。這些詞規(guī)律性很強(qiáng),不可能也沒(méi)有必要收入詞典。比如《現(xiàn)漢》一般不會(huì)收錄“星期一”至“星期六”,而是在“星期”下有所交代,但“星期日”由于是不能類(lèi)推的,詞典就會(huì)收錄。這是詞典對(duì)規(guī)律性強(qiáng)的詞一種簡(jiǎn)便的處理方式,既可以涵蓋有關(guān)的詞目,又可以以簡(jiǎn)馭繁。

      《高頻詞表》會(huì)收錄一些帶有詞綴、類(lèi)詞綴的詞語(yǔ),比如《高頻詞表》中“性”作為詞綴構(gòu)成的詞有229個(gè),“者”作為詞綴構(gòu)成的詞有113個(gè),“率”作為詞綴構(gòu)成的詞有59個(gè)。但除非意義比較特殊,詞典通常不會(huì)收錄太多這類(lèi)詞,只在該詞綴中舉例說(shuō)明。因?yàn)檫@些詞具有能產(chǎn)性,結(jié)構(gòu)上可以類(lèi)推,語(yǔ)義比較透明,除少數(shù)高頻使用的組合外,詞典多采取在詞綴下處理的辦法,不單獨(dú)出條。

      (三) 語(yǔ)音信息

      《高頻詞表》與詞典的另一個(gè)重要區(qū)別是《高頻詞表》主要關(guān)注詞的書(shū)寫(xiě)形式,而詞典則涉及個(gè)詞的形、音、義等諸多方面。這主要體現(xiàn)在它們對(duì)兒化詞的收錄上,如《高頻詞表》中的“差點(diǎn)、靠譜、較真、支招、貓膩、沒(méi)準(zhǔn)、模特、納悶、年頭、起名、嗓門(mén)、玩意、餡餅、心眼、大腕、叫座、拔尖、小道”等詞在《現(xiàn)漢》中均以?xún)夯男问匠霈F(xiàn),因?yàn)檫@些詞在使用中是必須讀兒化的。兒化形式的有無(wú)也是導(dǎo)致二者收詞差異的原因之一。另外,對(duì)于一些可以讀成兒化也可以不讀成兒化的詞語(yǔ),《現(xiàn)漢》也用括注的形式“(~兒)”來(lái)說(shuō)明,如“開(kāi)竅、吭聲”等,這樣,詞典就采取不同的處理方式對(duì)必須兒化和可以?xún)夯脑~語(yǔ)做出了區(qū)分。

      三、 《高頻詞表》對(duì)辭書(shū)編纂的價(jià)值

      盡管《高頻詞表》與《現(xiàn)漢》所收的詞目在性質(zhì)上存在不同,但是高頻詞語(yǔ)有著非常重要的價(jià)值,“對(duì)反映語(yǔ)言的真正面貌與使用狀況來(lái)說(shuō),詞頻反映的信息比詞種數(shù)更為重要。詞頻顯示出一個(gè)詞的社會(huì)使用密度、人們的熟知程度,是一個(gè)詞穩(wěn)定性的重要標(biāo)志”(蘇新春等 2006)。作為一部以記錄現(xiàn)代漢語(yǔ)普通話(huà)詞語(yǔ)為己任的規(guī)范型詞典,《現(xiàn)漢》在收詞時(shí)自然應(yīng)該首先注意高頻詞語(yǔ)。王敏(2009)已經(jīng)從辭書(shū)編纂的角度分析了媒體字詞頻統(tǒng)計(jì)結(jié)果的應(yīng)用價(jià)值,指出這些統(tǒng)計(jì)結(jié)果“體現(xiàn)了現(xiàn)代漢語(yǔ)的最新發(fā)展情況,其成果值得辭書(shū)編纂界關(guān)注”,我們將具體分析《高頻詞表》對(duì)辭書(shū)編纂,尤其是詞典收詞方面的價(jià)值。

      除去詞表性質(zhì)不同造成的差異,《高頻詞表》未收入《現(xiàn)漢》第7版的4671個(gè)詞非常值得我們?nèi)リP(guān)注,它們是《高頻詞表》對(duì)辭書(shū)編纂特別是詞典收詞的主要價(jià)值所在,主要體現(xiàn)在下面三個(gè)方面。

      (一) 增補(bǔ)詞目

      《高頻詞表》可以為詞典增補(bǔ)詞目提供參考,因?yàn)槭褂妙l率往往是判定一個(gè)新詞是否穩(wěn)定并具有收入詞典資格的重要標(biāo)準(zhǔn)之一?!陡哳l詞表》中有不少詞是可收入詞典的。它們既有對(duì)新事物進(jìn)行說(shuō)明的詞,如“代購(gòu)、試駕、夜店”;也有一些從行業(yè)詞進(jìn)入日常生活中的詞,如“橋段、藍(lán)籌、絕殺”等;還有一些因構(gòu)成語(yǔ)素不自由而合并形成的詞,如“售罄、撰文、殆盡”等。以“售罄”為例,它其實(shí)就是“賣(mài)完”的意思,但“賣(mài)完”的組成成分都是可獨(dú)立使用的,且語(yǔ)義透明,詞典不會(huì)收錄,而“售罄”的組成成分已經(jīng)不能獨(dú)立使用,“罄”也不常用,語(yǔ)義透明度低,所以詞典可以收錄。我們主要分析《高頻詞表》對(duì)詞典增補(bǔ)漏收詞和增收新詞兩方面的價(jià)值,增收的新詞著重分析詞綴派生詞、詞匯化而來(lái)的詞和縮略詞。

      1. 增補(bǔ)漏收詞

      《現(xiàn)漢》作為一部以反映現(xiàn)代漢語(yǔ)詞匯整體面貌為己任的中型語(yǔ)文詞典,在收詞方面取得了公認(rèn)的成績(jī),但詞匯數(shù)量繁多,早期辭書(shū)編纂又主要依靠手工卡片記錄,難免有所遺漏。《高頻詞表》正好可以彌補(bǔ)這一缺陷。比如“收緊”“疊加”“練就”這三個(gè)詞《現(xiàn)漢》并未收錄,但它們?cè)?010年—2017年的《高頻詞表》中均有出現(xiàn),相對(duì)穩(wěn)定,也較為常用。

      表5 詞典可補(bǔ)收的詞

      “收緊”表面上看是一個(gè)普通的動(dòng)補(bǔ)結(jié)構(gòu),如“收緊韁繩”,這種動(dòng)補(bǔ)結(jié)構(gòu)數(shù)量龐大,語(yǔ)義透明度高,詞典是不會(huì)收錄的。但“收緊”還有“嚴(yán)加控制”的意思,如“收緊銀根”,這個(gè)用法在《人民日?qǐng)?bào)》中第一次出現(xiàn)是1957年:

      (1) 但美國(guó)仍堅(jiān)持它自己的主張,只同意稍稍放寬對(duì)中國(guó)的“禁運(yùn)”,……;另外還要收緊對(duì)所謂“例外程序”的運(yùn)用。

      (《英國(guó)放寬對(duì)華“禁運(yùn)”以后》,《人民日?qǐng)?bào)》1957-06-08)

      “疊加”表示兩個(gè)事物在同一位置重疊共存,《人民日?qǐng)?bào)》中第一次出現(xiàn)是1959年:

      (2) 因此在米波波段中我們測(cè)到的太陽(yáng)是扁形的,而且比肉眼看到的要大得多,當(dāng)日面上出現(xiàn)黑子的時(shí)候,太陽(yáng)的輻射上便疊加著黑子的影響,……

      (《射電天文學(xué)——打開(kāi)宇宙秘密的新鑰匙》,《人民日?qǐng)?bào)》1959-08-22)

      “練就”是“練成”的意思,表示“經(jīng)過(guò)練習(xí)訓(xùn)練而取得某一成就”,在《人民日?qǐng)?bào)》中第一次出現(xiàn)是1948年:

      (3) 戰(zhàn)士劉貴、秦海堂拿出練兵中練就了的本領(lǐng),把手榴彈從碉頂上投進(jìn)去,轟然一聲,把敵人的彈藥引炸了,碉堡里哄隆隆的亂成一團(tuán)。

      (《太原南區(qū)敵守碉司令畢樹(shù)武被俘記》,《人民日?qǐng)?bào)》1948-11-21)

      可以看到,這些詞出現(xiàn)時(shí)間都比較早,現(xiàn)在較為常用,可以考慮收入詞典。

      2. 增收詞綴派生詞

      通過(guò)添加(類(lèi))詞綴構(gòu)成新詞是一種很能產(chǎn)的構(gòu)詞方式,比如“式”在《高頻詞表》中有“中式、西式、歐式、日式、美式、意式、英式、法式”等25個(gè)詞,詞典一般不會(huì)將這些詞一一收錄并解釋?zhuān)窃凇笆健毕绿幚?,?

      式shì① 樣式: 新~|舊~|西~|男~|女~。

      (《現(xiàn)漢》第7版)

      但當(dāng)組合后意義發(fā)生變化時(shí),就應(yīng)該收入詞典?!冬F(xiàn)漢》在每一次的修訂中都注意增加這樣的詞語(yǔ)。如《現(xiàn)漢》第5版就新增了“地毯式”“一站式”;《現(xiàn)漢》第6版新增了“捆綁式”“拉網(wǎng)式”“螺旋式”“填鴨式”“投幣式”;《現(xiàn)漢》第7版新增了“斷崖式”。根據(jù)這樣的原則,我們發(fā)現(xiàn)《高頻詞表》中還有一些“X式”可以收錄。比如:“復(fù)式”,它是一種新的建筑形式,它的層高比普通的房屋高,多在內(nèi)部分上下兩層。

      “式”不僅僅是一個(gè)單純的詞綴,它常常也是一個(gè)比喻用法的標(biāo)記,它的出現(xiàn)使得與它共現(xiàn)的詞語(yǔ)發(fā)展出一種比喻意義,比如“病毒式”突出的是“像病毒一樣快速傳播和擴(kuò)散”,最常見(jiàn)的組合是“病毒式傳播”。“自殺式”也表示“像自殺一樣的”,最常見(jiàn)的搭配是“自殺式襲擊”,這是一種與敵人同歸于盡的襲擊方式,在傷害敵人的同時(shí)也傷害自己。還有一種“自殺式營(yíng)銷(xiāo)”,這是指商家用賠本等方式來(lái)吸引消費(fèi)者的一種營(yíng)銷(xiāo)手段?!白詺⑹揭u擊”和“自殺式營(yíng)銷(xiāo)”所凸顯的都是“自殺”對(duì)自己造成傷害這一特點(diǎn)。近年來(lái)常見(jiàn)的“塌方式、跳水式、爆發(fā)式、井噴式”等也都是通過(guò)比喻構(gòu)成的詞,可以適當(dāng)考慮收入詞典。

      3. 增收詞匯化而來(lái)的詞

      高頻使用是詞匯化發(fā)生的重要條件之一。董秀芳(2011)指出,“心理的組塊過(guò)程中把經(jīng)常相連出現(xiàn)的兩個(gè)分立單位組織在一個(gè)組塊中,這樣二者就有可能逐漸變?yōu)橐粋€(gè)不可再分的單位?!焙钊鸱?2015a,2015b,2017)分析了詞匯化而來(lái)的詞在詞典中的處理方式,指出一個(gè)詞匯化而來(lái)的語(yǔ)言單位要收入詞典,最重要的一點(diǎn)就是看其組合義是不是已經(jīng)不同于成分義的加合,但也要考慮語(yǔ)言結(jié)構(gòu)組成成分能夠單用及整個(gè)語(yǔ)言結(jié)構(gòu)的使用頻率等多種因素。江藍(lán)生(2013)介紹了《現(xiàn)漢》第6版收錄的一些詞匯化而來(lái)的詞,比如“對(duì)了、好了、算了、完了”等與體標(biāo)記“著”連用而詞匯化的詞;“本著”和“隨著”等與體標(biāo)記“著”連用而詞匯化的詞;對(duì)“—于、—乎、—及、—以、—自”等跨層結(jié)構(gòu)合成詞做了增補(bǔ)?!陡哳l詞表》中一些詞匯化的高頻組合也可以考慮收入詞典,如:

      表6 詞典可收錄的詞匯化而來(lái)的詞

      “亟待”是急迫等待的意思,其中“亟”是“急迫”的意思,已經(jīng)不能單用;“與否”是“是(這樣)或者不是(這樣)”的意思,用來(lái)表示正反兩方面的意思;“愈發(fā)”是“更加”的意思,表示程度更近一步;“盡可能”其實(shí)就是“盡量”的意思。這些詞的構(gòu)詞成分已經(jīng)不能單用,在長(zhǎng)期的高頻共現(xiàn)中詞匯化成詞,可以考慮收入詞典。

      4. 增收縮略詞

      縮略也是構(gòu)成新詞的重要方式之一,它是從較長(zhǎng)結(jié)構(gòu)中抽取典型的語(yǔ)素構(gòu)成新詞的一種方法,縮略詞簡(jiǎn)潔明快,更容易通行,但是從字面上看,縮略詞的意義往往不很明確,因此,一些高頻的縮略詞可以考慮收入詞典。如:

      表7 詞典可收錄的縮略而來(lái)的詞

      “防控”是“預(yù)防控制”的縮略,“福彩”是“福利彩票”的縮略,“非遺”是“非物質(zhì)文化遺產(chǎn)”的縮略,它們的使用頻率都很高,可收入詞典。值得注意的是,“福利彩票”和“非物質(zhì)文化遺產(chǎn)”都被《現(xiàn)漢》第7版收錄,它們都是多字詞,在使用中逐漸縮略為二字詞。與全稱(chēng)相比,縮略的二字詞更為常用,因此,詞典應(yīng)在收錄全稱(chēng)的同時(shí)也收錄簡(jiǎn)稱(chēng)。

      (二) 同物異名形式的取舍

      當(dāng)一種事物具有幾種不同的語(yǔ)言形式時(shí),《高頻詞表》可以幫助我們對(duì)這些同物異名形式進(jìn)行取舍。

      比如《現(xiàn)漢》同時(shí)收錄了“冰激凌”和“冰淇淋”,“冰激凌”是主條,“冰淇淋”是副條,用“冰激凌”直注?!陡哳l詞表》也同時(shí)收錄了“冰激凌”和“冰淇淋”,但是“冰淇淋”的頻次明顯高于“冰激凌”。因此,或許我們可以把后者當(dāng)作主條,前者作為副條。

      表8 “冰淇淋”與“冰激凌”的頻次

      再比如意大利的食品Pizza傳到中國(guó)后有幾種不同的翻譯:“匹薩(餅)”“比薩(餅)”“披薩(餅)”和“批薩(餅)”。《現(xiàn)漢》第6版收錄了“比薩餅”,第7版同時(shí)收錄了“比薩”和“比薩餅”,并以“比薩”為主條,但我們發(fā)現(xiàn)《高頻詞表》中并未收錄“比薩(餅)”,而只收錄了“披薩”,那么,我們究竟用哪一種形式合適呢?

      圖1 “比薩”“披薩”和“匹薩”使用頻次的歷時(shí)變化

      《人民日?qǐng)?bào)》中沒(méi)有出現(xiàn)過(guò)“批薩”一詞,其他三個(gè)詞都有使用?!氨人_”首次出現(xiàn)是在1990年,那一年第一家“必勝客”在北京開(kāi)業(yè)。1993年,“匹薩”一詞首次出現(xiàn),這一年,“匹薩”被頻繁使用,但之后就用得很少,從2015年開(kāi)始,“匹薩”沒(méi)在《人民日?qǐng)?bào)》中出現(xiàn)過(guò)。2013年,“披薩”第一次在《人民日?qǐng)?bào)》中出現(xiàn),使用頻次逐漸增多。

      我們可以看到,“比薩”在過(guò)去的二三十年中的使用是比較頻繁的,有著絕對(duì)的優(yōu)勢(shì),但是從近幾年和今后的發(fā)展來(lái)看,或許“披薩”的使用頻率會(huì)呈現(xiàn)一個(gè)逐漸上升的趨勢(shì),有可能超過(guò)“比薩”。一個(gè)原因可能是“披薩”在聲音上與pizza更接近,也就是說(shuō),在漢語(yǔ)口語(yǔ)中pizza讀音類(lèi)似“pīsà”,音譯詞與實(shí)際讀音相一致。除此之外,還有一個(gè)重要的原因是“比薩”這個(gè)中文譯名早已有其他意義。意大利城市“Pisa”的中文譯名是比薩市,那里還有著名的比薩斜塔,在pizza傳到中國(guó)之前,《人民日?qǐng)?bào)》中的“比薩”幾乎都是指“比薩市”或“比薩斜塔”,所以表示pizza的“比薩”基本一直都是以“比薩餅”的形式出現(xiàn)的,否則就容易與表示Pisa的“比薩”弄混。而且,“比薩餅”和“比薩市”本來(lái)是完全沒(méi)有關(guān)系的,使用同一個(gè)譯名很容易讓人們把它們錯(cuò)誤地聯(lián)系在一起。或許正是這個(gè)原因,人們一直試圖尋找更合適的譯名,而“披薩”可能就是個(gè)不錯(cuò)的選擇。因?yàn)槲覀儗?duì)pizza的熟悉已經(jīng)由“比薩餅”完成了,“披薩”在出現(xiàn)之初就是以不帶類(lèi)名的形式出現(xiàn)的,這也更符合漢語(yǔ)的雙音節(jié)傾向,使得它比“比薩餅”更容易傳播。

      (三) 糾正收詞的失誤

      詞典收詞是一個(gè)龐大復(fù)雜的工程,加上詞語(yǔ)一直處在不停地變化中,再好的詞典都難免存在個(gè)別詞語(yǔ)失收或收詞不當(dāng)?shù)那闆r。通過(guò)《高頻詞表》與《現(xiàn)漢》收詞的對(duì)比,我們可以發(fā)現(xiàn)一些詞典收詞上的失誤,進(jìn)而做出修訂。前面已經(jīng)提到,詞典傾向于收錄具有較強(qiáng)組合能力的較小詞匯單位,《現(xiàn)漢》也一直努力貫徹這一原則,比如《現(xiàn)漢》第6版收“代言人”,第7版改收“代言”,這是因?yàn)樵戎挥小按匀恕?,“代言”是不能單?dú)使用的,隨著“代言人”的高頻使用,“代言”獨(dú)立出來(lái),《現(xiàn)漢》第7版對(duì)這一變化做了及時(shí)調(diào)整。改收“代言”既涵蓋了“代言人”,又反映了語(yǔ)言的發(fā)展實(shí)際。但這一原則在《現(xiàn)漢》中也有執(zhí)行不到位的地方,如:

      表9 《高頻詞表》和《現(xiàn)漢》第7版的收詞對(duì)比(1)

      這幾組詞在《高頻詞表》中出現(xiàn)的是較短形式,而在《現(xiàn)漢》第7版中出現(xiàn)的是較長(zhǎng)形式,這與詞典收詞的原則相違背,應(yīng)該適時(shí)調(diào)整。但之所以出現(xiàn)這種情況,是因?yàn)檫@些二字詞原先是不能單用的,是在多字詞的高頻使用中逐漸獨(dú)立出來(lái)的。詞典對(duì)語(yǔ)言事實(shí)的反應(yīng)總是相對(duì)滯后的,但隨著編纂手段的改進(jìn),這一問(wèn)題會(huì)有所改善。

      漢語(yǔ)中有一些外來(lái)詞在開(kāi)始使用時(shí)往往在譯名后加類(lèi)名構(gòu)成三字詞,在使用過(guò)程中,這些帶有類(lèi)名的三字外來(lái)詞具有逐漸脫落類(lèi)名成為二字詞的趨勢(shì),不論是從收錄小單位的角度考慮還是從使用頻率的角度考慮,詞典都應(yīng)該首先收錄二字詞,或者同時(shí)收錄但把二字詞作為主條。《現(xiàn)漢》有些詞的處理比較好,比如“桑拿”和“桑拿浴”都收錄,但是以“桑拿”為主條;“摩托”和“摩托車(chē)”都收錄,但是以“摩托”為主條;“比薩”和“比薩餅”都收錄,但是以“比薩”為主條。但是也有一些詞條的處理不太合適。

      表10 《高頻詞表》和《現(xiàn)漢》第7版的收詞對(duì)比(2)

      這些詞中類(lèi)名的脫落是緩慢的,有些變化不容易發(fā)現(xiàn),《高頻詞表》正好給我們提供了參考,可以幫助我們做出取舍。當(dāng)然“香檳酒、搖滾樂(lè)、芭蕾舞”是最早出現(xiàn)的正規(guī)說(shuō)法,而“香檳、搖滾、芭蕾”是因類(lèi)名脫落后起的說(shuō)法,為了體現(xiàn)這一演變過(guò)程,也可以處理為將前者作為正條,將后者作為副條,或掛尾處理,總之要對(duì)頻率較高的二字詞有所交代。

      四、 結(jié)語(yǔ)

      詞頻反映著語(yǔ)言的面貌與使用狀況,是詞匯的重要屬性之一。它對(duì)社會(huì)的發(fā)展變化有直接反應(yīng),受多種因素影響而不斷變化。詞頻的動(dòng)態(tài)變化不僅反映著詞匯的發(fā)展變化,也能幫我們預(yù)測(cè)詞的發(fā)展方向。

      高頻使用是常用詞的本質(zhì)屬性,也是一個(gè)詞語(yǔ)從出現(xiàn)到逐漸穩(wěn)定下來(lái)需要具備的重要條件。高頻使用能夠促進(jìn)人們加深對(duì)一個(gè)詞語(yǔ)的熟知程度,為詞語(yǔ)的穩(wěn)定性提供重要保證。一個(gè)新詞從出現(xiàn)到成為詞匯系統(tǒng)中穩(wěn)定的一員,需要經(jīng)過(guò)高頻詞的階段。

      高頻詞是不斷變化的,每年都有一些高頻詞進(jìn)入,也有一些高頻詞退出。所以,高頻詞既包括不同時(shí)期都廣泛使用的比較穩(wěn)定的詞,也包括某個(gè)時(shí)代特定的流行語(yǔ),而那些相對(duì)穩(wěn)定的高頻詞才是共時(shí)詞典應(yīng)該收錄的主要對(duì)象。2010年—2017年《高頻詞表》的合收詞為我們提供了近幾年比較穩(wěn)定的高頻詞語(yǔ)的集合,反映了近年來(lái)漢語(yǔ)詞匯的基本面貌和發(fā)展趨勢(shì),對(duì)詞典收詞有重要的參考價(jià)值。

      借助大規(guī)模語(yǔ)料庫(kù)和頻率統(tǒng)計(jì)來(lái)對(duì)詞語(yǔ)進(jìn)行篩選是辭書(shū)編纂的一個(gè)趨勢(shì)和方向,《中國(guó)語(yǔ)言生活狀況報(bào)告》在這方面提供了很好的資源,為我們了解媒體語(yǔ)料的用字用語(yǔ)情況提供了重要參考,也對(duì)高頻詞語(yǔ)和新詞語(yǔ)的發(fā)展變化提供了有力證據(jù),對(duì)辭書(shū)增補(bǔ)新詞、確定同物異名形式的主副條及糾正收詞的失誤都很有幫助,希望能引起辭書(shū)編纂者的關(guān)注,使這一資源得到充分利用。

      附 注

      [1] 這里的百萬(wàn)詞頻次=詞語(yǔ)的頻次×1000000/總頻次。因?yàn)槊磕甑拿襟w語(yǔ)料數(shù)量不一樣,當(dāng)語(yǔ)料規(guī)模大的時(shí)候詞語(yǔ)的頻次自然多,為了讓歷年的詞語(yǔ)頻次具有可比性,我們采用了百萬(wàn)詞頻次來(lái)進(jìn)行對(duì)比。下同。

      [2] 這里的排名是指在2010年—2017年22203個(gè)《高頻詞語(yǔ)》共收詞中的百萬(wàn)頻次排行。下同。

      猜你喜歡
      高頻詞比薩辭書(shū)
      比薩
      CISHU YANJIU LEXICOGRAPHICAL STUDIES
      30份政府工作報(bào)告中的高頻詞
      小康(2022年7期)2022-03-10 11:15:54
      省級(jí)兩會(huì)上的高頻詞
      小康(2022年7期)2022-03-10 11:15:54
      大型辭書(shū)疑難字考釋七則
      28份政府工作報(bào)告中的高頻詞
      小康(2021年7期)2021-03-15 05:29:03
      省級(jí)兩會(huì)上的高頻詞
      小康(2021年7期)2021-03-15 05:29:03
      請(qǐng)你吃比薩
      比薩,比薩
      好吃的比薩
      啟蒙(3-7歲)(2016年4期)2016-02-28 12:26:43
      桂东县| 龙胜| 蛟河市| 嘉鱼县| 辰溪县| 明光市| 旺苍县| 开封县| 武邑县| 乐清市| 潢川县| 克拉玛依市| 榆树市| 临夏市| 芒康县| 潼南县| 秭归县| 九龙坡区| 象州县| 安塞县| 开江县| 白玉县| 沈丘县| 宜都市| 澎湖县| 大新县| 宜章县| 方正县| 青河县| 河池市| 商丘市| 绩溪县| 加查县| 辽阳县| 桑日县| 娱乐| 桑植县| 师宗县| 同江市| 东兰县| 普格县|