馮志偉
(教育部語言文字應(yīng)用研究所,北京 100010)
術(shù)語形成的經(jīng)濟(jì)律
——FEL公式
馮志偉
(教育部語言文字應(yīng)用研究所,北京 100010)
分析了單詞型術(shù)語和詞組型術(shù)語在術(shù)語數(shù)據(jù)庫 GLOT-C中的分布,試圖從理論上解釋在術(shù)語系統(tǒng)中詞組型術(shù)語占大多數(shù)的這一重要術(shù)語現(xiàn)象,在此基礎(chǔ)上提出了“術(shù)語形成的經(jīng)濟(jì)律”,并且用 FEL公式來描述這個定律。
單詞型術(shù)語,詞組型術(shù)語,術(shù)語形成經(jīng)濟(jì)律,FEL公式
現(xiàn)代科學(xué)技術(shù)日新月異地發(fā)展,新的科學(xué)概念層出不窮,人們不可能給每一個新出現(xiàn)的概念都用一個新的單詞來命名。在大多數(shù)情況下,會采用由原有的單詞組合起來構(gòu)成詞組的方法來表示新的概念,這樣,就會形成許多以詞組為形式的術(shù)語,它們叫做詞組型術(shù)語 (phrase-term)。從目前發(fā)展的趨勢來看,詞組型術(shù)語越來越多,在整個術(shù)語系統(tǒng)中占了很大的一部分,這幾乎成了現(xiàn)代術(shù)語發(fā)展的一個規(guī)律。當(dāng)然,單詞型術(shù)語 (word-ter m)仍然是術(shù)語系統(tǒng)中的重要組成部分。
如果從語言學(xué)的觀點(diǎn)來看術(shù)語系統(tǒng),那么可以看出,單詞只不過是術(shù)語的構(gòu)成材料 (它既是詞組型術(shù)語的構(gòu)成材料,也是單詞型術(shù)語的構(gòu)成材料),而術(shù)語(包括詞組型術(shù)語和單詞型術(shù)語)則是由這些構(gòu)成材料形成的產(chǎn)品。因此,可以說,一切術(shù)語都是由單詞構(gòu)成的。在我們設(shè)計的數(shù)據(jù)處理中文術(shù)語數(shù)據(jù)庫 GLOT-C術(shù)語數(shù)據(jù)庫中的 1510條單詞型術(shù)語和詞組型術(shù)語,都是由 858個不同的單詞構(gòu)成的。這 858個單詞,與 1510條術(shù)語的數(shù)量比較起來,只是一個較小的數(shù)目。這種由少量的單詞構(gòu)成大量術(shù)語的語言現(xiàn)象,反映了語言使用中的經(jīng)濟(jì)原則,我們把它叫做“術(shù)語形成的經(jīng)濟(jì)律”(economic law of ter m for mation)。
早在 19世紀(jì)初,德國杰出的語言學(xué)家和人文學(xué)者洪堡特(Von Humboldt,1767—1835)就觀察到“語言是有限手段的無限運(yùn)用”。但是,由于當(dāng)時尚未找到能夠證實(shí)這種論斷的技術(shù)工具和方法,這種論斷只是停留在科學(xué)假設(shè)階段。
究竟如何來理解“語言是有限手段的無限運(yùn)用”這個科學(xué)假設(shè)呢?
美國語言學(xué)家喬姆斯基(1928—)認(rèn)為:
“一個人的語言知識是以某種方式體現(xiàn)在人腦這個有限的機(jī)體之中的,因此語言知識就是一個由某種規(guī)則和原則構(gòu)成的有限系統(tǒng)。但是一個會說話的人卻能講出并理解他從未聽到過的句子以及和我們聽到的不十分相似的句子。而且,這種能力是無限的。如果不受時間和注意力的限制,那么由一個人所獲得的知識系統(tǒng)規(guī)定了特定形式、結(jié)構(gòu)和意義的句子的數(shù)目也將是無限的。不難看到這種能力在正常的人類生活中得到自由的運(yùn)用。我們在日常生活中所使用和理解的句子范圍是極大的,無論就其實(shí)際情況而言還是為了理論描寫上的需要,我們完全有理由認(rèn)為人們使用和理解的句子范圍都是無限的?!盵1]
喬姆斯基以“句子”的使用和理解為例進(jìn)一步說明了“語言是有限手段的無限運(yùn)用”這一科學(xué)假設(shè)。
如果我們把喬姆斯基這段話中的“句子”改為“術(shù)語”,可以類推地得到如下的假設(shè):
“一個人的語言知識是以某種方式體現(xiàn)在人腦這個有限的機(jī)體之中的,因此語言知識就是一個由某種規(guī)則和原則構(gòu)成的有限系統(tǒng)。但是一個會說話的人卻能講出并理解他從未聽到過的術(shù)語以及和我們聽到的不十分相似的術(shù)語。而且,這種能力是無限的。如果不受時間和注意力的限制,那么由一個人所獲得的知識系統(tǒng)規(guī)定了特定形式、結(jié)構(gòu)和意義的術(shù)語的數(shù)目也將是無限的。不難看到這種能力在正常的人類生活中得到自由的運(yùn)用。我們在日常生活中所使用和理解的術(shù)語范圍是極大的,無論就其實(shí)際情況而言還是為了理論描寫上的需要,我們完全有理由認(rèn)為人們使用和理解的術(shù)語范圍都是無限的?!?/p>
通過這樣的類推可以看出,“語言是有限手段的無限運(yùn)用”這個科學(xué)假設(shè)也可以應(yīng)用到術(shù)語學(xué)中,我們不妨把這個科學(xué)假設(shè)稱為“術(shù)語生成性假設(shè)”(hypothesis on ter m generation)。
根據(jù)“術(shù)語生成性假設(shè)”,可以得到如下三個命題:
命題 1:任何一個會說話的人在他的知識范圍內(nèi)都有能力猜測或理解他從未聽到的術(shù)語,從而認(rèn)識有關(guān)的科學(xué)概念;
命題 2:任何一個會說話的人在他的知識范圍內(nèi)都有能力創(chuàng)造或說出他從未聽到的術(shù)語,從而表達(dá)有關(guān)的科學(xué)概念;
命題 3:任何一個會說話的人在他的知識范圍內(nèi)都有能力在少量的單詞型術(shù)語的基礎(chǔ)上創(chuàng)造出大量的詞組型術(shù)語,從而使得在一個術(shù)語系統(tǒng)中,詞組型術(shù)語的數(shù)量大大地超過單詞型術(shù)語的數(shù)量。
命題 1和命題 2是顯而易見的,它們可以由“術(shù)語生成性假設(shè)”直接推導(dǎo)出來,而命題3則不十分明顯,需要通過科學(xué)實(shí)驗和數(shù)學(xué)計算來加以檢驗。
命題 3在術(shù)語學(xué)中究竟是否存在呢?這是本文需要通過科學(xué)實(shí)驗和數(shù)學(xué)計算來檢驗的內(nèi)容。
今天,有了電子計算機(jī)這個有力的技術(shù)工具,通過科學(xué)實(shí)驗和數(shù)學(xué)計算來檢驗命題 3這個大膽的科學(xué)假設(shè)的時機(jī)已經(jīng)成熟。
實(shí)驗數(shù)據(jù)充分說明,本文提出的“術(shù)語形成的經(jīng)濟(jì)律”驗證了命題 3。因此,“術(shù)語形成的經(jīng)濟(jì)律”正是洪堡特的“語言是有限手段的無限運(yùn)用”這一假設(shè)的一個科學(xué)實(shí)例。術(shù)語系統(tǒng)中單詞型術(shù)語的數(shù)目是有限的,而由單詞型術(shù)語構(gòu)成的詞組型術(shù)語的數(shù)目卻是無限的。由少量的、有限的單詞構(gòu)成大量的、無限的術(shù)語,這正是“有限手段的無限運(yùn)用”這一假設(shè)在術(shù)語學(xué)中的具體表現(xiàn)??梢?“術(shù)語形成的經(jīng)濟(jì)律”是一個有著深刻的語言學(xué)和哲學(xué)背景的普遍性規(guī)律。
在本文中,我們將討論術(shù)語形成的經(jīng)濟(jì)律的三個基本概念:術(shù)語系統(tǒng)的經(jīng)濟(jì)指數(shù)、單詞的術(shù)語構(gòu)成頻率和術(shù)語的平均長度,并且提出“FEL公式”來描述這三個基本概念之間的關(guān)系。
為了說明什么是術(shù)語系統(tǒng)的經(jīng)濟(jì)指數(shù)以及術(shù)語系統(tǒng)的經(jīng)濟(jì)規(guī)律,需要先定義如下的初始概念。
1.系統(tǒng)的術(shù)語數(shù):在一個術(shù)語系統(tǒng)中,不同的術(shù)語的總數(shù),也就是術(shù)語系統(tǒng)的容量。系統(tǒng)的術(shù)語數(shù)用 T表示,它的單位是“條”。
2.單詞的絕對頻率:在術(shù)語系統(tǒng)中,某一個詞的出現(xiàn)次數(shù)(或使用次數(shù))。詞的絕對頻率用α表示,它的單位是“次”。
3.不同單詞數(shù):具有同一頻率的不同單詞的數(shù)目。不同單詞數(shù)用ν表示,它的單位是“詞”。
4.不同單詞的總數(shù):在術(shù)語系統(tǒng)中,具有不同絕對頻率的不同單詞的總數(shù)。不同單詞總數(shù)用W表示,它的單位是“詞”。不同單詞總數(shù)的計算公式是:
5.運(yùn)行單詞數(shù):具有同一絕對頻度的不同單詞ν和它的絕對頻度α的乘積。運(yùn)行單詞數(shù)用ρ表示,它的單位是“詞次”。運(yùn)行單詞數(shù)的計算公式是:
6.運(yùn)行單詞總數(shù):具有不同絕對頻率的運(yùn)行單詞的總數(shù)。運(yùn)行單詞總數(shù)用 R表示,它的單位是“詞次”。運(yùn)行單詞總數(shù)的計算公式是:
術(shù)語系統(tǒng)的經(jīng)濟(jì)指數(shù)就是系統(tǒng)的術(shù)語數(shù) T被不同單詞總數(shù)W來除所得的商。術(shù)語系統(tǒng)的經(jīng)濟(jì)指數(shù)用 E來表示。這樣,我們有如下公式:
E的單位是“條/詞”,讀為“每詞多少條”。
在大多數(shù)術(shù)語系統(tǒng)中,E>1;如果 E≤1,則說明術(shù)語系統(tǒng)設(shè)計的經(jīng)濟(jì)效應(yīng)不高。例如,在術(shù)語系統(tǒng) GLOT-C中,T=1510,W=858,則該系統(tǒng)的經(jīng)濟(jì)指數(shù) E為:
這說明,當(dāng)術(shù)語系統(tǒng)有 1510條術(shù)語時,每個單詞平均可構(gòu)成 1.76條術(shù)語??梢?這個術(shù)語系統(tǒng)具有較高的經(jīng)濟(jì)效應(yīng),也就是說,在該系統(tǒng)中,每個單詞構(gòu)成的術(shù)語條數(shù)較多。
術(shù)語系統(tǒng)的經(jīng)濟(jì)指數(shù)的高低,受到系統(tǒng)中術(shù)語數(shù)的強(qiáng)烈影響。隨著系統(tǒng)的術(shù)語數(shù)的增加,術(shù)語系統(tǒng)的經(jīng)濟(jì)指數(shù)也逐漸升高,在我們設(shè)計的數(shù)據(jù)處理中文術(shù)語數(shù)據(jù)庫 GLOT-C中,當(dāng)系統(tǒng)的術(shù)語數(shù)為500條,不同單詞數(shù)為 342個詞時,其經(jīng)濟(jì)指數(shù)為1.46;當(dāng)系統(tǒng)的術(shù)語數(shù)增加到 1000條,不同單詞數(shù)增加到 588個詞時,其經(jīng)濟(jì)指數(shù)也增加到 1.70;當(dāng)系統(tǒng)的術(shù)語數(shù)進(jìn)一步增加到 1510條,不同單詞數(shù)進(jìn)一步增加到 858個詞時,其經(jīng)濟(jì)指數(shù)也進(jìn)一步增加到 1.76。如下表所示:
T W E 500 342 1.46 1000 588 1.70 1510 858 1.76
這種情況,可圖示如下:
在一定的學(xué)科領(lǐng)域內(nèi),如果具有大量術(shù)語條目的術(shù)語系統(tǒng)具有較高的經(jīng)濟(jì)指數(shù),那么,這個系統(tǒng)必定具有大量的由少數(shù)基本單詞構(gòu)成的詞組型術(shù)語,而這些詞組型術(shù)語構(gòu)成了該術(shù)語系統(tǒng)的主要部分。
在術(shù)語系統(tǒng)中,每個單詞的絕對頻率并不是一樣的。有的單詞經(jīng)常使用,叫做高頻詞,有的單詞不常使用,叫做低頻詞。隨著術(shù)語條目的增加,高頻詞的數(shù)目一般來說也相應(yīng)地增加,而新詞出現(xiàn)的可能性越來越小。這時,盡管術(shù)語的條數(shù)還繼續(xù)增加,不同單詞總數(shù)增加的速率卻越來越小,而高頻詞則反復(fù)地出現(xiàn)。在術(shù)語數(shù) T與不同單詞總數(shù)W之間,存在著如下的函數(shù)關(guān)系:
這種函數(shù)關(guān)系可粗略地用下圖表示:
術(shù)語系統(tǒng)的高頻詞越多,則由這些高頻詞構(gòu)成的術(shù)語也越多。單詞構(gòu)成術(shù)語的這種能力,叫做單詞的術(shù)語構(gòu)成頻率。
單詞的術(shù)語構(gòu)成頻率就是在一個術(shù)語系統(tǒng)中運(yùn)行單詞的總數(shù) R被不同單詞數(shù)W來除所得商。單詞的術(shù)語構(gòu)成頻度用 F表示。這樣,我們有下面的公式:
F的單位是“次”。事實(shí)上,因為 R的單位是“詞次”,W的單位是“詞”,所以 F的單位就是“詞次/詞”,它恰恰等于“次”。
F的值不能小于 1,即 F≥1。對于同一個術(shù)語系統(tǒng)來說,單詞的術(shù)語構(gòu)成頻率 F不能小于術(shù)語系統(tǒng)的經(jīng)濟(jì)指數(shù) E,即 E≤F,因為我們總是有T≤R。
在 GLOT-C中,1510條術(shù)語的運(yùn)行單詞總數(shù)為 3216個,而構(gòu)成這 1510條術(shù)語的不同單詞總數(shù)為 858個,即 R=3216,W=858。這樣,我們有:
F=R/W=3216/858=3.75
這說明,當(dāng) GLOT-C系統(tǒng)的術(shù)語數(shù)為 1510條時,其單詞的術(shù)語構(gòu)成頻率為 3.75,也就是說,平均每個單詞可以出現(xiàn) 375次。因此,這個值也可以代表這些單詞構(gòu)成術(shù)語的平均頻率。
單詞的術(shù)語構(gòu)成頻率也受到術(shù)語系統(tǒng)中術(shù)語數(shù)的影響。在 GLOT-C術(shù)語數(shù)據(jù)庫中,當(dāng)術(shù)語數(shù)為 500條時(T=500),單詞的頻率表如下:
αυρ αυρ αυρ 1 181 181 8 4 32 16 1 16 2 66 132 9 3 27 19 1 19 3 32 96 10 6 60 20 1 20 4 19 76 11 1 11 26 1 26 5 8 40 12 1 12 27 1 27 6 4 24 13 4 52 37 1 37 7 5 35 15 1 15 49 1 49
此時,W=∑ν=342。并且,R=∑ρ=987。因此,F=R/W=987/342=2.89。
當(dāng)系統(tǒng)中的術(shù)語數(shù)為 1000條(T=1000)時,單詞的頻率表如下:
αυρ αυρ αυρ 1 295 295 12 6 72 25 1 25 2 103 206 13 2 26 26 1 26 3 54 162 14 2 28 29 1 29 4 36 144 15 2 30 33 1 33 5 19 95 17 2 34 37 1 37 6 16 96 19 1 19 48 1 48 7 12 84 20 1 20 51 1 51 8 10 80 21 1 21 52 1 52 9 6 54 22 1 22 64 1 64 10 6 60 23 1 23 11 2 22 24 1 24
此時,W=∑ν=588。并且,R=∑ρ=2072。因此,F=R/W=2072/588=3.52
當(dāng)系統(tǒng)的術(shù)語數(shù)為 1510條(T=1510)時,單詞的頻率表如下:
αυρ αυρ αυρ 1 411 411 13 5 65 26 2 52 2 150 300 14 3 42 27 2 54 3 73 319 15 2 30 33 2 66 4 52 208 16 3 48 34 1 34 5 44 220 18 1 18 35 1 35 6 24 144 19 3 57 44 1 44 7 14 98 20 1 20 47 1 47 8 14 112 21 2 42 55 1 55 9 13 117 22 1 22 56 1 56 10 6 50 23 2 46 63 1 63 11 8 88 24 3 72 68 1 68 12 7 84 25 2 50 79 1 79
此時,W=∑ν=858。并且,R=∑ρ=3216。因此,F=R/W=3216/858=3.75。
我們可得到如下的表:
TWRF 500 342 987 2.89 1000 588 2072 3.52 1510 858 3216 3.75
從表中可以看出,隨著系統(tǒng)中術(shù)語數(shù)的增加,單詞的術(shù)語構(gòu)成頻率也相應(yīng)地增加。圖示如下:
在上圖中,虛線表示系統(tǒng)的經(jīng)濟(jì)指數(shù) E的變化情況,實(shí)線表示單詞的術(shù)語構(gòu)成頻率 F的變化情況。如果術(shù)語數(shù) T相同,單詞的術(shù)語構(gòu)成頻率 F的值不小于系統(tǒng)的經(jīng)濟(jì)指數(shù) E的值,即 F≥E。僅當(dāng)術(shù)語數(shù) T=1,系統(tǒng)中只有一個單詞時,F等于 E,在其他場合,F永遠(yuǎn)大于 E。
從上面三個頻率表中還可看出,隨著單詞絕對頻率α的增加,具有同一絕對頻率的不同的單詞的數(shù)目ν相應(yīng)地減小,這種關(guān)系可用下圖來描述:
這說明,在一個術(shù)語系統(tǒng)中,高頻詞只占了不同單詞總數(shù)的一小部分,而它們卻能構(gòu)成大量的術(shù)語。例如,在數(shù)據(jù)處理中文術(shù)語數(shù)據(jù)庫 GLOT -C中,當(dāng)術(shù)語數(shù) T為 1510條時,絕對頻率大于10的高頻詞只有 62個,而它們的出現(xiàn)次數(shù)卻是1342詞次。由這些高頻詞構(gòu)成的運(yùn)行詞總數(shù)占了全部的運(yùn)行詞總數(shù)的 41.4%。術(shù)語系統(tǒng)中的高頻詞越多,則該系統(tǒng)中單詞的術(shù)語構(gòu)成頻率也就越高。
包含在術(shù)語中的單詞數(shù),叫做術(shù)語的長度。在一個術(shù)語系統(tǒng)中,術(shù)語的最小長度為 1。單詞型術(shù)語的長度永遠(yuǎn)等于 1,每個單詞型術(shù)語只能包含一個單詞。例如,“程序”這個單詞型術(shù)語的長度為1。詞組型術(shù)語的長度永遠(yuǎn)大于 1。例如,“程序/設(shè)計”這個詞組型術(shù)語的長度為 2,“數(shù)字/字符/子集”這個詞組型術(shù)語的長度為 3,“條件/控制/轉(zhuǎn)移/指令”這個詞組型術(shù)語的長度為 4,“平均/無/故障/工作/時間”這個詞組型術(shù)語的長度為 5,等等。從術(shù)語經(jīng)濟(jì)原則的觀點(diǎn)看來,術(shù)語的長度太長,不便于使用和記憶,因而,我們有必要研究術(shù)語的長度問題。
從術(shù)語系統(tǒng)的整體來看,還應(yīng)該研究術(shù)語的平均長度。在一個術(shù)語系統(tǒng)中,術(shù)語的平均長度就是運(yùn)行單詞總數(shù) R被術(shù)語數(shù) T來除所得的商。術(shù)語的平均長度用L表示。計算公式為:
L的單位是“詞次/條”,讀為“每條多少詞次”。
L的值永遠(yuǎn)不小于 1,即L≥1。在每一個術(shù)語都只由一個單詞構(gòu)成的術(shù)語系統(tǒng)中,L=1,在其他場合,L>1。
在數(shù)據(jù)處理中文術(shù)語數(shù)據(jù)庫 GLOT-C中,R= 3216,T=1510,所以,該系統(tǒng)的術(shù)語平均長度為:
這意味著,在 GLOT-C中,當(dāng)術(shù)語數(shù)等于1510條時,平均每條術(shù)語由 2.130個單詞構(gòu)成,即每條術(shù)語中含有 2.130詞次。
隨著術(shù)語系統(tǒng)中術(shù)語數(shù)的增加,術(shù)語的平均長度也有增加的趨勢。在 GLOT-C系統(tǒng)中,當(dāng)術(shù)語數(shù)為500條時,術(shù)語的平均長度為1.974詞次/條;當(dāng)術(shù)語數(shù)為 1000條時,術(shù)語的平均長度為 2.072詞次/條;當(dāng)術(shù)語數(shù)為 1510條時,術(shù)語的平均長度為 2. 130詞次/條。當(dāng)然,術(shù)語的平均長度不能太長,每個術(shù)語系統(tǒng)都能在其運(yùn)行過程中,不斷地把術(shù)語的平均長度調(diào)節(jié)到最佳值。在這個調(diào)節(jié)的過程中,某些太長的術(shù)語被淘汰了,某些較短的術(shù)語變長了,這樣,術(shù)語的平均長度就可以保持相對的穩(wěn)定。
前面我們討論了術(shù)語構(gòu)成的三個主要概念:術(shù)語系統(tǒng)的經(jīng)濟(jì)指數(shù) E、單詞的術(shù)語構(gòu)成頻率 F和術(shù)語的平均長度 L?,F(xiàn)在我們進(jìn)一步研究這三個概念之間的關(guān)系。仔細(xì)觀察 GLOT-C術(shù)語數(shù)據(jù)庫的實(shí)驗數(shù)據(jù),可以發(fā)現(xiàn):術(shù)語系統(tǒng)的經(jīng)濟(jì)指數(shù) E和術(shù)語的平均長度L的乘積,與單詞的術(shù)語構(gòu)成頻率之值是近似相等的。
實(shí)驗數(shù)據(jù)如下:
T E L E×L F 500 1.46 1.974 2.88304 2.89 1000 1.70 2.072 3.52140 3.52 1510 1.76 2.130 3.74880 3.75
當(dāng) T=500時,有 E×L=2.883 04,而這時 F= 2.89;當(dāng) T=1000時,我們有 E×L=3.521 40,而這時F=3.52;當(dāng) T=1510時,我們有 E×L=3.748 80,而這時 F=3.75??梢钥闯?E×L之值與 F之值幾乎是相等的。
根據(jù)這些實(shí)驗數(shù)據(jù),我們可以在 E、F和 L之間建立如下的數(shù)學(xué)關(guān)系:
事實(shí)上,由于
以及
(2)÷(1)得到
根據(jù)術(shù)語平均長度的定義,我們有
比較(3)與(4),可以得到:
因此,可有
這就是上面的 FEL公式。
由此,我們可以得出結(jié)論:在一個術(shù)語系統(tǒng)中,術(shù)語系統(tǒng)的經(jīng)濟(jì)指數(shù) E與術(shù)語的平均長度 L的乘積恰恰等于單詞的術(shù)語構(gòu)成頻率 F之值。我們把這個規(guī)律,叫做“術(shù)語形成的經(jīng)濟(jì)律”。
從 FEL公式,我們還可得到如下的推論:
1.在一個術(shù)語系統(tǒng)中,當(dāng)術(shù)語的平均長度L一定時,單詞的術(shù)語構(gòu)成頻率 F與術(shù)語系統(tǒng)的經(jīng)濟(jì)指數(shù) E成正比。術(shù)語系統(tǒng)的經(jīng)濟(jì)指數(shù)越高,單詞的術(shù)語構(gòu)成頻率也越高。這時,FEL公式變?yōu)?
這說明,為了提高術(shù)語系統(tǒng)的經(jīng)濟(jì)指數(shù),應(yīng)該增加單詞的術(shù)語構(gòu)成頻率,使得每個單詞能構(gòu)成更多的術(shù)語。
2.在一個術(shù)語系統(tǒng)中,當(dāng)系統(tǒng)的經(jīng)濟(jì)指數(shù) E一定時,單詞的術(shù)語構(gòu)成頻率 F與術(shù)語的平均長度L成正比。術(shù)語的平均長度越長,單詞的術(shù)語構(gòu)成頻率越高。這時,FEL公式變?yōu)?
這說明,為了提高單詞的術(shù)語構(gòu)成頻率,必須增加術(shù)語的平均長度,因為系統(tǒng)的經(jīng)濟(jì)指數(shù)是一定的,每個單詞只能被包含到有限數(shù)目的術(shù)語之中,所以,只有增加術(shù)語的平均長度。
3.在一個術(shù)語系統(tǒng)中,當(dāng)單詞的術(shù)語構(gòu)成頻率F一定時,系統(tǒng)的經(jīng)濟(jì)指數(shù) E與術(shù)語的平均長度 L成反比。系統(tǒng)的經(jīng)濟(jì)指數(shù)的增加將會引起術(shù)語平均長度的縮小,而系統(tǒng)的經(jīng)濟(jì)指數(shù)的減少將會引起術(shù)語平均長度的增長。這時,FEL公式變?yōu)?
這說明,在不改變單詞的術(shù)語構(gòu)成頻率的條件下,如果我們想提高術(shù)語系統(tǒng)的經(jīng)濟(jì)指數(shù)使得每個單詞能夠構(gòu)成更多的術(shù)語,那么,我們只好從原有的術(shù)語中,抽出一些單詞來構(gòu)成新的術(shù)語,這樣,術(shù)語的平均長度就縮短了。因為在這種情況下,運(yùn)行單詞總數(shù)是不變的,我們必須從原有的術(shù)語中,一般是從較長的術(shù)語中,抽出一部分單詞來構(gòu)成新的術(shù)語,而這將引起術(shù)語數(shù)目的增加。其結(jié)果,術(shù)語系統(tǒng)的某些術(shù)語中所包含的單詞數(shù)可能會減少,而新術(shù)語的長度不可能太長,因而系統(tǒng)中術(shù)語的平均長度就縮短了。
由此可見,FEL公式反映了術(shù)語系統(tǒng)的經(jīng)濟(jì)指數(shù)、單詞的術(shù)語構(gòu)成頻率以及術(shù)語的平均長度之間的相互依存和相互制約的關(guān)系。這個公式是支配著術(shù)語的形成和變化的一個經(jīng)濟(jì)規(guī)律。
從 FEL公式,我們可得到:
由此可知,提高術(shù)語系統(tǒng)的經(jīng)濟(jì)指數(shù)的方法有兩個:
1.在不改變單詞的術(shù)語構(gòu)成頻率的條件下,縮短術(shù)語的平均長度;
2.在不改變術(shù)語的平均長度的條件下,提高單詞的術(shù)語構(gòu)成頻率。
一般來說,在一個術(shù)語系統(tǒng)中,最好不要過大地改變術(shù)語的平均長度。術(shù)語的平均長度改變過大,往往會使術(shù)語系統(tǒng)改變到人們難以辨認(rèn)的程度。由于這個原因,我們最好不要使用縮短術(shù)語平均長度的方法來提高術(shù)語系統(tǒng)的經(jīng)濟(jì)指數(shù)??磥?提高術(shù)語系統(tǒng)的經(jīng)濟(jì)指數(shù)的最好方法,還是在盡量不過大地改變術(shù)語的平均長度的前提下,增加單詞的術(shù)語構(gòu)成頻率。這樣,在術(shù)語形成的過程中,將會產(chǎn)生大量的詞組型術(shù)語,使得詞組型術(shù)語的數(shù)量大大地超過單詞型術(shù)語的數(shù)量,而成為術(shù)語系統(tǒng)中的大多數(shù)。在我們設(shè)計的數(shù)據(jù)處理中文術(shù)語數(shù)據(jù)庫 GLOT-C中,詞組型術(shù)語占了75.17%。這個事實(shí),正是術(shù)語形成經(jīng)濟(jì)律作用的結(jié)果。而術(shù)語形成的經(jīng)濟(jì)律又是洪堡特提出的“語言是有限手段的無限運(yùn)用”這一普遍假設(shè)在現(xiàn)代術(shù)語學(xué)中的實(shí)際體現(xiàn)和科學(xué)證明。
[1]ChomskyN.喬姆斯基語言理論介紹·喬姆斯基序[M].黑龍江:黑龍江大學(xué)出版社,1982:1-2.
該文曾發(fā)表于 Social Sciences in China(No.4,1988)。本刊發(fā)表前,經(jīng)作者譯為中文并作了修改。——編者注
Economic Law of Ter m For mation—FEL For mula
FENG Zhiwei
The author ana lyzed the d is tribution of word-te rm and p hrase-te rm in the te rm inolog ica l da tabase GLO T-C,and tried to exp la in the p henom enon of p hrase-te rm s dom ina ted in te rm inolog ica l sys tem. Based on theore tica l ana lys is,the author p rop osed the econom ic law of te rm form a tion,and desc ribed the law w ith FEL form ula.
w ord-te rm,p hrase-te rm,econom ic law of te rm form a tion,FEL form ula
N04;H083
A
1673-8578(2010)02-0009-07
2009-12-20
馮志偉(1939—),男,云南昆明人,教育部語言文字應(yīng)用研究所研究員、博士生導(dǎo)師,計算語言學(xué)家。通信方式:zwfengde2008@hotmail.com。