馮志偉 周建
摘 要:本文介紹語言學(xué)家理查德·赫德森提出的詞語法,著重分析了“語言網(wǎng)絡(luò)”(language network)和“缺省傳承”(default inheritance)的概念,說明了詞語法與依存語法的關(guān)系。
關(guān)鍵詞:詞語法 語言網(wǎng)絡(luò) 缺省傳承 依存語法
理查德·赫德森(Richard Anthony Hudson,1939-)是英國著名語言學(xué)家,他曾在拉夫堡文法學(xué)校(Loughborough Grammar School)、劍橋大學(xué)圣體學(xué)院學(xué)習(xí)。1964年,在倫敦亞非學(xué)院獲得博士學(xué)位,博士論文研究的是碧雅語(Beja)的語法體系。1964-2004的四十年間,赫德森一直在倫敦大學(xué)學(xué)院(University College London,簡稱UCL)任教。曾經(jīng)擔(dān)任英國語言學(xué)會(huì)主席(1997-2000)。目前為倫敦大學(xué)學(xué)院榮休教授、英國社會(huì)科學(xué)院(The British Academy)院士。
赫德森
赫德森的主要著作有:
《英語復(fù)雜句》(English Complex Sentences,1971),《非轉(zhuǎn)換語法研究》(Arguments for a Non-Transformational Grammar,1976),《社會(huì)語言學(xué)》(Sociolinguistics, 1980初版,1996二版),《詞語法》(Word Grammar,1984),《英語詞語法》(English Word Gramm ar,1990),《英語語法》(English Grammar,1998),《語言網(wǎng)絡(luò)》(Language Networks,2007)等。
赫德森最重要的學(xué)術(shù)貢獻(xiàn)是創(chuàng)立了“詞語法”(Word Grammar)理論①。
詞語法是一種關(guān)于語言結(jié)構(gòu)的一般理論②。盡管目前有關(guān)詞語法的研究大多與句法有關(guān),但也與語義、形態(tài)、社會(huì)語言學(xué)、歷史語言學(xué)和語言處理等方面的研究有關(guān)。
詞語法也是認(rèn)知語言學(xué)的一個(gè)分支。
詞語法的名稱就說明了“詞”在這種理論中的中心地位。
詞語法認(rèn)為,詞是唯一的句法單位,句子結(jié)構(gòu)是由詞間依存關(guān)系構(gòu)成的一個(gè)整體。因此,詞語法也是一種依存語法理論。
詞語法最重要的特點(diǎn)是“語言網(wǎng)絡(luò)”(language network)的概念和“缺省傳承”(default inheritance)的概念。
在本文中,我們重點(diǎn)介紹一下這兩個(gè)概念。
詞語法認(rèn)為,語言網(wǎng)絡(luò)如同其它知識(shí)網(wǎng)絡(luò)一樣,也是一種“傳承網(wǎng)絡(luò)”(inheritance network)。這意味著,語言網(wǎng)絡(luò)具有如下特征:
“is-a”可以表示分類關(guān)系,這樣的分類關(guān)系“is-a”可以通過缺省傳承進(jìn)行概念的泛化,因此這種關(guān)系在語言網(wǎng)絡(luò)中具有特殊的地位。
語言網(wǎng)絡(luò)中的每一個(gè)結(jié)點(diǎn)是至少一個(gè)由“is-a”關(guān)系連接在一起的“傳承層級(jí)”的一部分。因此,在語言網(wǎng)絡(luò)中的所有結(jié)點(diǎn)都是被分了類的。例如:TAKE is-a Verb is-a Word(“TAKE”是一個(gè)“Verb”,而“Verb”是一個(gè)“Word”)意味著“TAKE”屬于“Verb”這個(gè)類,而“Verb”屬于“Word”這個(gè)類。
每一個(gè)連接至少是“傳承層級(jí)”的一部分。例如,Object is-a Complement is-a Dependent(Object是一種Complement,而Complement是一種Dependent)是一個(gè)連接,這個(gè)連接屬于“傳承”的一個(gè)“層級(jí)”,在這種情況下,不僅將語言網(wǎng)絡(luò)中的結(jié)點(diǎn)進(jìn)行了分類,語言網(wǎng)絡(luò)中的連接也進(jìn)行了分類。
考慮到“is-a”關(guān)系的特殊地位,詞語法使用一個(gè)特殊的符號(hào)來表示它:這個(gè)特殊的符號(hào)是一個(gè)小三角形,其底邊靠近上一級(jí)范疇。
圖1是上面所舉例子的詞語法簡圖。左邊表示語言網(wǎng)絡(luò)中結(jié)點(diǎn)之間的傳承層級(jí),右邊表示語言網(wǎng)絡(luò)中連接的傳承層級(jí)。
在詞語法的結(jié)構(gòu)圖里,結(jié)點(diǎn)的功能是非常單一的,它只表示在兩個(gè)或多個(gè)連接之間存在一種關(guān)聯(lián)關(guān)系。也就是說,結(jié)點(diǎn)是沒有內(nèi)容的,是沒有什么內(nèi)部結(jié)構(gòu)的。
但是,每一個(gè)通向另一結(jié)點(diǎn)的連接都定義了某種“屬性”。例如,一條從“TAKE”出來的“object”連接表示“TAKE”需要一個(gè)“賓語”的屬性,一條從“Verb”出來的“complement”連接表示“Verb”需要一個(gè)“補(bǔ)足語”的連接,一條從“Word”出來的“dependent”連接表示“Word”需要一個(gè)“從屬成分”的連接。
事實(shí)上,每一條連接給它所連接的每一個(gè)結(jié)點(diǎn)定義了一種屬性,對于結(jié)點(diǎn)而言,連接如同一種數(shù)學(xué)函數(shù),函數(shù)的值是隨變元而變的,連接的值是隨著結(jié)點(diǎn)而變的。
例如,object(賓語)函數(shù)的值是隨動(dòng)詞和詞例而變的,因此在表示所有動(dòng)詞的賓語一般化層級(jí),這個(gè)值必須是一個(gè)變量。詞語法中用點(diǎn)“··”或“?”來表示變量。圖2是把圖1中的依存關(guān)系和結(jié)點(diǎn)(詞型)連在一起所形成的一個(gè)簡單網(wǎng)絡(luò)。
從圖2我們可以看出,“詞”(Word)一般是沒有“補(bǔ)足語”(complement)的,因此它的數(shù)量(用“#”表示)為0。對“補(bǔ)足語”(complement)的這種約束也可以說明補(bǔ)足語是由“詞”(Word)來選擇的。例如,“TAKE”必須有一個(gè)“object”,而且,這個(gè)“object”應(yīng)該是“Noun”?!百e語”(object)的這種屬性通過傳承決定了“TAKE”賓語的詞性。
傳承網(wǎng)絡(luò)的主要特點(diǎn)就是可通過缺省傳承進(jìn)行概念的泛化推理。
這種方法在日常推理中常常用到,為了猜測我們無法觀察到的信息,人們一般都會(huì)采用將特殊情況泛化的操作。例如,當(dāng)我們認(rèn)為某個(gè)東西是一只“狗”的時(shí)候,我們假設(shè)這只“狗”如同一只真正的“狗”一樣,它有四條腿。換言之,這只狗通過缺省傳承這種方式,傳承了我們大腦中關(guān)于“狗”的這一典型屬性。但是,如果我們已經(jīng)看到了這只狗只有三條腿,那么,這個(gè)信息會(huì)取代通過缺省傳承得來的信息,從而使我們可以繼續(xù)將其看作為一只狗,盡管它只有三條腿。
總的說來,傳承層級(jí)越低,優(yōu)先級(jí)越高。圖3更清楚地說明了缺省傳承的機(jī)理。
從圖3可以看出,如果A'不為C,則A'通過傳承得到B',反之,A'為C。
圖3的(3)、(4)部分列舉了一個(gè)關(guān)于蘑菇顏色的例子。
按照我們的一般知識(shí),植物(plant)都有顏色(colour),而且是綠色的(green)。蘑菇(mushroom)是一種植物(plant),所以它也應(yīng)該有顏色(colour)。按照缺省推理,蘑菇(mushroom)的顏色(colour)應(yīng)該是綠的,但由于我們看到的事實(shí)是:蘑菇的顏色(colour)是灰色的(grey),因此這個(gè)信息會(huì)代替“蘑菇是綠色(green)”的信息。
詞語法通過對實(shí)體(entities)和關(guān)系(relation)的分類來區(qū)分語言的層級(jí),旨在避免傳統(tǒng)語言學(xué)中各個(gè)層級(jí)之間的邊界不清問題。
詞語法中采用的結(jié)點(diǎn)類型有:詞(words)、形(forms)、音(sound)、字母(letters)以及其它可表詞義的實(shí)體(entity)和關(guān)系(relation)。主要的關(guān)系有:意義(meaning)和實(shí)現(xiàn)(realization)。這樣,詞語法所表示的語言結(jié)構(gòu)如圖4所示。
圖4中,右邊用虛線隔開的語言學(xué)層級(jí)(從上至下)是:語義學(xué)(semantics)、句法學(xué)(syntax)、形態(tài)學(xué)(morphology)、音系學(xué)(phonology)和文字學(xué)(graphology)。
值得注意的是,在圖4沒有一個(gè)獨(dú)立的詞表。這意味著,詞語法和其它認(rèn)知語言學(xué)理論一樣,詞匯信息和其它事實(shí)之間的差別只是一種程度上的差別。
我們來看一個(gè)用詞語法處理動(dòng)詞“put”的例子④:
PUT
PUT isa verb.
stem of PUT =
whole of ed-form of PUT = stem of it.
NOT:whole of ed-form of PUT =
sense of PUT = put.
PUT has[1-1]object.
PUT has[1-1]adjunct-complement.
NOT:PUT has[0-0]complement.
type of sense of adjunct-complement of PUT = place.
referent of adjunct-complement of PUT = position of sense of it.
referent of object of PUT = put-ee of sense of it.
由此可見,詞語法力圖采用簡單的英語來描述詞的句法和語義規(guī)則。
在句法層面,詞語法的最大特點(diǎn)是放棄了短語的概念,只采用了依存結(jié)構(gòu)。詞語法這樣做不僅考慮了依存關(guān)系和語言網(wǎng)絡(luò)之間的親和性,也考慮了依存關(guān)系是一種更具心理現(xiàn)實(shí)性的結(jié)構(gòu)。
在句法研究中,在舍棄短語結(jié)構(gòu)后,詞語法衡量句子是否合乎語法的方式也有所變化。詞語法采用依存關(guān)系(?。┎豢上嘟坏姆椒▉肀硎疽粋€(gè)句子合乎語法的程度。
由于圖6中出現(xiàn)依存弧交叉的情況,因此,我們說的“I complicated like sentences”不是一個(gè)合乎語法的英語句子。
值得指出的是,用這種方式判斷句子的語法性不具有普適性。因?yàn)?,在有些語言中允許出現(xiàn)交叉弧(例如,荷蘭語)。這時(shí),就需要考慮采用一種新的方法來衡量句子是否合乎語法。一般而言,在這些允許交叉弧的語言中,人們也不能用短語結(jié)構(gòu)語法來判定句子的語法性。
另外一個(gè)問題是并列結(jié)構(gòu)的句法處理,這對所有基于依存關(guān)系的句法理論都是一個(gè)問題。
盡管并列結(jié)構(gòu)的處理,特別是復(fù)雜并列結(jié)構(gòu)的處理對所有的句法理論來說都不是一件容易的事情,但由于依存關(guān)系是非對稱的,這種非對稱性使并列結(jié)構(gòu)的處理在依存句法中遇到比短語結(jié)構(gòu)語法更大的困難。
目前,各種主要的依存句法理論都有相對的并列結(jié)構(gòu)處理方式,這些方式可以歸為三大類:并列連詞作為并列結(jié)構(gòu)的中心詞,并列結(jié)構(gòu)中的第一個(gè)詞作為整個(gè)結(jié)構(gòu)的中心詞,并列結(jié)構(gòu)中所有的詞具有平等的地位。
詞語法是第三種方法的代表性理論。圖7所示為詞語法處理一個(gè)英語并列結(jié)構(gòu)的依存圖。
圖7中的并列結(jié)構(gòu)看似簡單,實(shí)際上是比較復(fù)雜的。因?yàn)閳D7中構(gòu)成并列結(jié)構(gòu)的成分并不是受同一個(gè)詞支配的。如,London和Manchester的支配詞是介詞in,而today和tomorrow的支配詞則是is。
從圖7還可看出,并列連詞and在詞語法中是沒有位置的。對并列連詞and的這種處理方式略微修改,就可以滿足所有的詞語應(yīng)在依存結(jié)構(gòu)中出現(xiàn)的原則,這個(gè)原則是依存句法的一般原則。
詞語法是一種非模塊化的語言學(xué)理論。也就是說,詞語法中,在句法、語義等語言層面之間是沒有明確邊界的。
圖8為英語句子“The dog hid a bone for a week”(狗把骨頭藏了一個(gè)星期)的句法和語義結(jié)構(gòu)。
與句法結(jié)構(gòu)相比,語義結(jié)構(gòu)更為復(fù)雜,因?yàn)橐粋€(gè)詞的意義不僅需要通過其它概念來限定,而且語義分析還牽涉到使用者的認(rèn)知結(jié)構(gòu)。在圖8中,緊挨著詞上面的實(shí)線弧所構(gòu)成的依存圖表示句子的句法結(jié)構(gòu),從每個(gè)詞引出來的虛線把詞與其語義結(jié)構(gòu)連在一起。
盡管圖8所表示的語義結(jié)構(gòu)經(jīng)過了簡化,但仍保留了詞語法中語義描述的主要成分。圖中的“1”用來表示單個(gè)詞次,字母下標(biāo)只是為了便于區(qū)分所指的成分。虛線有兩種,直的虛線表示單詞的意義,曲的虛線表示單詞的所指。
這種方法最重要的特點(diǎn)是,同一方法可用于所有詞類的分析,包括動(dòng)詞。如,“1b”表示只有一只“狗”(dog),“1e”表示只“藏”(hiding)了一次。有定性(definiteness)是用長等號(hào)“==”表示的,它是定冠詞the的主要語義構(gòu)成,用于表明the和其后面的名詞dog共享網(wǎng)絡(luò)中的相關(guān)結(jié)點(diǎn)。為了說明時(shí)間狀語for a week的功能,把“藏”(hiding)這個(gè)單詞分解為“活動(dòng)”(er是活動(dòng)者的后綴)和“結(jié)果”(result)兩種意義是很有必要的。因?yàn)?,hiding本身作為一種活動(dòng)是不能持續(xù)一星期的,這一星期的“持續(xù)時(shí)間”(duration)針對的是“藏”(hiding)的“結(jié)果”?!安亍钡慕Y(jié)果是使得“骨頭”(bone)成為“不可見”(invisible)的。
總的說來,詞語法是一種以詞為中心的語法理論,同時(shí)含有依存語法、認(rèn)知語言學(xué)和構(gòu)式語法(construction grammar)的思想。
在詞語法里,語法就是由一種語言中所有的詞構(gòu)成的網(wǎng)絡(luò)。詞語法認(rèn)為語法沒有天然的邊界,也就是說,不存在語法甚至語言模塊。
語法網(wǎng)絡(luò)只是有關(guān)詞匯知識(shí)的整個(gè)網(wǎng)絡(luò)的一部分,它和這個(gè)網(wǎng)絡(luò)中的有關(guān)百科知識(shí)、社會(huì)結(jié)構(gòu)、語音等子網(wǎng)絡(luò)密切相關(guān)。
“語法”和“詞匯”在描寫上沒有什么本質(zhì)的區(qū)別,只不過前者處理的是一般性的模式,后者描述的是有關(guān)單個(gè)詞素的事實(shí)。從形式上看,一般模式雖然涉及的是有關(guān)詞類方面的事情,但表現(xiàn)方式與描寫詞素的方法并沒有什么不同。
詞語法是被引用最多的依存語法理論之一,詞語法中使用的“依存有向圖”成為了很多計(jì)算語言學(xué)家表示依存關(guān)系的一種常規(guī)手段。
雖然詞間依存是構(gòu)成詞語法的基礎(chǔ),但不能把詞語法理論簡單地看成是一種句法理論,它是一種幾乎涵蓋了共時(shí)語言學(xué)各個(gè)分支的語言學(xué)理論。詞語法將這些研究領(lǐng)域統(tǒng)一在一面旗幟之下,這一面旗幟上寫著:“語言是一個(gè)概念網(wǎng)絡(luò)”。
盡管語言網(wǎng)絡(luò)的概念有助于提升語言學(xué)研究的普遍價(jià)值,有利于改善語言學(xué)理論的心理現(xiàn)實(shí)性,但語言網(wǎng)絡(luò)的概念也向許多傳統(tǒng)的語言學(xué)方法提出了挑戰(zhàn)。例如,我們是如何通過這種語言網(wǎng)絡(luò)進(jìn)行語言理解和生成的?怎樣用計(jì)算機(jī)來模擬這種語言認(rèn)知過程?等等。這些都涉及到語言網(wǎng)絡(luò)的可操作性問題,有待進(jìn)一步研究。
不過,詞語法的創(chuàng)立者赫德森堅(jiān)信,我們可以構(gòu)造一種計(jì)算機(jī)模型來模擬人腦處理語言的過程,他自己要做的工作就是盡可能做出這樣一種模型來。目前在人工智能領(lǐng)域提出的“詞矢量”(word vector)和“詞嵌入”(word embedding)等方法,用單詞在上下文中的分布來表示單詞的特性,把單詞與上下文緊密地結(jié)合起來,其思路與詞語法相差無幾。
注釋:
①Richard Hudson,Word Grammar.Keith Brown
(ed.)Encyclopedia of Language and Linguistics,Second Edition.Elsevier.pp.633-642,2006.
②Richard Hudson,Word Grammar.Kensei Sugayama
(ed).Studies in Word Grammar(Kobe: Research Institute of Foreign Studies,Kobe City University of Foreign Studies)pp.7-32,2002.
③Hudson,R.Language Networks[M].USA:Oxford
University Press,2007.
④Hudson,R.A.English Word Grammar,pp264,
1991.
⑤Richard Hudson.Word Grammar[A].Bernd Heine
and Heiko Narrog.Oxford Handbook of Linguistic Analysis[C].Oxford University Press,2009.
參考文獻(xiàn):
[1]Richard Hudson,Word Grammar[A].Keith Brown.
Encyclopedia of Language and Linguistics(Second Edition)[C].Netherlands:Elsevier,2006.
[2]Richard Hudson,Word Grammar.Kensei
Sugayama(ed).Studies in Word Grammar(Kobe:Research Institute of Foreign Studies,Kobe City University of Foreign Studies)pp.7-32,2002.