• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      非連續(xù)性的復(fù)合量化句邏輯語法處理方式*

      2015-05-25 00:33:16鄒崇理
      關(guān)鍵詞:量詞句法范疇

      鄒崇理

      (中國社會科學(xué)院哲學(xué)所,北京100732)

      非連續(xù)性的復(fù)合量化句邏輯語法處理方式*

      鄒崇理

      (中國社會科學(xué)院哲學(xué)所,北京100732)

      【主持人語】 本期刊登兩篇有關(guān)研究邏輯語法的文章。

      信息時代的核心技術(shù)之一是自然語言信息處理,而自然語言信息處理的前提是把自然語言句法語義形式化。以下兩篇文章都是對自然語言形式化研究的成果,這有助于計算機的自然語言信息處理。早在卡爾納普和莫里斯那里,自然語言就分為句法、語義和語用三個層面。從句法角度看,自然語言表達(dá)式總是前后相連的符號串,但從語義視角看,這些符號串的語義運算并非都是相鄰毗連的。句法相鄰而語義分離的錯位現(xiàn)象常??梢砸姷?這就是自然語言中的非連續(xù)結(jié)構(gòu),而復(fù)合量化句呈現(xiàn)出獨特的非連續(xù)性特點。鄒崇理研究員在此先后介紹范疇語法和蒙太格語法對非連續(xù)結(jié)構(gòu)的處理方式,對此做出一些擴展來處理非連續(xù)的復(fù)合量化句,最后評價兩種方法的優(yōu)劣和提出探索的問題。

      姚從軍副教授關(guān)注的范疇語法是一種用于計算的關(guān)于自然語言的語法。范疇語法的兩個最完善的分支是基于邏輯傳統(tǒng)的范疇類型邏輯和基于組合傳統(tǒng)的組合范疇語法,二者聯(lián)系緊密,差異也明顯,前者主要關(guān)心不同邏輯算子對語言的適用性和邏輯系統(tǒng)的證明論性質(zhì),理論價值大于計算應(yīng)用的價值。后者具有良好的計算性質(zhì),在信息處理領(lǐng)域影響很大。二者具有互補作用。

      從純句法角度看,自然語言表達(dá)式表現(xiàn)為由小到大生成的連續(xù)符號串。大多數(shù)情況下,這些符號串的語義追隨句法進行毗連組合。但在不少場合下,這種句法和語義的對應(yīng)出現(xiàn)錯位,句法的生成和語義的組合對應(yīng)不起來,即句法上分離的符號串在語義上是不可分離的整體。這就是自然語言中的非連續(xù)結(jié)構(gòu),而復(fù)合量化句呈現(xiàn)出獨特的非連續(xù)性特點。本文先后介紹范疇語法和蒙太格語法對非連續(xù)結(jié)構(gòu)的處理方式,對此做出一些擴展,最后評價兩種方法的優(yōu)劣和需要探索的問題。

      非連續(xù)結(jié)構(gòu);復(fù)合量化句;范疇語法;蒙太格語法

      信息時代的核心技術(shù)是計算機信息處理,特別是關(guān)于自然語言的信息處理。自然語言信息處理的前提是對句法語義豐富多樣的自然語言進行形式化分析,20世紀(jì)60年代誕生的邏輯語法(又叫形式語義學(xué))系列學(xué)科為此應(yīng)運而生,其中的范疇語法和蒙太格語法影響最大,其處理自然語言的最大難點就是自然語言中的非連續(xù)結(jié)構(gòu)(discontinuous structure)。

      什么是自然語言中的“非連續(xù)結(jié)構(gòu)”。組合范疇語法的創(chuàng)立者Steedman認(rèn)為:“自然語言中的非連續(xù)結(jié)構(gòu)是范疇語法以及其他語法理論的核心問題(Steedman 1987)?!蓖ǔ0殃P(guān)系從句、疑問句、話題句、斷裂句和準(zhǔn)斷裂句等無界限依存結(jié)構(gòu)認(rèn)為是非連續(xù)結(jié)構(gòu)。古典范疇語法只能把相鄰(adjacent)兩成分毗連(concatenation)在一起,語義上其中一個是函數(shù)表達(dá)式,另一個是論元表達(dá)式,二者之間進行函數(shù)運算。Wood提出如果可作函數(shù)運算的兩成分句法上不相鄰,則無法直接毗連,這就是不連續(xù)現(xiàn)象(Wood 1993)。Morrill提出動詞省略和照應(yīng)回指現(xiàn)象等屬于非連續(xù)結(jié)構(gòu)(Morrill 2011),把非連續(xù)結(jié)構(gòu)定義為句法和語義的不匹配(the mismatch between syntax and semantics)(Morrill 1995;Morrill 2011),本文討論的非連續(xù)的量化復(fù)合句就屬于這樣的情況。

      先看看英語的一些非連續(xù)結(jié)構(gòu),如:

      (1)Mary let John down

      Let…down的意思是“令人失望”,就是說let…down在語義上是一個不可再分的基本單位,可是在句法上卻由不相鄰的兩個單詞構(gòu)成。雖然let…down可以針對John做語義運算,但句法上卻需要把后者插入到前者兩個單詞之間。英語中還有一些習(xí)語,如:

      (2)Mary gave John the cold shoulder

      從語義角度看,“give…the cold shoulder”可以對應(yīng)一個語義算子,而“John”對應(yīng)這個算子的論元。但是在句法上,語義算子和語義論元對應(yīng)的表達(dá)式卻是分開的,這就是句法和語義不匹配造成的非連續(xù)結(jié)構(gòu)。

      范疇語法怎樣處理自然語言的非連續(xù)結(jié)構(gòu)?古典范疇語法限于處理相鄰的兩個句法表達(dá)式,只有毗連(concatenation)一種句法操作,所謂毗連是指給定任意兩個語符串α和β,把它們毗連在一起得到α β或者βα。范疇語法中強調(diào)函數(shù)運算的表述就是:若α的范疇是A/B,β的范疇是B,則αβ的范疇是A?,F(xiàn)代范疇語法用包裹(wrapping)這種句法操作(syntactic operation)來處理不連續(xù)現(xiàn)象。給定任意兩個表達(dá)式,依照某一句法規(guī)則,經(jīng)某種句法操作,二者可生成一個句法整體。為了生成如“gave John the cold shoulder”一類的表達(dá)式,Bach在范疇語法中引進了右包裹操作(Bach 1989):

      若a形如[XPXW],則RWAP(a,b)=X_b_W。

      應(yīng)用于(2)就得:

      RWRAP((gave the cold shoulder),John)=gave John the cold shoulder

      為解決自然語言在句法和語義上不匹配的非連續(xù)結(jié)構(gòu),Morrill提出了不連續(xù)蘭貝克演算DLC (Discontinuous Lambek Calculus)?;贒LC的范疇語法,其詞庫里的詞條內(nèi)容是句法形式、所屬范疇和語義表達(dá)式的三元組,某些詞條的句法形式增加了表示不連續(xù)的結(jié)構(gòu)成分,即語言成分之間的間隙(gap),比如:

      give…the cold shoulder?give+1+the+cold+shoulder:(nps)↑np:shun

      也就是把非連續(xù)的句法表達(dá)式“give…the cold shoulder”改寫成含有毗連算子“+”和間隙“1”的句法形式“give+1+the+cold+shoulder”,用包含上箭頭算子的范疇“(nps)↑np”作為該句法形式的范疇,用shun作為這個句法形式的語義表達(dá)式。DLC處理英語中一個不連續(xù)語句的范疇語法推演如下:

      什么是非連續(xù)的復(fù)合量化句?量化句指的是包含量詞的句子,量詞在自然語言中表現(xiàn)為“每個”“一個”“不同一本”之類的限定詞(determiner),復(fù)合的量化句就是包含兩個以上量詞的句子。我們來看通常的漢語復(fù)合量化句:

      (4)每個選民都選舉一個候選者。

      這里“每個”和“一個”就是(4)包含的兩個量詞,通常一階邏輯和廣義量詞理論對(4)的語義表述是:①以下借用漢語詞的黑體來表示其對應(yīng)的謂詞常項。

      一階邏輯方式:?x[選民(x)→?y[候選者(y)&選舉(x,y)]

      廣義量詞方式:EVERY(選民,λx(SOME(候選者)(λy(選舉(x,y)))))

      雖然上述語義表述存在不夠精細(xì)之處,②就某個選民而言,他選舉的候選者跟其他選民選擇的候選者是相同還是不同,語句(3)本身沒有進一步說明,一階邏輯的方式和通常廣義量詞理論的方式對此也不能進行更精細(xì)的分析。但從廣義量詞角度看量詞“EVERY”和“SOME”的涵義是各自獨立的,(3)不屬于非連續(xù)的復(fù)合量化句。下述復(fù)合量化句的情況就不同了:

      (5)每個學(xué)生(都)讀不同一本書。

      顯然,一階邏輯和通常廣義量詞的表述方式不便分析(5)的語義特征。(5)說的是“學(xué)生”集合中的成員通過“讀”對應(yīng)的“書”集合中的成員是各不相同的,這種對應(yīng)是一一對應(yīng),學(xué)生甲讀的書不同于學(xué)生乙讀的書,兩個不同學(xué)生不能讀同一本書。按照Keenan的方法(Keenan 1986),我們用集合A代表“學(xué)生”,用集合B代表“書”,“每個……不同一本…”這個復(fù)合量詞用Q[每個…]表示,A和B可以作為這個復(fù)合量詞的兩個論元。二元關(guān)系R 表示“讀”,是這個量詞的第三個論元。而Ra表示由個體a作為R的前項所決定的R的后項的集合,(5)的量化表述為:

      Q[每個……不同一本…](A,B,R)

      (6)的語義解釋為:

      (7)Q[每個……不同一本…](A,B,R)=1當(dāng)且僅當(dāng)

      1.?a,b∈A且a≠b:RaB≠RbB

      2.?a∈A:|RaB|=1

      (7)用兩條陳述表明量化公式(6)的語義。第1陳述說的是,對于任兩個不同的學(xué)生a和b來說,a讀的書的集合RaB不同于b讀的書的集合RbB;第2陳述意味,任何一個學(xué)生a讀的書的集合中只有一個成員,即一本書。這里我們強調(diào)的是,(5)中的兩個量詞“每個”和“不同一本”的量化涵義不是獨自分離的,它們必須結(jié)合在一起才能確立(7)所顯示的兩條陳述,(7)中的Q[每個…同樣一本…]其量化語義是一個整體。而(5)中體現(xiàn)量化語義的句法成分“每個”與“不同一本”卻不是毗連相鄰的,句法和語義在這里不匹配,這就是復(fù)合量化句中的非連續(xù)結(jié)構(gòu),或者叫非連續(xù)的復(fù)合量化句。

      按照范疇語法的方式,即Morrill提出的不連續(xù)蘭貝克演算DLC,是否能夠處理上述非連續(xù)的復(fù)合量化句?我們列舉Morrill的DLC中處理不連續(xù)結(jié)構(gòu)的兩個推演規(guī)則:③這里Morrill用“,”替代“…”表示間隙。為直觀簡明起見,我們從J?ger(J?ger 2005)中轉(zhuǎn)引Morrill在2000年的表述,而不用Morrill在2011年著述中的更具一般性的表述。

      規(guī)則↑1E生成具有一個間隙的非連續(xù)結(jié)構(gòu),如同(3)中的推演。而規(guī)則↑2E用于生成具有兩個間隙的不連續(xù)結(jié)構(gòu)。由于(6)分析出的復(fù)合量詞嚴(yán)格講具有三個間隙,第一個間隙插入“學(xué)生”,第二個間隙插入“讀”,第三個間隙插入“書”。關(guān)鍵是,前兩個間隙是相毗連的,第三個間隙后面沒有符號串。這些情況是Morrill的規(guī)則所沒有描述的,由此可見,范疇語法處理非連續(xù)結(jié)構(gòu)的規(guī)則對非連續(xù)的量化復(fù)合句來說似乎需要進一步擴展。

      怎樣擴展?筆者先定義具有連續(xù)間隙的符號串和具有右空符號串的間隙,在Morrill的有關(guān)定義那里,增加一條補充:

      3′ 若α,β∈T1,則(α,,β,)∈T2

      再增加相應(yīng)的推演規(guī)則:

      于是(6)的生成過程表現(xiàn)為依次應(yīng)用↑3E、↑2E和↑1E的推演:

      然而,蒙太格對非連續(xù)復(fù)合量化句的處理似乎更加精巧便利,蒙太格式的構(gòu)建語句系統(tǒng)的方式對此大有用武之地。Keenan對非連續(xù)復(fù)合量化句的分析非常到位,頗具影響力。然而在Keenan那里,沒有系統(tǒng)的生成復(fù)合量化句的規(guī)則,僅僅給出復(fù)合量詞整體的語義解釋,沒有給出復(fù)合量化句的生成過程。這使我們回想到蒙太格語法(Montague Grammar)當(dāng)初處理量化句的獨特方式,即不單列出量詞范疇的做法(Montague 1974),有其獨特的精妙之處。把這種方式進一步擴展,對復(fù)合量化句的生成是很方便的。我們先來看Montague的PTQ系統(tǒng)對量化表達(dá)式的生成規(guī)則:

      S2.若ζ∈PCN,則F0(ζ),F1(ζ),F2(ζ)∈PT,其中:

      F2(ζ)=aζ或anζ,依據(jù)ζ詞頭第一個字母是輔音讀法還是元音讀法。

      對應(yīng)的翻譯規(guī)則為:

      TR2.若α∈PCN,α翻譯成α′,則F0(α)=everyα譯為:λQ?z[α′(z)→Q(z)]

      F1(α)=theα譯作:λQ?x[?y[α′(y)?y=x]∧Q(x)]

      F2(α)=aα譯為:λQ?z[α′(z)∧Q(z)]

      這里,Montague生成量化短語的方式非常獨特,在句法規(guī)則中不把量詞當(dāng)作獨立的句法范疇。僅僅通過句法操作F把量詞插入到通名前而形成量詞短語。而對應(yīng)這樣的句法操作F的表現(xiàn)語義的翻譯操作也很巧妙,其靈活性使得蒙太格式的語句系統(tǒng)生成非連續(xù)的復(fù)合量化句顯得非常方便。如生成(5)的句法規(guī)則就是:

      Syn1.若α,β∈PCN,γ∈PVT,則F1(α,β,γ)=每個αγ不同一本β∈Pt。

      相應(yīng)的翻譯規(guī)則為:

      Tr1.若α′,β′是α,β的翻譯,γ′是γ的翻譯,則F1(α,β,γ)翻譯為:Q[每個…不同一本…](α′,β′,γ′)。

      而非連續(xù)的復(fù)合量詞的語義解釋(7)為:①Keenan對復(fù)合量詞的解釋體現(xiàn)出一種函項映射的思想。我們設(shè)置一個函項f,限制為一一函項,就能準(zhǔn)確揭示(6)的量化語義,對Keenan的語義解釋的改進是:Q[每個…不同的一本…](A,B,R)?存在一一映射的函項f:A?B, f即是R。即?a,b∈A且a≠b:f(a)≠f(b)。關(guān)于復(fù)合量詞語義解釋的改進這里從略。

      Q[每個……不同一本…](α′,β′,γ′)當(dāng)且僅當(dāng) 存在一一映射的函項f:α′?β′,f就是γ′。

      自然語言中還有大量的非連續(xù)復(fù)合量化句,以漢語為例:②關(guān)于漢語非連續(xù)的復(fù)合量化句的詳細(xì)論述參見(張世寧2006)。

      (8)每個學(xué)生(都)讀了同樣一本書

      (9)每個學(xué)生(都)讀了同樣三本書

      (10)每個學(xué)生(都)讀了同樣一些書

      (11)至少兩個學(xué)生問了那個老師同樣一個問題。

      用蒙太格語法構(gòu)造語句系統(tǒng)的方式,可以確立生成上述非連續(xù)復(fù)合量化句的句法規(guī)則:

      Syn2.如果α,β∈PCN,γ∈PVT,則F2(α,β,γ)=每個αγ同樣一本β∈Pt。

      Syn3.如果α,β∈PCN,γ∈PVT,則F3(α,β,γ)=每個αγ同樣三本β∈Pt。

      Syn4.如果α,β∈PCN,γ∈PVT,則F4(α,β,γ)=每個αγ同樣一些β∈Pt。

      Syn5.如果α,β,δ∈PCN,γ∈PVT3,則F5(α,β,δ,γ)=至少兩個αγ那個β同樣一個δ∈Pt。

      對應(yīng)的翻譯規(guī)則可以像范疇語法那樣給出自然語言表達(dá)式的邏輯式:

      Tr2.如果α′,β′分別是α,β的翻譯,γ′是γ的翻譯,則F2(α,β,γ)的翻譯是:

      Q[每個……同樣一本…](α′,β′,γ′)。

      Tr3.如果α′,β′分別是α,β的翻譯,γ′是γ的翻譯,則F3(α,β,γ)的翻譯是:

      Q[每個……同樣三本…](α′,β′,γ′)。

      Tr4.如果α′,β′分別是α,β的翻譯,γ′是γ的翻譯,則F4(α,β,γ)的翻譯是:

      Q[每個……同樣一些…](α′,β′,γ′)。

      Tr5.如果α′,β′,δ′分別是α,β,δ的翻譯,γ′是γ的翻譯,則F5(α,β,δ,γ)的翻譯是:

      Q[至少兩個……那個…同樣一個…](α′,β′,γ′,δ′)。

      結(jié)束語:以上我們簡略地介紹了非連續(xù)的復(fù)合量化句的情況。自然語言中存在大量的非連續(xù)現(xiàn)象,復(fù)合量化句能夠顯示出這樣的非連續(xù)性——句法和語義的不匹配,即通過句法分離的方式表現(xiàn)出一個完整的語義。其次,我們分別給出范疇語法和蒙太格語法處理自然語言非連續(xù)現(xiàn)象的不同方式,前者采用類似引入或消去邏輯連接詞的推演規(guī)則來展示非連續(xù)的復(fù)合量化句的句法和語義的生成過程,后者采取構(gòu)造自然語言語句系統(tǒng)的規(guī)則方式說明這樣的過程。③本文對Morrill的非連續(xù)蘭貝克演算的規(guī)則做了擴充,同時對刻畫復(fù)合量化句的蒙太格語句系統(tǒng)的規(guī)則也做了增添?,F(xiàn)在我們就來比較比較兩種方法的利弊優(yōu)劣。

      范疇語法處理非連續(xù)結(jié)構(gòu)的方式具有邏輯學(xué)追求的簡潔精準(zhǔn)性,每一步推演根據(jù)一個規(guī)則,一個規(guī)則執(zhí)行一個操作。推演樹(7′)可以重新表述為:④為了最直接展示語言的生成過程,我們在此略去了每個節(jié)點對應(yīng)的邏輯式。這是一種兩分法的分析,從邏輯角度看沒有什么不妥。但是從語言直覺感受來講,非連續(xù)的復(fù)合量詞的符號串本身就不自然,除最后一步的每一步插入一個詞所得結(jié)果也不符合人們構(gòu)詞造句的語言習(xí)慣。

      對此蒙太格語法的分析樹是:

      這是多分法的結(jié)果,步驟簡單,每個節(jié)點對應(yīng)的自然語言符號串都是人們語言習(xí)慣所能接受的,因此從語言直覺看,蒙太格語法生成非連續(xù)復(fù)合量化句的方式顯得自然簡便。從計算語言學(xué)角度看,蒙太格語法的多分法操作比范疇語法的兩分法操作效率高。

      最后,我們需要進一步探討的問題是,按照范疇語法的詞匯主義思想,包含三個間隙的非連續(xù)結(jié)構(gòu)“每個,,不同一本,”并非最小的詞條單位,怎樣理解它的生成過程?①蒙太格語法不把量詞作為一個獨立的句法單位,回避了復(fù)合量詞的生成過程的理解問題。按照廣義量詞理論,復(fù)合量詞總是由簡單量詞根據(jù)嚴(yán)格的疊置定義疊置復(fù)合而成。但是非連續(xù)的復(fù)合量詞顯示出特殊性,即復(fù)合前的單個量詞成分如“不同一本”還不好算作是具有獨立涵義的簡單量詞,這樣能夠適用于廣義量詞理論中嚴(yán)格的量詞復(fù)合的疊置定義嗎?如果能夠納入到量詞復(fù)合的疊置定義中被說明,復(fù)合前的量詞成分如“不同一本”的量化涵義怎樣確立?非連續(xù)復(fù)合量詞的生成在范疇語法中似乎應(yīng)該確立特定的推演規(guī)則。

      Linguistic logic in discontinuously compound quantified sentences

      ZOU Chong-li
      (Institute of Philosophy,Chinese Academy of Social Sciences,Beijing 100732,China)

      From a purely syntactic perspective,natural language expressions are characterized by continuous symbolic strings generated from small parts to large ones.Mostly,by following their syntax,the semantic meanings of these symbolic strings are also concatenate.But in many cases,the correspondences between their syntax and semantics are dislocated,which means that their syntactic generation and semantic composition cannot match with each other;for instances,syntactically separated symbolic strings are inseparable as a whole semantically.This is the discontinuous structure of natural language.Compound quantified sentences present the unique characteristics of discontinuity. This paper briefs the approaches to the discontinuous structure in the framework of categorical grammar and Montague grammar and somewhat improves their methods.Finally,the paper evaluates the merits and weaknesses of the two methods and proposes the future research questions.

      discontinuous structure;compound quantified sentences;categorical grammar,Montague grammar

      B81-092

      A

      1000-5110(2015)01-0069-06

      [責(zé)任編輯: 王德明]

      鄒崇理,男,四川成都人,中國社會科學(xué)院創(chuàng)新工程首席研究員,博士生導(dǎo)師,中國邏輯學(xué)會會長,國家重大課題首席專家,研究方向為語言邏輯。

      國家社科基金重大課題“自然語言信息處理的邏輯語義學(xué)研究”(10&ZD073)。

      猜你喜歡
      量詞句法范疇
      批評話語分析的論辯范疇研究
      句法與句意(外一篇)
      中華詩詞(2021年3期)2021-12-31 08:07:22
      述謂結(jié)構(gòu)與英語句法配置
      正合范疇中的復(fù)形、余撓對及粘合
      集合、充要條件、量詞
      十二生肖議量詞
      量詞大集合
      Clean-正合和Clean-導(dǎo)出范疇
      句法二題
      中華詩詞(2018年3期)2018-08-01 06:40:40
      詩詞聯(lián)句句法梳理
      中華詩詞(2018年11期)2018-03-26 06:41:32
      航空| 高州市| 墨竹工卡县| 沈阳市| 嘉荫县| 文化| 凤山县| 十堰市| 梁平县| 盱眙县| 宁明县| 喀喇| 肇东市| 睢宁县| 石家庄市| 峨眉山市| 兴业县| 曲靖市| 长垣县| 绩溪县| 师宗县| 木兰县| 白城市| 临海市| 湖南省| 密云县| 左云县| 鲁甸县| 镇远县| 孟津县| 牙克石市| 扎赉特旗| 凭祥市| 江油市| 二连浩特市| 梧州市| 高州市| 海伦市| 东源县| 皋兰县| 滁州市|