• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      關(guān)于組合范疇語法CCG

      2011-10-30 12:25:54鄒崇理
      關(guān)鍵詞:指派詞庫斜線

      鄒崇理

      (1.燕山大學(xué)文法學(xué)院,河北秦皇島 066004;2.中國社會科學(xué)院哲學(xué)研究所,北京 100732)

      關(guān)于組合范疇語法CCG

      鄒崇理1,2

      (1.燕山大學(xué)文法學(xué)院,河北秦皇島 066004;2.中國社會科學(xué)院哲學(xué)研究所,北京 100732)

      組合范疇語法CCG(Combinatory Categorial Grammar)和類型邏輯語法TLG(Type Logical Grammar)都是范疇語法的現(xiàn)代版本,前者關(guān)注范疇語法的語言學(xué)應(yīng)用和自然語言的信息處理,后者傾向于從邏輯的角度審視范疇語法的理論性質(zhì)。CCG的特點(diǎn)有:原子范疇的加標(biāo)多樣化和徹底的詞匯主義思路;斜線算子的下標(biāo)模態(tài)化和函子范疇的多樣組合;基于范疇等級和范疇構(gòu)造的視角建立CCG的證明論。

      組合范疇語法CCG;類型邏輯語法TLG;函子范疇的組合

      范疇語法是一種面向自然語言信息處理的邏輯理論。按照這種理論,自然語言是由詞構(gòu)成詞組、詞組構(gòu)成語句的符號系統(tǒng),自然語言的這種構(gòu)造生成被看作是計(jì)算推演的過程。范疇語法產(chǎn)生于20世紀(jì)30~40年代,50年代以后逐步走向成熟。

      組合范疇語法 CCG(Combinatory Categorial Grammar,簡稱CCG)則在20世紀(jì)80~90年代開始出現(xiàn),是對范疇語法進(jìn)行擴(kuò)展的現(xiàn)代版本。擴(kuò)展的實(shí)質(zhì)在于“組合”(combinatory),即基于范疇語法增添了函子范疇的組合運(yùn)算,這類似數(shù)學(xué)中函數(shù)的復(fù)合。與此同時,類型邏輯語法TLG(Type Logical Grammar,簡稱TLG)也是范疇語法發(fā)展的現(xiàn)代產(chǎn)物,這個發(fā)展方向的源頭是著名的蘭貝克演算(Lambek,1958)。自誕生起CCG和TLG就顯示出各自側(cè)重的偏好。CCG關(guān)注自然語言“語境敏感層面”的表達(dá)力問題,從語言學(xué)和計(jì)算語言學(xué)的角度探討基于統(tǒng)計(jì)模型的自然語言的自動機(jī)處理問題。而TLG的蘭貝克傳統(tǒng)則熱心于范疇語法的邏輯理論問題,把范疇語法看成是一個邏輯系統(tǒng),配備框架語義學(xué),討論系統(tǒng)的可靠性和完全性,以及系統(tǒng)的可判定性。本文從范疇語法的基礎(chǔ)出發(fā),進(jìn)而介紹CCG,看看這個理論到底具有哪些不同于TLG的內(nèi)容。

      跟范疇語法一脈相承,CCG也是一種基于詞匯的語法形式理論。就是說,CCG把自然語言的生成過程凝縮在詞條的范疇構(gòu)造上[1]。例如:

      我們可以通過詞條“proved”的范疇構(gòu)造(2)來體現(xiàn)生成規(guī)則(1)的內(nèi)容。從某種意義上說,(1)確定了(2)。根據(jù)(1),我們有生成樹:

      按照(3)從上到下看,節(jié)點(diǎn)VP對應(yīng)的函子范疇是:運(yùn)算的論元是NP,運(yùn)算的結(jié)果是S,記作S NP,其運(yùn)算是向后的,即論元范疇在函子范疇的后邊。而節(jié)點(diǎn)V對應(yīng)的函子范疇為:論元是NP,結(jié)果是SNP,記作(SNP)/NP,其運(yùn)算是向前的,即論元在函子的前邊。(SNP)/NP就是詞條Proved對應(yīng)的范疇。因此說,范疇語法指派給動詞的函子范疇的構(gòu)造顯示出:運(yùn)算前的論元范疇和運(yùn)算后的結(jié)果范疇以及運(yùn)算的方向。于是,CCG從范疇語法那里傳承的函項(xiàng)應(yīng)用于論元的規(guī)則為[1]:

      向前的應(yīng)用

      向后的應(yīng)用

      以上規(guī)則就是CCG對范疇語法基本思想的繼承。除此以外,CCG還發(fā)展出自己新的內(nèi)容,概括為三點(diǎn):原子范疇的加標(biāo)多樣化和徹底的詞匯主義思路;斜線算子的下標(biāo)模態(tài)化和函子范疇的多樣組合規(guī)則;基于范疇等級和范疇構(gòu)造的概念建立CCG的證明論。

      首先,CCG為刻畫豐富多彩的自然語言,其范疇設(shè)置比TLG更加精細(xì)化。對原子范疇譬如N, NP,PP,S等等,可以通過添加數(shù)格等標(biāo)記進(jìn)一步多樣化,如名詞短語范疇根據(jù)數(shù)的特征分為NPsg和NPpl,根據(jù)格的特征分為NPsbj和NPobj,還有主格復(fù)數(shù)名詞短語范疇NPplsbj等等。CCG是徹底的詞匯主義語法理論,詞庫中甚至還有詞綴的范疇指派[2]:

      圖1 詞庫

      圖1這樣的詞庫顯示:第一列的第七行就是對名詞的復(fù)數(shù)詞綴的范疇指派,第二列第八行就是對第三人稱動詞詞綴的范疇指派?;谶@樣的詞庫,CCG關(guān)于動詞第三人稱詞綴和名詞復(fù)數(shù)詞綴的推演例子如圖2[2]:

      圖2 推演例

      其次,純粹的范疇語法限于函項(xiàng)應(yīng)用于論元的句法貼合規(guī)則,這樣限制了語境自由文法的表達(dá)力。CCG擴(kuò)大了語境自由文法的規(guī)則集合,添加了基于函子范疇的組合(置換)獲得另一函子范疇的那些規(guī)則。如:

      函子范疇的向前組合

      函子范疇的向后組合

      函子范疇的向前置換

      函子范疇的向后置換

      不僅如此,基于Jacobson(1990,1992)、Hepple(1990)、Baldridge(2002)和Baldridge&Kruijff (2003)等人的工作,CCG進(jìn)一步提出函子范疇及其規(guī)則的模態(tài)化概念,即給斜線算子添加下標(biāo)。具體來說,CCG提出四個基本的模態(tài)*,◇,×和■作為斜線算子的下標(biāo),各種不同下標(biāo)的斜線算子適用于不同的函子范疇組合規(guī)則。換言之,不同下標(biāo)的斜線算子的性質(zhì)往往通過各自適用的組合規(guī)則體現(xiàn)出來。

      提出斜線算子模態(tài)的用意在于:帶下標(biāo)*的斜線算子是最受限的,僅適用于最基本的函項(xiàng)應(yīng)用規(guī)則(即NL的規(guī)則);帶下標(biāo)◇的斜線算子允許推演中的結(jié)合性(即適用于L的規(guī)則);帶下標(biāo)×的斜線算子允許推演中的交換性(即適用于NLP的規(guī)則);帶下標(biāo)■的斜線算子適用于所有的范疇推演規(guī)則(即適用于LP系統(tǒng)的規(guī)則)[1],見圖3:

      圖3 斜線模態(tài)下標(biāo)的作用

      提出斜線算子模態(tài)下標(biāo)的后果是給有關(guān)詞條指派帶下標(biāo)的函子范疇,詞條在生成中受到的限制通過各自不同下標(biāo)的斜線算子不同的適用范圍體現(xiàn)出來。如果不用模態(tài)下標(biāo),要避免某些不合語法的詞序(詞的線性排列),我們不得不把各種自然語言生成中受限制或被禁止的地方專門列出來,從而使組合規(guī)則因自然語言的不同而異。采用模態(tài)下標(biāo)的手段,組合規(guī)則就是普遍適用的,每一自然語言的語法適用同樣的規(guī)則集合,不同自然語言的差異表現(xiàn)在詞庫中,即有關(guān)詞條指派帶模態(tài)下標(biāo)的函子范疇,這是CCG的特色。

      四個模態(tài)下標(biāo)的關(guān)系類似四個蘭貝克演算的關(guān)系:處于頂端的*是最強(qiáng)的母類型,適用的組合規(guī)則范圍最窄;處于底端的 ■ 是最弱的子類型,適用的組合規(guī)則范圍最寬,見圖4。

      圖4 斜線模態(tài)下標(biāo)之間的關(guān)系

      帶下標(biāo)*的斜線算子適用的規(guī)則范圍最窄,只有少量的組合規(guī)則適用于帶下標(biāo)*的斜線算子,這包括范疇語法最基本的規(guī)則(>)和(<):

      因?yàn)椋瞧渌B(tài)下標(biāo)的最大母類型,(>)和(<)之類斜線/*涉及的規(guī)則適用于其他所有模態(tài)下標(biāo)的范疇。即對任α∈{*,◇,×,■},X/αY Y?X總能成立。

      以下組合規(guī)則對帶■的斜線算子范疇適用,但對*不成立:

      這些組合規(guī)則由于具有上述限制,我們就可以在詞庫中對英語連詞“and”指派帶*的斜線算子范疇,以剔除那些不符合英語語法的生成推演,從而指出某些英語詞條的排列不合語法性。在詞庫中只要有(4)這樣的指派,(5)那樣的推演就不能獲得結(jié)果,(<B)向后組合規(guī)則不適用于帶*的斜線算子范疇。這就從CCG的角度解釋了“sleeps and he talks”的不合語法性。

      推而廣之,指派給“and”的范疇表現(xiàn)為:(X★X)/★X,這種指派能夠滿足英語中正常表達(dá)式的范疇推演,如圖5:

      圖5 推演例

      最后,我們簡略介紹CCG基于范疇等級概念和從范疇構(gòu)造的視角建立的CCG證明論。CCG的英語片段思想和蒙太格語法略有不同,不同種類自然語言的區(qū)別在蒙太格語法那里通過句法規(guī)則體現(xiàn)出來,而CCG貫徹詞匯主義的思路把這些差異放到詞庫中去。CCG的證明論也不同于TLG的做法,而是從范疇構(gòu)造的獨(dú)特視角建立的范疇推演理論[2]。

      先介紹類型(范疇)等級(type hierarchy)的概念。類型的等級是序?qū)Α碩,?〉,滿足:

      1)T是類型的字母表。

      2)?是T上自返的反對稱的和傳遞的關(guān)系,稱作管轄關(guān)系,該系統(tǒng)是一個弱序。

      3)〈T,?〉有一個最小元素(處于等級頂端的),即存在一個類型管轄自身在內(nèi)的所有類型。

      4)〈T,?〉滿足:T的具有上限的每一子集都有一個最小上限?!碩,?〉中極大類型的集合中的元素是除自身外不管轄其他任何類型,換言之,極大類型是沒有(真)子類型的類型。

      我們給出類型等級的例子,如圖6:

      圖6 英語的范疇等級關(guān)系

      直線條表示管轄關(guān)系?。top是該類型等級中的最小類型,它管轄該等級中所有的類型。是該類型等級中的極大類型,它們只管轄自身。T在這里作為飽和(原子)范疇的集合A有top,S,Nom等17個成員。

      上述類型等級中只有飽和的原子范疇,這對刻畫自然語言的生成推演是不夠的。我們還需要大量的函子范疇,所以CCG就有函子范疇的構(gòu)造(category structure)、函子范疇的描述(category description)以及前者對應(yīng)后者的滿足等概念。

      前面談到,指派給詞條的范疇,尤其是函子范疇的構(gòu)造凝聚了有關(guān)的句法生成過程。

      對范疇構(gòu)造進(jìn)行形式化定義就構(gòu)成了CCG證明論的語義基礎(chǔ)?;陲柡?原子)范疇字母表A上的范疇構(gòu)造是一個六元組〈Q,Res,Arg,Vs,VM,VA〉,其中:1)Q是點(diǎn)的集合;2)Res和Arg分別是Q上的結(jié)果關(guān)系和論元關(guān)系;3)Vs和VM對每一非終結(jié)點(diǎn)分別指派斜線和斜線的模態(tài)下標(biāo); 4)VA對每一終結(jié)點(diǎn)指派A中的一個飽和范疇。例如,基于字母表{S,NP}的函子范疇(S×(NP)/*(NP◇S)的構(gòu)造樹為(見圖7):

      圖7 范疇構(gòu)造樹

      范疇構(gòu)造是語義概念,相關(guān)的句法概念是范疇描述。范疇描述的集合是這樣一個最小的集合,滿足:

      1)每一飽和范疇符號自身是范疇描述,即A?Φ;

      2)對所有φ,ψ∈Φ,所有μ∈{*,◇,×,■},φ/μψ∈Φ;

      3)對所有φ,ψ∈Φ,所有μ∈{*,◇,×,■},φ/μψ∈Φ;

      4)對所有φ,ψ∈Φ,所有μ∈{*,◇,×,■},φ/μψ∈Φ。①這里出現(xiàn)的豎線雙方向算子在通常文獻(xiàn)中不常見,參見參考文獻(xiàn)[2]。

      然后,令基于類型等級〈A,?〉的范疇構(gòu)造S=〈Q,Res,Arg,Vs,VM,VA〉,q∈Q。S與q局部滿足A上的范疇描述φ,即S,q╞φ當(dāng)且僅當(dāng)

      1)φ∈A:存在某個滿足 φ?α的 α使得VA(q)=α

      2)φ=(ψ1δμψ2),δ∈{/,},μ∈{*,◇,×},Vs(q)=δ,VM(q)=μ,S,Res(q)╞ψ1并且S,Arg(q)╞ψ2

      3)φ=(ψ1|μψ2),μ∈{*,◇,×},VM(q)=μ,S,Res(q)╞ψ1并且S,Arg(q)╞ψ2

      4)φ=(ψ1δ■μψ2),δ∈{/,},Vs(q)=δ,S,Res(q)╞ψ1并且S,Arg(q)╞ψ2

      5)φ=(ψ1|■ψ2),S,Res(q)╞ψ1,S,Arg(q)╞ψ2

      基于上述英語范疇的等級,CCG給出英語片段,也叫英語部分語句系統(tǒng)的形式定義。令∑是英語詞條的集合,我們有∑基礎(chǔ)上的四元組〈A,?,S,L〉滿足:

      1)〈A,?〉是飽和范疇的等級。

      2)S是A中的特異元素。

      3)L是從∑中非空符號串到A上生成的范疇描述的映射,即英語詞庫。

      這樣的〈A,?,S,L〉就稱作CCG的英語片段。

      最后,CCG給出任意兩個范疇描述φ和ψ的?-相容概念,在英語片段基礎(chǔ)上定義各種有效推理模式的概念:把詞庫中對詞條的范疇指派定義成前提詞條結(jié)論為范疇的推理模式;范疇的提升、不同模態(tài)下標(biāo)的函子范疇的各種組合和置換規(guī)則自然就是CCG證明論中帶有各種不同限制條件的推理模式[2]。

      所以,組合范疇語法CCG比較類型邏輯語法TLG而言,能更加深入揭示自然語言的語言學(xué)特點(diǎn),全面服務(wù)于自然語言的計(jì)算機(jī)處理需求。其特征是:1)為刻畫自然語言詞類的豐富句法特征對原子范疇進(jìn)行加標(biāo)多樣化的設(shè)置;2)為描述自然語言句法生成的細(xì)微之處對斜線算子實(shí)行模態(tài)化分類,據(jù)此確立不同斜線算子范疇的多樣組合規(guī)則;(3)基于范疇等級和范疇構(gòu)造的思想構(gòu)造CCG的證明論系統(tǒng)。

      [1]Steedman M,Baldridge J.Combinatory Categorial Grammar[C]//Kirsti B?rjars.Non-transformational syntax:a guide to current models.[S.l.]:Blackwell,2005.

      [2]McConville,Mark.Type-h(huán)ierarchical CCG[M].Edinburgh:University of Edinburgh,2005.

      Combinatory Categorial Grammar CCG

      ZOU Chong-li1,2
      (1.School of Humanities and Law,Yanshan University,Qinghuangdao 066004,China; 2.Institute of Philosophy,Chinese Academy of Social Sciences,Beijing 100732,China)

      Combinatory Categorial Grammar(CCG)and Type Logical Grammar(TLG)are the modern version of the categorial grammar.The former approach is concerned with the application of the linguistics and the information processing of the natural language;and the later one tended to scrutinize the nature of the theory of categorial grammar from the perspective of logic.The features of CCG are: the various way of labeling the basic category and the complete lexicalism;the modalization to the index of the slash operator and the multiple combinations of functor categories;the proof to CCG which based on the class of category and the construction of category.

      CCG;TLG;combination of functor categories

      B81

      A

      1674-8425(2011)08-0001-05

      2011-06-06

      國家社科基金項(xiàng)目“面向自然語言信息處理的范疇類型邏輯研究”(09BZX046)研究成果。

      鄒崇理(1953—),男,四川成都人,研究員,博士生導(dǎo)師,研究方向:自然語言邏輯。

      (責(zé)任編輯 魏艷君)

      猜你喜歡
      指派詞庫斜線
      詞庫音系學(xué)的幾個理論問題芻議
      英語知識(2016年1期)2016-11-11 07:07:54
      零元素行擴(kuò)展路徑算法求解線性指派問題
      具有直覺模糊信息的任務(wù)指派問題研究
      環(huán)境變了,詞庫別變
      電腦迷(2014年14期)2014-04-29 00:44:03
      非線性流水線的MTO/MOS工人指派優(yōu)化決策研究
      瘋狂的游戲
      飛碟探索(2013年2期)2013-08-13 09:31:01
      瘋狂的游戲
      飛碟探索(2012年12期)2012-04-29 23:33:50
      瘋狂的游戲
      飛碟探索(2012年10期)2012-04-29 21:11:10
      QQ手機(jī)輸入法如何導(dǎo)入分類詞庫
      電腦迷(2012年15期)2012-04-29 17:09:47
      更正啟事
      海安县| 黑河市| 化隆| 望都县| 英山县| 临西县| 淅川县| 云林县| 辽阳市| 唐河县| 资溪县| 泽库县| 唐海县| 巴彦县| 云安县| 合水县| 和平区| 新巴尔虎左旗| 临沂市| 鄄城县| 恩施市| 深圳市| 宜章县| 象州县| 万盛区| 阳西县| 射洪县| 河源市| 新宁县| 上蔡县| 义马市| 南部县| 夏津县| 顺昌县| 曲沃县| 岑巩县| 宁津县| 西乌珠穆沁旗| 门头沟区| 松溪县| 冷水江市|