鄭 新,李培峰,朱巧明
(1. 蘇州大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,江蘇 蘇州 215006; 2. 江蘇省計(jì)算機(jī)信息處理技術(shù)重點(diǎn)實(shí)驗(yàn)室,江蘇 蘇州 215006)
基于全局優(yōu)化的中文事件時序關(guān)系推理方法
鄭 新1,2,李培峰1,2,朱巧明1,2
(1. 蘇州大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,江蘇 蘇州 215006; 2. 江蘇省計(jì)算機(jī)信息處理技術(shù)重點(diǎn)實(shí)驗(yàn)室,江蘇 蘇州 215006)
近年來,越來越多的研究關(guān)注事件時序關(guān)系,但大多數(shù)工作集中于提高事件關(guān)系分類器的性能,忽略了分類器錯誤所造成的事件關(guān)系間不一致的問題。該文利用了一個全局優(yōu)化的推理模型來解決這一問題,將事件時序關(guān)系全局優(yōu)化看成整數(shù)線性規(guī)劃問題,使用了自反性、傳遞性、同指性、時序連接詞、事件類型對等多個約束條件。實(shí)驗(yàn)結(jié)果表明,該文的全局推理方法與分類器相比,F(xiàn)1值提高了3.56%。
事件;時序關(guān)系;推理
事件時序關(guān)系識別是篇章理解研究的重要組成部分,廣泛應(yīng)用于信息抽取、文本摘要等多個自然語言處理應(yīng)用領(lǐng)域。例如,在系列化的新聞報道中,了解各個事件之間發(fā)生的時序關(guān)系,可以更好地對文章內(nèi)容進(jìn)行歸納總結(jié),方便人們快速獲取有效信息;在文景轉(zhuǎn)換系統(tǒng)中,需要知道文中事件發(fā)生的先后順序,以此來排列動畫場景,保證整個故事情節(jié)的連續(xù)性。
隨著TimeBank等語料庫的出現(xiàn),機(jī)器學(xué)習(xí)方法逐漸應(yīng)用到這一研究任務(wù)。給定一個事件對,根據(jù)它們的特征集合訓(xùn)練出一個分類器來預(yù)測事件對的時序關(guān)系。這種方法由于它每次只考慮一個單一事件對的時序關(guān)系,卻忽略了同一文章中事件之間的聯(lián)系。這種局部性方法往往會存在以下的缺點(diǎn): 分類結(jié)果有時會違反時序關(guān)系集合中的邏輯約束條件。圖1中,(a)表示的是一個分類器識別的關(guān)系圖,其中事件e1發(fā)生在事件e2之前,事件e2發(fā)生在事件e3之前,而事件e1卻發(fā)生在事件e3之后——很明顯這是會產(chǎn)生一個時序邏輯關(guān)系矛盾。
為了消除分類器帶來的這種矛盾,Chambers[1]、Do[2]等人提出一個全局推理模型,即使用傳遞性約束條件(e1 before e2 + e2 before e3 → e1 before e3),來優(yōu)化事件對之間的關(guān)系,最終得到一個最優(yōu)的事件關(guān)系圖。然而,經(jīng)過傳遞性約束限制后,得到的并不一定是正確的事件關(guān)系圖,圖1中,(b)、(c)、(d)均可能是(a)經(jīng)過全局優(yōu)化后的結(jié)果,而正確的結(jié)果只能是其中一個。因此,只有保證其中兩個事件對關(guān)系的正確性,才能正確優(yōu)化第三個事件對的關(guān)系。
圖1 事件時序關(guān)系圖注: (a) 表示分類器識別的時序關(guān)系圖; (b)、(c)、(d)分別為全局優(yōu)化后的可能結(jié)果
本文的主要貢獻(xiàn)是: 為了保證傳遞性約束限制后結(jié)果的正確性,本文在Do[2]的基礎(chǔ)上進(jìn)一步提出了同指關(guān)系、時序連接詞及事件類型對等多個約束條件。這些約束條件的加入,使得全局推理模型的實(shí)驗(yàn)性能有了顯著提高。
本文組織結(jié)構(gòu)如下: 第二節(jié)介紹相關(guān)工作;第三節(jié)講述本文實(shí)驗(yàn)的基準(zhǔn)系統(tǒng);第四節(jié)提出了一種全局優(yōu)化的推理方法來提高事件時序關(guān)系識別;第五節(jié)是實(shí)驗(yàn)結(jié)果與分析;最后是對本文工作的總結(jié)及下一步工作展望。
目前,事件時序關(guān)系的研究絕大多數(shù)針對英文。早期研究采用基于規(guī)則方法,隨著TimeML(Time Markup Language)標(biāo)注體系的發(fā)展以及TimeBank[3]語料庫的出現(xiàn),統(tǒng)計(jì)機(jī)器學(xué)習(xí)方法開始廣泛應(yīng)用于事件時序關(guān)系識別方面。
Mani[4]等在TimeML語料庫和Opinion語料庫的基礎(chǔ)上,提出了事件屬性特征(稱為“完美特征”): 事件類別、體態(tài)、形態(tài)、極性、時態(tài)等。Chambers[5]在Mani的基礎(chǔ)上,進(jìn)一步拓展了特征空間,引入了詞法、句法等特征,使得分類器的結(jié)果有了很大的提高。D’Souza[6]等較全面地總結(jié)了事件時序關(guān)系識別的相關(guān)特征,并進(jìn)一步提出了有關(guān)篇章級別的特征,使系統(tǒng)性能有了一定的提高。Ng[7]等借助修辭結(jié)構(gòu)理論、篇章關(guān)系及話題文本分割等篇章結(jié)構(gòu)方面的技術(shù)在很大程度上提高了事件時序關(guān)系識別的性能。
中文時序關(guān)系的研究相對較少,絕大多數(shù)的研究集中在事件與時間之間的關(guān)系。王昀[8]提出了一個基于轉(zhuǎn)換的時間-事件映射關(guān)系的方法。林靜[9]介紹了漢語文本中時間關(guān)系的抽取方法,并分別從時間與時間、時間與事件和事件與事件三個方面研究了時間關(guān)系的抽取與計(jì)算。事件映射關(guān)系的方法,并取得了較高的實(shí)驗(yàn)性能。仲兆滿[10]提出了一種事件關(guān)系表示模型,并做了一個簡單的事件關(guān)系推理實(shí)驗(yàn)。Cheng[11-12]借鑒TimeML的標(biāo)注準(zhǔn)則,構(gòu)建了一個中文事件時序關(guān)系的語料庫,并通過事件的類型來識別中文事件時序關(guān)系。譚紅葉[13]總結(jié)了當(dāng)前時間關(guān)系識別研究進(jìn)展,并探討了研究中存在的問題和未來研究的重點(diǎn)。王風(fēng)娥[14]采用最大熵分類器識別句子內(nèi)的事件時序關(guān)系,實(shí)驗(yàn)中使用了一些有助于提高同句內(nèi)事件時序關(guān)系的語言特征。
近幾年運(yùn)用全局推理方法來提高事件時序關(guān)系識別的研究工作已有很多。Chambers[1]與Do[2]的做法類似,都是在有監(jiān)督機(jī)器學(xué)習(xí)方法的基礎(chǔ)上,運(yùn)用了整數(shù)線性規(guī)劃方法來提高實(shí)驗(yàn)性能。而Yoshikawa[15]使用的則是馬爾可夫推理模型來提高機(jī)器學(xué)習(xí)的方法。Denis[16]通過用區(qū)間端點(diǎn)表示事件和時間的方法來控制Chambers[1]等人的聯(lián)合推理方法的復(fù)雜性,并提出了一個圖的分解方法來簡化圖的優(yōu)化問題。然而,Chambers[1]、Do[2]等人的全局優(yōu)化方法所使用的約束條件較為單一,僅包含反轉(zhuǎn)性、傳遞性等規(guī)則。
絕大多數(shù)研究使用的是TimeBank語料庫,也有少數(shù)人使用的是ACE語料庫*http://www.ldc.upenn.edu/Projects/ACE/docs/Chinese-Events-Guidelines_v5.5.1.pdf(如Do[2]、Ng[7]等),而這兩種語料庫的標(biāo)注規(guī)則卻大有不同。ACE語料庫中標(biāo)注的事件是一個具體發(fā)生的事情,往往是一個短語或一句話,并用觸發(fā)詞來表示該事件,而TimeBank語料庫則是將大部分動詞、動名詞都標(biāo)注為事件。因此,ACE語料庫適用于信息抽取、問答系統(tǒng)等領(lǐng)域,TimeBank語料庫則更適用于文景轉(zhuǎn)換系統(tǒng)等研究。
此外,由于TimeBank語料庫中只標(biāo)注了同句及鄰句中部分事件之間的關(guān)系,Chambers[17]對TimeBank語料庫中部分語料重新標(biāo)注了同句及鄰句中所有事件之間可能的時序關(guān)系,構(gòu)建了一個稠密的事件時序關(guān)系語料庫。與之類似,Do[2]使用的也是一個稠密的事件時序關(guān)系語料庫。本文所采用的實(shí)驗(yàn)語料庫則是標(biāo)注了同一篇文章中任意兩個事件之間的時序關(guān)系。
本文的基準(zhǔn)系統(tǒng)采用有監(jiān)督的機(jī)器學(xué)習(xí)方法構(gòu)造一個事件時序關(guān)系分類器,即給定一個事件對,構(gòu)造一個分類器能夠預(yù)測它們之間屬于哪一種時序關(guān)系。具體表示如式(1)。
(1)
其中,ei,ej分別表示第i個和第j個事件。
為了訓(xùn)練這樣的分類器,本文定義了一個特征空間,包括詞法特征、句法特征、語義特征等,如表1所示。這些特征一部分是英文時序關(guān)系識別用到的特征[2,4-5],另一部分是根據(jù)中文語言特征總結(jié)的一些有用的特征(用*標(biāo)記)。
表1 時序關(guān)系識別特征集合
續(xù)表
注: 表中(4)、(2)、(1)等表示對應(yīng)的特征數(shù)目。
由于分類器獨(dú)立地對每一對事件關(guān)系進(jìn)行分類,忽略了事件對之間的聯(lián)系,因而有可能會產(chǎn)生事件關(guān)系對之間的邏輯性矛盾;而已有的全局優(yōu)化方法僅使用了自反性和傳遞性約束條件,并不能保證優(yōu)化后結(jié)果的正確性,如圖1所示。因此,本文在全局優(yōu)化策略的基礎(chǔ)上,提出多個有效地約束條件,進(jìn)一步提升事件時序關(guān)系識別性能。
本文提出的全局推理模型分為兩步: 1)訓(xùn)練一個時序關(guān)系分類器(見第三節(jié));2)利用分類器的預(yù)測概率以及約束條件,轉(zhuǎn)化成最優(yōu)化問題,最終得到一個全局最優(yōu)的結(jié)果。本文使用整數(shù)線性規(guī)劃(Integer Linear Programming)法來解決這一問題。
4.1 目標(biāo)函數(shù)
目標(biāo)函數(shù)被定義為事件時序關(guān)系分類器預(yù)測概率的對數(shù)之和,如式(2)所示。
(2)
其中,x(eiej,r)是一個二元變量,取值為1時,表示ei與ej之間的關(guān)系為r;p(eiej,r)表示分類器CE-E預(yù)測ei與ej之間的關(guān)系為r的概率;ε={e1,e2,…,en}表示同一篇文章中所有事件的集合;εε={(ei,ej)∈ε×ε|ei∈ε,ej∈ε,i≠j}表示同一篇文章中的事件對集合;R={before,after,overlap,unknown}表示時序關(guān)系集合。
本文的目標(biāo)函數(shù)是概率p的對數(shù)之和,而不是直接求概率p之和,因?yàn)槿?shù)后,變量x的權(quán)重更離散化(p的取值為[0,1], 而logp取值為[-,0]),從而更有利于區(qū)分事件對之間屬于哪一種時序關(guān)系。
4.2 基本約束條件
1) 唯一性
式(3)保證x(eiej,r)是一個二元變量,它的取值只能是0或1。式(4)是為了確保ei與ej之間只存在一種時序關(guān)系,即其中一種關(guān)系取值為1,其余均為0。
例如,relation(ei,ej)只能是{before,after,overlap,unknown}四種關(guān)系中的一種。
2) 自反性
如果已知relation1(ei,ej),那么很容易就知道relation2(ej,ei)。例如,若e1beforee2,則必有e2aftere1。具體可表示為式(5)。
(5)
3) 傳遞性
由(Bramsen[18],Chambers[1],Do[2])等人的工作可知,事件時序關(guān)系之間存在傳遞閉包的性質(zhì)。如果已知relation1(ei,ej)且relation2(ej,ek),那么可以推出relation3(ei,ek)。即relation1(ei,ej)+relation2(ej,ek)?relation3(ei,ek)。如式(6)所示。
(6)
其中(r1,r2,r3)∈{(b,b,b),(a,a,a)}。
例如,before(ei,ej)+before(ej,ek)?before(ei,ek)。
4.3 擴(kuò)展約束條件
1) 同指性
① 若ei與ej互為同指關(guān)系,則必有overlap(ei,ej)。
② 若已知ei與ej互為同指關(guān)系且relation1(ei,ek),則有relation1(ej,ek)。
以上兩條性質(zhì)可表示為式(7)和式(8)。
例如,已知e1beforee2且e3為e1的同指事件,則必有e3beforee2。
2) 時序連接詞
如果兩個相鄰事件之間存在特定的時序連接詞,那么就可以根據(jù)該連接詞確定它們之間的時序關(guān)系。例如,ei與ej之間存在時序連接詞“之后”,那么就有eibeforeej。
若某時序連接詞在訓(xùn)練集中出現(xiàn)三次以上,則加入到時序連接詞詞表中;然后,使用開發(fā)集篩選詞表中的時序連接詞;最終得到一個最優(yōu)的時序連接詞詞表,部分時序連接詞見表2。
公式化為式(9)所示。
(9)
其中,conj為時序連接詞,Conj_List為時序連接詞詞表,r1為conj對應(yīng)的時序關(guān)系。
例如,一些巴勒斯坦人從清真寺出來后在老城獅子門處同以軍警發(fā)生了沖突。由于事件“出來”與“沖突”之間存在時序連接詞“后”,那么很容易判斷事件“出來”發(fā)生在事件“沖突”之前。
表2 部分時序連接詞詞表與事件類型對表
3) 事件類型對
一篇文章中通常圍繞某個話題來闡述,隨著話題的推演與發(fā)展,與之相關(guān)的事件也不斷發(fā)生與結(jié)束。某些特定類型的事件對之間往往具有特定的時序關(guān)系,例如,Arrest,逮捕→Trial-Hearing: 審理→Sentence: 判處。
若某事件類型對在訓(xùn)練集中出現(xiàn)五次以上且均被分為同一種關(guān)系,則加入到事件類型對列表中;然后,使用開發(fā)集篩選列表中的事件類型對,最終得到一個最優(yōu)的事件類型對列表(表2)。
公式化為式(10)所示。
(10)
其中,typei,typej分別為ei,ej的類型,r1為對應(yīng)的時序關(guān)系。
例如,法院今天公開開庭審理了一起殺人案。…… 據(jù)悉,法院擇日對此進(jìn)行宣判。司法類話題中不同類型的事件一般是按序進(jìn)行的,只有先審理才能進(jìn)行宣判,即事件“審理”通常發(fā)生在事件“宣判”之前。
本節(jié)中,首先介紹本文的實(shí)驗(yàn)設(shè)置及基準(zhǔn)系統(tǒng),然后給出詳細(xì)的實(shí)驗(yàn)結(jié)果與分析,最后討論與英文相關(guān)工作的異同。
5.1 實(shí)驗(yàn)設(shè)置與基準(zhǔn)系統(tǒng)
本文實(shí)驗(yàn)所用的語料共包含271篇新聞文本,其中103篇取自ACE 2005中文語料庫,其余168篇語料的原文選自Chinese TreeBank 6.0 和Chinese Gigaword語料庫,并遵循ACE 2005中文語料庫的標(biāo)注規(guī)則,進(jìn)行事件標(biāo)注。然后人工標(biāo)注了每篇文本中任意兩個事件之間的時序關(guān)系(本文將事件時序關(guān)系分為四種: before,after,overlap,unknown)。語料最終共標(biāo)注了2 291個事件,20 632對事件關(guān)系。
本文的實(shí)驗(yàn)語料由兩位標(biāo)注者完成,其中before、after和overlap三類標(biāo)注結(jié)果的Kappa值均達(dá)到0.7,由于unknown關(guān)系歧義性較大,Kappa值僅0.5。對于標(biāo)注不一致的事件關(guān)系對,邀請第三位標(biāo)注者共同商量決定最終的結(jié)果。
本文實(shí)驗(yàn)中隨機(jī)選取187篇語料作訓(xùn)練集,30篇作開發(fā)集,54篇作測試集,采用常用的準(zhǔn)確率(Precision)、召回率(Recall)及F1值作為評價準(zhǔn)則?;鶞?zhǔn)系統(tǒng)中使用最大熵分類器;在推理階段,使用Gurobi Optimizer構(gòu)建全局推理模型。
本文將第三節(jié)中提到的有監(jiān)督機(jī)器學(xué)習(xí)方法作為實(shí)驗(yàn)的一個基準(zhǔn)系統(tǒng)。此外,為了與全局推理方法對比,本文實(shí)現(xiàn)了一個強(qiáng)規(guī)則推理方法。即利用第四節(jié)中的約束規(guī)則來修正違反約束規(guī)則的時序關(guān)系。具體操作為: 首先,將測試集分為可信集與不可信集兩部分,即設(shè)定一個閥值K*本文實(shí)驗(yàn)中,經(jīng)開發(fā)集調(diào)參后,K取0.9,若事件對(ei,ej)的預(yù)測概率大于K時,則被分到可信集中,否則被分到不可信集中;然后,把可信集中的事件對關(guān)系當(dāng)作已知條件,根據(jù)約束條件,推出不可信集中的事件對關(guān)系。
5.2 實(shí)驗(yàn)結(jié)果與分析
實(shí)驗(yàn)結(jié)果如表3所示,其中,“Do”是在本文數(shù)據(jù)集上重現(xiàn)Do[2]原文中的方法。不過,Do[2]還將事件與時間表達(dá)式關(guān)系的識別結(jié)果作為一個約束條件,本文未涉及此研究內(nèi)容,故表3中Do與本文方法的實(shí)驗(yàn)結(jié)果均未使用此約束條件。
表3 各方法實(shí)驗(yàn)性能比較
首先,比較本文的全局推理方法與基準(zhǔn)系統(tǒng)的實(shí)驗(yàn)結(jié)果,可以看出,本文的全局推理方法的F1值比基準(zhǔn)系統(tǒng)高了3.56%。這表明使用全局約束條件的全局優(yōu)化模型處理事件時序關(guān)系識別問題的有效性。本文采用McNemar檢驗(yàn)法對實(shí)驗(yàn)結(jié)果進(jìn)行顯著性檢驗(yàn),求得P值<0.000 1,因此,本文方法較基準(zhǔn)系統(tǒng)有顯著性提升。
然后,比較本文全局推理方法與強(qiáng)規(guī)則推理方法的實(shí)驗(yàn)結(jié)果發(fā)現(xiàn),基于全局優(yōu)化推理方法要明顯優(yōu)于強(qiáng)規(guī)則的局部推理方法,而強(qiáng)規(guī)則推理方法較基準(zhǔn)系統(tǒng)其F1值僅提高了0.91%。經(jīng)分析實(shí)驗(yàn)數(shù)據(jù)發(fā)現(xiàn),強(qiáng)規(guī)則推理方法根據(jù)預(yù)測概率劃分可信集與不可信集,而可信集中仍然含有大量的錯誤樣例。當(dāng)把錯誤樣例作為已知條件進(jìn)行推理時,這不僅不能夠正確推出不可信集中樣例的結(jié)果,甚至?xí)⒃痉诸惼鞣诸愓_的樣例推理成錯誤的。因而,強(qiáng)規(guī)則推理方法的性能提升相對較小。
整數(shù)線性規(guī)劃是一種尋找一組最優(yōu)解使目標(biāo)函數(shù)最大化且滿足一系列限制約束條件的數(shù)學(xué)推理方法。全局優(yōu)化推理方法綜合考慮了各事件關(guān)系對之間的聯(lián)系,而不是將每個事件對單獨(dú)來處理。加入有效地約束條件后,在保證了部分事件關(guān)系對正確的情況下,盡可能的修正錯誤的事件關(guān)系對,使得最終的結(jié)果達(dá)到最優(yōu),因此,性能提升較大。
最后,比較本文方法與Do方法的實(shí)驗(yàn)性能。本文方法是在Do的基礎(chǔ)之上,加入了同指關(guān)系、時序連接詞及事件類型對多個約束條件,F(xiàn)1值比Do高了1.96%。這表明,本文提出的幾個約束條件非常有效。
另外,約束條件的不同對全局推理模型的性能有著很大的影響,表4給出了不同約束條件之間對ILP的貢獻(xiàn)度。
表4中,貢獻(xiàn)度最大的是傳遞性約束條件,其次是同指關(guān)系約束條件,因?yàn)檫@二者是多個事件對之間的約束條件,充分利用了事件對之間的聯(lián)系,而“連接詞”、“事件類型對”則是針對單個事件對的約束條件。然而,“自反性”約束條件的貢獻(xiàn)度為0,經(jīng)分析分類器的實(shí)驗(yàn)結(jié)果發(fā)現(xiàn),互為逆反關(guān)系的兩個事件對要么都被正確分類,要么都被分到同一個錯誤類別中去,因此“自反性”并沒有對實(shí)驗(yàn)性能產(chǎn)生影響。
表4 各約束條件對實(shí)驗(yàn)性能的貢獻(xiàn)度
此外,“傳遞性”+“時序連接詞”的貢獻(xiàn)度要大于它們各自貢獻(xiàn)度之和(2.89>1.60+0.53),因?yàn)椤皶r序連接詞”的加入提升了“傳遞性”中部分事件關(guān)系對的正確率,從而保證了其余事件關(guān)系對能夠被正確約束。而“傳遞性”+“事件類型對”的貢獻(xiàn)度卻小于它們各自貢獻(xiàn)度之和(2.15<1.60+0.70),主要原因在于特定類型的事件對之間的關(guān)系不如含有時序連接詞的事件對關(guān)系明確,例如,一個攻擊類事件發(fā)生后造成受傷類事件,可能之后又發(fā)生了攻擊類事件,再如審理之后對被告判決,可能由于被告不服,會再次審理。
本文所用約束條件中,“自反性”、“傳遞性”和“同指性”為強(qiáng)規(guī)則約束條件,理論上是完全正確的;而“時序連接詞”和“事件類型對”僅僅是在絕大多數(shù)情況下成立的,并不能保證完全正確,例如,“近幾起沖突共造成10人死亡”中,雖有時序標(biāo)志詞“造成”,但事件“沖突”的發(fā)生時間是一個時間段,所以“沖突”與“死亡”是overlap關(guān)系。若“時序連接詞”和“事件類型對”與強(qiáng)規(guī)則約束條件發(fā)生沖突時,則以強(qiáng)規(guī)則約束條件為準(zhǔn);若“時序連接詞”與“事件類型對”發(fā)生沖突時,以“時序連接詞”為準(zhǔn),因?yàn)椤皶r序連接詞”的正確率相對較高。
5.3 討論
本文實(shí)驗(yàn)所采用的時序關(guān)系分類方法與文獻(xiàn)[2]中類似,實(shí)驗(yàn)語料均為ACE新聞?wù)Z料,并且都使用全局推理方法,但是,本文實(shí)驗(yàn)改進(jìn)了目標(biāo)函數(shù),并引入了更多更有效地約束條件。
兩次實(shí)驗(yàn)均表明,全局推理方法能有效提高事件時序關(guān)系識別性能。文獻(xiàn)[2]中,實(shí)驗(yàn)結(jié)果表明,在僅使用自反性、傳遞性等少量約束條件時,全局推理方法較機(jī)器學(xué)習(xí)方法就有很大的提升。而本文實(shí)驗(yàn)在僅使用文獻(xiàn)[2]中的約束條件時,提升的結(jié)果并不是很高。其原因主要有: 一、本文中的機(jī)器學(xué)習(xí)分類方法實(shí)驗(yàn)性能要遠(yuǎn)高于文獻(xiàn)[2]的實(shí)驗(yàn)性能(F1值高了將近15%);二、文獻(xiàn)[2]所用語料較為稀疏,僅僅20篇文檔, 324個事件,實(shí)驗(yàn)結(jié)果偶然性較大,而本文實(shí)驗(yàn)語料包含271篇文檔,2 291個事件。
此外,本文提出了幾個約束條件使實(shí)驗(yàn)性能有很大的提高,這幾個約束條件的加入,保證了傳遞閉包性質(zhì)的有效性。因此,有效地約束條件能更好地提升全局推理模型的性能。
本文提出了一個全局推理方法來進(jìn)一步提升中文事件時序關(guān)系識別的性能。特別是在構(gòu)建全局推理模型時,提出了同指關(guān)系、時序連接詞及事件類型對多個有效約束條件。實(shí)驗(yàn)結(jié)果表明,本文的全局推理方法在有監(jiān)督的機(jī)器學(xué)習(xí)方法的基礎(chǔ)上有了較大的提高,且本文提出的幾個約束條件起到了很大的作用。
在下一步研究工作中,一方面提高“時序連接詞”和“事件類型對”的正確率;另一方面引入更多的語義和篇章知識等信息加入到全局推理模型中,進(jìn)一步提高系統(tǒng)的性能。
[1] Nathanael Chambers, DanJurafsky. Jointly Combining Implicit Constraints Improves Temporal Ordering[C]//Proceedings of the Conference on EMNLP, 2008: 698-706.
[2] Quang Xuan Do, Wei Lu, Dan Roth. Joint Inference for Event Timeline Construction[C]//Proceedings of the 2012 Joint Conference on EMNLP, 2012: 677-687.
[3] James Pustejovsky, Patrick Hanks, Roser Sauri, et al. The TimeBank Corpus[C]//Proceedings of the Corpus Linguistics, 2003: 647-656.
[4] Inderjeet Mani, Marc Verhagen, Ben Wellner, et al. Machine Learning of Temporal Relations [C]//Proceedings of the 21st International Conference on Computational Linguistics and the 44th annual meeting of the Association for Computational Linguistics, 2006: 753-760.
[5] Nathanael Chambers, Shan Wang, DanJurafsky. Classifying Temporal Relations between Events [C]//Proceedings of the 45th Annual Meeting of the ACL on Interactive Poster and Demonstration Sessions, 2007: 173: 176.
[6] Jennifer D’Souza, Vincent Ng. Classifying Temporal Relations with Rich Linguistic Knowledge[C]//Proceedings of NAACL-HLT, 2013: 918-927.
[7] Jun-Ping Ng, Min-YenKan, Ziheng Lin, et al. Exploiting Discourse Analysis for Article-Wide Temporal Classification[C]//Proceedings of EMNLP, 2013: 12-23.
[8] 王昀, 苑春法. 基于轉(zhuǎn)換的時間-事件關(guān)系映射[J]. 中文信息學(xué)報, 2004, 18(4): 23-30.
[9] 林靜, 苑春法. 漢語時間關(guān)系抽取與計(jì)算[J]. 中文信息學(xué)報, 2009, 23(5): 62-67.
[10] 仲兆滿, 劉宗田, 周文, 付劍鋒. 事件關(guān)系表示模型[J]. 中文信息學(xué)報, 2009, 23(6): 56-60.
[11] Y C Cheng, M Asahara, Y Matsumoto. Constructing a Temporal Relation Tagged Corpus of Chinese based on Dependency Structure Analysis[C]//Proceedings of Temporal Representation and Reasoning, In 14th International Symposium on Temporal Representation and Reasoning, 2007: 59-69.
[12] Y C Cheng, M Asahara, Y Matsumoto. Use of Event Types for Temporal Relation Identification in Chinese Text[C]//Proceedings of IJCNLP, 2008: 31-38.
[13] 譚紅葉, 鄭家恒, 梁吉業(yè). 時間關(guān)系識別研究進(jìn)展[J]. 中文信息學(xué)報, 2011,, 25(5): 44-52.
[14] 王風(fēng)娥, 譚紅葉, 錢揖麗. 基于最大熵的句內(nèi)時間關(guān)系識別[J]. 計(jì)算機(jī)工程, 2012, 38(4): 37-39.
[15] Katsumasa Yoshikawa, Sebastian Riedel. Jointly Identifying Temporal Relations with Markov Logic[C]//Proceedings of the 47th Annual Meeting of the ACL and the 4th IJCNLP of the AFNLP, 2009: 405-413.
[16] Pascal Denisand Philippe Muller. Predicting globally-coherent temporal structures from texts via endpoint inference and graph decomposition[C]//Proceedings of the Conference on IJCAI, 2011: 1788-1793.
[17] Nathanael Chambers, Taylor Cassidy, Bill McDowell, et al. Dense Event Ordering with a Multi-Pass Architecture[C]//Proceedings of the Transactions of the Association for Computational Linguistics, 2014: 273-284.
[18] PhilipBramsen, Pawan Deshpande, Yoong Keok Lee, et al. Inducing Temporal Graphs[C]//Proceedings of the 2006 Conference on EMNLP, 2006: 198-198.
Global Inference for Temporal Relations Between Chinese Events
ZHENG Xin1,2, LI Peifeng1,2, ZHU Qiaoming1,2
(1. School of Computer Science and Technology, Soochow University, Suzhou,Jiangsu 215006,China; 2. Key Lab of Computer Information Processing Technology of Jiangsu Province, Suzhou, Jiangsu 215006, China)
In recently years, more and more studies are devoted to temporal relations between events, with a focuse on improving pairwise classifiers, ignoring the obvious inconsistent problems in the global space of events when misclassifications occur. In this paper, we use a global inference model to resolve such problem bytreating temporal relations recognition as Integer Linear Program. We use many constraints, such as reflexivity, transitivity, event coreference, temporal conjunctions, pairs of event types, etc. The experimental results show that the global inference model outperformed the local classifiers by 3.56% in F1.
event; temporal relation; inference
鄭新(1990—),碩士研究生,主要研究領(lǐng)域?yàn)樽匀徽Z言處理,中文信息處理。E?mail:358581959@qq.com李培峰(1971—),博士,教授,主要研究領(lǐng)域?yàn)樽匀徽Z言處理,中文信息處理,Web信息處理和嵌入式系統(tǒng)。E?mail:pfli@suda.edu.cn朱巧明(1963—),博士,博士生導(dǎo)師,主要研究領(lǐng)域?yàn)樽匀徽Z言處理,中文信息處理,Web信息處理和嵌入式系統(tǒng)。E?mail:qmzhu@suda.edu.cn
1003-0077(2016)05-0129-07
2014-02-29 定稿日期: 2015-03-30
國家自然科學(xué)基金(61472265);國家自然科學(xué)基金(61331011);江蘇省前瞻性聯(lián)合研究項(xiàng)目(BY2014059-08)
TP391
A