林 鴻 飛, 許 侃, 任 惠
(大連理工大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,遼寧 大連 116024)
分析一篇文章的情感色彩,需要對(duì)詞進(jìn)行著重分析,因?yàn)槲恼率怯删渥咏M成的,而句子是由詞組成的.在文本情感計(jì)算時(shí),常??梢园l(fā)現(xiàn)并不是每個(gè)句子當(dāng)中都含有情感詞,這時(shí)計(jì)算機(jī)很難準(zhǔn)確地給出這個(gè)句子的情感.然而情感是豐富而抽象的,往往通過隱喻給以形象的描述.因此,對(duì)這些隱喻進(jìn)行識(shí)別,并且將其解釋成普通的語言表達(dá)方式,有助于文本的情感計(jì)算.
例如:“這律師是狐貍?!?/p>
計(jì)算機(jī)很難從字面上直接給出這句話的真實(shí)情感.但是從隱喻的角度考慮,本體是“律師”,喻體是“狐貍”,話外之音是省略掉的喻底“狡猾”、“多疑”,這句話表達(dá)的真正意思是“律師像狐貍一樣狡猾.”因此,隱喻的識(shí)別和理解,對(duì)于情感計(jì)算有很大的幫助.
從20世紀(jì)60年代起,西方對(duì)隱喻的研究掀起了熱潮,隱喻研究者把隱喻從修辭學(xué)納入認(rèn)知語言學(xué)的范疇,人們認(rèn)識(shí)到隱喻既是一種語言現(xiàn)象,也是一種思維方式[1].而漢語的隱喻研究也逐漸被放在一個(gè)更加重要的位置,國(guó)內(nèi)語言學(xué)界對(duì)隱喻的研究給予了極大的熱情,主要集中于有關(guān)漢語隱喻修辭的語言學(xué)和心理學(xué)范疇的討論.而隱喻計(jì)算化方面的研究仍處于探索研究階段.國(guó)內(nèi)的相關(guān)學(xué)者進(jìn)行了一些隱喻計(jì)算模型的探討和試驗(yàn),俞士汶從自然語言理解角度提出了多個(gè)層面的隱喻理解問題[1],張威等在隱喻邏輯推理方面進(jìn)行了研究[2-4].
王治敏[5]使用機(jī)器學(xué)習(xí)的方法識(shí)別名詞短語隱喻,采用了基于實(shí)例、樸素貝葉斯、最大熵3種分類方法進(jìn)行比較,得出最大熵的分類效果最好.
賈玉祥等基于現(xiàn)有的詞典資源,對(duì)名詞性隱喻進(jìn)行識(shí)別[6],并利用隱喻知識(shí)庫進(jìn)行了隱喻理解方面的研究[7].
本文主要針對(duì)隱喻識(shí)別進(jìn)行初步探討,以便將其應(yīng)用到情感計(jì)算中.王治敏主要處理的是名詞短語隱喻,而本文考慮的隱喻中的本體和喻體不限于名詞短語;賈玉祥利用詞典資源識(shí)別名詞性隱喻,對(duì)于未登錄詞的處理會(huì)有限制,而本文通過依存句法分析可以彌補(bǔ)這一缺陷;利用隱喻知識(shí)庫處理會(huì)需要大量的知識(shí)庫建立工作,而本文的方法不需要用到隱喻知識(shí)庫.
隱喻的理解過程分為兩個(gè)步驟:隱喻的辨認(rèn)和隱喻意義的推斷[8],分別稱之為隱喻的識(shí)別和隱喻的理解,其中隱喻的理解是建立在正確的隱喻識(shí)別基礎(chǔ)之上的.因此,研究隱喻的識(shí)別對(duì)于隱喻的機(jī)器理解而言,是一項(xiàng)很有意義的基礎(chǔ)性工作,對(duì)于基于文本的情感計(jì)算具有十分重要的意義[9,10].
本體和喻體之間存在明顯差異是隱喻的一個(gè)重要特征,完全相同的事物是不能構(gòu)成隱喻的.本體和喻體不僅要有差異,也要相似,相似性也是隱喻的基本要素.而隱喻的理解就是找到本體到喻體的映射.由此可以得出影響漢語隱喻理解的四大要素:本體、喻體、相異點(diǎn)和相似點(diǎn)[2].從隱喻的表現(xiàn)形式、功能和效果、認(rèn)知特點(diǎn)等角度,可以把隱喻分為顯性隱喻(明喻)與隱性隱喻、根隱喻與派生隱喻、以相似性為基礎(chǔ)的隱喻和創(chuàng)造相似性的隱喻等[2].本文中只討論對(duì)顯性隱喻的識(shí)別.
對(duì)于隱喻的識(shí)別來說,由于漢語句子本身的復(fù)雜性,不宜展開來通篇識(shí)別,應(yīng)該從一個(gè)小范圍入手,本文選擇顯性隱喻這個(gè)類別作為切入點(diǎn).顯性隱喻的特征是隱喻的四要素都存在于句子之中,明確說明兩者是一種對(duì)比關(guān)系,漢語中的典型形式是“A像B”或“A像B一樣C”.如:
例1 “建筑像凝固的音樂。”
但是,并不是所有含有“像”字的句子都是隱喻句.如:
例2 “未經(jīng)書面授權(quán)禁止復(fù)制或建立鏡像?!崩? “一九四二年創(chuàng)作的浮雕《毛澤東像》是毛澤東的側(cè)面頭像?!?/p>
這兩個(gè)句子中的“像”都是名詞,句子并不是隱喻句.又如:
例4 “就像鄧小平同志指出的:統(tǒng)一戰(zhàn)線仍然是一個(gè)重要法寶?!?/p>
例5 “像標(biāo)志牌寫的那樣,要有志氣把三峽工程建好?!?/p>
例4、5兩個(gè)句子中含有動(dòng)詞“像”,但是句子本身也不是隱喻句.
這些隱喻句是隱喻當(dāng)中結(jié)構(gòu)比較簡(jiǎn)單的一類,但是即便是這樣,對(duì)它們的識(shí)別也不是那么容易的.在實(shí)驗(yàn)中,從隱喻本身的特點(diǎn)出發(fā),去考慮解決顯性隱喻的識(shí)別問題.從邏輯角度來看,隱喻中涉及的兩個(gè)主詞屬于兩個(gè)不同的類型,因而將它們用系詞(通常是be)聯(lián)結(jié)起來實(shí)際上構(gòu)成了一種邏輯錯(cuò)誤,或稱“范疇置錯(cuò)”.在顯性隱喻的識(shí)別過程中就是使用隱喻中本體詞匯和喻體詞匯的范疇矛盾性來解決識(shí)別問題.如:
例6 “她的手像冰一樣。”
例6中“手”是本體,“冰”是喻體.實(shí)際生活中,冰的溫度明顯低于手的溫度,“手”和“冰”并不屬于同一個(gè)詞匯范疇,因而判定該句為隱喻句.由人對(duì)“冰”的固定認(rèn)知可以推斷,這個(gè)句子的真正意義是:“她的手像冰一樣冷”.
詞性標(biāo)注是特征詞提取的基礎(chǔ).在詞性標(biāo)注階段,利用自動(dòng)分詞程序?qū)ξ谋局械木渥舆M(jìn)行分詞,然后逐詞進(jìn)行查找和分析.過程分為兩個(gè)步驟:提取標(biāo)志詞匯,然后提取標(biāo)志詞匯的相關(guān)詞匯.
在特征詞的提取過程中,每個(gè)句子的結(jié)構(gòu)被描述成一個(gè)三元組O∶={C,T,S}.
其中C中的元素被稱為標(biāo)志詞(character word),元素的選擇范圍為“像/v”和“像/n”.即在分詞完成的句子中,“像/v”和“像/n”需要作為標(biāo)志詞來提取.含有名詞“像”的句子,不屬于顯性隱喻的識(shí)別范疇.含有動(dòng)詞“像”的句子將會(huì)被進(jìn)一步處理.由于詞性標(biāo)注工具的不同,可能會(huì)產(chǎn)生不同的詞性分類體系,本文主要考慮“像/v”和“像/n”這兩類.
T、S中的元素分別被稱為本體詞(target word)和喻體詞(source word).以C為中心,按照臨近名詞規(guī)則來確定句子中的本體詞和喻體詞.在處理的過程中,根據(jù)句子的復(fù)雜程度,需要把整個(gè)句子按照“,”進(jìn)行斷句,如果在C的當(dāng)前分句中無法找到T或者S,那么就需要擴(kuò)大查找范圍,在其他分句中確定T或S.在本系統(tǒng)中,會(huì)指定C的下一小分句的第一個(gè)名詞為要查找的本體詞.如:
例7 “她/r的/u面龐/n笑/v得/u竟/d像/v一/m 朵/q盛開/v的/u鮮花/n”
可以得到“像/v”以及本體“面龐”和喻體“鮮花”.又如:
例8 “像/v無數(shù)/m 燃燒/v的/u蠟燭/n一樣/a,/wp所有/b老師/n都/d情愿/v燃燒/v自己/r,/wp照亮/v別人/r。/wp”
按照臨近名詞規(guī)則,只能找到喻體“蠟燭”,而對(duì)于本體“老師”臨近規(guī)則失效,這時(shí),擴(kuò)大詞的查找范圍,指定 “像/v”的下一小分句的第一個(gè)名詞為要查找的本體詞.從而,可以找到標(biāo)志詞“像/v”以及本體“老師”和喻體“蠟燭”.
在利用詞性標(biāo)注提取本體和喻體特征詞的同時(shí),需要利用依存句法分析來加強(qiáng)對(duì)喻體特征詞的進(jìn)一步提取.在本文中,利用的是哈爾濱工業(yè)大學(xué)的依存句法分析系統(tǒng)[11],其分析結(jié)果為特征詞的提取提供了有力的支持.
系統(tǒng)通過依存句法分析,把句子從一個(gè)線性序列重新組織成一個(gè)結(jié)構(gòu)化的依存分析樹,而句子中詞之間的依存關(guān)系是通過依存弧來反映的.依存句法分析的優(yōu)點(diǎn)是深入語言的內(nèi)部結(jié)構(gòu)而不再局限于表層的匹配.為了加強(qiáng)詞性標(biāo)注提取的準(zhǔn)確性,這里要利用依存句法分析進(jìn)行本體和喻體的進(jìn)一步確定,本文所用系統(tǒng)的無標(biāo)記依存弧句法分析準(zhǔn)確率為80%左右,對(duì)提高詞匯提取的正確性起到了一個(gè)很好的作用.
具體說來,“像”字在句子中一般充當(dāng)謂語和介詞,所以后面跟的一般都是動(dòng)賓詞和介賓詞.在依存句法分析系統(tǒng)中,動(dòng)賓關(guān)系和介賓關(guān)系的分析標(biāo)識(shí)分別為“VOB”和“POB”,而這些依存于“像”字的詞匯往往就是要查找的喻體詞匯.如:
例9 “優(yōu)秀/a大學(xué)生/n就/d像/v社會(huì)主義/n精神文明/n建設(shè)/v的/u種子/n。/wp”
依存句法分析結(jié)果如圖1所示.
本體為“大學(xué)生”,喻體為“種子”.如果利用詞性標(biāo)注來判斷喻體為“社會(huì)主義”,顯然是錯(cuò)誤的,但是根據(jù)依存句法分析,通過“像_種子/VOB”這一項(xiàng),可以得出“種子”是“像”的動(dòng)賓詞,因此可以得到喻體“種子”.
圖1 依存句法分析示例之一Fig.1 Example 1of interdependence parsing analysis
提取到本體和喻體特征詞以后,需要對(duì)兩個(gè)特征詞的范疇進(jìn)行判別并且計(jì)算詞的相似度.而知網(wǎng)中含有豐富的詞匯語義知識(shí),因此本文詞匯范疇判別和相似度的計(jì)算都是基于知網(wǎng)(HowNet Knowledge Database)進(jìn)行的.
知網(wǎng)是一個(gè)網(wǎng)狀結(jié)構(gòu)的知識(shí)系統(tǒng),主要反映概念以及概念的屬性之間的各種關(guān)系.知網(wǎng)的基礎(chǔ)文件是知識(shí)詞典,在知識(shí)詞典中,每一個(gè)詞的概念及其描述對(duì)應(yīng)一條記錄,而每一條記錄都主要包含詞語、詞語詞性、詞語例子以及概念定義這4項(xiàng)內(nèi)容[12].
看一個(gè)具體的例子:
在上例中,NO.是概念編號(hào),W_C是漢語詞語,G_C是漢語詞性,E_C是漢語例子,W_E是英語詞語,G_E是英語詞性,E_E是英語例子,DEF是概念定義[12].其中DEF是最重要的.可以認(rèn)為知網(wǎng)中的概念定義是這個(gè)詞所屬的一個(gè)類別.而這個(gè)類別,對(duì)處理隱喻,用來表示本體和喻體的范疇是很重要的.
根據(jù)知網(wǎng)知識(shí)詞典的語言描述,可以利用其中的概念定義來判別一個(gè)詞所屬的類別.如果提取的本體和喻體特征詞屬于同一個(gè)類別或者相近的類別,就可以判斷這個(gè)句子不是隱喻;反之,如果這兩個(gè)特征詞匯不屬于同一個(gè)類別,那么就構(gòu)成隱喻.
例10 “這些地區(qū)都應(yīng)像京郊災(zāi)區(qū)一樣,振
例11 “遠(yuǎn)處的她像一束飄動(dòng)的紅綢子?!?/p>
提取特征詞為“她”、“綢子”,這兩個(gè)詞匯在知網(wǎng)中的概念定義分別為“他”、“材料”,因此可以判斷它們不屬于同一個(gè)概念范疇,那么就構(gòu)成隱喻.
對(duì)于詞匯相近范疇的識(shí)別,需要支持向量機(jī)的學(xué)習(xí)來進(jìn)行.
如果兩個(gè)詞語相互替換而不改變替換文本的句法語義結(jié)構(gòu),那么這兩個(gè)詞是相似的.而它們的相似度在于改變替換文本句法語義結(jié)構(gòu)的程度,改變得越小,相似度越高,改變得越大,相似度越低.
計(jì)算兩個(gè)詞語的語義相似度,對(duì)于隱喻的識(shí)別有重要的意義,本體和喻體的相似度可以作為隱喻識(shí)別的一個(gè)重要特征.根據(jù)知網(wǎng)提供的詞匯義原以及知網(wǎng)本身的網(wǎng)狀結(jié)構(gòu),可以計(jì)算出詞之間的距離[13].
首先,應(yīng)該計(jì)算兩個(gè)詞之間相似度的大小.對(duì)于兩個(gè)漢語詞語W1和W2,如果W1有n個(gè)義項(xiàng)奮精神,精打細(xì)收,力爭(zhēng)抗災(zāi)奪豐收?!?/p>
提取特征詞為“地區(qū)”、“災(zāi)區(qū)”,這兩個(gè)詞匯在知網(wǎng)中的概念定義均為“地區(qū)”,因此可以判斷它們屬于同一個(gè)概念范疇,那么就不構(gòu)成隱喻.(概念):S11,S12,…,S1n,W2有m個(gè)義項(xiàng)(概念):S21,S22,…,S2m,W1和W2的語義相似度即是各個(gè)概念的相似度之最大值[12].即
這樣可以根據(jù)兩個(gè)概念之間的相似度來計(jì)算兩個(gè)詞之間的相似度.
然后,根據(jù)計(jì)算得到的相似度大小,設(shè)定一個(gè)閾值來界定兩個(gè)詞的范疇,從而判斷它們是不是屬于同一個(gè)類別.這樣,就可以把概念之間的相似度問題歸結(jié)成兩個(gè)詞之間的范疇問題,最終達(dá)到是否屬于一個(gè)類別判斷的目的.
在系統(tǒng)中,相似度的取值范圍規(guī)定在0~1.針對(duì)實(shí)驗(yàn)語料,在0~1定義一個(gè)閾值d,相似度大于d的詞被視為同一范疇,小于等于d的則被視為不同范疇,即構(gòu)成隱喻.閾值d的計(jì)算公式為
例12 “頭發(fā)白得像臘月里的雪?!?/p>
通過計(jì)算得到,本體詞“頭發(fā)”和喻體詞“雪”的相似度為0.1.根據(jù)閾值判斷,它們的相似度比較低,本體和喻體不屬于同一個(gè)范疇,因此構(gòu)成隱喻.
支持向量機(jī)根據(jù)特征空間的數(shù)據(jù)是否線性可分,分為線性支持向量機(jī)和非線性支持向量機(jī).非線性支持向量機(jī)的原理是把輸入向量從低維特征空間映射到高維特征空間,從而把非線性問題轉(zhuǎn)換成線性問題.而這種變換是通過核函數(shù)k(x,xi)來實(shí)現(xiàn)的[14].
本系統(tǒng)采用SVMlight 4.0版本軟件包[15,16]來實(shí)現(xiàn)分類器的訓(xùn)練和測(cè)試.
使用基于特征向量的機(jī)器學(xué)習(xí)方法進(jìn)行隱喻識(shí)別,最重要的過程就是特征向量的構(gòu)造.選取恰當(dāng)?shù)奶卣髂軌蜉^好地對(duì)實(shí)體進(jìn)行表述,有利于學(xué)習(xí)效果的提高.
隱喻的特征選取,需要針對(duì)其結(jié)構(gòu)特點(diǎn),依據(jù)詞匯范疇的原則來進(jìn)行.通過對(duì)訓(xùn)練語料進(jìn)行分析,把“像/v”,“像/n”,本體、喻體詞在知網(wǎng)中的概念定義,本體、喻體詞的相似度4個(gè)方面作為隱喻識(shí)別的特征.
“像/v”表示“像”在句子中以謂詞的成分出現(xiàn),它是判斷一個(gè)句子有可能是要處理的隱喻的一個(gè)基本特征;“像/n”是判斷一個(gè)句子為非隱喻句的一個(gè)重要而直接的特征,是區(qū)分隱喻和非隱喻的標(biāo)志.根據(jù)這個(gè)特征可以把語料中非隱喻的句子直接排除出去.
本體、喻體詞在知網(wǎng)中的概念定義是詞匯范疇詳細(xì)劃分的特征,根據(jù)這個(gè)特征可以給出詞在概念層次的范疇分類.運(yùn)用分詞和依存句法分析對(duì)句子進(jìn)行主成分分析,以“像”為中心,根據(jù)本體、喻體特征詞進(jìn)行提取.根據(jù)范疇分類,可以有效地判斷特征類別范疇相同的句子為非隱喻句.
本體、喻體詞的相似度為本體、喻體詞范疇二元?jiǎng)澐值奶卣?除了詞的概念層次范疇分類以外,對(duì)于類別范疇相似或相近的詞匯,需要采取相似度的計(jì)算來判斷本體、喻體詞的范疇.根據(jù)此特征可以進(jìn)一步地對(duì)詞的類別進(jìn)行劃分,并且可以通過調(diào)整相似度的閾值來進(jìn)行范疇的界定.
在實(shí)驗(yàn)過程中,把以上4個(gè)方面作為隱喻識(shí)別的特征加入特征向量中,進(jìn)行機(jī)器學(xué)習(xí)的訓(xùn)練和預(yù)測(cè).
本文中利用的語料來自于國(guó)家語委語料庫(http://219.238.40.213:8080/).在網(wǎng)站中,通過語料庫的檢索系統(tǒng)搜索出含有“像”字的句子4 590句,從中抽取前1 000句作為本次實(shí)驗(yàn)的語料,然后手工整理到數(shù)據(jù)庫中.因?yàn)闃?biāo)注的語料數(shù)量有限,很難覆蓋所有的詞,而且漢語的表達(dá)方式靈活多樣,因此在訓(xùn)練語料和測(cè)試語料劃分時(shí),其中938句作為訓(xùn)練語料,62句作為測(cè)試語料.實(shí)驗(yàn)的流程如圖2所示.
在實(shí)驗(yàn)過程中,首先把語料分成訓(xùn)練樣本和測(cè)試樣本.然后,在數(shù)據(jù)轉(zhuǎn)換模塊對(duì)語料進(jìn)行分詞、句法分析,并提取其中的本體和喻體信息,形成特征數(shù)據(jù),生成SVMlight所需要的訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù).其次,利用SVMlight對(duì)得到的數(shù)據(jù)進(jìn)行訓(xùn)練和分類,最后對(duì)SVMlight得到的結(jié)果進(jìn)行分析整理,得到最終的數(shù)據(jù).
根據(jù)以上流程,實(shí)現(xiàn)了一個(gè)基于知網(wǎng)的隱喻計(jì)算程序模塊.共設(shè)計(jì)了兩個(gè)對(duì)比實(shí)驗(yàn).
圖2 顯性隱喻識(shí)別的實(shí)驗(yàn)流程Fig.2 Experiment process of dominant metaphor indentification
實(shí)驗(yàn)1 僅僅利用詞性標(biāo)注來提取本體和喻體詞,并通過知網(wǎng)判斷詞的范疇.
實(shí)驗(yàn)2 利用詞性標(biāo)注和依存句法分析提取本體和喻體詞,通過知網(wǎng)以及相似度計(jì)算來判斷詞的范疇.
實(shí)驗(yàn)結(jié)果如表1所示.
表1 實(shí)驗(yàn)結(jié)果Tab.1 Experiment results
實(shí)驗(yàn)2同實(shí)驗(yàn)1相對(duì)比,加入了依存句法分析和相似度計(jì)算,結(jié)果有了一定的提高.但是兩個(gè)實(shí)驗(yàn)共同的問題是:準(zhǔn)確率相對(duì)不高,而召回率卻比較高,說明實(shí)驗(yàn)中的噪音比較大.
對(duì)實(shí)驗(yàn)流程進(jìn)行分析,發(fā)現(xiàn)特征詞提取不準(zhǔn)確是造成噪音比較大的一個(gè)主要原因.
在本體和喻體特征詞提取過程中,由于語料中句子比較復(fù)雜,詞的提取規(guī)則并不能適用于所有的句子.如:
例13 “城市夢(mèng)對(duì)于地處偏僻山區(qū)龍華的農(nóng)民來說,不再像天上的月亮可望不可即。”
人工對(duì)本句進(jìn)行詞信息提取,可以得到本體“城市夢(mèng)”和喻體“月亮”,但是如果通過機(jī)器提取,句子成分的復(fù)雜程度已經(jīng)超出了規(guī)則范圍.因此,語料的復(fù)雜程度是影響特征詞提取準(zhǔn)確與否的一個(gè)重要因素.
另一方面,依存句法分析在特征詞提取過程中確實(shí)起到了一定的作用,但對(duì)于語料中某些句子,并不能用依存句法分析來提取本體詞,而用來提取喻體詞的準(zhǔn)確率也不是很高.如:
例14 “我們決不能像無頭蒼蠅一樣亂撞亂飛。”
依存句法分析的結(jié)果如圖3所示.
通過例句可以看出,并不能得到本體“我們”和喻體“蒼蠅”,因此這也是造成特征詞提取不準(zhǔn)確的一個(gè)原因.
另外,由于語料有限,相對(duì)于知網(wǎng)來說,特征詞匯覆蓋面比較小,造成SVMlight特征向量矩陣比較稀疏,不能達(dá)到一個(gè)理想的學(xué)習(xí)效果,也是影響實(shí)驗(yàn)結(jié)果的一個(gè)重要因素.
由于受到目前句法分析工具準(zhǔn)確率的限制,本體和喻體的提取會(huì)影響最終實(shí)驗(yàn)結(jié)果的準(zhǔn)確率和召回率,由此可見加強(qiáng)對(duì)本體和喻體的提取是提高隱喻識(shí)別精度的一個(gè)重要因素.
圖3 依存句法分析示例之二Fig.3 Example 2of interdependence parsing analysis
本文提出了一種基于語義和詞匯相似度的漢語顯性隱喻識(shí)別方法.仔細(xì)分析實(shí)驗(yàn)結(jié)果可以發(fā)現(xiàn),當(dāng)前實(shí)驗(yàn)中,由于選擇的語料句子比較復(fù)雜,在特征詞抽取方面的準(zhǔn)確率還不是很高,造成詞匯范疇判斷和相似度計(jì)算得不到正確的結(jié)果.
在以后的研究中,除進(jìn)一步提高抽取準(zhǔn)確率外,可以考慮更多類型的隱喻,對(duì)多種類型隱喻的識(shí)別進(jìn)行研究.
[1] 俞士汶.語料庫與綜合型語言知識(shí)庫的建設(shè)[C]//中文信息處理若干重要問題.北京:科學(xué)出版社,2002.YU Shi-wen.Construction of corpus and comprehensive language knowledge-base [C]// Several Important Problems for Chinese Information Processing.Beijing:Science Press,2002.(in Chinese)
[2] 張 威,周昌樂.漢語隱喻理解的邏輯描述初探[J].中文信息學(xué)報(bào),2004,18(5):23-28.ZHANG Wei,ZHOU Chang-le.Study on logical description of Chinese metaphor comprehension[J].Journal of Chinese Information Processing,2004,18(5):23-28.(in Chinese)
[3] 楊 蕓,周昌樂,王雪梅,等.基于機(jī)器理解的漢語隱喻分類研究初步[J].中文信息學(xué)報(bào),2004,18(4):31-36.YANG Yun,ZHOU Chang-le,WANG Xue-mei,etal.Research into machine understanding-based classification of the metaphor of Chinese[J].Journal of Chinese Information Processing,2004,18(4):31-36.(in Chinese)
[4] 周昌樂.隱喻、類比邏輯與可能世界[J].外國(guó)語言文學(xué)研究,2004,4(2):17-22.ZHOU Chang-le. Metaphor,analogous logic and possible worlds [J].Research in Foreign Language and Literature,2004,4(2):17-22.(in Chinese)
[5] 王治敏.漢語名詞短語隱喻識(shí)別研究[D].北京:北京大學(xué),2006.WANG Zhi-min.Chinese noun phrase metaphor recognition[D].Beijing:Peking University,2006.(in Chinese)
[6] 賈玉祥,俞士汶.基于詞典的名詞性隱喻識(shí)別[J].中文信息學(xué)報(bào),2011,25(2):99-104.JIA Yu-xiang, YU Shi-wen. Nominal metaphor recognition based on lexicons[J].Journal of Chinese Information Processing,2011,25(2):99-104.(in Chinese)
[7] 賈玉祥,俞士汶.基于實(shí)例的隱喻理解與生成[J].計(jì)算機(jī)科學(xué),2009,36(3):138-141.JIA Yu-xiang,YU Shi-wen.Instance-based metaphor comprehension and generation[J].Computer Science,2009,36(3):138-141.(in Chinese)
[8] 束定芳.隱喻學(xué)研究[M].上海:上海外語教育出版社,2000.SHU Ding-fang.Studies in Metaphor[M].Shanghai:Shanghai Foreign Language Education Press,2000.(in Chinese)
[9] 陳建美,林鴻飛.中文情感常識(shí)知識(shí)庫的構(gòu)建[J].情報(bào)學(xué)報(bào),2009,28(4):492-498.CHEN Jian-mei,LIN Hong-fei.Constructing the affective commonsense knowledgebase[J].Journal of the China Society for Scientific and Technical Information,2009,28(4):492-498.(in Chinese)
[10] 徐琳宏,林鴻飛,趙 晶.情感語料庫的構(gòu)建和分析[J].中文信息學(xué)報(bào),2008,22(1):116-122.XU Lin-h(huán)ong, LIN Hong-fei, ZHAO Jing.Construction and analysis of emotional corpus[J].Journal of Chinese Information Processing,2008,22(1):116-122.(in Chinese)
[11] 劉 挺,車萬翔,李正華.語言技術(shù)平臺(tái)[J].中文信息學(xué)報(bào),2011,25(6):53-62.LIU Ting, CHE Wan-xiang, LI Zheng-h(huán)ua.Language technology platform [J]. Journal of Chinese Information Processing,2011,25(6):53-62.(in Chinese)
[12] 董振東,董 強(qiáng).知 網(wǎng) [DB/OL].http://www.keenage.com.DONG Zhen-dong,DONG Qiang.HowNet[DB/OL].http://www.keenage.com.(in Chinese)
[13] 劉 群,李素建.基于《知網(wǎng)》的詞匯語義相似度計(jì)算 [C]//第三屆漢語詞匯語義學(xué)研討會(huì).臺(tái)北:[s n],2002.LIU Qun,LI Su-jian. Word meaning similarity computation based on HowNet [C]// The 3th Chinese Lexical Semantics Workshop.Taipei:[s n],2002.(in Chinese)
[14] Cristianini N,Shawe-Taylor J.An Introduction to Support Vector Machines [M ]. Cambridge:Cambridge University Press,2000.
[15] Canny J. A computational approach to edge detection[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1986,8(6):679-698.
[16] Joachims T. Making large-scale SVM learning practical[M]//Sch lkopf B,Burges C,Smpla A.Advances in Kernel Methods—Support Vector Learning.Cambridge:MIT Press,1999.