李洪波 于建平
摘要:該文以形式觀念分析理論為支撐,以屬性結(jié)構(gòu)偏序圖為工具,探討英語(yǔ)情態(tài)動(dòng)詞語(yǔ)義排歧中的知識(shí)發(fā)現(xiàn),提出進(jìn)行英語(yǔ)情態(tài)動(dòng)詞的知識(shí)發(fā)現(xiàn)分的五個(gè)層次和五個(gè)視角。五個(gè)層次為:語(yǔ)言學(xué)準(zhǔn)備層,數(shù)據(jù)采集層,數(shù)據(jù)預(yù)處理層,形式概念分析層和知識(shí)發(fā)現(xiàn)層;五個(gè)視角為:語(yǔ)義模式識(shí)別,語(yǔ)義規(guī)則提取,特征選擇優(yōu)化,句法與語(yǔ)義互動(dòng)關(guān)系,屬性重要度分析。該文提出的情態(tài)動(dòng)詞語(yǔ)義排歧中知識(shí)發(fā)現(xiàn)框架,既可以其他復(fù)雜語(yǔ)義詞的知識(shí)發(fā)現(xiàn),也可以應(yīng)用到機(jī)器翻譯和其他自然語(yǔ)言處理領(lǐng)域。
關(guān)鍵詞:模式識(shí)別;規(guī)則提?。惶卣鬟x擇優(yōu)化;句法語(yǔ)義互動(dòng);屬性重要度分析
中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2019)12-0181-05
1前言
知識(shí)發(fā)現(xiàn)是指從數(shù)據(jù)集中提取有效的、新穎的、潛在有用的、可理解的模式的非平凡過(guò)程[1]。隨著大數(shù)據(jù)時(shí)代的來(lái)臨,知識(shí)發(fā)現(xiàn)引起了各領(lǐng)域、各學(xué)科的關(guān)注,如工業(yè)[2]、農(nóng)業(yè)[3]、生物醫(yī)學(xué)[4]、 網(wǎng)絡(luò)輿情[5]等等。從紛繁的數(shù)據(jù)中發(fā)現(xiàn)知識(shí),已成為是人工智能領(lǐng)域的重要工作之一[6]。作為一種有潛力的獲取新穎、有用、可理解知識(shí)的方法,知識(shí)發(fā)現(xiàn)也被應(yīng)用到語(yǔ)言學(xué)和自然語(yǔ)言處理領(lǐng)域 [7],知識(shí)發(fā)現(xiàn)是挖掘語(yǔ)言背后隱性知識(shí)的有效方法。
語(yǔ)義排歧一直是自然語(yǔ)言處理領(lǐng)域的熱點(diǎn)問(wèn)題,復(fù)雜語(yǔ)義詞 — 英語(yǔ)情態(tài)動(dòng)詞的語(yǔ)義排歧更是棘手問(wèn)題。近年來(lái),英語(yǔ)情態(tài)動(dòng)詞語(yǔ)義排歧領(lǐng)域有很多開(kāi)拓性的研究,于建平教授等分別研究了基于神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、樸素貝葉斯概率、模糊 c 均值聚類、自適應(yīng)神經(jīng)網(wǎng)絡(luò)模糊推理系統(tǒng)以及屬性偏序圖的英語(yǔ)情態(tài)動(dòng)詞的語(yǔ)義排歧[8-13],筆者也從不同視角對(duì)英語(yǔ)情態(tài)動(dòng)詞語(yǔ)義排歧進(jìn)行了知識(shí)發(fā)現(xiàn)研究[14-18]??v觀前期研究成果,研究或止于高精確語(yǔ)義排歧模型的建立,或局限于某個(gè)單獨(dú)視角研究語(yǔ)義排歧中的知識(shí)發(fā)現(xiàn),因此,本文在總結(jié)前期研究的基礎(chǔ)上,提出英語(yǔ)情態(tài)動(dòng)詞語(yǔ)義排歧中知識(shí)發(fā)現(xiàn)的基本框架,為以后情態(tài)動(dòng)詞的知識(shí)發(fā)現(xiàn)研究提供借鑒。
2理論背景
形式概念分析主要用于數(shù)據(jù)分析,發(fā)現(xiàn)對(duì)象及描述對(duì)象的一系列特征之間的內(nèi)在關(guān)系。形式概念分析中,數(shù)據(jù)被分解成概念的抽象表示單元,并對(duì)各單元做出有意義的解釋 [19]。形式概念分析能夠?qū)㈦[性、復(fù)雜的信息抽象為層級(jí)概念,該理論對(duì)信息提取、文本聚類和分類、自然語(yǔ)言處理等領(lǐng)域都有重大意義。如下是形式概念分析的基本概念:
定義 1. U 一個(gè)對(duì)象集合, U = {u1, u2,…, un },M 是一個(gè)屬性集合, M = {m1, m2,…, mn }, 而且 I ? U×M 是U和M之間的一個(gè)二元關(guān)系,( u, m )∈I 表示對(duì)象u 具有屬性m。那么, K= (U, M, I) 就叫作一個(gè)形式背景。.
定義 2. 如果 m ∈ M, g (m) = {u ∈ G | (u, m) ∈ I} 說(shuō)明這個(gè)對(duì)象集合享有屬性m。 如果u ∈ G, f (u) = {m ∈ M | (u, m) ∈ I} 說(shuō)明這個(gè)屬性集合享有對(duì)象u。
定義 3. m0, m1, m2, …, mk ∈ M。如果 g( mi ) ? g( m0 ),且i =1, 2, 3, …, k, k≥2,則 m0 叫做m1, m2, …, mk.的共有屬性。
定義 4. 設(shè)K= (U, M, I) 為一形式背景,對(duì)于集合 A ? U, f (A) = {m∈ M | (u, m) ∈ I, " u∈ A}。相應(yīng)的, 對(duì)于一個(gè)集合B ? M, 我們定義 g(B)= {u∈ G | (u, m) ∈ I, "m∈ B}。 一個(gè)形式概念是一個(gè)有序?qū)Γˋ, B), A ? U, B ? M, f (A) =B 而且 u (B) =A. A叫作概念的外延,而 B叫作概念的內(nèi)涵。
3情態(tài)動(dòng)詞語(yǔ)義排歧中知識(shí)發(fā)現(xiàn)的基本框架
基于前人的貢獻(xiàn)和筆者自己的研究,本文在總結(jié)前期研究成果的基礎(chǔ)上,提出了英語(yǔ)情態(tài)動(dòng)詞語(yǔ)義排歧中知識(shí)發(fā)現(xiàn)的基本框架,該框架適用于所有情態(tài)動(dòng)詞的知識(shí)發(fā)現(xiàn)研究。
4 基本框架描述
情態(tài)動(dòng)詞知識(shí)發(fā)現(xiàn)基本框架可以分為五層:語(yǔ)言學(xué)準(zhǔn)備層,數(shù)據(jù)采集層,數(shù)據(jù)預(yù)處理層,形式概念分析層和知識(shí)發(fā)現(xiàn)層。前四層的實(shí)質(zhì)為情態(tài)動(dòng)詞語(yǔ)義排歧的基本框架,參照[13],這里不再贅述。本文主要闡述框架第五層,即知識(shí)發(fā)現(xiàn)層。情態(tài)動(dòng)詞語(yǔ)義排歧模型生成后,可以從如下五個(gè)視角來(lái)進(jìn)行知識(shí)發(fā)現(xiàn)研究:模式識(shí)別研究,規(guī)則提取研究,語(yǔ)義與句法互動(dòng)關(guān)系研究,特征選擇優(yōu)化研究和屬性重要度分析研究。本文主要基于筆者之前關(guān)于英語(yǔ)情態(tài)動(dòng)詞的系列研究成果,研究主要圍繞情態(tài)動(dòng)詞must和shall展開(kāi),文章提到的方法也適用于其他情態(tài)動(dòng)詞或其他詞匯范疇。
4.1 模式識(shí)別
模式識(shí)別是指對(duì)表征事物或現(xiàn)象的各種形式的信息進(jìn)行處理和分析,以對(duì)事物或現(xiàn)象進(jìn)行描述、辨認(rèn)、分類和解釋的過(guò)程。它是信息科學(xué)和人工智能的重要組成部分,主要應(yīng)用領(lǐng)域是圖像分析與處理、語(yǔ)音識(shí)別、通信、計(jì)算機(jī)輔助診斷等學(xué)科。作為一種分類的重要手段,它可用于語(yǔ)義排歧領(lǐng)域。
本節(jié)以must語(yǔ)義排歧模型[18]為例,探討must的語(yǔ)義模式識(shí)別。在圖中,以對(duì)象為起點(diǎn),逆序向上,形成對(duì)象和屬性的二元組,每個(gè)二元組就是must語(yǔ)義的一種模式,以圖中o1為例,逆序向上,得到屬性組合a17a13a16a8a3a1a6, 因o1:o117(2), 即o1對(duì)應(yīng)對(duì)象o117(2),屬于must的第二類意義,故得到must的一種語(yǔ)義模式{2, a17a13a16a8a3a1a6}。以此類推,可以推出模型中所有的語(yǔ)義模式,篇幅關(guān)系,這里不一一列舉。
由此,構(gòu)造出目標(biāo)詞語(yǔ)義排歧模型后,語(yǔ)料庫(kù)中目標(biāo)詞各語(yǔ)義義項(xiàng)的語(yǔ)義模式顯而易見(jiàn)。所有這些模式都可以被視為must語(yǔ)義判定的基礎(chǔ)。
4.2 規(guī)則提取
規(guī)則提取是數(shù)據(jù)挖掘中最重要最關(guān)鍵的一步,是解決黑匣子問(wèn)題的主要方法。在黑匣子中,數(shù)據(jù)輸出過(guò)程抽象復(fù)雜、很難解釋,但卻可以用簡(jiǎn)單明了的方式表述出來(lái),這種轉(zhuǎn)換就是規(guī)則提取。近些年,不同學(xué)科領(lǐng)域出現(xiàn)了多種多樣的規(guī)則提取方法,筆者在文獻(xiàn)[18] 中提出情態(tài)動(dòng)詞語(yǔ)義排歧中的規(guī)則提取方法。
還是以must為例,在must的語(yǔ)義排歧模型(圖2)中,提取must語(yǔ)義排歧規(guī)則,規(guī)則提取流程圖如下:
在屬性偏序圖中,各屬性均做如下運(yùn)算:(以屬性mi為例)1)以mi為起點(diǎn),逆序向上直至頂點(diǎn),該過(guò)程屬性組合形成二元組(g, m)中的m,mi對(duì)向下至底層對(duì)象集合構(gòu)成g;2)對(duì)二元組集合進(jìn)行兩兩運(yùn)算。運(yùn)算規(guī)則為外延集合取并集,內(nèi)涵集合取交集。從而形成新的二元組集合。新二元組中成員若與原二元組集合中某成員相等,則刪除新成員,即不生成該新成員;3)若新二元組集合中某成員內(nèi)涵與原二元組集合中某成員內(nèi)涵相同,則刪除原二元組集合中該成員,即保留外延大的二元組;4)若新二元組集合中只有一個(gè)元素,則完成該屬性運(yùn)算,保留下來(lái)的所有二元組即為可能模式的一部分;否則返回第2步。
該過(guò)程將找到所有可能模式。對(duì)比所有可能模式。對(duì)內(nèi)涵部分,若其中幾個(gè)二元組內(nèi)涵相等,則生成新二元組,該新二元組內(nèi)涵不變,外延為幾個(gè)二元組外延并集,同時(shí)刪除原二元組;對(duì)外延部分,若兩二元組外延相同,則內(nèi)涵部分必然為包含關(guān)系,保留內(nèi)涵最大(屬性個(gè)數(shù)最多)的一個(gè)二元組,其余的刪除;保留下來(lái)的二元組即為形式概念,即規(guī)則,提取出的規(guī)則見(jiàn)表1。
由此,4.1中各種復(fù)雜的模式就轉(zhuǎn)化成了表中的四條簡(jiǎn)單明了的規(guī)則。
4.3 特征選擇優(yōu)化
特征選擇,也稱為特征子集選擇或?qū)傩赃x擇,指的是從所有備選特征子集中選擇一個(gè)最優(yōu)的特征子集,以提高分類器性能。在機(jī)器學(xué)習(xí)和模式識(shí)別領(lǐng)域, 特征數(shù)量往往較多,特征個(gè)數(shù)越多,分析特征、訓(xùn)練模型的時(shí)間就越長(zhǎng);特征個(gè)數(shù)越多,維度也就越多,模型也會(huì)越復(fù)雜,其應(yīng)用推廣能力會(huì)下降。一些解決特征數(shù)量過(guò)多問(wèn)題的技術(shù)應(yīng)運(yùn)而生,旨在減少不相關(guān)特征和冗余特征,減輕分類器的負(fù)擔(dān),即特征選擇。特征選擇使研究人員易于理解數(shù)據(jù),能夠減少計(jì)算時(shí)間,避免維度災(zāi)難,提高分類器性能 [20]。
關(guān)于英語(yǔ)情態(tài)動(dòng)詞的特征選擇,繼續(xù)以must為例。在對(duì)其進(jìn)行規(guī)則提取的基礎(chǔ)上,可以進(jìn)一步做特征選擇優(yōu)化研究。表2中提取出的規(guī)則只包含must的6個(gè)屬性:a3, a4, a5, a6, a7和 a8,接下來(lái)我們要驗(yàn)證是否可以用這6個(gè)特征來(lái)生成語(yǔ)義排歧模型進(jìn)行語(yǔ)義排歧,并且達(dá)到原有17個(gè)特征時(shí)相同的效果。刪除了規(guī)則以外的11個(gè)特征,保留了規(guī)則包含的6個(gè)特征,建立形式背景,將此形式背景凈化,轉(zhuǎn)換成屬性結(jié)構(gòu)偏序圖,生成新的語(yǔ)義排歧模型,如圖4所示,同前,此圖亦可作為must的語(yǔ)義分類和判定模型。
為了檢驗(yàn)優(yōu)化后模型的有效性,需先將檢驗(yàn)組的初始形式背景做相同的優(yōu)化處理:刪除多余特征,保留規(guī)則中出現(xiàn)的6個(gè)特征,然后按照初始模型的檢驗(yàn)方法對(duì)新模型進(jìn)行檢驗(yàn),得到模型準(zhǔn)確率為97.5%,高于初始模型的準(zhǔn)確率94.5%。
初始模型(圖2)和優(yōu)化模型(圖4)對(duì)比可知:優(yōu)化模型只選擇了6個(gè)特征,與初始模型中的17個(gè)特征相比降低了將近200%,然而準(zhǔn)確率卻提高了3%。由此得出結(jié)論:特征子集a3, a4, a5, a6, a7和 a8是must語(yǔ)義排歧中的優(yōu)化特征集,其他特征為冗余特征,它們對(duì)must的語(yǔ)義排歧有貢獻(xiàn),但如果優(yōu)化特征子集存在,這些特征的存在就沒(méi)有意義。
4.4 語(yǔ)義與句法互動(dòng)
語(yǔ)言不僅是符號(hào)系統(tǒng),也是價(jià)值系統(tǒng)。語(yǔ)言中各要素不是獨(dú)立存在的,而是交織在一個(gè)隱形的網(wǎng)里。句法和語(yǔ)義在這個(gè)網(wǎng)中相互影響:句法差異會(huì)映射到語(yǔ)義中,語(yǔ)義差異也會(huì)反映在句法上[21]。句法和語(yǔ)義相互依賴,又相互補(bǔ)充。語(yǔ)義、句法的相關(guān)研究應(yīng)該將二者結(jié)合在一起,探究二者之間的互動(dòng)關(guān)系[22]。
筆者在文獻(xiàn)[16]中,僅以must的句法特征為屬性,研究must的句法和不同語(yǔ)義間的互動(dòng)關(guān)系。首先構(gòu)建語(yǔ)義排歧模型,按照4.2中提到的方法對(duì)must進(jìn)行語(yǔ)義規(guī)則提取運(yùn)算,得到如下規(guī)則:
{ 1,a1} { 1,a2a9} { 2,a5} { 2,a6} { 2,a7a8}
這些規(guī)則可以揭示must不同語(yǔ)義和句法特征之間的互動(dòng)關(guān)系,可以看出:在與must共現(xiàn)的9個(gè)句法特征中,只有規(guī)則中出現(xiàn)的某些特征或者特征組合對(duì)must的意義選擇具有決定性。
1){ 1,a1}
這條規(guī)則表示:所有具有屬性a1(否定)的對(duì)象中must均為根意義。情態(tài)意義must不與否定共現(xiàn),英語(yǔ)中must否定情態(tài)意義的缺失由cant(= it is not possible that ×)來(lái)彌補(bǔ)。在否定上,must是一個(gè)特例:它不具備情態(tài)意義的否定形式,只有根意義must具備否定形式,其否定形式否定的是述謂結(jié)構(gòu),含根意義must的否定句可以解釋為:I order you not to × 或者it is necessary for (you) not to ×。
2){ 1,a2a9}
這條規(guī)則表示:所有同時(shí)具有屬性a2(被動(dòng))和a9 (無(wú)生命主語(yǔ))的對(duì)象中must均為根意義。在被動(dòng)語(yǔ)態(tài)中,動(dòng)作的對(duì)象(通常無(wú)生命)為句子的語(yǔ)法主語(yǔ),動(dòng)作的發(fā)出者不做具體說(shuō)明。然而,說(shuō)話者的目的是試圖影響某個(gè)隱匿的對(duì)象產(chǎn)生行動(dòng),所以,所有同時(shí)與被動(dòng)和無(wú)生命主語(yǔ)共現(xiàn)的對(duì)象中must均為根意義。具備這兩個(gè)句法特征的句子表達(dá)較弱的義務(wù)性,可以理解為:it is important that ×。
3){ 2,a5} { 2,a6} { 2,a7a8}
規(guī)則{ 2,a5}:所有具有屬性a5 (完成時(shí)) 的對(duì)象中must均為情態(tài)意義。Must本身沒(méi)有過(guò)去時(shí),但是情態(tài)意義的must卻可以通過(guò)使用have+ed結(jié)構(gòu)來(lái)表達(dá)過(guò)去的狀態(tài)或活動(dòng)。具有完成時(shí)的must樣本可以理解為: Im sure/I infer that × was ×。情態(tài)意義must也通過(guò)與a6 (進(jìn)行時(shí)) 或 a8 (靜態(tài)動(dòng)詞)共現(xiàn)來(lái)表達(dá)當(dāng)前的狀態(tài)或活動(dòng)。提取出的{ 2,a6} { 2,a7a8}表示:所有具有屬性a6 (進(jìn)行時(shí))或a8 (靜態(tài)動(dòng)詞,尤其在靜態(tài)動(dòng)詞與存在主語(yǔ)同時(shí)出現(xiàn)時(shí))的對(duì)象中must均為情態(tài)意義,可以理解為:Im sure/I infer that × is × or Im sure/I infer there is ×。
4.5屬性重要度分析
數(shù)據(jù)處理中,評(píng)價(jià)屬性的重要度是數(shù)據(jù)分析的一個(gè)重要步驟。作為分類和決策的重要理論支持,屬性重要度亦可被應(yīng)用到語(yǔ)義排歧領(lǐng)域。
4.1 ~ 4.4的分析一直以must為例,取must語(yǔ)義的二分法,即根意義和情態(tài)意義。英語(yǔ)情態(tài)動(dòng)詞的多義性往往更復(fù)雜,比如shall, 本小節(jié)屬性重要度分析以shall為例,闡述情態(tài)動(dòng)詞語(yǔ)義排歧中的屬性重要度分析。根據(jù)框架圖完成shall的語(yǔ)義排歧模型,參見(jiàn)文獻(xiàn)[15],運(yùn)用五倍交叉驗(yàn)證,模型準(zhǔn)確率為95.5%±2.27%。模型有效,在此進(jìn)行屬性重要度分析。
屬性重要度分析的一個(gè)重要參數(shù)是分類精度,分類精度指信息系統(tǒng)分類過(guò)程中,用屬性子集P分類出的正確對(duì)象與總對(duì)象的比值,分類精度是評(píng)價(jià)特征子集P的屬性重要度的關(guān)鍵指數(shù)[23]。本文用從形式背景中刪除某屬性的方法來(lái)計(jì)算該屬性的分類精度,刪除后,對(duì)象和其他屬性形成新的形式背景,并生成新的屬性偏序圖,然后檢測(cè)該圖中的分類錯(cuò)誤。錯(cuò)誤越多,說(shuō)明模型的分類效果越差,也就表明被刪除屬性的分類精度越高,即:該算法中的錯(cuò)誤率與分類精度、屬性重要度正相關(guān),錯(cuò)誤率越高,被刪除屬性的分類精度越高,該屬性越重要。結(jié)果如表2所示。其中,a1 和a2均表示MI(s+INTshall),實(shí)驗(yàn)中將其歸為一組,其他組互信息值同理。
表2中的最后一列和圖3均可顯示實(shí)驗(yàn)中刪除某個(gè)特征后的總錯(cuò)誤率,可視為shall語(yǔ)義排歧中反映屬性重要度的參數(shù)。如圖所示,無(wú)生命主語(yǔ)(a18)錯(cuò)誤率最高,即在shall語(yǔ)義排歧中,無(wú)生命主語(yǔ)特征在屬性重要度中位居第一,是shall當(dāng)前形勢(shì)背景中最重要的屬性;位居無(wú)生命主語(yǔ)特征之后的是疑問(wèn)句(a21)、MI (INTshall, v) (a9a10), MI (PREshall, v) (a15a16) 以及 MI (s, PREshall) (a7a8),這些特征為相對(duì)重要屬性;其它特征為不相關(guān)屬性(僅限于個(gè)體,不限于整體)。
5 總結(jié)
該文以形式觀念分析理論為支撐,以屬性結(jié)構(gòu)偏序圖為工具,探討英語(yǔ)情態(tài)動(dòng)詞語(yǔ)義排歧中的知識(shí)發(fā)現(xiàn),提出進(jìn)行英語(yǔ)情態(tài)動(dòng)詞的知識(shí)發(fā)現(xiàn)分的五個(gè)層次和五個(gè)視角。五個(gè)層次為:語(yǔ)言學(xué)準(zhǔn)備層,數(shù)據(jù)采集層,數(shù)據(jù)預(yù)處理層,形式概念分析層和知識(shí)發(fā)現(xiàn)層;五個(gè)視角為:語(yǔ)義模式識(shí)別,語(yǔ)義規(guī)則提取,特征選擇優(yōu)化,句法與語(yǔ)義互動(dòng)關(guān)系,屬性重要度分析。該文提出的情態(tài)動(dòng)詞語(yǔ)義排歧中知識(shí)發(fā)現(xiàn)框架,既可以其他復(fù)雜語(yǔ)義詞的知識(shí)發(fā)現(xiàn),也可以應(yīng)用到機(jī)器翻譯和其他自然語(yǔ)言處理領(lǐng)域。
參考文獻(xiàn):
[1] Fayyad U,Piatetsky-shapiro G,Smyth P. The KDD process for extracting useful knowledge from volumes of data[J].Comunications of the ACM,1996,39(11):27-34.
[2] Mishra N,Ling C,Chang H T. A cognitive adopted framework for IoT big-data management and knowledge discovery prospective[J]. International Journal of Distributed Sensor Networks,2015:6.
[3] 趙瑞雪,鮮國(guó)建,寇遠(yuǎn)濤,等. 大數(shù)據(jù)環(huán)境下的農(nóng)業(yè)知識(shí)發(fā)現(xiàn)服務(wù)探索[J]. 數(shù)字圖書(shū)館論壇,2016(9):28-33.
[4] Holzinger A,Zupan M. Knodwat. KNODWAT:a scientificframework application for testing knowledge discovery methods for the biomedical domain[J]. BMC Bioinformatics,2013,14(1):191.
[5] Zhang C,He L,Mao Y,et al. Knowledge discovery ofnetwork public opinion in the concept of smart city[C]//Industrial Electronics and Applications(ICIEA),2015 IEEE 10th Conference on. IEEE,2015:1197-1202.
[6] 鄒純龍,馬海群. 基于神經(jīng)網(wǎng)絡(luò)的政府開(kāi)放數(shù)據(jù)網(wǎng)站評(píng)價(jià)研究———以美國(guó) 20 個(gè)政府開(kāi)放數(shù)據(jù)網(wǎng)站為例[J]. 現(xiàn)代情報(bào),2016,36(9):16 -21.
[7] 于建平,魏雪姣,耿延宏等,基于偏序結(jié)構(gòu)理論的情態(tài)與時(shí)、體、態(tài)互動(dòng)關(guān)系知識(shí)發(fā)現(xiàn)研究[J].燕山大學(xué)學(xué)報(bào),2016,40(06):508-516.
[8] Yu Jianping,Huang Liang,F(xiàn)u Jilin,et al. A comparative study of word sense disambiguation of English modal verb by BP neural network and support vector machine [J]. International Journal of Innovative Computing, Information and Control, 2011, 7 (5 ) :2345-2355.
[9] Yu Jianping,F(xiàn)u Jilin,Duan Jianli.Syntactic feature based word sense disambiguation of English modal verbs by Na ve Bayesian model [J]. ICIC Express Letter,2010,4 (5B) : 1817-22.
[10] Yu Jianping,Huang Liang,Mei Deming,et al. Determination of the senses of English modal verb will by fuzzy c-means cluster[J]. ICIC Express Letters, Part B: Applications,2011,2 ( 1) :177-182.
[11] Yu Jianping,Zhao Sha,Mei Deming,et al.Sense inference of English modal verb must by adaptive network-based fuzzy inference system [J]. ICIC Express Letter,2011,5(8A) : 2409-2414.
[12] Yu Jianping,Hong Wenxue,Li Shaoxiong,et al.A new approach of word sense disambiguation and knowledge discovery of English modal verbs by formal concept analysis[J]. International Journal Innovative Computing,Information and Control,2013,9 (3) :1189-1200.
[13] Yu Jianping, Li Hongbo, Hong Wenxue. A framework for word sense disambiguation of English modal verbs by formal concept analyasis[J]. ICIC Express Letter, 2017, 11(2).
[14] Li Hongbo,Yu Jianping, Hong Wenxue . Rule extraction for word sense disambiguation of English modal verb must[J]. ICIC Express Letters, 2013, 7( 3A): 877-882,.
[15] Li Hong-bo, Yu Jian-ping. Pattern Recognition of Contextual Features for English Modal Verb shall in Word SenseDisambiguation,International Conference On Information Technology And Management Engineering (ITME 2014), 2014: 512-516 .
[16] Li Hongbo,Yu Jianping. Knowledge representation and discovery for the interaction between syntax and semantics: A case study of must, PIC 2014 - Proceedings of 2014 IEEE International Conference on Progress in Informatics and Computing, 2014, 12(2) :153-157.
[17] Li Hongbo, Yu Jianping. Attribute significance analysis of English modal verb shall in word sense disambiguation[J]. ICIC Express Letters, Part B: Applications, 2015, 6( 5): 1287-1294.
[18] Li Hongbo, Yu Jianping, Hong Wenxue. A rule-extraction based optimization method for feature selection in word sense disambiguation[J]. ICIC Express Letter, 2016, 10(6): 1325-1333.
[19] Ganter B, Wille R. Formal Concept Analysis[M]. Berlin: Spring-Verlag, 1999.
[20] Chandrashekar G, Sahin F. A survey on feature selection method[J]. Computers and Electrical Engineering, 2014, 40( 1): 16-28.
[21] Saussure F. Course of General Linguistics. Transl. M. Gao. Bei Jing: Commercial Press, 1996: 37-167.
[22] Zhang S. On the interation of syntax and semantics: from the perspective of metaphor and metonomy[J]. Foreigh Language Research, 2012, 135( 5).
[23] Pawlak Z. Rough Set – Theoretical Aspects of Reasoning about Data[M]. Kluwer Academic Pub, 1991.
【通聯(lián)編輯:光文玲】