陶星,李衛(wèi)華,汪中飛
(廣東工業(yè)大學(xué)計(jì)算機(jī)學(xué)院,廣東廣州510006)
基于知網(wǎng)的可拓領(lǐng)域信息元庫(kù)的構(gòu)建方法
陶星,李衛(wèi)華,汪中飛
(廣東工業(yè)大學(xué)計(jì)算機(jī)學(xué)院,廣東廣州510006)
為了解決某個(gè)領(lǐng)域的矛盾問(wèn)題,須構(gòu)建領(lǐng)域信息元庫(kù)以提高計(jì)算機(jī)語(yǔ)義理解能力。結(jié)合知網(wǎng)的表達(dá)知識(shí)的形式化特點(diǎn),提出了對(duì)基元進(jìn)行改造,增強(qiáng)語(yǔ)義互操作性的方法。在知網(wǎng)2000版中,以教育領(lǐng)域?yàn)榘咐?,提取出教育領(lǐng)域的概念及其屬性,并在此基礎(chǔ)上改造與更新,構(gòu)造可拓學(xué)的教育領(lǐng)域基礎(chǔ)庫(kù)。在實(shí)驗(yàn)過(guò)程中采用關(guān)系型數(shù)據(jù)庫(kù)實(shí)現(xiàn)了信息元的存儲(chǔ),表明了可以提高語(yǔ)義互操作能力,驗(yàn)證了該方法的可行性。
可拓學(xué);知網(wǎng);信息元;矛盾問(wèn)題;語(yǔ)義
可拓學(xué)是由中國(guó)學(xué)者于1983年提出的一門(mén)原創(chuàng)性橫斷學(xué)科,它以形式化的模型,探討事物拓展的可能性以及開(kāi)拓創(chuàng)新的規(guī)律與方法,并用于解決矛盾問(wèn)題[1]。所謂矛盾問(wèn)題,是指在現(xiàn)有條件下無(wú)法實(shí)現(xiàn)人們要達(dá)到的目標(biāo)的問(wèn)題。要解決某個(gè)領(lǐng)域的矛盾問(wèn)題,使計(jì)算機(jī)自動(dòng)生成可拓策略,必須有該領(lǐng)域的知識(shí)庫(kù)做為支持。這是可拓策略生成系統(tǒng)亟需解決的一個(gè)關(guān)鍵且基礎(chǔ)的問(wèn)題[2]。
文獻(xiàn)[3]提出“可拓信息-知識(shí)-智能形式化體系結(jié)構(gòu)”這一構(gòu)想,指出研究以物元、事元和關(guān)系元為基本元的信息表示體系,以建立信息元庫(kù)。
知網(wǎng)(HowNet)是一套知識(shí)描述規(guī)范體系,一個(gè)通用的常識(shí)知識(shí)庫(kù),描述了世間萬(wàn)物所有的概念、概念的屬性及屬性之間的關(guān)系[4]。但是知網(wǎng)并不能解決矛盾問(wèn)題。以知網(wǎng)的知識(shí)資源為基礎(chǔ),借助可拓學(xué)基元表達(dá)體系,將有望讓其計(jì)算機(jī)自動(dòng)生成(或人機(jī)結(jié)合引導(dǎo)生成)解決矛盾問(wèn)題的策略。
本文提出一種基于知網(wǎng)來(lái)建立領(lǐng)域可拓信息元庫(kù)的方法,并以教育領(lǐng)域?yàn)檠芯堪咐?,探討改進(jìn)后的基元如何表達(dá)可拓知識(shí)和解決語(yǔ)義二義性問(wèn)題,是未來(lái)解決某一領(lǐng)域的矛盾問(wèn)題的基礎(chǔ)研究。
在“可拓信息-知識(shí)-智能形式化”體系[3]研究中提出了該體系的主要功能模塊:信息元庫(kù)、知識(shí)表示庫(kù)、可拓策略庫(kù)。為了實(shí)現(xiàn)該體系,信息元庫(kù)的建立是首要工作。
信息元庫(kù)集成了領(lǐng)域的基礎(chǔ)知識(shí),是支持策略生成系統(tǒng)的基礎(chǔ)庫(kù)。由于信息元庫(kù)容量龐大,且其中涉及領(lǐng)域繁雜,又有非結(jié)構(gòu)化組織,對(duì)于許多的復(fù)雜情況根本不存在查詢(xún)結(jié)果,必要時(shí),仍需要查詢(xún)整個(gè)信息元庫(kù),查詢(xún)效率極低。本文將分別建立信息物元、信息事元、信息關(guān)系元模型,并將其存儲(chǔ)在信息元庫(kù)中,每次查詢(xún)時(shí)先在信息元庫(kù)中查詢(xún);若不能得出查詢(xún)結(jié)果,再進(jìn)行可拓變換,這樣可提高查詢(xún)效率。
2.1 知網(wǎng)的知識(shí)網(wǎng)絡(luò)體系
知網(wǎng)是一個(gè)以英、漢雙語(yǔ)所代表的概念以及概念的特征為基礎(chǔ),以揭示概念與概念之間以及概念所具有的特性之間的關(guān)系為基本內(nèi)容的常識(shí)知識(shí)庫(kù)[4]。知網(wǎng)知識(shí)庫(kù)中的概念是通過(guò)義原與義原之間的關(guān)系來(lái)描述的。
知網(wǎng)所描述的概念之間的關(guān)系有:上下位關(guān)系、同義關(guān)系、反義關(guān)系、對(duì)義關(guān)系、部件—整體關(guān)系、屬性—宿主關(guān)系、材料—成品關(guān)系、施事/經(jīng)驗(yàn)者/關(guān)系主體—事件關(guān)系、受事/內(nèi)容/領(lǐng)屬物、屬性關(guān)系、實(shí)體—值關(guān)系、事件—角色關(guān)系、相關(guān)關(guān)系。這些關(guān)系形成了一個(gè)網(wǎng)狀的知識(shí)系統(tǒng),進(jìn)而使計(jì)算機(jī)對(duì)其可進(jìn)行操作。
2.2 知網(wǎng)知識(shí)庫(kù)描述語(yǔ)言
知網(wǎng)知識(shí)庫(kù)描述語(yǔ)言是一種面向計(jì)算機(jī)的結(jié)構(gòu)化描述語(yǔ)言[5]。為了實(shí)現(xiàn)計(jì)算這一設(shè)計(jì)目標(biāo),知網(wǎng)的創(chuàng)立者進(jìn)行了2個(gè)工作:1)將概念分解為義原,并形成一套完整的分類(lèi)體系;2)將義原通過(guò)各種關(guān)系的組織表達(dá)一個(gè)概念。因?yàn)橹W(wǎng)中的每個(gè)義原都表示一個(gè)唯一的特定的意義,這樣就能解決自然語(yǔ)言處理的語(yǔ)義的歧義性問(wèn)題。
在知網(wǎng)知識(shí)庫(kù)描述語(yǔ)言(KDML)2000版中,通過(guò)一些特定的符號(hào)來(lái)描述義原之間的關(guān)系的。如表1所示。
表1 KDML符號(hào)及其含義Table 1 Symbols and meanings of KDML
例如:
這個(gè)概念的含義是:大學(xué)生是N范疇。是“人”類(lèi)別的一員,是施行“學(xué)”行為的,屬于教育領(lǐng)域類(lèi)概念。
知網(wǎng)的哲學(xué)思想:世界上一切事物(物質(zhì)的,精神的或事情)都在一定的時(shí)間和空間內(nèi)不停地運(yùn)動(dòng)和變化。它們通常是從一種狀態(tài)變化到另一種狀態(tài),并通常由其屬性值的改變來(lái)體現(xiàn)[2]。這一思想與可拓學(xué)的思想有異曲同工之妙。初步的研究顯示,將可拓學(xué)與知網(wǎng)這2個(gè)中國(guó)原創(chuàng)的理論和應(yīng)用工具相結(jié)合,研究解決矛盾問(wèn)題的策略生成問(wèn)題,可為策略生成研究提供一種新的思路。
由于知網(wǎng)本身就是一個(gè)具有語(yǔ)義的通識(shí)知識(shí)庫(kù),可以借助知網(wǎng)中義原及其語(yǔ)義關(guān)系的表達(dá)方式,對(duì)信息元的結(jié)構(gòu)進(jìn)行重新構(gòu)造。
3.1 信息物元的構(gòu)造
信息物元,是指具體對(duì)象、其特征和量值構(gòu)成的有序三元組,而知網(wǎng)中的義原均為概念,并非具體的對(duì)象,所以,對(duì)信息物元并不需要基于知網(wǎng)進(jìn)行重新改造,仍然使用可拓學(xué)中對(duì)于物元的定義。例如:
3.2 信息關(guān)系元的構(gòu)造
信息關(guān)系元主要描述的是信息物元和信息事元之間的關(guān)系。通過(guò)對(duì)知網(wǎng)的描述,可以知道知網(wǎng)在描述概念及概念之間的關(guān)系上,已經(jīng)有完備且有效的關(guān)系,只是知網(wǎng)不具備解決矛盾問(wèn)題的能力。基于此,本文提出信息關(guān)系元模型如表2所示。
表2 信息關(guān)系元的結(jié)構(gòu)Table 2 Structure of relation-element
在此信息關(guān)系元結(jié)構(gòu)中,定義了4種關(guān)系屬性。1)isKindOf,即具有繼承關(guān)系或者上下位的信息元,譬如:“筆-鋼筆”、“白-雪白”等;2)isPartOf,表示具有整體與部分關(guān)系或者包含關(guān)系的信息元,又可細(xì)分為組合和聚合,譬如:“中國(guó)-上?!?、“森林-樹(shù)”等;3)hasAttributeOf,表示與該具有屬性關(guān)系的信息元;4)hasInstanceOf,表示概念及其概念實(shí)例關(guān)系。譬如:“學(xué)校”的上位屬性是“場(chǎng)所”,其屬性有很多:名稱(chēng)、地點(diǎn)、級(jí)別等?!皩W(xué)?!庇挚煞譃椋骸靶W(xué)”、“中學(xué)”、“高中”、“大學(xué)”、“研究院”等。通過(guò)這樣的關(guān)系定義,希望其不僅可以支持基本的可拓變換:置換變換、增(減)變換、擴(kuò)(縮)變換、分解變換和復(fù)制變換,并能具有一定的智能,幫助對(duì)矛盾問(wèn)題的理解。
本文規(guī)定,每種信息關(guān)系元,都有某些固定的特征,譬如:關(guān)系前項(xiàng)(antecedent)、關(guān)系后項(xiàng)(conse?quent),其余特征需根據(jù)知網(wǎng)中的知識(shí)表達(dá),進(jìn)行相應(yīng)的改造。詳細(xì)的改造方法如下。
基于知網(wǎng)中的關(guān)系符,本文分別進(jìn)行如下處理。
1)空符號(hào)
在知網(wǎng)中,空符號(hào)義原主要存在于概念詞典中,一般有3種含義。
在知網(wǎng)中,實(shí)體、事件、屬性/屬性值、數(shù)量/數(shù)量值定義的第1項(xiàng)均為空符號(hào)義原,用來(lái)表示其主要特征。對(duì)于實(shí)體和事件概念來(lái)說(shuō),該第1項(xiàng)表示上下位關(guān)系。在信息物元中,將定義為isKindOf屬性。例如:
其對(duì)應(yīng)的信息關(guān)系元為
對(duì)于屬性和數(shù)量的概念,因?yàn)槠浜械摹埃Α标P(guān)系,可不對(duì)第1義原進(jìn)行處理,將在之后的“&”關(guān)系的處理中詳細(xì)介紹。
2)“&”關(guān)系
在知網(wǎng)中,“&”表示“屬性-宿主”關(guān)系。對(duì)此類(lèi)概念,不提取第1義原,改為提取該概念和第2義原之間為上下位關(guān)系。因?yàn)榈?義原描述了具體的數(shù)量/屬性類(lèi),可以更加準(zhǔn)確地對(duì)概念的語(yǔ)義范圍進(jìn)行界定。例如:
按照上述轉(zhuǎn)換規(guī)則,可以得到上下位信息關(guān)系元(isKindOf):“模式”-“樣式”,其對(duì)應(yīng)的信息關(guān)系元為
其表示的意義為:“模式”是屬于物質(zhì)的樣式類(lèi)別。
3)“%”關(guān)系
在知網(wǎng)中,“%”表示“整體-部分”關(guān)系,與屬性/數(shù)量關(guān)系類(lèi)似,不再提取第1義原作為其上下位關(guān)系,而是直接提取“%”關(guān)系作為isPartOf屬性。例如:
從中,可以提取2個(gè)信息關(guān)系元,上下文關(guān)系元(isKindOf):“琴鍵”-“部件”、整體部分信息關(guān)系元(isPartOf):“琴鍵”-“樂(lè)器”。其對(duì)應(yīng)的信息關(guān)系元為
在知網(wǎng)中,對(duì)于這些關(guān)系的提取,都可以直接進(jìn)行,不再贅述。
3.3 信息事元的構(gòu)造
對(duì)于信息事元的改造,一方面要保證其語(yǔ)義的完整性,另一方面,更要規(guī)定其模型,針對(duì)不同類(lèi)型的事件,事件模型不一樣。對(duì)于某一領(lǐng)域內(nèi)的知識(shí),應(yīng)該進(jìn)行分類(lèi),并建立相應(yīng)的事件模式。譬如:“報(bào)考”這一事件一定有考生(actingObject)和學(xué)校(re?ceivingObject)的參與,所以在建立這類(lèi)事元時(shí),施動(dòng)對(duì)象(actingObject)和接受對(duì)象(receivingObject)特征是固定的必不可少的。
知網(wǎng)2000中使用到約70個(gè)動(dòng)態(tài)角色是指概念在實(shí)際的語(yǔ)言中所構(gòu)成的各種關(guān)系,如施事、受事、經(jīng)驗(yàn)者、時(shí)間、處所等[6]。有了這些動(dòng)態(tài)角色的注釋?zhuān)ㄟ^(guò)形式化的表示,計(jì)算機(jī)就能更好地理解其含義。
本文針對(duì)信息事元的構(gòu)造,采用的方法為:提取第1義原為信息事元的上位屬性,提取動(dòng)態(tài)角色為信息事元的第2屬性。譬如“報(bào)考”這一事元,在知網(wǎng)中對(duì)其的定義為:
其對(duì)應(yīng)的信息事元為
對(duì)于沒(méi)有動(dòng)態(tài)角色的義原,例如:
直接取第1義原為該事元的上位屬性,即
3.4 信息復(fù)合元的構(gòu)造
對(duì)于現(xiàn)實(shí)世界中的復(fù)雜事件的描述,需要使用復(fù)合元。復(fù)合元包括多種形式,包括:物元和事元的復(fù)合,物元和關(guān)系元的復(fù)合等。
前面已經(jīng)詳細(xì)討論了信息物元、信息關(guān)系元和信息事元的構(gòu)造,那么至于信息復(fù)合元的構(gòu)成,即它們的復(fù)合,唯一不同的是在信息關(guān)系元與其他信息元的復(fù)合中,信息關(guān)系元將做為其他信息元的特征。例如:“張三要報(bào)考廣東工業(yè)大學(xué)”這一事件,可以建立如下信息復(fù)合元:
subject=1,即表示理科;subject=2,表示文科。collegeLevel=0,表示國(guó)家重點(diǎn)“985”院校,col?legeLevel=1,表示國(guó)家重點(diǎn)“211”或者一本院校,二本院校、三本院校等其他類(lèi)院校,以此類(lèi)推。
綜上,分別確定了信息物元、信息關(guān)系元、信息事元和信息復(fù)合元的結(jié)構(gòu),并舉例說(shuō)明該結(jié)構(gòu)是可以反映一個(gè)無(wú)語(yǔ)義二義性的客觀世界,同時(shí)也具有表達(dá)可拓知識(shí)并支持可拓變換的能力。
在之前文獻(xiàn)的研究中,利用可拓學(xué)很好地解決了某個(gè)矛盾問(wèn)題,譬如:租房可拓策略生成系統(tǒng)、自助游可拓策略生成系統(tǒng)[7],而并未涉及到某個(gè)領(lǐng)域的矛盾問(wèn)題的求解。也有文獻(xiàn)討論了基于本可拓模型的復(fù)合元[8],基于可拓模型的本體進(jìn)化研究[9],為本文的研究提供了很好的基礎(chǔ)。本文以教育領(lǐng)域?yàn)榘咐?,說(shuō)明如何用改進(jìn)語(yǔ)義能力的信息元解決領(lǐng)域矛盾問(wèn)題。譬如,高考填報(bào)志愿,理想中的學(xué)校分熟線和自己高考分?jǐn)?shù)存在矛盾;學(xué)習(xí)中,學(xué)習(xí)能力方法和預(yù)期成績(jī)存在矛盾等。為此,建立一個(gè)教育領(lǐng)域的概念體系是研究的關(guān)鍵基礎(chǔ)步驟。
4.1 教育領(lǐng)域概念結(jié)構(gòu)
圖1 教育領(lǐng)域概念體系Fig.1 Education concept system
教育概念體系反映了教育體系概念和及其屬性[10]。本文總體上將教育客體分為3類(lèi):自然類(lèi)教育客體,如學(xué)科,專(zhuān)業(yè)等;社會(huì)類(lèi)教育客體,如學(xué)校的各類(lèi)管理組織機(jī)構(gòu)、教學(xué)設(shè)備等;精神類(lèi)教育客體,如教育理論、教育思想等[11]。教育領(lǐng)域的概念結(jié)構(gòu)如圖1所示。面[10]。這種由于咨詢(xún)用戶(hù)自身對(duì)高考填報(bào)志愿咨詢(xún)領(lǐng)域語(yǔ)義信息理解一致的慣性及咨詢(xún)目標(biāo)十分明確的特點(diǎn),大大降低了專(zhuān)家的參與度,在確定類(lèi)、屬性和關(guān)系的處理上很容易達(dá)成共識(shí)。因此,本文采用自底向上建模方法,先行確定核心概念和關(guān)系,保障語(yǔ)義的正確性和完整性。
在知網(wǎng)知識(shí)庫(kù)2000中,分別查詢(xún)“學(xué)?!?、“專(zhuān)業(yè)”、“指標(biāo)”等義原。發(fā)現(xiàn):
建立對(duì)應(yīng)的信息復(fù)合元為
4.2 教育領(lǐng)域信息元的構(gòu)建
以高考填報(bào)志愿為例說(shuō)明可拓領(lǐng)域信息元庫(kù)的建立方法。實(shí)踐證明,多年來(lái),考生在報(bào)考時(shí)的關(guān)注重點(diǎn)在于:高校名稱(chēng)、高校地點(diǎn)、高校聲譽(yù)、專(zhuān)業(yè)設(shè)置、學(xué)科排名、分?jǐn)?shù)線、招生人數(shù)和就業(yè)前景幾個(gè)方
再具體到某一個(gè)事件的表述:“張三要報(bào)考廣東工業(yè)大學(xué)”這一事件,可以建立語(yǔ)義關(guān)系如圖2所示。
圖2 報(bào)考事件的語(yǔ)義關(guān)系圖Fig.2 Semantic relations of“register for examination register for examination”
這樣清楚直觀的表示后,可以方便計(jì)算機(jī)理解并處理此語(yǔ)義關(guān)系,即可清晰的表達(dá)出具有清晰的語(yǔ)義互操作性的信息元。
4.3 實(shí)驗(yàn)結(jié)果
應(yīng)用前面所討論的理論知識(shí),考慮到關(guān)系型數(shù)據(jù)庫(kù)具有查詢(xún)、插入、修改和刪除操作的簡(jiǎn)潔性,從執(zhí)行效率和成本角度考慮,本文使用關(guān)系型數(shù)據(jù)庫(kù)建立教育領(lǐng)域的概念體系[11]。本文使用的是SQL Server Express關(guān)系型數(shù)據(jù)庫(kù)。
知網(wǎng)是一個(gè)較為完整的知識(shí)系統(tǒng),且具有語(yǔ)義可操作性。所以,將知網(wǎng)2000知識(shí)庫(kù)存入SQL Server 2012 Express數(shù)據(jù)庫(kù)中,數(shù)據(jù)庫(kù)名為:Extenics_HowNet,并提取其中關(guān)于“教育”的所有詞匯,共606條記錄,建立表:Edu_HowNet。再按照G_C屬性值的不同,分別建立Edu_HowNet_N,Edu_HowNet_V,Edu_HowNet_ADJ 3張表,如圖3所示。
圖3 信息元表結(jié)構(gòu)Fig.3 Table of information element
如何才能證明計(jì)算機(jī)是否能理解我們的語(yǔ)義關(guān)系呢?本文主要通過(guò)基元語(yǔ)義相似度算法來(lái)判斷。如果算法的輸入結(jié)果在可接受范圍內(nèi),就可以判定該領(lǐng)域信息元庫(kù)具有語(yǔ)義互操作性。
在可拓信息-知識(shí)-策略形式化體系研究過(guò)程中,一個(gè)待求解問(wèn)題最初可能是用自然語(yǔ)言表達(dá)的信息,如果自然語(yǔ)言存在二義性,計(jì)算機(jī)無(wú)法識(shí)別,就無(wú)法對(duì)該問(wèn)題建立正確的可拓模型,更無(wú)法進(jìn)一步處理。假設(shè)一個(gè)考生想要報(bào)考華師,但是在知識(shí)庫(kù)中并沒(méi)有“華師”這個(gè)基元,所以,利用文獻(xiàn)[12]的詞匯相關(guān)度算法,找出所有與其相關(guān)的詞語(yǔ)。
首先,建立“華師”信息物元,
然后,在信息元庫(kù)中查詢(xún)相應(yīng)信息物元信息,發(fā)現(xiàn)并未存放“華師”這一信息物元的具體信息。通過(guò)與知識(shí)庫(kù)中的基元比較,得出結(jié)果如下:
數(shù)據(jù)庫(kù)中查詢(xún)結(jié)果如圖4所示。
圖4 查詢(xún)結(jié)果Fig.4 Result of query
于是,可以將計(jì)算結(jié)果:“華中師范大學(xué)”,“華南師范大學(xué)”,“華東師范大學(xué)”推送給用戶(hù)。再通過(guò)與用戶(hù)的交互與反饋,確定哪所“華師”,從而消除語(yǔ)義模糊,以達(dá)到理解用戶(hù)意圖的目的。
本文基于知網(wǎng)這個(gè)通用的語(yǔ)義知識(shí)庫(kù),借助知網(wǎng)義原表達(dá)方式,解決概念語(yǔ)義二義性問(wèn)題并提出了一種建立可拓領(lǐng)域信息元庫(kù)的創(chuàng)建方法,并以教育領(lǐng)域的高考信息咨詢(xún)問(wèn)題為例,用計(jì)算機(jī)實(shí)現(xiàn)了該建庫(kù)方法,驗(yàn)證了該方法可行性,得到了可接受的結(jié)論。這個(gè)基礎(chǔ)工作的完成對(duì)今后可拓策略生成系統(tǒng)解決教育領(lǐng)域矛盾問(wèn)題有重要意義。
[1]楊春燕,蔡文.可拓工程[M].北京:科學(xué)出版社,2007:1?10.YANG Chunyan,CAI Wen.Extension engineering[M].Beijing:Science Press,2007:1?10.
[2]李立希,楊春燕,李鏵汶.可拓策略生成系統(tǒng)[M].北京:科學(xué)出版社,2006:1?23.LI Lixi,YANG Chunyan,LI Huawen.The extension strategy generating system[M].Beijing:Science Press,2006:1?23.
[3]楊春燕,蔡文.可拓信息-知識(shí)-智能形式化體系研究[J].智能系統(tǒng)學(xué)報(bào),2007,2(3):8?11.YANG Chunyan,CAI Wen.A formalized system of exten?sion information?knowledge?intelligence[J].CAAI Transac?tions on Intelligent System,2007,2(3):8?11.
[4]董振東.HowNet[EB/OL].[2013?10?09].http://www.keenage.com.
[5]郝長(zhǎng)伶,董強(qiáng).知網(wǎng)知識(shí)庫(kù)描述語(yǔ)言[C]//全國(guó)第七屆計(jì)算語(yǔ)言學(xué)聯(lián)合學(xué)術(shù)會(huì)議.哈爾濱,中國(guó),2003:371?377.HAO Changling,DONG Qiang.Knowledge database mark?up language of HowNet[C]//The 7th National Conference on Computer Linguistics.Harbin,China:2003:371?377.
[6]滕巖.基于領(lǐng)域知識(shí)的智能信息檢索研究[D].濟(jì)南:山東大學(xué),2006,61.TENG Yan.The research of intelligent information retrieval system based on domain knowledge[D].Jinan,China:Shandong University,2006,61.
[7]方卓君,李衛(wèi)華,李承曉.自助游可拓策略生成系統(tǒng)的研究與實(shí)現(xiàn)[J].廣東工業(yè)大學(xué)學(xué)報(bào),2009,26(2):83?89.FANG Zhuojun,LI Weihua,LI Chengxiao.Research and realization of extension strategy generating system for inde?pendent travel[J].Journal of Guangdong University of Technology,2009,26(2):83?89.
[8]劉宗妹.本體可拓模型的復(fù)合元實(shí)現(xiàn)及應(yīng)用研究[D].廣州:廣東工業(yè)大學(xué),2010:1?48.LIU Zongmei.Research on ontology extension model imple?mented with complex elements and its application[D].Guangzhou,China:Guangdong University of Technology,2010:1?48.
[9]何平.基于可拓模型的本體進(jìn)化研究[D].廣州:廣東工業(yè)大學(xué),2011,89. HE Ping.Study of the ontology evolution based on extension model[D].Guangzhou,China:Guangdong University of Technology,2011,89.
[10]馬捷,劉小樂(lè),黃嵐,等.教育領(lǐng)域本體構(gòu)建研究[J].情報(bào)理論與實(shí)踐,2012,35(7):104?108.MA Jie,LIU Xiaole,HUANG Lan,et al.Research on the ontology construction in educational domain[J].Information Studies:Theory&Application,2012,35(7):104?108.
[11]劉小樂(lè).教育領(lǐng)域頂層本體構(gòu)建及其應(yīng)用研究[D].吉林:吉林大學(xué),2012,64.LIU Xiaole.The construction and application research of the top?level ontology of educational domain[D].Jilin,China:Jilin University,2012,64.
[12]劉群,李素建.基于《知網(wǎng)》的詞匯語(yǔ)義相似度計(jì)算[J].計(jì)算語(yǔ)言學(xué)及中文信息處理,2002,(7):59?76.LIU Qun,LI Sujian.Word similarity computing on how?net[J].Computational Linguistics and Chinese Information Processing,2002,(7):59?76.
Construction of HowNet?based extendable domain information element base
TAO Xing,LI Weihua,WANG Zhongfei
(College of Computer,Guangdong University of Technology,Guangzhou 510006,China)
To solve contradictory problems in a domain,it is necessary to construct the domain information element base and to improve the semantic recognition ability of computer software.Combined with the characteristics of for?malized expression of knowledge in HowNet,this paper proposes an approach to redefine the construction of basic?element which is the logic cell of Extenics to enhance semantic interoperability.Taking the domain of education as an example,the concepts and their properties of education are extracted in HowNet 2000,and further reconstructed and updated.Thereby the basic?element base of Extenics in the domain of education is built.A relational database(SQL Express)has been used to store the information element in the experiment,showing that the new basic?ele?ment can improve semantic interoperability,and proving the feasibility of the method.
Extenics;HowNet;information element;contradictory problem;semantic
陶星,女,1989年生,碩士研究生,主要研究方向?yàn)橹悄苘浖?/p>
李衛(wèi)華,女,1957年生,教授,主要研究方向?yàn)槊嫦駻gent計(jì)算、網(wǎng)絡(luò)信息系統(tǒng)、智能軟件。發(fā)表學(xué)術(shù)論文40余篇。
汪中飛,男,1988年生,碩士研究生,主要研究方向?yàn)橹悄苘浖?/p>
TP39
A
1673?4785(2015)05?0790?07
10.11992/tis.201412006
http://www.cnki.net/kcms/detail/23.1538.TP.20150827.1024.008.html
陶星,李衛(wèi)華,汪中飛.基于知網(wǎng)的可拓領(lǐng)域信息元庫(kù)的構(gòu)建方法[J].智能系統(tǒng)學(xué)報(bào),2015,10(5):790?796.
英文引用格式:TAO Xing,LI Weihua,WANG Zhongfei.Construction of HowNet?based extendable domain information element base[J].CAAI Transactions on Intelligent Systems,2015,10(5):790?796.
2014?12?08.
日期:2015?08?27.
國(guó)家自然科學(xué)基金資助項(xiàng)目(61273306).
陶星.E?mail:xingtao0724@163.com.