李金海,何有世,馬云蕾,周愛平,3
1.泰州學(xué)院,江蘇 泰州225300
2.江蘇大學(xué) 管理學(xué)院,江蘇 鎮(zhèn)江212013
3.東南大學(xué) 計(jì)算機(jī)網(wǎng)絡(luò)與信息集成教育部重點(diǎn)實(shí)驗(yàn)室,南京211189
知識(shí)表示是知識(shí)管理的基礎(chǔ),知識(shí)表示模型直接決定了知識(shí)管理的有效性。目前大多數(shù)信息系統(tǒng)主要是基于關(guān)鍵詞對(duì)知識(shí)進(jìn)行管理的,在知識(shí)的管理過程中,沒有考慮到知識(shí)所蘊(yùn)涵的語義關(guān)系,導(dǎo)致了知識(shí)檢索結(jié)果的查全率及查準(zhǔn)率都不能令用戶滿意[1]。而知識(shí)表示方法直接影響到知識(shí)檢索的準(zhǔn)確率以及知識(shí)的重用效果[2]。
關(guān)于知識(shí)表示的方法主要有面向?qū)ο?、語義網(wǎng)絡(luò)以及基于本體[3-4]等。與其他表示方法相比,基于本體的知識(shí)表示方法保證了知識(shí)理解的唯一性,同時(shí)能夠適應(yīng)信息系統(tǒng)涉及的知識(shí)領(lǐng)域多樣性以及語義關(guān)系復(fù)雜性的特點(diǎn),因此,該方法已成為知識(shí)表示的主要方法[5-7]。本文將本體知識(shí)引入到知識(shí)表示模型,通過本體最大程度的挖掘知識(shí)的語義。目前,基于本體的知識(shí)表示已得到了一定的研究,如,李曙光等針對(duì)企業(yè)特定領(lǐng)域內(nèi)的信息資源,基于本體理論研究信息分類編碼方法,并實(shí)例化本體生成需要的信息編碼,為信息資源的組織提供了框架[8]。Brandt等通過本體知識(shí)表示數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)的調(diào)用知識(shí)以及產(chǎn)品設(shè)計(jì)過程中的經(jīng)驗(yàn)知識(shí)[9]。朱海華等構(gòu)建了基于本體的產(chǎn)品服務(wù)知識(shí)管理系統(tǒng),該系統(tǒng)能實(shí)現(xiàn)產(chǎn)品服務(wù)活動(dòng)案例所涉及知識(shí)的獲取與重用[10]。王力等提出一種產(chǎn)品設(shè)計(jì)知識(shí)的本體構(gòu)建方法,基于此構(gòu)建了基于本體的產(chǎn)品設(shè)計(jì)知識(shí)表示模型,該模型提高了產(chǎn)品設(shè)計(jì)知識(shí)共享與重用效率[11]。
雖然基于領(lǐng)域本體的知識(shí)表示方法具有較強(qiáng)的可理解性與可擴(kuò)展性,能夠形式化地描述某一領(lǐng)域的知識(shí),在針對(duì)單一領(lǐng)域知識(shí)的系統(tǒng)中得到了很好的應(yīng)用,而多領(lǐng)域知識(shí)的集成是未來的方向,如涵蓋各類商品的電子商務(wù)平臺(tái),各類商品的知識(shí)間有著各自的特殊性,基于單一領(lǐng)域本體難以表示出所有商品的信息。但是若通過不同的領(lǐng)域本體來表示各類商品知識(shí),將有礙于系統(tǒng)中本體知識(shí)的調(diào)用;另一方面,假如用戶需要的信息涉及多個(gè)領(lǐng)域的知識(shí),由于各領(lǐng)域知識(shí)組織形式的不同,此時(shí)只能對(duì)各領(lǐng)域知識(shí)分別進(jìn)行檢索,這會(huì)極大地降低信息檢索的效率?;诖?,將研究領(lǐng)域本體的整合,構(gòu)建通用型的本體模型,使得各領(lǐng)域的知識(shí)可以通過通用本體進(jìn)行表示,有利于復(fù)雜信息系統(tǒng)中信息的有效組織以及信息的準(zhǔn)確檢索。
目前信息系統(tǒng)中信息資源大多通過關(guān)系型數(shù)據(jù)庫(kù)來表示,關(guān)系型數(shù)據(jù)庫(kù)有利于結(jié)構(gòu)化信息的表示,但缺乏對(duì)非結(jié)構(gòu)化信息的表示;并且沒有完整的語義模型,缺乏對(duì)包含復(fù)雜語義信息的知識(shí)的支持能力[12]。
無論是網(wǎng)絡(luò)購(gòu)物信息系統(tǒng)還是管理信息系統(tǒng)都不再是單一領(lǐng)域的集合,而是多領(lǐng)域的重構(gòu)。并且多領(lǐng)域知識(shí)重構(gòu)的特點(diǎn)不僅在信息系統(tǒng)的構(gòu)建過程中可以得到體現(xiàn),在信息系統(tǒng)的使用中也能得以體現(xiàn)[13]。
在宏觀層面上,信息系統(tǒng)的設(shè)計(jì)涉及多個(gè)組織,每個(gè)組織包括不同部門、而部門內(nèi)各員工的知識(shí)背景存在差異。由于企業(yè)職能的多元化,信息系統(tǒng)在使用過程中,需要面對(duì)不同領(lǐng)域,信息系統(tǒng)的使用也涉及多領(lǐng)域知識(shí)。
在微觀層面上,信息系統(tǒng)的設(shè)計(jì)所需知識(shí)來自多學(xué)科多領(lǐng)域,且存儲(chǔ)方式異構(gòu),為了知識(shí)概念與語義的統(tǒng)一,信息系統(tǒng)的設(shè)計(jì)需要一種能兼容多領(lǐng)域知識(shí)的知識(shí)表示方式。并且,信息系統(tǒng)在實(shí)際使用過程中,由于用戶需求的多樣化,信息系統(tǒng)需要有效理解不同領(lǐng)域知識(shí)間的概念與語義關(guān)系。
本文的思路是通過通用的本體構(gòu)建模型來確保各領(lǐng)域知識(shí)在語義層面上的統(tǒng)一[14]。頂層本體作為領(lǐng)域本體的參考依據(jù),它揭示了領(lǐng)域知識(shí)在更高語義層次上的關(guān)系[15]。但是,在諸多領(lǐng)域本體的構(gòu)建研究中,忽視了頂層本體提供的上層語義知識(shí)[13],為領(lǐng)域本體之間多領(lǐng)域知識(shí)的互通帶來難題。
基于頂層本體的上層語義關(guān)聯(lián),構(gòu)建多層領(lǐng)域本體模型,統(tǒng)一各領(lǐng)域本體的構(gòu)建,規(guī)范各領(lǐng)域知識(shí)的共享與重用。
多層領(lǐng)域本體從多個(gè)層面對(duì)不同層次的知識(shí)體系進(jìn)行描述,基于本體各層次概念面向的不同層次的知識(shí)體系以及自頂而下的本體構(gòu)建原則,本文構(gòu)建了四層領(lǐng)域本體,四層領(lǐng)域本體的各層概念及層次關(guān)系如圖1所示。
上層本體的構(gòu)建基于頂層本體,繼承了頂層本體中的實(shí)體與關(guān)系,并按照實(shí)體粒度擴(kuò)展子類體系,描述了具有領(lǐng)域特征的上層類和關(guān)系,起到了銜接頂層及應(yīng)用本體的功能;針對(duì)具體領(lǐng)域,依據(jù)明確的領(lǐng)域需求與應(yīng)用目標(biāo),構(gòu)建能夠較為全面描述該領(lǐng)域知識(shí)的應(yīng)用本體;而實(shí)例本體則通過應(yīng)用本體類的匹配與映射,實(shí)現(xiàn)具體領(lǐng)域的實(shí)例集成。
傳統(tǒng)的領(lǐng)域本體只能表示具體領(lǐng)域中概念及關(guān)系,不能表示多個(gè)領(lǐng)域中概念集的共有屬性以及概念間的普遍關(guān)系,割裂了領(lǐng)域間知識(shí)的普遍聯(lián)系,不利于領(lǐng)域知識(shí)的復(fù)用以及整合。針對(duì)基于領(lǐng)域本體的多領(lǐng)域知識(shí)表示的不足,本文構(gòu)建了多層領(lǐng)域本體通用模型,用于多領(lǐng)域知識(shí)的表示,圖2為由頂層本體、上層本體、應(yīng)用本體、實(shí)例本體組成的四層本體架構(gòu)的多層領(lǐng)域本體模型框架。
圖1 多層領(lǐng)域本體的層次關(guān)系圖
圖2 多層領(lǐng)域本體的模型框架
作為適用于各領(lǐng)域構(gòu)建領(lǐng)域本體的普適框架,在信息系統(tǒng)的知識(shí)表示中,頂層本體能適應(yīng)不同領(lǐng)域需求的變化,能夠用于各領(lǐng)域知識(shí)的共享與重構(gòu)。頂層框架中的實(shí)體不具有領(lǐng)域特征,是對(duì)現(xiàn)實(shí)世界中的對(duì)象從各層面進(jìn)行的抽象描述?;谝延形墨I(xiàn)[16],分析了基于5W1H的頂層本體構(gòu)建方法,將頂層本體分為六個(gè)通用組成模塊,即What-客體模塊、Where-地點(diǎn)模塊、When-時(shí)間模塊、Who-主體模塊、Why-原因模塊、How-方法模塊。
通過四元組O=(C,A,R,X)表示概念及概念間的關(guān)系,其中,C 表示本體中概念的集合,A 表示概念屬性的集合,R 表示概念間關(guān)系的集合,X 表示本體的公理與規(guī)則組成的集合。
概念集合C 由5W1H 的六個(gè)模塊的概念集合組成,即C=Cwhat∪Cwhere∪Cwhen∪Cwho∪Cwhy∪Chow,為了保證概念非奇異,設(shè)Ci ∩Cj=?{i ≠j ∧i,j ∈(what,where,when,who,why,how)}。
Cwhat表示有關(guān)研究對(duì)象的概念集合,其他五個(gè)以此類推。
本體中的概念間的關(guān)系R 分為分類關(guān)系Rt 與依賴關(guān)系Rd,即R=Rt ∪Rd,R ?Ci×Cj(Ci,Cj ∈Cwhat∨Cwhere∨Cwhen∨Cwho∨Cwhy∨Chow)。
分類關(guān)系包括繼承關(guān)系kind-of 及整體部分關(guān)系part-of,依賴關(guān)系表示概念間存在的語義關(guān)系。
通過Protégé定義頂層本體中的概念、屬性、關(guān)系及公理。以When-時(shí)間模塊的頂層本體為例,如圖3 所示。時(shí)間模塊的頂層本體涵蓋了時(shí)間所有的通用概念、屬性以及關(guān)系。
圖3 When-時(shí)間模塊的頂層本體
上層本體涉及多領(lǐng)域知識(shí),本體的粒度過大,不利于知識(shí)的復(fù)用、整合及維護(hù)[17]。為了解決該問題,研究了模塊化的上層本體構(gòu)建方法,細(xì)化本體構(gòu)建粒度,通過多領(lǐng)域?qū)<覅f(xié)作、自治構(gòu)建模塊化本體的基礎(chǔ)上,完成本體的復(fù)用、裂變、重組,從而提升通用本體的構(gòu)建效率及進(jìn)化能力[18],上層本體的模塊化構(gòu)建流程[19]如圖4所示。
其中,核心本體、原子本體都是領(lǐng)域本體,原子本體是模塊化本體構(gòu)建中的最小單位,是構(gòu)建的基礎(chǔ),深度不超過a(a >1);而核心本體是模塊化本體構(gòu)建的骨架,具有子模塊,深度不超過b(b >1)。模塊化本體構(gòu)建就是將子模型集成到核心本體模型中。具體步驟如下:
圖4 上層本體的模塊化構(gòu)建流程
步驟1 根據(jù)本體的構(gòu)建目標(biāo)確定領(lǐng)域范圍。
步驟2 依據(jù)領(lǐng)域邊界劃分本體模塊。
步驟3 確定各模塊的核心本體及原子本體。
步驟4 將原子本體模塊集成到核心本體模塊,構(gòu)建本體模塊。
步驟5 將多個(gè)本體模塊集成為一個(gè)模塊化本體。
在模塊化本體構(gòu)建過程中,通過多領(lǐng)域?qū)<业膮f(xié)作管理,保證各領(lǐng)域之間語義的一致性,及模塊化本體的構(gòu)建質(zhì)量。
每個(gè)上層本體模塊由c 個(gè)核心本體與d 個(gè)原子本體組成,其中,c=1 或0,d ≥0,即每個(gè)上層本體模塊最多包含一個(gè)核心本體。若c=0,則上層本體模塊為原子本體模塊;若c=1,則上層本體模塊中至少有一個(gè)核心本體是其一個(gè)子模塊的根,逐層分解,最終的子模塊為原子本體模塊。以電子產(chǎn)品上層本體為例,其模塊化本體的形成如圖5所示。
圖5 電子產(chǎn)品模塊化本體
應(yīng)用本體是上層本體的細(xì)分領(lǐng)域,依據(jù)頂層本體以及上層本體的基礎(chǔ)框架,基于實(shí)際的應(yīng)用場(chǎng)景,分析相關(guān)領(lǐng)域的關(guān)鍵知識(shí),依次拓展上層本體,構(gòu)建表示具體應(yīng)用領(lǐng)域知識(shí)的模型。
基于信息系統(tǒng)所涉及的具體領(lǐng)域知識(shí)需求,確定知識(shí)表示所需要的領(lǐng)域本體,一方面基于主題詞表,制定詞表向本體轉(zhuǎn)化的映射規(guī)則;另一方面將領(lǐng)域中已有本體作為補(bǔ)充資源,通過詞表概念的規(guī)范、映射和本體的重用、重構(gòu),形成能夠體現(xiàn)領(lǐng)域共有特征的核心概念及關(guān)系體系,從而構(gòu)建用于多領(lǐng)域知識(shí)組織和描述的應(yīng)用本體,形成應(yīng)用本體的詳細(xì)描述文件OWL[20]。
概念體系的構(gòu)建是應(yīng)用本體構(gòu)建的重點(diǎn)工作,主要包括5個(gè)部分:
(1)確定本體的核心大類;
(2)確定類的等級(jí)關(guān)系;
(3)定義類間的關(guān)系;
(4)定義類的屬性;
(5)創(chuàng)建類的實(shí)例。
應(yīng)用本體的構(gòu)建具體流程如圖6所示。
圖6 應(yīng)用本體的構(gòu)建流程
以電子產(chǎn)品上層本體中的筆記本應(yīng)用本體的構(gòu)建流程為例:
(1)創(chuàng)建筆記本主題詞表
基于TF-IWF算法提取筆記本行業(yè)分類標(biāo)準(zhǔn)中的關(guān)鍵詞,借助HowNet的標(biāo)準(zhǔn)對(duì)關(guān)鍵詞進(jìn)行規(guī)范,構(gòu)建筆記本主題詞表。
(2)確定類的等級(jí)體系
基于筆記本應(yīng)用本體的核心概念,對(duì)類的等級(jí)體系進(jìn)行擴(kuò)展。
(3)定義類的屬性
筆記本應(yīng)用本體的屬性代表概念的數(shù)據(jù)特征。
如“存儲(chǔ)設(shè)備”類包含3 個(gè)屬性:內(nèi)存容量、硬盤容量以及光驅(qū)類型。
(4)定義類間的關(guān)系
分析概念與概念之間的關(guān)系,定義筆記本領(lǐng)域本體中類間的關(guān)系。本體中的關(guān)系可劃分為等級(jí)關(guān)系與非等級(jí)關(guān)系,主要的類間關(guān)系包括:整體-部分關(guān)系、同義關(guān)系、反義關(guān)系、轉(zhuǎn)指關(guān)系、指示關(guān)系。
(5)筆記本應(yīng)用本體的OWL實(shí)現(xiàn)
通過Protégé構(gòu)建筆記本應(yīng)用本體,以O(shè)WL語言作為本體的表示語言,構(gòu)建的本體由24個(gè)類,56個(gè)數(shù)據(jù)屬性以及13個(gè)關(guān)系組成。
圖7 實(shí)例本體的概念集C與關(guān)系屬性集R
采用手工構(gòu)建本體的方法,以O(shè)WL 語言作為本體的表示語言,利用protégé 完成實(shí)例本體的設(shè)計(jì)。實(shí)例本體的具體創(chuàng)建流程如下:
步驟1 解析應(yīng)用本體模型的OWL,得到概念模型,獲取對(duì)應(yīng)目標(biāo)的概念集C。
步驟2 解析應(yīng)用本體模型的OWL,得到關(guān)系模型,獲取與概念集C 相對(duì)應(yīng)的關(guān)系屬性集R。
步驟3 設(shè)置概念C 相關(guān)聯(lián)的數(shù)據(jù)屬性集A,由本體的公理與規(guī)則X 約束。
步驟4 將上述的概念集C、關(guān)系屬性集R、數(shù)據(jù)屬性集A,填充到實(shí)例本體。
以“筆記本”領(lǐng)域中的聯(lián)想Air 13實(shí)例為例,為其創(chuàng)建實(shí)例本體,其中,概念集C 與關(guān)系屬性集R 如圖7所示,數(shù)據(jù)屬性集A 如表1所示。
表1 實(shí)例本體的數(shù)據(jù)屬性集A
基于多層領(lǐng)域本體的知識(shí)表示通用模型的有效性通過該模型的語義檢索進(jìn)行驗(yàn)證。具體驗(yàn)證步驟如下:
步驟1 獲取用戶的查詢請(qǐng)求;
步驟2 將查詢的條件與本體庫(kù)中的概念進(jìn)行語義匹配;
步驟3 通過搜索引擎查詢語義索引庫(kù);
步驟4 將檢索結(jié)果以一定的相關(guān)度進(jìn)行排序;
步驟5 排序結(jié)果返回給用戶。
仿真實(shí)驗(yàn)包括本體管理、語義索引庫(kù)、查詢分析及信息檢索四個(gè)模塊,如圖8所示。
圖8 語義檢索實(shí)驗(yàn)流程
語義檢索的主要功能是從用戶請(qǐng)求中挖掘出檢索關(guān)鍵詞,并將它們傳遞到系統(tǒng)的檢索模塊。仿真實(shí)驗(yàn)中的語義擴(kuò)展包括同義關(guān)系、整體-部分關(guān)系及實(shí)例關(guān)系。將預(yù)處理后的查詢條件與語義索引庫(kù)中的信息進(jìn)行匹配,計(jì)算兩者的相似度,對(duì)相似度不小于閾值α 的檢索結(jié)果進(jìn)行排序,并以合適的形式返回給用戶。
本實(shí)驗(yàn)語義相似度的計(jì)算采用基于屬性的Tversky算法,對(duì)于檢索關(guān)鍵詞M 和待檢索概念N ,Tversky算法如下:
其中,f(M ?N)表示M 和N 的公有屬性個(gè)數(shù),f(MN)表示M 有而N 沒有的屬性個(gè)數(shù),f(N-M)表示N有而M 沒有的屬性個(gè)數(shù),權(quán)重β 與γ ∈[0,1],本實(shí)驗(yàn)中設(shè)β=γ=0.5。
若相似度Sim(M,N)≥α,則概念N 滿足檢索要求。
為了客觀地評(píng)價(jià)基于多層領(lǐng)域本體的知識(shí)表示通用模型的有效性,在單個(gè)領(lǐng)域以及多個(gè)領(lǐng)域知識(shí)環(huán)境下,將其與基于傳統(tǒng)領(lǐng)域本體的知識(shí)表示模型以及傳統(tǒng)的關(guān)鍵詞知識(shí)表示模型進(jìn)行對(duì)比分析。
其中,單個(gè)領(lǐng)域選擇應(yīng)用本體中的筆記本應(yīng)用本體,多個(gè)領(lǐng)域選擇電子產(chǎn)品上層本體中多個(gè)應(yīng)用本體。
在單個(gè)領(lǐng)域知識(shí)環(huán)境下,仿真實(shí)驗(yàn)隨機(jī)選取10 個(gè)筆記本應(yīng)用本體內(nèi)相關(guān)主題進(jìn)行測(cè)試;而在多個(gè)領(lǐng)域知識(shí)環(huán)境下,仿真實(shí)驗(yàn)在電子產(chǎn)品上層本體中隨機(jī)選取10個(gè)不同應(yīng)用本體內(nèi)相關(guān)主題進(jìn)行測(cè)試。不同領(lǐng)域環(huán)境下三種模型在不同的相似度閾值下的語義檢索結(jié)果如表2所示。其中,召回率R 與精度P 是衡量檢索效果的兩項(xiàng)重要指標(biāo),假設(shè),系統(tǒng)檢索到的相關(guān)信息為A,系統(tǒng)檢索到的不相關(guān)信息為B,相關(guān)但是沒被系統(tǒng)檢索到的信息為C ,不相關(guān)且沒有被系統(tǒng)檢索到的信息為D,則召回率R=A/(A+C),精度P=A/(A+B)。
在單個(gè)領(lǐng)域環(huán)境下,從整體上看,基于多層領(lǐng)域本體的知識(shí)表示模型與基于傳統(tǒng)領(lǐng)域本體的知識(shí)表示模型的召回率R 與精度P 差異都有限,基于多層領(lǐng)域本體的知識(shí)表示模型略高;但相比于基于關(guān)鍵詞的知識(shí)表示模型,無論是召回率R 還是精度P,基于本體的知識(shí)表示模型優(yōu)勢(shì)都較為明顯。這說明在表示單個(gè)領(lǐng)域知識(shí)時(shí),基于多層領(lǐng)域本體與基于傳統(tǒng)領(lǐng)域本體的知識(shí)表示模型,由于不涉及多個(gè)領(lǐng)域知識(shí),因此,它們的效果相當(dāng);但它們都考慮了概念間的語義關(guān)系,因此,較單純的基于關(guān)鍵詞的知識(shí)表示模型具有明顯優(yōu)勢(shì)。從不同相似度閾值的局部上看,隨著相似度閾值的降低,三種模型的召回率R 都是逐步提升;三種模型的精度P 在相似度閾值取中間值時(shí)達(dá)到頂峰;并且在相似度閾值取中間值時(shí),三種模型無論是召回率R 還是精度P 之間的差異都最小,這是因?yàn)槎鄬宇I(lǐng)域本體主要功效在于提高查詢請(qǐng)求與相關(guān)結(jié)果間的相似度,降低與不相關(guān)結(jié)果間的相似度,從而讓更多的相關(guān)結(jié)果排在比較靠前的位置,因此在相似度閾值較高或較低時(shí),基于多層領(lǐng)域本體的知識(shí)表示模型優(yōu)勢(shì)明顯,在中間相似度閾值時(shí),優(yōu)勢(shì)就不那么顯著了。
在多個(gè)領(lǐng)域環(huán)境下,從整體上看,不同于單個(gè)領(lǐng)域環(huán)境,此時(shí),基于多層領(lǐng)域本體的知識(shí)表示模型與基于傳統(tǒng)領(lǐng)域本體的知識(shí)表示模型的召回率R 與精度P 有著明顯的差異;而基于傳統(tǒng)領(lǐng)域本體的知識(shí)表示模型與基于關(guān)鍵詞的知識(shí)表示模型之間的差異反而降低了。這是由于基于多層領(lǐng)域本體的知識(shí)表示模型有利于不同領(lǐng)域知識(shí)間的調(diào)用與共享,在多領(lǐng)域環(huán)境下,基于多層領(lǐng)域本體的知識(shí)表示模型的性能才能完全體現(xiàn);而基于傳統(tǒng)領(lǐng)域本體的知識(shí)表示模型的優(yōu)勢(shì)被很大程度上削弱。從不同相似度閾值的局部上看,相比于單個(gè)領(lǐng)域,無論是召回率R 還是精度P ,同一相似度閾值下,基于多層領(lǐng)域本體的知識(shí)表示模型稍微有所降低,但基于傳統(tǒng)領(lǐng)域本體的知識(shí)表示模型與基于關(guān)鍵詞的知識(shí)表示模型降低得則更為明顯。且隨著相似度閾值的增加,后兩者的召回率R 與精度P 的降低幅度也在增加。說明當(dāng)系統(tǒng)對(duì)相似度要求較高時(shí),基于多層領(lǐng)域本體的知識(shí)表示模型較后兩者更適合于涉及多領(lǐng)域知識(shí)的系統(tǒng)要求。
考慮到傳統(tǒng)的基于關(guān)鍵詞的知識(shí)管理過程中,沒有分析知識(shí)所蘊(yùn)涵的語義關(guān)系,導(dǎo)致了知識(shí)檢索結(jié)果的查全率及查準(zhǔn)率都不能令用戶滿意。因此,分析了基于領(lǐng)域本體的知識(shí)表示,但也只能適用于單一領(lǐng)域知識(shí)體系,在分析復(fù)雜信息系統(tǒng)的知識(shí)表示需求基礎(chǔ)上,借鑒頂層本體提供的上層語義知識(shí),構(gòu)建多層領(lǐng)域本體,并詳細(xì)分析了各層本體的構(gòu)建流程。
最后,通過基于多層領(lǐng)域本體的語義檢索驗(yàn)證了基于多層領(lǐng)域本體的知識(shí)表示通用模型的有效性。仿真實(shí)驗(yàn)結(jié)果發(fā)現(xiàn),在單個(gè)領(lǐng)域環(huán)境下,無論是多層領(lǐng)域本體的知識(shí)表示模型,還是傳統(tǒng)領(lǐng)域本體的知識(shí)表示模型,二者效果相當(dāng),較基于關(guān)鍵詞的知識(shí)表示模型具有明顯優(yōu)勢(shì)。在多個(gè)領(lǐng)域環(huán)境下,基于多層領(lǐng)域本體的知識(shí)表示模型的優(yōu)勢(shì)得以真正體現(xiàn),無論是召回率R 還是精度P ,不僅較基于關(guān)鍵詞的知識(shí)表示模型有顯著優(yōu)勢(shì),較傳統(tǒng)領(lǐng)域本體的知識(shí)表示模型也有顯著優(yōu)勢(shì)。
表2 不同領(lǐng)域環(huán)境下三種模型語義檢索性能結(jié)果對(duì)比表 %