• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      面向領(lǐng)域本體非分類關(guān)系的語(yǔ)義相關(guān)度計(jì)算方法

      2016-12-26 08:14:22樊紅杰

      王 紅 樊紅杰 孫 康

      (中國(guó)民航大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院 天津 300300)

      ?

      面向領(lǐng)域本體非分類關(guān)系的語(yǔ)義相關(guān)度計(jì)算方法

      王 紅 樊紅杰 孫 康

      (中國(guó)民航大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院 天津 300300)

      針對(duì)民航突發(fā)事件領(lǐng)域本體非分類關(guān)系的語(yǔ)義查詢擴(kuò)展問(wèn)題,提出一種面向領(lǐng)域本體非分類關(guān)系的語(yǔ)義相關(guān)度計(jì)算方法。該方法在數(shù)據(jù)屬性方面,提出基于屬性類型和屬性值的語(yǔ)義相關(guān)度計(jì)算方法;在對(duì)象屬性方面,針對(duì)查詢?cè)~與本體概念或?qū)嵗嬖诙喾N對(duì)象屬性問(wèn)題,提出基于對(duì)象屬性的語(yǔ)義相關(guān)度計(jì)算方法,并結(jié)合領(lǐng)域本體在民航突發(fā)事件案例的語(yǔ)義查詢過(guò)程給出了該方法的實(shí)現(xiàn)效果分析。該方法不僅有效地提高了語(yǔ)義查詢的準(zhǔn)確率和查全率,也為民航突發(fā)事件的應(yīng)急決策提供了更好的方法支持。

      民航突發(fā)事件 領(lǐng)域本體 非分類關(guān)系 語(yǔ)義相關(guān)度

      0 引 言

      本體是共享概念模型的明確的規(guī)范說(shuō)明[1]。領(lǐng)域本體是用于描述指定領(lǐng)域知識(shí)的一種專門本體,它將與特定領(lǐng)域相關(guān)的概念以及概念間的關(guān)系以形式化的說(shuō)明進(jìn)行了嚴(yán)格的規(guī)范,明確描述了概念的含義以及概念間語(yǔ)義的關(guān)系。民航突發(fā)事件領(lǐng)域本體是以民航突發(fā)事件應(yīng)急救援計(jì)劃、民航應(yīng)急管理相關(guān)規(guī)定、民航突發(fā)事件應(yīng)急救援預(yù)案,民航突發(fā)事件歷史案例為基礎(chǔ),通過(guò)概念以及概念間關(guān)系的形式化描述,明確了領(lǐng)域中概念及概念間的語(yǔ)義關(guān)系。之前開展的基于領(lǐng)域本體的語(yǔ)義檢索方法[2]是基于概念間的分類關(guān)系實(shí)現(xiàn)的,雖然有效解決了傳統(tǒng)的基于關(guān)鍵詞查詢方法所存在的語(yǔ)義偏差和語(yǔ)義歧義等問(wèn)題,但在查全率和查準(zhǔn)率方面依然存在不足。非分類關(guān)系是指除分類關(guān)系以外的所有其他關(guān)系,是概念間語(yǔ)義關(guān)系的重要組成部分,影響著語(yǔ)義查詢擴(kuò)展的效率。因此,本文面向領(lǐng)域本體對(duì)基于非分類關(guān)系的語(yǔ)義相關(guān)度計(jì)算方法展開了研究。

      目前,針對(duì)本體非分類關(guān)系的語(yǔ)義相關(guān)度計(jì)算方法的研究主要集中在數(shù)據(jù)屬性[3-6]方面,在對(duì)象屬性方面的研究[7,8]還比較少。本文結(jié)合民航突發(fā)事件應(yīng)急救援的特殊性,通過(guò)深入分析已構(gòu)建的民航突發(fā)事件領(lǐng)域本體[9,10]的特征,提出一種面向領(lǐng)域本體非分類關(guān)系的語(yǔ)義相關(guān)度計(jì)算方法。該方法不僅提高了語(yǔ)義查詢的準(zhǔn)確率和查全率,同時(shí)也為民航突發(fā)事件的應(yīng)急決策與救援提供了輔助作用。

      1 語(yǔ)義相關(guān)度

      1.1 語(yǔ)義相關(guān)度定義

      在本體領(lǐng)域,語(yǔ)義相關(guān)度是指概念間語(yǔ)義相互關(guān)聯(lián)程度[11]。語(yǔ)義相關(guān)的兩個(gè)概念可能不存在相似關(guān)系,但它們可以通過(guò)某些其他關(guān)系相關(guān)聯(lián)形成相關(guān)關(guān)系。語(yǔ)義相似度是語(yǔ)義相關(guān)度的特例,通常情況下,相似概念一般是相關(guān)的,但相關(guān)概念卻不一定相似。

      本文依據(jù)語(yǔ)義相關(guān)度的一般定義和已構(gòu)建的民航突發(fā)事件領(lǐng)域本體的特點(diǎn),給出了以下基于民航突發(fā)事件領(lǐng)域本體的語(yǔ)義相關(guān)度的定義:

      語(yǔ)義相關(guān)度是指本體中概念在非分類關(guān)系上的相關(guān)程度,記概念ci、cj之間的相關(guān)度為Sim(ci, cj),它需滿足以下條件:

      (1) 相關(guān)度的值是區(qū)間[0,1]內(nèi)的一個(gè)實(shí)數(shù),即Sim(ci, cj)?[0,1];

      (2) 如果兩個(gè)概念完全相似,則相關(guān)度值為1,即Sim(ci, cj)=1(當(dāng)且僅當(dāng)ci=cj);

      (3) 如果兩個(gè)概念之間不存在任何連通路徑,則相關(guān)度值為0,即Sim(ci, cj)=0;

      (4) 概念之間的相關(guān)度是對(duì)稱的,即Sim(ci, cj)= Sim(cj, ci)。

      1.2 語(yǔ)義相關(guān)度計(jì)算方法

      在民航突發(fā)事件領(lǐng)域本體中,非分類關(guān)系分為數(shù)據(jù)屬性關(guān)系和對(duì)象屬性關(guān)系。本文通過(guò)對(duì)數(shù)據(jù)屬性和對(duì)象屬性語(yǔ)義相關(guān)度的研究,提出了一種基于非分類關(guān)系的語(yǔ)義相關(guān)度計(jì)算方法,并將其應(yīng)用于領(lǐng)域本體中事故案例的語(yǔ)義查詢擴(kuò)展中,其實(shí)現(xiàn)模型如圖1所示。

      圖1 面向領(lǐng)域本體非分類關(guān)系的語(yǔ)義相關(guān)度計(jì)算方法模型

      圖1中:

      相關(guān)定義:負(fù)責(zé)語(yǔ)義相關(guān)度、數(shù)據(jù)屬性權(quán)重和對(duì)象屬性權(quán)重的定義。

      相關(guān)度計(jì)算:實(shí)現(xiàn)查詢?cè)~與本體概念、實(shí)例基于非分類關(guān)系的語(yǔ)義相關(guān)度計(jì)算。

      相關(guān)度應(yīng)用:將該基于非分類關(guān)系的語(yǔ)義相關(guān)度計(jì)算方法應(yīng)用于民航突發(fā)事件領(lǐng)域本體中的事故案例語(yǔ)義查詢擴(kuò)展中。

      2 領(lǐng)域本體數(shù)據(jù)屬性的語(yǔ)義相關(guān)度計(jì)算

      2.1 數(shù)據(jù)屬性的權(quán)重

      當(dāng)民航突發(fā)事件發(fā)生時(shí),救援指揮中心根據(jù)獲取的各種事故信息和救援信息制定相應(yīng)的救援方案并通知各救援部門實(shí)施及時(shí)、有效的救援。在突發(fā)事件的應(yīng)急決策與救援中,突發(fā)事件案例對(duì)實(shí)現(xiàn)事故的及時(shí)、有效救援起到了重要的借鑒和指導(dǎo)作用。已構(gòu)建的民航突發(fā)事件領(lǐng)域本體中與突發(fā)事件案例相關(guān)的數(shù)據(jù)屬性如表1所示,這些數(shù)據(jù)屬性實(shí)現(xiàn)了對(duì)突發(fā)事件案例的特征描述。

      表1 領(lǐng)域本體中與突發(fā)事件案例相關(guān)的數(shù)據(jù)屬性及取值

      由于突發(fā)事件案例對(duì)事故的應(yīng)急決策與救援具有重要的借鑒和指導(dǎo)作用,本文依據(jù)突發(fā)事件案例的各種信息在事故應(yīng)急決策與救援中起到的重要程度,為上述數(shù)據(jù)屬性分配了一定的權(quán)重。數(shù)據(jù)屬性的權(quán)重越大,該數(shù)據(jù)屬性越重要,越不可缺失。

      對(duì)于各屬性權(quán)重的具體取值,需要結(jié)合民航突發(fā)事件應(yīng)急決策與救援的實(shí)際需求。由于Event_Level直接決定了應(yīng)急救援響應(yīng)等級(jí),因此其權(quán)重應(yīng)最大。Operation_Stage、Weather_Type、Event_Location對(duì)事故評(píng)估、救援實(shí)施具有重要作用,因此要為其分配次大的權(quán)重值。Plane_Type、Plane_Task和Event_Time對(duì)事故救援起到的輔助作用相比其他屬性要弱一些,因此其權(quán)重值應(yīng)較小。本文將上述各數(shù)據(jù)屬性權(quán)重值限定在區(qū)間[0,1]內(nèi),并對(duì)其進(jìn)行歸一化處理,最終為各數(shù)據(jù)屬性分配如表2所示的權(quán)重值。

      表2 數(shù)據(jù)屬性的權(quán)重

      2.2 數(shù)據(jù)屬性類型的語(yǔ)義相關(guān)度

      在本體中,數(shù)據(jù)屬性將本體概念與屬性值類型、本體實(shí)例與具體屬性值相關(guān)聯(lián),它實(shí)現(xiàn)了對(duì)本體概念和實(shí)例的特征描述,起到了語(yǔ)義標(biāo)簽的作用。

      目前,基于數(shù)據(jù)屬性的語(yǔ)義相關(guān)度計(jì)算方法中最經(jīng)典且最常被引用的是Tversrvy[3]方法,其公式如下:

      (1)

      其中,f(ci, cj)表示本體概念ci、cj擁有的相同數(shù)據(jù)屬性的數(shù)量,f(ci- cj)表示ci擁有但cj沒(méi)有的數(shù)據(jù)屬性數(shù)量,f(cj-ci)表示cj擁有但ci沒(méi)有的數(shù)據(jù)屬性數(shù)量。α是調(diào)節(jié)因子,它與ci、cj的深度有關(guān),其取值如下:

      (2)

      該方法在語(yǔ)義相關(guān)度計(jì)算中將比較的兩概念視為同等重要,但語(yǔ)義查詢擴(kuò)展是利用目標(biāo)概念在本體中查詢擴(kuò)展出與其語(yǔ)義相似或相關(guān)的其他本體概念,上述方法削弱了目標(biāo)概念的重要性。同時(shí),該方法使用的是典型的特征匹配方法,忽略了屬性值之間的語(yǔ)義相關(guān)度問(wèn)題。因此,本節(jié)以目標(biāo)概念具有的數(shù)據(jù)屬性為基準(zhǔn),對(duì)概念在數(shù)據(jù)屬性類型和數(shù)據(jù)屬性值上的語(yǔ)義相關(guān)度分別進(jìn)行了研究。

      在數(shù)據(jù)屬性類型方面,兩概念擁有的相同屬性類型的個(gè)數(shù)越多,它們?cè)较嚓P(guān);反之,兩概念擁有的相同屬性類型的個(gè)數(shù)越少,它們?cè)讲幌嚓P(guān)[12]。以目標(biāo)概念或?qū)嵗哂械臄?shù)據(jù)屬性為基準(zhǔn),提出了以下基于數(shù)據(jù)屬性類型的語(yǔ)義相關(guān)度計(jì)算:

      (3)

      (4)

      其中,ci、cj是任意本體概念或?qū)嵗?,ci作為目標(biāo)概念或?qū)嵗琧j作為源概念或?qū)嵗?。cik表示ci的第k個(gè)數(shù)據(jù)屬性;cjl表示cj的第l個(gè)數(shù)據(jù)屬性。type(cik)表示ci的第k個(gè)數(shù)據(jù)屬性的屬性類型。Simtype(cik, cjl)表示數(shù)據(jù)屬性cik、cjk基于屬性類型的語(yǔ)義相關(guān)度。wk是數(shù)據(jù)屬性cik的權(quán)重值。n、m分別表示ci、cj擁有的數(shù)據(jù)屬性的個(gè)數(shù)。

      2.3 數(shù)據(jù)屬性值的語(yǔ)義相關(guān)度

      在民航突發(fā)事件領(lǐng)域本體中,數(shù)據(jù)屬性值有三種:有序枚舉型屬性值、無(wú)序枚舉型屬性值和混合枚舉型屬性值。數(shù)據(jù)屬性值的類型不同,對(duì)屬性值的語(yǔ)義相關(guān)度計(jì)算方法也應(yīng)不同。因此,根據(jù)數(shù)據(jù)屬性值的特點(diǎn)提出了三種基于屬性值的語(yǔ)義相關(guān)度計(jì)算。

      1) 有序枚舉型屬性值的語(yǔ)義相關(guān)度

      有序枚舉型屬性值是指屬性在給定的一個(gè)數(shù)據(jù)集中進(jìn)行取值,該數(shù)據(jù)集中的數(shù)據(jù)存在有序關(guān)系,例如Event_Level的取值有1(特別重大)、2(重大)、3(較大)和4(一般)。

      對(duì)于有序枚舉型屬性值,屬性值相差越大,其語(yǔ)義相關(guān)度越??;反之,屬性值相差越小,其語(yǔ)義相關(guān)度越大。在有序枚舉型屬性值的語(yǔ)義相關(guān)度計(jì)算方面,目前最常用的是海明距離法,其計(jì)算公式如下:

      (5)

      其中,Pi、Pj表示數(shù)據(jù)屬性,xi、xj是Pi、Pj的數(shù)值型屬性值。

      該方法雖然解決了對(duì)有序枚舉型屬性值的語(yǔ)義相關(guān)度計(jì)算問(wèn)題,但是計(jì)算結(jié)果受取值個(gè)數(shù)的影響較大。為了增強(qiáng)有序枚舉型屬性值之差對(duì)相關(guān)度的影響,進(jìn)行了以下改進(jìn):

      (6)

      其中,ci、cj是任意本體實(shí)例,SimValue(cik, cjk)表示ci、cj在第k個(gè)數(shù)據(jù)屬性上基于屬性值的語(yǔ)義相關(guān)度。xk、yk分別表示ci和cj的第k個(gè)數(shù)據(jù)屬性的數(shù)值型屬性值。m是第k個(gè)數(shù)據(jù)屬性的取值個(gè)數(shù)。

      2) 無(wú)序枚舉型屬性值的語(yǔ)義相關(guān)度

      無(wú)序枚舉型屬性值是指屬性在給定的一個(gè)數(shù)據(jù)集中進(jìn)行取值,該數(shù)據(jù)集中的所有數(shù)據(jù)之間無(wú)關(guān)聯(lián)關(guān)系,例如數(shù)據(jù)屬性Weather_Type的取值有“適航”、“臺(tái)風(fēng)”、“雷暴”、“冰雹”等。

      無(wú)序枚舉型屬性值一般都是字符型,因此,對(duì)于該屬性值的語(yǔ)義相關(guān)度計(jì)算使用字符匹配法,即:

      (7)

      其中,ci、cj是任意本體實(shí)例,SimValue(cik, cjk)表示ci、cj在第k個(gè)數(shù)據(jù)屬性上基于無(wú)序枚舉型屬性值的語(yǔ)義相關(guān)度。xk、yk分別表示ci和cj的第k個(gè)數(shù)據(jù)屬性的屬性值。

      3) 混合枚舉型屬性值的語(yǔ)義相關(guān)度

      混合枚舉型屬性值是指屬性在給定的多個(gè)數(shù)據(jù)集中進(jìn)行取值,這些數(shù)據(jù)集之間存在分類關(guān)系,各數(shù)據(jù)集內(nèi)部所有數(shù)據(jù)之間無(wú)關(guān)聯(lián)關(guān)系。由于混合枚舉型屬性值通常是字符型,所以最常使用的方法是字符匹配法。但是該方法忽略了屬性值之間的隱性語(yǔ)義關(guān)系,在一定程度上影響了語(yǔ)義相關(guān)度計(jì)算的準(zhǔn)確度,因此本文依據(jù)該屬性值的特點(diǎn),提出了一種針對(duì)混合枚舉型屬性值的語(yǔ)義相關(guān)度計(jì)算方法。

      對(duì)于混合枚舉型屬性值的語(yǔ)義相關(guān)度計(jì)算,在計(jì)算前先對(duì)屬性的取值數(shù)據(jù)集進(jìn)行有序編號(hào)。如數(shù)據(jù)屬性Plane_Task的取值數(shù)據(jù)集有商用航空數(shù)據(jù)集和通用航空數(shù)據(jù)集,商用航空數(shù)據(jù)集包含“客運(yùn)”、“貨運(yùn)”、“客貨運(yùn)”,通用航空數(shù)據(jù)集包含“工業(yè)航空”、“農(nóng)業(yè)航空”、“航空科研和探險(xiǎn)活動(dòng)”等。商用航空數(shù)據(jù)集的序號(hào)為1,通用航空數(shù)據(jù)集的序號(hào)為2,Plane_Task的屬性值“客運(yùn)”、“貨運(yùn)”、“飛行訓(xùn)練”間的語(yǔ)義相關(guān)度關(guān)系為Sim(客運(yùn),客運(yùn))>Sim(客運(yùn),貨運(yùn)) > Sim(客運(yùn),飛行訓(xùn)練)。

      依據(jù)混合枚舉型屬性值的特點(diǎn),基于混合枚舉型屬性值的語(yǔ)義相關(guān)度計(jì)算如下:

      (8)

      其中,ci、cj是任意本體實(shí)例,SimValue(cik, cjk)表示ci、cj在第k個(gè)數(shù)據(jù)屬性上基于混合枚舉型屬性值的語(yǔ)義相關(guān)度。Xk、Yk分別表示ci和cj的第k個(gè)數(shù)據(jù)屬性的屬性值所在數(shù)據(jù)集的序號(hào),如Plane_Task的屬性值“客運(yùn)”所在數(shù)據(jù)集的序號(hào)為1,“飛行訓(xùn)練”所在數(shù)據(jù)集的序號(hào)為2。m是第k個(gè)數(shù)據(jù)屬性的取值數(shù)據(jù)集的個(gè)數(shù)。xk、yk分別表示ci和cj的第k個(gè)數(shù)據(jù)屬性的屬性值。

      2.4 基于數(shù)據(jù)屬性的語(yǔ)義相關(guān)度計(jì)算

      通過(guò)上述對(duì)屬性類型的語(yǔ)義相關(guān)度和屬性值的語(yǔ)義相關(guān)度的研究,提出了以下基于數(shù)據(jù)屬性的語(yǔ)義相關(guān)度計(jì)算:

      (9)

      其中,ci、cj是任意本體概念或?qū)嵗?,ci作為目標(biāo)概念或?qū)嵗?,cj作為源概念或?qū)嵗?。cik表示ci的第k個(gè)數(shù)據(jù)屬性。SimDat(ci,cj)表示ci、cj基于數(shù)據(jù)屬性的語(yǔ)義相關(guān)度。SimType(cik,cjl)表示cik、cjl在屬性類型上的語(yǔ)義相關(guān)度。SimValue(cik,cjl)表示cik、cjl在屬性值上的語(yǔ)義相關(guān)度。wk是屬性cik的權(quán)重值。n、m分別是ci、cj擁有的數(shù)據(jù)屬性的個(gè)數(shù)。

      3 領(lǐng)域本體對(duì)象屬性的語(yǔ)義相關(guān)度計(jì)算

      3.1 對(duì)象屬性的權(quán)重

      本體中,對(duì)象屬性將不同的概念、實(shí)例依據(jù)語(yǔ)義相關(guān)性關(guān)聯(lián)在一起,構(gòu)成了非分類關(guān)系。通常情況下,相似概念一般是相關(guān)的,但相關(guān)概念卻不一定相似。

      目前,通過(guò)對(duì)象屬性計(jì)算語(yǔ)義相關(guān)度的方法主要依賴于概念間的語(yǔ)義距離來(lái)實(shí)現(xiàn)。許多研究者將基于詞語(yǔ)距離的相似度計(jì)算方法引入了本體領(lǐng)域,成為了一種常用的基于對(duì)象屬性的語(yǔ)義相關(guān)度計(jì)算方法,其計(jì)算公式如下:

      (10)

      其中,ci、cj是任意本體概念或?qū)嵗?,length(ci, cj)是ci、cj之間包含對(duì)象屬性關(guān)系邊的路徑長(zhǎng)度。α是調(diào)節(jié)參數(shù)。

      后來(lái)一些研究者對(duì)概念間的對(duì)象屬性通過(guò)關(guān)系權(quán)重進(jìn)行了量化,進(jìn)而產(chǎn)生了利用權(quán)重路徑計(jì)算本體概念基于對(duì)象屬性的語(yǔ)義相關(guān)度的方法,其中最常用的方法為:

      (11)

      其中,ci、cj是任意本體概念或?qū)嵗瑆(ei)是ci、cj之間包含對(duì)象屬性關(guān)系邊的路徑中第ei條邊的權(quán)重。

      雖然該方法通過(guò)對(duì)象屬性實(shí)現(xiàn)了語(yǔ)義相關(guān)度的計(jì)算,但是它僅考慮了本體概念或?qū)嵗g只存在一種對(duì)象屬性的情況,對(duì)于本體概念或?qū)嵗g擁有多種對(duì)象屬性的情況并不適用。因此,本文基于民航突發(fā)事件領(lǐng)域本體對(duì)上述方法進(jìn)行了改進(jìn)。

      在民航突發(fā)事件領(lǐng)域本體中,與突發(fā)事件案例相關(guān)的對(duì)象屬性主要有PlanOwn、ActionOwn、RelatedCause、RelatedEffect、RelatedExperience、Keyfacor。由于突發(fā)事件案例對(duì)事故的應(yīng)急決策與救援具有重要的借鑒和指導(dǎo)作用,本文依據(jù)突發(fā)事件案例的各種信息在事故應(yīng)急決策與救援中的重要程度,為上述對(duì)象屬性分配了一定的權(quán)重。對(duì)象屬性的權(quán)重越大,該對(duì)象屬性越重要,越不可缺失。

      由于對(duì)象屬性是將概念、實(shí)例進(jìn)行語(yǔ)義相關(guān)聯(lián)的一種非分類關(guān)系,所以對(duì)象屬性的權(quán)重也與分類關(guān)系的權(quán)重相關(guān)。對(duì)于各對(duì)象屬性權(quán)重的具體取值,需要結(jié)合民航突發(fā)事件應(yīng)急決策與救援的實(shí)際需求、專家經(jīng)驗(yàn)和下文改進(jìn)的基于對(duì)象屬性的語(yǔ)義相關(guān)度計(jì)算方法進(jìn)行實(shí)驗(yàn)驗(yàn)證。實(shí)驗(yàn)中,將所有對(duì)象屬性的權(quán)重初值設(shè)為0.1且取值范圍為[0,1],同時(shí)以增值為0.1的方式對(duì)權(quán)重值進(jìn)行遞增,計(jì)算不同權(quán)重值下本體概念、實(shí)例基于對(duì)象屬性的語(yǔ)義相關(guān)度。實(shí)驗(yàn)發(fā)現(xiàn),當(dāng)對(duì)象屬性權(quán)重小于0.6時(shí),會(huì)導(dǎo)致概念間的語(yǔ)義相關(guān)度值過(guò)??;當(dāng)對(duì)象屬性權(quán)重大于0.8時(shí),會(huì)導(dǎo)致概念間的語(yǔ)義相關(guān)度值過(guò)大,與實(shí)際情況不符。最終,通過(guò)對(duì)不同對(duì)象屬性權(quán)重下的實(shí)驗(yàn)結(jié)果的分析和對(duì)比,得到如表3所示的各對(duì)象屬性的權(quán)重值。

      表3 民航突發(fā)事件領(lǐng)域本體中對(duì)象屬性權(quán)重值

      3.2 基于對(duì)象屬性的語(yǔ)義相關(guān)度計(jì)算

      設(shè)集合R={r1,r2,…,rm}為對(duì)象屬性非分類關(guān)系的集合,其中ri(i=1,2,…,m)是領(lǐng)域本體中已定義的某種對(duì)象屬性非分類關(guān)系。

      定義任意本體概念或?qū)嵗齝i和cj在對(duì)象屬性非分類關(guān)系ri上的相關(guān)值Vri(ci, cj)為:

      其中,weight(ri)是對(duì)象屬性非分類關(guān)系ri的權(quán)重值。

      在領(lǐng)域本體中,由于本體概念或?qū)嵗g可能存在多種對(duì)象屬性非分類關(guān)系,因此定義ci和cj在對(duì)象屬性非分類關(guān)系上的關(guān)系權(quán)重為:

      (12)

      其中,m為集合R中元素的個(gè)數(shù)。n為ci與cj間存在且不重復(fù)的對(duì)象屬性非分類關(guān)系的個(gè)數(shù)。

      將本體中通過(guò)對(duì)象屬性相關(guān)聯(lián)的概念或?qū)嵗闯墒怯梢粭l加權(quán)的非分類關(guān)系邊直接相連,則基于式(12)的關(guān)系權(quán)重計(jì)算,ci和cj在對(duì)象屬性上的語(yǔ)義相關(guān)度為:

      (13)

      其中,α、 β為調(diào)節(jié)參數(shù)。

      4 實(shí)現(xiàn)過(guò)程與效果分析

      4.1 實(shí)現(xiàn)過(guò)程

      通過(guò)上述對(duì)基于數(shù)據(jù)屬性和對(duì)象屬性的語(yǔ)義相關(guān)度的研究,提出了以下面向領(lǐng)域本體非分類關(guān)系的語(yǔ)義相關(guān)度計(jì)算方法。該方法將數(shù)據(jù)屬性和對(duì)象屬性的語(yǔ)義相關(guān)度進(jìn)行了結(jié)合,其計(jì)算方法如下:

      Sim(ci,cj)=?1SimDat(ci,cj)+?2SimNl(ci,cj)

      (14)

      其中,ci、cj是任意本體概念或?qū)嵗琧i作為目標(biāo)概念或?qū)嵗?,cj作為源概念或?qū)嵗?,Sim (ci, cj)表示 ci、cj基于非分類關(guān)系的語(yǔ)義相關(guān)度。?1、?2是調(diào)節(jié)因子,且?1+?2=1。

      在基于非分類關(guān)系的語(yǔ)義相關(guān)度計(jì)算方法中,通過(guò)設(shè)定一個(gè)閾值λ來(lái)限制查詢結(jié)果集的大小,將領(lǐng)域本體中與目標(biāo)查詢?cè)~的語(yǔ)義相關(guān)度大于閾值λ的本體概念和實(shí)例加入查詢結(jié)果集中,該方法的具體實(shí)現(xiàn)過(guò)程如圖2所示。

      圖2 基于非分類關(guān)系的語(yǔ)義相關(guān)度算法

      如圖2所示,基于民航突發(fā)事件領(lǐng)域本體將關(guān)鍵詞qk與本體概念、實(shí)例相匹配, 計(jì)算匹配的關(guān)鍵詞qk與其他任意本體概念或?qū)嵗齝j在數(shù)據(jù)屬性和對(duì)象屬性上的語(yǔ)義相關(guān)度值。確定調(diào)節(jié)因子?1、?2的值,計(jì)算出關(guān)鍵詞qk與cj基于非分類關(guān)系的總相關(guān)度值,將總相關(guān)度值大于閾值λ的本體概念或?qū)嵗尤氩樵兘Y(jié)果集OntoSet。

      4.2 實(shí)現(xiàn)效果與分析

      已構(gòu)建的民航突發(fā)事件領(lǐng)域本體主要包含了與民航突發(fā)事件相關(guān)的應(yīng)急預(yù)案、應(yīng)急案例、應(yīng)急救援處置方法等領(lǐng)域概念和實(shí)例,并對(duì)它們之間的各種語(yǔ)義關(guān)系進(jìn)行了描述。圖3是已構(gòu)建的民航突發(fā)事件領(lǐng)域本體的一部分。

      圖3 領(lǐng)域本體中的數(shù)據(jù)屬性和對(duì)象屬性

      圖3中,橢圓表示本體概念或?qū)嵗?,矩形表示屬性值,?shí)線空箭頭表示KindOf分類關(guān)系,實(shí)線實(shí)箭頭表示InstanceOf分類關(guān)系,虛線空箭頭表示數(shù)據(jù)屬性非分類關(guān)系,虛線實(shí)箭頭表示對(duì)象屬性非分類關(guān)系,邊上的權(quán)值是該關(guān)系邊對(duì)應(yīng)的關(guān)系權(quán)重。

      對(duì)于參數(shù)α、β的取值,依據(jù)已構(gòu)建的民航突發(fā)事件領(lǐng)域本體和基于對(duì)象屬性的相關(guān)度計(jì)算方法,首先進(jìn)行了多組相關(guān)實(shí)驗(yàn)。實(shí)驗(yàn)中將α、β的初值都設(shè)為0.5,并以增值為0.5的方式對(duì)α、β的值進(jìn)行遞增,計(jì)算不同的α、β值下本體概念、實(shí)例基于對(duì)象屬性的語(yǔ)義相關(guān)度。通過(guò)對(duì)所有相關(guān)度計(jì)算結(jié)果的分析和對(duì)比,最終確定α值為0.5、β值為1時(shí),結(jié)果最符合實(shí)際情況。

      為了驗(yàn)證本文提出的方法的有效性,將傳統(tǒng)的基于數(shù)據(jù)屬性的相關(guān)度計(jì)算方法Tversky方法[3]和P.W方法[13]作為對(duì)比方法,展開了以下實(shí)驗(yàn)。

      實(shí)驗(yàn)中,將數(shù)據(jù)屬性和對(duì)象屬性視為同等重要,因此參數(shù)?1、?2的取值分別為0.5、0.5。對(duì)于閾值λ的取值,需要考慮實(shí)際情況。如果λ值過(guò)大,會(huì)導(dǎo)致查詢結(jié)果集過(guò)小,影響語(yǔ)義查詢的查全率。如果λ 值過(guò)小,會(huì)將許多與查詢?cè)~的語(yǔ)義相關(guān)度較小的本體概念和實(shí)例加入查詢結(jié)果集中,影響語(yǔ)義查詢的查準(zhǔn)率。本文結(jié)合實(shí)際情況及需求,將閾值λ的取值設(shè)為0.38?;谝褬?gòu)建的民航突發(fā)事件領(lǐng)域本體,以“AF358號(hào)航班事故案例”為例,實(shí)驗(yàn)結(jié)果的部分對(duì)比情況如表4所示。

      表4 AF358航班事故案例相關(guān)度計(jì)算實(shí)驗(yàn)結(jié)果對(duì)比

      由于民航突發(fā)事件領(lǐng)域本體中,數(shù)據(jù)屬性是根據(jù)概念或?qū)嵗哂械奶卣鬟M(jìn)行定義的,因此同類概念、實(shí)例的數(shù)據(jù)屬性相關(guān),不同類概念、實(shí)例的數(shù)據(jù)屬性完全不相關(guān)。同時(shí),由于領(lǐng)域本體中對(duì)象屬性主要存在于不同類的概念、實(shí)例之間,因此通過(guò)對(duì)象屬性相關(guān)聯(lián)的概念或?qū)嵗跀?shù)據(jù)屬性上的相關(guān)性非常小,所以上述實(shí)驗(yàn)結(jié)果普遍偏小。

      為驗(yàn)證方法的有效性,共做了10組查詢對(duì)比實(shí)驗(yàn)。對(duì)得到的實(shí)驗(yàn)結(jié)果,使用信息檢索最常用的兩個(gè)基本評(píng)價(jià)指標(biāo)—查全率Recall和查準(zhǔn)率Precision進(jìn)行評(píng)測(cè)。用N表示領(lǐng)域本體中所有相關(guān)概念和實(shí)例總數(shù),A表示檢索出的概念和實(shí)例總數(shù),NC表示檢索出的所有相關(guān)概念和實(shí)例總數(shù),相關(guān)計(jì)算公式如下:

      (15)

      (16)

      將本文提出的語(yǔ)義相關(guān)度計(jì)算方法與對(duì)比方法的查全率Recall和查準(zhǔn)率Precision進(jìn)行了對(duì)比,對(duì)比結(jié)果如表5所示。

      表5 平均查全率和查準(zhǔn)率對(duì)比

      實(shí)驗(yàn)結(jié)果表明,Tversky方法通過(guò)將查詢?cè)~與本體概念、實(shí)例的數(shù)據(jù)屬性值進(jìn)行字符匹配來(lái)計(jì)算它們間的語(yǔ)義相關(guān)度。該方法不僅忽略了屬性值間的語(yǔ)義關(guān)系,同時(shí)也忽略了查詢?cè)~與本體概念、實(shí)例間的對(duì)象屬性,因此查全率和查準(zhǔn)率都較低。P.W方法基于多路徑長(zhǎng)度計(jì)算查詢?cè)~與本體概念、實(shí)例間的語(yǔ)義相關(guān)度,該方法忽略了它們?cè)跀?shù)據(jù)屬性上的語(yǔ)義相關(guān)問(wèn)題,因此查全率和查準(zhǔn)率也較低。本文提出的方法在數(shù)據(jù)屬性方面,既考慮了查詢?cè)~與本體概念、實(shí)例在屬性類型上的語(yǔ)義相關(guān)性,又考慮了它們?cè)趯傩灾瞪系恼Z(yǔ)義相關(guān)性;在對(duì)象屬性方面,其解決了查詢?cè)~與本體概念或?qū)嵗嬖诙喾N對(duì)象屬性非分類關(guān)系時(shí)的語(yǔ)義相關(guān)度問(wèn)題,在一定程度上提高了語(yǔ)義查詢的查全率和查準(zhǔn)率。

      5 結(jié) 語(yǔ)

      本文面向已構(gòu)建的民航突發(fā)事件領(lǐng)域本體,提出了一種基于非分類關(guān)系的語(yǔ)義相關(guān)度計(jì)算方法。該方法在數(shù)據(jù)屬性方面,提出了一種將數(shù)據(jù)屬性類型與屬性值相結(jié)合的語(yǔ)義相關(guān)度計(jì)算;該方法在對(duì)象屬性方面,解決了查詢?cè)~與本體概念或?qū)嵗嬖诙喾N對(duì)象屬性非分類關(guān)系時(shí)的語(yǔ)義相關(guān)度計(jì)算問(wèn)題。實(shí)驗(yàn)結(jié)果表明,該方法不僅有效提高了語(yǔ)義查詢的查全率和查準(zhǔn)率,同時(shí)也為民航突發(fā)事件的應(yīng)急決策與救援提供了輔助作用。但該方法仍存在不足,下一步的研究工作將針對(duì)查詢關(guān)鍵詞集與本體概念不匹配問(wèn)題,進(jìn)行相關(guān)概念推薦,進(jìn)一步提高查詢效率。

      [1] Studer R, Benjamins V R, Fensel D.Knowledge Engineering Principles and Methods[J].Data and Knowledge Engineering,1998,25(1-2):161-197.

      [2] 王紅,肖志偉,李剪,等.基于民航機(jī)場(chǎng)應(yīng)急資源語(yǔ)義檢索方法的研究[J].計(jì)算機(jī)應(yīng)用與軟件,2014,31(1):73-76,153.

      [3] Tversky A. Features of Similarity[J]. Psychological Review,1977,84(4):327-352.

      [4] David Sánchez, Montserrat Batet, David Isern,et al. Ontology-based Semantic Similarity:A New Feature-based Approach[J].Expert Systems with Applications, 2012, 39(9):7718-7728.

      [5] Amel Yessad, Catherine Faron-Zucker, Rose Dieng-Kuntz,et al. Ontology- based Semantic Relatedness for Detecting the Relevance of Learning Resources[J].Interactive Learning Environments, 2011,19(1):63-80.

      [6] Cai Yingfang, Qiu Wanghua.Research on Retrieval of Multi-Attribute Instance Knowledge Based on Ontology[C]//Proceedings of International Conference on Uncertainty Reasoning and Knowledge Engineering, 2012:13-17.

      [7] Huacheng Chen, Xuehui Du, Xingyuan Chen,et al.Query Expansion Model Based on Interest Ontology[C]//Proceedings of International Conference on Information Management, Innovation Management and Industrial Engineering, 2012:474-478.

      [8] Neda Alipanah, Pallabi Parveen, Sheetal Menezes,et al.Ontology-driven Query Expansion Methods to Facilitate Federated Queries[C]//Proceedings of IEEE International Conference on Service-Oriented Computing and Applications, 2010:1-8.

      [9] 王紅,高斯婷,潘振杰,等.基于NNV關(guān)聯(lián)規(guī)則的非分類關(guān)系提取方法及其應(yīng)用研究[J].計(jì)算機(jī)應(yīng)用研究, 2012,29(10):3665-3668.

      [10] 王紅,楊璇,王靜,等.基于本體的民航應(yīng)急決策知識(shí)表達(dá)與推理方法研究[J].計(jì)算機(jī)工程與科學(xué), 2011, 33(4):129-133.

      [11] 王旭陽(yáng),蕭波.基于概念關(guān)聯(lián)度的智能檢索研究[J].計(jì)算機(jī)工程與設(shè)計(jì), 2013,34(4):1415-1419.

      [12] 劉宏哲,須德.基于本體的語(yǔ)義相似度和相關(guān)度計(jì)算研究綜述[J].計(jì)算機(jī)科學(xué), 2012,39(2):8-13.

      [13] Paul Witherell, Sundar Krishnamurty, Ian Grosse,et al.A Meronomic Relatedness Measure for Domain Ontologies Using Concept Probability and Multiset Theory[C]//Proceedings of the 28th North American Fuzzy Information Processing Society Annual Conference, 2009:1-6.

      SEMANTIC RELEVANCY CALCULATION METHOD FOR NON-CLASSIFICATION RELATIONSHIP OF DOMAIN ONTOLOGY

      Wang Hong Fan Hongjie Sun Kang

      (School of Computer Science and Technology, Civil Aviation University of China, Tianjin 300300, China)

      Aiming at the problem of semantic query expansion in regard to non-classification relationships of civil aviation emergency domain ontology (CAEDO), we proposed a semantic relevancy calculation method for the non-classification relationships of domain ontology. In this method, on the aspect of data properties, we proposed a semantic relevancy calculation method which is based on the property type and property value; on the aspect of object properties, aiming at the problem that there are multiple object properties in query words and ontology concept or example, we proposed the object property-based semantic relevancy calculation method. Furthermore, in combination with the semantic query process of domain ontology in civil aviation emergency cases, we gave the analysis of the implementation effect of the method. The method not only effectively improves the precision and the recall of semantic query, it also provides better methods support for emergency decision-making in regard to civil aviation emergencies as well.

      Civil aviation emergency Domain ontology Non-classification relationship Semantic relevancy

      2015-05-31。國(guó)家自然科學(xué)基金委員會(huì)與中國(guó)民用航空總局聯(lián)合基金項(xiàng)目(61079007);國(guó)家自然科學(xué)青年基金項(xiàng)目(61201414)。王紅,教授,主研領(lǐng)域:本體技術(shù),數(shù)據(jù)挖掘與智能信息處理。樊紅杰,碩士生。孫康,碩士生。

      TP391

      A

      10.3969/j.issn.1000-386x.2016.11.004

      铜山县| 林州市| 新兴县| 临安市| 香港| 英山县| 海盐县| 沾化县| 天等县| 华坪县| 广州市| 修武县| 正镶白旗| 和顺县| 铜山县| 苏尼特左旗| 东丽区| 拉萨市| 金溪县| 梅州市| 鄂温| 昌邑市| 册亨县| 那曲县| 梁河县| 武强县| 库尔勒市| 城市| 陵川县| 新源县| 扶风县| 榆中县| 汾阳市| 禹城市| 双峰县| 正镶白旗| 黄石市| 那坡县| 岫岩| 邢台市| 东城区|