• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      一種基于社會(huì)選擇理論的本體聚集方法

      2018-02-15 05:41:36朱澤宇陸建波
      關(guān)鍵詞:本體語(yǔ)義函數(shù)

      朱澤宇, 鐘 智, 陸建波*

      (1.揚(yáng)州大學(xué) 廣陵學(xué)院,揚(yáng)州 225000)(2.廣西師范學(xué)院 計(jì)算機(jī)與信息工程學(xué)院, 南寧 530023)

      語(yǔ)義Web作為人工智能的一個(gè)研究熱點(diǎn)已經(jīng)得到廣泛關(guān)注.本體對(duì)Web信息提供了完全形式化的語(yǔ)義描述,可以實(shí)現(xiàn)知識(shí)共享和重用,在一定程度上提高了計(jì)算機(jī)對(duì)信息進(jìn)行訪問(wèn)和搜索的能力.由于不同的用戶可以構(gòu)造不同的本體,導(dǎo)致了同一個(gè)領(lǐng)域中會(huì)產(chǎn)生許多不同的本體.由于異構(gòu)本體之間很難實(shí)現(xiàn)互操作,嚴(yán)重限制了語(yǔ)義Web的發(fā)展,而本體的集成、映射、合并可以有效解決這類問(wèn)題[1-2].本體合并是最為常見(jiàn)的分布式語(yǔ)義融合方式之一,以期望形成一個(gè)更大的語(yǔ)義共享空間[3].在本體合并形成的語(yǔ)義空間里,不同的網(wǎng)頁(yè)信息可以用多個(gè)本體描述;在本體合并中通過(guò)聚集函數(shù)產(chǎn)生一個(gè)新的上層本體,以協(xié)調(diào)不同本體之間的差異.

      本體是概念化的形式化規(guī)格說(shuō)明,反應(yīng)了人類對(duì)客觀世界的認(rèn)知,具有明顯的社會(huì)屬性[4].因此,從社會(huì)選擇理論的視角來(lái)看,本體合并可以轉(zhuǎn)化為研究個(gè)體偏好和集體選擇之間的關(guān)系,形成能達(dá)成共識(shí)的最優(yōu)的群體認(rèn)知.投票理論和判定聚集等都是社會(huì)選擇中比較經(jīng)典的應(yīng)用,通過(guò)社會(huì)選擇函數(shù)生成一個(gè)代表整體偏好的最終決策,也為本體聚集提供了理論基礎(chǔ)[5].

      本體映射通過(guò)制定一系列規(guī)則來(lái)建立本體之間的關(guān)聯(lián),它不會(huì)破壞源本體的結(jié)構(gòu).在本體映射的研究中,有學(xué)者分析了整個(gè)映射過(guò)程的方法,例如文獻(xiàn)[6]中提出了一種基于手動(dòng)編碼規(guī)則的識(shí)別本體之間映射的方法,并證明了該方法的優(yōu)越性;文獻(xiàn)[7]中介紹了本體映射的基本框架,并且設(shè)計(jì)了一種通用的本體映射過(guò)程用以研究和比較不同的映射方法;文獻(xiàn)[8]中重點(diǎn)討論了如何利用實(shí)體類的相似度來(lái)進(jìn)行本體映射,在語(yǔ)義Web的背景下,利用機(jī)器學(xué)習(xí),通過(guò)計(jì)算概念實(shí)體之間的相似度,建立本體間的映射關(guān)系.

      本體合并是通過(guò)輸入兩個(gè)或多個(gè)源本體生成一個(gè)新的本體的過(guò)程,新本體可以提供反饋從而指導(dǎo)分布式本體的自我修正,它相對(duì)源本體來(lái)說(shuō)結(jié)構(gòu)發(fā)生了改變.文獻(xiàn)[9]中提出了一種基于概念代數(shù)的本體合并方法,該方法可以用可視化的概念網(wǎng)形式表示本體并通過(guò)運(yùn)算實(shí)現(xiàn)概念之間的合并,建立了概念代數(shù)與OWL(web ontology language)的對(duì)應(yīng)關(guān)系,為本體合并提供了一個(gè)新視角.

      本體映射和合并都是實(shí)現(xiàn)異構(gòu)本體互操作的有效方法,其關(guān)鍵技術(shù)都依賴于本體相似度的計(jì)算.文獻(xiàn)[10]中提出了基于Jaccard相似度的計(jì)算關(guān)鍵字之間的相似性度量方法.實(shí)驗(yàn)結(jié)果表明,該方法在測(cè)量單詞中每個(gè)字母相似度時(shí)具有很好的性能.文獻(xiàn)[11]中提出了一種基于Jaccard相似度和位置行為的協(xié)同過(guò)濾推薦算法,改善了傳統(tǒng)的推薦算法.文獻(xiàn)[12]中將社會(huì)選擇中的投票理論運(yùn)用在本體合并領(lǐng)域中,將本體提供者看作是投票者,通過(guò)社會(huì)選擇函數(shù)選舉出群體本體作為最終決策.

      社會(huì)選擇理論主要研究如何將個(gè)人偏好聚集為一個(gè)群體偏好,其中包含的大量的社會(huì)選擇函數(shù)用來(lái)聚集個(gè)體偏好.在語(yǔ)義Web、多智能體系統(tǒng)、本體合并等領(lǐng)域中將社會(huì)選擇理論和計(jì)算機(jī)科學(xué)相結(jié)合,既拓展了社會(huì)選擇的理論研究范圍,又為解決人工智能等領(lǐng)域的問(wèn)題提供了新思路.文中采用社會(huì)選擇理論,實(shí)現(xiàn)了本體聚集.

      1 本體聚集問(wèn)題描述

      1.1 基本概念和性質(zhì)

      社會(huì)選擇主要研究如何將個(gè)人偏好聚集為一個(gè)群體偏好.給定選項(xiàng)集合A,群體中n個(gè)個(gè)體可以根據(jù)個(gè)人意愿對(duì)A中的元素排序,并匯報(bào)自己的個(gè)人偏好Ri,最后通過(guò)一個(gè)社會(huì)選擇函數(shù)(R1,R2,…,Rn)=Rc選取A中的元素作為最終的群體決策.將本體合并視為社會(huì)選擇中的問(wèn)題,用一個(gè)有限集合N={1,2,…,N}來(lái)表示Agent集合,集合A表示候選者Alternative集合,任意Agenti∈N都可以提供一個(gè)本體Oi?A,那么O={O1,O2,…,On}?ON構(gòu)成了一個(gè)完整的本體組合.

      定義1本體聚集:收集所有的本體并通過(guò)本體聚集函數(shù)F:ON→2A從本體集合中選出唯一的本體作為最終決策.

      基于社會(huì)選擇的本體聚集模型如圖1,本體聚集器讀取分布式本體的概念及關(guān)系要素,通過(guò)聚集規(guī)則給出本體要素之間的對(duì)應(yīng)關(guān)系,最終形成新的頂層本體,作為更高層次的語(yǔ)義共享空間.

      圖1 基于社會(huì)選擇的本體聚集模型Fig.1 Model of ontology aggregation basedon social choice

      1.2 本體聚集函數(shù)

      社會(huì)選擇理論中常見(jiàn)的投票聚集規(guī)則及其性質(zhì)包括一致性、獨(dú)立性等,是在設(shè)計(jì)聚集函數(shù)時(shí)需要考慮的因素.通過(guò)證明,存在一種聚集函數(shù)同時(shí)滿足萬(wàn)有域、匿名性、獨(dú)立性和單調(diào)性的性質(zhì).

      定義4聯(lián)盟聚合規(guī)則:基于聯(lián)盟的聚合函數(shù)F(O)=O1∪O2∪…∪On是一種簡(jiǎn)單的聚合方式,任意一個(gè)ontology都可能會(huì)成為群體決策,只要其中一個(gè)Agent接受它即可.

      定義5基于距離規(guī)則:用d(O,Oi)表示兩個(gè)本體O和Oi之間的距離,一般采用海明距離將一個(gè)本體變換成本體所需要替換的元素個(gè)數(shù)進(jìn)行計(jì)算.基于距離的聚集算法,定義本體聚集函數(shù)為F(O)=argminO∈ON∑i∈Nd(O,Oi).

      性質(zhì)4匿名性:也稱平等原則F(O1,…,On)=F(On(1),…,On(n)),匿名性是指聚集函數(shù)對(duì)agent都是同等對(duì)待的,π:N→N表示任意置換.

      2 基于相似度的本體聚集算法

      2.1 基于樹(shù)狀圖的本體相似度計(jì)算

      用算法1計(jì)算兩個(gè)本體之間的相似度:① 本體規(guī)范化,將本體用同一種語(yǔ)言描述,若本體的表達(dá)形式不一致,則不利于相似度計(jì)算;② 相似度計(jì)算,從本體中分析出概念、結(jié)構(gòu)(關(guān)系)等特征,并計(jì)算相似度;③ 本體相似度修正,得出多個(gè)相似度值之后,根據(jù)這些相似度的重要程度進(jìn)行加權(quán)計(jì)算,得到最終的本體相似度.

      算法1:本體相似度算法輸入:O1,O2輸出:sim(O1,O2)步驟:(1) for i:1→n ∥本體樹(shù)狀圖有n層(2) if (Oi1∩Oi2=?)(3) end(4) else(5) for j:1→|Oi1∩Oi2|(6) simij(O1,O2);∥分別計(jì)算第i層中j個(gè)結(jié)點(diǎn)的相似度(7) end for(8) simi(O1,O2)=∑simij(O1,O2)|Oi1,Oi2|;∥計(jì)算第i層中本體結(jié)點(diǎn)相似度(9) end if(10) end for(11) sim(O1,O2)=∑i=ni=1n-kn simi(O1,O2);∥最終的本體相似度

      2.2 基于相似度的本體聚集算法

      算法2: 基于相似度的本體聚集算法輸入:Ontology1,Ontology2,…Ontologyn輸出:Ontology*步驟:(1) for i: 1→n(2) sim(O,Oi)=1n·∑O'∈Osim(O',Oi)(3) end for(4) if sim(O,Oi)

      3 實(shí)驗(yàn)結(jié)果分析

      3.1 實(shí)驗(yàn)環(huán)境及數(shù)據(jù)

      實(shí)驗(yàn)的開(kāi)發(fā)環(huán)境:① 開(kāi)發(fā)語(yǔ)言Java;② 本體構(gòu)建工具Protégé,用于對(duì)本體進(jìn)行語(yǔ)言、語(yǔ)法的統(tǒng)一描述;③ 集成開(kāi)發(fā)環(huán)境Eclipse;④ 語(yǔ)義web應(yīng)用API Jena,用于對(duì)本體進(jìn)行解析和識(shí)別.實(shí)驗(yàn)運(yùn)行在處理器為2.9 GHz Intel Core i5,內(nèi)存為8 GB的PC機(jī)上.實(shí)驗(yàn)數(shù)據(jù)來(lái)源于OAEI2008[14]提供的Conference本體,本實(shí)驗(yàn)采用其中的4個(gè)本體,具體數(shù)據(jù)信息如表1.

      表1 實(shí)驗(yàn)數(shù)據(jù)信息

      本實(shí)驗(yàn)中用到的本體簡(jiǎn)記為O={O1,O2,O3,O4},這些實(shí)驗(yàn)數(shù)據(jù)信息主要來(lái)源于3類資源,分別是真實(shí)的會(huì)議以及它的網(wǎng)頁(yè)信息、與會(huì)者的經(jīng)驗(yàn)和用于會(huì)議組織的軟件工具.

      3.2 實(shí)驗(yàn)結(jié)果分析

      首先根據(jù)算法1,計(jì)算本體之間的相似度,計(jì)算結(jié)果見(jiàn)表2.實(shí)驗(yàn)中,令t為所有本體與本體組合相似度的平均值,用于進(jìn)行模擬實(shí)驗(yàn).令q為1,再根據(jù)算法2求出最終合并后的本體,合并結(jié)果如圖2,合并后的決策本體的概念和屬性體系更簡(jiǎn)潔.

      表2 本體之間的相似度

      因?yàn)閟im(O,O3),sim(O,O4)

      圖2 本體聚集生成的頂層本體Fig.2 Upper ontology generated by ontology aggregation

      4 結(jié)論

      (1) 在同一領(lǐng)域本體的基礎(chǔ)上,本體合并通過(guò)一系列規(guī)則合并,生成一個(gè)全新的本體,形成更高層次的共享語(yǔ)義空間.而社會(huì)選擇理論研究將個(gè)人偏好聚集為群體偏好,其中提供了大量的社會(huì)選擇函數(shù).因此,可以將本體合并視為社會(huì)選擇中的本體聚集問(wèn)題.

      (2) 文中給出了基于社會(huì)選擇的本體聚集框架,并形式化定義了一組常見(jiàn)的聚集函數(shù),進(jìn)而設(shè)計(jì)了基于相似度的本體聚集算法.通過(guò)證明,可得該算法滿足萬(wàn)有域、匿名性、獨(dú)立性和單調(diào)性.以O(shè)AEI2008提供的會(huì)議本體作為實(shí)驗(yàn)數(shù)據(jù),文中通過(guò)實(shí)驗(yàn)證明了新算法的有效性.

      (3) 文中提出的新算法在進(jìn)行相似度計(jì)算時(shí),執(zhí)行速度會(huì)隨著源本體數(shù)量的增加而降低,如何減少執(zhí)行時(shí)間有待進(jìn)一步研究;此外,由于本體概念中有很多復(fù)合詞,但這些詞無(wú)法從WordNet中找到,因此對(duì)本體間相似度計(jì)算造成的誤差也需要進(jìn)一步研究.

      猜你喜歡
      本體語(yǔ)義函數(shù)
      Abstracts and Key Words
      二次函數(shù)
      第3講 “函數(shù)”復(fù)習(xí)精講
      二次函數(shù)
      對(duì)姜夔自度曲音樂(lè)本體的現(xiàn)代解讀
      函數(shù)備考精講
      語(yǔ)言與語(yǔ)義
      “上”與“下”語(yǔ)義的不對(duì)稱性及其認(rèn)知闡釋
      《我應(yīng)該感到自豪才對(duì)》的本體性教學(xué)內(nèi)容及啟示
      認(rèn)知范疇模糊與語(yǔ)義模糊
      莆田市| 台东县| 溧阳市| 衡山县| 广宗县| 攀枝花市| 太康县| 正蓝旗| 阜阳市| 永城市| 平江县| 韩城市| 洛隆县| 定安县| 班玛县| 瓦房店市| 新余市| 都昌县| 金山区| 蚌埠市| 齐河县| 郧西县| 满城县| 屯门区| 商河县| 隆林| 云浮市| 天等县| 临颍县| 慈溪市| 股票| 黑水县| 二连浩特市| 麟游县| 石柱| 揭东县| 台南市| 定南县| 永城市| 宜春市| 五寨县|