• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      面向?qū)ο蟮亩喟姹緜鞲衅饔^測(cè)服務(wù)模式匹配方法

      2016-12-22 08:06:18侯景偉
      關(guān)鍵詞:模式匹配子類面向?qū)ο?/a>

      何 杰, 侯景偉

      (寧夏大學(xué) 資源環(huán)境學(xué)院, 銀川 750021 )

      ?

      面向?qū)ο蟮亩喟姹緜鞲衅饔^測(cè)服務(wù)模式匹配方法

      何 杰*, 侯景偉

      (寧夏大學(xué) 資源環(huán)境學(xué)院, 銀川 750021 )

      以多版本傳感器觀測(cè)服務(wù)(Sensor Observation Service,簡(jiǎn)稱SOS)模式為研究對(duì)象,從SOS實(shí)現(xiàn)規(guī)范數(shù)據(jù)類型UML圖中解析出SOS服務(wù)模式組成對(duì)象,提出一種面向?qū)ο蟮哪J狡ヅ浞椒ǎ逊?wù)模式匹配問(wèn)題轉(zhuǎn)換為模式對(duì)象的匹配問(wèn)題.重點(diǎn)闡述了模式對(duì)象的分解、關(guān)聯(lián)子對(duì)象識(shí)別、及子對(duì)象匹配等相關(guān)技術(shù).最后,以兩種版本的SOS模式匹配試驗(yàn)驗(yàn)證了方法的有效性.

      傳感器觀測(cè)服務(wù); UML; 面向?qū)ο螅?對(duì)象匹配

      模式匹配[1-5]是當(dāng)前研究的一個(gè)熱點(diǎn)和重點(diǎn)問(wèn)題,也是眾多應(yīng)用,如基于web的服務(wù)查詢和集成、電子商務(wù)、數(shù)據(jù)同化等不可缺少的關(guān)鍵步驟.然而,在當(dāng)前,不管是語(yǔ)法模式匹配[1,5-6]方法還是語(yǔ)義(本體)[2-4,7]模式匹配方法,它們都從微觀上,以每個(gè)模式元素為單位參與匹配,而且通常需要對(duì)兩個(gè)待匹配的模式文件中所有元素進(jìn)行比較,由于參與匹配元素的增多,特別是大尺度的模式匹配問(wèn)題,造成匹配性能較差;同時(shí),隨著參與匹配元素的增多,匹配復(fù)雜度提高,誤匹配率也會(huì)增多,從而影響匹配精度.針對(duì)這些問(wèn)題,國(guó)際上有人提出基于模式片段匹配的方法來(lái)提高模式匹配性能和質(zhì)量,如在H.Do和Rahm設(shè)計(jì)的COMA++[8]系統(tǒng)中,首先對(duì)模式進(jìn)行分塊,然后對(duì)這些模式分塊進(jìn)行匹配,但由于COMA++采用啟發(fā)式分塊規(guī)則,造成模式分塊要么太多,要么太少,且在識(shí)別相似分塊時(shí),通常只考慮分塊的根節(jié)點(diǎn)信息,造成匹配質(zhì)量不高.在國(guó)內(nèi),東南大學(xué)的胡偉等人提出的Falco[9]系統(tǒng)則根據(jù)輸入的本體實(shí)體在結(jié)構(gòu)和語(yǔ)言學(xué)上的相似性把兩個(gè)本體中所有相似的實(shí)體單元,通過(guò)聚類算法形成一個(gè)個(gè)大的本體塊,由于其算法中涉及的本體信息多且復(fù)雜,從而影響了系統(tǒng)的性能.

      在地理信息網(wǎng)絡(luò)服務(wù)中,傳感器觀測(cè)服務(wù)(SOS)[10]內(nèi)容最復(fù)雜、應(yīng)用最廣,它提供了一個(gè)標(biāo)準(zhǔn)的接口來(lái)管理和提取各種不同傳感器系統(tǒng)的元數(shù)據(jù)和觀測(cè).在本文中,以SOS服務(wù)模式為例,研究不同版本服務(wù)模式的差異,及差異造成了諸如類在命名上的變化、屬性上的變化(如新增屬性)、繼承關(guān)系上的變化等.從本質(zhì)上講,這些服務(wù)模式具有面向?qū)ο筇卣?為此,本文提出了一種面向?qū)ο蟮哪J狡ヅ浞椒?Object-Oriented Schema Matching,簡(jiǎn)稱OOSM),試圖把待匹配模式文件當(dāng)作一個(gè)對(duì)象類,在綜合考慮Falco[9]系統(tǒng)通過(guò)聚類算法形成本體塊,及COMA++[8]系統(tǒng)采用的啟發(fā)式分塊方法的基礎(chǔ)上,采用直接利用類的繼承層次關(guān)系把類分解成一個(gè)個(gè)子類或子對(duì)象.然后通過(guò)計(jì)算子類名稱字符、詞義及注釋相似度來(lái)找出待匹配的兩個(gè)模式類的所有相似或關(guān)聯(lián)子對(duì)象.最后設(shè)計(jì)一種匹配算法對(duì)所有相似子類進(jìn)行匹配,最終達(dá)到通過(guò)匹配規(guī)模的減少和匹配算法的改進(jìn)來(lái)提高匹配性能和質(zhì)量.

      1系統(tǒng)體系結(jié)構(gòu)及部件

      圖1是系統(tǒng)體系結(jié)構(gòu).

      圖1 系統(tǒng)體系結(jié)構(gòu)Fig.1 Architecture of the schema matching system

      系統(tǒng)由模式類生成,模式類分解,相似類識(shí)別及模式子類匹配四個(gè)部件組成.模式類生成部件主要實(shí)現(xiàn)把輸入的模式文件生成對(duì)應(yīng)的模式類,并用對(duì)應(yīng)的類圖表示;模式類分解部件則根據(jù)模式類包含的子類或?qū)ο箝g的層次關(guān)系,把模式類分解成一個(gè)個(gè)獨(dú)立的子類;相似類識(shí)別部件則從分解的所有源和目的子類中識(shí)別出相似或關(guān)聯(lián)的子類;最后子類匹配部件對(duì)這些相似子類進(jìn)行匹配,并對(duì)所有子類匹配結(jié)果進(jìn)行組合,得到最終匹配結(jié)果.同時(shí),在子類匹配過(guò)程中,可以人工從匹配器庫(kù)中選擇合適的匹配器及匹配器組合方法.

      2系統(tǒng)實(shí)現(xiàn)

      2.1模式類生成

      OGC(Open Geospatial Consortium)為不同類型的網(wǎng)絡(luò)服務(wù)間的互操作定義了技術(shù)和實(shí)現(xiàn)規(guī)范,它們使用標(biāo)準(zhǔn)的XML 模式定義語(yǔ)言(XSD)定義了網(wǎng)絡(luò)服務(wù)實(shí)例文檔應(yīng)該遵循的結(jié)構(gòu)和使用的數(shù)據(jù)類型.從本質(zhì)上講,XML模式定義是面向?qū)ο蟮模园裍ML模式文件轉(zhuǎn)換為一種面向?qū)ο蟮哪J筋惐硎臼呛线m的.

      一個(gè)XML模式文檔中定義了4種類型的數(shù)據(jù)結(jié)構(gòu):復(fù)雜類型(complexType),簡(jiǎn)單類型(simpleType),元素(element),屬性(attribute).此外,XML模式定義語(yǔ)言還定義了19種內(nèi)置的原子數(shù)據(jù)類型,如string類型,及25種派生數(shù)據(jù)類型(由原子數(shù)據(jù)類型派生),如normalizedString派生于string.下面來(lái)定義各種規(guī)則把不同數(shù)據(jù)類型轉(zhuǎn)換為面向?qū)ο蟮念愋?

      規(guī)則1:所有的復(fù)雜類型(complexType)都映射為一個(gè)類類型,復(fù)雜類型名字為對(duì)應(yīng)的類名,復(fù)雜類型內(nèi)部定義的變量,如果類型為內(nèi)置原子類型,則映射為類的屬性,如果是派生類類型則映射為復(fù)雜類的一個(gè)嵌套子類.

      規(guī)則2:所有的簡(jiǎn)單的數(shù)據(jù)類(simpleType)型映射為類的屬性,其定義的枚舉值為屬性的默認(rèn)值.

      規(guī)則3:所有的元素(element)及屬性,如果其類型為原子數(shù)據(jù)類型,則映射為類的屬性,否則映射為類的一個(gè)嵌套子類.

      以SOS GetCapabilities響應(yīng)文件為例,其模式文件包括ows∶CapabilitiesBaseType,sos∶Fileter_Capabilities,sos∶Contents等3個(gè)模式片段,在XMLSpy軟件中,其模式結(jié)構(gòu)圖如圖2所示.根據(jù)本節(jié)定義的轉(zhuǎn)換規(guī)則,很容易把其轉(zhuǎn)換為模式類表示,其類名為Capabilities,下面包含3個(gè)子類,每個(gè)子類又包含其它子類或?qū)傩裕瑘D3顯示了模式片段轉(zhuǎn)換后的UML靜態(tài)圖表示.

      圖2 GetCapabilities響應(yīng)文件結(jié)構(gòu)Fig.2 Structure of GetCapabilities response file

      圖3 GetCapabilities響應(yīng)文件UML表示Fig.3 UML diagram of GetCapabilities response file

      2.2模式類分解

      為了操作方便,把模式類的UML靜態(tài)表示圖轉(zhuǎn)換為一個(gè)面向?qū)ο笙到y(tǒng)的有向圖,圖中每個(gè)類或子類用一個(gè)節(jié)點(diǎn)表示,節(jié)點(diǎn)的標(biāo)簽用類名表示,節(jié)點(diǎn)間的有向邊表示類間的關(guān)系(如繼承,關(guān)聯(lián),聚合等).下面對(duì)有向圖及相關(guān)操作進(jìn)行定義.

      定義1在OOSM對(duì)象模型圖中,每個(gè)對(duì)象用一個(gè)五元組,其中Id表示該對(duì)象在當(dāng)前有向圖中編號(hào),Name表示節(jié)點(diǎn)名稱,Type表示節(jié)點(diǎn)類型,Pre表示該節(jié)點(diǎn)的直接前驅(qū)節(jié)點(diǎn)或父節(jié)點(diǎn),Suc表示節(jié)點(diǎn)的直接后繼節(jié)點(diǎn)或子節(jié)點(diǎn).

      在定義1中,編號(hào)根據(jù)圖的廣度優(yōu)先遍歷方法獲得.節(jié)點(diǎn)類型包括簡(jiǎn)單基本數(shù)據(jù)類型(如integer,char,string等)及復(fù)雜數(shù)據(jù)類型,如類類型.在OOSM有向圖中,直接的前驅(qū)節(jié)點(diǎn)最多一個(gè),沒(méi)有前驅(qū)節(jié)點(diǎn)的節(jié)點(diǎn)為圖的根節(jié)點(diǎn),而直接的后繼節(jié)點(diǎn)可以有多個(gè),沒(méi)有后繼節(jié)點(diǎn)的節(jié)點(diǎn)稱為葉子節(jié)點(diǎn).

      定義2在OOSM對(duì)象模型圖中,每個(gè)有向圖用一個(gè)三元組〈R,V,E〉表示,其中R表示有向圖的根節(jié)點(diǎn),V表示頂點(diǎn)或節(jié)點(diǎn)集合,E是邊集合.

      在定義2中,R是有向圖中唯一一個(gè)沒(méi)有前驅(qū)的節(jié)點(diǎn),且經(jīng)過(guò)R可以到達(dá)有向圖中任意節(jié)點(diǎn).

      模式類的分解是基于模式類的有向圖進(jìn)行的,分解規(guī)則定義如下.

      模式類分解規(guī)則:給定任何一個(gè)待分解的模式類圖,首先判斷模式類中是否包含嵌套的子類或?qū)ο?,如果模式類為空,或者包含的全是原子屬性,沒(méi)有子類,則分解結(jié)束;否則,我們對(duì)模式類進(jìn)行分解,分解方法為:把所有與模式類(父類)有直接關(guān)系的各種子類或?qū)ο筇崛〕鰜?lái),成為一個(gè)個(gè)獨(dú)立的子類.算法的偽代碼表示如下:

      算法1:圖分解算法PartitionGraph(G).

      輸入:面向?qū)ο笙到y(tǒng)的有向圖G.

      輸出:子圖集合subGraphs.

      subGraphs=Φ

      if(hasSubClass(G))

      subGraphs=getSubGraph(G)

      End if

      上述算法中,hasSubClass(G)用來(lái)判斷圖是否包含可分解的子類,判斷方法即根據(jù)圖G的根節(jié)點(diǎn)的類型來(lái)判斷,如果根節(jié)點(diǎn)是簡(jiǎn)單數(shù)據(jù)類型,則圖G是不可再分的,否則可以再分.getSubGraph(G)則從圖G中分解出直接的子類(子圖).分解的過(guò)程為:依次處理圖G的每個(gè)直接后繼節(jié)點(diǎn),將這些節(jié)點(diǎn)的Pre(前驅(qū))設(shè)置為空,則每個(gè)后繼節(jié)點(diǎn)及其所有后繼節(jié)點(diǎn)構(gòu)成了一個(gè)以該后繼節(jié)點(diǎn)為根節(jié)點(diǎn)的新子圖.最小的子圖是一個(gè)只包含一個(gè)葉子節(jié)點(diǎn)的節(jié)點(diǎn),節(jié)點(diǎn)的前驅(qū)及后繼均為空.

      如給定圖3的Capabilities類經(jīng)過(guò)一次分解后得到Filter_Capabilites,Contents,CapabilitiesBaseType 3個(gè)子類,其中,F(xiàn)ilter_Capabilites又可分解為Spatial_Capabilities,Temporal_Capabilities,Scalar_Capabiities,Id_Capabilities 4個(gè)子類,對(duì)于Contents子類,它又是由很多的ObserationOffering類組成,CapabilitiesBaseType子類分解成4個(gè)屬性元素及3個(gè)可選子類ServiceIdentification,ServiceProvider,OperationsMetadata.

      2.3相似類識(shí)別

      相似類識(shí)別主要是發(fā)現(xiàn)源和目的模式類中所有相似子類對(duì),以便對(duì)這些相似子類對(duì)作進(jìn)一步匹配.為了提高相似類識(shí)別的效率,只考慮所有子類的名稱相似值及類的注釋文本相似值,而不考慮類的內(nèi)部結(jié)構(gòu)相似性;同時(shí),只計(jì)算相似類間1∶1的關(guān)聯(lián)關(guān)系.下面定義2個(gè)子類相似值sim(o1,o2).

      sim(o1,o2)=α×simstr(o1.Name,o2.Name)+

      β×simsyn(o1.Name,o2.Name)+

      γ×simglos(o1.gloss,o2.gloss).

      (1)

      在公式(1)中,simstr(o1.Name,o2.Name)計(jì)算的是兩個(gè)類名字符相似值,在本文中,采用編輯距離算法來(lái)計(jì)算兩個(gè)類的名稱相似值,即有:

      simstr(o1.Name,o2.Name)=

      1-editNums/maxLength(o1.Name,o2.Name)

      (2)

      其中,editNums為把一個(gè)字符轉(zhuǎn)換為另一個(gè)字符需要的編輯次數(shù),maxLength()返回字符串最大長(zhǎng)度.如給定兩個(gè)類名:”feature”,”fofeature”,根據(jù)公式(2)可計(jì)算出它們間的字符相似值simstr("feature","fofeature")=1-2/9=0.78.

      simsyn(o1.Name,o2.Name)計(jì)算的是兩個(gè)類名的標(biāo)簽概念相似值[11],其具體計(jì)算方法如下.

      定義3(類名標(biāo)簽詞義相似值)設(shè)有類名標(biāo)簽A、B,其在WordNet[12]中的同義詞集合表示為A=(α1,α2,α3,…,αn),B=(β1,β2,β3,…,βm),其中α1,α2,α3,…,αn,β1,β2,β3,…,βm分別為類名標(biāo)簽A、B的原子義詞,則類名標(biāo)簽A、B的內(nèi)積為:

      (3)

      其中,simasyn(αi,βj)根據(jù)兩個(gè)原子義詞在WordNet中的詞義距離的倒數(shù)計(jì)算出的義詞相似值.有了內(nèi)積,我們就能導(dǎo)出類名標(biāo)簽的范數(shù)和原始類名標(biāo)簽的相似值定義.

      定義4(類名標(biāo)簽范數(shù)和相似值)設(shè)有類名標(biāo)簽Α,其范數(shù)定義如下:

      (4)

      則兩個(gè)原始類名標(biāo)簽Α、B間的相似值定義如下:

      (5)

      simglos(o1.gloss,o2.gloss)用來(lái)計(jì)算兩個(gè)類的注釋文本相似值,我們采用的是基于向量空間模型的余弦算法,定義如下.

      定義5(文本相似度)設(shè)有源模式類的注釋文檔di={ti1,wi1;ti2,wi2;…; tin,win},目的模式類的注釋文檔dj={tj1,wj1;tj2,wj2;…; tjn,wjn},其中ti1,ti2,…, tin;tj1,tj2,…, tjn為源和目的注釋文檔的特征項(xiàng),wi1,wi2,…, win;wj1,wj2,…, wjn為對(duì)應(yīng)的文檔特征項(xiàng)的權(quán)重,則文檔di、dj的文本相似值用公式表示為:

      (6)

      其中,θ為兩個(gè)文檔向量的空間夾角.

      在兩個(gè)子類的相似值計(jì)算中,由于不同類型相似值的作用程度不同,如對(duì)于類名的字符相似值,由于同名異義、同義異名現(xiàn)象使得在很多情況下,類名的字符相似值并不能準(zhǔn)確表示兩個(gè)子類的相似程度,所以各個(gè)類型相似值權(quán)重不同,對(duì)公式(1)中的α、β、γ取值滿足α<β≤γ,且α+β+γ=1.

      對(duì)于源類的每個(gè)子類,當(dāng)計(jì)算出其與目的類的所有子類的相似值后,我們選擇相似值最大者(maxSim)、且相似值大于門限值(threshold)的子類對(duì)作為候選相似子類對(duì)(subGPairs).如果某個(gè)最大相似值的值小于規(guī)定的門限值,此時(shí),把這種子類對(duì)作為次候選相似子類對(duì)(secondSubGPairs).當(dāng)源和目的類的所有子類初次識(shí)別完成后,判斷是否有次候選相似對(duì)產(chǎn)生,如果沒(méi)有,子類識(shí)別結(jié)束,輸出最終相似子類對(duì),否則,進(jìn)行二次子類識(shí)別,即,處理所有的次候選相似對(duì).處理過(guò)程為:如果源子類可以分解(包含有子類),分解源子類,然后把目的子類與源子類的所有子類比較(見(jiàn)算法2中的函數(shù)getMaxSim),如果沒(méi)有候選相似子類對(duì),則逆向比較,即如果目的子類可以分解,則把源子類和目的子類的所有子類比較,如果仍然不滿足候選相似子類條件,則處理結(jié)束,否則輸出對(duì)應(yīng)的候選相似子類.算法2是子類(子圖)識(shí)別算法的偽代碼.

      算法2:子類識(shí)別算法SimilarClassIdentity(subGraphs1,subGraphs2).

      輸入:源和目的子圖subGraphs1,subGraphs2.

      輸出:候選相似子圖對(duì)subGPairs.

      subGPairs=Φ, secondSubGPairs=Φ;

      foreach(class o1 in subGraphs1){

      maxSim=0.0;

      foreach(class o2 in subGraphs2){

      if(sim(o1,o2)>=maxSim)

      maxSim=sim(o1,o2);

      }

      if(maxSim>threshold)

      subGPairs+=new Pair;

      else

      secondSubGPairs+=new Pair;

      }

      if(secondSubGPairs==Φ)

      return subGPairs;

      else{

      foreach(Pair p in secondSubGPairs){

      class oo=p.getFirstClass();

      class oo2=p.getSecondClass();

      if(oo.canPaitition()){

      class tmpClass=getMaxSim(PartitionGraph(oo),oo2);

      subGPairs+=new Pair;

      }else if(oo2.canPaitition()){

      class tmpClass=getMaxSim(PartitionGraph(oo2),oo);

      subGPairs+=new Pair;

      }

      }

      return subGPairs;

      }//算法結(jié)束.

      識(shí)別后的候選相似子類對(duì)被分成兩種類型,一種為簡(jiǎn)單的原子子類對(duì),即不可再分解,一種為復(fù)雜的子類對(duì),可以繼續(xù)被分解.下節(jié)將對(duì)這兩種相似子類進(jìn)行匹配.

      2.4子類匹配

      針對(duì)識(shí)別后的兩種類型的子類對(duì):簡(jiǎn)單子類對(duì)和復(fù)雜子類對(duì),分別設(shè)計(jì)了簡(jiǎn)單子類匹配算法和復(fù)雜子類匹配算法.

      對(duì)于簡(jiǎn)單子類匹配,由于每個(gè)子類內(nèi)部只包含屬性成員,沒(méi)有嵌套子類,所以根據(jù)公式(1)計(jì)算所有屬性成員兩兩間的名稱、標(biāo)簽概念和注釋文本組合相似值,同時(shí)每組相似值中的最大者、且大于門限值的屬性對(duì)為匹配的候選映射.

      對(duì)于復(fù)雜子類匹配問(wèn)題,我們思想是通過(guò)類分解,把復(fù)雜子類匹配轉(zhuǎn)化為簡(jiǎn)單子類匹配,即首先使用本文的類分解方法對(duì)復(fù)雜類進(jìn)行分解,然后識(shí)別分解后的相似子類,最后對(duì)子類進(jìn)行匹配.具體算法描述如下.

      算法3:子類匹配算法ObjectMatching(Os,Ot).

      輸入:候選子類對(duì)(Os,Ot).

      輸出:候選映射Mappings.

      1)從對(duì)象管理器中選擇未匹配子類對(duì)(osi,otj).

      2)判斷子類類型.如果是簡(jiǎn)單子類,利用公式(1)進(jìn)行簡(jiǎn)單子類匹配;如果是復(fù)雜子類,則首先把復(fù)雜子類轉(zhuǎn)換為簡(jiǎn)單子類,再利用簡(jiǎn)單子類算法進(jìn)行匹配.

      3)匹配中間結(jié)果處理.即把每輪得到的候選映射路徑擴(kuò)充到模式類的根節(jié)點(diǎn),候選映射轉(zhuǎn)化為匹配的最終映射.

      4)如果子類對(duì)匹配完,轉(zhuǎn)步驟5),否則返回到步驟1),重新執(zhí)行上述步驟.

      5)輸出子類匹配結(jié)果,算法結(jié)束.

      圖4 候選子類對(duì)匹配流程圖Fig.4 Process of the candidate subclass pairs matching

      3實(shí)驗(yàn)及討論

      本文試驗(yàn)使用的計(jì)算機(jī)配置為:windows XP 操作系統(tǒng), 2.5 GHz Intel Core2 Quad處理器,2.0 GB RAM,且安裝Sun Java 1.6.0運(yùn)行庫(kù).實(shí)驗(yàn)數(shù)據(jù)我們選取的是SOS 1.0.0版本和2.0.0版本的三種模式文件,分別是:sosGetCapabilities.xsd,文件大小為4 KB;sos GetObservation.xsd,其大小為6 KB;sosGetResult.xsd,大小為5 KB.

      3.1模式匹配質(zhì)量實(shí)驗(yàn)

      應(yīng)用①COMA;②COMA++;③OOSM分別進(jìn)行匹配試驗(yàn).對(duì)于COMA我們選擇的配置策略為:平均值法進(jìn)行相似值聚合和組合,MaxDelta法選擇匹配候選者,匹配方法選擇AllContext(完全上下文),包含匹配器組合為:NAME(名稱),PATH(路徑),LEAVES(葉子),PAR ENTS(父親),SIBLINGS(兄弟).對(duì)于COMA++,選擇的匹配策略是Fragment-based(基于片段),使用的Node Matcher(節(jié)點(diǎn)匹配器)和Context Matcher(上下文匹配器)均為COMA.對(duì)于OOSM,相似子類識(shí)別選定的門限值為0.7.

      用傳統(tǒng)的查全率(Recall),精度(Precision)來(lái)評(píng)估匹配結(jié)果,試驗(yàn)結(jié)果如圖5、圖6所示.從圖5看出,對(duì)于SOS兩種不同版本的3種操作模式文件匹配,使用本文面向?qū)ο蠓椒ǖ玫降牟槿首罡?,平均查全率值達(dá)到82%以上,這主要由于面向?qū)ο笃ヅ浞椒ㄖ胁粌H考慮到了元素標(biāo)簽名稱組成,還考慮到了標(biāo)簽的節(jié)點(diǎn)語(yǔ)義和注釋,所以能發(fā)現(xiàn)更多那些使用COMA/COMA++沒(méi)有發(fā)現(xiàn)的語(yǔ)義異質(zhì)性問(wèn)題.從圖5還可以看出,對(duì)于操作getCapabilities,getObservation來(lái)說(shuō),COMA++查全率稍稍高于COMA,對(duì)于getResult匹配結(jié)果,二者幾乎相同,這主要由于getResult兩種版本結(jié)果差異巨大,模式片段及相似片段少,COMA++作用不明顯.從圖6可以看出,3種匹配方法精度值滿足COMA

      圖5 匹配查全率比較Fig.5 The Recall of 3 match methods

      圖6 匹配精度比較Fig.6 The Precision of 3 match methods

      3.2模式匹配性能實(shí)驗(yàn)

      同樣,應(yīng)用上節(jié)使用的3種匹配器來(lái)進(jìn)行匹配性能實(shí)驗(yàn),實(shí)驗(yàn)數(shù)據(jù)也同3.1節(jié),實(shí)驗(yàn)結(jié)果如圖7所示.從圖7比較看出,不同的類型的模式文件間的匹配,及不同匹配方法性能各不相同.對(duì)于同種匹配任務(wù),匹配性能COMA++最好,OOSM次之,COMA最差.這主要由于COMA++在局部上雖然使用的與COMA相同的匹配器,但在整體上采用的是分塊策略,匹配規(guī)模大大減少,所以性能優(yōu)于COMA,同時(shí)由于COMA++在元素級(jí)上的匹配仍然為語(yǔ)法匹配方法,而OOSM在匹配時(shí)考慮了節(jié)點(diǎn)的語(yǔ)義信息及注釋文本信息,所以整體匹配性能稍遜于COMA++.對(duì)于結(jié)構(gòu)組成清晰,模式類繼承關(guān)系簡(jiǎn)單,容易分塊或子類化的模式文件,如對(duì)于操作getCapabilities,getObservation模式文件由于易于對(duì)象化表達(dá)和分塊,所以使用COMA++和OOSM都能使性能大幅提高.

      圖7 3種匹配方法性能比較Fig.7 Performance comparison of three matching methods

      4結(jié)論與展望

      異構(gòu)網(wǎng)絡(luò)服務(wù)模式間特別是不同質(zhì)的模式文件間結(jié)構(gòu)差異巨大,同時(shí)元素語(yǔ)義表達(dá)差異明顯,造成了模式匹配精度和性能的下降.為了改善性能,提高精度,本文在分析不同版本模式文件結(jié)構(gòu)特征基礎(chǔ)上,提出了一種面向?qū)ο蟮哪J狡ヅ浞椒?,把模式匹配?wèn)題轉(zhuǎn)化為模式子對(duì)象間的匹配問(wèn)題,從整體上減少了模式匹配規(guī)模,同時(shí)在局部匹配過(guò)程中充分考慮模式元素的標(biāo)簽語(yǔ)義信息和注釋文本向量信息.實(shí)驗(yàn)結(jié)果表明,文中提出的方法在匹配性能上比傳統(tǒng)模式匹配方法,如COMA,有較大提高,同時(shí)在精度上又優(yōu)于COMA++.

      下一步將把面向?qū)ο蠓椒ㄓ糜诋愘|(zhì)不同類型模式文件間,如SOS與WCS,SOS與WFS間的匹配,同時(shí)改善匹配算法,進(jìn)一步提高匹配性能.

      [1] SHVAIKO P, EUZENAT J. A survey of schema-based matching approaches[J]. Journal on Data Semantics IV, 2006, 3730:146-171.

      [2] GIUNCHIGLIA F, SHVAIKO P. Semantic matching[J]. KER Journal, 2003, 18(3):265-280.

      [3] GIUNCHIGLIA F,SHVAIKO P,YATSKEVICH M.S-Match[J]:An Algorithm and an Implementation of SemanticMatching[C].In:Proceedings of the European Sema-ntic WebSymposium(ESWS),Springer, Heidelberg,2004:61-75.

      [4] GIUNCHIGLIA F, YATSKEVICH M, GIUNCHIGLIA E. Efficient semantic matching[C]//In Proceedings of ESWC,Heraklion,Greece, 2005: 272-289.

      [5] 王育紅, 陳 軍. 基于實(shí)例的GIS數(shù)據(jù)庫(kù)模式匹配方法[J]; 武漢大學(xué)學(xué)報(bào)(信息科學(xué)版), 2008, 33(1):46-50.

      [6] AUMULLER D, DO H H, MABMANN S, et al. Schema and ontology matching with COMA++[C]//In Proc of the 2005 ACM SIGMOD Int Conference on Management of Data. New York: ACM Press, 2005: 906-908.

      [7] NOY N, MUSEN M. The prompt suite: interactive tools for ontology merging and mapping[J]. International Journal of Human-Computer Studies, 2003, 59(6):983-1024.

      [8] DO H H, RAHM E. Matching large schemas:Approaches and evaluation[J]. Information Systems, 2007, 32(6):857-885.

      [9] HU W,QU Y,CHENG G. Matching large ontologies:A divide-and-conquer approach[J]. DKE, 2008, 67:140-160.

      [10] OGC. OpenGIS? Sensor Observation Service Implementation Specification [M]. 2006.

      [11] 何 杰, 陳能成, 鄭 重, 等. 利用語(yǔ)義的多版本網(wǎng)絡(luò)覆蓋服務(wù)模式匹配方法[J]. 武漢大學(xué)學(xué)報(bào)(信息科學(xué)版), 2012, 37(2):210-214.

      [12] MILLER A G. WordNet:A lexical database for English[J]. Communications of the ACM, 1995, 38(11):39-41.

      [13] DO H H, RAHM E.COMA-A System for FlexibleCombination of Match Algorithms[C]//In Proceedings of the 28th International Conference on VeryLarge Data Bases, Hongkong,China, 2002.

      An object-oriented multi-versions sensor observation services schema matching method

      HE Jie, HOU Jinwei

      (School of Resource and Environment, Ningxia University, Yinchuan 750021)

      An Object-Oriented schema matching method is proposed and the schema match is converted into object match using multi-version sensor observation service(SOS) schemas as study objects and SOS service schema objects parsed out from SOS implementation specification presented by Unified Modeling Language (UML) static class diagram. Key problems, such as object decomposition, similar sub-object identification and sub-object match, are focused on. Finally, different version schemas of SOS are utilized to test the effectiveness of the proposed method.

      sensor observation service; UML; Object-Oriented; object match

      2016-09-11.

      寧夏自然科學(xué)基金資助項(xiàng)目(NZ12110);國(guó)家自然基金資助項(xiàng)目(41201393);武漢大學(xué)測(cè)繪遙感信息工程國(guó)家重點(diǎn)實(shí)驗(yàn)室開(kāi)放基金項(xiàng)目(14I03).

      1000-1190(2016)06-0805-07

      P205

      A

      *E-mail: whujiejie@163.com.

      猜你喜歡
      模式匹配子類面向?qū)ο?/a>
      卷入Hohlov算子的某解析雙單葉函數(shù)子類的系數(shù)估計(jì)
      基于模式匹配的計(jì)算機(jī)網(wǎng)絡(luò)入侵防御系統(tǒng)
      電子制作(2019年13期)2020-01-14 03:15:32
      具有間隙約束的模式匹配的研究進(jìn)展
      OIP-IOS運(yùn)作與定價(jià)模式匹配的因素、機(jī)理、機(jī)制問(wèn)題
      面向?qū)ο蟮挠?jì)算機(jī)網(wǎng)絡(luò)設(shè)計(jì)軟件系統(tǒng)的開(kāi)發(fā)
      關(guān)于對(duì)稱共軛點(diǎn)的倒星象函數(shù)某些子類的系數(shù)估計(jì)
      面向?qū)ο蟮臄?shù)據(jù)交換協(xié)議研究與應(yīng)用
      面向?qū)ο骔eb開(kāi)發(fā)編程語(yǔ)言的的評(píng)估方法
      基于散列函數(shù)的模式匹配算法
      面向?qū)ο笮畔⑻崛≈杏跋穹指顓?shù)的選擇
      河南科技(2014年10期)2014-02-27 14:09:03
      南宁市| 工布江达县| 瓦房店市| 陵川县| 中卫市| 扬中市| 科技| 樟树市| 青田县| 探索| 长岭县| 城步| 永胜县| 新竹市| 诸城市| 高安市| 彭泽县| 房产| 曲周县| 章丘市| 彰化县| 凌云县| 济阳县| 白山市| 赤水市| 榆树市| 平南县| 满城县| 铜川市| 安顺市| 西宁市| 鹿邑县| 昔阳县| 彩票| 繁昌县| 株洲县| 广水市| 静宁县| 巨野县| 宝坻区| 天镇县|