陳文宇,張忠全,向 濤,桑 楠
(電子科技大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院 成都 610054)
基于相似度的語(yǔ)義Web服務(wù)發(fā)現(xiàn)技術(shù)研究
陳文宇,張忠全,向 濤,桑 楠
(電子科技大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院 成都 610054)
針對(duì)傳統(tǒng)Web服務(wù)在服務(wù)發(fā)現(xiàn)中存在效率低的問(wèn)題,應(yīng)用語(yǔ)義Web技術(shù)和本體理論,提出了一種基于相似度的語(yǔ)義Web服務(wù)發(fā)現(xiàn)模型。采用Web本體語(yǔ)言(OWL-S)描述Web服務(wù),發(fā)布服務(wù)時(shí)包含充分的語(yǔ)義信息,在服務(wù)搜索中加入本體推理過(guò)程,綜合度量服務(wù)的功能匹配程度和信譽(yù)值。實(shí)驗(yàn)結(jié)果表明,語(yǔ)義Web服務(wù)發(fā)現(xiàn)方法的查準(zhǔn)率和查全率高于UDDI基于關(guān)鍵字的查找方法。
本體; 信譽(yù); 語(yǔ)義Web; 服務(wù)發(fā)現(xiàn); Web服務(wù)
Web服務(wù)是一種面向服務(wù)架構(gòu)的技術(shù),通過(guò)標(biāo)準(zhǔn)的SOAP協(xié)議提供服務(wù),保證分布式和異構(gòu)環(huán)境下的應(yīng)用可以互操作。Web服務(wù)具有跨平臺(tái)、復(fù)用性高、成本低和使用簡(jiǎn)單等優(yōu)點(diǎn),所以其應(yīng)用范圍非常廣泛,特別是在電子商務(wù)領(lǐng)域[1]。但其也面臨一些挑戰(zhàn),如怎樣從龐大的Web服務(wù)庫(kù)中準(zhǔn)確地搜索到所需的服務(wù),即服務(wù)發(fā)現(xiàn)等。傳統(tǒng)的Web服務(wù)將描述服務(wù)信息的WSDL發(fā)布到UDDI,通過(guò)關(guān)鍵字匹配的方式查找服務(wù)[2-3]。該服務(wù)的發(fā)布和發(fā)現(xiàn)方式不支持基于語(yǔ)義的模糊匹配,不能選出與檢索詞同義和相關(guān)的服務(wù),不利于實(shí)現(xiàn)服務(wù)的自動(dòng)組合,難以構(gòu)建高效、動(dòng)態(tài)的系統(tǒng)。語(yǔ)義Web服務(wù)技術(shù)的誕生解決了傳統(tǒng)服務(wù)發(fā)現(xiàn)的局限性,具有更好的信息表達(dá)能力和語(yǔ)義推理能力。目前,對(duì)語(yǔ)義Web服務(wù)的研究取得了部分進(jìn)展[4],但對(duì)語(yǔ)義Web服務(wù)發(fā)現(xiàn)機(jī)制的研究尚處于起步階段。
本文引入語(yǔ)義Web服務(wù)技術(shù),比較了傳統(tǒng)Web服務(wù)和語(yǔ)義Web服務(wù);引入本體理論,采用OWL_S替代WSDL描述帶語(yǔ)義的Web服務(wù);分析了文獻(xiàn)[5]中的服務(wù)發(fā)現(xiàn)算法的不足,提出了基于功能相似度和信譽(yù)度的服務(wù)發(fā)現(xiàn)方法,給出了影響功能和信譽(yù)的各個(gè)因素以及它們之間的聯(lián)系,并通過(guò)實(shí)驗(yàn)說(shuō)明了該方法的可行性。
互聯(lián)網(wǎng)應(yīng)用的快速發(fā)展使現(xiàn)有技術(shù)的局限逐漸顯現(xiàn)出來(lái)。當(dāng)前互聯(lián)網(wǎng)技術(shù)沒有描述信息的含義,也不關(guān)心信息的具體內(nèi)容,導(dǎo)致信息處理的智能化水平較低[6]。為改變?cè)摖顩r,文獻(xiàn)[7-8]提出了語(yǔ)義Web技術(shù)。語(yǔ)義Web通過(guò)在Web資源中加入語(yǔ)義信息,擴(kuò)展當(dāng)前Web的自描述能力。在Web服務(wù)中引入語(yǔ)義Web技術(shù),可以解決傳統(tǒng)服務(wù)中不含語(yǔ)義信息,計(jì)算機(jī)之間不能相互理解和操作的問(wèn)題,并能將Web服務(wù)的功能和信譽(yù)信息轉(zhuǎn)化為格式化的語(yǔ)義信息,方便機(jī)器的自動(dòng)識(shí)別和匹配,提高服務(wù)查找的精確度。
語(yǔ)義Web服務(wù)是語(yǔ)義Web和Web服務(wù)兩種技術(shù)的融合,是Web服務(wù)發(fā)展的新方向。表1給出了語(yǔ)義Web服務(wù)與傳統(tǒng)Web服務(wù)相比較的優(yōu)點(diǎn)[9]。
表1 傳統(tǒng)Web服務(wù)和語(yǔ)義Web服務(wù)的比較
語(yǔ)義Web建立在本體論的基礎(chǔ)上,本體定義了事物的屬性、約束、類以及類之間的關(guān)系等信息,在Web服務(wù)中引入本體可以增加描述服務(wù)的語(yǔ)義信息。由于本體具有清晰的概念層次結(jié)構(gòu),并支持邏輯推理,所以可以檢測(cè)請(qǐng)求服務(wù)和待選服務(wù)的一致性,使檢索出來(lái)的信息更符合要求,增強(qiáng)服務(wù)自動(dòng)發(fā)現(xiàn)的能力并提高服務(wù)查全率。為了進(jìn)一步達(dá)到服務(wù)的自動(dòng)發(fā)現(xiàn)和執(zhí)行,還需要加強(qiáng)對(duì)Web服務(wù)語(yǔ)義信息的描述,因此催生了OWL_S。OWL_S是基于OWL的Web服務(wù)本體,其標(biāo)記語(yǔ)言結(jié)構(gòu)準(zhǔn)確地刻畫了Web服務(wù)的功能和屬性。OWL_S不僅支持基于語(yǔ)義的推理機(jī)制,而且對(duì)信息的表達(dá)能力也比WSDL強(qiáng),其主體結(jié)構(gòu)如圖1所示[10]。
圖1 OWL_S主體結(jié)構(gòu)
從圖1可以看出,Service Model、Service Gounding和Service Profile是OWL_S的主體結(jié)構(gòu)的3個(gè)組成部分,它們分別通過(guò)屬性describedBy、supports和presents描述Web服務(wù)的語(yǔ)義信息,包括質(zhì)量語(yǔ)義、數(shù)據(jù)語(yǔ)義和功能語(yǔ)義等,這些語(yǔ)義信息組合起來(lái)為服務(wù)發(fā)現(xiàn)提供依據(jù)。
文獻(xiàn)[5]提出了一種基于功能相似程度進(jìn)行匹配的服務(wù)發(fā)現(xiàn)方法,其中評(píng)價(jià)服務(wù)請(qǐng)求和待選服務(wù)之間的功能相似程度是通過(guò)它們之間的公有信息進(jìn)行的。分別計(jì)算OWL_S對(duì)象的Service Gounding、Service Profile和Service Model以決定待選服務(wù)是否匹配服務(wù)請(qǐng)求,但該發(fā)現(xiàn)方法存在以下缺點(diǎn)[11-12]:(1)需要參照Service Gounding、Service Profile和Service Model的信息,計(jì)算比較復(fù)雜,模型實(shí)現(xiàn)困難;(2)篩選服務(wù)時(shí)沒有考慮其信譽(yù)度的因素,可能導(dǎo)致某些信譽(yù)低下,沒有達(dá)到指定閾值的服務(wù)也被篩選出來(lái);(3)性能和查全率低,尤其在海量服務(wù)庫(kù)中查找時(shí)比較明顯。
為解決以上問(wèn)題,本文采用本體推理理論和語(yǔ)義Web技術(shù),提出一種新的服務(wù)發(fā)現(xiàn)方法。本文的服務(wù)發(fā)現(xiàn)主要關(guān)注服務(wù)的功能語(yǔ)義相似程度和服務(wù)提供方的信譽(yù)值,并加入性能度量,不再考慮時(shí)效性和安全等其他非功能性因素。
假定服務(wù)請(qǐng)求和服務(wù)公告分別用request和advertise表示,它們的相似度用similarity(request,advertise)表示,請(qǐng)求服務(wù)和待選服務(wù)之間的功能相似度和信譽(yù)度相似度分別用similarityfunction(request,advertise)和similarityreputation(request,advertise)表示。請(qǐng)求服務(wù)和待選服務(wù)的相似度定義為:
輸入、輸出、前置條件和效果是影響功能相似度的4個(gè)主要因素(簡(jiǎn)稱IOPE)。服務(wù)請(qǐng)求和服務(wù)公告的功能相似度定義為:
可用性、響應(yīng)時(shí)間和價(jià)格是影響服務(wù)信譽(yù)度的3個(gè)主要因素。分別用similarityA、similarityT和similarityP表示可用性相似度、響應(yīng)時(shí)間相似度和價(jià)格相似度。信譽(yù)度相似度為:
服務(wù)發(fā)現(xiàn)的具體步驟如下:
(1)遍歷服務(wù)庫(kù)中登記的所有Web服務(wù)的公告,通過(guò)語(yǔ)義推理過(guò)濾與請(qǐng)求服務(wù)在功能上不相似的服務(wù),得到有效的待選服務(wù)集合;
(2)依次查找有效的待選服務(wù),篩選淘汰信譽(yù)值低下的服務(wù);
(3)計(jì)算各個(gè)待選服務(wù)的功能語(yǔ)義相似度;(4)計(jì)算各個(gè)待選服務(wù)的信譽(yù)度相似度;(5)計(jì)算整體相似度,并按照相似度從大到小的順序排列;
(6)返回相似度達(dá)到指定閾值的服務(wù)列表,并選擇相似度最大的服務(wù)作為最佳匹配的服務(wù)。
以查找汽車銷售服務(wù)為例說(shuō)明服務(wù)匹配過(guò)程。假定服務(wù)注冊(cè)庫(kù)中有SA銷售自行車、SB售火車票、SC銷售轎車、SD只銷售本田汽車、SE銷售所有類型的車等5個(gè)滿足本體規(guī)范的有效服務(wù)。定義如下的本體實(shí)例:
注冊(cè)服務(wù)中的SB銷售火車票,與請(qǐng)求服務(wù)-汽車銷售在概念和功能上不一致,所以經(jīng)過(guò)語(yǔ)義推理分析,排除該項(xiàng)服務(wù),剩余的4個(gè)服務(wù)都是有效的待選服務(wù)。
3.2.1 計(jì)算功能相似值
影響功能相似度的輸入、輸出、前置條件和效果等參數(shù)如表2所示,假設(shè)輸入對(duì)于所有的服務(wù)都是相同的。
表2 功能參數(shù)等級(jí)表
假定輸入、輸出、前置條件和效果的權(quán)重分別為0.3、0.3、0.2、0.2。根據(jù)式(2),采用加權(quán)平均值計(jì)算出各個(gè)服務(wù)的功能相似值為:
3.2.2 計(jì)算信譽(yù)度相似值
服務(wù)SA、SC、SD和SE的響應(yīng)時(shí)間、可用性、價(jià)格等信譽(yù)參數(shù)如表3所示,并且它們的權(quán)重分別為0.5、0.3和0.2。根據(jù)式(3),計(jì)算出各個(gè)服務(wù)的信譽(yù)值為:
假設(shè)信譽(yù)的閾值為0.65,即認(rèn)為低于該信譽(yù)值的服務(wù)包含有虛假信息,不將其添加到待選服務(wù)列表中,故丟棄服務(wù)SD。
表3 信譽(yù)等級(jí)表
3.2.3 整體語(yǔ)義相似度
假定功能相似度和信譽(yù)相似度的權(quán)重分別是0.7和0.3,根據(jù)式(1),計(jì)算出各個(gè)服務(wù)的整體相似度分別為:
綜合考慮功能相似度和信譽(yù)度,得出各個(gè)服務(wù)的整體相似度。各服務(wù)相似度從大到小的排序以次是SC、SE、SA。所以對(duì)本例而言,應(yīng)該首選SC作為最佳匹配的服務(wù)。
仍然用汽車銷售實(shí)例驗(yàn)證前文所提模型的可行性。實(shí)驗(yàn)環(huán)境配置為本體建模工具Protege3.1、本體編輯工具OWL_S Editor、推理機(jī)Jena+RACER Pro1.9、私有注冊(cè)中心jUDDI 0.9rc3、應(yīng)用服務(wù)器Jakarta Tomcat5.0、數(shù)據(jù)庫(kù)服務(wù)器MySQL5.1和開發(fā)平臺(tái)Eclipse。
先編寫相應(yīng)的服務(wù)并在UDDI中注冊(cè),如圖2所示。
圖2 Web服務(wù)注冊(cè)
圖3 Web服務(wù)的查詢結(jié)果
圖2左側(cè)窗口中列出了5個(gè)與汽車銷售相關(guān)服務(wù),右側(cè)窗口是對(duì)這些服務(wù)信息的詳細(xì)描述。要得到所需Web服務(wù)列表,用戶需要提供必要的信息如Service Name、Description、Inputs和Outputs等給請(qǐng)求代理,代理根據(jù)語(yǔ)義推理和信譽(yù)度度量過(guò)濾淘汰不相關(guān)和虛假的服務(wù),然后按服務(wù)相似度匹配程度返回滿足要求的Web服務(wù)列表。如圖3所示。
目前還沒有統(tǒng)一的計(jì)算Web服務(wù)發(fā)現(xiàn)性能的標(biāo)準(zhǔn),本文將采用查準(zhǔn)率和查全率作為評(píng)價(jià)依據(jù)。
由于本文實(shí)驗(yàn)的服務(wù)集數(shù)量有限,不能有效地驗(yàn)證服務(wù)發(fā)現(xiàn)性能。為收集大量的試驗(yàn)數(shù)據(jù),從uddi.ibm.com等站點(diǎn)下載了110個(gè)描述Web服務(wù)的WSDL文件和40個(gè)OWL_S文件。服務(wù)主要有汽車銷售、股票行情、航班查詢和數(shù)字圖書館查詢服務(wù)等。用工具OWL_S Editor對(duì)WSDL文件進(jìn)行了轉(zhuǎn)化,得到150個(gè)OWL_S文件,然后分別基于UDDI、Semantic進(jìn)行100次有效的服務(wù)請(qǐng)求,服務(wù)匹配結(jié)果如圖4所示。
圖4 兩種方法查全率和查準(zhǔn)率的比較
圖4表明,基于關(guān)鍵字查找的查準(zhǔn)率和查全率(48%,41%)遠(yuǎn)低于基于OWL_S語(yǔ)義相似度查找的查準(zhǔn)率和查全率(78%,85%),原因是UDDI基于關(guān)鍵字的服務(wù)發(fā)現(xiàn)機(jī)制不支持自動(dòng)化的服務(wù)發(fā)現(xiàn),查詢結(jié)果需要人工處理,才能確定服務(wù)是否和查詢條件相匹配。而基于語(yǔ)義的Web服務(wù)發(fā)現(xiàn)機(jī)制能夠自動(dòng)查找并返回與所要查找內(nèi)容在功能和信譽(yù)方面達(dá)到指定相似度的Web服務(wù)。
傳統(tǒng)的基于關(guān)鍵字和簡(jiǎn)單分類的Web服務(wù)發(fā)現(xiàn)存在查準(zhǔn)率和查全率低下的缺點(diǎn)。本文提出了一種基于相似度的語(yǔ)義Web服務(wù)發(fā)現(xiàn)方法,該方法在服務(wù)發(fā)現(xiàn)過(guò)程中增加了語(yǔ)義信息,通過(guò)語(yǔ)義推理增強(qiáng)服務(wù)的信譽(yù)度相似度和功能相似度,從而提高服務(wù)發(fā)現(xiàn)和匹配的精確程度。實(shí)驗(yàn)驗(yàn)證了該方法的可行性和相對(duì)于傳統(tǒng)方法的優(yōu)越性。進(jìn)一步的研究包括充分利用本體推理機(jī)制優(yōu)化語(yǔ)義Web服務(wù)發(fā)現(xiàn)算法,并提高語(yǔ)義Web服務(wù)發(fā)現(xiàn)的性能。
[1]FEI Chun, TANG Xue-fei. Research on the E-learning application of web service[J]. Journal of Electronic Science and Technology of China, 2005, 3(3): 218-221.
[2]鄭向宏, 李院春, 李增智, 等. 面向語(yǔ)用Web服務(wù)的Qos評(píng)價(jià)模型研究[J]. 電子科技大學(xué)學(xué)報(bào), 2007, 36(6): 1477-1480.
ZHENG Xiang-hong, LI Yuan-chun, LI Zeng-zhi, et al.Research on pragmatic web-oriented Qos evaluation model[J]. Journal of University of Electronic Science and Technology of China, 2007, 36 (6): 1477-1480.
[3]趙文峰, 孟祥武, 陳俊亮. 信息提供類Web服務(wù)與RDF數(shù)據(jù)源的集成[J]. 北京郵電大學(xué)學(xué)報(bào), 2008, 31 (6): 109-112.
ZHAO Wen-feng, MENG Xiang-wu, CHEN Jun-liang.Integration of information-providing web services and RDF data sources[J]. Journal of Beijing University of Posts and Telecommunications, 2008, 31(6). 109-112.
[4]PAPAZOGLOU M P, GEORGAK O D. Service oriented computing[J]. Communication of the ACM, 2003, 46 (10):25-28.
[5]DAY J, DETERS R. Selecting the best web service[C]//Proceedings of the 2004 Conference of the Centre for Advanced Studies on Collaborative Research Tabel of Contents. Markham: [s.n.], 2004.
[6]林清瀅. 基于UDDI的語(yǔ)義Web服務(wù)發(fā)現(xiàn)研究[J]. 計(jì)算機(jī)工程與設(shè)計(jì), 2006, 27(12): 2215-2217.
LIN Qing-ying. UDDI based semantic web service discovery research[J]. Computer Engineering and Design,2006, 27(12): 2215-2217.
[7]KAMVAR S D, SCHLOSSER M T. In: Reputation management in P2P networks[C]//Proc of the 12th World Wide Web Conference. Hawaii: ACM Press, 2004: 123-134.
[8]RAMA A. RICHARD C. A method for semantically enhancing the service discovery capabilities of transaction on web service, 2003, 3(3): 310-323.
[9]艾未華, 宋自林, 魏 磊, 等. 基于領(lǐng)域本體的Web服務(wù)發(fā)現(xiàn)[J]. 電子科技大學(xué)學(xué)報(bào), 2007, 36(3): 506-509.
AI Wei-hua, SONG Zi-lin, WEI Lei, et al. Web service discovery based on domain ontology[J]. Journal of University of Electronic Science and Technology of China,2007, 36(3): 506-509.
[10]王 慧, 王金華, 趙煜輝, 等. 基于信譽(yù)的語(yǔ)義Web服務(wù)發(fā)現(xiàn)[J]. 計(jì)算機(jī)科學(xué), 2007, 34(8): 130-134.
WANG Hui, WANG Jin-Hua, ZHAO Yu-Hui, et al.Reputation-based semantic web service discovery[J].Computer Science, 2007, 34(8): 130-134.
[11]CURBERA F, KHALAF R, MUKHI N. The next step in web service[J]. ACM, 2003, 46(10): 29-34.
[12]白東偉, 劉傳昌, 陳俊亮. 一種增強(qiáng)語(yǔ)義精確度的Web服務(wù)匹配方法[J]. 北京郵電大學(xué)學(xué)報(bào), 2006, 29(5): 40-44.
BAI Dong-wei, LIU Chuan-chang, CHEN Jun-liang. A web services matchmaking method with enhanced semantic precision[J]. Journal of Beijing University of Posts and Telecommunications, 2006, 29(5): 40-44.
編 輯 漆 蓉
Research on Similarity-Based Semantic Web Services Discovery
CHEN Wen-yu, ZHANG Zhong-quan, XIANG Tao, and SANG Nan
(School of Computer Science and Engineering, University of Electronic Science and Technology of China Chengdu 610054)
Aiming at the problems of low efficiency in service discovery of traditional web service, a similarity-based semantic web service discovery model is proposed, with the application of semantic web technology and ontology. The mechanism uses Ontology Web Language for Service (OWL_S)to describe web service and publishes service with semantic information. Ontology reasoning is added into service searching to measure its degree of functional matching and reputation value. The experiments suggest that the proposed method is better than that of Universal Description Discovery and Integration (UDDI)in precision and recall ratio.
ontology; reputation; semantics Web; service discovery; Web services
TP311
A
10.3969/j.issn.1001-0548.2010.06.019
2009- 04- 17;
2010- 03- 28
國(guó)家863計(jì)劃 (2007AAO1Z131)
陳文宇(1968- ),男,博士,副教授,主要從事編譯技術(shù)、模式識(shí)別、形式語(yǔ)言與自動(dòng)機(jī)方面的研究.
book=910,ebook=354