王棒鈞
關(guān)鍵詞:知識(shí)圖譜;Web服務(wù)推薦技術(shù);物品協(xié)同推薦;GN計(jì)算方法
知識(shí)圖譜下的Web服務(wù)推薦技術(shù)實(shí)質(zhì)上是為了能夠快速、有效地解決網(wǎng)頁(yè)問(wèn)題而出現(xiàn),其核心思想是通過(guò)特殊技術(shù),將用戶(hù)與物品之間建立的聯(lián)系進(jìn)行深入挖掘,從而獲取有效信息,以實(shí)現(xiàn)用戶(hù)畫(huà)像的準(zhǔn)確描述,并將其感興趣的信息和數(shù)據(jù)有效推送,以此滿(mǎn)足用戶(hù)的使用需求[1]。
1概述
1.1知識(shí)圖譜
知識(shí)圖譜基礎(chǔ)概論是由互聯(lián)網(wǎng)公司提出來(lái)的,其主要的目的和功能是優(yōu)化搜索引擎,以關(guān)系數(shù)據(jù)知識(shí)庫(kù)為基礎(chǔ),對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化、確定性的關(guān)聯(lián)與檢索,從而提升搜索服務(wù)質(zhì)量,提高平臺(tái)探索結(jié)果關(guān)聯(lián)性、可解釋性。為了豐富知識(shí)圖譜關(guān)聯(lián)探索結(jié)構(gòu),技術(shù)人員要進(jìn)行全面分析,合理利用知識(shí)圖譜,結(jié)合知識(shí)圖譜實(shí)體之間的關(guān)聯(lián),將搜索內(nèi)容作為真實(shí)實(shí)體結(jié)構(gòu),構(gòu)建一個(gè)完整、真實(shí)的知識(shí)系統(tǒng)性組織。
在知識(shí)圖譜中,“反映現(xiàn)實(shí)世界的概念或者是具體事物的形式”一般是通過(guò)節(jié)點(diǎn)數(shù)據(jù)形式,即將知識(shí)、信息建立成一個(gè)實(shí)體結(jié)構(gòu)。在知識(shí)庫(kù)的基礎(chǔ)上,將不同種類(lèi)的知識(shí)系統(tǒng)進(jìn)行完善,從而形成知識(shí)圖譜。并且,為了反映實(shí)體間的關(guān)聯(lián),需要進(jìn)行結(jié)構(gòu)標(biāo)識(shí),將實(shí)體結(jié)構(gòu)、關(guān)系等組合形成知識(shí)圖譜中的基礎(chǔ)單位,確保實(shí)體與實(shí)體之間相關(guān)屬性,豐富了知識(shí)圖譜節(jié)點(diǎn)內(nèi)容。比如,當(dāng)用戶(hù)在平臺(tái)結(jié)構(gòu)上關(guān)注了B平臺(tái),就可以利用組合平臺(tái)組合標(biāo)識(shí)-A關(guān)注為B。由于此知識(shí)圖譜通過(guò)組合形式針對(duì)現(xiàn)實(shí)世界實(shí)體以及內(nèi)部關(guān)系進(jìn)行結(jié)構(gòu)標(biāo)識(shí),所以就本質(zhì)上而言,知識(shí)圖譜是結(jié)構(gòu)化語(yǔ)義知識(shí)庫(kù)。
1.2Web服務(wù)推薦
Web服務(wù)推薦在實(shí)施過(guò)程中,其目的是有效解決用戶(hù)服務(wù)的現(xiàn)實(shí)問(wèn)題,使其成為服務(wù)計(jì)算機(jī)領(lǐng)域研究的重點(diǎn)內(nèi)容,而現(xiàn)代Web服務(wù)推薦發(fā)展中,知識(shí)圖譜的引進(jìn)與應(yīng)用就有著重要意義。同時(shí),在Web服務(wù)推薦的過(guò)程中,借助服務(wù)注冊(cè)治理平臺(tái)可以獲取服務(wù)詳細(xì)信息、用戶(hù)詳細(xì)信息以及用戶(hù)調(diào)查等相關(guān)數(shù)據(jù),從而結(jié)合數(shù)據(jù)特點(diǎn)以及模型自身重點(diǎn)建立有關(guān)推薦模型,進(jìn)而有效提升用戶(hù)服務(wù)質(zhì)量。當(dāng)前,在Web服務(wù)推薦技術(shù)產(chǎn)業(yè)發(fā)展中,其系統(tǒng)需要使用專(zhuān)業(yè)技術(shù)在用戶(hù)協(xié)同推薦、物品協(xié)同推薦的基礎(chǔ)上為用戶(hù)提供準(zhǔn)確服務(wù)。
1.2.1用戶(hù)協(xié)同推薦
用戶(hù)協(xié)同推薦就是在用戶(hù)協(xié)同推薦規(guī)律和原則下,首先找到相近偏好的鄰居,利用目標(biāo)用戶(hù)鄰居對(duì)物品的評(píng)價(jià)進(jìn)行全面預(yù)測(cè),隨后根據(jù)預(yù)測(cè)評(píng)分的實(shí)際順序進(jìn)行推送,并建立用于協(xié)同過(guò)濾推薦用戶(hù)行為表,為后續(xù)的用戶(hù)服務(wù)提供數(shù)據(jù)參考。
1.2.2物品協(xié)同推薦
物品協(xié)同推薦是以物品協(xié)同過(guò)濾為重點(diǎn),對(duì)物品的相似性進(jìn)行詳細(xì)分析,物品協(xié)同過(guò)濾計(jì)算方式同樣需要依靠用戶(hù)行為表格,通過(guò)用戶(hù)基礎(chǔ)行為表格,詳細(xì)計(jì)算出物品之間的相似度,隨后根據(jù)服務(wù)評(píng)分開(kāi)展信息預(yù)測(cè),以此為用戶(hù)提供針對(duì)性的推薦服務(wù)。
2基于知識(shí)圖譜視域的Web服務(wù)推薦技術(shù)的算法架構(gòu)
2.1圖聚類(lèi)算法
圖聚類(lèi)算法是一種將數(shù)據(jù)與信息以分組形式進(jìn)行的計(jì)算方式。其計(jì)算原理是將一個(gè)初始數(shù)據(jù)結(jié)合之后進(jìn)行連續(xù)分類(lèi),最后得到不同子集,確保相同子集中不同元素之間具有較高相似度,在對(duì)知識(shí)圖譜結(jié)構(gòu)進(jìn)行區(qū)域劃分后的實(shí)際計(jì)算中,需要采用的計(jì)算方法包含GN計(jì)算法、標(biāo)簽傳播計(jì)算法以及Fastunfolding計(jì)算法[2]。因此,圖聚類(lèi)算法從本質(zhì)上來(lái)看是系統(tǒng)結(jié)構(gòu)具有緊密節(jié)點(diǎn)的聚合類(lèi)計(jì)算方法。
2.1.1CN計(jì)算法
CN計(jì)算法作為典型的分裂結(jié)構(gòu)計(jì)算模式,在實(shí)施環(huán)節(jié)上需要根據(jù)社區(qū)內(nèi)部高聚合以及不同社區(qū)之間的低聚合特點(diǎn)進(jìn)行綜合分析,由于該計(jì)算方法能夠有效去除連接不同社區(qū)的邊緣線(xiàn),使不同社區(qū)之間更加聚合,所以該計(jì)算方法針對(duì)邊緣判斷主要通過(guò)邊緣所產(chǎn)生介質(zhì)數(shù)量完成。
利用CN計(jì)算法開(kāi)展信息計(jì)算時(shí),邊緣介質(zhì)數(shù)是一個(gè)固定參數(shù),主要為節(jié)點(diǎn)兩邊最短距離所需要經(jīng)過(guò)頻率次數(shù),所以如果兩個(gè)社區(qū)需要通過(guò)某一條邊緣結(jié)構(gòu)進(jìn)行相互連接,則兩個(gè)社區(qū)之間的節(jié)點(diǎn)最短路線(xiàn)通過(guò)邊緣次數(shù)和頻率會(huì)不斷增加。因此,在實(shí)際開(kāi)展信息和參數(shù)計(jì)算時(shí),應(yīng)根據(jù)邊緣介數(shù)的核心定義,確保經(jīng)過(guò)此邊緣參數(shù)更大,CN計(jì)算法就是以這種計(jì)算原理,對(duì)刪除邊緣參數(shù)不斷重復(fù)操作,直至社區(qū)滿(mǎn)足劃分需求。
2.1.2標(biāo)簽傳播計(jì)算法
標(biāo)簽傳播計(jì)算法從本質(zhì)上來(lái)看是一種典型從下至上的社區(qū)分類(lèi)計(jì)算方法,標(biāo)簽傳播計(jì)算方法的分類(lèi)核心思想則是節(jié)點(diǎn)標(biāo)簽標(biāo)注,直接取決于相鄰節(jié)點(diǎn)的數(shù)據(jù)標(biāo)簽,所以利用此計(jì)算法時(shí),需針對(duì)每個(gè)節(jié)點(diǎn)統(tǒng)計(jì)當(dāng)下節(jié)點(diǎn)所有連接屬性標(biāo)簽,將具備節(jié)點(diǎn)數(shù)量最多的標(biāo)簽賦予當(dāng)下節(jié)點(diǎn),利用標(biāo)簽傳播計(jì)算法,首先需要為每一個(gè)節(jié)點(diǎn)建立初始化的標(biāo)簽;其次,實(shí)現(xiàn)傳播。并且,在每一次的更新迭代中傳播思想,并不斷發(fā)展,最終使得在標(biāo)簽不斷傳播過(guò)程中,將一些具備共同社區(qū)的標(biāo)簽階段劃分在相同社區(qū)環(huán)境中。
2.1.3Fast unfolding計(jì)算法
關(guān)于使用圖聚類(lèi)算法,無(wú)論是分裂型CN計(jì)算法,還是凝聚性標(biāo)簽傳播計(jì)算法,都沒(méi)有一個(gè)量化的指標(biāo)針對(duì)社區(qū)劃分質(zhì)量開(kāi)展優(yōu)化與衡量。換言之,社區(qū)無(wú)論是運(yùn)算到什么程度都會(huì)被認(rèn)定為最佳結(jié)果。比如,以CN計(jì)算法作為實(shí)際案例,通過(guò)從上至下的社會(huì)分裂開(kāi)展劃分,其分裂終止條件無(wú)法開(kāi)展最優(yōu)化的項(xiàng)目設(shè)定,所以社區(qū)劃分質(zhì)量需要根據(jù)基礎(chǔ)條件設(shè)定出不同類(lèi)型的較大波動(dòng)。
使用標(biāo)簽傳播計(jì)算法時(shí),更新迭代次數(shù)與頻率同樣無(wú)法被有效設(shè)定,由于圖譜存在異常節(jié)點(diǎn)數(shù)據(jù)時(shí)會(huì)出現(xiàn)標(biāo)簽震動(dòng)等情況,無(wú)法得到高質(zhì)量、高水平的社區(qū)劃分,所以模塊化概念被廣泛使用。
Fast unfolding計(jì)算法主要通過(guò)模塊進(jìn)行社區(qū)劃分,判斷出社區(qū)發(fā)現(xiàn)計(jì)算方法,一般來(lái)說(shuō),將模塊化最大程度社區(qū)劃分作為最優(yōu)的區(qū)域。Fast unfolding計(jì)算法在實(shí)施過(guò)程中,首先將社區(qū)內(nèi)每個(gè)節(jié)點(diǎn)初始化不同社區(qū)管理區(qū)域中,對(duì)每個(gè)節(jié)點(diǎn)開(kāi)展詳細(xì)劃分,將計(jì)算階段與相鄰節(jié)點(diǎn)劃分至相同社區(qū)環(huán)境中,以此作為基礎(chǔ)條件。計(jì)算劃分之后的模塊與沒(méi)劃分的模塊數(shù)據(jù),如果兩者之間差值為正值,則表示模塊增加,如果差值為負(fù)值,則視為錯(cuò)誤參數(shù)需要放棄。Fastunfolding計(jì)算法如圖1所示。
2.2基于知識(shí)圖譜的算法框架
從本質(zhì)上來(lái)看,知識(shí)圖譜計(jì)算方式框架制定是對(duì)專(zhuān)業(yè)知識(shí)的抽象管理,所以框架主要使用本體知識(shí)模型建立方式,將本體概念建立在數(shù)據(jù)結(jié)構(gòu)層上,其中知識(shí)圖譜的本體結(jié)構(gòu)是知識(shí)庫(kù)的概念模板,通過(guò)本體數(shù)據(jù)所形成的知識(shí)庫(kù),不僅自身結(jié)構(gòu)層次劃分清晰,并且所產(chǎn)生的數(shù)據(jù)與信息冗余度較小。計(jì)算方式框架向量圖如圖2所示。
綜上可知,本體所描述的語(yǔ)言作為知識(shí)圖譜的算法框架基礎(chǔ)語(yǔ)言模式,是框架語(yǔ)言的一種寬泛表示,讓用戶(hù)為框架編寫(xiě)清晰、表面化的概念描述。針對(duì)此現(xiàn)狀,本體語(yǔ)言通常具有語(yǔ)言清晰、含義清晰以及便利性?xún)?yōu)勢(shì)和特點(diǎn),能夠按照標(biāo)記語(yǔ)法進(jìn)行種類(lèi)劃分。
3Web服務(wù)知識(shí)圖譜的構(gòu)建分析
3.1數(shù)據(jù)采集
在Web服務(wù)知識(shí)圖譜構(gòu)建過(guò)程中,若要保證圖譜構(gòu)建合理性,首先須對(duì)知識(shí)圖譜結(jié)構(gòu)所產(chǎn)生的數(shù)據(jù)和信息全面收集[3],如利用程序軟件針對(duì)Web服務(wù)網(wǎng)站中相關(guān)數(shù)據(jù)進(jìn)行全面收集和分析時(shí),會(huì)借助Programmable Web。由于Programmable Web網(wǎng)站是全球范圍內(nèi)網(wǎng)站的主要服務(wù)平臺(tái),由此,不少互聯(lián)網(wǎng)企業(yè)都需要通過(guò)該網(wǎng)站發(fā)布相應(yīng)的服務(wù),這樣才能夠?qū)崿F(xiàn)用戶(hù)使用的便利性。
Programmable Web網(wǎng)站在實(shí)際建設(shè)環(huán)節(jié)上還發(fā)布了大量網(wǎng)頁(yè)API以及APP等,并且數(shù)據(jù)收集方面還包含世界地圖、城市旅游以及自然天氣等大量實(shí)時(shí)信息。由于該網(wǎng)站的服務(wù)數(shù)據(jù)與信息主要通過(guò)網(wǎng)頁(yè)管理模式所呈現(xiàn),并且大多數(shù)屬于半結(jié)構(gòu)數(shù)據(jù),所以對(duì)其進(jìn)行使用時(shí)需要利用專(zhuān)業(yè)技術(shù)針對(duì)網(wǎng)頁(yè)中的半結(jié)構(gòu)化數(shù)據(jù)和信息予以全面抽取,獲得大量與服務(wù)相關(guān)的網(wǎng)頁(yè)數(shù)據(jù),并將相關(guān)數(shù)據(jù)初步存儲(chǔ)在關(guān)系型數(shù)據(jù)庫(kù)中。
3.2Web服務(wù)知識(shí)圖譜的可視化
在知識(shí)圖譜下的Web服務(wù)推薦技術(shù)實(shí)施過(guò)程中,圖譜中的知識(shí)通過(guò)大量信息聯(lián)系在一起,因此當(dāng)平臺(tái)數(shù)據(jù)被頻繁查詢(xún)和更新時(shí),關(guān)系數(shù)據(jù)庫(kù)處理會(huì)產(chǎn)生許多信息連接查詢(xún),造成平臺(tái)性能問(wèn)題。為此,使用圖庫(kù)能夠?qū)?shù)據(jù)儲(chǔ)存與提取方式合理規(guī)劃,使圖譜數(shù)據(jù)庫(kù)在使用環(huán)境下較關(guān)系型數(shù)據(jù)庫(kù)來(lái)說(shuō)具有更高性能,同時(shí)在圖譜數(shù)據(jù)庫(kù)中以更加直觀(guān)的圖形展現(xiàn)。由此可見(jiàn),圖譜數(shù)據(jù)庫(kù)在建設(shè)過(guò)程中能夠針對(duì)平臺(tái)進(jìn)行圖譜可視化操作。
本次研究主要使用譜圖數(shù)據(jù)庫(kù)進(jìn)行Web服務(wù),以確保圖譜數(shù)據(jù)儲(chǔ)存和可視化操作。NE04J是一種基于圖譜的非關(guān)系數(shù)據(jù)庫(kù),現(xiàn)階段該數(shù)據(jù)庫(kù)應(yīng)用范圍比較廣,尤其在數(shù)據(jù)搜索或者推薦等領(lǐng)域中被廣泛使用,如電商平臺(tái)以及沃爾瑪?shù)却笮统芯褂迷撈脚_(tái)。除此之外,NE04J平臺(tái)上的節(jié)點(diǎn)可以與其他任何節(jié)點(diǎn)構(gòu)建出連接關(guān)系,并且以每個(gè)節(jié)點(diǎn)作為基礎(chǔ)條件設(shè)置多個(gè)屬性,其中每一個(gè)關(guān)系必須具有開(kāi)始節(jié)點(diǎn)或者結(jié)束節(jié)點(diǎn),以有效構(gòu)成一個(gè)系統(tǒng)小組?,F(xiàn)階段,譜圖數(shù)據(jù)庫(kù)種類(lèi)較為復(fù)雜,除了NE04J平臺(tái)以外,同樣有其他類(lèi)型的平臺(tái)結(jié)構(gòu),但是NE04J平臺(tái)在實(shí)施過(guò)程中,無(wú)論是信息儲(chǔ)存還是查詢(xún)都需要使用圖形結(jié)構(gòu)開(kāi)展參數(shù)計(jì)算,該平臺(tái)在數(shù)據(jù)庫(kù)儲(chǔ)存時(shí),即使沒(méi)有使用譜圖結(jié)構(gòu),各個(gè)階層同樣利用關(guān)系型數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)和信息儲(chǔ)存。由此可見(jiàn),NE04J平臺(tái)管理效率更高。
知識(shí)圖譜的實(shí)際情況與關(guān)系在平臺(tái)上主要以節(jié)點(diǎn)與邊緣呈現(xiàn),確保實(shí)體的信息與數(shù)據(jù)能夠直接儲(chǔ)存在節(jié)點(diǎn)中,在信息查詢(xún)時(shí)能十分直觀(guān)清晰地觀(guān)察到各個(gè)數(shù)據(jù)節(jié)點(diǎn)的使用屬性。在Web服務(wù)推薦技術(shù)應(yīng)用中,知識(shí)圖譜中單個(gè)節(jié)點(diǎn)質(zhì)保函的實(shí)體基礎(chǔ)屬性信息與數(shù)據(jù)并不能包含之間的關(guān)系,如Mashup FollowFly關(guān)聯(lián)了三個(gè)服務(wù)——YouTube,F(xiàn)acebook和Twitter。顯然,借助知識(shí)圖譜可以較好地表示這種聯(lián)系,從而實(shí)現(xiàn)信息與數(shù)據(jù)之間關(guān)聯(lián)性確定。
4總結(jié)
互聯(lián)網(wǎng)的高速發(fā)展讓網(wǎng)絡(luò)服務(wù)的類(lèi)型逐漸增多,功能也更加復(fù)雜,為了解決傳統(tǒng)開(kāi)發(fā)模式中面臨的問(wèn)題,面向服務(wù)架構(gòu)應(yīng)運(yùn)而生。隨著面向服務(wù)架構(gòu)的逐漸成熟,互聯(lián)網(wǎng)中大量的Web服務(wù)涌現(xiàn)出來(lái),需要不斷加強(qiáng)對(duì)知識(shí)圖譜下的Web服務(wù)推薦技術(shù)的研究,以推動(dòng)互聯(lián)網(wǎng)技術(shù)的持續(xù)發(fā)展。