• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于可信Web服務(wù)的信息查詢技術(shù)的研究

      2016-07-31 21:10:14孟奇
      數(shù)碼世界 2016年3期
      關(guān)鍵詞:搜索引擎密鑰頁(yè)面

      基于可信Web服務(wù)的信息查詢技術(shù)的研究

      在Internet網(wǎng)絡(luò)中,對(duì)Web站點(diǎn)中的信息進(jìn)行查詢是非常頻繁的操作,但面對(duì)海量的網(wǎng)絡(luò)信息我們的查詢存在著很多安全隱患和查詢效率低下的煩惱。導(dǎo)致查詢效率低下的原因主要有兩個(gè):一是Internet網(wǎng)絡(luò)中的信息浩瀚無(wú)邊且與日俱增,Web信息沒(méi)有統(tǒng)一的模式結(jié)構(gòu)。二是Internet網(wǎng)絡(luò)中目前還沒(méi)有非常完善的查詢技術(shù)來(lái)有效的幫助用戶查詢符合用戶需求的信息。查詢效率的高低與查詢算法設(shè)計(jì)的好壞是密切相關(guān)的。本文主要討論:可信Web服務(wù),Web服務(wù)的安全性和Web查詢技術(shù)。

      1 可信Web服務(wù)

      由于互聯(lián)網(wǎng)的開(kāi)放性和不完善性,目前的互聯(lián)網(wǎng)中存在著很多不安全的因素,而Web服務(wù)的靈活性在一定程度上也潛在著安全缺陷,所以確保Web服務(wù)的安全性是一個(gè)非常重要的問(wèn)題,這就要求能夠采取各種有效措施來(lái)抵御各種攻擊。應(yīng)用安全模型、安全機(jī)制等可以確保Web服務(wù)的完整性、私密性和安全性。

      1.1 Web服務(wù)的安全通信

      Web服務(wù)是采用SOAP協(xié)議標(biāo)準(zhǔn)來(lái)交換消息的,提高Web服務(wù)的可信性也就是提高SOAP消息的可信度。我們可以對(duì)SOAP消息的傳送的三步驟:信息序列化?傳送?反序列化進(jìn)行改進(jìn):

      1)服務(wù)請(qǐng)求者向服務(wù)提供者發(fā)送ClientHello消息;

      2)服務(wù)提供者對(duì)收到ClientHello消息進(jìn)行簽名,再發(fā)送給服務(wù)請(qǐng)求者;

      3)服務(wù)請(qǐng)求者對(duì)服務(wù)提供者進(jìn)行身份認(rèn)證,若通過(guò),則生成會(huì)話密鑰和進(jìn)一步的請(qǐng)求,對(duì)請(qǐng)求消息進(jìn)行安全處理,并連同自己的證書(shū)一起發(fā)送給服務(wù)提供者。

      4)服務(wù)提供者收到請(qǐng)求消息后,首先對(duì)服務(wù)請(qǐng)求者進(jìn)行驗(yàn)證,若通過(guò),則建立會(huì)話,完成對(duì)請(qǐng)求消息的后續(xù)處理,并對(duì)處理結(jié)果進(jìn)行MAC計(jì)算;

      5)服務(wù)請(qǐng)求者收到響應(yīng)消息后,進(jìn)行簽名、加密等處理,并使用會(huì)話密鑰對(duì)處理結(jié)果進(jìn)行MAC計(jì)算;

      6)服務(wù)提供者收到上一步的請(qǐng)求消息后,驗(yàn)證會(huì)話的有效性,若通過(guò),則驗(yàn)證MAC的有效性,并對(duì)請(qǐng)求消息進(jìn)行后續(xù)處理,否則,若會(huì)話標(biāo)識(shí)符無(wú)效或MAC驗(yàn)證無(wú)效,則向服務(wù)請(qǐng)求者發(fā)出錯(cuò)誤消息。

      這一會(huì)話過(guò)程是有時(shí)間限制的,若會(huì)話未超時(shí),則重復(fù)步驟5、6,否則重復(fù)步驟1~6。若通信發(fā)生較嚴(yán)重的錯(cuò)誤時(shí),則會(huì)導(dǎo)致會(huì)話終止,通信失敗,發(fā)送錯(cuò)誤信息。

      1.2 Web服務(wù)的安全機(jī)制

      1.2.1 加密機(jī)制

      目前用于網(wǎng)絡(luò)通信安全的密碼技術(shù)主要有對(duì)稱加密、非對(duì)稱加密。

      對(duì)稱加密:發(fā)送者和接收者都使用相同的密鑰對(duì)數(shù)據(jù)進(jìn)行加密和解密,一般用于加密大量數(shù)據(jù)。對(duì)稱密鑰技術(shù)的常用算法有DES、IDEA、RC2、RC4、SKIPJACK。對(duì)稱加密算法的加密處理簡(jiǎn)單,加密解密速度快。但密鑰管理困難。

      非對(duì)稱加密:發(fā)送者和接收者使用不同的密鑰對(duì)數(shù)據(jù)進(jìn)行加密和解密。非對(duì)稱密鑰技術(shù)的典型算法有RSA、DSA。非對(duì)稱加密算法解決了密鑰管理的困難,密鑰是事先分配的無(wú)需在通信過(guò)程中傳輸,所以安全性很高,且具有很高的加密強(qiáng)度,但非對(duì)稱加密系統(tǒng)的加密和解密速度慢。

      1.2.2 安全認(rèn)證機(jī)制

      為了確保信息的安全、真實(shí)、可靠,我們必須有一種機(jī)制來(lái)驗(yàn)證信息傳遞中各方的真實(shí)身份,安全認(rèn)證包括安全管理、加密處理、PKI和認(rèn)證管理等問(wèn)題。目前常用的安全認(rèn)證機(jī)制有:數(shù)字摘要、數(shù)字時(shí)間戳、數(shù)字簽名、數(shù)字證書(shū)等。

      1.2.3 訪問(wèn)控制策略

      訪問(wèn)控制是維護(hù)網(wǎng)絡(luò)系統(tǒng)安全、保護(hù)網(wǎng)絡(luò)資源的最重要的核心策略之一,有效的訪問(wèn)控制可以保證網(wǎng)絡(luò)資源不被非法使用和非法訪問(wèn)。目前常用的訪問(wèn)控制策略有:入網(wǎng)訪問(wèn)控制、操作權(quán)限控制、目錄安全控制。

      2 信息查詢技術(shù)

      信息查詢一般都是借助搜索引擎頁(yè)面來(lái)實(shí)現(xiàn),即輸入關(guān)鍵詞利用搜索引擎在索引數(shù)據(jù)庫(kù)中進(jìn)行相關(guān)信息的查找,并將結(jié)果返回給用戶。除了根據(jù)需要選擇不同的搜索引擎之外,我們可以根據(jù)不同的查詢需求采用不同的查詢技術(shù)來(lái)提高查詢效率。

      2.1 盲目查詢

      盲目查詢又叫做無(wú)信息查詢,即按照預(yù)定的控制策略實(shí)行查詢,在查詢過(guò)程中獲取的中間信息不用來(lái)改進(jìn)控制策略。盲目查詢方法有寬度優(yōu)先、深度優(yōu)先、代價(jià)優(yōu)先、混合、向前、向后、雙向等等。

      2.2 啟發(fā)式查詢

      把求解問(wèn)題的具體領(lǐng)域的知識(shí)加入查詢算法中,控制整個(gè)查詢過(guò)程,以提高算法效率的查詢方法叫做啟發(fā)式查詢。啟發(fā)式查詢過(guò)程中最重要的事件就是尋找和決定要擴(kuò)展的下一個(gè)節(jié)點(diǎn),用來(lái)估算節(jié)點(diǎn)希望程度的量度,叫做估價(jià)函數(shù)。一個(gè)節(jié)點(diǎn)的“希望度”在狀態(tài)空間問(wèn)題中,可以估算目標(biāo)節(jié)點(diǎn)到此節(jié)點(diǎn)的距離或者解答路徑包括被估價(jià)過(guò)的節(jié)點(diǎn),并計(jì)算全條路徑的長(zhǎng)度或難度。每個(gè)不同的衡量標(biāo)準(zhǔn)只能考慮該問(wèn)題中這個(gè)節(jié)點(diǎn)的某些決定性特性,所以我們可以對(duì)給定節(jié)點(diǎn)與目標(biāo)節(jié)點(diǎn)進(jìn)行比較,以決定相關(guān)特性。

      2.3 多元搜索查詢技術(shù)

      網(wǎng)絡(luò)中信息的種類繁復(fù),單一的搜索工具根本無(wú)法滿足用戶的需求。多元搜索引擎是一種集合式的搜索引擎,它可以將多個(gè)搜索引擎集成在一起,并提供一個(gè)統(tǒng)一的檢索界面,且能將一個(gè)檢索提問(wèn)同時(shí)發(fā)送給多個(gè)搜索引擎,達(dá)到同時(shí)檢索多個(gè)數(shù)據(jù)庫(kù),再經(jīng)過(guò)聚合、去除重復(fù)項(xiàng)之后輸出檢索結(jié)果。多元搜索引擎可以大大節(jié)省檢索時(shí)間。多元搜索引擎適合查詢一些較模糊的提問(wèn),或就某一課題的網(wǎng)絡(luò)資源進(jìn)行快速調(diào)查、摸底、綜覽。

      2.4 常用的查詢算法

      實(shí)現(xiàn)搜索引擎最關(guān)鍵的就是搜索算法的實(shí)現(xiàn),PageRank和HITS都是典型的網(wǎng)絡(luò)搜索查詢算法,我們可以把這兩種算法應(yīng)用到可信Web服務(wù)的查詢技術(shù)中來(lái)。

      2.4.1 PageRank算法

      PageRank算法主要基于重要性平均分配的思想進(jìn)行設(shè)計(jì)的。

      假定Nu是頁(yè)面u的出度,Rank(u)是u的重要性。PageRank假設(shè)u通過(guò)指向v的直接鏈接將一部分重要性(量化為Rank(u)/Nu)傳遞給了v頁(yè)面。同樣,v頁(yè)面的重要性是所有直接鏈接到v的頁(yè)面累積起來(lái)的。(Ranki(u)÷Nu)

      注:Bv代表直接對(duì)v鏈接的所有頁(yè)面的集合。

      基于這個(gè)思想,通過(guò)迭代算法,我們可以得到所有頁(yè)面的重要性。

      2.4.2 HITS算法

      HITS(Hyperlink-Induced Topic Search,超鏈接誘導(dǎo)的主題搜索)算法是Kleinberg在90年代末提出的基于鏈接分析的網(wǎng)頁(yè)排名算法。

      HITS算法的基本思想:HITS由用戶的檢索主題得到一個(gè)初始結(jié)果,構(gòu)成一個(gè)算法的根集。設(shè)置非負(fù)權(quán)威權(quán)重ap和非負(fù)中心權(quán) 重h與數(shù)據(jù)庫(kù)基本集中的每一個(gè)頁(yè)面p相關(guān),將所有的a和h值都初始化為相同的常數(shù)。權(quán)重規(guī)范處理,維護(hù)所有權(quán)重的平方和為1。權(quán)威與中心的權(quán)重可按如下公式更新:

      第一個(gè)公式表明,如果一個(gè)頁(yè)面被很多好的中心所指向,則其權(quán)威權(quán)重應(yīng)當(dāng)增加(即,它為所有指向它的頁(yè)面的當(dāng)前中心權(quán)重之和)。第二個(gè)公式表明,如果一個(gè)頁(yè)面指向許多好的權(quán)威頁(yè)面,則其中心權(quán)重應(yīng)當(dāng)增加(即,它為該頁(yè)面指向的所有頁(yè)面的權(quán)威權(quán)重之和)。

      我們用{1,2,…,n}對(duì)頁(yè)面編號(hào),定義它們的鄰接矩陣A為n×n矩陣,如果頁(yè)面i鏈接到頁(yè)面就j,則A(i,j)為1,否則為0。類似地,定義權(quán)威權(quán)重向量a=(a1,a2,…,an),和中心權(quán)重向量h=(h1,h2,…h(huán)n)??傻?/p>

      h=A·a a=AT·h

      注:AT是A的轉(zhuǎn)置矩陣。對(duì)兩公式展開(kāi)k次,就有h=A·a=AATh=(AAT)h=(AAT)2h=…=(AAT)kh a=AT·h=ATAa=(ATA) a=(ATA)2a=…=(ATA)

      根據(jù)線性代數(shù),當(dāng)規(guī)范化后,這兩個(gè)迭代序列分別收斂于主本真向量AAT和ATA,這就證明了權(quán)威和中心權(quán)重是所收集的鏈接頁(yè)面的固有特征,并且不受初始權(quán)重設(shè)置的影響。而在實(shí)際應(yīng)用中HITS算法的查詢也具有非常好的搜索結(jié)果。

      2.4.3 查詢算法的改進(jìn)

      PageRank算法和HITS算法雖然都是鏈接分析算法,但都存在著不足。PageRank算法會(huì)忽略了網(wǎng)頁(yè)的內(nèi)容,他的authority值只是相對(duì)于某個(gè)檢索主題的權(quán)重,而HITS算法存在著“主題漂移”的現(xiàn)象。下面對(duì)兩種算法進(jìn)行改進(jìn),以便解決他們的不足。

      首先利用HITS的方法構(gòu)造出算法的基本集,用戶的查詢請(qǐng)求來(lái)了之后,我們首先用一個(gè)現(xiàn)有的商業(yè)搜索引擎進(jìn)行查詢,從得到的查詢結(jié)果中取出一定量的信息作為算法的根集,將該根集進(jìn)行擴(kuò)充,將根集中的所有頁(yè)面的出度和入度網(wǎng)頁(yè)都補(bǔ)充進(jìn)來(lái),形成新的基本集。然后再利用PageRank算法。

      PageRank算法原先是對(duì)萬(wàn)維網(wǎng)的整體分析,可以對(duì)用戶的要求進(jìn)行快速的響應(yīng)。而HITS算法是對(duì)萬(wàn)維網(wǎng)的部分進(jìn)行分析,依賴于用戶查詢,實(shí)時(shí)性差。改進(jìn)后的算法主要是通過(guò)把HITS生成查詢基本集的方法應(yīng)用到PageRank算法中,這樣就彌補(bǔ)了PageR? ank算法中頁(yè)面內(nèi)容無(wú)關(guān)性的缺點(diǎn)。新算法中引用了PageRank算法中的排序機(jī)制,也笑容削弱了HITS算法中的“主題漂移”的缺點(diǎn)。

      3結(jié)束語(yǔ)

      利用Internet進(jìn)行信息查詢已經(jīng)成為人們生活、工作、娛樂(lè)中必不可少的一部分。目前我們用得比較多的還是關(guān)鍵詞查詢,隨著XML語(yǔ)言的廣泛應(yīng)用和Web搜索技術(shù)的發(fā)展,專業(yè)、快捷、有效的查詢技術(shù)將越來(lái)越被人們所研究和使用。

      [1]Papazoglou M P.Web Services Principles and Technology[M].北京:機(jī)械工業(yè)出版社,2010.

      [2]Han Jiawei,Kamber M.數(shù)據(jù)挖掘概念與技術(shù)[M].北京:機(jī)械工業(yè)出版社.2007

      [3]孟小峰.Web數(shù)據(jù)管理研究綜述[J].計(jì)算機(jī)研究與發(fā)展,2001(4).

      [4]顧寧,劉家茂,柴曉路.Web Services原理與研發(fā)實(shí)踐[M].北京:機(jī)械工業(yè)出版社,2006.

      猜你喜歡
      搜索引擎密鑰頁(yè)面
      大狗熊在睡覺(jué)
      探索企業(yè)創(chuàng)新密鑰
      刷新生活的頁(yè)面
      密碼系統(tǒng)中密鑰的狀態(tài)與保護(hù)*
      一種對(duì)稱密鑰的密鑰管理方法及系統(tǒng)
      基于ECC的智能家居密鑰管理機(jī)制的實(shí)現(xiàn)
      網(wǎng)絡(luò)搜索引擎亟待規(guī)范
      基于Nutch的醫(yī)療搜索引擎的研究與開(kāi)發(fā)
      廣告主與搜索引擎的雙向博弈分析
      同一Word文檔 縱橫頁(yè)面并存
      隆德县| 项城市| 宜昌市| 温宿县| 庐江县| 巴彦淖尔市| 牡丹江市| 鲜城| 井陉县| 忻城县| 通渭县| 泸西县| 忻城县| 清徐县| 日喀则市| 白朗县| 海盐县| 壶关县| 绥江县| 夏河县| 丹江口市| 兰西县| 沿河| 台南市| 天镇县| 乡宁县| 凌海市| 芮城县| 万州区| 海阳市| 明光市| 旺苍县| 东阿县| 固阳县| 奇台县| 兴义市| 克东县| 余庆县| 封丘县| 沂南县| 进贤县|