丁華
摘要:關(guān)鍵詞查詢可以讓用戶在使用數(shù)據(jù)庫的過程中更好地對自己所感興趣的內(nèi)容進行查詢。該文主要從關(guān)系數(shù)據(jù)庫中
關(guān)鍵詞查詢技術(shù)的有關(guān)概念入手,以蟻群優(yōu)化算法和基于概念漂移的查詢結(jié)果動態(tài)優(yōu)化機制為例,對查詢結(jié)果的動態(tài)優(yōu)化措施進行了探究。
關(guān)鍵詞:關(guān)系數(shù)據(jù)庫;關(guān)鍵詞查詢結(jié)果;動態(tài)優(yōu)化
中圖分類號:TP311
文獻標(biāo)識碼:A
文章編號:1009-3044(2017)10-0002-02
信息化社會的發(fā)展,讓關(guān)系數(shù)據(jù)庫中的數(shù)據(jù)存儲量表現(xiàn)出了逐步增長的特點。搜索引擎的產(chǎn)生與發(fā)展,對用戶的信息檢索需求的滿足起到了一定的促進作用。關(guān)系數(shù)據(jù)庫已經(jīng)成為了目前使用較為廣泛的一種數(shù)據(jù)庫類型。在結(jié)構(gòu)化數(shù)據(jù)模式在關(guān)系數(shù)據(jù)庫中發(fā)揮出重要的作用以后,用戶除了需要對數(shù)據(jù)庫模式進行充分認(rèn)識以外,還需要在對結(jié)構(gòu)化查詢語言進行應(yīng)用的基礎(chǔ)上,對自己所要收集的信息進行檢索。SQL語句查詢就是一種符合上述特點的查詢方式,但是對于普通人而言,這一查詢模式還存在著一定的技術(shù)難度。關(guān)鍵詞查詢方式是數(shù)據(jù)庫檢索領(lǐng)域的一種簡單可行的操作方式,用戶即使在對SQL語言和相關(guān)的數(shù)據(jù)庫模式缺乏了解的前提下,也可以通過對所查詢信息的相關(guān)度進行排序的方式來進行數(shù)據(jù)庫的查詢。
1.關(guān)系數(shù)據(jù)庫中關(guān)鍵詞查詢技術(shù)的相關(guān)概念
1.1關(guān)系數(shù)據(jù)庫關(guān)鍵詞查詢的基本概念
關(guān)系數(shù)據(jù)庫中的關(guān)鍵詞查詢,主要指的是將一些存儲于數(shù)據(jù)庫中的結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)變?yōu)榻Y(jié)構(gòu)的操作過程。它是通過對圖數(shù)據(jù)子圖的作用進行發(fā)揮的方式來對關(guān)鍵詞查詢方式進行建構(gòu)的。與關(guān)系數(shù)據(jù)庫有關(guān)的子圖包含了已經(jīng)輸人的所有關(guān)鍵詞信息,同時也涉及一些與這些關(guān)鍵詞有關(guān)的關(guān)聯(lián)信息。以關(guān)鍵詞節(jié)點為初始節(jié)點的查詢方式已經(jīng)開始在關(guān)系數(shù)據(jù)庫的信息檢索過程中得到了應(yīng)用。路徑索引概念與查詢方法之間的融合,可以通過路徑索引的便利來實現(xiàn)關(guān)鍵詞的查詢。這種基于關(guān)鍵詞的關(guān)系數(shù)據(jù)庫查詢方式與文本數(shù)據(jù)庫查詢方法之間存在著一定的相似性。但是前者并不是通過文件搜索的方式來實現(xiàn)的。在數(shù)據(jù)庫的關(guān)系表中查詢相關(guān)記錄,可以讓關(guān)鍵字的元祖和與之有關(guān)的連接關(guān)系進行發(fā)揮。因而用戶只需要通過提交關(guān)鍵詞的查詢列表的方式,就可以讓系統(tǒng)根據(jù)用戶所提供的關(guān)鍵詞對相關(guān)的結(jié)果進行檢索。
1.2關(guān)系數(shù)據(jù)庫關(guān)鍵詞查詢的意義
關(guān)系數(shù)據(jù)庫中的關(guān)鍵詞查詢涉及數(shù)據(jù)的收集、處理和可視化的多個環(huán)節(jié)。在對現(xiàn)有現(xiàn)有數(shù)據(jù)進行分析的基礎(chǔ)上,用戶可以借助關(guān)鍵詞查詢更好地獲取到自己所感興趣的信息。關(guān)鍵詞查詢的意義主要表現(xiàn)為以下幾個方面,首先,關(guān)鍵詞查詢結(jié)果的董濤優(yōu)化,可以為關(guān)系數(shù)據(jù)庫的信息查詢工作提供一種新的友好型的方法。對SQL語言查詢給用戶所帶來的問題進行優(yōu)化,是對信息查詢工作進行優(yōu)化的一種有效方式。關(guān)鍵詞查詢可以讓用戶從大量的數(shù)據(jù)中迅速查找到與關(guān)鍵詞有關(guān)的內(nèi)容和結(jié)構(gòu)信息,并通過形象化的方式,對檢索結(jié)果進行展示。
關(guān)鍵詞查詢也可以為數(shù)據(jù)的深度發(fā)掘提供一定的參考作用。從Web的應(yīng)用情況來看,常用的搜索引擎只能對一寫網(wǎng)頁數(shù)據(jù)進行有效檢索。對于一些長期存儲于后臺之中的信息,相關(guān)的搜索引擎只能表現(xiàn)出鞭長莫及的問題。從這一問題的產(chǎn)生原因來看,它與數(shù)據(jù)庫查詢與搜索引擎的信息查詢方式之間的差異性存在著一定的關(guān)聯(lián),因而關(guān)鍵詞查詢結(jié)構(gòu)的應(yīng)用,可以幫助用戶更好地獲取一些需要通過特定接口才能查找的信息。
除此以外,關(guān)系數(shù)據(jù)庫中的關(guān)鍵詞查詢技術(shù)也可以為信息檢索結(jié)果的排序提供一定的思路。查詢結(jié)果的精準(zhǔn)性的缺乏,一度是基于關(guān)鍵詞的關(guān)系數(shù)據(jù)庫查詢結(jié)果所表現(xiàn)出來的主要特點。在用戶借助自己所關(guān)注的問題的關(guān)鍵詞對相關(guān)的信息進行檢索以后,他們往往會在數(shù)據(jù)庫中獲取到大量的信息。很多時候用戶往往無法對自己利用關(guān)鍵詞所搜集到的每一條信息進行研究分析。對查詢結(jié)果的排列策略的優(yōu)化,也是對查詢結(jié)果進行動態(tài)優(yōu)化的一種有效措施。它可以從信息檢索結(jié)果與用戶的自身需求的相關(guān)性人手,通過由高到低的方式對信息進行排序,這就可以讓用戶有效節(jié)省信息的檢索時間。
2.蟻群優(yōu)化算法在關(guān)鍵詞查詢問題求解過程中的應(yīng)用
2.1蟻群優(yōu)化算法的基本原理
蟻群算法是意大利學(xué)者在上世紀(jì)末建構(gòu)的一種查詢結(jié)果優(yōu)化辦法。從這一名字的字面含義來看,這種算法與螞蟻在自然界中的覓食行為存在著一定的相似性。自然界的螞蟻在尋找食物的過程中,往往并不會對食物的信息進行感知,但是在某一只螞蟻找到食物以后,它會將相關(guān)的信息釋放在環(huán)境之中,因而會讓大量的螞蟻找到食物。一些沒有找到食物的螞蟻依據(jù)信息素的濃度變化對事物的位置進行確定。蟻群優(yōu)化算法就可以被看做是與之有關(guān)的一種優(yōu)化方式。在信息檢索過程中,這一算法的應(yīng)用可以讓用戶對最優(yōu)化的問題處理方式進行發(fā)掘。
從這計算方法的應(yīng)用情況來看,它是對旅行商問題進行解決的一種有效方式。隨著這一算法的不斷發(fā)展,在眾多學(xué)者的努力下,蟻群優(yōu)化逐漸成為了一種優(yōu)化技術(shù)。它可以對傳統(tǒng)搜索算法中無法解決的一些復(fù)雜問題進行有效解決。正反饋性成為了這一算法在實際應(yīng)用中所表現(xiàn)出來的主要特性,分布式環(huán)境是這一算法的主要應(yīng)用環(huán)境。
2.2蟻群優(yōu)化算法求解關(guān)鍵詞查詢問題的正確方式
從蟻群優(yōu)化算法的應(yīng)用情況來看,關(guān)系數(shù)據(jù)庫中的關(guān)鍵詞查詢問題可以被轉(zhuǎn)化為Steiner樹問題。從國內(nèi)外學(xué)者對這一問題的研究現(xiàn)狀來看,這一問題可以被看做NP-hard問題的一種特殊表現(xiàn)形式。所謂的NP-hard問題主要指的是一些可以利用一定數(shù)量的運算對多項式時間內(nèi)可解決的問題進行處理的問題(NP是非確定多項式的簡稱)。在對這一類問題進行處理的過程中,啟發(fā)方法是我國學(xué)者所采用的對搜索空間進行縮小的方式。從國內(nèi)一些學(xué)者的研究實驗來看,不論是NP-com—Dlete問題還是NP-hard問題,蟻群算法都是對問題的解答效率進行提升的有效方法。隨著這一計算方法的不斷發(fā)展,利用蟻群優(yōu)化法對Steiner數(shù)問題進行解決的研究已經(jīng)表現(xiàn)出了一種逐漸上升的趨勢。其中,不同的研究機構(gòu)所采用的研究方法還存在著一定的差異性。但是從這一算法的總體來看,學(xué)者對蟻群算法在NP問題中的應(yīng)用作用的研究,是為Steiner數(shù)問題及其應(yīng)用場景的研究提供服務(wù)的,因而,在具體化的研究過程中,學(xué)者并沒有對其中的一些關(guān)鍵問題進行有效考慮,因而這一方法并不能在關(guān)系數(shù)據(jù)庫的關(guān)鍵詞查詢中發(fā)揮自身的作用。
3.基于概念漂移的查詢結(jié)果動態(tài)優(yōu)化
3.1基于概念漂移的查詢結(jié)果動態(tài)優(yōu)化的核心思想
概念漂移也是機器學(xué)習(xí)領(lǐng)域研究中的一大重要課題。數(shù)據(jù)分布變化在時間變化的影響下所產(chǎn)生的變化,可能會讓一些基于舊數(shù)據(jù)的計算模型表現(xiàn)出對新數(shù)據(jù)特點難以適應(yīng)的問題。因而在數(shù)據(jù)庫關(guān)鍵詞研究工作的開展過程中,有關(guān)人員也需要對相關(guān)的模型進行進一步的創(chuàng)新與完善。從我國社會的發(fā)展現(xiàn)狀來看,在信息化進程的發(fā)展過程中,概念漂移理論的研究成果已經(jīng)在多個領(lǐng)域得到了應(yīng)用。以零售業(yè)為例,概念漂移理論的研究成果的運用,可以讓超市、商場的經(jīng)營著對消費者的購買行為進行綜合分析,進而在第一時間對消費者購買行為的變化進行充分了解。這就可以通過對相關(guān)的經(jīng)營戰(zhàn)略進行優(yōu)化的方式,對信息戰(zhàn)略進行處理。在信息檢索過程中,用戶查詢興趣的變化可以被看做是一次概念轉(zhuǎn)移的過程,因而,在將概念漂移理論應(yīng)用于信息用戶的研究工作以后,數(shù)據(jù)庫的管理設(shè)可以對用戶的檢索興趣的變化進行及時感知,進而在對查詢結(jié)構(gòu)的核心要素進行優(yōu)化的方式,讓數(shù)據(jù)庫更好地滿足用戶區(qū)的需求,因而,基于概念漂移的查詢結(jié)果動態(tài)優(yōu)化就成為了對關(guān)鍵詞查詢結(jié)果進行優(yōu)化的有效方式。
3.2動態(tài)優(yōu)化過程
在對與之有關(guān)的動態(tài)優(yōu)化過程進行探究以后,我們可以發(fā)現(xiàn),在基于概念漂移理論的查詢結(jié)果的優(yōu)化過程中,相關(guān)人員首先需要借助概念漂移理論的應(yīng)用,對用戶的興趣節(jié)點集進行確認(rèn),進而在對與之有關(guān)的ACOKS算法進行簡單修改的基礎(chǔ)上構(gòu)建一種新型化的ACOKS算法。用戶興趣節(jié)點集的運用,客戶對用戶的查詢興趣進行充分的展示。因而這種動態(tài)優(yōu)化過程也可以被看做向用戶反饋查詢結(jié)果的過程。在這一過程中,數(shù)據(jù)庫的各個查詢結(jié)果是由多個元祖連接而成的元祖樹。這種元祖樹通常也會被稱為是Steiner樹。用戶在對關(guān)鍵詞查詢法進行應(yīng)用的過程中所查詢的關(guān)鍵詞就蘊藏在這些節(jié)點之中,這樣在對查詢結(jié)果進行訪問的過程中,查詢系統(tǒng)可以將元祖樹中的所有節(jié)點都儲存于用戶興趣節(jié)點集之中。下圖中所示的內(nèi)容就是基于概念漂移的查詢結(jié)果優(yōu)化過程圖。
3.結(jié)論
蟻群優(yōu)化算法是適用于分布性環(huán)境額一種優(yōu)化方法。數(shù)據(jù)圖在關(guān)系數(shù)據(jù)庫中的應(yīng)用,可以讓關(guān)鍵詞的查詢問題轉(zhuǎn)變?yōu)镾teiner樹問題。給予1概念漂移理論的用戶查詢興趣探查法的應(yīng)用,可以讓有關(guān)人員在第一時間對用戶興趣的變化問題進行處理,因而這一理論是對查詢結(jié)果進行動態(tài)優(yōu)化的一種有效方式。它可以讓關(guān)鍵詞查詢結(jié)果與用戶的自身預(yù)期之間的統(tǒng)一性得到有效強化,這一優(yōu)化方式也可以讓查詢結(jié)果的有效性得到充分的保障。