劉建
摘要:目前數(shù)據(jù)庫超文本查詢方法存在查詢準確率較低的問題,為解決這一問題對基于頻繁項集挖掘的數(shù)據(jù)庫超文本查詢算法進行研究。研究通過建立頻繁項集挖掘數(shù)據(jù)庫超文本查詢模型,以模型為基礎對數(shù)據(jù)庫超文本查詢關聯(lián)規(guī)則計算,從而實現(xiàn)數(shù)據(jù)庫超文本查詢權(quán)重計算。通過實驗,對繁項集挖掘數(shù)據(jù)庫超文本查詢算法與傳統(tǒng)查詢算法精準度相比較,從而證明頻繁項集挖掘數(shù)據(jù)庫超文本查詢算法的有效性。
關鍵詞:頻繁項集;挖掘;數(shù)據(jù)庫;超文本
中圖分類號:TP391 文獻標識碼:A 文章編號:1007-9416(2019)04-0119-02
0 引言
我國在向著信息時代發(fā)展的同時,已經(jīng)擁有數(shù)量龐大的網(wǎng)絡用戶,因此在信息查詢過程中信息數(shù)量巨大與信息易丟失成為目前面臨的最大問題[1]?;ヂ?lián)網(wǎng)的大量使用,使越來越多的人利用搜索引擎進行查詢操作,但在引擎查詢時往往通過查詢關鍵詞執(zhí)行查詢,因此會出現(xiàn)較多不需要信息,導致查詢速率較低。提升數(shù)據(jù)庫超文本查詢的查準率與查全率,是目前需要解決的最大問題。因此對基于頻繁項集挖掘的數(shù)據(jù)庫超文本查詢算法進行研究,從而有效提高算法精準度。
1 基于頻繁項集挖掘的數(shù)據(jù)庫超文本查詢算法
1.1 頻繁項集挖掘數(shù)據(jù)庫超文本查詢模型
頻繁項集挖掘技術(shù)是數(shù)據(jù)庫超文本查詢實現(xiàn)信息聯(lián)想的主要途徑,在建立數(shù)據(jù)關系定義后,使用虛擬量技術(shù)對數(shù)據(jù)庫超文本更加廣泛的應用于各種系統(tǒng)中[2]。建立頻繁項集挖掘數(shù)據(jù)庫超文本查詢模型,若數(shù)據(jù)源為,其中存在個數(shù)據(jù)集,將作為一個數(shù)據(jù)節(jié)點,則下一個數(shù)據(jù)節(jié)點為:
2 仿真實驗
2.1 實驗準備
為基于頻繁項集挖掘的數(shù)據(jù)庫超文本查詢算法的有效性,因此選擇10個大型關系庫作為測試樣本,在各個數(shù)據(jù)中選取超文本,從而建立查詢數(shù)據(jù)。通過建立分組小數(shù)據(jù)庫,對數(shù)據(jù)庫中關鍵詞進行查詢,從而得到800×10個超文本,將其形成分組小容量數(shù)據(jù)庫D1;而在大容量數(shù)據(jù)庫中采集1300×10個超文本,將其分為大容量數(shù)據(jù)量D2。利用數(shù)據(jù)庫超文本查詢精準度作為實驗對象,分為兩組。其中基于頻繁項集挖掘的數(shù)據(jù)庫超文本查詢算法為實驗組,傳統(tǒng)查詢算法為對照組。將各超文本中數(shù)據(jù)結(jié)果進行排列,其測試集情況,如表1所示。
2.2 查詢精準度對比
通過大型關系數(shù)據(jù)庫超文本查詢,實現(xiàn)在查詢過程中最大程度的對查詢目標的相關信息尋找。對實驗組與對照組之間的查詢精準度進行統(tǒng)計比較,其結(jié)果如圖2所示。
分析圖2可知,在對相同目標進行查詢條件下,實驗組查詢精準度與對照組查詢精準度相比具有明顯優(yōu)勢,且實驗組查詢精準度能夠在保持較高水準,因此說明實驗組查詢算法具有更好有效性。
3 結(jié)語
頻繁項集挖掘作為數(shù)據(jù)庫超文本查詢算法中較為重要的一項工作,在整體數(shù)據(jù)超文本查詢過程中,將查詢目標數(shù)據(jù)從頻繁數(shù)據(jù)中挖掘出來,以數(shù)據(jù)集形式進行輸出,從而減小數(shù)據(jù)所占查詢空間。
參考文獻
[1] 張素智,趙亞楠,楊芮.基于MPB-Tree索引的空間數(shù)據(jù)多關鍵詞模糊查詢算法研究[J].華中師范大學學報:自然科學版,2017,51(06):49-55.
[2] 顧榮,仇紅劍,楊文家,等.Goldfish:基于矩陣分解的大規(guī)模RDF數(shù)據(jù)存儲與查詢系統(tǒng)[J].計算機學報,2017,40(10):2212-2230.
[3] 萬木君.云計算環(huán)境下基于矩陣加密的查詢算法研究[J].科技通報,2017,33(07):133-136.
[4] 焦?jié)櫤?,張謙,陳超.基于Spark改進的最大頻繁項集挖掘算法[J].計算機工程與設計,2017,38(7):1839-1843.
[5] 田喜平,黃勇杰.基于關聯(lián)規(guī)則的大型關系數(shù)據(jù)庫超文本查詢算法研究[J].科技通報,2018,34(10):109-112.