陳蘇海
摘 要: 針對(duì)大型數(shù)據(jù)庫(kù)的數(shù)據(jù)定位時(shí)間緩慢的問(wèn)題,提出一種大型數(shù)據(jù)庫(kù)的數(shù)據(jù)快速定位方法。引進(jìn)二分查找算法進(jìn)行數(shù)據(jù)查詢,同時(shí)結(jié)合資源描述框架(RDF)三元組方法方便在大型數(shù)據(jù)庫(kù)中進(jìn)行數(shù)據(jù)定位。根據(jù)大型數(shù)據(jù)庫(kù)的操作方式以及數(shù)據(jù)結(jié)構(gòu)進(jìn)行方位查找換算,可以實(shí)現(xiàn)在大型數(shù)據(jù)庫(kù)中對(duì)數(shù)據(jù)進(jìn)行快速定位。實(shí)驗(yàn)表明,設(shè)計(jì)的大型數(shù)據(jù)庫(kù)的數(shù)據(jù)快速定位方法,能夠快速、準(zhǔn)確地在大量數(shù)據(jù)中進(jìn)行數(shù)據(jù)定位,同時(shí)降低了對(duì)大型數(shù)據(jù)庫(kù)的影響。
關(guān)鍵詞: 軟件設(shè)計(jì); 數(shù)據(jù)快速定位; 定位軟件; 數(shù)據(jù)查詢
中圖分類號(hào): TN911?34; TP34 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2017)24?0091?03
Abstract: A data rapid positioning method for large database is presented in this paper to solve the slow location of data in large database. A binary search algorithm is introduced for data query. The triad method for resource description framework (RDF) is combined for convenient positioning of the data in large database. Orientation seeking conversion is performed according to the operating mode and data structure of large database, which can achieve quick positioning of data in large database. The experiment results show that the designed quick positioning method for data in large database can realize quick and accurate positioning for a large amount of data, and reduce the impact on large database.
Keywords: software design; rapid data positioning; positioning software; data query
0 引 言
近幾年,更多的數(shù)據(jù)信息都是存儲(chǔ)在數(shù)據(jù)庫(kù)中,大型數(shù)據(jù)庫(kù)的建立已經(jīng)能夠通過(guò)網(wǎng)絡(luò)進(jìn)行實(shí)時(shí)的信息數(shù)據(jù)提取,且已代替了原有的集中硬盤(pán)以及移動(dòng)存儲(chǔ)[1]。大型數(shù)據(jù)庫(kù)相對(duì)傳統(tǒng)的硬盤(pán)存儲(chǔ),其存儲(chǔ)信息數(shù)據(jù)的能力更強(qiáng),對(duì)數(shù)據(jù)信息保存更加完善,并且通過(guò)網(wǎng)絡(luò)連接可以進(jìn)行實(shí)時(shí)的調(diào)用,解放實(shí)際的占用空間,同時(shí)可以解決由于U盤(pán)或者移動(dòng)硬盤(pán)丟失的損失。在大型數(shù)據(jù)庫(kù)中,為了能更加方便對(duì)數(shù)據(jù)信息進(jìn)行存儲(chǔ),通常狀況下會(huì)把文件進(jìn)行壓縮存儲(chǔ)。
在對(duì)大型數(shù)據(jù)庫(kù)的數(shù)據(jù)定位過(guò)程中,雖然大型數(shù)據(jù)庫(kù)都設(shè)置了相關(guān)的索引,但是查找過(guò)程中的關(guān)鍵詞以及索引信息出現(xiàn)重疊,會(huì)很大程度上限制對(duì)數(shù)據(jù)的定位,同時(shí)定位的準(zhǔn)確度也被降低。
本文設(shè)計(jì)的大型數(shù)據(jù)庫(kù)的數(shù)據(jù)快速定位軟件與傳統(tǒng)的方法相比較,能夠更加快速、準(zhǔn)確地在大型數(shù)據(jù)庫(kù)中對(duì)數(shù)據(jù)進(jìn)行查找,并且能夠有效地保證定位過(guò)程的準(zhǔn)確性,通過(guò)試驗(yàn)證明了大型數(shù)據(jù)庫(kù)數(shù)據(jù)快速定位軟件的有效性[2?3]。
1 傳統(tǒng)大型數(shù)據(jù)庫(kù)的數(shù)據(jù)定位緩慢因素
在大型數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)存儲(chǔ)過(guò)程中,一般會(huì)劃分很多區(qū)域,這樣方便不同類型的文件進(jìn)行存儲(chǔ)和區(qū)分,這樣的設(shè)置對(duì)數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)的查找定位造成了阻礙。特別是大型數(shù)據(jù)庫(kù)中由于數(shù)據(jù)信息的量十分龐大,即便是根據(jù)索引進(jìn)行查找也無(wú)法進(jìn)行快速查詢定位。這給數(shù)據(jù)的使用以及數(shù)據(jù)的修改造成了麻煩,傳統(tǒng)的數(shù)據(jù)庫(kù)數(shù)據(jù)定位過(guò)程中,一般會(huì)根據(jù)屬性進(jìn)行查找,這樣的定位方法會(huì)提升定位速度,但是依然無(wú)法滿足現(xiàn)代對(duì)數(shù)據(jù)快速瀏覽提取的要求。
本文針對(duì)大型數(shù)據(jù)庫(kù)設(shè)計(jì)了一種快速定位的方法,通過(guò)本文設(shè)計(jì)的方法可以實(shí)現(xiàn)在大型數(shù)據(jù)庫(kù)中對(duì)數(shù)據(jù)快速定位[3]。
2 大型數(shù)據(jù)庫(kù)的數(shù)據(jù)快速定位設(shè)計(jì)
大型數(shù)據(jù)庫(kù)的數(shù)據(jù)快速定位軟件結(jié)構(gòu)圖如圖1所示。
對(duì)大型數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)定位,其主要取決于對(duì)數(shù)據(jù)的查找能力以及查找方式,傳統(tǒng)的查找方式都是通過(guò)索引或者關(guān)鍵詞進(jìn)行查找。這種查找方式是逐一的進(jìn)行對(duì)比查找,因此速度極為緩慢[4?5]。為了方便進(jìn)行查找,本文引入二分查找,這樣可以提高對(duì)數(shù)據(jù)的查找速度。假設(shè)一個(gè)擁有U位的二進(jìn)制大型數(shù)據(jù)庫(kù),并且數(shù)據(jù)庫(kù)中具有S個(gè)劃分區(qū)域,存儲(chǔ)的數(shù)據(jù)通過(guò)自然排序進(jìn)行排列,其中的數(shù)據(jù)值域都是按照二進(jìn)制進(jìn)行的。二分查找算法流程圖見(jiàn)圖2,使用二分查找法進(jìn)行查找時(shí),首先需要對(duì)數(shù)據(jù)進(jìn)行一定的數(shù)據(jù)排序,其排序公式如下:
排序過(guò)后需要進(jìn)行RDF三元組的相關(guān)運(yùn)算,一個(gè)RDF三元組由三個(gè)元素(n,N-1,N)組成,其中N是對(duì)查找的條件進(jìn)行限制的元素,N-1是對(duì)查找過(guò)程進(jìn)行限制的元素,n是查找模式的系數(shù)概括。通過(guò)RDF三元組能夠進(jìn)行區(qū)域的查找,比傳統(tǒng)的逐一查找方便[6?8]。
最終通過(guò)模型可以得到矩陣:
式中:Sx表示最終結(jié)果;矩陣中的每個(gè)元素是坐標(biāo)系下的全部數(shù)據(jù)屬性[10]。
通過(guò)與二分查找法進(jìn)行結(jié)合可以得到矩陣:
式中:A,B,l三個(gè)矩陣分別代表數(shù)據(jù)屬性、數(shù)據(jù)特殊屬性、數(shù)據(jù)位置坐標(biāo)。這樣既能保證查詢過(guò)程的速度,又能夠通過(guò)式子檢測(cè)其準(zhǔn)確程度。
通過(guò)誤差匹配函數(shù)進(jìn)行檢驗(yàn),得到:
通過(guò)上述的誤差匹配檢驗(yàn)又可以排除一批數(shù)據(jù),再通過(guò)坐標(biāo)匹配檢驗(yàn)得到下列公式:endprint
式中,每一個(gè)坐標(biāo)元素檢驗(yàn)都可以是零,如果有非零值,坐標(biāo)位置便是想要找的數(shù)據(jù),執(zhí)行坐標(biāo)便可以定位。
通過(guò)上述設(shè)計(jì)的模型,改變以往的逐一定位的方式,能夠快速地在大型數(shù)據(jù)庫(kù)中找到想要定位的數(shù)據(jù)。
3 試驗(yàn)驗(yàn)證
為了驗(yàn)證本文設(shè)計(jì)的大型數(shù)據(jù)庫(kù)的數(shù)據(jù)快速定位軟件的有效性,進(jìn)行了仿真試驗(yàn),在實(shí)驗(yàn)過(guò)程中對(duì)擁有100 MB信息的大型數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)定位。首先使用傳統(tǒng)的查找流程,根據(jù)設(shè)置好的數(shù)據(jù)關(guān)鍵詞“再見(jiàn)”在數(shù)據(jù)庫(kù)中進(jìn)行定位,并記錄時(shí)間。在使用本文設(shè)計(jì)的大型數(shù)據(jù)庫(kù)的數(shù)據(jù)快速定位方法進(jìn)行數(shù)據(jù)定位。設(shè)置數(shù)據(jù)特殊屬性為“再見(jiàn)”,設(shè)置傳載系數(shù)U為7.5;查詢屬性關(guān)聯(lián)系數(shù)ΔX,ΔY分別為5.0,6.0,定位完成直接顯示位置以及時(shí)間。為了保證試驗(yàn)的有效性,經(jīng)過(guò)多次試驗(yàn),結(jié)果如圖3所示。
通過(guò)圖3可以看出本文設(shè)計(jì)的大型數(shù)據(jù)庫(kù)的數(shù)據(jù)快速定位方法,對(duì)數(shù)據(jù)進(jìn)行定位過(guò)程所使用的時(shí)間明顯低于傳統(tǒng)方法的定位時(shí)間。
通過(guò)表1可以看出本文設(shè)計(jì)的大型數(shù)據(jù)庫(kù)的數(shù)據(jù)快速定位方法能夠快速準(zhǔn)確地在大型數(shù)據(jù)庫(kù)中對(duì)數(shù)據(jù)進(jìn)行定位,解決了傳統(tǒng)方法的定位時(shí)間緩慢的問(wèn)題。
4 結(jié) 語(yǔ)
本文設(shè)計(jì)的大型數(shù)據(jù)庫(kù)的數(shù)據(jù)快速定位軟件,通過(guò)使用二分查找法以及RDF 三元組方法在數(shù)據(jù)庫(kù)中進(jìn)行查找定位,有效地解決了傳統(tǒng)方法的數(shù)據(jù)定位緩慢的問(wèn)題。本文的設(shè)計(jì)能夠充分滿足現(xiàn)代對(duì)數(shù)據(jù)定位的要求。
參考文獻(xiàn)
[1] 張威,鮑麗娜.可快速定位的視頻流媒體大數(shù)據(jù)存儲(chǔ)系統(tǒng)[J].科學(xué)技術(shù)與工程,2014,14(1):239?243.
[2] DO T X, KIM Y. EPD?NEMO: efficient PMIPv6?based distributed network mobility management [J]. Wireless networks, 2015, 21(7): 1?12.
[3] 許應(yīng)康,彭國(guó)金,劉威.飛行試驗(yàn)數(shù)據(jù)自檢測(cè)系統(tǒng)軟件設(shè)計(jì)[J].現(xiàn)代電子技術(shù),2015,38(6):31?35.
[4] HORNG G J. Opportunistic content sharing scheme for distributed network in city environments [J]. Wireless personal communications, 2015, 84(4): 1?24.
[5] 肖林京,文藝成,孫傳余,等.礦井物流管理和人員定位系統(tǒng)數(shù)據(jù)庫(kù)設(shè)計(jì)[J].工礦自動(dòng)化,2015,41(4):26?29.
[6] 朱保鋒,蘇小玲.大型網(wǎng)絡(luò)異常數(shù)據(jù)庫(kù)的快速數(shù)據(jù)定位模型仿真[J].微電子學(xué)與計(jì)算機(jī),2016(2):140?143.
[7] 羅國(guó)瑋,張新長(zhǎng),齊立新,等.矢量數(shù)據(jù)變化對(duì)象的快速定位與最優(yōu)組合匹配方法[J].測(cè)繪學(xué)報(bào),2014,43(12):1285?1292.
[8] PANDA M, KHILAR P M. Distributed self fault diagnosis algorithm for large scale wireless sensor networks using modified three sigma edit test [J]. Ad hoc networks, 2015, 25: 170?184.
[9] 劉興明,楊卓琴.多源數(shù)據(jù)庫(kù)中的入侵?jǐn)?shù)據(jù)定位方法研究與仿真[J].計(jì)算機(jī)仿真,2016,33(3):367?370.
[10] TOUBAKH H, SAYED?MOUCHAWEH M. Hybrid dynamic classifier for drift?like fault diagnosis in a class of hybrid dynamic systems [J]. Neurocomputing, 2016, 171: 1496?1516.endprint