劉 凱,王三虎,薛艷鋒,武彩紅
(呂梁學(xué)院 計(jì)算機(jī)科學(xué)與技術(shù)系,山西 呂梁 033000)
云計(jì)算環(huán)境下不可靠數(shù)據(jù)恢復(fù)方法研究
劉 凱,王三虎,薛艷鋒,武彩紅
(呂梁學(xué)院 計(jì)算機(jī)科學(xué)與技術(shù)系,山西 呂梁 033000)
由于云計(jì)算環(huán)境下不可靠數(shù)據(jù)中包含有利用價(jià)值的信息,但直接使用可能會(huì)給計(jì)算機(jī)帶來負(fù)擔(dān),所以需要對(duì)云計(jì)算環(huán)境下不可靠數(shù)據(jù)進(jìn)行恢復(fù);當(dāng)前大多數(shù)方法對(duì)不可靠數(shù)據(jù)進(jìn)行復(fù)寫時(shí),利用地址映射層分配新的寫入地址,因此不可靠的數(shù)據(jù)在一段時(shí)間內(nèi)仍存在于云存儲(chǔ)中,在這樣的系統(tǒng)上實(shí)現(xiàn)對(duì)其的保護(hù),不需額外保存數(shù)據(jù)的更新信息;通過FLASH的帶外區(qū)記錄時(shí)間戳,在FTL的映射項(xiàng)中增加時(shí)間戳信息,在不跟蹤映射表每次更新的情況下,達(dá)到數(shù)據(jù)快速恢復(fù)的目的;但這種方法對(duì)云存儲(chǔ)系統(tǒng)性能產(chǎn)生不利影響;為此,提出一種基于張量Tucker閾值的云計(jì)算環(huán)境下不可靠數(shù)據(jù)恢復(fù)方法,首先利用云計(jì)算環(huán)境下節(jié)點(diǎn)自身的隨機(jī)秘鑰生成器產(chǎn)生隨機(jī)會(huì)話密鑰,并對(duì)不可靠數(shù)據(jù)HMAC報(bào)文鑒別碼進(jìn)行計(jì)算,從而實(shí)現(xiàn)保護(hù)和重構(gòu);在此基礎(chǔ)上,將不可靠數(shù)據(jù)的閾值分解過程與奇異閾值方法相結(jié)合,從而得到Tncker閾值算子,實(shí)現(xiàn)動(dòng)態(tài)的數(shù)據(jù)恢復(fù),恢復(fù)過程中利用Tucker閾值算子與增廣拉格朗日乘子方法相結(jié)合的方式選擇n-秩相似張量,提出基于增廣拉格朗日乘子方法的不可靠數(shù)據(jù)Tucker閾值恢復(fù)方法,完成云計(jì)算環(huán)境下不可靠數(shù)據(jù)恢復(fù);實(shí)驗(yàn)證明,所提方法能夠有效提高不可靠數(shù)據(jù)恢復(fù)的準(zhǔn)確性,降低數(shù)據(jù)恢復(fù)的能耗和時(shí)間,具有較強(qiáng)的可行性,為該課題的應(yīng)用研究提供理論依據(jù)。
云計(jì)算;不可靠數(shù)據(jù);數(shù)據(jù)恢復(fù)
隨著云計(jì)算技術(shù)的不斷發(fā)展產(chǎn)生了大量數(shù)據(jù),稱為現(xiàn)今社會(huì)非常重要的信息資源。然而云計(jì)算環(huán)境下,一些數(shù)據(jù)由于木馬病毒等原因,變成不可靠數(shù)據(jù)[1]。但這些數(shù)據(jù)中可能蘊(yùn)含非常重要的信息,直接使用會(huì)影響使用效率[2]。不可靠數(shù)據(jù)恢復(fù)包括數(shù)據(jù)保護(hù)、數(shù)據(jù)分解等內(nèi)容,針對(duì)不可靠數(shù)據(jù)存儲(chǔ)位置的不同,導(dǎo)致不可靠數(shù)據(jù)恢復(fù)方法的不同[3]。云環(huán)境下不可靠數(shù)據(jù)恢復(fù)的方法需要改進(jìn)和創(chuàng)新,以滿足當(dāng)前環(huán)境下數(shù)據(jù)恢復(fù)的要求[4]。但目前大多數(shù)數(shù)據(jù)恢復(fù)方法利用手工重建數(shù)據(jù)鏈恢復(fù)不可靠數(shù)據(jù),通過文件系統(tǒng)轉(zhuǎn)換不可靠數(shù)據(jù)類型,完成RBM重建,根據(jù)重建后的RBM,對(duì)不可靠數(shù)據(jù)位置進(jìn)行描述,完成原不可靠數(shù)據(jù)內(nèi)容表的重建,從而完成不可靠數(shù)據(jù)重建[5],這種方法進(jìn)行不可靠數(shù)據(jù)恢復(fù)能耗較少,稱為當(dāng)前不可靠數(shù)據(jù)恢復(fù)的重要方法,隨著信息化和網(wǎng)絡(luò)化的發(fā)展與應(yīng)用[6],不可靠數(shù)據(jù)恢復(fù)成為當(dāng)前研究的熱點(diǎn)問題,隨著研究內(nèi)容的深入,產(chǎn)生了大量的研究成果[7]。
文獻(xiàn)[8]以SQLite3文件格式為恢復(fù)依據(jù),提出了一種云計(jì)算環(huán)境下不可靠數(shù)據(jù)恢復(fù)方法。通過對(duì)SQLite3數(shù)據(jù)庫的文件格式的分析,分析不可靠數(shù)據(jù)記錄的存儲(chǔ)機(jī)制。通過識(shí)別SQLite3文件格式,實(shí)現(xiàn)不可靠數(shù)據(jù)頁中的自由塊和未使用空間進(jìn)行尋找和收集,從而完成不可靠數(shù)據(jù)恢復(fù)方法。但這種方法僅適用于SQLite3文件格式,使用范圍受到限制,難以推廣使用。文獻(xiàn)[9]提出一種基于相干函數(shù)無偏估計(jì)的不可靠數(shù)據(jù)恢復(fù)技術(shù)。首先對(duì)云計(jì)算環(huán)境下不可靠數(shù)據(jù)結(jié)構(gòu)模型進(jìn)行構(gòu)建,針對(duì)需要進(jìn)行數(shù)據(jù)恢復(fù)的不可靠數(shù)據(jù)結(jié)構(gòu)進(jìn)行特征分解和信息模型構(gòu)建,采用相干函數(shù)特征分解算法對(duì)待恢復(fù)的不可靠數(shù)據(jù)進(jìn)行篩分和殘差濾除,最后采用相干函數(shù)無偏估計(jì)算法提高不可靠數(shù)據(jù)恢復(fù)的準(zhǔn)確度,這種方法對(duì)對(duì)數(shù)據(jù)進(jìn)行恢復(fù)時(shí),花費(fèi)時(shí)間較長。文獻(xiàn)[10]提出一種基于模式識(shí)別的云環(huán)境下不可靠數(shù)據(jù)恢復(fù)方法。通過對(duì)不可靠數(shù)據(jù)進(jìn)行特征量提取,并與預(yù)先設(shè)置的時(shí)序相對(duì)變化量變化趨勢(shì)矩陣和時(shí)序數(shù)值矩陣進(jìn)行模式匹配,實(shí)現(xiàn)不可靠數(shù)據(jù)的實(shí)時(shí)辨識(shí),并使用錯(cuò)誤出現(xiàn)最近時(shí)刻的正常數(shù)據(jù)進(jìn)行數(shù)據(jù)快速恢復(fù)。
針對(duì)傳統(tǒng)方法存在的不足,本文提出一種基于張量Tucker閾值的云計(jì)算環(huán)境下不可靠數(shù)據(jù)恢復(fù)方法,首先,利用節(jié)點(diǎn)自身的隨機(jī)秘鑰生成器生成隨機(jī)會(huì)話密鑰,并完成不可靠數(shù)據(jù)HMAC報(bào)文鑒別碼計(jì)算,從而實(shí)現(xiàn)不可靠數(shù)據(jù)的保護(hù)和重構(gòu)。采用閾值分解過程與奇異值閾值方法相結(jié)合,實(shí)現(xiàn)對(duì)不可靠數(shù)據(jù)的Tucker閾值算子的計(jì)算,實(shí)現(xiàn)不可靠數(shù)據(jù)恢復(fù)過程中動(dòng)態(tài)地選擇n-秩相似張量,在此基礎(chǔ)上,以基于增廣拉格朗日乘子方法為依據(jù),結(jié)合得到的算子,實(shí)現(xiàn)基于張量Tucker閾值的云計(jì)算環(huán)境下不可靠數(shù)據(jù)恢復(fù)。實(shí)驗(yàn)證明,本文所提方法是一種準(zhǔn)確度較高、可行性較強(qiáng)的方法,提高不可靠數(shù)據(jù)恢復(fù)效率,為該課題的應(yīng)用研究提供理論依據(jù)。
在云計(jì)算環(huán)境下,不可靠數(shù)據(jù)對(duì)象之間的相關(guān)性可以表示成以下幾種:
1)在云計(jì)算環(huán)境中,與不可靠數(shù)據(jù)對(duì)象相關(guān)聯(lián)的對(duì)象一直在一起。
2)與不可靠數(shù)據(jù)相關(guān)聯(lián)的數(shù)據(jù)對(duì)象在開始幾個(gè)連續(xù)窗口中在一起,然后,它們分離,不在一起。
3)與不可靠數(shù)據(jù)相關(guān)聯(lián)的數(shù)據(jù)對(duì)象在連續(xù)窗口中,有時(shí)在一起,有時(shí)分離。
設(shè)在云計(jì)算環(huán)境中當(dāng)前數(shù)據(jù)窗口的前一窗口[t-2w+1,t-w]中,項(xiàng)集X={T1,T2,…,Tm}的關(guān)聯(lián)度為φt-w(X),則在當(dāng)前數(shù)據(jù)窗口Wc中,X關(guān)聯(lián)度可以表示為:
(1)
式中,exp_sup(X,Wc)表示在但錢數(shù)據(jù)窗口Wc項(xiàng)集X的期望支持度,f表示該窗口的衰減因子。設(shè)定Tm和Tn表示兩個(gè)數(shù)據(jù)對(duì)象,則在窗口[t-w+1,t]中,存在φt(Tm,Tn)=φt(Tn,Tm)。
設(shè)η表示云計(jì)算環(huán)境下不可靠數(shù)據(jù)的不關(guān)聯(lián)閾值,φt(X)表示不可靠數(shù)據(jù)項(xiàng)集X在云計(jì)算窗口Wc中的關(guān)聯(lián)度,當(dāng)滿足條件:φt(X)<η時(shí),則稱云計(jì)算環(huán)境下不可靠數(shù)據(jù)的項(xiàng)集樹所包含不可靠數(shù)據(jù)對(duì)象不具有關(guān)聯(lián)性。
設(shè)定一個(gè)窗口Wc中,Ti,Tj∈X,當(dāng)Tj滿足公式(2),則稱Tj為Ti的最大關(guān)聯(lián)標(biāo)簽。
(2)
在云計(jì)算窗口W[m,n]內(nèi),以不可靠數(shù)據(jù)Ti的觀測(cè)事務(wù)為元素,以觀測(cè)時(shí)序?yàn)轫樞蝮@醒匯集組成集合,將這個(gè)集合稱為不可靠Ti的概率運(yùn)動(dòng)軌跡,表示為:
(3)
在云計(jì)算窗口W[m,n]內(nèi),將由N個(gè)不可靠數(shù)據(jù)標(biāo)簽的概率運(yùn)動(dòng)軌跡匯集組成的集合稱為不可靠數(shù)據(jù)概率運(yùn)動(dòng)軌跡集,表示為MS={M1,M2,…,MN}。
分別用Mi和Mj對(duì)數(shù)據(jù)對(duì)象Ti和Tj的概率運(yùn)動(dòng)軌跡進(jìn)行表述,且滿足條件Mi,Mj∈MS。當(dāng)Mi和Mj的前l(fā)項(xiàng)都表示對(duì)應(yīng)的不可靠數(shù)據(jù)概率相似運(yùn)動(dòng)軌跡點(diǎn),則稱Mi和Mj為l-概率相似運(yùn)動(dòng)軌跡,l表示不可靠數(shù)據(jù)特征的相似度,記為l-PS(Mi,Mj)。
在不可靠數(shù)據(jù)流中,不可靠數(shù)據(jù)Ti的最相似運(yùn)動(dòng)軌跡表示與不可靠數(shù)據(jù)Ti概率相似運(yùn)動(dòng)軌跡最相似的運(yùn)動(dòng)軌跡。并將不可靠數(shù)據(jù)Ti的最相似運(yùn)動(dòng)軌跡的標(biāo)簽稱為最相似運(yùn)動(dòng)軌跡標(biāo)簽。
多遠(yuǎn)統(tǒng)計(jì)分析方法是以數(shù)據(jù)對(duì)象所具有的多個(gè)觀測(cè)指標(biāo)規(guī)律為基礎(chǔ)進(jìn)行分析統(tǒng)計(jì),從而發(fā)現(xiàn)數(shù)據(jù)對(duì)象指標(biāo)存在的相互關(guān)聯(lián)。由于云計(jì)算環(huán)境下不可靠數(shù)據(jù)對(duì)象存在多方面關(guān)聯(lián)信息,為多元統(tǒng)計(jì)創(chuàng)造了條件。
利用多元統(tǒng)計(jì)的判別方法對(duì)計(jì)算環(huán)境下不可靠數(shù)據(jù)進(jìn)行恢復(fù),主要技術(shù)有兩點(diǎn):
1)確定數(shù)據(jù)恢復(fù)的指標(biāo),即預(yù)報(bào)因子;
2)各項(xiàng)指標(biāo)在恢復(fù)過程中的權(quán)重
設(shè)定一個(gè)數(shù)據(jù)窗口Wc,標(biāo)簽Ti的最相關(guān)標(biāo)簽為TMAX_r,且最相似跡標(biāo)簽為TMAX_s,則Ti在云計(jì)算環(huán)境Rx∈RSi的各項(xiàng)指標(biāo)向量可以表示為:
φ4exp_sup(TMAX_s,Wc)}
(4)
式中,φ1,φ2,φ3,φ4分別表示指標(biāo)所占的權(quán)重,pix表示Ti的先驗(yàn)概率。其歐氏距離可以表示為:
(5)
根據(jù)上式,得到基于多元統(tǒng)計(jì)的判別方法判定規(guī)則:
在D(Ti,Rx)≥max{?j,D(Ti,Rj)}情況下,其中1≤j≤m,則可以說明標(biāo)簽Ti位于云計(jì)算系統(tǒng)中,且其后驗(yàn)概率可以計(jì)算為:
(6)
通過上述論述,基于距離的云計(jì)算環(huán)境下不可靠數(shù)據(jù)恢復(fù)方法的具體步驟:對(duì)不可靠數(shù)據(jù)進(jìn)行頻繁模式挖掘,從而確定不可靠數(shù)據(jù)的最大關(guān)聯(lián)標(biāo)簽以及最相似軌跡標(biāo)簽。
利用公式(5)對(duì)不可靠數(shù)據(jù)對(duì)應(yīng)的歐氏距離進(jìn)行計(jì)算,并利用公式(6)實(shí)現(xiàn)對(duì)不可靠數(shù)據(jù)的后驗(yàn)概率進(jìn)行計(jì)算,并對(duì)后驗(yàn)概率表進(jìn)行更新,從而確定不可靠數(shù)據(jù)標(biāo)簽之間的關(guān)聯(lián)度。
為實(shí)現(xiàn)數(shù)據(jù)保護(hù),云計(jì)算環(huán)境中感知節(jié)點(diǎn)vi對(duì)云計(jì)算環(huán)境下不可靠數(shù)據(jù)di進(jìn)行采集,然后按照以下方式對(duì)不可靠數(shù)據(jù)di進(jìn)行操作。以保護(hù)數(shù)據(jù)的完整性和機(jī)密性。
首先利用云計(jì)算環(huán)境下節(jié)點(diǎn)自身的隨機(jī)秘鑰生成器產(chǎn)生隨機(jī)會(huì)話密鑰Ki,來保護(hù)不可靠數(shù)據(jù)的完整性和私密性。
然后使用節(jié)點(diǎn)密鑰Ki對(duì)不可靠數(shù)據(jù)di的HMAC報(bào)文鑒別碼進(jìn)行計(jì)算:MAC=HKi(di),以保護(hù)不可靠數(shù)據(jù)的完整性,消除不可靠數(shù)據(jù)中攻擊對(duì)其的篡改。
最后使用最開始生成的隨機(jī)密鑰對(duì)不可靠數(shù)據(jù)和鑒別碼的聯(lián)合信息進(jìn)行對(duì)稱加密,生成密文,保護(hù)數(shù)據(jù)的機(jī)密性。
為了便于計(jì)算和保證不可靠數(shù)據(jù)回復(fù)的精度,引入不可靠數(shù)據(jù)特征的初始值與不可靠數(shù)據(jù)張量相等的輔助張量M,滿足輔助張量初始值與張量X相等,從而在對(duì)不可靠數(shù)據(jù)恢復(fù)進(jìn)行恢復(fù)計(jì)算過程中,盡可能保留不可靠數(shù)據(jù)張量迭代的多樣性,從而提高云計(jì)算環(huán)境下不可靠數(shù)據(jù)恢復(fù)精度。
(7)
公式(7)優(yōu)化目標(biāo)函數(shù)所要解決的不可靠數(shù)據(jù)恢復(fù)問題通過隨機(jī)給定部分張量元素下標(biāo)的子集,根據(jù)這些已知元素恢復(fù)缺失元素值,使得恢復(fù)后的張量為所有可能的恢復(fù)張量中的最低秩近似張量。
(矩陣奇異值分解)秩為r的矩陣X∈Rn1×n2的奇異值分解表示為:
X=U∑V*,∑=diag({σi}1≤i≤r)
(8)
其中:U、V分別表示n1×r、n2×r大小的正交矩陣,σi表示不可靠數(shù)據(jù)奇異值,且σi>0。
(奇異值收縮算子)云環(huán)境下不可靠數(shù)據(jù)矩陣X∈Rn1×n2的奇異值收縮算子或奇異值閾值算子可以表示為;
Dτ(X)=UDτ(∑)V*,Dτ(∑)=diag({max(σi-τ,0)})
(9)
通過公式(9)可知,當(dāng)云環(huán)境下不可靠數(shù)據(jù)矩陣X的奇異值較數(shù)據(jù)閾值τ小時(shí),則可認(rèn)為Dτ(X)的秩要比X小。
對(duì)任意的τ≥0和不可靠數(shù)據(jù)矩陣Y∈Rn1×n2,奇異值收縮算子需要滿足:
(10)
根據(jù)對(duì)云計(jì)算環(huán)境下不可靠數(shù)據(jù)矩陣奇異值收縮算子的論述,本文提出了一種基于張量分解的張量恢復(fù)算子。
張量X∈Rn1×n2×…×nX的Tucker閾值算子TDτ(X)定義如下:
X≈Γ(1:r1,1:r2,…,1:rN)×1A(1)(:,1:r1)×2A(2)
(:,1:r2)…×NA(N)(:,1:rN)
(11)
ri=sum(Dτ(∑i))=sum(diag({max(σi-τ,0)}))
(12)
式中,∑i表示張量的mode-n矩陣A(i)奇異值分解的奇異值。
對(duì)任意的τ≥0和不可靠數(shù)據(jù)矩陣Y∈Rn1×n2×nN,奇異值收縮算子需要滿足:
(13)
增廣拉格朗日乘子方法主要對(duì)如下限制優(yōu)化問題求解。
minf(X),s.t.h(X)=0
(14)
將上述優(yōu)化問題通過拉格朗日函數(shù)形式進(jìn)行表示為:
(15)
式中,Y表示不可靠數(shù)據(jù)的拉格朗日乘子,μ表示正實(shí)數(shù)。利用交替方向乘子方法對(duì)不可靠數(shù)據(jù)進(jìn)行分裂并迭代更新從而對(duì)不可靠數(shù)據(jù)進(jìn)行求解。
(16)
為解決云計(jì)算環(huán)境下不可靠數(shù)據(jù)恢復(fù)問題,本文通過增廣拉格朗日乘子方法確定不可靠數(shù)據(jù)的優(yōu)化目標(biāo),并將優(yōu)化目標(biāo)函數(shù)利用拉格朗日函數(shù)進(jìn)行表示為:
s.t.XΩ=TΩ
(17)
其中:β為一正常數(shù),為了加快本文方法的收斂速度,在迭代中令βk+1=tβk,其中t∈[1,2]。根據(jù)增廣拉格朗日乘子方法,得到如下三個(gè)子問題的求解形式:
(18)
利用公式(15),對(duì)X和Y進(jìn)行求解,則有:
(19)
可利用張量Tucker閾值方法對(duì)不可靠數(shù)據(jù)M進(jìn)行求解,實(shí)現(xiàn)不可靠數(shù)據(jù)恢復(fù),需要對(duì)公式(17)進(jìn)行等價(jià)變形:
(20)
設(shè)定N=X(1/β)Y,則:
(21)
通過上述論述,完成云計(jì)算環(huán)境下不可靠數(shù)據(jù)恢復(fù)。
為證明本文提出的基于張量Tucker閾值的云計(jì)算環(huán)境下不可靠數(shù)據(jù)恢復(fù)方法的有效性和實(shí)用性,以Intel P4 2G處理器為硬件環(huán)境,Matlab2008a為平臺(tái),以云計(jì)算環(huán)境下不可靠數(shù)據(jù)為實(shí)驗(yàn)數(shù)據(jù),運(yùn)用對(duì)比法將本文提出的基于張量Tucker閾值的云計(jì)算環(huán)境下不可靠數(shù)據(jù)恢復(fù)方法與文獻(xiàn)[8]和文獻(xiàn)[9]所提云云計(jì)算環(huán)境下不可靠數(shù)據(jù)恢復(fù)方法進(jìn)行比較,完成本次實(shí)驗(yàn)。
首先對(duì)不可靠數(shù)據(jù)恢復(fù)的準(zhǔn)確度進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)通過在云環(huán)境下不可靠數(shù)據(jù)中隨機(jī)抽取50組不可靠數(shù)據(jù),觀察恢復(fù)后數(shù)據(jù)的原始性。通過實(shí)驗(yàn),得到三種不可靠數(shù)據(jù)恢復(fù)方法的恢復(fù)準(zhǔn)確度對(duì)比,對(duì)比結(jié)果如圖1所示。
圖1 三種恢復(fù)方法的恢復(fù)準(zhǔn)確度對(duì)比
通過圖1可以看出,本文所提不可靠數(shù)據(jù)恢復(fù)方法數(shù)據(jù)恢復(fù)的準(zhǔn)確度較高,且準(zhǔn)確度較穩(wěn)定,由于本文在進(jìn)行數(shù)據(jù)恢復(fù)過程中,首先對(duì)數(shù)據(jù)進(jìn)行保護(hù)和恢復(fù)重構(gòu),保證了數(shù)據(jù)的完整性,從而提高不可靠數(shù)據(jù)恢復(fù)的準(zhǔn)確度。
表1是云計(jì)算環(huán)境下不可靠數(shù)據(jù)恢復(fù)方法的恢復(fù)時(shí)間(s)對(duì)比。實(shí)驗(yàn)分別次利用三種不可靠數(shù)據(jù)恢復(fù)方法對(duì)相同數(shù)據(jù)進(jìn)行恢復(fù),得到恢復(fù)時(shí)間對(duì)比,對(duì)比結(jié)果如表1所示。
表1 三種不可靠數(shù)據(jù)恢復(fù)方法恢復(fù)時(shí)間對(duì)比
通過表1可知,本文所提不可靠數(shù)據(jù)恢復(fù)方法的恢復(fù)耗時(shí)較短,由于張量Tucker分解算法復(fù)雜度較低,運(yùn)行較快,從而提高不可靠數(shù)據(jù)恢復(fù)方法的恢復(fù)速度。進(jìn)行三種不可靠數(shù)據(jù)恢復(fù)方法進(jìn)行數(shù)據(jù)恢復(fù)時(shí)所占存儲(chǔ)空間(MB)對(duì)比,實(shí)驗(yàn)通過對(duì)不同大小不可靠數(shù)據(jù)進(jìn)行恢復(fù),對(duì)比恢復(fù)后數(shù)據(jù)大小,對(duì)比結(jié)果如表2所示。
表2 三種方法進(jìn)行不可靠數(shù)據(jù)恢復(fù)所占存儲(chǔ)空間對(duì)比
通過表2可知,本文所提方法進(jìn)行數(shù)據(jù)恢復(fù)后,數(shù)據(jù)的大小變化較小,由于本文針對(duì)張量Tucker分解算法存在的不足,將Tucker分解算法與奇異值閾值函數(shù)相結(jié)合,降低了不可靠數(shù)據(jù)分解的存儲(chǔ)空間,從而降低不可靠數(shù)據(jù)恢復(fù)所占空間。
對(duì)比三種云計(jì)算環(huán)境下不可靠數(shù)據(jù)恢復(fù)方法的可行性,設(shè)可行性單位為%,實(shí)驗(yàn)通過對(duì)不同事件類型的不可靠數(shù)據(jù)進(jìn)行恢復(fù),對(duì)比恢復(fù)的準(zhǔn)確度,為保證實(shí)驗(yàn)的準(zhǔn)確度,對(duì)每種事件類型分別進(jìn)行500次實(shí)驗(yàn),計(jì)算每種事件類型不可靠數(shù)據(jù)恢復(fù)的平均準(zhǔn)確度作為可行性,從而得到三種方法的可行性對(duì)比,對(duì)比結(jié)果如表3所示。
表3 三種方法的可行性對(duì)比
通過表3可知,本文所提不可靠數(shù)據(jù)恢復(fù)方法對(duì)不同事件類型的不可靠數(shù)據(jù)進(jìn)行恢復(fù),可行性都達(dá)到93%以上,說明本文所提方法適用于不同事件類型的不可靠數(shù)據(jù)恢復(fù),具有較強(qiáng)的可行性。
最后對(duì)三種云計(jì)算環(huán)境下不可靠數(shù)據(jù)恢復(fù)方法的能耗(焦)進(jìn)行對(duì)比,通過實(shí)驗(yàn),得到三種云計(jì)算環(huán)境下不可靠數(shù)據(jù)恢復(fù)方法的運(yùn)行能耗對(duì)比,對(duì)比結(jié)果如圖2所示。
圖2 三種方法的運(yùn)行能耗對(duì)比
通過圖2可知,本文所提不可靠數(shù)據(jù)恢復(fù)方法的運(yùn)行能耗較少,且本文所提方法能耗較均勻說明本文所提方法運(yùn)行較為穩(wěn)定。
綜上所述,本文所提云計(jì)算環(huán)境下不看可靠數(shù)據(jù)恢復(fù)方法能夠有效提高不可靠數(shù)據(jù)恢復(fù)的準(zhǔn)確度,降低不可靠數(shù)據(jù)恢復(fù)時(shí)間和能耗,且數(shù)據(jù)恢復(fù)占用的內(nèi)存較少,具有良好的使用價(jià)值。
云計(jì)算環(huán)境下存在大量的不可靠數(shù)據(jù),但這些數(shù)據(jù)中可能含有重要信息,不可以刪除,這就需要對(duì)云計(jì)算環(huán)境下不可靠數(shù)據(jù)進(jìn)行恢復(fù)。采用當(dāng)前的不可靠數(shù)據(jù)恢復(fù)方法進(jìn)行數(shù)據(jù)恢復(fù)時(shí)過程較復(fù)雜,并且難以保證恢復(fù)后數(shù)據(jù)的準(zhǔn)確度。提出一種基于張量Tucker閾值的云計(jì)算環(huán)境下不可靠數(shù)據(jù)恢復(fù)方法,通過實(shí)驗(yàn)證明,所提方法的準(zhǔn)確度較高,具有較強(qiáng)的可行性。
[1] 張 露,尚艷玲.云計(jì)算環(huán)境下資源調(diào)度系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J].計(jì)算機(jī)測(cè)量與控制,2017,25(1):131-134.
[2] 周 虹, 陳 鋒. 一種云計(jì)算共享數(shù)據(jù)完整性公開審計(jì)方案[J]. 電子設(shè)計(jì)工程, 2016, 24(9):60-62.
[3] 崔立魯,朱貴發(fā).利用重力衛(wèi)星數(shù)據(jù)恢復(fù)地球質(zhì)量遷移方法的研究[J].科學(xué)技術(shù)與工程,2015,15(14):106-109.
[4] 向勁松,王 舉,吳 濤,等.基于脈沖展寬波形的光脈沖位置調(diào)制異步采樣信號(hào)的數(shù)據(jù)恢復(fù)技術(shù)[J].光學(xué)學(xué)報(bào),2017(1):74-81.
[5] 韓利華,程 聰.遮擋物體的圖像恢復(fù)方法研究與仿真[J].計(jì)算機(jī)仿真,2016,33(11):345-348.
[6] 劉金明,謝秋菊,王 雪,等.基于GSA-SVM的畜禽舍廢氣監(jiān)測(cè)缺失數(shù)據(jù)恢復(fù)方法[J].東北農(nóng)業(yè)大學(xué)學(xué)報(bào),2015,46(5):95-101.
[7] 楊立東,王 晶,謝 湘,等.基于低秩張量補(bǔ)全的多聲道音頻信號(hào)恢復(fù)方法[J].電子與信息學(xué)報(bào),2016,38(2):394-399.
[8] 白晉國,孫紅勝,胡澤明.一種基于SQLite3文件格式的刪除數(shù)據(jù)恢復(fù)方法[J].小型微型計(jì)算機(jī)系統(tǒng),2016,37(3):505-509.
[9] 陳紅玉,孟彩霞.基于相干函數(shù)無偏估計(jì)的數(shù)據(jù)恢復(fù)技術(shù)[J].科技通報(bào),2016,32(3):105-108.
[10] 陳亦平,陳偉彪,姚 偉,等.WAMS錯(cuò)誤數(shù)據(jù)的快速辨識(shí)及恢復(fù)方法[J].電力自動(dòng)化設(shè)備,2016,36(12):95-101.
Research on Unreliable Data Recovery Method in Cloud Computing Environment
Liu Kai,Wang Sanhu,Xue Yanfeng,Wu Caihong
(Department of Computer Science and Technology,Lüliang University,Lüliang 033000,China)
Because the cloud computing environment is unreliable and the data contain valuable information, the direct use may lead to the burden on the computer, so it is necessary to recover the unreliable data in the cloud computing environment. Most of the current methods of copying unreliable data, use the address mapping layer assignment write new address, so unreliable data in a period of time still exists in the cloud storage, the protection is achieved in such a system, do not need to update the channel additional data storage information. The timestamp information is added to the mapping term of FTL through the outer zone record timestamp of FLASH, and the fast recovery of data is achieved without updating the mapping table each time. But this approach has a detrimental effect on the performance of cloud storage systems. Therefore, this paper proposes a method to calculate environment unreliable data recovery method based on tensor Tucker threshold cloud, first calculate the random secret key generator node environment generates a random session key using the cloud, and the unreliable data HMAC message authentication code is calculated, so as to realize the protection and reconstruction. On this basis, combining the unreliable data threshold decomposition process and singular threshold method, in order to get the threshold of Tncker operator, to achieve dynamic data recovery, similar n- rank tensor combined with Tucker threshold operator and the recovery process using augmented Lagrange multiplier method is chosen, no reliable data recovery method of Tucker threshold augmented Lagrange multiplier based on the proposed, completed under the cloud computing environment is not reliable data recovery. Experimental results show that the proposed method can effectively improve the accuracy of unreliable data recovery, reduce the energy consumption and time of data restoration, and has a strong feasibility. It provides a theoretical basis for the application of this topic.
cloud computing; unreliable data; data recovery
2017-01-05;
2017-02-11。
呂梁學(xué)院校內(nèi)自然科學(xué)基金項(xiàng)目(ZRXN201506);呂梁學(xué)院校級(jí)重點(diǎn)大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練項(xiàng)目(CXCYZD201625)。
劉 凱(1985-),男,山東臨沂人,碩士研究生,助教,主要從事計(jì)算機(jī)軟件、數(shù)據(jù)挖掘、人工智能方向的研究。
1671-4598(2017)08-0028-04
10.16526/j.cnki.11-4762/tp.2017.08.008
TP309
A