摘要:大數(shù)據(jù)使云計(jì)算成為數(shù)據(jù)存儲(chǔ)和處理的重要途徑.但也引發(fā)了數(shù)據(jù)隱私和安全問(wèn)題。因此,發(fā)展基于云計(jì)算的數(shù)據(jù)隱私保護(hù)技術(shù)是當(dāng)前研究熱點(diǎn)之一。文章進(jìn)一步開(kāi)發(fā)了包括數(shù)據(jù)提供者、服務(wù)器和用戶(hù)3部分組成的云架構(gòu).并發(fā)展了一種apriori算法來(lái)增強(qiáng)加密數(shù)據(jù)的隱私性、云計(jì)算系統(tǒng)的數(shù)據(jù)保護(hù)以及查詢(xún)隱私功能。最后,為了評(píng)估所提出的架構(gòu)的安全性能,實(shí)驗(yàn)使用Windows 11操作系統(tǒng)的計(jì)算機(jī)對(duì)不同的最小支持度和數(shù)據(jù)量做安全評(píng)估。測(cè)試表明,所提出的算法能為云計(jì)算系統(tǒng)提供安全的隱私保護(hù)。
關(guān)鍵詞:云計(jì)算;數(shù)據(jù)隱私;apriori算法;相等性測(cè)試
中圖法分類(lèi)號(hào):TP393 文獻(xiàn)標(biāo)識(shí)碼:A
1 引言
隨著大數(shù)據(jù)時(shí)代的到來(lái),云計(jì)算已成為數(shù)據(jù)存儲(chǔ)和處理的重要手段[1] 。然而,云計(jì)算的廣泛應(yīng)用也引發(fā)了數(shù)據(jù)隱私泄露的風(fēng)險(xiǎn),基于云計(jì)算的數(shù)據(jù)隱私保護(hù)技術(shù)也應(yīng)運(yùn)而生,并成為當(dāng)前研究的熱點(diǎn)之一[2] 。
基于云計(jì)算的數(shù)據(jù)隱私保護(hù)技術(shù)主要包括基于加密算法的技術(shù)[3] 、基于隱私保護(hù)協(xié)議的技術(shù)[4] 和基于數(shù)據(jù)脫敏的技術(shù)等。
基于加密算法的技術(shù)通過(guò)對(duì)數(shù)據(jù)進(jìn)行加密,可以使數(shù)據(jù)在傳輸過(guò)程中不被竊取或篡改。常見(jiàn)的加密算法包括對(duì)稱(chēng)加密算法、非對(duì)稱(chēng)加密算法和哈希加密算法。對(duì)稱(chēng)加密算法是最常用的加密算法之一,該算法的核心思想是使用相同的密鑰進(jìn)行加密和解密。
常用的對(duì)稱(chēng)加密算法包括DES,AES 等。非對(duì)稱(chēng)加密算法則使用一對(duì)密鑰,分別是公鑰和私鑰。公鑰可以公開(kāi)使用,私鑰只有數(shù)據(jù)接收方才能使用。常見(jiàn)的非對(duì)稱(chēng)加密算法有RSA,ECC 等。哈希加密算法通過(guò)對(duì)數(shù)據(jù)進(jìn)行單向的哈希運(yùn)算,可以將數(shù)據(jù)轉(zhuǎn)化為固定長(zhǎng)度的哈希值,以保證數(shù)據(jù)的一致性和完整性。
另外,基于隱私保護(hù)協(xié)議的技術(shù)也是一種常用的數(shù)據(jù)隱私保護(hù)技術(shù)。該技術(shù)利用協(xié)議來(lái)保護(hù)數(shù)據(jù)隱私,包括差分隱私保護(hù)協(xié)議、匿名化保護(hù)協(xié)議和混淆保護(hù)協(xié)議等。差分隱私保護(hù)協(xié)議的核心思想是通過(guò)向數(shù)據(jù)添加噪音的方式保證數(shù)據(jù)的隱私性,常見(jiàn)的協(xié)議有拉普拉斯機(jī)制和指數(shù)機(jī)制。匿名化保護(hù)協(xié)議則是對(duì)數(shù)據(jù)進(jìn)行一定程度的匿名化處理?;煜Wo(hù)協(xié)議則是將數(shù)據(jù)進(jìn)行重復(fù)排列和混淆,使得攻擊者無(wú)法獲取到原始數(shù)據(jù)。最后,基于數(shù)據(jù)脫敏的技術(shù)是對(duì)敏感數(shù)據(jù)進(jìn)行脫敏處理,使得數(shù)據(jù)在保留數(shù)據(jù)基本特征的同時(shí),又能保護(hù)數(shù)據(jù)的隱私。
目前,基于加密算法的技術(shù)仍是最常用的數(shù)據(jù)隱私保護(hù)技術(shù)。本文發(fā)展了一種apriori 算法來(lái)增強(qiáng)加密數(shù)據(jù)的隱私性,云計(jì)算系統(tǒng)通過(guò)這種算法增強(qiáng)了數(shù)據(jù)保護(hù)以及查詢(xún)隱私功能。結(jié)果表明,與先前提出的關(guān)聯(lián)規(guī)則挖掘相比,所提出的算法顯著增強(qiáng)了云計(jì)算系統(tǒng)的隱私保護(hù)功能。
2 云計(jì)算系統(tǒng)架構(gòu)
目前,盡管已經(jīng)開(kāi)發(fā)了多種安全協(xié)議來(lái)保護(hù)云存儲(chǔ)免受外部攻擊,但云內(nèi)部的隱私保護(hù)同樣重要。在常見(jiàn)的云架構(gòu)中,系統(tǒng)對(duì)外遵循協(xié)議和標(biāo)準(zhǔn),但內(nèi)部算法仍可以訪問(wèn)受到保護(hù)的關(guān)鍵數(shù)據(jù),侵入了云存儲(chǔ)的隱私。在本研究中,我們將進(jìn)一步完善現(xiàn)有的云架構(gòu)。
所采用的體系結(jié)構(gòu)由4 個(gè)主要部分組成:數(shù)據(jù)提供者、服務(wù)器1、服務(wù)器2 和用戶(hù),如圖1 所示。在該架構(gòu)中,數(shù)據(jù)提供者是原始數(shù)據(jù)的實(shí)際所有者,用戶(hù)從云存儲(chǔ)中查找數(shù)據(jù)的實(shí)體,該架構(gòu)使用安全的計(jì)算協(xié)議,并將其用于2 個(gè)云服務(wù)器之間的安全計(jì)算。本架構(gòu)的工作流程如下:首先,數(shù)據(jù)提供者使用Elgamal加密算法生成密鑰和公鑰,密鑰生成后,數(shù)據(jù)提供商將生成的公鑰和加密數(shù)據(jù)集發(fā)送到服務(wù)器1;然后,數(shù)據(jù)提供者向服務(wù)器2 提供elgamal 公鑰,它會(huì)并行地向用戶(hù)發(fā)送生成的公鑰;共享密鑰對(duì)數(shù)據(jù)加密后,用戶(hù)以加密查詢(xún)的形式發(fā)出請(qǐng)求,并將其發(fā)送到服務(wù)器1。在該架構(gòu)中,使用安全純文本相等性測(cè)試來(lái)檢查2個(gè)加密數(shù)據(jù)集是否相等,無(wú)需對(duì)其進(jìn)行實(shí)際解密。2個(gè)云服務(wù)器協(xié)同工作,服務(wù)器1 使用安全純文相等性測(cè)試執(zhí)行apriori 算法。
3 基于apriori 算法的數(shù)據(jù)隱私保護(hù)技術(shù)
為了提高云計(jì)算架構(gòu)的數(shù)據(jù)隱私性,采用了apriori 算法和安全純文本相等性測(cè)試來(lái)增強(qiáng)云計(jì)算中的隱私保護(hù)功能,圖2 解釋了所提算法的流程。
3.1 安全純文本相等性測(cè)試
本架構(gòu)使用了安全純文本相等測(cè)試算法。安全純文本相等性測(cè)試算法基于輸入比較返回值,輸出值可以是true 或false。若2 個(gè)純文本值相同,則返回true,否則返回false。算法的輸入是2 個(gè)密文(input1和input2),輸出為真或假。首先,服務(wù)器1 生成一個(gè)復(fù)合數(shù)t,并向服務(wù)器2 發(fā)送input1(t)。使用input1(t),input2(t)和2 個(gè)密碼輸入,使用該值生成S1 和S2。然后,將此數(shù)據(jù)傳輸?shù)椒?wù)器2,使用服務(wù)器2 上的密鑰生成輸出gr1x 和gr2x,其中,x 是密鑰生成后數(shù)據(jù)提供者提供的密鑰。最后,這些值被傳輸?shù)椒?wù)器1,在服務(wù)器1 中,它們使用t,gr1x 和gr2x 生成算法的輸出,并根據(jù)輸出為true 或false 定義2 個(gè)密文是否相似。
本研究提出的基于apriori 算法和安全純文本平等測(cè)試算法的隱私保護(hù)有2 個(gè)重要步驟:候選集的生成和頻繁集的計(jì)算。
3.2 候選集的生成
每個(gè)候選集合存在多個(gè)模式,每個(gè)模式由多個(gè)項(xiàng)目組成。候選集生成包括以下步驟。首先,從k?1 頻繁數(shù)據(jù)集中選擇一對(duì)模式<p1,p2>。然后,在模式1和模式2 的項(xiàng)目之間執(zhí)行連接,并將連接的結(jié)果添加到候選集Sk,其中k 是項(xiàng)目數(shù)。在對(duì)模式1 和模式2的所有排除項(xiàng)執(zhí)行該連接后,Sk 被傳送到服務(wù)器1。
3.3 頻繁集的計(jì)算
在該步驟中,計(jì)算候選集合的頻繁集(Sk)。首先,從候選集合中選擇一個(gè)模式,然后,對(duì)屬于所選模式的所有項(xiàng)目執(zhí)行安全純文本相等測(cè)試。若此測(cè)試返回true,則匹配項(xiàng)計(jì)數(shù)加1。
3.4 apriori 算法
本文所采用的apriori 算法流程如圖2 所示。最初,L1 被設(shè)置為數(shù)據(jù)所有者接收的單個(gè)項(xiàng)目集。然后,使用候選集生成算法生成候選集,并計(jì)算候選集的頻繁集。在這個(gè)階段,如果沒(méi)有生成k 個(gè)頻繁集,那么返回k?1 個(gè)頻繁集,其中k 是項(xiàng)集的長(zhǎng)度。
4 結(jié)果和討論
4.1 算法分析
為了確定所提出算法的安全漏洞,對(duì)其進(jìn)行了安全證明分析。對(duì)于服務(wù)器1,數(shù)據(jù)以加密格式存在,并且該服務(wù)器中存在的數(shù)據(jù)庫(kù)也是加密格式。由于所提出的加密算法在每個(gè)加密過(guò)程中為相同的純文本數(shù)據(jù)提供不同的加密數(shù)據(jù),因此可以保證數(shù)據(jù)不會(huì)泄漏。關(guān)于服務(wù)器2,由于原始數(shù)據(jù)不包含密文的前面部分,因此不存在第二個(gè)服務(wù)器暴露數(shù)據(jù)的機(jī)會(huì)。這表明所提出的算法具有云計(jì)算基礎(chǔ)設(shè)施的安全性。
4.2 安全評(píng)估
為了評(píng)估所提出的架構(gòu)的安全性能,我們進(jìn)行了以下分析。本評(píng)估使用Windows 11 操作系統(tǒng),配備了64 GB DDR4 RAM 和Intel? CoreTM i9?12900K 處理器,并使用了6.2.1 版本GMP 庫(kù)。具體如表1 所列。
在評(píng)估中,為了獲得更廣泛的評(píng)估效果,采用了不同的最小支持度和數(shù)據(jù)量,安全關(guān)聯(lián)規(guī)則挖掘性能分析評(píng)估的細(xì)節(jié)如表2 所列。其中,最小支持度的范圍在10%至40%,數(shù)據(jù)量分別為1 000,5 000 和10000。為了確定虛假交易的影響,將虛假交易比率設(shè)置在40%到100%區(qū)間內(nèi)。高級(jí)加密算法的密鑰大小為512。
最終測(cè)試表明,本文所提算法與關(guān)聯(lián)規(guī)則挖掘算法相比,在虛假交易比率為60%,最小支持率為10%的情況下,所提出的算法顯示出180%的改進(jìn)。與數(shù)據(jù)隱私關(guān)聯(lián)規(guī)則挖掘相比,在虛假交易比率為100%,最小支持率為20%的情況下,所提出的算法顯示出270%的提高。該結(jié)果表明,所提出的算法具有顯著的安全性。
5 結(jié)束語(yǔ)
云計(jì)算具有許多優(yōu)勢(shì),如靈活的空間、較高的安全性和成本優(yōu)化以及從任何遠(yuǎn)程位置訪問(wèn),云計(jì)算正在成為個(gè)人和組織的主要數(shù)據(jù)存儲(chǔ)。同時(shí),隱私保護(hù)也是云計(jì)算的一個(gè)重要方面。在本研究中,提出了一種apriori 算法來(lái)增強(qiáng)加密數(shù)據(jù)的隱私性,所提出算法改進(jìn)了數(shù)據(jù)保護(hù)以及查詢(xún)隱私功能。實(shí)驗(yàn)表明,與關(guān)聯(lián)規(guī)則挖掘算法相比,所提出的算法在性能上顯示出明顯的優(yōu)勢(shì)。未來(lái),我們可能在系統(tǒng)泛化方面做出更多研究。
參考文獻(xiàn):
[1] 陳全,鄧倩妮. 云計(jì)算及其關(guān)鍵技術(shù)[J]. 計(jì)算機(jī)應(yīng)用,2009,29(9):2562?2567.
[2] 馮登國(guó),張敏,張妍,等.云計(jì)算安全研究[J].軟件學(xué)報(bào),2011,22(1):45?49.
[3] LIU H,NING H,XIONG Q,et al. Shared authority basedprivacy?preserving authentication protocol in cloud computing[J].IEEE Transactions on parallel and distributed systems,2014,26(1):241?251.
[4] XIANG N,ZHANG X,DOU Y,et al.High?end equipment datadesensitization method based on improved Stackelberg GAN[J].Expert Systems with Applications,2021,180:114989.
作者簡(jiǎn)介:梁文龍(1994—),碩士,助教,研究方向:模式識(shí)別、圖像處理、云計(jì)算技術(shù)。