周先春,孫文榮,嵇亞婷
?
基于云計(jì)算的大數(shù)據(jù)安全隱私保護(hù)研究
周先春,孫文榮,嵇亞婷
(南京信息工程大學(xué) 電子與信息工程學(xué)院,江蘇 南京 210044)
云計(jì)算技術(shù)是信息技術(shù)快速發(fā)展下的產(chǎn)物,其實(shí)現(xiàn)了大數(shù)據(jù)的整合運(yùn)用,給人們的生活帶來(lái)了極大便利。大數(shù)據(jù)在云計(jì)算技術(shù)構(gòu)建的平臺(tái)上得到充分利用。同時(shí),其潛在安全隱患和用戶的隱私問(wèn)題成為目前云計(jì)算的重要研究課題。為此,本文簡(jiǎn)要闡述了云計(jì)算及大數(shù)據(jù)的概念定義,在此基礎(chǔ)上提出了基于云計(jì)算的大數(shù)據(jù)安全隱私問(wèn)題,并針對(duì)這些問(wèn)題提出了基于云計(jì)算的大數(shù)據(jù)安全隱私保護(hù)策略。
云計(jì)算;大數(shù)據(jù);安全隱私;隱私保護(hù)
云計(jì)算是一種基于互聯(lián)網(wǎng)的新型計(jì)算方式。在這種計(jì)算方式下計(jì)算機(jī)按照不同需要通過(guò)云平臺(tái)實(shí)現(xiàn)信息資源共享[1]。這些共享資源有很多種,如應(yīng)用程序,服務(wù)器、存儲(chǔ)器等。在云計(jì)算環(huán)境下不需要管理員的干預(yù)就可便捷地釋放或配置共享資源。而大數(shù)據(jù)是指規(guī)模龐大的數(shù)據(jù)總和,現(xiàn)有數(shù)據(jù)處理存儲(chǔ)技術(shù)已無(wú)法快捷地對(duì)海量數(shù)據(jù)進(jìn)行管理,更無(wú)法從中整理出具有價(jià)值的信息[2]。當(dāng)前基于云計(jì)算的大數(shù)據(jù)存儲(chǔ)技術(shù)發(fā)展迅猛,然而基于云計(jì)算的大數(shù)據(jù)安全問(wèn)題是限制其發(fā)展的主要因素。為此,本文深入研究了基于云計(jì)算的大數(shù)據(jù)安全隱私保護(hù)方案,希望能夠促進(jìn)我國(guó)基于云計(jì)算的大數(shù)據(jù)技術(shù)的發(fā)展。
所謂云計(jì)算大數(shù)據(jù)隱私安全是指整個(gè)生命周期中數(shù)據(jù)的安全隱私。從數(shù)據(jù)存儲(chǔ)角度來(lái)看,云計(jì)算安全隱私問(wèn)題是指云計(jì)算平臺(tái)中用戶數(shù)據(jù)的安全問(wèn)題[3]。大數(shù)據(jù)背景下,數(shù)據(jù)機(jī)密性、完整性、可用性面臨挑戰(zhàn),傳統(tǒng)安全算法協(xié)議不再像之前那么有效;從數(shù)據(jù)計(jì)算角度來(lái)看,云計(jì)算安全隱私問(wèn)題主要包括用戶行為被監(jiān)視,數(shù)據(jù)被篡改等;從云計(jì)算平臺(tái)的生態(tài)系統(tǒng)角度來(lái)看,云計(jì)算安全隱私問(wèn)題包括云計(jì)算平臺(tái)的可靠性、服務(wù)收費(fèi)是否合理等。問(wèn)題產(chǎn)生原因主要有兩個(gè),第一,云計(jì)算服務(wù)提供商不可靠,盜取用戶數(shù)據(jù)或隨意使用用戶數(shù)據(jù)。為解決該問(wèn)題,我們可以引入第三方監(jiān)督。第二,云平臺(tái)遭受外部入侵,通常云計(jì)算服務(wù)提供商會(huì)提供各種形式的身份認(rèn)證、訪問(wèn)控制以及數(shù)據(jù)加密措施。如圖1所示的稅收云平臺(tái)模型。
圖1 政府稅收云平臺(tái)模型
在這個(gè)云平臺(tái)中政府稅務(wù)部門(mén)通過(guò)云平臺(tái)整合企業(yè)、社會(huì)團(tuán)體、非盈利組織的稅收情況,對(duì)云平臺(tái)的稅收數(shù)據(jù)進(jìn)行數(shù)據(jù)統(tǒng)計(jì),為政府部門(mén)的決策提供數(shù)據(jù)支持。這種云平臺(tái)稅收模式和傳統(tǒng)的稅收模式相比,透明程度更高,可靠性更高[4]。但是,假如這個(gè)云平臺(tái)的安全隱私保護(hù)措施不到位就可能導(dǎo)致政府稅收信息遭到破壞、泄露、篡改,從而給國(guó)家政府決策和稅收安全帶來(lái)不利影響。
各個(gè)行業(yè)的安全需求在大數(shù)據(jù)環(huán)境下都在發(fā)生變化。隨著數(shù)據(jù)規(guī)模的不斷擴(kuò)大,整個(gè)數(shù)據(jù)鏈條面臨的安全問(wèn)題日益增多,數(shù)據(jù)的安全隱私保護(hù)難度越來(lái)越高。當(dāng)前,各大企業(yè)非常關(guān)注基于云計(jì)算的大數(shù)據(jù)安全隱私問(wèn)題[5]。此外,大數(shù)據(jù)技術(shù)的不斷發(fā)展帶來(lái)數(shù)據(jù)共享便利的同時(shí)也帶來(lái)了不容忽視的數(shù)據(jù)隱私安全問(wèn)題,一方面,用戶受益于大數(shù)據(jù)技術(shù)可以用更低的價(jià)格獲得更加個(gè)性化的商品,另一方面,大數(shù)據(jù)環(huán)境下,用戶的個(gè)人行為數(shù)據(jù)被收集被統(tǒng)計(jì)的過(guò)程中存在隱私泄露的可能性。
下面我們將分析基于同態(tài)加密機(jī)制的云平臺(tái)安全計(jì)算方案和安全存儲(chǔ)方案。在這兩個(gè)方案中成功解決了云計(jì)算環(huán)境下對(duì)數(shù)據(jù)的隱私保護(hù)和計(jì)算信息的隱私保護(hù)。此外,還解決了完整性驗(yàn)證和數(shù)據(jù)恢復(fù)問(wèn)題。該方案提高了云平臺(tái)數(shù)據(jù)的安全隱私性[6]。
當(dāng)前云服務(wù)提供商在數(shù)據(jù)計(jì)算安全性和數(shù)據(jù)隱私性方面的保護(hù)措施非常有限。本章中提到的基于隱式機(jī)制的數(shù)據(jù)存儲(chǔ)方案中使基于代數(shù)中的多項(xiàng)式以及矩陣?yán)碚?,不涉及?shù)據(jù)加密,避免了管理密鑰等復(fù)雜的數(shù)據(jù)處理過(guò)程[7]。但是,如果存儲(chǔ)用戶數(shù)據(jù)的云服務(wù)器合謀就會(huì)導(dǎo)致用戶數(shù)據(jù)泄露,威脅到用戶數(shù)據(jù)的安全隱私。和顯式的同態(tài)加密機(jī)制相比,隱式機(jī)制無(wú)需密鑰管理,但是也解決不了云服務(wù)器合謀導(dǎo)致數(shù)據(jù)泄露的問(wèn)題。為此,文本提出了一種基于多個(gè)云服務(wù)器的數(shù)據(jù)存儲(chǔ)計(jì)算方案,經(jīng)過(guò)加密的用戶數(shù)據(jù)被分別存儲(chǔ)在多個(gè)云服務(wù)器中,然后再統(tǒng)一通過(guò)一個(gè)云服務(wù)器進(jìn)行數(shù)據(jù)計(jì)算,最終得到加密的數(shù)據(jù),數(shù)據(jù)被使用之前需要使用者先解密數(shù)據(jù)[8]。這種數(shù)據(jù)存在計(jì)算方案可以顯著降低數(shù)據(jù)存儲(chǔ)計(jì)算成本,同時(shí)云計(jì)算技術(shù)的應(yīng)用能夠顯著提升數(shù)據(jù)的計(jì)算處理效率,有效提高用戶數(shù)據(jù)的安全性。此方案的主要優(yōu)勢(shì)在于不但能保護(hù)數(shù)據(jù)計(jì)算結(jié)果的安全隱私,還能保證計(jì)算條目?jī)?nèi)容,計(jì)算條目數(shù)的安全隱私,同時(shí)確保計(jì)算結(jié)果的準(zhǔn)確性。圖2為該方案中基于云端的多用戶數(shù)據(jù)安全計(jì)算系統(tǒng)示意圖:
圖2 云端多方安全計(jì)算系統(tǒng)
我們給該用戶數(shù)據(jù)計(jì)算系統(tǒng)模型中的實(shí)體賦予相應(yīng)的定義:數(shù)據(jù)擁有者(DO)。擁有多個(gè)數(shù)據(jù)條目及對(duì)應(yīng)數(shù)據(jù)值的DO有多個(gè);云服務(wù)器(CS),云服務(wù)器主要用于儲(chǔ)存DO上傳的數(shù)據(jù),每個(gè)DO將自己的數(shù)據(jù)上傳到擁有海量存儲(chǔ)空間的云服務(wù)器中,由云服務(wù)提供商對(duì)上傳的數(shù)據(jù)進(jìn)行相應(yīng)的分配存儲(chǔ);Proxy:同樣是云服務(wù)器,只是和CS不同的是,Proxy負(fù)責(zé)接收用戶的請(qǐng)求,然后對(duì)數(shù)據(jù)進(jìn)行相應(yīng)的計(jì)算處理,最后將計(jì)算結(jié)果返回給用戶。User:計(jì)算服務(wù)的使用者[9]。該方案的主要設(shè)計(jì)目標(biāo)是確保云平臺(tái)數(shù)據(jù)的安全隱私,下面我們從數(shù)據(jù)存儲(chǔ)的安全隱私、計(jì)算結(jié)果的安全隱私、計(jì)算結(jié)果的準(zhǔn)確性和完整性等方面來(lái)闡述該方案的安全性。該方案中對(duì)數(shù)據(jù)的上傳進(jìn)行加密操作以確保云服務(wù)器上存儲(chǔ)數(shù)據(jù)的安全隱私。一旦云服務(wù)器收到攻擊或服務(wù)器之間進(jìn)行合謀,數(shù)據(jù)竊取者只能得到加密后的數(shù)據(jù)。只要加密算法足夠復(fù)雜且在本次存儲(chǔ)密鑰,網(wǎng)絡(luò)黑客就不可能破解出其中的明文,從而保證用戶數(shù)據(jù)的安全性。此外,該方案中,服務(wù)器接受用戶請(qǐng)求對(duì)數(shù)據(jù)進(jìn)行計(jì)算,再返回相應(yīng)的計(jì)算結(jié)果給用戶。假設(shè)用戶是可靠的,那么云服務(wù)器得到的是加密后的結(jié)果,因?yàn)橛脩魶](méi)有數(shù)據(jù)密鑰,所以不可能獲得具體的計(jì)算結(jié)果,從而保證了數(shù)據(jù)計(jì)算結(jié)果的隱私性。該方案中接受用戶計(jì)算請(qǐng)求的云服務(wù)器Proxy在實(shí)行數(shù)據(jù)計(jì)算之前就會(huì)驗(yàn)證參與計(jì)算的數(shù)據(jù)完整性,這樣做的目的是為了保證計(jì)算內(nèi)容的正確性和完整性。因?yàn)?,有些惡意的CS和Proxy有可能會(huì)隱瞞已發(fā)生的數(shù)據(jù)事故,所以,該方案會(huì)預(yù)先計(jì)算salt-hash值來(lái)防范此類風(fēng)險(xiǎn),進(jìn)而在一定程度上確保了計(jì)算結(jié)果的準(zhǔn)確性。
上述的方案在驗(yàn)證數(shù)據(jù)完整性和恢復(fù)數(shù)據(jù)方面還有很多需要完善的地方。在實(shí)踐應(yīng)用中,數(shù)據(jù)擁有者(DO)有可能擁有大量的最大條目,而數(shù)據(jù)擁有者(DO)擁有的最大條目數(shù)量每提升一個(gè),需要預(yù)計(jì)算的salt-hash數(shù)據(jù)將增加一倍,但實(shí)際上可能只需要計(jì)算區(qū)區(qū)幾個(gè)條目組合,這樣會(huì)導(dǎo)致服務(wù)器的計(jì)算資源閑置或浪費(fèi)[10]。由此可見(jiàn),如此檢驗(yàn)數(shù)據(jù)的效率非常低,同時(shí)上述方案中驗(yàn)證數(shù)據(jù)完整性的次數(shù)也是有限的m次,而在實(shí)踐應(yīng)用中我常常需要進(jìn)行遠(yuǎn)遠(yuǎn)多于m次的數(shù)據(jù)完整性檢驗(yàn),這也會(huì)導(dǎo)致給方案無(wú)法正常進(jìn)行。此外,當(dāng)數(shù)據(jù)經(jīng)檢驗(yàn)后被確定完整性不符合要求時(shí),就應(yīng)該對(duì)數(shù)據(jù)進(jìn)行相應(yīng)的恢復(fù)處理,這樣的處理方式有助于提高數(shù)據(jù)的安全性。正是因?yàn)槲覀冊(cè)诨诒Wo(hù)數(shù)據(jù)隱私的安全計(jì)算方案中提出的數(shù)據(jù)完整性驗(yàn)證及恢復(fù)的問(wèn)題,促使我們對(duì)該方案進(jìn)行完善,改進(jìn)后的方案需要實(shí)現(xiàn)以下幾個(gè)目標(biāo):①能夠不限次數(shù)地檢驗(yàn)數(shù)據(jù)完整性;②一旦數(shù)據(jù)完整性遭到破壞,應(yīng)該可以對(duì)數(shù)據(jù)進(jìn)行相應(yīng)的恢復(fù)處理;③能夠準(zhǔn)確找到錯(cuò)誤數(shù)據(jù),快速定位出現(xiàn)錯(cuò)誤的數(shù)據(jù)塊;④盡量降低數(shù)據(jù)計(jì)算成本相:⑤數(shù)據(jù)擁有者只需支付很低的計(jì)算成本就可以對(duì)數(shù)據(jù)進(jìn)行完整性檢驗(yàn);⑥有效避免浪費(fèi)計(jì)算資源。
該方案中的系統(tǒng)模型與上一個(gè)章節(jié)中基于保護(hù)數(shù)據(jù)隱私的安全計(jì)算方案是一致的,我們利用結(jié)構(gòu)圖來(lái)深入探討新方案,如圖3所示。我們可以給圖中的實(shí)體分別賦予其定義:數(shù)據(jù)擁有者(DO)。擁有多個(gè)數(shù)據(jù)條目及對(duì)應(yīng)數(shù)據(jù)值的DO有多個(gè);云服務(wù)器(CS),云服務(wù)器主要用于儲(chǔ)存DO上傳的數(shù)據(jù),每個(gè)DO將自己的數(shù)據(jù)上傳到擁有海量存儲(chǔ)空間的云服務(wù)器中,由云服務(wù)提供商對(duì)上傳的數(shù)據(jù)進(jìn)行相應(yīng)的分配存儲(chǔ);Proxy:這里的Proxy的作用和基于保護(hù)數(shù)據(jù)隱私的安全計(jì)算方案中的proxy一樣。User:這里的User的作用和基于保護(hù)數(shù)據(jù)隱私的安全計(jì)算方案中的User一樣。該方案是對(duì)基于保護(hù)數(shù)據(jù)隱私的安全計(jì)算方案的優(yōu)化,該方案在上一個(gè)方案的基礎(chǔ)上增加了不限次數(shù)的數(shù)據(jù)完整性驗(yàn)證及恢復(fù)功能。在基于保護(hù)數(shù)據(jù)隱私的安全計(jì)算方案中,考慮到CS和Proxy可能會(huì)惡意隱瞞數(shù)據(jù)丟失的錯(cuò)誤,從而導(dǎo)致數(shù)據(jù)計(jì)算結(jié)果出現(xiàn)錯(cuò)誤。為此,該方案中,我們給所有結(jié)算條目組合添加x個(gè)salt值,確保用戶User進(jìn)行x次挑戰(zhàn)-應(yīng)答協(xié)議,其中選用的x值都是隨機(jī)保密的,可以有效避免云服務(wù)器CS作弊,從而有效保證參與計(jì)算處理的數(shù)據(jù)的完整性。在該方案中,我們可以通過(guò)雙線性對(duì)的性質(zhì)進(jìn)行數(shù)據(jù)完整性檢驗(yàn)。由于用戶User產(chǎn)生的挑戰(zhàn)值都是隨機(jī)的,同時(shí)每一次挑戰(zhàn)生成的值同樣是隨機(jī)的,因此,云服務(wù)器CS、Proxy除了猜測(cè)以外,沒(méi)有 別的方法可以獲取該值,只有誠(chéng)實(shí)地將計(jì)算值發(fā)送給用戶User,如此一來(lái),就避免了CS和Proxy 作弊。
圖3 三個(gè)網(wǎng)絡(luò)實(shí)體的結(jié)構(gòu)圖
綜上所述,近些年來(lái)隨著信息技術(shù)的發(fā)展,云計(jì)算和大數(shù)據(jù)成為最典型的信息技術(shù)代表。云計(jì)算技術(shù)和大數(shù)據(jù)技術(shù)顛覆了傳統(tǒng)數(shù)據(jù)存儲(chǔ)、計(jì)算模式,給人類社會(huì)帶來(lái)了巨大改變,人們從云計(jì)算和大數(shù)據(jù)中獲得了絕大的便利,各個(gè)行業(yè)也越來(lái)越重視云計(jì)算和大數(shù)據(jù)。大數(shù)據(jù)就像“埋在地下的金子”,而云計(jì)算就是探測(cè)挖掘“金子”的有效工具。信息大爆炸下,呈現(xiàn)指數(shù)增長(zhǎng)巨量數(shù)據(jù)必須利用更加高效的云計(jì)算技術(shù)進(jìn)行數(shù)據(jù)提取、數(shù)據(jù)分析、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)計(jì)算等操作,以更加充分地發(fā)揮數(shù)據(jù)價(jià)值。因?yàn)閭鹘y(tǒng)地計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)無(wú)法高效分配、處理數(shù)據(jù),假如沒(méi)有云計(jì)算技術(shù),大數(shù)據(jù)就像深深埋藏在地下的金子永遠(yuǎn)沒(méi)有發(fā)光的機(jī)會(huì),而如果沒(méi)有大數(shù)據(jù),云計(jì)算技術(shù)就會(huì)英雄無(wú)用武之地,因此,這兩者之間是相互依賴的關(guān)系,他們的結(jié)合是科技發(fā)展的必然趨勢(shì)。
[1] 吳延順. 基于云計(jì)算的大數(shù)據(jù)安全隱私保護(hù)的研究[J]. 電子技術(shù)與軟件工程, 2016(4): 199-199.
[2] 馬凱航, 高永明, 吳止鍰等. 大數(shù)據(jù)時(shí)代數(shù)據(jù)管理技術(shù)研究綜述[J]. 軟件, 2015, 36(10): 46-49.
[3] 齊榮. 用戶隱私研究綜述[J]. 軟件, 2015, 36(1): 125-130.
[4] 榮艷冬. 基于云計(jì)算的高校就業(yè)信息服務(wù)平臺(tái)的應(yīng)用研究[J]. 軟件, 2015, 36(5): 45-48.
[5] 崔繼仁, 張艷麗, 王越男. 基于云計(jì)算的大數(shù)據(jù)安全隱私保護(hù)分析[J]. 網(wǎng)絡(luò)安全技術(shù)與應(yīng)用, 2016(6): 72-73.
[6] 卜曉波. 試論大數(shù)據(jù)云計(jì)算環(huán)境下的數(shù)據(jù)安全[J]. 軟件, 2018, 39(2): 197-199.
[7] 田鵬程, 張莉梅, 楊俊. 就業(yè)信息服務(wù)平臺(tái)數(shù)據(jù)隱私保護(hù)方案設(shè)計(jì)[J]. 軟件, 2015, 36(4): 18-23.
[8] 張小波, 付達(dá)杰. 網(wǎng)絡(luò)信息資源個(gè)性化推薦中隱私保護(hù)的研究[J]. 軟件, 2015, 36(4): 62-66.
[9] 謝晉. 基于云計(jì)算的大數(shù)據(jù)安全隱私保護(hù)研究[J]. 通訊世界, 2017(02): 112-112.
[10] 張亮. 基于云計(jì)算環(huán)境的大數(shù)據(jù)安全存儲(chǔ)機(jī)制研究[D]. 東南大學(xué), 2016.
Research on Security and Privacy Protection of Big Data Based on Cloud Computing
ZHOU Xian-chun, SUN Wen-rong, JI Ya-ting
(College of Electronic and Information Engineering, Nanjing University of Information Science and Technology, Nanjing 210044, China)
Cloud computing technology is the product of the rapid development of information technology, which realizes the integration and application of large data, and brings great convenience to people's lives. Big data is fully utilized on the platform of cloud computing technology. At the same time, its potential security risks and user privacy problems have become an important research topic in cloud computing. Therefore, this paper briefly describes the concept of cloud computing and large data definition, based on this proposed cloud-based large data security and privacy issues, and to address these issues proposed cloud-based large data security and privacy protection strategy.
Cloud computing; Big data; Security privacy; Privacy protection
TP309.2
A
10.3969/j.issn.1003-6970.2018.10.013
周先春(1974-),男,副教授,主要研究方向:信號(hào)與信息處理;孫文榮(1989-),男,研究生,主要研究方向:信號(hào)與信息處理;嵇亞婷(1989-),女,研究生,主要研究方向:信號(hào)與信息處理。
周先春,孫文榮,嵇亞婷. 基于云計(jì)算的大數(shù)據(jù)安全隱私保護(hù)研究[J]. 軟件,2018,39(10):60-63