【摘要】隨著網(wǎng)絡技術和信息技術的飛速發(fā)展,物聯(lián)網(wǎng)(Ineternet of things,IoT)的概念一被提出便受到人們的廣泛關注。由于物聯(lián)網(wǎng)終端運算能力存在瓶頸, 物聯(lián)網(wǎng)終端用戶必須依托云平臺對私有數(shù)據(jù)進行存儲和處理,因此云平臺對用戶數(shù)據(jù)擁有絕對的控制權,這會對數(shù)據(jù)中隱私信息(如身份證號、醫(yī)療記錄等)的完整性和機密性造成極大的威脅。保護用戶數(shù)據(jù)最直觀方法是在數(shù)據(jù)被外包存儲在云平臺之前對數(shù)據(jù)進行加密,但是這種方法給后續(xù)的數(shù)據(jù)可用性(如,數(shù)據(jù)檢索和數(shù)據(jù)去重)帶來困難。因此,在保護數(shù)據(jù)隱私的同時,不得不面臨一個尖銳的矛盾,即在保護數(shù)據(jù)中敏感信息的同時確保數(shù)據(jù)在后續(xù)數(shù)據(jù)處理過程中的可用性。本文針對云環(huán)境下物聯(lián)網(wǎng)數(shù)據(jù)外包時所面臨安全威脅,研究如何構建物聯(lián)網(wǎng)數(shù)據(jù)安全存儲和處理技術。
【關鍵詞】物聯(lián)網(wǎng);數(shù)據(jù)安全;隱私保護;訪問控制;圖像檢索;視頻去重
引言:近年來,隨著連接互聯(lián)網(wǎng)的設備數(shù)量增加,“物聯(lián)網(wǎng)(Internet of things,IoT)”這一概念逐漸引起大量研究人員的關注。物聯(lián)網(wǎng)的主要思想是使越來越多的物體連接起來,使其能夠相互交流.在這種背景下,智能設備的角色已經(jīng)由傳統(tǒng)的通信工具轉變?yōu)橐垣@取、處理數(shù)據(jù)和通信的現(xiàn)代工具。
物聯(lián)網(wǎng)中連接和交互的智能對象包括移動設備,可穿戴傳感器設備和環(huán)境傳感器。這些設備可以將周圍環(huán)境的電子狀態(tài)或數(shù)字快照,如家庭中的空氣濕度,辦公室的打印設置等,均可通過聯(lián)網(wǎng)將信息傳遞給用戶。一旦物聯(lián)網(wǎng)技術成功并廣泛地應用,智能設備將密集填充到人們的生存環(huán)境,甚至是極限環(huán)境,增加人們與環(huán)境之間的互動。例如,當人們將無線傳感器放置在寵物身上時,他們能夠隨時獲取寵物的位置信息;如果在建筑環(huán)境中檢索到危險氣體的泄露,警報將自動啟動;當佩戴谷歌眼鏡時,用戶只需使用語言控制即可在互聯(lián)網(wǎng)上拍照、發(fā)送信息和檢索信息。此外,一些實際應用需要這些智能攝像捕捉電子視頻,例如,交通環(huán)境和智能城市中監(jiān)控設備等。因此,這些環(huán)境提供者(Context provider)將電子信息發(fā)送給用戶。
但是,物聯(lián)網(wǎng)中的大多數(shù)設備都具有存儲容量小,計算能力有限等缺點,而隨著物聯(lián)網(wǎng)應用的普及,需要收集越來越多的數(shù)據(jù)并由內(nèi)容提供者處理,這可能導致設備終端無法負擔起相應的存儲空間和計算成本消耗。相比起加強設備終端的存儲和計算能力,人們更愿意以更小的代價將數(shù)據(jù)傳送到云服務器上進行處理和存儲。而隨著5G時代的到來,數(shù)據(jù)傳送將變得更有效率。
1. 主要技術
1.1 對稱加密
在密碼系統(tǒng)中,原始消息(通常稱為明文)被加密為密文。如果沒有正確的解密密鑰,那么就很難獲得明文信息。一般加密方法可以分為兩種:對稱加密和非對稱加密。這里,主要介紹本方案中采用的對稱加密。
在對稱加密中,假設發(fā)送者(Sender)與接收者(Reciever)雙方已經(jīng)共享一個密鑰K。發(fā)送方使用密鑰K對明文消息P進行加密,通過以下方式獲得密文C:
C = Sym Enc(P, K)
這種情況,如果接收者收到密文C后,可以用相同的密鑰K對其進行解密,以恢復明文P ?P= Sym Dec(C, K)
需要注意的是,這里的秘鑰K是發(fā)送者與接收者之間秘密共享的,通過安全的共享方式,沒有第三方知道。
1.2 收斂加密
收斂加密是一種特殊的加密技術,在數(shù)據(jù)去重過程中,保證數(shù)據(jù)的機密性。用戶從原始數(shù)據(jù)中衍生出一個收斂密鑰,并用收斂密鑰對原始數(shù)據(jù)進行加密。此外,用戶同時從原始數(shù)據(jù)中提取數(shù)據(jù)標簽tag,用于重復數(shù)據(jù)的檢測。也就是說,如果兩個原始數(shù)據(jù)是完全相同的,那么它們的標簽與密文也是完全相同的。因此,一般來說收斂加密由四個算法組成:
· 密鑰生成:KeyGenCE (M) → K。該算法用于提取密鑰,將原始數(shù)據(jù) M 映射成一個收斂密鑰 K。
· 加密:EncryptCE (K, M) → C。該算法屬于對稱加密算法,采用收斂密鑰 K和原始數(shù)據(jù) M 作為輸入,輸出密文C。
· 解密:DecryptCE (K,C) → M。該算法用于獲取明文。用收斂密鑰 K 和密文 C 作為輸入,經(jīng)過解密后,得到原始數(shù)據(jù) M。
· 標簽生成:TagGenCE (M) → T (M)。該算法用于生成數(shù)據(jù)標簽,檢測重復數(shù)據(jù)。將原始數(shù)據(jù) M 映射成一個標簽 T (M),并且標簽不能被用來獲取收斂密鑰。
1.3 SGX
在前面第四章中已經(jīng)詳細的介紹過 SGX 技術,這里本節(jié)只簡單回顧下SGX的三個主要功能。
· 隔離:可以創(chuàng)建一個安全可信的空間 enclave,將數(shù)據(jù)或程序加載到
enclave中執(zhí)行計算,隔離惡意軟件的讀取或篡改。
· 封裝:每個SGX處理器在制造時都會被嵌入一個根密鑰,稱為 Root Seal
Key。當 enclave 創(chuàng)建時,使用 EGETKEY 指令,根據(jù)跟密鑰衍生出一個密鑰稱為 Seal Key,用來加密和認證數(shù)據(jù)。
· 認證:主要有兩種認證方式,一種是本地認證,指認證同一平臺的兩個
enclave 之間;另一種是遠程認證,指遠程應用與本地 enclave 之間的認證。
2. 系統(tǒng)模型與設計目標
2.1 系統(tǒng)結構
系統(tǒng)結構主要包含了三個實體:環(huán)境提供者(Contextprovider)、遠程服務器(Remote server)和密鑰分發(fā)中心(Key distributioncenter)。
· 環(huán)境提供者:該實體的主要任務是收集數(shù)據(jù),并將數(shù)據(jù)傳送給遠程的服
務器或者其他的遠程終端設備。一般來說,環(huán)境提供者包括傳感器節(jié)點,RFID 閱讀器等。在大多數(shù)情況下,終端設備在存儲空間和計算能力方面受到大的限制。
· 遠程服務器:該實體擁有大量的存儲空間和強大的計算能力,用戶可以將他們的數(shù)據(jù)存儲在遠程服務器上,并利用該實體所提供的服務,完成計算任務。
· 密鑰分發(fā)中心:該系統(tǒng)實體是可信的,主要任務是分配和管理用戶的公鑰和私鑰,以及系統(tǒng)的公共參數(shù)。
2.2 威脅模型
該系統(tǒng)主要考慮以下兩種攻擊方式:
· 內(nèi)部攻擊:主要指系統(tǒng)內(nèi)參與者的攻擊,按照參與者分類可以分為遠程服務器和受妥協(xié)的終端。
– 遠程服務器:通常假設遠程服務器是“誠實且具有好奇心”的,它們能夠誠實地執(zhí)行系統(tǒng)協(xié)議,然而對存儲的數(shù)據(jù)內(nèi)容是好奇的,會非法嘗試侵犯用戶的隱私數(shù)據(jù)。
– 受妥協(xié)的終端:指在系統(tǒng)中工作的終端,會按照正常的協(xié)議工作,但是會嘗試非法侵犯其他設備終端的數(shù)據(jù)隱私。
· 外部攻擊:主要指不在系統(tǒng)內(nèi)的惡意用戶,通過公共傳送頻道獲取一些感興趣的信息,并試圖利用這些信息獲取數(shù)據(jù)內(nèi)容。
3. 視頻去重方案
根據(jù)上述內(nèi)容,系統(tǒng)的設計目標是在物聯(lián)網(wǎng)云平臺環(huán)境下,實現(xiàn)隱私保護的視頻去重存儲系統(tǒng)。由于多媒體數(shù)據(jù),如視頻圖像具有高維度,存儲空間大等內(nèi)在特征,且內(nèi)容大多由物聯(lián)網(wǎng)中特定終端在固定環(huán)境下拍攝,如用戶的工作場所。
意味著這些視頻圖像包含大量的重復內(nèi)容,冗余數(shù)據(jù)大,因此,本節(jié)針對視頻數(shù)據(jù),提出了隱私保護的視頻去重方案。
一般來說,重復數(shù)據(jù)刪除技術根據(jù)去重細粒度可以分為兩類:文件級去重和塊級去重。根據(jù)這兩種細粒度,分別介紹文件級視頻去重方案和塊級視頻去重方案。
3.1 文件級視頻去重
在文件級視頻去重方案中,如果兩個圖像中的每個像素完全相同,則將文件表示為重復數(shù)據(jù)。如圖4.1所示,基于物聯(lián)網(wǎng)云平臺的視頻去重方案中涉及到環(huán)境提供者和云平臺。在物聯(lián)網(wǎng)終端,設備負責收集環(huán)境數(shù)據(jù),同時負責視頻加密。在云平臺上,存儲加密的視頻數(shù)據(jù),并且在密文數(shù)據(jù)上執(zhí)行去重過程。以下步驟詳細描述了保護隱私的文件級視頻去重方案。
步驟1:系統(tǒng)初始化。首先,密鑰分發(fā)中心為系統(tǒng)中的每個參與者分配一個密鑰對(ski, pki),并且將密鑰對通過安全通道分發(fā)下去。然后選擇一個安全哈希函數(shù):H(.): {0, 1} → {0, 1}k。最后密鑰分發(fā)中心發(fā)布系統(tǒng)的公共參數(shù) param。
步驟2:密鑰生成。假設一個終端設備收集的一個圖像 P,根據(jù)收斂加密中的秘鑰提取算法,可以從中提取收斂密鑰 K:
K = Gen(P) (4.1)
步驟3:加密。得到收斂密鑰 K 后,對原始圖像P加密:
C = Enc(P, K) (4.2)
步驟4:標簽生成。將密文 C 和公共參數(shù) param 作為輸入,輸出標簽 Tag:
Tag = H(C, param) ? ? ? ? ? ? ? ? ? ?(4.3)
然后將密文與相對應的標簽 < Tag,C > 發(fā)送到遠程云服務器中,進行存儲。
步驟5:查重。在云平臺上,服務器在存儲數(shù)據(jù)中進行查重比較。假設有兩個密文 < Tag1,C1 > 和 < Tag2,C2 >,且它們滿足以下條件:
Tag1 = Tag2, C1 ?= C2
那么,系統(tǒng)會認為這兩個數(shù)據(jù)是完全重復的。
步驟6:去重。當服務器確定是重復的數(shù)據(jù)時,將保留其中一個副本,同時移除其他重復的副本,并且將結果反饋給用戶終端。此外,所有刪除的圖像都替換為指向唯一副本的指針存儲在服務器上,并不影響其他之前用戶終端的訪問讀取。
3.2 塊級視頻去重
文件級視頻去重只針對相同的視頻文件,要求視頻中每張圖像的每個像素都必須完全一致,這樣所得到的密文才會完全相同,實現(xiàn)去重的目標。文件級視頻去重對視頻本身的要求非常嚴格,但實際中,由于光線、設備等問題,即使是拍攝相同的環(huán)境目標,所得到的視頻在計算機看來還是不同的。因此,這種去重方式節(jié)省的存儲空間是有限的?;诖朔N原因,考慮采用塊級去重可以更大程度地節(jié)省存儲空間。本文重點塊級視頻去重方案。
眾所周知,視頻由連續(xù)的幀圖像組成,鄰近的幀圖像之間彼此關聯(lián)強烈,這意味著視頻文件中存在著高冗余數(shù)據(jù)。而由于幀圖像不完全相同,文件級視頻的去重方案在這種情況下并不適用,而塊級視頻去重則可以最大程度的消除視頻幀中的冗余,使存儲空間降低。
在本文中,基于收斂加密的塊級視頻去重方案將被詳細描述。該方案同樣旨在實現(xiàn)兩個主要目標。一方面,重復數(shù)據(jù)的刪除工作將在圖像塊上進行,可以達到更高的重復數(shù)據(jù)刪除率。另一方面,出于隱私保護的目的,數(shù)據(jù)在傳送到云服務器之前是被加密的,避免公共傳送頻道的竊聽。同時,在去重過程中以密文形式進行,云服務器無法得到明文信息。圖4.2給出了塊級視頻去重方案模型。塊級視頻去重方案主要由以下幾個步驟組成:
步驟1:假設存在一個圖像P,將該圖像劃分成n個塊,并且bi表示圖像的第i個塊。由此,該圖像可以表示成:P = {b1, b2, ..., bn}
步驟2:對于圖像中的每一個圖像塊 bi,用密鑰提取算法,計算相應的收斂密鑰:ki = Gencov(bi) i = 1, 2, ..., n
步驟3:用得到的收斂密鑰 ki,對相應的圖像塊 bi 加密:
ci ?= Enc(bi, ki) i = 1, 2, ..., n
得到密文 C={c1, c2, ..., cn}。
步驟4:在第二輪加密中,用對稱密鑰 K 對密文 C 進行加密。假設這里的對稱密鑰 K 是終端設備與云平臺已經(jīng)通過密鑰共享的加密密鑰。
C = Encsym(C, K)
然后終端設備通過公共信道將密文C 發(fā)送到云平臺。當云服務器接收到密文時,將執(zhí)行查重刪重過程。
步驟5:在云端,云服務器通過密鑰 K 對密文C 解密得到C = {c1, c2, ..., cn}。
C = Decsym(C, K)
云服務器將 C = {c1, c2, ..., cn} 存儲在 S-CSP(Storage-cloud service provider)中。
步驟6:為了加速去重效率,云服務器選擇一組哈希函數(shù) H = {H1, H2, ..., Hn},對每一個圖像密文塊ci映射成相對應的哈希值:
hi = hash(ci) i = 1, 2, ..., n
并將這些哈希值 H = {h1, h2, ..., hn} 存儲在 I-CSP(Index-cloud service provider)中。
步驟7:假設給出一個相似的圖像Pr,經(jīng)過上述步驟得到相應的哈希值Hr={hr1, hr2 , ..., hrn},其中 hrj表示第j個圖像塊的哈希值。比較 Hr與H這兩組之間的哈希值。如果滿足
hri = hi, if ?i = j i, j = 1, 2, ..., n
則表示這兩個圖像塊是完全一樣的,可以只保留其中一個圖像塊。如果滿足
hri = hi, if i = j i, j = 1, 2, ..., n
則表示這兩個圖像塊不一致,最后可以得到不重復的圖像塊集合 HNr oDup ={hrj1 , hrj2 , ..., hrjl }。然后,I-CSP將重復的數(shù)據(jù)下標反饋給S-CSP,S-CSP可刪除重復的圖像數(shù)據(jù)塊,最終得到唯一的數(shù)據(jù) CNoDup = {ci1 , ci2 , ..., cin }
盡管上述的塊級視頻去重方案能夠在公共信道傳送過程中不被惡意攻擊者截取保護數(shù)據(jù)的隱私,但是在云服務器上去重過程中,不能防止統(tǒng)計信息的泄露。在該方案中,收斂密鑰被用來作為加密密鑰直接對圖像塊進行加密,這會導致原始圖像的統(tǒng)計特征泄露。其原因在于從相同的圖像塊獲取相同的秘鑰,并得到相同的密文塊。因此,云服務器可以從收斂加密后的密文 C={c1, c2, ..., cn} 中學到一些關于原始圖像的統(tǒng)計信息。圖4.3給出了原始圖像與密文圖像之間存在的統(tǒng)計信息。圖4.3(a) 是加密前的原始圖像,圖 4.3(b) 是使用收斂密鑰后對圖像塊進行加密后的密文圖像。從密文圖像中,可以清晰的分析出原始圖像的大致分布,因此,統(tǒng)計信息的泄露使該方案變的不安全。
3.3 安全的塊級視頻去重方案
針對塊級視頻去重中存在的統(tǒng)計信息泄露問題,本文融合SGX技術提出一個安全的防止統(tǒng)計信息泄露的塊級視頻去重方案。由于SGX技術具有隔離、封裝和認證這三個有點,在云平臺上執(zhí)行數(shù)據(jù)重復去重的過程可以被轉移到SGX中的安全空間中執(zhí)行,以此來防止云服務器獲取統(tǒng)計信息。圖 3.4給出該安全方案的模型圖。
安全塊級視頻去重方案同樣也包括終端和服務器端,區(qū)別在于本方案中需要終端和服務器端進行SGX遠程認證。具體描述如下:
步驟1:給出一張圖像P,將該圖像劃分成n個圖像塊P = {b1, b2, ..., bn},
bi表示第i個圖像塊。對于每個圖像 bi,計算相應的收斂密鑰:
ki = Gencov(bi) i = 1, 2, ..., n
然后,終端設備用密鑰 ki 對 bi 進行加密,得到
ci ?= Enc(bi, ki) i = 1, 2, ..., n
則密文為 C = {c1, c2, ..., cn}。
步驟2:因為用收斂密鑰加密生成的密文與原文之間可能存在統(tǒng)計信息,如果直接通過公共信息傳送,可能會被攻擊者截獲。為了防止這種情況的發(fā)生,需要進行二輪加密,用對稱密鑰K再次加密:
C=Encsym(C, K)
步驟3:在云平臺中,首先要初始化解密enclave,通過向終端設備執(zhí)行遠程認證,如果認證有效,則建立安全信道,并且將密鑰K通過安全信道傳送到解密enclave中。
步驟4:將密文C加載到解密enclave中解密,獲取
C=Decsym(C,K)
解密后,圖像密文塊C={c1,c2,..., cn} 通過哈希函數(shù)組H={H1, H2, ..., Hn}映射得到相應的哈希值
hi = hash(ci) i = 1, 2, ..., n
步驟5:當去重 enclave 與解密 enclave 通過本地認證后,解密 enclave 將哈希值 H和密鑰K傳送到去重enclave中。標記重復的圖像塊后,I-CSP將重復的圖像塊下標返回給S-CSP。S-CSP刪除重復的圖像塊,保留唯一的密文圖像塊。
4. 實驗評估
在這主要介紹塊級視頻去重方案的實現(xiàn)細節(jié),并從以下兩個方面對方案性能進行評估:(1)塊級視頻中的去重率;(2)該方案與現(xiàn)有的主流視頻壓縮算法的存儲大小比較。本實驗在配有 Intel(R) Core(TM) i7-7500U CPU,2.7GHZ,8G內(nèi)存的電腦上運行。
4.1 性能測試
實驗分別提取了 100,500,1000,2000,3000 幀圖像,測得這些連續(xù)的幀圖像之間的去重率。表 5.1 給出了測試結果。從表中可以看出,隨著視頻幀數(shù)的增加,重復的圖像塊所占的比重也在逐漸增加,當幀數(shù)達到3000時,圖像塊的去重率可達到84.04%。也就是說去重后的存儲空間消耗比原始圖像的存儲空間消耗提升了至少33.04%。可以看出去重后的圖像存儲空間的增長幅度也遠遠小于原始圖像存儲空間的增長幅度。
4.2 性能對比
視頻壓縮技術是目前視頻編碼中常用的技術手段,主要是指通過特定的壓縮技術,將視頻中的冗余數(shù)據(jù)去掉,降低存儲空間消耗,且不影響視頻的正常播放。目前網(wǎng)絡上主要流行的一些視頻壓縮技術有 MPEG-2,H264,H265等。MPEG-2:是運動圖像專家組(Moving picture experts group)的縮寫。該技術原理是利用圖像中的空間相關性和時間相關性來進行壓縮??臻g相關性指幀圖像內(nèi)的任何一個場景都是由若干像素點構成,因此一個像素通常與周圍的某些像素在亮度和色度上存儲一定關系。時間相關性指一個鏡頭常常由若干連續(xù)的幀圖像構成序列,這些幀圖像之間存在一定關系。將這些相關的冗余信息去除,只保留少量非相關的圖像信息存儲,按照特定的解碼算法,可以保證一定的圖像質量的前提下恢復原始圖像。該算法主要應用于數(shù)字電視、數(shù)字廣播等方面。H264:是繼MPEG-4之后的新一代視頻壓縮技術,采用混合結構,充分利用視頻數(shù)據(jù)中的各種冗余,包括統(tǒng)計冗余和視覺生理冗余等,達到高效的壓縮。統(tǒng)計冗余指頻譜冗余(色彩分量之間的相關性),空間冗余和時間冗余。視覺生理冗余指由于人類視覺系統(tǒng)特性,如人眼對色彩分量的高頻分量沒有對亮度分量的高頻分量敏感,對圖像高頻的噪聲不敏感等。H264最大的優(yōu)勢就是具有很高的數(shù)據(jù)壓縮比率,同時還擁有高質量流暢的圖像。因此,該算法主要應用于視頻網(wǎng)絡傳輸。
H265:H265是繼H264之后的技術改進,在壓縮效率、魯棒性、容錯率等方面都有顯著的提升。H265可以實現(xiàn)在低于1.5Mbps的傳輸帶寬下,實現(xiàn)1080p全高清視頻傳輸。由于其網(wǎng)絡的適應性很好,主要用于智能手機、平板等方面的視頻播放存儲。本實驗對5組視頻數(shù)據(jù)分別經(jīng)過塊級視頻去重、MPEG-2、H264和H265等算法后所需要的存儲空間消耗(表5.1)。塊級視頻去重方案與視頻算法之間的比率變化。從整體趨勢來看,三個比率線都呈現(xiàn)下降并趨于平穩(wěn)的狀態(tài)。也就是說,塊級視頻去重方案與視頻壓縮算法之間消耗存儲空間的差距會隨著視頻數(shù)據(jù)增大而降低。為了更好的說明塊級視頻去重方案的優(yōu)勢,實驗在多個視頻數(shù)據(jù)上進行去重壓縮??梢钥闯鯩PEG-2,H264和H265等壓縮算法在多個視頻數(shù)據(jù)上的壓縮后,所消耗的存儲空間成線性升高,而塊級視頻去重方案呈現(xiàn)穩(wěn)定趨勢。這主要是因為視頻壓縮算法主要針對單個視頻內(nèi)的幀圖像進行壓縮,而對于多個視頻之間的重復幀圖像無法實現(xiàn)跨視頻壓縮。而本章所提出的塊級視頻去重方案可以在多個視頻之間達到去重目的。這是因為對于相同內(nèi)容的圖像塊,那么它們的密文圖像塊也是相同的,系統(tǒng)會認為這些圖像塊屬于重復內(nèi)容,即使是兩個視頻中的幀圖像,也可以完成去重。因此,塊級視頻去重在多視頻去重領域具有更強的優(yōu)勢。
結論:根據(jù)上述的實驗測試結果以及實驗對比分析可知,塊級視頻去重方案與現(xiàn)有的視頻壓縮方法主要有兩個優(yōu)勢:首先,塊級視頻去重方案能夠保證數(shù)據(jù)的隱私,惡意攻擊者或者云服務器都無法獲取敏感的視頻信息。而視頻壓縮技術并不考慮數(shù)據(jù)的隱私保護。其次,塊級視頻去重方案可以消除不同視頻之間的冗余,而視頻壓縮技術只針對單個視頻數(shù)據(jù)進行冗余消除,無法推廣到多個視頻中去。因此,塊級視頻去重方案在多個視頻去重場景中用更強的優(yōu)勢和應用場景。
事實上,人們習慣于將數(shù)據(jù)傳送到遠程云服務器中集中管理,因此可見,云平臺也將在物聯(lián)網(wǎng)環(huán)境下發(fā)揮著重要作用。終端可以利用云平臺來管理數(shù)據(jù),進行數(shù)據(jù)共享,訪問控制,數(shù)據(jù)認證,數(shù)據(jù)分析,數(shù)據(jù)檢索等多種服務方式。負責收集終端信息的設備可以相應減輕存儲和處理數(shù)據(jù)的負擔,這導致物聯(lián)網(wǎng)和云平臺相結合的必然性。因此,一些應用程序可以利用物聯(lián)網(wǎng)云平臺的存儲和計算能力來存儲和處理來自終端的數(shù)據(jù)。實際上,已經(jīng)存在這樣的依賴于web服務器的應用,如天氣服務,在線日歷等。
然而,目前大部分的數(shù)據(jù)傳送都會泄露用戶的敏感信息。例如,在物聯(lián)網(wǎng)環(huán)境下常用到的無線技術,由于其移動性和服務便攜性,成為應用趨勢。物聯(lián)網(wǎng)中的無線應用場景通常包括無線射頻識別(Radio frequency identification
devices,RFID)和無線傳感網(wǎng)絡(Wireless sensor networks,WSN)。由于無線設備與其他設備共享物理介質,其中包括潛在的惡意設備,當無線傳感器向數(shù)據(jù)中心傳送數(shù)據(jù)時,很可能會遭到惡意設備的攻擊。因此無線設備在廣泛應用的同時,也帶來了巨大的安全挑戰(zhàn)。例如,當人們使用可穿戴設備時,他們擔心這些設備在他們不知的情況下攜帶攝像或錄音等功能侵犯個人的隱私。因此,最好允許用戶能夠控制個人的隱私數(shù)據(jù)。
而由終端設備生成的大規(guī)模數(shù)據(jù)中存在大量的冗余,尤其是多媒體數(shù)據(jù)視頻等,導致通信帶寬和存儲空間的大量消耗。而云服務提供商為了節(jié)約存儲空間,降低資源的消耗,需要消除存儲數(shù)據(jù)中的大量冗余;同時,用戶為了降低租用云服務的成本,也需要消除需要存儲數(shù)據(jù)中的大量冗余。因此,出于相同的目標,數(shù)據(jù)去重技術被廣泛應用。這一些數(shù)據(jù)中所含有的敏感信息與用戶的個人信息密切相關,因此用戶信息的隱私保護在數(shù)據(jù)去重過程中成為一個重要挑戰(zhàn)。通常情況下,加密是一種實用的隱私保護安全方法。雖然這種方法可以有效抵抗數(shù)據(jù)泄露的風險,但同樣給云服務端的數(shù)據(jù)去重帶來技術難題,因為即使是相同的明文數(shù)據(jù),在不同密鑰下加密,他們的密文形式也不同。
為了解決上述問題,一些常用的技術包括同態(tài)加密技術(Homomor phicencryption)和代理重加密技術(Proxy re-encryption)。然而,前者的計算復雜度高,效率低,不適合高維數(shù)據(jù)處理,尤其是在物聯(lián)網(wǎng)環(huán)境下,設備的計算能力有限,該方法并不適用;后者需要一個區(qū)別于云服務的代理服務器, 通過復雜的計算將不同密鑰下相同的明文轉化為相同密鑰下的密文,但這種方法的工作量同樣很大。
基于上述挑戰(zhàn),主要針對視頻數(shù)據(jù),提出隱私保護視頻去重方案。由于視頻數(shù)據(jù)中存在相關性,連續(xù)幀之間只有很小的差異,甚至這些差異肉眼是無法捕捉的,因此,為了節(jié)省云存儲空間,視頻去重是勢在必行的。
參考文獻:
[1]AshtonK.That‘internetofthingsthing[J].RFIDjournal,2009,22(7):97-114.
[2]Pea-LópezI.ITUInternetreport2005:theinternetofthings[J].2005.
[3]IBMResearch.whatisbigdata:Bringbigdatatotheenterprise[OL].http://www-01.ibm.com/software/data/bigdata/,2016.
[4]YuS,LiuM,DouW,etal.Networkingforbigdata:Asurvey[J].IEEECommu-nicationsSurveys&Tutorials,2017,19(1):531-549.
[5]JohnWalkerS.Bigdata:Arevolutionthatwilltransformhowwelive,work,andthink[J].InternationalJournalofAdvertising,2014,33(1):181-183.
[6]FengD,ZhangM,LiH.Bigdatasecurityandprivacyprotection[J].Chinesejournalofcomputers,2014,37(1):246-258.
[7]馮登國,張敏,李昊.大數(shù)據(jù)安全與隱私保護[D].,2014.
[8]楊庚,許建,陳偉,等.物聯(lián)網(wǎng)安全特征與關鍵技術[D].2010.
作者簡介:莊錫釗,廣州人,計算機應用技術實驗師,研究方向:電子信息化技術、多媒體技術、計算機應用技術。