胡濤 李嶠 周宇
【摘 要】針對(duì)數(shù)據(jù)融合過程的隱私保護(hù)應(yīng)用需求,基于信源編碼理論將數(shù)據(jù)模值編碼與數(shù)據(jù)融合的過程相結(jié)合,設(shè)計(jì)了一種具有隱私保護(hù)能力的融合方法。該方法根據(jù)信源編碼思想,從數(shù)據(jù)編碼的角度實(shí)現(xiàn)深層次數(shù)據(jù)融合。理論分析和實(shí)驗(yàn)結(jié)果表明,該算法能夠在較低開銷的前提下實(shí)現(xiàn)數(shù)據(jù)融合隱私保護(hù)。
【關(guān)鍵詞】無線傳感器網(wǎng)絡(luò);數(shù)據(jù)融合;隱私保護(hù);信源編碼
0 引言
無線傳感器網(wǎng)絡(luò)中數(shù)據(jù)融合過程的隱私保護(hù)技術(shù)按照其實(shí)現(xiàn)數(shù)據(jù)隱藏的原理,主要可以分為兩大類:即通過數(shù)據(jù)形式變換實(shí)現(xiàn)隱私保護(hù)和和通過加密技術(shù)實(shí)現(xiàn)的隱私保護(hù)。為了實(shí)現(xiàn)精確感知的需求和對(duì)單個(gè)節(jié)點(diǎn)失效的魯棒性,WSN往往需要進(jìn)行密集部署,這使得感知數(shù)據(jù)間存在豐富的空間相關(guān)性和冗余性。由于無線傳感器網(wǎng)絡(luò)的能耗主要集中在數(shù)據(jù)傳輸上且與數(shù)據(jù)發(fā)送量成正比,所以這些冗余信息將會(huì)造成巨大的能量浪費(fèi)。分布式信源編碼為消除這種相關(guān)性提供了很好的思路,它可以使得各相關(guān)信源在不用相互通信的情況下進(jìn)行獨(dú)立編碼,并獲得與相互通信同樣的數(shù)據(jù)壓縮性能,目前在WSN領(lǐng)域中得到了廣泛的研究。由于分布式信源編碼的特征,該技術(shù)可以很好的和數(shù)據(jù)融合結(jié)合起來,從數(shù)據(jù)編碼的角度實(shí)現(xiàn)深層次數(shù)據(jù)融合。
1 理論基礎(chǔ)與研究現(xiàn)狀
1973年提出的Slepian-Wolf理論是分布式信源編碼的理論基礎(chǔ),本文首先對(duì)該理論進(jìn)行簡(jiǎn)要介紹,然后對(duì)基于該理論的模值編碼進(jìn)行闡述,為本文所提的基于信源編碼的隱私保護(hù)方法提供理論依據(jù)。
根據(jù)Slepian-Wolf編碼理論,對(duì)兩個(gè)互相關(guān)的信號(hào)源X,Y進(jìn)行編碼,如果X和Y知道彼此的互相關(guān)信息,那么X就可以在不需要事先知道Y的情況下獲得與事先知道Y一樣的編碼效率,即圖1所示的兩種編碼方案的效果是一樣的。但是獨(dú)立編解碼方案不需要與Y進(jìn)行通信,因此可以減少通信能耗,這一點(diǎn)對(duì)于能量受限的無線傳感器網(wǎng)絡(luò)來說是十分有利的。
在Slepian-Wolf編碼理論中將Y稱作邊信息。對(duì)X和Y進(jìn)行獨(dú)立編碼,并在譯碼端進(jìn)行無失真地聯(lián)合譯碼,需要滿足以下條件:對(duì)兩個(gè)互相關(guān)的信號(hào)源X,Y進(jìn)行編碼,如果X和Y知道彼此的互相關(guān)信息,比如聯(lián)合概率分布p(x,y),那么X就可以在不需要事先知道Y的情況下獲得與事先知道Y一樣的編碼效率。但是獨(dú)立編解碼方案不需要與Y進(jìn)行通信,不但具有更大的靈活性,同時(shí)還可以減少通信能耗,保護(hù)數(shù)據(jù)的隱私性。在Slepian-Wolf編碼理論中將Y稱作邊信息。對(duì)X和Y進(jìn)行獨(dú)立編碼,并在譯碼端進(jìn)行無失真地聯(lián)合譯碼,需要滿足:
其中Rx,Ry表示X和Y的編碼速率,H(XY),H(YX)分別表示對(duì)應(yīng)的條件熵,H(X,Y)表示兩者的聯(lián)合熵。
Slepian-Wolf編碼理論針對(duì)兩個(gè)相關(guān)信源,主要方法包括伴隨式的分布式信源編碼,Turbo碼,LDPC碼方法,模值方法等。
2 基于信源編碼的數(shù)據(jù)融合技術(shù)
考慮到無線傳感器網(wǎng)絡(luò)的應(yīng)用場(chǎng)景,其數(shù)據(jù)相關(guān)性往往表現(xiàn)為其差值在一定范圍內(nèi)且監(jiān)測(cè)值連續(xù),因此,本文中采用模值編碼方式實(shí)現(xiàn)數(shù)據(jù)融合過程的數(shù)據(jù)表示。在模式編碼中,首先作如下約定:設(shè)網(wǎng)絡(luò)節(jié)點(diǎn)監(jiān)測(cè)的數(shù)據(jù)范圍為[mins,maxs],數(shù)據(jù)精度表示為Δ(這一數(shù)值將由實(shí)際應(yīng)用來確定),數(shù)據(jù)編碼的比特?cái)?shù)為n,則可以得到監(jiān)測(cè)的數(shù)據(jù)樣本集合如下:
算法流程如下:
Step1:構(gòu)建簇型結(jié)構(gòu)
首先需要構(gòu)建一個(gè)分簇結(jié)構(gòu),由于該類型算法較多,其中LEACH算法應(yīng)用最為廣泛,本文也采用該算法進(jìn)行簇結(jié)構(gòu)的建立,簇頭節(jié)點(diǎn)表示為CH,簇內(nèi)成員節(jié)點(diǎn)表示為Cn。
Step2:編碼
簇頭節(jié)點(diǎn)根據(jù)當(dāng)前測(cè)量結(jié)果向簇內(nèi)節(jié)點(diǎn)廣播邊信息Y。根據(jù)模值編碼技術(shù),若信源X與邊信息Y之間的差值小于2k-1Δ(0≤k≤n),則X 可以以k bit 進(jìn)行編碼以實(shí)現(xiàn)數(shù)據(jù)壓縮的目的,即:
f(X)=index(X)mod2k (1)
其中f(X)表示X編碼后的信息比特,index(X)=(X-min s)/Δ。由此可知,由于節(jié)點(diǎn)在傳輸數(shù)據(jù)前首先將其進(jìn)行編碼表示,因此可以實(shí)現(xiàn)對(duì)數(shù)據(jù)真實(shí)數(shù)值的隱藏,對(duì)于惡意節(jié)點(diǎn)來說,由于并不知道其編碼過程和邊信息的數(shù)值,因此即使惡意節(jié)點(diǎn)獲得了該編碼結(jié)果也無法得到隱私數(shù)據(jù)。
Step3:融合
首先,需要在簇頭節(jié)點(diǎn)進(jìn)行譯碼操作:
i=‖Y-ri‖(2)
其中i表示譯碼后的結(jié)果,S表示由f(X)給出的陪集,ri表示陪集內(nèi)的元素。
根據(jù)譯碼結(jié)果,簇頭節(jié)點(diǎn)進(jìn)行融合操作,本文以加法融合為例,融合過程可表示如下:
y=i(3)
簇頭節(jié)點(diǎn)在獲得中間的融合結(jié)果后,再將其按照基站節(jié)點(diǎn)發(fā)給其的邊信息進(jìn)行編碼,編碼過程如公式(1),并在編碼后將數(shù)據(jù)上傳至基站節(jié)點(diǎn),基站節(jié)點(diǎn)按照公式(2)解碼后即可獲得最終的融合結(jié)果。
3 算法性能分析
首先,在算法的復(fù)雜度方面,模值編碼的編碼過程較為簡(jiǎn)單,僅僅為數(shù)值計(jì)算,文獻(xiàn)對(duì)其算法復(fù)雜度進(jìn)行了測(cè)算,編碼過程的計(jì)算復(fù)雜度較低僅為0(1)。譯碼過程的復(fù)雜度則與與陪集的元素個(gè)數(shù)成正比,這是因?yàn)樾枰谂慵羞M(jìn)行搜索對(duì)應(yīng)的數(shù)值。
其次,數(shù)據(jù)通信量分析?,F(xiàn)有的數(shù)據(jù)融合隱私保護(hù)算法大多基本可以分為三種類型,加密,分片或者安全多方計(jì)算,我們分別選擇其中的代表性方案SA算法[1],SMART算法[2]和iPDA算法進(jìn)行性能的比較。
對(duì)于SA算法,由于該算法中需要傳輸節(jié)點(diǎn)的ID用以檢驗(yàn)數(shù)據(jù)的完整性,總的通信量為4n+ID,其中n為網(wǎng)絡(luò)中傳感器節(jié)點(diǎn)的個(gè)數(shù),為了方便比較本文忽略ID所需要通信開銷;SMART算法主要依靠對(duì)隱私數(shù)據(jù)進(jìn)行分片傳輸來達(dá)到保護(hù)隱私的目的,因此數(shù)據(jù)傳輸量主要取決于其數(shù)據(jù)的分片情況,假設(shè)分片個(gè)數(shù)為s,則總共需要傳輸?shù)臄?shù)據(jù)量應(yīng)該為s*n。iPDA算法中,由于通過采用安全多方計(jì)算的方式來對(duì)信息的隱私性進(jìn)行保護(hù),網(wǎng)絡(luò)中的通信量為3(1-pc)n+6pc*n,其中pc為成為簇頭的概率。而本文算法的數(shù)據(jù)通信量由于進(jìn)行了信源編碼的壓縮,僅為pd*n,其中pd為壓縮的比例。比較結(jié)果如圖2所示。
4 總結(jié)與展望
借助于網(wǎng)絡(luò)數(shù)據(jù)的相關(guān)性,本文將信源相關(guān)編碼技術(shù)引入數(shù)據(jù)融合隱私保護(hù)方案,重點(diǎn)研究了如何在數(shù)據(jù)融合場(chǎng)景下實(shí)現(xiàn)基于模值的編碼和譯碼。在數(shù)據(jù)傳遞過程中不需要參考信息數(shù)值的情況下,節(jié)點(diǎn)對(duì)采集到的隱私數(shù)據(jù)進(jìn)行獨(dú)立編碼并傳輸,從而實(shí)現(xiàn)了數(shù)據(jù)融合過程的隱私保護(hù)。
【參考文獻(xiàn)】
[1]HU Lingxuan, EVANS D. Secure aggregation for wireless networks[C].Proceeding of the 2003 Symposium on Applications and the Internet Workshops, Washington, 2011:384-391.
[2]Wenbo He, Xue Liu, Nguyen H, and Nahrstedt K. A Cluster-based Protocol to Enforce Integrity and Preserve Privacy in Data Aggregation[C].Proceedings of the 29th IEEE International Conference on Distributed Computing Systems Workshops, 2009:14-19.
[責(zé)任編輯:王楠]