楊文娟
摘 要:網(wǎng)絡(luò)社交中數(shù)據(jù)傳輸便捷性、共享性,增加了隱私信息保護(hù)的困難性,差分隱私技術(shù)因能夠低于攻擊者全部背景知識(shí),而備受關(guān)注。為此,文章針對(duì)非交互式的場(chǎng)景下,基于隱私保護(hù)及數(shù)據(jù)可用性的雙重需求,針對(duì)數(shù)據(jù)的屬性分類,分別引入Laplace機(jī)制及指數(shù)機(jī)制,通過(guò)噪聲添加實(shí)現(xiàn)差分隱私保護(hù);并基于數(shù)據(jù)可用性,利用改進(jìn)的LWSPA查詢結(jié)構(gòu)序列的分割,降低向量溫度,控制發(fā)布數(shù)據(jù)集的誤差,以優(yōu)化數(shù)據(jù)可用性,以此建構(gòu)的差分隱私保護(hù)機(jī)制,能夠?qū)崿F(xiàn)隱私保護(hù)與數(shù)據(jù)可用的均衡發(fā)展。
關(guān)鍵詞:差分隱私;Laplace機(jī)制;隱私保護(hù);數(shù)據(jù)效用
0 引言
目前,大數(shù)據(jù)時(shí)代驅(qū)動(dòng)下微博、微信等各類網(wǎng)絡(luò)社交平臺(tái)層出不窮,這些平臺(tái)集成和存儲(chǔ)了海量的數(shù)據(jù)信息,為人們信息交互、共享提供了多元化的網(wǎng)絡(luò)空間。但網(wǎng)絡(luò)虛擬性、高效傳播性,讓諸多發(fā)布出來(lái)的個(gè)人信息暴露出來(lái),使得隱私泄密問(wèn)題日漸嚴(yán)峻。因此如何在保有網(wǎng)絡(luò)社交便捷性同時(shí),保護(hù)隱私是關(guān)注的焦點(diǎn)。就目前隱私保護(hù)技術(shù)的發(fā)展而言,可大致歸為基于聚類、基于網(wǎng)絡(luò)結(jié)構(gòu)修改等2類。其中,前者是以既定的規(guī)則將節(jié)點(diǎn)分為不同的組,而后,將所有組的節(jié)點(diǎn)組成的子圖,以匿名方式構(gòu)造一個(gè)超級(jí)節(jié)點(diǎn)用以隱藏其內(nèi)部的用戶隱私信息。后者則是通過(guò)邊的刪除、添加、交換等方式,來(lái)干擾社會(huì)網(wǎng)絡(luò)結(jié)構(gòu),促使其與原始社會(huì)網(wǎng)絡(luò)結(jié)構(gòu)產(chǎn)生既定差異,由此實(shí)現(xiàn)對(duì)用戶隱私數(shù)據(jù)的保護(hù)目的。但聚類方法因?yàn)閷⒆訄D內(nèi)個(gè)體屬性及關(guān)聯(lián)信息均予以隱藏,故而隱私保護(hù)后,數(shù)據(jù)缺損嚴(yán)重,嚴(yán)重影響了其可用性。網(wǎng)絡(luò)結(jié)構(gòu)修改方法則可有效彌補(bǔ)這一缺點(diǎn),尤其差分隱私保護(hù)機(jī)制作為主流的一種隱私保護(hù)方法,其將噪聲添加至原始數(shù)據(jù)或統(tǒng)計(jì)結(jié)果之中,以混淆攻擊者對(duì)于數(shù)據(jù)集中個(gè)人隱私記錄的判斷。在不影響數(shù)據(jù)輸出結(jié)果的前提下,該方法能有效抵御了潛在攻擊者的任何背景知識(shí),實(shí)現(xiàn)數(shù)據(jù)應(yīng)用與隱私保護(hù)的雙重功能,在網(wǎng)絡(luò)社交隱私保護(hù)中具有較明顯的應(yīng)用優(yōu)勢(shì)。但在實(shí)踐中,非交互式場(chǎng)景下數(shù)據(jù)集中屬性過(guò)多,利用差分隱私添加過(guò)量的噪聲,會(huì)影響數(shù)據(jù)集的可用性。因此在該種應(yīng)用場(chǎng)景下,如何基于差分隱私保護(hù)機(jī)制的優(yōu)化設(shè)計(jì),實(shí)現(xiàn)數(shù)據(jù)隱私保護(hù)及可用性的均衡發(fā)展視為研究的重點(diǎn)。
1 網(wǎng)絡(luò)社交差分隱私保護(hù)的基本定位
1.1 差分隱私保護(hù)的需求分析
網(wǎng)絡(luò)社交平臺(tái)的出現(xiàn)為信息交互、共享及利用提供了廣闊的空間,而基于數(shù)據(jù)應(yīng)用性需求,需將個(gè)體大量的數(shù)據(jù)信息公布于眾,這其中會(huì)暴露個(gè)人隱私,為此,在網(wǎng)絡(luò)社交數(shù)據(jù)發(fā)布之前,需進(jìn)行隱私保護(hù)處理,以在確保個(gè)人隱私保密的同時(shí),實(shí)現(xiàn)數(shù)據(jù)高可用性,據(jù)此,網(wǎng)絡(luò)社交隱私保護(hù)需滿足如下要求:
要求1:隱私保護(hù),也即能夠保障網(wǎng)絡(luò)社交數(shù)據(jù)中個(gè)人隱私不被泄露。差分隱私保護(hù)旨在通過(guò)添加噪聲干擾,來(lái)構(gòu)建網(wǎng)絡(luò)社交的隱私保護(hù)機(jī)制,以隱藏個(gè)人私密的信息,且該隱藏記錄是否出現(xiàn)在原有數(shù)據(jù)集匯總,不會(huì)對(duì)發(fā)布的數(shù)據(jù)結(jié)果產(chǎn)生顯著影響。
要求2:數(shù)據(jù)可用性,也即在經(jīng)過(guò)隱私保護(hù)處理后,所發(fā)布的數(shù)據(jù)仍然保留高度的準(zhǔn)確性及實(shí)用性。為確保數(shù)據(jù)可用性,通常網(wǎng)絡(luò)社交的隱私保護(hù)需隱藏?cái)?shù)據(jù)記錄中敏感屬性,但攻擊者利用公布的海量信息通過(guò)其中非敏感屬性的組合關(guān)系,亦能夠獲取數(shù)據(jù)信息中的敏感屬性,進(jìn)而實(shí)現(xiàn)隱私保護(hù)數(shù)據(jù)的破解差分隱私機(jī)制應(yīng)用的關(guān)鍵是通過(guò)添加噪聲來(lái)轉(zhuǎn)換原始數(shù)據(jù),并控制轉(zhuǎn)換數(shù)據(jù)與原始數(shù)據(jù)的差異,以實(shí)現(xiàn)隱私保護(hù)的同時(shí),確保網(wǎng)絡(luò)社交數(shù)據(jù)的高度準(zhǔn)確性及可用性。
1.2 差分隱私保護(hù)的定義
據(jù)此,通過(guò)實(shí)驗(yàn)分析可得與以往的差分隱私技術(shù)相比,本文改進(jìn)的差分隱私技術(shù)在對(duì)網(wǎng)絡(luò)社交數(shù)據(jù)進(jìn)行隱私保護(hù)過(guò)程中,會(huì)更好的控制輸出數(shù)據(jù)集與原始數(shù)據(jù)集的誤差,數(shù)據(jù)準(zhǔn)確性更優(yōu);且保持了輸出數(shù)據(jù)集90%以上最短路徑不變,達(dá)到了數(shù)據(jù)高度可用性的要求,具有一定的應(yīng)用可行性。
4 結(jié)語(yǔ)
網(wǎng)絡(luò)社交深化應(yīng)用與發(fā)展下,各類用戶信息云集,推進(jìn)了海量信息的集成與共享,但公布的數(shù)據(jù)中涵蓋諸多隱私信息,亟待進(jìn)行保護(hù)處理?;诰W(wǎng)絡(luò)社交數(shù)據(jù)交互共享性特質(zhì),隱私保護(hù)的內(nèi)涵及外延得以拓展,不再局限于單一隱私性的保護(hù)研究,也開始關(guān)注數(shù)據(jù)效用性,而目前差分隱私技術(shù)多集中在基于攻擊者背景知識(shí)抵御的隱私保護(hù)上,忽略了數(shù)據(jù)可用性。為此上述研究針對(duì)隱私保護(hù)及數(shù)據(jù)效用的均衡發(fā)展需求,提出了一種基于差分隱私保護(hù)機(jī)制,其通過(guò)添加噪聲進(jìn)行查詢敏感設(shè)計(jì),并透過(guò)發(fā)布數(shù)據(jù)集與原始數(shù)據(jù)集的誤差控制,來(lái)提升發(fā)布數(shù)據(jù)的準(zhǔn)確性及可用性,實(shí)現(xiàn)了一舉多得的設(shè)計(jì)。
[參考文獻(xiàn)]
[1]付鈺,俞藝涵,吳曉平.大數(shù)據(jù)環(huán)境下差分隱私保護(hù)技術(shù)及應(yīng)用[J].通信學(xué)報(bào),2019(10):157-168.
[2]何明,常盟盟,吳小飛.一種基于差分隱私保護(hù)的協(xié)同過(guò)濾推薦方法[J].計(jì)算機(jī)研究與發(fā)展,2017(7):1439-1451.
[3]李強(qiáng).軌跡隱私保護(hù)及在基于位置的社交網(wǎng)絡(luò)服務(wù)中應(yīng)用研究[D].蘭州:蘭州交通大學(xué),2016.
[4]蘭麗輝,鞠時(shí)光.基于差分隱私的權(quán)重社會(huì)網(wǎng)絡(luò)隱私保護(hù)[J].通信學(xué)報(bào),2015(9):145-159.
[5]黃茜茜,蔣千越,蔣琳,等.基于差分隱私的社交網(wǎng)絡(luò)隱私保護(hù)[J].信息技術(shù)與網(wǎng)絡(luò)安全,2018(6):36-40.
(編輯 姚 鑫)
Privacy protection in social networking based on differential privacy
Yang Wenjuan
(Shanghai Zhongqiao Vocational And Technical University, Shanghai 201514, China)
Abstract:Data transmission convenience and sharing increase the difficulty of privacy information protection. The differential privacy technology attracts much attention because it is lower than the full background knowledge of the attacker. Therefore, based on the dual demand of privacy protection and data availability, we introduce Laplace mechanism and index mechanism, realize differential privacy protection through noise addition, and use the segmentation of improved LWSPA, query structure sequence, reduce the vector temperature, control the error of the release data set, and optimize the data availability to realize the balanced development of privacy protection and data availability.
Key words:differential privacy;laplace mechanism;privacy protection;data utility