• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      大數(shù)據(jù)環(huán)境下的多維敏感度最佳k值匿名框架

      2020-06-16 11:13:00嚴(yán)英占
      關(guān)鍵詞:中斷級(jí)別敏感度

      南 楠 嚴(yán)英占

      1(嶺南師范學(xué)院基礎(chǔ)教育學(xué)院 廣東 湛江 524048)

      2(中國電子科技集團(tuán)第54研究所 河北 石家莊 050000)

      0 引 言

      隨著信息和通信領(lǐng)域的發(fā)展和進(jìn)步,出現(xiàn)了統(tǒng)計(jì)分析、知識(shí)發(fā)現(xiàn)、數(shù)據(jù)挖掘和許多其他研究領(lǐng)域的新機(jī)遇和新技術(shù),但同時(shí)面臨著隱私和數(shù)據(jù)保護(hù)方面的新挑戰(zhàn)[1]。云計(jì)算是一種革命性的計(jì)算方法,可提供海量存儲(chǔ)和計(jì)算能力,使用戶無需投資和基礎(chǔ)設(shè)施即可經(jīng)濟(jì)高效地實(shí)施應(yīng)用,并能夠通過Internet靈活地按需訪問計(jì)算資源[2]。這些優(yōu)點(diǎn)是導(dǎo)致安全性和隱私問題的原因,因?yàn)椴煌脩魮碛械臄?shù)據(jù)存儲(chǔ)在云服務(wù)器中,海量數(shù)據(jù)的價(jià)值吸引了更多的攻擊,最終導(dǎo)致用戶失去對(duì)數(shù)據(jù)的控制,數(shù)據(jù)公開和對(duì)數(shù)據(jù)分析不斷增長(zhǎng)的需求也增加了對(duì)數(shù)據(jù)隱私的侵犯和攻擊[3]。

      對(duì)于數(shù)據(jù)隱私保護(hù)的方法分為密碼技術(shù)和非密碼技術(shù)[4],密碼技術(shù)中常用的方法有身份認(rèn)證、基于屬性的憑證和k匿名方法等[5-6]。隱私保護(hù)的兩個(gè)主要模型是k匿名和差分隱私模型,許多其他模型都是從這兩種模型發(fā)展而來的。k匿名保護(hù)個(gè)人和數(shù)據(jù)隱私的方式是隱藏公開信息與個(gè)人之間的對(duì)應(yīng)關(guān)系,更適合保護(hù)隱私的數(shù)據(jù)發(fā)布。目前對(duì)于k匿名方法的研究一直在繼續(xù)。汪小寒等[7]提出了Top-Down grid位置敏感哈希k匿名隱私保護(hù)方法,通過采用位置敏感哈希函數(shù)的Top-Down grid網(wǎng)格劃分方法選擇待匿名區(qū)域,使得匿名損失率更小,提高了匿名后的數(shù)據(jù)質(zhì)量。Wang等[8]提出了基于層次分析法的k匿名聚類算法,根據(jù)k單獨(dú)控制聚類,實(shí)現(xiàn)等價(jià)類的均衡劃分,實(shí)現(xiàn)用戶隱私的保護(hù)。Yu等[9]提出了圖形結(jié)構(gòu)感知的層次k匿名技術(shù),根據(jù)圖形結(jié)構(gòu)特征調(diào)整邊緣的隱私處理策略,解決了社交網(wǎng)絡(luò)的隱私保護(hù)。上述模型都提供相同程度的隱私保護(hù),并沒有考慮多敏感度的個(gè)性化隱私保護(hù)需求。

      用戶在現(xiàn)實(shí)生活中對(duì)隱私數(shù)據(jù)的敏感度并不相同,相同敏感度的信息對(duì)不同個(gè)體的重要性也不同,因此需要提供多敏感度的個(gè)性化隱私保護(hù)。曹敏姿等[10]提出了個(gè)性化(α,l)-多樣性k匿名隱私保護(hù)模型,設(shè)置相應(yīng)的約束條件對(duì)敏感屬性的取值劃分類別,增強(qiáng)隱私保護(hù)能力。Li等[11]提出了長(zhǎng)期觀察感知虛擬選擇的位置服務(wù)k匿名方法。文獻(xiàn)[12-13]是針對(duì)敏感值的個(gè)性化匿名服務(wù),Wu等[12]通過涵蓋敏感主題以保護(hù)個(gè)性化推薦中的個(gè)人隱私。以上個(gè)性化隱私方法忽略了用戶敏感度對(duì)隱私的影響。Ashoka等[13]以記錄所有者端的敏感性標(biāo)志形式考慮隱私要求,以及數(shù)據(jù)挖掘者最終的應(yīng)用特定要求個(gè)性化隱私保護(hù)。Lin等[14]的(k,p)匿名框架,不僅隱藏了多個(gè)敏感信息,還隱藏了個(gè)人敏感信息。但是這些敏感值匿名方法忽略了不同個(gè)人的細(xì)粒度要求。另外以上匿名模型都是針對(duì)傳統(tǒng)數(shù)據(jù)量的處理,對(duì)于海量數(shù)據(jù)的處理效率并不高。

      針對(duì)以上問題,本文提出一種針對(duì)大數(shù)據(jù)的多維敏感度的最佳k值匿名框架,在MapReduce域中,支持多個(gè)用戶的多維敏感度、細(xì)粒度訪問。數(shù)據(jù)被分成幾個(gè)組,并且對(duì)于每個(gè)組,應(yīng)用不同的匿名化級(jí)別,這取決于用戶的訪問級(jí)別。該方法通過中斷值方程,根據(jù)數(shù)據(jù)累積頻率(cumulative frequency,CF)方程得出最佳k值,最后通過驗(yàn)證服務(wù)、初始化服務(wù)和匿名服務(wù),實(shí)現(xiàn)最終的多維敏感度的最佳k值細(xì)粒度大數(shù)據(jù)匿名保護(hù)。

      1 匿名過程的MSOkA分組

      1.1 敏感度等級(jí)計(jì)算

      MSOkA采用準(zhǔn)標(biāo)識(shí)符(Quasi-identifier,QI)概率進(jìn)行匿名,概率值來自分類樹概念,分類樹T從父節(jié)點(diǎn)w傳播到葉子v,每個(gè)父節(jié)點(diǎn)的概率為P(w)=1/v,如果在最小值Vmin和最大值Vmax的間隔內(nèi)出現(xiàn)一個(gè)數(shù)n,則在該間隔范圍內(nèi)獲得該數(shù)的概率為P(n)=1/(Vmin-Vmax),此概率支持多個(gè)用戶的細(xì)粒度訪問。在這種情況下,數(shù)據(jù)被分成多個(gè)組或域,并且對(duì)每個(gè)組應(yīng)用不同的匿名化級(jí)別,這取決于用戶的訪問級(jí)別。匿名化過程通過靈敏度等級(jí)ψ的值來增加或減少從數(shù)據(jù)中獲得的信息,ψ值越高的用戶獲得的信息越多。

      敏感度等級(jí)由敏感度因子ω和老化因子τ這兩個(gè)主要因素決定,設(shè)T表示一個(gè)表,k表示k匿名值。用k′表示給定的所有權(quán)級(jí)別,其值越大,k′表示的所有權(quán)級(jí)別就較低,因此最低的所有權(quán)級(jí)別是由k′=k給出的,0≤k′≤k。較低的k′值意味著較少的匿名性,從而導(dǎo)致較高的所有權(quán)級(jí)別。通過求ω的最大值和最小值來計(jì)算靈敏度系數(shù),最大ω和最小ω定義如下:

      (1)

      ω的值可以在ωmin和ωmax之間找到:

      (2)

      式中:ω表示靈敏度因子;k′表示所有權(quán)級(jí)別。將ω和τ兩項(xiàng)進(jìn)行比較,得出靈敏度方程ψ。

      ψ=|ω+τ|

      (3)

      靈敏度級(jí)別與用戶的訪問級(jí)別成正比,較高的靈敏度級(jí)別導(dǎo)致較高的訪問級(jí)別,因此應(yīng)用較少的匿名化。此外,對(duì)象的靈敏度隨數(shù)據(jù)集年齡的增加而降低。考慮到老化因子的負(fù)值,老化因子τ反向影響靈敏度,數(shù)據(jù)集越老越不敏感。

      1.2 MSOkA分組

      MSOkA將數(shù)據(jù)屬性分類為三個(gè)類別:準(zhǔn)標(biāo)識(shí)符QI、類屬性和非指定屬性,MSOkA分組旨在保護(hù)類屬性和QI屬性中的敏感數(shù)據(jù)。將每?jī)蓚€(gè)、三個(gè)或四個(gè)QI屬性聚合到一個(gè)組中,稱為QI組,這些垂直組對(duì)于將粒度訪問方法應(yīng)用于數(shù)據(jù)授權(quán)至關(guān)重要。此外,MSOkA還將水平聚合技術(shù)應(yīng)用于匿名化過程中,可以通過創(chuàng)建四種不同類型的組來實(shí)現(xiàn),即:G組、完全平等組(Fully equal groups,FEG)、半等價(jià)組(Semi-equivalent group,SEG)和非等價(jià)組(Non-equivalent group,NEG)。G組最初是通過根據(jù)類值篩選數(shù)據(jù)元組來創(chuàng)建的,如果類值為4,則創(chuàng)建4個(gè)G組,依此類推。

      每個(gè)QI組可以由2~4個(gè)QI屬性表示,通過實(shí)現(xiàn)五個(gè)主要階段來實(shí)現(xiàn)數(shù)據(jù)的匿名化。階段0是過濾步驟,根據(jù)明顯的猜測(cè)對(duì)所有數(shù)據(jù)記錄進(jìn)行過濾,旨在排除僅包含一個(gè)類的完全相似的組。考慮到每個(gè)相似組的記錄數(shù)必須大于給定的所有權(quán)級(jí)別值k′,階段0從分組等效記錄開始,將每個(gè)等價(jià)組(按已知)發(fā)送到用戶定義函數(shù)程序,該程序?qū)Ⅱ?yàn)證數(shù)據(jù)包是否為明顯的猜測(cè)類型。如果是明顯的猜測(cè),那么將被存儲(chǔ)為第2階段,而其余的記錄將被存儲(chǔ)為第1階段。第1階段通過創(chuàng)建G組后聚合數(shù)據(jù)來分離完全等效的記錄。

      創(chuàng)建G組后,階段1開始分別處理每個(gè)G組,檢查完全等效的記錄,完全等效的記錄存儲(chǔ)在FEG組中,而其余的記錄存儲(chǔ)在SEG1組中。在第2階段中,如前面所述,對(duì)SEG1進(jìn)行半等價(jià)測(cè)試。小于k′的記錄數(shù)將存儲(chǔ)在SEG2組中,大于k′的記錄將由用戶定義函數(shù)程序匿名存儲(chǔ),并在完成匿名化后存儲(chǔ)在FEG組中。在第3階段,通過再次測(cè)試SEG2是否具有半等效性和匿名性,而非等效記錄存儲(chǔ)在NEG組中。在第4階段中,NG由一個(gè)QI屬性進(jìn)行測(cè)試,并進(jìn)行匿名,存儲(chǔ)在SEG組中。最后,小于k′的記錄編號(hào)完全抑制并存儲(chǔ)在SEG中。

      2 匿名過程的MSOkA和細(xì)粒度訪問控制

      2.1 基于累積頻率的最佳k值方法

      通常,數(shù)據(jù)所有者需要許多實(shí)驗(yàn)才能得到確定導(dǎo)致信息損失最小的最低k值,面對(duì)大數(shù)據(jù)環(huán)境,則需要更多的計(jì)算時(shí)間和成本。MSOkA提出了累積頻率的最佳k值確定方法,大大減少了計(jì)算時(shí)間和成本。另外,分配較小的k值所帶來的安全風(fēng)險(xiǎn)會(huì)增加,特別是當(dāng)數(shù)據(jù)集包含多個(gè)QI組時(shí)。然而,較大的k值可能會(huì)對(duì)獲得信息的有用性產(chǎn)生負(fù)面影響,需要將這種數(shù)據(jù)降級(jí)控制在最低限度,因此,需要確定最佳k值,在安全級(jí)別和獲得的信息級(jí)別之間進(jìn)行權(quán)衡。

      允許等效記錄的最小數(shù)量為2(k′=2),此最小值達(dá)到安全閾值以防止唯一標(biāo)識(shí),基于這一事實(shí),可以根據(jù)每一個(gè)kperc值指定k值,如前所述,kperc允許的最小值為0.1。由于k′=kperc×k,且k′=2,則k值應(yīng)至少為20,可以從k=20開始增加k的值,因?yàn)榈陀?0的k可能會(huì)對(duì)數(shù)據(jù)隱私產(chǎn)生負(fù)面影響,從而破壞k匿名性原則。具有多個(gè)QI組的數(shù)據(jù)集應(yīng)分配有較大的k值,這是指在QI組中跨組唯一標(biāo)識(shí)符(Across Groups Unique Identifiers,AGUI)值的急劇增加,AGUI是匿名化后出現(xiàn)的唯一記錄,由于記錄與其他記錄等效,因此該記錄不是匿名的,它的唯一性出現(xiàn)在多個(gè)QI組中,并在單個(gè)QI組中消失。面對(duì)AGUI攻擊,可通過增加每個(gè)QI組的k值來實(shí)現(xiàn)解決AGUI問題。為了為每個(gè)QI組選擇較大的k值,同時(shí)使得所選k不會(huì)對(duì)所獲得信息產(chǎn)生較大負(fù)面影響,根據(jù)中斷測(cè)量方程,設(shè)計(jì)了累積頻率方程,中斷測(cè)量用于衡量匿名化后信息有用性的降級(jí)百分比,如下所示:

      (4)

      式中:i表示匿名數(shù)據(jù)塊數(shù);N是一個(gè)匿名數(shù)據(jù)塊中數(shù)據(jù)記錄的個(gè)數(shù),M≤N;∏P[QI]是用于匿名每個(gè)QI組的概率因子。

      在hadoop大數(shù)據(jù)分析平臺(tái)的Pig Latin腳本中,快速計(jì)算腳本將所有等效記錄分組,然后對(duì)分組記錄進(jìn)行過濾,每個(gè)k值的非等效記錄數(shù)是累加的,因此,可以根據(jù)非等效記錄的數(shù)量來計(jì)算累積頻率CF,可通過中斷測(cè)量和檢查點(diǎn)計(jì)算CF,如下所示:

      (5)

      中斷值隨著k值的增加而增加,通過k的檢查點(diǎn)得到中斷值,選擇四個(gè)檢查點(diǎn)kmax、kmin、kold、knew,Dx表示對(duì)應(yīng)檢查點(diǎn)的中斷值。

      如果0.9≤CF(knew)≤1.1,則經(jīng)過檢驗(yàn)的knew被批準(zhǔn),與數(shù)據(jù)中斷的線性增加相比,允許數(shù)據(jù)分散的范圍為0.2。該等式被公式化以減少由于使用較大的k值對(duì)數(shù)據(jù)進(jìn)行匿名化而發(fā)生的信息丟失。對(duì)于初始化k值,可以根據(jù)數(shù)據(jù)的累積頻率逐漸增加,CF方程可以在合理的計(jì)算時(shí)間內(nèi)有效地獲得k值。

      2.2 MSOkA的訪問控制

      MSOkA框架在聯(lián)合身份驗(yàn)證服務(wù)(Federation Service,FS)和服務(wù)提供者(Service Provider,SP)之間進(jìn)行鏈接,包含了三個(gè)部分:核心服務(wù)部分、初始化服務(wù)部分和匿名服務(wù)部分。核心服務(wù)位于FS端,而初始化服務(wù)和匿名服務(wù)都位于SP端。所提框架由四個(gè)主服務(wù)器組成:FS服務(wù)器、SP網(wǎng)關(guān)服務(wù)器、Kerberos/LDAP服務(wù)器和Hadoop NameNode服務(wù)器。用戶被定義為嘗試訪問Hadoop域以進(jìn)行數(shù)據(jù)分析的任何用戶,可以是數(shù)據(jù)所有者或來自任何外部組織的客戶,外部客戶必須得到數(shù)據(jù)所有者的批準(zhǔn)。FS和SP網(wǎng)關(guān)通過安全斷言標(biāo)記語言SAML語言進(jìn)行鏈接,用于SP和FS之間的數(shù)據(jù)傳輸。匿名服務(wù)在SP網(wǎng)關(guān)和NameNode服務(wù)器之間運(yùn)行。LDAP/Kerberos服務(wù)器為Hadoop域提供域名服務(wù)和安全操作。MSOkA框架如圖1所示。

      圖1 MSOkA框架

      核心服務(wù)為多訪問用戶級(jí)別提供身份驗(yàn)證和授權(quán)。該服務(wù)的目的是識(shí)別QI組和類,為它們提供k匿名值,將其映射到業(yè)務(wù)角色,以及將角色委派給組織。每2~4個(gè)QI屬性和一個(gè)類被分配給一個(gè)組,所選擇的QI組和一個(gè)類不一定在一個(gè)表中。該服務(wù)部分框架如圖2所示。

      圖2 核心服務(wù)框架

      初始化服務(wù)提供初始文檔以準(zhǔn)備匿名化數(shù)據(jù)。SP需要在SP-Gateway服務(wù)器中為數(shù)據(jù)所有者提供有效的目錄路徑,數(shù)據(jù)所有者需要通過該路徑上載大數(shù)據(jù)文件。在NameNode服務(wù)器上載的每個(gè)大數(shù)據(jù)都必須提供一組必要的文檔,以支持匿名化過程。大數(shù)據(jù)文件包括一個(gè)用于定義每個(gè)數(shù)據(jù)集的XML文件、一個(gè)文件匿名程序,以及用于分類法樹屬性的任何XML文件。SP網(wǎng)關(guān)服務(wù)器通過SAML服務(wù)器與FS通信,用戶生成SAML斷言的XML文件,該文件包含文件屬性部分的登錄和匿名化信息。屬性部分包含以下信息:用戶id、數(shù)據(jù)庫id、k′值、靈敏度級(jí)別ψ和數(shù)據(jù)狀態(tài)。數(shù)據(jù)狀態(tài)由兩個(gè)不同的值組成:保留或刪除,數(shù)據(jù)狀態(tài)定義相同用戶匿名數(shù)據(jù)上一個(gè)副本的有效性,此決定是基于用戶的最后一次登錄時(shí)間在FS端做出的,如果數(shù)據(jù)狀態(tài)為刪除,則匿名數(shù)據(jù)將被刪除,并開始新的匿名過程。

      匿名服務(wù)在SP網(wǎng)關(guān)和NameNode之間運(yùn)行。該服務(wù)將初始化服務(wù)從SP網(wǎng)關(guān)輸出傳輸?shù)絟adoop域NameNode,然后匿名服務(wù)在hadoop域中執(zhí)行匿名腳本,該域由LDAP/Kerberos服務(wù)器控制,在hadoop域訪問之前為用戶提供身份驗(yàn)證和授權(quán)服務(wù)。此外,Kerberos還支持hadoop服務(wù)的票證授予。匿名服務(wù)執(zhí)行嵌入在Web編程中的shell命令,使用新的Web編程擴(kuò)展和庫,保證了程序執(zhí)行的安全。

      LDAP服務(wù)使用從user_id派生的用戶名來創(chuàng)建身份驗(yàn)證標(biāo)識(shí),user_id已通過SAML斷言文件從FS發(fā)送到SP。用戶名是在第一次訪問時(shí)創(chuàng)建的,并帶有一個(gè)隨機(jī)的復(fù)雜密碼,因此用戶可以訪問NameNode,創(chuàng)建的帳戶應(yīng)對(duì)創(chuàng)建的輸入和輸出HDFS存儲(chǔ)目錄擁有完全權(quán)限。首次訪問時(shí),將觸發(fā)shell命令行以創(chuàng)建輸入和輸出HDFS目錄,并為創(chuàng)建的user_id提供完全訪問權(quán)限。最后,如果數(shù)據(jù)(status=remove)則執(zhí)行匿名Pig腳本。

      3 實(shí) 驗(yàn)

      為了驗(yàn)證所提框架的有效性,將本文框架和其他方法進(jìn)行對(duì)比實(shí)驗(yàn)。實(shí)驗(yàn)由五臺(tái)虛擬機(jī)組成,其中hadoop域有一個(gè)NameNode和兩個(gè)DataNodes,一個(gè)SP-Gateway服務(wù)器和一個(gè)LDAP/Kerberos服務(wù)器組成。核心服務(wù)是在個(gè)人計(jì)算機(jī)上設(shè)置的,并使用MySQL數(shù)據(jù)庫和PHP語言創(chuàng)建,SAML服務(wù)器被設(shè)置在個(gè)人計(jì)算機(jī)和SP-Gateway上,通過在本地PC、FS和虛擬機(jī)SP-Gateway的兩端實(shí)現(xiàn)SAML,將用戶的屬性嵌入到XML斷言中。創(chuàng)建了一個(gè)名為A的組織,委派給三個(gè)不同的角色,分別為:kperc=40%(映射到QI1)的人力資源員工、kperc=40%(映射到QI2)的腫瘤科醫(yī)生、kperc=60%(映射到兩個(gè)QI組)的醫(yī)院管理者。此外,還創(chuàng)建了三個(gè)具有以下角色的用戶:user1(人力資源員工)、user2(腫瘤科醫(yī)生)和user3(醫(yī)院管理者)。實(shí)驗(yàn)數(shù)據(jù)集采用Seer Cancer數(shù)據(jù)集,其中一些記錄為N=60 803 185。

      粒度原則促進(jìn)了匿名數(shù)據(jù)級(jí)別與獲得信息之間的權(quán)衡。如果不污染主要獲得的信息,則將QI分組以增強(qiáng)訪問控制方法。所提框架通過選擇一個(gè)適中的最佳k值,可以減少AGUI安全攻擊,同時(shí)又不會(huì)降低信息的有用性。圖3給出了k值的選擇與中斷值和AGUI數(shù)量的關(guān)系,其中,中斷值反映了信息損失量,AGUI數(shù)量反映了隱私保護(hù)程度。實(shí)驗(yàn)中使用uer3賬戶,因此基于kperc=60%對(duì)數(shù)據(jù)進(jìn)行匿名化,計(jì)算了每個(gè)值的AGUI數(shù),并比較了兩個(gè)QI組的中斷級(jí)別和所有記錄中出現(xiàn)的AGUI數(shù)量。

      圖3 不同k值的中斷值和AGUI數(shù)量

      可以看出,對(duì)于兩個(gè)QI組,在較大的k值上中斷值略微增加,但AGUI數(shù)量出現(xiàn)了顯著下降,說明可以通過將k值增加到某個(gè)水平來減少AGUI數(shù)量。當(dāng)k=27時(shí)可以輸出較少的匿名信息損失以及較少的AGUI減少影響,在有限的信息損失下,提高隱私保護(hù)程度。

      需要測(cè)試粒度訪問及其對(duì)明顯猜測(cè)攻擊記錄數(shù)量的影響,在本實(shí)驗(yàn)中,分別使用user1和user2來訪問每個(gè)QI組。很明顯,單個(gè)組訪問權(quán)限不會(huì)面臨任何AGUI問題,然而,即使只有一個(gè)QI組,明顯的猜測(cè)攻擊仍然是一個(gè)障礙。圖4給出了兩個(gè)QI組的中斷值和明顯猜測(cè)數(shù)量。

      圖4 不同k值的中斷值和明顯猜測(cè)數(shù)量

      可以看出,較低的k值增加了明顯猜測(cè)記錄的數(shù)量,因此,選擇一個(gè)最優(yōu)k對(duì)于在低中斷級(jí)別和低數(shù)量的明顯猜測(cè)記錄之間折中是至關(guān)重要的。當(dāng)k取值在24~36之間時(shí),可以得到中斷最小值和明顯猜測(cè)最小值。兩個(gè)實(shí)驗(yàn)可以對(duì)所提MSOkA框架中尋找最優(yōu)k進(jìn)行驗(yàn)證。

      為了驗(yàn)證MSOkA框架的有效性,將其與其他方法進(jìn)行比較,包括文獻(xiàn)[9]的基于層次分析法的k匿名聚類算法、文獻(xiàn)[10]的個(gè)性化(α,l)-多樣性k匿名隱私保護(hù)模型、文獻(xiàn)[14]的(k,p)匿名框架,從敏感值識(shí)別率和運(yùn)行時(shí)間兩個(gè)指標(biāo)進(jìn)行比較。圖5給出了不同k值下敏感值識(shí)別率對(duì)比,圖6給出了不同數(shù)據(jù)集規(guī)模下運(yùn)行時(shí)間對(duì)比結(jié)果。

      由圖5可以看出,隨著k值的增加,敏感值識(shí)別率降低,但是MSOkA框架具有最低的敏感值識(shí)別率,隱私保護(hù)最好。這是因?yàn)楸疚目蚣芡ㄟ^敏感值進(jìn)行權(quán)限分級(jí),進(jìn)行QI分組,支持多個(gè)用戶多維敏感度的細(xì)粒度訪問,加強(qiáng)了隱私保護(hù)力度。由圖6可以看出,隨著數(shù)據(jù)集規(guī)模的增加,所有方法的執(zhí)行時(shí)間都增加,所提MSOkA框架具有最低的執(zhí)行時(shí)間,并且隨著數(shù)據(jù)集的增加,執(zhí)行時(shí)間增加幅度最小。這是因?yàn)榭蚣芸梢酝ㄟ^累積頻率快速找到最佳k值,且核心服務(wù)部分、初始化服務(wù)部分和匿名服務(wù)部分都是在hadoop域?qū)崿F(xiàn),大大降低了執(zhí)行時(shí)間。

      4 結(jié) 語

      針對(duì)多用戶訪問的大數(shù)據(jù)隱私保護(hù),提出一種多維敏感度最佳k值匿名框架,該模型利用MapReduce性能和可伸縮性,有效實(shí)現(xiàn)大數(shù)據(jù)環(huán)境下用戶隱私、快速訪問。根據(jù)敏感值對(duì)用戶訪問級(jí)別分層,通過累積頻率找到最佳k值,在hadoop域進(jìn)行MSOkA框架的核心服務(wù)部分、初始化服務(wù)部分和匿名服務(wù),實(shí)現(xiàn)大數(shù)據(jù)細(xì)粒度、快速訪問。實(shí)驗(yàn)結(jié)果表明,所提MSOkA框架能夠快速找出最佳k值,在k=27時(shí),能夠在信息損失量和AGUI數(shù)量得到權(quán)衡,在24~36范圍內(nèi),框架能夠在信息損失量和明顯猜測(cè)數(shù)量得到權(quán)衡,實(shí)現(xiàn)用戶多維敏感度、細(xì)粒度隱私保護(hù)。另外,MSOkA框架在敏感值識(shí)別率和執(zhí)行時(shí)間要低于其他方法,驗(yàn)證了本文方法的有效性與優(yōu)越性。

      猜你喜歡
      中斷級(jí)別敏感度
      痘痘分級(jí)別,輕重不一樣
      全體外預(yù)應(yīng)力節(jié)段梁動(dòng)力特性對(duì)于接縫的敏感度研究
      電視臺(tái)記者新聞敏感度培養(yǎng)策略
      新聞傳播(2018年10期)2018-08-16 02:10:16
      邁向UHD HDR的“水晶” 十萬元級(jí)別的SIM2 CRYSTAL4 UHD
      新年導(dǎo)購手冊(cè)之兩萬元以下級(jí)別好物推薦
      跟蹤導(dǎo)練(二)(5)
      千里移防,衛(wèi)勤保障不中斷
      解放軍健康(2017年5期)2017-08-01 06:27:44
      你是什么級(jí)別的
      在京韓國留學(xué)生跨文化敏感度實(shí)證研究
      Diodes高性能汽車霍爾效應(yīng)閉鎖提供多種敏感度選擇
      灵璧县| 二手房| 和田县| 阿拉善右旗| 洱源县| 社旗县| 沂水县| 元氏县| 卢氏县| 汉阴县| 西盟| 漳浦县| 金秀| 本溪市| 杂多县| 岫岩| 琼海市| 博乐市| 遂川县| 济宁市| 巫溪县| 延川县| 永昌县| 香港| 北辰区| 庄河市| 分宜县| 盱眙县| 虹口区| 松溪县| 昭通市| 龙泉市| 沙坪坝区| 颍上县| 苗栗市| 德化县| 望都县| 固镇县| 平阴县| 密云县| 墨竹工卡县|