• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于差分隱私的線性回歸分析

      2016-06-06 13:41:36王寶楠方賢進(jìn)
      電腦知識與技術(shù) 2016年6期
      關(guān)鍵詞:線性回歸隱私保護(hù)回歸分析

      王寶楠++方賢進(jìn)

      摘要:隨著數(shù)據(jù)分析和發(fā)布等應(yīng)用需求的出現(xiàn)和發(fā)展,如何保護(hù)隱私數(shù)據(jù)和防止敏感信息泄露成為當(dāng)前面臨的重大挑戰(zhàn)。文中對差分隱私保護(hù)技術(shù)的基本原理和特征進(jìn)行了闡述,重點介紹差分隱私下拉普拉斯機(jī)制的線性回歸分析技術(shù),它既保護(hù)了用戶的隱私信息,又不影響數(shù)據(jù)的可用性,達(dá)到了研究目的。在對已有技術(shù)深入對比分析的基礎(chǔ)上,指出了差分隱私保護(hù)技術(shù)的未來發(fā)展方向。

      關(guān)鍵詞:差分隱私;隱私保護(hù),回歸分析,線性回歸

      中圖分類號:TP309 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2016)06-0026-04

      Based on Differential Privacy of Linear Regression Analysis

      WANG Bao-Nan,F(xiàn)ANG Xian-jing

      (Department of computer,Anhui University of Science and Technology ,Huainan 232001 ,China)

      Abstract: With the emergence and development of data analysis and publishing applications, and how to protect the privacy of data and prevent sensitive information leaks has become a major challenge currently facing. In this paper the basic principles and characteristics of differential privacy protection technologies are described, linear regression analysis focuses on privacy under Laplace differential mechanism, both to protect the user's privacy, without affecting the availability of data, to achieve the purpose .In contrast to the prior art in-depth analysis, based on the difference it pointed out the future direction of development of privacy-enhancing technologies.

      Key words: differential privacy; privacy protection; regression analysis; linear Regression

      1 引言

      信息化社會的發(fā)展進(jìn)步使得部分機(jī)構(gòu)可以獲得大量個人和組織的數(shù)據(jù)信息進(jìn)行數(shù)據(jù)挖掘與分析研究,從而帶來商業(yè)價值和科研價值。例如各大商場的顧客購物數(shù)據(jù)和證券公司個人交易數(shù)據(jù)的分析與統(tǒng)計等。但是,這些數(shù)據(jù)涉及的大量個人隱私信息的數(shù)據(jù)發(fā)布和分析都面臨著隱私泄露問題。因此, 隱私保護(hù)問題已成為重要的研究課題。隱私保護(hù)技術(shù)可以解決個人和組織的數(shù)據(jù)發(fā)布和數(shù)據(jù)分析帶來的隱私安全問題。如何發(fā)布數(shù)據(jù)而又不泄露隱私信息是隱私保護(hù)技術(shù)的主要目的。

      當(dāng)前,差分隱私成為一種新的隱私保護(hù)技術(shù),差分隱私保護(hù)是通過添加特定的噪聲使得數(shù)據(jù)失真來達(dá)到隱私保護(hù)的目的。與傳統(tǒng)的隱私保護(hù)技術(shù)相似,差分隱私保護(hù)技術(shù)的實施主要考慮兩個因素:(1)怎樣保證算法的設(shè)計符合差分隱私的定義,從而確保隱私數(shù)據(jù)不被泄露;(2)怎樣減少噪聲帶來的誤差,從而提高數(shù)據(jù)的可靠性。

      文獻(xiàn)[13]借鑒基于差分隱私下拉普拉斯機(jī)制與邏輯回歸方法提出一種[ω*]的計算方法 LP Log,此方法先求出[ω*]。然后再往數(shù)據(jù)中添加拉普拉斯噪音,然而由于回歸分析的輸入與輸出有緊密的關(guān)聯(lián)性,使得敏感度非常高,最后導(dǎo)致預(yù)測精度比較低。文獻(xiàn)[14]提出了一種對目標(biāo)函數(shù)直接擾動的方法,該方法是對元組目標(biāo)函數(shù)的均值添加噪音。

      上述2種回歸分析方法均存在各自的不足。第一種回歸分析方法,它的回歸分類精確度比較低,噪音誤差比較高;第二種方法缺陷在于,基于擾動機(jī)制的回歸分析方法目前只適用于特定的目標(biāo)函數(shù),存在一定的局限性。針對這些缺陷,本文提出基于拉普拉斯機(jī)制的線性回歸分析。

      2 差分隱私保護(hù)

      2.1 差分隱私

      差分隱私保護(hù)通過向數(shù)據(jù)中添加噪聲使敏感數(shù)據(jù)失真,而部分?jǐn)?shù)據(jù)或數(shù)據(jù)屬性保持不變。差分隱私保護(hù)技術(shù)可以達(dá)到這樣一個效果,即在用戶數(shù)據(jù)中增加或減少一個記錄數(shù)據(jù),不會影響數(shù)據(jù)的輸出結(jié)果,不影響數(shù)據(jù)的有效性與可靠性。即使在最壞的情況下,如果攻擊者知道數(shù)據(jù)中除一條記錄數(shù)據(jù)之外的所有數(shù)據(jù)信息,仍可以做到保證這一條數(shù)據(jù)信息不被泄露的效果。

      5 結(jié)論

      本文介紹差分隱私的相關(guān)概念以及隱私保護(hù)的重要性。重點研究了差分隱私保護(hù)下拉普拉斯機(jī)制的線性回歸分析。首先,設(shè)計相關(guān)算法; 其次,給每一個多項式系數(shù)添加[Lap(2(d+1)2/ε)]噪音,最后在運(yùn)行噪音目標(biāo)函數(shù)中優(yōu)化[ω]。最后,發(fā)布噪音數(shù)據(jù)。實驗運(yùn)行結(jié)果顯示,隨著隱私預(yù)算增加,誤差率越小,數(shù)據(jù)可用性較好,實現(xiàn)了數(shù)據(jù)的隱私保護(hù)。線性回歸分析比較簡單,因為目標(biāo)函數(shù)就是[ω]多項式本身。差分隱私將是未來一個長期研究的課題,將其應(yīng)用到回歸分析中,尚有很多需要改進(jìn)的地方,這是筆者下一步研究的方向。

      參考文獻(xiàn):

      [1] 李楊,溫雯,謝光強(qiáng).差分隱私保護(hù)研究綜述[J].計算機(jī)應(yīng)用研究,2012,29(9) : 3201.

      [2] DWORK C.A firm foundation for private data analysis[J].Communications of the ACM,2011,54( 1) : 86-95.

      [3] Dwork C,McSherry F,Nissim K,Smith A. Calibrating Noise to Sensitivity in Private Data Analysis[C]/ /Proceedings of the 3th Theory of Cryptography Conference ( TCC) . New York,USA,2006: 363-385.

      [4] DWORK C.The differential privacy frontier[C]/ /Proc of the 6th International Conference on Theory of Cryptography Conference.Berlin: Springer - Verlag,2009: 496-502.

      [5] J. Zhang, X. Xiao, Y. Yang, and et al.. PrivGene: differentially private model fitting using genetic algorithms. SIGMOD, 2013.

      [6] Zhang J, Zhang Z, Xiao X, et al. Functional mechanism: Regression analysis under differential privacy[C]/ /Proceedings of the 38th Conference of Very Large Databases(VLDB).Istanbul,Turkey,2012:1364-1375.

      [7] C. Dwork. A firm foundation for private data analysis.Commun.ACM,2011,54(1) : 86 – 95.

      [8] B. Fung,K. Wang,R. Chen,et al. Privacy - preserving data publishing: A survey of recent developments[J].ACMi.Computing Surveys ( CSUR) ,2010,42(4) : 18.

      [9] DWORK C.Differential privacy: a survey of results[C]/ / Proc of the 5th International Conference on Theory and Applicationa of Models of Computation. Berlin: Springer -Verlag,2008: 1-9.

      [10] DWORK C.The promise of differential privacy: a tutorial on algorithmic techniques [C]/ /Proc of the 52nd Annual IEEE Symposium on Foundation of Computer Science.Washington DC: IEEE Computer Society,2011:1-2.

      [11] Dwork C,McSherry F,Nissim K,Smith A. Calibrating Noise to Sensitivity in Private Data Analysis[C]/ /Proceedings of the 3th Theory of Cryptography Conference ( TCC) . New York,USA,2006: 363-385.

      [12] McSherry F,Talwar K. Mechanism Design via Differential Privacy[C]/ /Proceedings of the 48th Annual IEEE Symposium on Foundations of Computer Science ( FOCS) .Providence,RI,USA,2007: 94 -103.

      [13] Smith A. Privacy-preserving statistical estimation with optimal convergence rate[C].Proceedings on the 43th Annual ACM Symposium on Theory of Computing(STOC).2011:813-822.

      [14] Chaudhuri K,Monteleoni C. Privacy-preserving logistic regression[C].Proceedings of the 20th Annual Conference on Neural Information ProcessingSystem(NIPS).Vancouver,British Columbia,Canada,2008:289-296.

      猜你喜歡
      線性回歸隱私保護(hù)回歸分析
      國道公路養(yǎng)護(hù)管理與規(guī)劃研究
      大數(shù)據(jù)環(huán)境下用戶信息隱私泄露成因分析和保護(hù)對策
      大數(shù)據(jù)安全與隱私保護(hù)的必要性及措施
      基于變形監(jiān)測的金安橋水電站壩體穩(wěn)定性分析
      價值工程(2016年29期)2016-11-14 01:56:12
      社交網(wǎng)絡(luò)中的隱私關(guān)注及隱私保護(hù)研究綜述
      大數(shù)據(jù)時代的隱私保護(hù)關(guān)鍵技術(shù)研究
      森林碳匯影響因素的計量模型研究
      中國市場(2016年33期)2016-10-18 13:00:47
      河北省城鎮(zhèn)居民人均可支配收入與消費統(tǒng)計分析
      商(2016年27期)2016-10-17 05:53:09
      河南省經(jīng)濟(jì)增長質(zhì)量與創(chuàng)新能力關(guān)系的實證分析
      影響上市公司股票價格的微觀因素分析
      商(2016年13期)2016-05-20 09:12:44
      江油市| 宜宾县| 永修县| 衡山县| 育儿| 长寿区| 紫金县| 葫芦岛市| 新营市| 高邮市| 云浮市| 清水县| 濉溪县| 宜都市| 布尔津县| 双鸭山市| 塔河县| 白河县| 富裕县| 河西区| 赤水市| 天津市| 海口市| 全南县| 榆中县| 丰都县| 冀州市| 舒城县| 峨眉山市| 普兰县| 三河市| 光山县| 苍梧县| 金华市| 屏东县| 汝南县| 临潭县| 阳曲县| 防城港市| 甘谷县| 桦川县|