陸雪梅 古春生
〔摘要〕針對(duì)大數(shù)據(jù)環(huán)境下用戶信息隱私泄露問題,論文首先分析當(dāng)前用戶信息隱私保護(hù)的現(xiàn)狀與趨勢(shì),并指出當(dāng)前用戶信息隱私保護(hù)存在的問題;然后通過典型案例、統(tǒng)計(jì)分析和系統(tǒng)分析等手段,研究大數(shù)據(jù)環(huán)境下用戶信息隱私泄露的發(fā)生機(jī)制和成因;最后聚焦用戶信息隱私泄露的成因,分析研究用戶信息隱私保護(hù)的關(guān)鍵社會(huì)方法與技術(shù)方法,并構(gòu)建用戶信息隱私保護(hù)的社會(huì)技術(shù)模型以及優(yōu)化策略。
〔關(guān)鍵詞〕大數(shù)據(jù);用戶信息;隱私泄露;成因分析;隱私保護(hù)
DOI:10.3969/j.issn.1008-0821.2016.11.012
〔中圖分類號(hào)〕G25076〔文獻(xiàn)標(biāo)識(shí)碼〕A〔文章編號(hào)〕1008-0821(2016)11-0066-05
〔Abstract〕For the problem of user information privacy disclosure in the big data environment,the paper firstly analyzed the status quo and trends of the user information privacy protection,and presented current problems of user information privacy.Then through typical cases,statistical analysis and system analysis,the paper researched generating mechanism and causes of user information privacy disclosure in the big data environments.Finally,focusing on causes of user information privacy disclosure,the paper analyzed key social methods and key technical methods of user privacy preserving,and built social technology model and optimization strategies of user information privacy preserving.
〔Key words〕big data;user information;privacy disclosure;privacy preserving;causes analysis
大數(shù)據(jù)(Big Data)是指所涉及的數(shù)據(jù)量規(guī)模巨大以致無法通過人工在合理時(shí)間內(nèi)達(dá)到收集、處理、并整理成為人類所能解讀的信息。大數(shù)據(jù)來源于物理社會(huì)和網(wǎng)絡(luò)社會(huì),由運(yùn)營(yíng)式系統(tǒng)被動(dòng)、互聯(lián)網(wǎng)系統(tǒng)主動(dòng)、感知式系統(tǒng)自動(dòng)3種方式產(chǎn)生[1]。大數(shù)據(jù)時(shí)代已經(jīng)到來,據(jù)Gartner公司估計(jì),互聯(lián)網(wǎng)上的數(shù)據(jù)量每?jī)赡陼?huì)翻一番,互聯(lián)網(wǎng)上新產(chǎn)生的數(shù)據(jù)量達(dá)到667EB(1EB=109GB)。
科學(xué)技術(shù)是一把雙刃劍。一方面大數(shù)據(jù)已經(jīng)在商業(yè)、傳媒、政府等很多領(lǐng)域得到有價(jià)值的應(yīng)用。2009年谷歌公司準(zhǔn)確預(yù)測(cè)了美國(guó)甲型H1N1流感暴發(fā)是大數(shù)據(jù)應(yīng)用的一個(gè)經(jīng)典案例。谷歌通過分析大量用戶的搜索記錄,比如“咳嗽”、“發(fā)燒”等特定詞條,并根據(jù)查詢服務(wù)器日志的IP地址判定搜索來源,從而準(zhǔn)確預(yù)測(cè)世界各地流感傳播趨勢(shì),和官方機(jī)構(gòu)相比,谷歌能提前14天預(yù)測(cè)流感暴發(fā),預(yù)測(cè)結(jié)果與官方數(shù)據(jù)的相關(guān)性高達(dá)97%[2]。另一方面大數(shù)據(jù)所引發(fā)的隱私安全問題與其帶來的價(jià)值同樣引人矚目。近年來侵犯用戶個(gè)人隱私案件時(shí)有發(fā)生,如2010年360公司泄露上億用戶名和密碼、2011年谷歌泄露個(gè)人隱私事件、CSDN開發(fā)者社區(qū)泄露600萬用戶賬號(hào)及明文密碼、2012年1 200萬個(gè)蘋果設(shè)備信息泄露事件、2013年騰訊泄露7 000萬QQ群和12億個(gè)QQ號(hào)數(shù)據(jù)、2014年初春運(yùn)售票首日12306網(wǎng)站即發(fā)生登錄串號(hào)泄露旅客信息、2015年社保系統(tǒng)成為個(gè)人信息泄露的重災(zāi)區(qū)等等,這些事件嚴(yán)重侵犯了用戶的隱私與合法權(quán)益。目前社會(huì)公眾與政府都開始重視個(gè)人隱私問題,如2010年,德國(guó)柏林?jǐn)?shù)千人參加了爭(zhēng)取個(gè)人數(shù)據(jù)隱私的游行;2012年美國(guó)政府號(hào)召公司在使用私人信息時(shí)將更多的控制權(quán)交給用戶;2013年“棱鏡門”事件曝光后,歐盟正在加速制定新版數(shù)據(jù)保護(hù)法案,根據(jù)該法,每個(gè)人有權(quán)要求公司清除他們自己的個(gè)人數(shù)據(jù)。
大數(shù)據(jù)已經(jīng)給用戶信息隱私保護(hù)帶來巨大挑戰(zhàn)。由于大數(shù)據(jù)的跨域聯(lián)系性,導(dǎo)致匿名信息的重新身份化[3],使得人肉搜索成為可能;由于大數(shù)據(jù)的數(shù)據(jù)量大,導(dǎo)致一旦服務(wù)商的服務(wù)器遭到侵襲而可能導(dǎo)致大量用戶私人信息泄露,國(guó)內(nèi)近期發(fā)生的“查開房”就是此類典型案例;非隱私數(shù)據(jù)的整合可能產(chǎn)生敏感的個(gè)人信息[4],如性取向、財(cái)務(wù)狀況等;大數(shù)據(jù)分析結(jié)果可能被濫用[5],如,美國(guó)大規(guī)模槍擊事件已經(jīng)產(chǎn)生試圖確定哪些人有可能采取付諸行動(dòng)的暴力沖動(dòng),這些線索被認(rèn)為存在于Facebook和其他社交媒體中,與一定模式相匹配的任何人都變成了犯罪嫌疑人。
1國(guó)內(nèi)外研究現(xiàn)狀和趨勢(shì)
用戶信息隱私保護(hù)是指任何人無權(quán)收集、加工或使用個(gè)人信息,除非經(jīng)信息主體的自愿同意或從事該行為有法律上的依據(jù)。實(shí)現(xiàn)大數(shù)據(jù)環(huán)境下用戶信息隱私保護(hù),較以往其他安全問題更為棘手[6]。目前解決用戶信息隱私保護(hù)問題的方案主要有社會(huì)方法與技術(shù)方法兩種。
11社會(huì)方法
111隱私保護(hù)立法
國(guó)際上已有50多個(gè)國(guó)家和地區(qū)制定了個(gè)人信息保護(hù)相關(guān)法律法規(guī)和標(biāo)準(zhǔn),規(guī)范社會(huì)、政治、經(jīng)濟(jì)活動(dòng)、網(wǎng)絡(luò)空間中處理個(gè)人信息的行為[7]。立法保護(hù)隱私信息的代表是歐盟。問題是各國(guó)政府對(duì)個(gè)人隱私的剛性邊界難以達(dá)成共識(shí),隱私保護(hù)標(biāo)準(zhǔn)難以統(tǒng)一。美國(guó)官方認(rèn)為在國(guó)際范圍內(nèi)保護(hù)個(gè)人隱私時(shí),不應(yīng)阻礙信息跨境流動(dòng),影響電子商務(wù)和跨境貿(mào)易發(fā)展,希望通過對(duì)隱私保護(hù)采取平衡的規(guī)制方式,創(chuàng)造有利于創(chuàng)新的最佳增長(zhǎng)環(huán)境[8]。因此,目前要想在國(guó)別標(biāo)準(zhǔn)差異的法規(guī)基礎(chǔ)上制定出一套切實(shí)可行的管理規(guī)則還是異常艱難。
112企業(yè)與行業(yè)自律
自律是指信息控制人主動(dòng)單方面地做出信息保護(hù)的承諾,如新浪、360、Google、Baidu等商業(yè)網(wǎng)站都在首頁載明了該網(wǎng)站的“隱私保護(hù)”政策。行業(yè)自律模式的代表是美國(guó)。美國(guó)保護(hù)個(gè)人信息行業(yè)自律模式主要有建議性的行業(yè)指引和網(wǎng)絡(luò)隱私認(rèn)證計(jì)劃兩種。如美國(guó)在線隱私聯(lián)盟(OPA)于1998年公布在線隱私指引屬于建議性的行業(yè)指引模式,美國(guó)的Truste認(rèn)證屬于網(wǎng)絡(luò)隱私認(rèn)證計(jì)劃模式。然而,行業(yè)協(xié)會(huì)無權(quán)懲罰違規(guī)企業(yè)。
12技術(shù)方法
121基于數(shù)據(jù)加密方法
主要思想是通過對(duì)用戶數(shù)據(jù)進(jìn)行加密,使得隱私信息窺探者無法通過密文推測(cè)出用戶隱私信息,包括:基于對(duì)稱加密技術(shù)方案[9],基于公鑰加密技術(shù)方案[10-11]和基于啟發(fā)式加密方案[12]。然而,加密方法的局限性在于數(shù)據(jù)使用性受到很大限制。這是因?yàn)椋海?)基于對(duì)稱加密的方案在數(shù)據(jù)使用上受到很大限制,僅能支持有限功能操作;(2)盡管基于公鑰加密的方案在數(shù)據(jù)使用上不受限制,可支持任何功能操作(如全同態(tài)加密方案),但現(xiàn)有全同態(tài)加密方案密文膨脹率大,計(jì)算復(fù)雜性高等問題,導(dǎo)致現(xiàn)有方案在大數(shù)據(jù)中不具有實(shí)用性;(3)雖然基于啟發(fā)式的加密方案計(jì)算效率高,支持功能操作比較靈活,但方案安全性并不能證明。
122基于數(shù)據(jù)匿名與失真方法
匿名方法主要思想是攻擊者基于目標(biāo)背景知識(shí)在匿名數(shù)據(jù)中無法標(biāo)識(shí)出單個(gè)個(gè)體的方法。k匿名方案指攻擊者基于匿名化數(shù)據(jù)進(jìn)行匹配識(shí)別時(shí),至少有k個(gè)候選項(xiàng)符合,即目標(biāo)用戶信息隱私泄露概率小于1/k[13]。失真方法主要思想是對(duì)于用戶數(shù)據(jù)進(jìn)行隨機(jī)化修改,使得攻擊者不能準(zhǔn)確地推測(cè)出原始真實(shí)用戶數(shù)據(jù),從而達(dá)到保護(hù)用戶信息隱私目的[14]。盡管基于數(shù)據(jù)匿名與失真是目前隱私保護(hù)的關(guān)鍵技術(shù),但在大數(shù)據(jù)中它存在“去身份”信息可以“重新身份”問題,如由生日、性別和郵政編碼組成的“三重標(biāo)識(shí)符”能夠用來惟一標(biāo)識(shí)公開數(shù)據(jù)庫中至少87%的美國(guó)公民[15]。
綜上所述,在大數(shù)據(jù)環(huán)境中用戶信息隱私保護(hù)的問題需要進(jìn)一步研究與探索,依靠單一的社會(huì)方法或技術(shù)方法都不能完全解決問題。實(shí)際上,大數(shù)據(jù)環(huán)境下用戶信息隱私保護(hù)問題并不僅僅是一個(gè)純技術(shù)問題,還是一個(gè)社會(huì)問題。問題涉及到用戶個(gè)人、隱私攻擊方、網(wǎng)絡(luò)企業(yè)、行業(yè)協(xié)會(huì)和政府部門等多個(gè)主體,這些主體之間的利益關(guān)系非常復(fù)雜,且交互重疊。因此,研究基于社會(huì)技術(shù)理論視角,將社會(huì)與技術(shù)兩種因素綜合起來考慮與研究,這樣的研究可能會(huì)發(fā)現(xiàn)新的解決方案與途徑。
2用戶信息隱私泄露成因分析
基于系統(tǒng)論的思想,通過典型案例、統(tǒng)計(jì)分析和系統(tǒng)分析等手段,對(duì)大數(shù)據(jù)環(huán)境下的用戶信息隱私保護(hù)的發(fā)生機(jī)制進(jìn)行建模。由于大數(shù)據(jù)環(huán)境下用戶信息隱私保護(hù)問題涉及到多種類型的數(shù)據(jù)、跨域數(shù)據(jù),同時(shí)數(shù)據(jù)挖掘技術(shù)不斷發(fā)展,因此原來可能沒有隱私泄漏問題的數(shù)據(jù)經(jīng)整合或重新處理變成敏感的隱私數(shù)據(jù),所以對(duì)發(fā)生機(jī)制進(jìn)行深入細(xì)致的研究非常必要。
21典型案例研究與統(tǒng)計(jì)分析
211典型案例研究
對(duì)大數(shù)據(jù)環(huán)境下用戶隱私問題的典型案例進(jìn)行深入研究,確認(rèn)用戶隱私問題發(fā)生過程中相關(guān)當(dāng)事方的主要責(zé)任,歸納總結(jié)出用戶隱私問題發(fā)生的環(huán)節(jié)、信息類型、情景條件等,并界定其中所涉及到的社會(huì)因素與技術(shù)因素以及這兩種因素是如何相互影響與共同作用。
212統(tǒng)計(jì)分析
通過社會(huì)調(diào)研獲取樣本信息以及虛擬環(huán)境下虛擬攻擊生成的數(shù)據(jù),對(duì)大數(shù)據(jù)環(huán)境下用戶隱私保護(hù)問題的主要形態(tài)、主要方式,以及導(dǎo)致問題發(fā)生的關(guān)鍵環(huán)節(jié)與要素進(jìn)行統(tǒng)計(jì)分析,從而發(fā)現(xiàn)用戶隱私問題發(fā)生的統(tǒng)計(jì)規(guī)律。
22用戶隱私泄露的發(fā)生機(jī)制及成因分析
221隱私泄露點(diǎn)與發(fā)生機(jī)制研究
首先建立用戶信息隱私問題的發(fā)生機(jī)制模型,如圖1所示用戶隱私泄露點(diǎn)及發(fā)生機(jī)制的框架示意圖。圖1大數(shù)據(jù)環(huán)境下的用戶信息隱私問題發(fā)生機(jī)制示意圖
隱私泄露點(diǎn)1:是用戶在與網(wǎng)絡(luò)服務(wù)方交互作用時(shí),提交或泄露了自己的隱私信息,沒有進(jìn)行相應(yīng)的匿名或者是失真處理。
隱私泄露點(diǎn)2:是網(wǎng)絡(luò)服務(wù)方在掌握大量用戶隱私信息的情況下,一是受到隱私攻擊主的攻擊而將信息泄露;二是網(wǎng)絡(luò)服務(wù)方委托大數(shù)據(jù)挖掘的第三方進(jìn)行數(shù)據(jù)分析時(shí),失真或加密處理無效導(dǎo)致隱私泄露。
隱私泄露點(diǎn)3:用戶在網(wǎng)絡(luò)上的行為或者是隱私信息被隱私攻擊方跟蹤與竊取,這是因?yàn)橛脩糇陨淼碾[私保護(hù)意識(shí)與保護(hù)手段不力所致。
222用戶信息隱私泄露成因分析
從上述用戶信息隱私泄露點(diǎn)和發(fā)生機(jī)制可以發(fā)現(xiàn),用戶信息隱私泄露的主要原因如下:一是用戶自身隱私保護(hù)意識(shí)不強(qiáng)、隱私保護(hù)技術(shù)不高,造成用戶隱私信息泄露,如隱私泄露點(diǎn)1、3;二是網(wǎng)絡(luò)服務(wù)方內(nèi)部數(shù)據(jù)管理松懈,用戶隱私信息安全體系不完善,造成用戶信息泄露,如隱私泄露點(diǎn)2;三是挖掘第三方利用隱私保護(hù)技術(shù)本身缺陷,造成用戶信息隱私泄露,如隱私泄露點(diǎn)2;四是攻擊者利用隱私保護(hù)技術(shù)漏洞非法獲取用戶隱私信息,造成隱私信息泄露,如隱私泄露點(diǎn)1、3。
3用戶信息隱私保護(hù)對(duì)策
當(dāng)前大數(shù)據(jù)環(huán)境下用戶隱私保護(hù)存在的問題是用戶隱私保護(hù)法律不完善、用戶數(shù)據(jù)的中心本身存在安全缺陷、用戶數(shù)據(jù)使用監(jiān)管存在明顯隱患、用戶信息隱私保護(hù)技術(shù)不先進(jìn)。針對(duì)隱私保護(hù)的問題,我們下面研究用戶信息隱私保護(hù)對(duì)策,即關(guān)鍵社會(huì)方法、關(guān)鍵技術(shù)方法、社會(huì)技術(shù)模型建構(gòu)與優(yōu)化、隱私保護(hù)的研究方法。
31關(guān)鍵社會(huì)方法
311隱私保護(hù)立法
借鑒歐盟針對(duì)大數(shù)據(jù)環(huán)境下的隱私保護(hù)立法的實(shí)踐經(jīng)驗(yàn),研究與分析我國(guó)用戶信息隱私保護(hù)中的共性與個(gè)性問題,針對(duì)大量高發(fā)且影響嚴(yán)重的問題與環(huán)節(jié),為制定出既有預(yù)防性質(zhì)也具有救濟(jì)性質(zhì)的隱私保護(hù)法律提供參考和理論依據(jù)。由于大數(shù)據(jù)環(huán)境下隱私保護(hù)具有跨時(shí)空、超國(guó)界的特點(diǎn),因此在考慮我國(guó)隱私立法獨(dú)特性的同時(shí),還需考慮到與歐盟等國(guó)家的相關(guān)立法關(guān)系,從而實(shí)現(xiàn)國(guó)際社會(huì)在隱私保護(hù)立法方面的協(xié)同。
312行業(yè)自律與認(rèn)證
借鑒美國(guó)在此方面的成功經(jīng)驗(yàn),同時(shí)分析研究世界各國(guó)在大數(shù)據(jù)環(huán)境下行業(yè)自律與認(rèn)證的未來發(fā)展趨勢(shì);針對(duì)我國(guó)相關(guān)行業(yè)與企業(yè)的特點(diǎn),特別是與大數(shù)據(jù)相關(guān)的網(wǎng)絡(luò)服務(wù)方、數(shù)據(jù)挖掘的第三方以及其他數(shù)據(jù)涉及方的行為特征相結(jié)合,為制定切實(shí)可行與有效的行業(yè)自律或認(rèn)證方案提供參考。
32關(guān)鍵技術(shù)方法
對(duì)于所涉及到的匿名與加密技術(shù)、追蹤與刪除技術(shù)以及統(tǒng)計(jì)識(shí)別技術(shù)等,各項(xiàng)技術(shù)現(xiàn)在都在不斷發(fā)展中,一是對(duì)現(xiàn)有的技術(shù)方法解決大數(shù)據(jù)環(huán)境下的用戶信息隱私保護(hù)問題的可行性進(jìn)行評(píng)估;二是對(duì)其技術(shù)組合及其中的某些關(guān)鍵技術(shù)難題進(jìn)行有針對(duì)性的研究,而這些都將是本文研究的重點(diǎn)與難點(diǎn)。
321匿名與加密技術(shù)
一是研究分析現(xiàn)有的技術(shù)方法在大數(shù)據(jù)環(huán)境下的可行性以及組合使用的可能性;二是研究現(xiàn)有技術(shù)方法的完善方案與改進(jìn)技術(shù)。匿名技術(shù)既要能夠保護(hù)隱私信息,同時(shí)又要保證在挖掘算法中的數(shù)據(jù)可用性。加密技術(shù)主要是用于掌握用戶數(shù)據(jù)的單位將用戶數(shù)據(jù)加密后委托給數(shù)據(jù)挖掘第三方的情形。目前,全同態(tài)加密技術(shù)能夠?qū)用艿臄?shù)據(jù)在密文狀態(tài)下任意計(jì)算,但現(xiàn)有方案不具有實(shí)用性,所以需要進(jìn)一步研究基于部分同態(tài)加密技術(shù)設(shè)計(jì)用戶信息隱私保護(hù)方案。
322追蹤與刪除技術(shù)
當(dāng)用戶或者是隱私保護(hù)的第三方發(fā)現(xiàn)隱私信息被泄露后,相關(guān)人員能夠?qū)Υ诵畔⒌男孤堵窂竭M(jìn)行追蹤,并對(duì)隱私信息泄露傳播路徑中的關(guān)鍵節(jié)點(diǎn)或者是數(shù)據(jù)庫進(jìn)行敏感信息的刪除。此項(xiàng)功能既要有技術(shù)手段,同時(shí)也需要有相關(guān)的社會(huì)支持。
323統(tǒng)計(jì)識(shí)別技術(shù)
用戶或者是委托的隱私保護(hù)第三方通過對(duì)大數(shù)據(jù)環(huán)境下的各種信息的掃描與實(shí)時(shí)統(tǒng)計(jì)分析,識(shí)別可能的用戶信息隱私問題,對(duì)具有高概率的用戶隱私保護(hù)問題提出預(yù)警,從而保證相關(guān)各方能夠采取及時(shí)有效的防范措施。
33隱私保護(hù)的社會(huì)技術(shù)模型建構(gòu)與優(yōu)化
331社會(huì)技術(shù)模型建構(gòu)與優(yōu)化研究
對(duì)大數(shù)據(jù)環(huán)境下用戶信息隱私保護(hù)問題所涉及到各主體、社會(huì)要素、技術(shù)要素及其相互關(guān)系進(jìn)行系統(tǒng)建模,整合3個(gè)隱私泄露點(diǎn)與4個(gè)機(jī)制,同時(shí)考慮系統(tǒng)目標(biāo)與實(shí)現(xiàn)目標(biāo)途徑的研究。大數(shù)據(jù)環(huán)境下用戶信息隱私保護(hù)可以采取多種機(jī)制,包括用戶的自我保護(hù)、政府保護(hù)、行業(yè)自律,也可以采取向第三方購買服務(wù)或者是購買與安裝用戶隱私保護(hù)軟件等手段來實(shí)現(xiàn)。所以需要對(duì)用戶隱私保護(hù)各種機(jī)制進(jìn)行優(yōu)化研究,在政府立法等強(qiáng)制措施之外,鼓勵(lì)采取行業(yè)自律與市場(chǎng)化解決方案。
332用戶信息隱私保護(hù)政策對(duì)策研究
基于用戶隱私保護(hù)的政策目標(biāo),進(jìn)行相關(guān)對(duì)策研究。一是研究用戶信息隱私保護(hù)的立法措施;二是研究推動(dòng)行業(yè)自律或認(rèn)證的相關(guān)政策措施;三是促進(jìn)隱私信息保護(hù)的技術(shù)開發(fā)與使用的相關(guān)政策措施。
34研究方法
本文基于社會(huì)技術(shù)理論的視角,綜合使用社會(huì)調(diào)研方法與信息技術(shù)方法進(jìn)行研究,所使用的主要方法如下。如圖2所示。圖2大數(shù)據(jù)環(huán)境中用戶信息隱私保護(hù)研究方法示意圖
341典型案例研究
研究將從根據(jù)用戶信息隱私問題的社會(huì)影響程度、隱私泄露點(diǎn)、所涉及的技術(shù)與社會(huì)因素的復(fù)雜程度等,選擇4~6個(gè)具有典型意義的大數(shù)據(jù)環(huán)境下用戶信息隱私問題的典型案例,對(duì)用戶信息隱私泄露的關(guān)鍵環(huán)節(jié)、技術(shù)社會(huì)因素、隱私泄露的擴(kuò)散、對(duì)受害人的傷害、隱私泄露的發(fā)現(xiàn)以及后續(xù)的情況等進(jìn)行全面分析與剖析。這些典型案例研究,將為大數(shù)據(jù)環(huán)境下用戶信息隱私問題的發(fā)生機(jī)制與發(fā)現(xiàn)機(jī)制的建立提供依據(jù)。
342統(tǒng)計(jì)分析與識(shí)別
樣本主要從兩個(gè)方面搜集:(1)從各種媒體包括網(wǎng)絡(luò)媒體上所報(bào)道的用戶信息隱私泄露問題中搜集樣本,同時(shí)借助社會(huì)關(guān)系網(wǎng)絡(luò)從政府機(jī)構(gòu)、法院、企業(yè)搜集能夠公開的數(shù)據(jù),進(jìn)行統(tǒng)計(jì)分析;(2)采取實(shí)驗(yàn)室研究,建立虛擬的大數(shù)據(jù)環(huán)境,然后采取各種方法進(jìn)行模擬攻擊,從而生成大量的樣本數(shù)據(jù),從中進(jìn)行統(tǒng)計(jì)分析,尋找關(guān)鍵環(huán)節(jié)與要素,以及建立相應(yīng)的問題識(shí)別模型。
343系統(tǒng)建模與優(yōu)化
基于系統(tǒng)論的思想,在案例分析與統(tǒng)計(jì)分析的基礎(chǔ)上,對(duì)大數(shù)據(jù)環(huán)境下的用戶信息隱私問題的發(fā)生機(jī)制、發(fā)現(xiàn)機(jī)制、預(yù)防機(jī)制與救濟(jì)機(jī)制進(jìn)行系統(tǒng)建模,描述用戶信息隱私問題在以上4個(gè)機(jī)制中的主要因素、環(huán)節(jié)及其相互關(guān)系。由于這4個(gè)機(jī)制之間具有相互聯(lián)系性,因此還可以建構(gòu)用戶信息隱私問題的系統(tǒng)過程模型。另一方面,由于大數(shù)據(jù)是一把雙刃劍,既帶來巨大的社會(huì)經(jīng)濟(jì)利益與可能的各種機(jī)會(huì),同時(shí)也帶來用戶信息隱私保護(hù)等問題,所以必須建立社會(huì)技術(shù)的系統(tǒng)優(yōu)化模型。這種優(yōu)化模型的目標(biāo)是大數(shù)據(jù)用戶信息隱私保護(hù)的利弊平衡以及經(jīng)濟(jì)社會(huì)方法的效益效率雙重目標(biāo)。
344政策可行性分析
隱私保護(hù)立法、行業(yè)自律與認(rèn)證雖然在歐盟以及美國(guó)都已經(jīng)有相應(yīng)的應(yīng)用,但在大數(shù)據(jù)環(huán)境下,每個(gè)國(guó)家面臨的問題仍然具有很強(qiáng)的特殊性質(zhì)。社會(huì)文化、經(jīng)濟(jì)環(huán)境、政策法律基礎(chǔ)、技術(shù)發(fā)展水平等都有差異,這些差異使得相同手段可能表現(xiàn)出不同的社會(huì)效果,也可能需要不同的社會(huì)經(jīng)濟(jì)成本的支持。因此在對(duì)隱私保護(hù)立法、行業(yè)自律與認(rèn)證措施可行性分析基礎(chǔ)上,提出可行的改善方案。
345加密算法與模擬攻擊
對(duì)目前采用的各種加密算法進(jìn)行評(píng)估,并運(yùn)用全同態(tài)加密算法進(jìn)行相對(duì)較為深入地研究。所以這些加密算法都將在大數(shù)據(jù)模擬環(huán)境下進(jìn)行攻擊試驗(yàn),對(duì)其安全性與實(shí)際應(yīng)用性進(jìn)行評(píng)測(cè),在此基礎(chǔ)上,提出用戶信息隱私保護(hù)的加密算法方案或者是組合方案。
4結(jié)語
無論半結(jié)構(gòu)化、非結(jié)構(gòu)化的大數(shù)據(jù)是來自普通用戶、企業(yè)還是政府機(jī)構(gòu),是被動(dòng)、主動(dòng)還是自動(dòng)式產(chǎn)生,伴隨著互聯(lián)網(wǎng)的新生態(tài),已深度滲透到各行各業(yè)的時(shí)代背景中。我們?cè)谙硎艽髷?shù)據(jù)帶來便利的同時(shí),也深深感受到在開放的互聯(lián)網(wǎng)環(huán)境下,用戶信息隱私保護(hù)的相關(guān)工作任重而又道遠(yuǎn)。本文從社會(huì)技術(shù)理論視角對(duì)此問題的相關(guān)研究,將為網(wǎng)絡(luò)服務(wù)商開發(fā)基于匿名和加密技術(shù)的隱私保護(hù)方案提供思路,也為網(wǎng)絡(luò)用戶提高自我隱私保護(hù)提供技術(shù)支持和策略指導(dǎo);為政府進(jìn)行大數(shù)據(jù)環(huán)境下的隱私保護(hù)立法提供決策參考,同時(shí)也為相關(guān)行業(yè)開展行業(yè)自律或隱私保護(hù)認(rèn)證提供研究支持,力求為推動(dòng)相關(guān)領(lǐng)域構(gòu)建強(qiáng)有力的保障體系,做出有益的嘗試和探索。
參考文獻(xiàn)
[1]孟小峰.大數(shù)據(jù)管理系統(tǒng)的發(fā)展與機(jī)遇[EB/OL].http:∥bigdata.chinabyte.com/322/13780322.shtml,2016-05-28.
[2]JGinsberg,MHMohebbi,RSPatel,LBrammer,MSSmolinski and LBrilliant.Detecting influenza epidemics using search engine query data[J].Nature 457,2009:1012-1014.
[3]POhm.Broken promises of privacy:responding to the surprising failure of anonymization[J].UCLA Law Review,2010,57:1701-1777.
[4]BLDaniels,Big Data,Big Trouble?Privacy and Legal Concerns with Big Data[EB/OL].http:∥www.sourcingspeak.com/2013/09/big-data-big-trouble-privacy-and-legal-concerns-with-big-data.html,2013-09-26.
[5]FBuytendijk and JHeiser,Confronting the privacy and ethical risks of Big Data[EB/OL].http:∥www.ft.com/intl/cms/s/0/105e30a4-2549-11e3-b349-00144feab7de.html#axzz49xNIFZAV,2013-09-24.
[6]馮登國(guó),張敏,李昊.大數(shù)據(jù)安全與隱私保護(hù)[J].計(jì)算機(jī)學(xué)報(bào),2013,37(1):246-257.
[7]郎慶斌,孫毅.個(gè)人信息安全——研究與實(shí)踐[M].北京:人民出版社,2012.
[8]周漢華.個(gè)人信息保護(hù)法(專家建議稿)及立法研究報(bào)告[M].北京:法律出版社,2006.
[9]D Song,D Wagner,A Perrig.Practical techniques for searches on encrypted data[C].IEEE Symposium on Security and Privacy,2000:44-55.
[10]CGentry.fully-homomorphic encryption scheme using ideal lattices[C].STOC,2009:169-178.
[11]ZBrakerski and VVaikuntanathan.Efficient Fully Homomorphic Encryption from(Standard)LWE[C].FOCS,2011:97-106.
[12]蔡克,張敏,馮登國(guó).基于單斷言的安全的密文區(qū)間檢索[J].計(jì)算機(jī)學(xué)報(bào),2011,34(11):2093-2103.
[13]劉向宇,王斌,楊曉春.社會(huì)網(wǎng)絡(luò)數(shù)據(jù)發(fā)布隱私保護(hù)技術(shù)綜述[J].軟件學(xué)報(bào),2014,25(3):576-590.
[14]CDwork.Differential privacy.ICALP,2006:1-12.
[15]LSweeney,Simple Demographics Often Identify People Uniquely.Carnegie Mellon University,Data Privacy Working Paper 3.Pittsburgh 2000.
(本文責(zé)任編輯:孫國(guó)雷)