• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      大數(shù)據(jù)分析與隱私保護(hù)

      2014-07-24 15:31:09虞慧群裴新范貴生
      微型電腦應(yīng)用 2014年11期
      關(guān)鍵詞:算法用戶信息

      虞慧群,裴新,范貴生

      大數(shù)據(jù)分析與隱私保護(hù)

      虞慧群,裴新,范貴生

      大數(shù)據(jù)為商業(yè)創(chuàng)新和社區(qū)服務(wù)帶來了巨大利益。然而,由于大數(shù)據(jù)分析技術(shù)挖掘出的信息可能超出人們想象,隱私問題備受關(guān)注。介紹大數(shù)據(jù)分析方法及支撐架構(gòu),剖析大數(shù)據(jù)的安全與隱私保護(hù)相關(guān)技術(shù),并提出一種基于云存儲(chǔ)的大數(shù)據(jù)隱私保護(hù)方案。

      大數(shù)據(jù)分析;隱私保護(hù);安全;云計(jì)算

      0 引言

      隨著云計(jì)算、物聯(lián)網(wǎng)等技術(shù)的興起,計(jì)算機(jī)應(yīng)用產(chǎn)生的數(shù)據(jù)量呈現(xiàn)了爆炸性增長(zhǎng),大數(shù)據(jù)已成為科技界和企業(yè)界甚至世界各國政府關(guān)注的熱點(diǎn)[1]。《Nature》在2008推出??U述大數(shù)據(jù)問題所需的技術(shù)以及面臨的一些挑戰(zhàn)?!禨cience》也對(duì)大數(shù)據(jù)研究中的科學(xué)問題展開討論,說明大數(shù)據(jù)對(duì)于科學(xué)研究的重要性。美國政府發(fā)布了“大數(shù)據(jù)研究和發(fā)展倡議”,正式啟動(dòng)“大數(shù)據(jù)發(fā)展計(jì)劃”。計(jì)劃在科學(xué)研究、環(huán)境、生物醫(yī)學(xué)等領(lǐng)域利用大數(shù)據(jù)技術(shù)進(jìn)行突破。我國工信部電信研究院于2014發(fā)布大數(shù)據(jù)白皮書,對(duì)大數(shù)據(jù)關(guān)鍵技術(shù)、應(yīng)用、產(chǎn)業(yè)和政策環(huán)境等核心要素進(jìn)行分析,梳理提出大數(shù)據(jù)技術(shù)體系和創(chuàng)新特點(diǎn),描述大數(shù)據(jù)應(yīng)用及產(chǎn)業(yè)生態(tài)發(fā)展?fàn)顩r。大數(shù)據(jù)已成為目前學(xué)術(shù)界和產(chǎn)業(yè)界共同關(guān)注的問題。

      大數(shù)據(jù)之“大”有兩方面的含義:一方面是數(shù)據(jù)數(shù)量巨大、數(shù)據(jù)種類繁多、數(shù)據(jù)采集高速;另一方面指的是應(yīng)用于這類數(shù)據(jù)的分析規(guī)模大,最終才能獲取具有價(jià)值的信息。目前大數(shù)據(jù)的發(fā)展仍然面臨著許多問題,隱私問題是人們公認(rèn)的關(guān)鍵問題之一[2]。由于大數(shù)據(jù)需要收集和發(fā)布移動(dòng)數(shù)據(jù)、社會(huì)媒體數(shù)據(jù)、視頻數(shù)據(jù)等。這些數(shù)據(jù)的集中存儲(chǔ)不僅會(huì)增加數(shù)據(jù)的泄露風(fēng)險(xiǎn),而且如何保證這些數(shù)據(jù)不被濫用,以及如何監(jiān)管和控制對(duì)基礎(chǔ)數(shù)據(jù)的分析和挖掘,都是用戶隱私保護(hù)中重要的問題。如果數(shù)據(jù)擁有者直接發(fā)布隱含著敏感信息的數(shù)據(jù),而不采取適當(dāng)數(shù)據(jù)保護(hù)技術(shù),將可能造成個(gè)人敏感信息的泄露。在大數(shù)據(jù)環(huán)境中,用戶或商家既是數(shù)據(jù)的生產(chǎn)者,又是數(shù)據(jù)的存儲(chǔ)、管理者和使用者,因此,單純通過技術(shù)手段限制商家對(duì)用戶信息的使用,實(shí)現(xiàn)用戶隱私保護(hù)是極其困難的事[3]。

      本文主要從大數(shù)據(jù)的結(jié)構(gòu)特征分析出發(fā),對(duì)大數(shù)據(jù)的體系結(jié)構(gòu)及問題進(jìn)行分析,并提出相應(yīng)技術(shù)與策略以實(shí)現(xiàn)對(duì)大數(shù)據(jù)的隱私進(jìn)行保護(hù)。

      1 大數(shù)據(jù)分析

      大數(shù)據(jù)不僅指數(shù)據(jù)本身的規(guī)模,也包括數(shù)據(jù)采集、數(shù)據(jù)存儲(chǔ)平臺(tái)、數(shù)據(jù)分析系統(tǒng)和數(shù)據(jù)衍生價(jià)值等要素。這種應(yīng)用模式的開放性和多樣化等特點(diǎn),導(dǎo)致大數(shù)據(jù)的信息安全和傳統(tǒng)信息安全體系存在較大差異。

      1.1 大數(shù)據(jù)來源

      目前,社會(huì)信息化和網(wǎng)絡(luò)化的發(fā)展導(dǎo)致數(shù)據(jù)爆炸式增長(zhǎng),大數(shù)據(jù)用于描述規(guī)模超出了日常軟件在可容忍期限內(nèi)獲取、管理和加工數(shù)據(jù)的能力。據(jù)統(tǒng)計(jì),百度每天大約要處理幾十PB的數(shù)據(jù),F(xiàn)acebook每天生成300TB以上的日志數(shù)據(jù)。同時(shí),教育科研、醫(yī)療衛(wèi)生、電力行業(yè)、智能交通、電子政務(wù)等各行業(yè)也有大量數(shù)據(jù)在不斷產(chǎn)生。據(jù)著名咨詢公司IDC的統(tǒng)計(jì),2011年全球被創(chuàng)建和復(fù)制的數(shù)據(jù)總量為1.8 ZB(1021),而到2015年這一數(shù)值預(yù)計(jì)會(huì)達(dá)到8ZB。然而,大數(shù)據(jù)主要以非結(jié)構(gòu)化數(shù)據(jù)為主,傳統(tǒng)技術(shù)難以應(yīng)對(duì)。為此,谷歌提出了一套以分布式為特征的全新技術(shù)體系,即分布式文件系統(tǒng)(GFS,Google File System)、分布式并行計(jì)算MapReduce和分布式數(shù)據(jù)庫BigTable等技術(shù),這類技術(shù)將計(jì)算和存儲(chǔ)節(jié)點(diǎn)在物理上結(jié)合在一起,從而避免在數(shù)據(jù)密集計(jì)算中易形成的I/O吞吐量的制約,同時(shí)采用了分布式架構(gòu),能達(dá)到較高的并行訪問能力。這些技術(shù)奠定了當(dāng)前大數(shù)據(jù)技術(shù)的基礎(chǔ)。

      1.2 大數(shù)據(jù)分析方法

      通過數(shù)據(jù)采集和初步的過濾處理,可以存儲(chǔ)和檢索分類數(shù)據(jù)。而有效的分析使得人們能夠從靜態(tài)的數(shù)據(jù)中獲取具有預(yù)測(cè)性和結(jié)論性的信息。大數(shù)據(jù)分析創(chuàng)造的價(jià)值遠(yuǎn)高于數(shù)據(jù)本身,目前的主流技術(shù)包括:

      (1)數(shù)據(jù)挖掘:從大量的數(shù)據(jù)中通過算法搜索隱藏于其中信息的過程。通常與計(jì)算機(jī)科學(xué)、統(tǒng)計(jì)學(xué)、在線分析處理、情報(bào)檢索、機(jī)器學(xué)習(xí)、專家系統(tǒng)和模式識(shí)別等諸多方法結(jié)合從而實(shí)現(xiàn)上述目標(biāo)。數(shù)據(jù)挖掘主要由數(shù)據(jù)準(zhǔn)備、規(guī)律尋找和規(guī)律表示3個(gè)步驟組成。數(shù)據(jù)準(zhǔn)備是從相關(guān)的數(shù)據(jù)源中選取所需的數(shù)據(jù)并整合成用于數(shù)據(jù)挖掘的數(shù)據(jù)集;規(guī)律尋找是用某種方法將數(shù)據(jù)集所含的規(guī)律找出來;規(guī)律表示是盡可能以用戶可理解的方式(可視化)將找出的規(guī)律表示出來。數(shù)據(jù)挖掘算法可以被訓(xùn)練用于找到數(shù)據(jù)模式,從算法的角度可以分為監(jiān)督學(xué)習(xí),非監(jiān)督學(xué)習(xí)和半監(jiān)督學(xué)習(xí)。常用的數(shù)據(jù)挖掘算法包括:分類算法,聚類算法,回歸算法,數(shù)據(jù)關(guān)聯(lián)算法,異常檢測(cè)算法等。例如,可以使用聚類算法,通過搜索分析網(wǎng)絡(luò)中數(shù)以百萬計(jì)的圖片,判斷出給定圖片的內(nèi)容類型;亞馬遜網(wǎng)站利用數(shù)據(jù)關(guān)聯(lián)算法對(duì)圖書、消費(fèi)者進(jìn)行關(guān)聯(lián)和分類,進(jìn)行圖書的推薦銷售。

      (2)信息融合:信息融合通過集成、過濾、替代等技術(shù),從多數(shù)據(jù)源中提取關(guān)鍵數(shù)據(jù)。融合技術(shù)能夠提高數(shù)據(jù)的互操作性,促進(jìn)兩個(gè)系統(tǒng)的通信和數(shù)據(jù)交換能力。在商業(yè)智能的應(yīng)用中,商家可以將在線商品、庫存、價(jià)格以及銷售記錄等信息以圖片的形式展示給客戶,同時(shí),行業(yè)內(nèi)部的信息可以融合及共享,建立多賣家信息平臺(tái)。此外,數(shù)據(jù)集成和信息融合技術(shù)同樣可以應(yīng)用于如傳感器網(wǎng)絡(luò)、視頻/圖像處理、機(jī)器人和智能系統(tǒng)等領(lǐng)域。

      (3)圖像和語音識(shí)別:利用計(jì)算機(jī)對(duì)圖像和語音進(jìn)行處理、分析和理解,以識(shí)別各種不同模式的目標(biāo)和對(duì)像。常用的方法包括特征值提取,數(shù)據(jù)比對(duì),模式匹配等。基于圖像識(shí)別技術(shù)實(shí)現(xiàn)的產(chǎn)品包括指紋識(shí)別,人臉識(shí)別等。而語音識(shí)別則是基于音調(diào)、音色、頻率等聲音的屬性實(shí)現(xiàn)語音匹配的過程。

      圖像和語音識(shí)別技術(shù)也廣泛應(yīng)用于視頻分析中。具備高識(shí)別度的系統(tǒng)可以用于追蹤和異常發(fā)現(xiàn),例如在攝像頭全覆蓋的城市區(qū)域,可以通過人臉識(shí)別或車牌識(shí)別技術(shù),定位嫌疑人員和車輛;在監(jiān)獄安保系統(tǒng)中,通過圖像識(shí)別和語音識(shí)別技術(shù),可以區(qū)分正常行為言語和打斗喧嘩的場(chǎng)景,用于報(bào)警。

      (4)可視化分析:可視化通過交互式的視覺表現(xiàn)形式,幫助分析和理解復(fù)雜的數(shù)據(jù)。典型的可視化方法利用柱狀圖、餅狀圖等形式繪制數(shù)據(jù),便于用戶直觀地對(duì)統(tǒng)計(jì)的趨勢(shì)和內(nèi)涵進(jìn)行理解和分析。同時(shí),用戶也可以改變數(shù)據(jù)的表現(xiàn)形式和設(shè)置系統(tǒng)參數(shù),從不同角度感知和探索??梢暬夹g(shù)可以迅速有效地簡(jiǎn)化和提煉數(shù)據(jù),幫助用戶從大量數(shù)據(jù)中篩選有用信息。很多情況下,大規(guī)模數(shù)據(jù)的可視化為滿足足夠的互動(dòng)性,會(huì)結(jié)合多分辨率表示等方法,如數(shù)據(jù)流線化,任務(wù)并行化,管道并行化和數(shù)據(jù)并行化。

      1.3 大數(shù)據(jù)支撐架構(gòu)

      大數(shù)據(jù)處理涉及數(shù)據(jù)的采集、處理、分析與表現(xiàn)幾個(gè)步驟[4],大數(shù)據(jù)系統(tǒng)架構(gòu)如圖1所示:

      圖1 大數(shù)據(jù)系統(tǒng)架構(gòu)

      數(shù)據(jù)采集層:對(duì)于當(dāng)前的網(wǎng)絡(luò)安全系統(tǒng),常見的信息來源是最為原始的數(shù)據(jù)。這些數(shù)據(jù)包括網(wǎng)絡(luò)通信數(shù)據(jù),事件日志、安全日志數(shù)據(jù),視頻流數(shù)據(jù)等。數(shù)據(jù)格式因數(shù)據(jù)而異,可以從結(jié)構(gòu)上分為結(jié)構(gòu)化數(shù)據(jù),半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)3類。

      數(shù)據(jù)處理層:該模塊通過多種算法,將原始數(shù)據(jù)進(jìn)行過濾、處理和分類,形成規(guī)范的格式化數(shù)據(jù)。包括清除無效數(shù)據(jù),減少冗余數(shù)據(jù),及建立數(shù)據(jù)關(guān)聯(lián)等。

      數(shù)據(jù)分析層:原始數(shù)據(jù)經(jīng)處理之后并不能直接幫助做出決策,需要通過機(jī)器學(xué)習(xí)和模式識(shí)別等人工智能的方法進(jìn)行分析,得到具有實(shí)際價(jià)值的結(jié)果。

      數(shù)據(jù)表現(xiàn)層:依照分析和統(tǒng)計(jì)結(jié)果建立可視化輸出,從而幫助預(yù)測(cè)和規(guī)劃。

      云計(jì)算:云計(jì)算提供了大數(shù)據(jù)集中采集和存儲(chǔ)的基礎(chǔ),并提供了存儲(chǔ)空間和訪問渠道,為大數(shù)據(jù)提供彈性可擴(kuò)展的基礎(chǔ)設(shè)施支撐環(huán)境以及數(shù)據(jù)的高效存儲(chǔ)模式。本地維護(hù)和分析大數(shù)據(jù)的成本很高,因此,大數(shù)據(jù)通常使用云存儲(chǔ)的大容量特性解決其存儲(chǔ)問題。云計(jì)算的高效計(jì)算能力來解決數(shù)據(jù)處理和分析問題。

      信息安全技術(shù):用于保護(hù)信息的保密性、完整性和可用性等關(guān)鍵屬性的方法和技術(shù)。保密性技術(shù)目的是防止非授權(quán)用戶非法獲取信息資源。完整性技術(shù)目標(biāo)是保證信息的真實(shí)可靠,防止對(duì)信息的非法篡改和偽造??捎眯约夹g(shù)保障合法用戶能夠有效地獲取相應(yīng)信息。

      2 大數(shù)據(jù)隱私保護(hù)

      2.1 大數(shù)據(jù)隱私保護(hù)技術(shù)

      在大數(shù)據(jù)時(shí)代,用戶隱私和數(shù)據(jù)安全至關(guān)重要[,5]。一方面,大量的數(shù)據(jù)匯集,包括大量的企業(yè)運(yùn)營數(shù)據(jù)、客戶信息、個(gè)人的隱私和各種行為的細(xì)節(jié)記錄。這些數(shù)據(jù)的集中存儲(chǔ)不僅會(huì)增加數(shù)據(jù)的泄露風(fēng)險(xiǎn)。另一方面,大數(shù)據(jù)對(duì)數(shù)據(jù)保密性、完整性和可用性帶來了新的挑戰(zhàn)。目前,用于大數(shù)據(jù)隱私保護(hù)的主要方法包括訪問控制,數(shù)據(jù)加密,數(shù)據(jù)匿名,數(shù)據(jù)映射等。

      訪問控制技術(shù):目前以層次化基于角色的訪問控制技術(shù)(H-RBAC,Hierarchical Role-Based Access Control)為主流。其具備用戶,角色,權(quán)限三要素以及構(gòu)成權(quán)限的對(duì)象和操作。通過建立層次化的角色樹,以及創(chuàng)建、分配、回收權(quán)限等操作,實(shí)現(xiàn)有效的文件訪問控制管理。

      數(shù)據(jù)加密技術(shù):對(duì)于大數(shù)據(jù)的加密來說,最重要的安全和效率。可以用于大數(shù)據(jù)的加密技術(shù)包括基于身份的加密(IBE, Identity-Based Encryption),基于屬性的加密(ABE, Attribute-Based Encryption)等,這些加密技術(shù)可以同時(shí)配合安全策略使用,以實(shí)現(xiàn)分布式數(shù)據(jù)的安全和高效使用。

      數(shù)據(jù)匿名技術(shù):匿名技術(shù)算法通用性較高,且匿名化過程不可逆,從而能夠保證數(shù)據(jù)的真實(shí)性和安全性。匿名技術(shù)包括k-匿名模型,m-invariance等,用于決策分類器的構(gòu)建,聚類。

      數(shù)據(jù)映射技術(shù):基于橢圓曲線方法將數(shù)據(jù)編碼為特定格式,并利用哈希函數(shù)將其映射到橢圓曲線上的點(diǎn)集。映射技術(shù)采用數(shù)學(xué)上的離散對(duì)數(shù)技術(shù),能夠確保映射過程的安全和保密性。

      數(shù)據(jù)失真技術(shù):通過隨機(jī)干擾,隨機(jī)化,阻塞,凝聚等技術(shù),防止數(shù)據(jù)的失真。該技術(shù)可以認(rèn)為是一種特殊的數(shù)據(jù)加密技術(shù),其關(guān)鍵在于數(shù)據(jù)的恢復(fù)能力。

      可逆置換技術(shù):通過可逆的置換算法以保證數(shù)據(jù)的真實(shí)性,并且效率比較高,常用于數(shù)據(jù)中心的大規(guī)模系統(tǒng)隱私保護(hù),如位置變換,映射變化等。

      2.2 大數(shù)據(jù)隱私保護(hù)實(shí)施方法

      大數(shù)據(jù)基于云端存儲(chǔ),而云存儲(chǔ)本身存在安全威脅。首先,云存儲(chǔ)沒有清晰定義安全邊界,給其采取安全保護(hù)措施增加了難度;其次,大數(shù)據(jù)是在云端的大集中,其及時(shí)的大流動(dòng)、跨界的大融合,以及動(dòng)態(tài)的變化,使得數(shù)據(jù)傳輸時(shí)的完整性和保密性受到很大威脅;再次,云存儲(chǔ)中數(shù)據(jù)的容錯(cuò)性、可恢復(fù)性和完整性也存在一定的安全問題;最后,云存儲(chǔ)作為公共數(shù)據(jù)中心,對(duì)多客戶連接、高交互性及數(shù)據(jù)安全保障都提出了更高的要求[6]。目前,可用于云存儲(chǔ)中的隱私保護(hù)策略包括同態(tài)驗(yàn)證策略,盲簽名策略和粘性訪問控制策略等。

      同態(tài)驗(yàn)證策略:基于同態(tài)映射機(jī)制的隱私保護(hù)的驗(yàn)證策略。實(shí)現(xiàn)了對(duì)數(shù)據(jù)的求和形式驗(yàn)證,保證了傳輸和計(jì)算過程中的數(shù)據(jù)安全和隱私。

      盲簽名策略:使得簽名者在簽名的過程中不能知曉具體的數(shù)據(jù)內(nèi)容。通常與基于身份的簽名一起使用。

      粘性訪問控制策略:用戶將對(duì)數(shù)據(jù)的要求制定為一定形式的策略文件,與文件一起上傳服務(wù)器。當(dāng)數(shù)據(jù)包被下載之后,需要用戶的授權(quán)才能使用[7,8]。該策略文件可以使得文件的訪問控制和生命周期能夠按照用戶的意愿執(zhí)行。

      典型的云服務(wù)由用戶、可信機(jī)構(gòu)、驗(yàn)證者、云服務(wù)簇、用戶組成。用戶需要將本地的大數(shù)據(jù)存儲(chǔ)在云中以減輕本地存儲(chǔ)壓力,同時(shí)委托云進(jìn)行合法用戶對(duì)數(shù)據(jù)的訪問,其系統(tǒng)架構(gòu)如圖2所示:

      圖2 大數(shù)據(jù)存儲(chǔ)框架

      首先,需要可信機(jī)構(gòu)對(duì)數(shù)據(jù)進(jìn)行合理分塊,生成加密和簽名密鑰,保證每一個(gè)數(shù)據(jù)塊的可驗(yàn)證性和多副本冗余,然后將數(shù)據(jù)塊和副本分配到不同的云節(jié)點(diǎn)并建立對(duì)應(yīng)列表。當(dāng)驗(yàn)證者對(duì)數(shù)據(jù)的完整性進(jìn)行驗(yàn)證時(shí),向云服務(wù)簇發(fā)起“挑戰(zhàn)”,并對(duì)云的反饋結(jié)果進(jìn)行驗(yàn)證。對(duì)于不能通過驗(yàn)證的數(shù)據(jù)塊,定位錯(cuò)誤的數(shù)據(jù)塊和所在云,并利用副本進(jìn)行迅速恢復(fù)。云中的數(shù)據(jù)訪問控制由用戶對(duì)文本進(jìn)行對(duì)稱加密(CP-ABE, Ciphertext Policy Attribute-Based Encryption),然后利用訪問控制策略對(duì)密鑰進(jìn)行加密,將密文與加密后的密鑰一起存儲(chǔ)在云端。任何用戶都可以下載密文,但只有符合屬性要求的用戶可以解密相應(yīng)的數(shù)據(jù)。

      完整性的驗(yàn)證是基于GDH困難問題的,在驗(yàn)證的過程中所使用的技術(shù)包括雙線性映射、非沖突哈希函數(shù)、同態(tài)映射以及Merkle哈希樹。依照云能夠提供的服務(wù)種類,可以將云分為3個(gè)層級(jí),依次是服務(wù)層、計(jì)算層和存儲(chǔ)層[9],其中,服務(wù)層由可信第三方云提供商(HCSP, Honest Cloud Service Provider)構(gòu)成,可以看作是多個(gè)云的組織者,起到請(qǐng)求處理、整合證明以及輔助定位和恢復(fù)等作用;計(jì)算層由多個(gè)云的計(jì)算節(jié)點(diǎn)構(gòu)成,該層又可以分為不同的子層,在錯(cuò)誤定位時(shí)需要對(duì)每層節(jié)點(diǎn)逐級(jí)驗(yàn)證;存儲(chǔ)層由云的存儲(chǔ)節(jié)點(diǎn)構(gòu)成,存儲(chǔ)數(shù)據(jù)塊及副本塊。在云存儲(chǔ)安全策略中,主要包含兩個(gè)協(xié)議:數(shù)據(jù)完整性校驗(yàn)協(xié)議和數(shù)據(jù)訪問控制協(xié)議。

      完整性校驗(yàn)協(xié)議:主要由挑戰(zhàn)、證明、驗(yàn)證3個(gè)步驟組成[10]。驗(yàn)證者產(chǎn)生一個(gè)數(shù)據(jù)塊驗(yàn)證隊(duì)列,并對(duì)其中的每個(gè)塊生成一個(gè)相應(yīng)的隨機(jī)數(shù),構(gòu)成一個(gè)挑戰(zhàn)請(qǐng)求,并發(fā)送給HCSP。HCSP將該請(qǐng)求下發(fā)到每個(gè)相應(yīng)的云,要求其根據(jù)存儲(chǔ)的數(shù)據(jù)塊計(jì)算一個(gè)完整性證明。HCSP將所有的證明匯聚為一個(gè)單一最終證明,并發(fā)給驗(yàn)證者。驗(yàn)證者依據(jù)挑戰(zhàn)、證明以及本地的消息摘要,計(jì)算并判斷完整性是否保持。

      當(dāng)驗(yàn)證者反饋給用戶完整性出錯(cuò)時(shí),用戶首先確定出錯(cuò)的位置,然后根據(jù)相應(yīng)的副本單元恢復(fù)出錯(cuò)的數(shù)據(jù)塊[11]。錯(cuò)誤定位是多次挑戰(zhàn)和反復(fù)校驗(yàn)的遍歷過程,通過建立數(shù)據(jù)的Merkle哈希樹,對(duì)于其驗(yàn)證正確的節(jié)點(diǎn),其本身及所有子節(jié)點(diǎn)都被認(rèn)為是正確的;對(duì)于未能通過驗(yàn)證的節(jié)點(diǎn),繼續(xù)分層遍歷其子節(jié)點(diǎn),直到定位至存儲(chǔ)層和出錯(cuò)的數(shù)據(jù)塊。依據(jù)在初始化步驟中建立的索引列表,找到并驗(yàn)證其副本,對(duì)其進(jìn)行恢復(fù)。整個(gè)過程可以用圖3表示:

      圖3 數(shù)據(jù)完整性校驗(yàn)協(xié)議

      數(shù)據(jù)訪問控制協(xié)議:用戶首先需要在可信機(jī)構(gòu)進(jìn)行注冊(cè),然后可信機(jī)構(gòu)賦予用戶屬性及密鑰。數(shù)據(jù)擁有者在本地產(chǎn)生私鑰并用其對(duì)文本進(jìn)行對(duì)稱加密得到文本密文(CT, Cipher Test),然后用基于屬性的訪問控制策略對(duì)密鑰進(jìn)行加密得到密鑰密文(CK, Cipher Key),將CT與CK一起存儲(chǔ)在云端。任何合法用戶都可以下載密文,但在解密的過程中,只有符合訪問控制策略的用戶可以獲取解密密鑰,從而得到明文。在此基礎(chǔ)上,可以對(duì)密鑰和密文進(jìn)行動(dòng)態(tài)更新,以及對(duì)用戶屬性的分配和回收。具體過程如圖4所示:

      圖4 數(shù)據(jù)訪問控制協(xié)議

      3 結(jié)論

      大數(shù)據(jù)的采集和分析為社會(huì)、經(jīng)濟(jì)和個(gè)人帶來了的廣闊的應(yīng)用前景,同時(shí)也給隱私保護(hù)帶了極大的挑戰(zhàn)。數(shù)據(jù)分析和隱私保護(hù)是相反相成的兩方面。大數(shù)據(jù)分析涉及到數(shù)據(jù)采集、數(shù)據(jù)處理、數(shù)據(jù)分析及數(shù)據(jù)表示等各個(gè)環(huán)節(jié)。大數(shù)據(jù)隱私保護(hù)需要考慮的因素眾多,包括大數(shù)據(jù)分析方法、數(shù)據(jù)屬性及相互關(guān)系、大數(shù)據(jù)系統(tǒng)環(huán)境。大數(shù)據(jù)的隱私保護(hù)需要綜合利用數(shù)據(jù)管理技術(shù)、信息和系統(tǒng)安全技術(shù)加以實(shí)現(xiàn)。

      目前,大數(shù)據(jù)的隱私保護(hù)和安全的理論基礎(chǔ)尚需深入研究,相應(yīng)的技術(shù)和工具支撐還有待在實(shí)踐中不斷積累。需要大數(shù)據(jù)相關(guān)的科技人員、企業(yè)和政府部門協(xié)同工作,在大數(shù)據(jù)的安全技術(shù)、安全服務(wù)等級(jí)協(xié)議、認(rèn)證技術(shù)等方面,建立一套與之相適應(yīng)的保障體系。

      [1] 馮登國, 張敏, 李昊. 大數(shù)據(jù)安全與隱私保護(hù). [J]計(jì)算機(jī)學(xué)報(bào). 2014, 37(1): 246-257.

      [2] V. M. Schonberger, K. Cukier. Big data: a revolution that w ill transform how we live, work and think. Boston: Houghton M ifflin Harcourt, 2013.

      [3] S. Marchal, X. Y. Jiang, R. State, et al. A big data architecture for large scale security monitoring. IEEE International Congress on Big Data. 2014, pp. 56-63.

      [4] R. X. Lu, H. Zhu, X. M. Liu, et al. Toward efficient and privacy-preserving computing in big data era. IEEE Network. 2014, pp. 46-50.

      [5] L. Liu, J. Lin. Some special issues of network security monitoring on big data environments. IEEE Conference on Dependable, Autonom ic and Secure Computing. 2013, pp. 10-15.

      [6] M. C. Mont, S. Pearson, P. Bramhall. Towards accountable management of identity and privacy: sticky policies and enforceable tracing services. IEEE Conference on Database and Expert Systems Applications. 2003, pp. 377-382.

      [7] 裴新, 虞慧群. 安全策略驅(qū)動(dòng)的資源分割技術(shù). 中國科技論文在線, 2014.

      [8] Y. Zhu, H. X. Hu. Cooperative provable data possession for integrity verification in multicloud storage, IEEE transactions on parallel and distributed systems. Vol. 23, 2012, pp. 2231-2244.

      [9] G. A teniese, R. C. Burns, R. Curtmola, J. Herring, L. Kissner, Z. Peterson, D. Song. Provable data possession at untrusted stores, ACM CCS’07. 2007, pp. 598-609.

      [10] K. Bowers, A. Juels, A. Oprea. HAIL: A high-availability and integrity layer for cloud storage. Proceedings 16th ACM Conference on Computer and Comm. Security. 2009, pp. 187-198.

      [11] Y. Kan; J. Xiaohua, Expressive, Efficient, and Revocable Data Access Control for Multi Authority Cloud Storage. IEEE Transactions on Parallel and Distributed Systems. Vol. 25, 2014, pp.1735 – 1744.

      Big Data Analytics and Privacy Protection

      Yu Huiqun, Pei Xin, Fan Guisheng
      (Business School, University of Shanghai for Science and Technology, Shanghai 200093, China)

      Big data brings big benefits for innovative businesses and new community services. However, privacy arises as a core concern because efficient big data analytics makes it possible to learn far more than most people anticipated. In this paper, big data analytics and its supporting framework are presented. Big data security and privacy protection techniques are discussed. Finally, a cloud storage based scheme is proposed for big data privacy protection.

      Big Data Analytics; Privacy Protection; Security; Cloud Computing

      TP393

      A

      2014.10.11)

      國家自然科學(xué)基金資助項(xiàng)目(61173048, 61300041)

      虞慧群(1967-),男,華東理工大學(xué)信息學(xué)院,教授,博士,研究方向:軟件工程、可信計(jì)算、面向服務(wù)軟件與云計(jì)算,上海 200237

      裴 新(1988-),男,華東理工大學(xué)信息學(xué)院,博士生,研究方向:軟件工程,云計(jì)算與信息安全,上海 200237

      范貴生(1980-),男,華東理工大學(xué)信息學(xué)院,副研究員,博士,研究方向:軟件工程,面向服務(wù)計(jì)算,云計(jì)算,形式化方法,上海 200237

      1007-757X(2014)11-0001-04

      猜你喜歡
      算法用戶信息
      基于MapReduce的改進(jìn)Eclat算法
      Travellng thg World Full—time for Rree
      進(jìn)位加法的兩種算法
      訂閱信息
      中華手工(2017年2期)2017-06-06 23:00:31
      關(guān)注用戶
      商用汽車(2016年11期)2016-12-19 01:20:16
      關(guān)注用戶
      商用汽車(2016年6期)2016-06-29 09:18:54
      一種改進(jìn)的整周模糊度去相關(guān)算法
      關(guān)注用戶
      商用汽車(2016年4期)2016-05-09 01:23:12
      如何獲取一億海外用戶
      展會(huì)信息
      思茅市| 耒阳市| 南召县| 星子县| 瓮安县| 边坝县| 武隆县| 安塞县| 红桥区| 德兴市| 随州市| 阿拉善左旗| 嘉黎县| 郎溪县| 唐海县| 根河市| 平度市| 石家庄市| 仪征市| 郴州市| 措美县| 将乐县| 武汉市| 池州市| 丹棱县| 北安市| 锡林浩特市| 阜平县| 玉溪市| 广平县| 眉山市| 平凉市| 科技| 梁河县| 巴东县| 连州市| 彭山县| 眉山市| 微山县| 资兴市| 吐鲁番市|