孟小峰,張嘯劍
摘要:目的:信息化和網(wǎng)絡化的高速發(fā)展使得大數(shù)據(jù)成為當前學術界和工業(yè)界的研究熱點,是IT業(yè)正在發(fā)生的深刻技術變革。但它在提高經(jīng)濟和社會效益的同時,也為個人和團體的隱私保護以及數(shù)據(jù)安全帶來極大風險與挑戰(zhàn)。當前,隱私成為大數(shù)據(jù)應用領域亟待突破的重要問題,其緊迫性已不容忽視。本文旨在通過對比分析傳統(tǒng)被動式隱私保護技術,探索大數(shù)據(jù)隱私主動式管理框架以及該框架下的關鍵技術。方法:大數(shù)據(jù)時代下,數(shù)據(jù)隱私保護有著獨特的意義,傳統(tǒng)的隱私保護理論和技術無法涵蓋大數(shù)據(jù)隱私的內涵,進而有必要對大數(shù)據(jù)隱私保護問題進行重新思考與定位。首先,概括出大數(shù)據(jù)的數(shù)據(jù)類型、隱私特征與隱私類別;然后,為了展示大數(shù)據(jù)目前所面臨的隱私風險,從數(shù)據(jù)肆意收集、數(shù)據(jù)集成融合、數(shù)據(jù)分析3個角度進行了闡述;接著,為了解決大數(shù)據(jù)所面臨的隱私風險,提出大數(shù)據(jù)隱私管理的思想及其目標,并在其基礎上提出主動式隱私管理框架。從隱私主動監(jiān)測體系、隱私主動評估體系、隱私主動管理技術體系、問責系統(tǒng)體系已經(jīng)法律法規(guī)體系五大部分解釋該管理框架的合理性;最后,著重對現(xiàn)有隱私管理關鍵技術進行了合理的分析,并介紹各自的適應環(huán)境。介紹了隱私管理技術所面臨的挑戰(zhàn)問題。結果:(1)監(jiān)視、披露、歧視能夠導致隱私泄露,而數(shù)據(jù)的肆意收集、集成融合與分析加劇了大數(shù)據(jù)的隱私風險。(2)傳統(tǒng)的匿名化機制主要缺陷是過分依賴背景知識假設,在一定的攻擊假設背景下改進現(xiàn)有的隱私保護方法,是被動式地防止單一數(shù)據(jù)集上的隱私泄露。類似于匿名化機制,數(shù)據(jù)加密機制也是針對某類數(shù)據(jù)的隱私泄露而被動式的保護,同樣會陷入“新數(shù)據(jù)加密機制不斷被提出但又不斷被打破”的循環(huán)中;差分隱私假設數(shù)據(jù)庫中各條記錄的取值是相互獨立的。在這種假設下,攻擊者只能通過觀察帶噪音的輸出結果來攻擊。但是現(xiàn)實中的數(shù)據(jù)庫記錄有可能存在相關性。盡管隱私信息檢索技術促進了安全軟硬件的發(fā)展,但在大數(shù)據(jù)環(huán)境中,這項技術的應用會更加困難和復雜。此外,問責系統(tǒng)缺乏底層風險監(jiān)測與評估的支持。采用人工問責時,該技術的效率很低。采用數(shù)據(jù)溯源進行問責時,其本身的隱私信息可能被泄露。(3)根據(jù)大數(shù)據(jù)本身的特點所提出的隱私保護框架,為防止大數(shù)據(jù)生命周期中收集、處理、存儲、轉換、銷毀各個階段隱私的泄露提供建議上的指導與幫助。結論:大數(shù)據(jù)在當前IT業(yè)發(fā)展十分迅速,具有廣闊的發(fā)展前景,但同時其所面臨的隱私挑戰(zhàn)和風險也空前的,需要隱私保護研究者共同探求管理之道。本文提出了主動式隱私管理框架,并討論了該框架面臨的主要技術挑戰(zhàn)。大數(shù)據(jù)隱私管理不僅僅是技術方面的問題,它還涉及到法律法規(guī)、監(jiān)管模式、宗教等諸多方面。因此,僅從技術層面探討大數(shù)據(jù)隱私管理問題是遠遠不夠的,需要學術界、企業(yè)界以及政府相關部門共同努力才能實現(xiàn)。
來源出版物:計算機研究與發(fā)展, 2015, 52(2): 265-281
入選年份:2016