李英
摘要:當(dāng)下,全球數(shù)據(jù)資源呈現(xiàn)爆發(fā)式和多樣化的急劇增長(zhǎng),催生了大數(shù)據(jù)(Big Data)。大數(shù)據(jù)引發(fā)的個(gè)人信息安全已全面爆發(fā),產(chǎn)生的威脅、侵害和影響,已經(jīng)遠(yuǎn)超越我們的范疇,信息安全與隱私泄露給我們帶來(lái)了嚴(yán)重的困擾。該文分析了大數(shù)據(jù)帶來(lái)的安全挑戰(zhàn)及隱私保護(hù)所面臨的關(guān)鍵方法,并指出大數(shù)據(jù)在引入安全問(wèn)題的同時(shí),也是解決隱私安全問(wèn)題的有效手段。
關(guān)鍵詞:大數(shù)據(jù);安全;隱私;保護(hù)
中圖分類(lèi)號(hào):TP393 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2015)13-0009-03
Abstracts: Nowadays,global data resources rise sharply in a projectile and diversified way,which gives rise to big data.personal information security started by big data has broken out comprehensively. The threat, aggression and impact generated by it have gone far beyond our category. Information security and privacy to divulge have brought us severeproblems.This paper analyzes the security challenges brought by large data and critical methods confrontingprivacy protection, as well as points out that big data not only introduces safety problems, butit is also the effective means to solve the problems of privacy, which brought new opportunitiesfor the development in the field of information security.
Key words: bigdata; safety; privacy; protection
大數(shù)據(jù)這一現(xiàn)象引發(fā)了各行各業(yè)的廣泛關(guān)注[1],而其作為一種重要的戰(zhàn)略資源,已經(jīng)不同程度地滲透到每個(gè)行業(yè)領(lǐng)域和部門(mén),其深度應(yīng)用有助于企業(yè)的經(jīng)營(yíng)活動(dòng)。大數(shù)據(jù)已成為一種新的經(jīng)濟(jì)資產(chǎn)類(lèi)別,就像貨幣和黃金一樣,對(duì)數(shù)據(jù)的掌控直接關(guān)系到對(duì)市場(chǎng)機(jī)遇的把握和巨大的經(jīng)濟(jì)回報(bào)。大數(shù)據(jù)資源呈現(xiàn)爆發(fā)式和多樣化的急劇增長(zhǎng),其蘊(yùn)含的無(wú)限開(kāi)發(fā)潛能和巨大商業(yè)價(jià)值正引領(lǐng)各行各業(yè)智慧經(jīng)濟(jì)的崛起。
大數(shù)據(jù)的發(fā)展使得監(jiān)視變得更容易、成本更低廉也更有用處。當(dāng)我們更多的個(gè)人信息被采集和存儲(chǔ)下來(lái),大數(shù)據(jù)的弊端也就顯現(xiàn)出來(lái)了。大數(shù)據(jù)還會(huì)帶來(lái)更多的威脅,畢竟,大數(shù)據(jù)的核心思想就是用規(guī)模劇增來(lái)改變現(xiàn)狀。我們將分析它是如何加深對(duì)我們隱私的威脅的,同時(shí)還將面對(duì)一個(gè)新的挑戰(zhàn),即運(yùn)用大數(shù)據(jù)預(yù)測(cè)來(lái)判斷和懲罰人類(lèi)的潛在行為,我們的隱私和傾向受到很不良的影響。
1 大數(shù)據(jù)的來(lái)源及分析應(yīng)用
1.1大數(shù)據(jù)的來(lái)源
網(wǎng)絡(luò)的應(yīng)用發(fā)展、科學(xué)研究的需要、存儲(chǔ)器價(jià)格的下降和容量的巨大提升、計(jì)算機(jī)仿真等,使得我們收集到前所未見(jiàn)的龐大數(shù)據(jù)集[2],大數(shù)據(jù)的來(lái)源主要包括如下幾個(gè)方面。
1)社交網(wǎng)絡(luò):隨著社交網(wǎng)絡(luò)不斷發(fā)展,更多的數(shù)據(jù)以圖作為基礎(chǔ)模型進(jìn)行表達(dá)更為自然,而且這些數(shù)據(jù)的是極其龐大的。大型和超大型社交網(wǎng)絡(luò)的處理是手工分析方式無(wú)法完成的,在過(guò)去的二十年中,社交網(wǎng)絡(luò)分析領(lǐng)域的快速發(fā)展,很大程度得益于計(jì)算機(jī)計(jì)算能力的提升和各種數(shù)據(jù)挖掘方法的發(fā)展。
2)電子商務(wù)系統(tǒng)的數(shù)據(jù):電子商務(wù)用戶(hù)數(shù)量和交易數(shù)量隨著物流的快速發(fā)展都相當(dāng)驚人。淘寶為了處理這些大規(guī)模的數(shù)據(jù),自行開(kāi)發(fā)了海量數(shù)據(jù)庫(kù)系統(tǒng)ocean base。
1.2大數(shù)據(jù)分析應(yīng)用
為了及時(shí)了解數(shù)據(jù)相應(yīng)的變化,不斷優(yōu)化和改進(jìn),不僅僅要治標(biāo)而且要治本,使同類(lèi)的問(wèn)題不再出現(xiàn);持續(xù)監(jiān)控和反饋,不斷尋找能從最根本上解決問(wèn)題的最優(yōu)方案。我們必做的就是深入的分析數(shù)據(jù)[3],使這些數(shù)據(jù)更好的被應(yīng)用。
我們不僅需要通過(guò)數(shù)據(jù)了解現(xiàn)在發(fā)生了什么,更需要利用數(shù)據(jù)對(duì)將要發(fā)生什么進(jìn)行預(yù)測(cè),以便在行動(dòng)上做出一些主動(dòng)的準(zhǔn)備(如圖1)。例如,通過(guò)預(yù)測(cè)商品的銷(xiāo)售量預(yù)先采取行動(dòng),對(duì)商品進(jìn)行及時(shí)的調(diào)整。
1)大量的交易歷史信息由商業(yè)組織積累而成,企業(yè)的各級(jí)管理人員希望從這些數(shù)據(jù)中分析出一些模式以便從中發(fā)現(xiàn)商業(yè)機(jī)會(huì),通過(guò)趨勢(shì)分析,甚至預(yù)先發(fā)現(xiàn)一些正在涌現(xiàn)出來(lái)的機(jī)會(huì)。比如,美國(guó)的一位父親,女兒只有16歲,卻收到了孕婦用品商場(chǎng)的促銷(xiāo)券。憤怒的父親找到商場(chǎng)討公道,沒(méi)想到女兒真的懷孕了。原因是這家商場(chǎng)建立了一個(gè)數(shù)據(jù)模型,選了25種典型商品的消費(fèi)數(shù)據(jù),構(gòu)建了懷孕預(yù)測(cè)指數(shù),能夠在很小的誤差范圍內(nèi),預(yù)測(cè)到顧客的孕情,從而及早搶占市場(chǎng)。
2)圖分析和網(wǎng)絡(luò)分析可用于產(chǎn)品直銷(xiāo)、組織和個(gè)體行為分析、潛在安全威脅分析等領(lǐng)域[4]。圖分析和網(wǎng)絡(luò)分析規(guī)模的增長(zhǎng),從幾何角度看,圖的節(jié)點(diǎn)和邊都不斷增長(zhǎng)。此外,公安機(jī)關(guān)發(fā)現(xiàn),犯罪分子還通過(guò)對(duì)獲取信息的整合,提高其含金量賣(mài)出更高的價(jià)格。比如,A從電信服務(wù)商獲得了一個(gè)人的姓名和手機(jī)號(hào)碼,B通過(guò)4S店得到了同一個(gè)人的姓名和車(chē)牌號(hào),C在醫(yī)院獲得了這個(gè)人的身份證號(hào)和家庭住址,那么通過(guò)信息交易或者交換,這個(gè)人的完整信息很可能就會(huì)徹底暴露給犯罪分子。而這一切,正是大數(shù)據(jù)所擅長(zhǎng)的分析、整合、數(shù)據(jù)碰撞。
2大數(shù)據(jù)引發(fā)的安全挑戰(zhàn)
科學(xué)技術(shù)是一把雙刃劍,在被稱(chēng)為“大數(shù)據(jù)”的網(wǎng)絡(luò)時(shí)代的收集和儲(chǔ)存能力面前,未來(lái)的每一個(gè)人,在執(zhí)意的搜索面前,都無(wú)所遁形,大數(shù)據(jù)所引發(fā)的安全問(wèn)題同樣引人注目。
大數(shù)據(jù)時(shí)代,外部數(shù)據(jù)商挖掘個(gè)人信息是不可能被屏蔽的。如今,用戶(hù)所產(chǎn)生的實(shí)時(shí)數(shù)據(jù)均不同程度地被各社交網(wǎng)站開(kāi)放,數(shù)據(jù)提供商很方便收集一些數(shù)據(jù)[5],涌現(xiàn)了一些專(zhuān)門(mén)從事監(jiān)測(cè)數(shù)據(jù)的市場(chǎng)分析機(jī)構(gòu)。市場(chǎng)分析機(jī)構(gòu)之所以能以非常高的精度鎖定個(gè)人,挖掘出個(gè)人信息體系,他們是通過(guò)人們?cè)谏缃痪W(wǎng)站中寫(xiě)入的信息、智能手機(jī)顯示的位置信息等多種數(shù)據(jù)組合得出的。據(jù)市場(chǎng)分析機(jī)構(gòu)統(tǒng)計(jì),他們可以識(shí)別出95%的用戶(hù),僅通過(guò)分析4個(gè)用戶(hù)曾經(jīng)到過(guò)的位置點(diǎn)。用戶(hù)隱私安全問(wèn)題堪憂,就如前CEO斯科特麥·克尼利(Scott McNealy)說(shuō):“你沒(méi)有隱私,忘記這事吧……”。
全球最大的電子郵件營(yíng)銷(xiāo)公司艾司?。‥psilon),曾在2011年4月初發(fā)生了史上最嚴(yán)重的黑客入侵事件,引發(fā)許多主要的企業(yè)客戶(hù)名單以及電子郵件地址因此外泄,這些受害企業(yè)包括了摩根大通、第一資本集團(tuán)、萬(wàn)豪飯店、美國(guó)銀行、花旗銀行及電視購(gòu)物網(wǎng)絡(luò)等。
大數(shù)據(jù)對(duì)個(gè)人信息獲取渠道拓寬需求引發(fā)的另一個(gè)重要問(wèn)題:安全、隱私和便利性之間的沖突。消費(fèi)者受惠于海量數(shù)據(jù):更低的價(jià)格、更符合消費(fèi)者需要的商品、以及從改善健康狀況到社會(huì)互動(dòng)順暢等生活質(zhì)量的提高?!袄忡R門(mén)”事件爆發(fā)后,尷尬的奧巴馬辯解道:“你不能在擁有100%安全情況下,同時(shí)擁有100%隱私和100%便利?!?。總統(tǒng)先生說(shuō)出這樣的話,說(shuō)明目前我們對(duì)大數(shù)據(jù)引發(fā)的安全挑戰(zhàn)還沒(méi)有效的遏阻。
3 大數(shù)據(jù)的隱私保護(hù)方法
3.1隱私保護(hù)方法之一——個(gè)人許可到讓數(shù)據(jù)使用都承擔(dān)責(zé)任
未來(lái)的隱私保護(hù)法應(yīng)當(dāng)區(qū)分用途,包括不需要或者只需要適當(dāng)標(biāo)準(zhǔn)化保護(hù)的用途。對(duì)于一些危險(xiǎn)性較大的項(xiàng)目,管理者必須設(shè)立規(guī)章,規(guī)定數(shù)據(jù)使用者應(yīng)如何評(píng)估風(fēng)險(xiǎn)、如何規(guī)避或者減輕潛在傷害。這將激發(fā)數(shù)據(jù)的創(chuàng)新性再利用[1],同時(shí)也確保個(gè)人免受無(wú)妄之災(zāi)。例如,一家公司出售了一項(xiàng)以駕駛員坐姿為特定識(shí)別符的汽車(chē)防盜技術(shù)。然后,它對(duì)收集到的信息進(jìn)行了分析,預(yù)測(cè)駕駛員的注意力狀態(tài)(如昏昏欲睡、醉酒以及生氣),以此向周?chē)渌{駛員發(fā)出警報(bào)以防發(fā)生交通事故主。根據(jù)目前的隱私規(guī)范,他可能需要新一輪的告知與許可,因?yàn)檫@樣使用信息是未經(jīng)駕駛員授權(quán)的。但是如今,在數(shù)據(jù)使用者的責(zé)任承擔(dān)體系下,他們就會(huì)評(píng)估預(yù)期用途的危險(xiǎn)性。如果發(fā)現(xiàn)危害性很小,他們就可以著手實(shí)施預(yù)定計(jì)劃并實(shí)現(xiàn)提高駕駛安全性的目標(biāo)。
將責(zé)任從民眾轉(zhuǎn)移到數(shù)據(jù)使用者很有意義,也存在充分的理由,因?yàn)閿?shù)據(jù)使用者比任何人都明白他們想要如何利用數(shù)據(jù)。他們的評(píng)估(或者由他們所雇用的專(zhuān)家制定的評(píng)估)避免了商業(yè)機(jī)密的泄露。也許更為重要的是,數(shù)據(jù)使用者是數(shù)據(jù)二級(jí)應(yīng)用的最大受益者,所以理所當(dāng)然應(yīng)該讓他們對(duì)自己的行為負(fù)責(zé)。
3.2隱私保護(hù)方法之二——個(gè)人動(dòng)因和預(yù)測(cè)分析
大數(shù)據(jù)時(shí)代,關(guān)于公正的概念需要重新定義以維護(hù)個(gè)人動(dòng)因的想法:人們選擇自我行為的自由意志[7]。簡(jiǎn)單地說(shuō),就是個(gè)人可以并應(yīng)該為他們的行為而非傾向負(fù)責(zé)。在大數(shù)據(jù)時(shí)代之前,這是明顯而基本的自由權(quán)利。畢竟,我們的法律體系就是這樣規(guī)定的:通過(guò)評(píng)判人們過(guò)去的行為使之為其行為承擔(dān)責(zé)任。然而,有了大數(shù)據(jù),我們就能預(yù)測(cè)人的行為,有時(shí)還能十分準(zhǔn)確。這誘使我們依據(jù)預(yù)測(cè)的行為而非實(shí)際行為對(duì)人們進(jìn)行評(píng)定。
通過(guò)保證個(gè)人動(dòng)因,我們可以確保政府對(duì)我們行為的評(píng)判是基于真實(shí)行為而非單純依靠大數(shù)據(jù)分析。從而,政府只能依法對(duì)我們過(guò)去的真實(shí)行為進(jìn)行追究,而不可以追究大數(shù)據(jù)預(yù)測(cè)到的我們的未來(lái)行為;或者,在政府評(píng)判我們過(guò)去的行為時(shí),也應(yīng)該防止單純依賴(lài)大數(shù)據(jù)的分析。例如,在對(duì)兩家涉嫌操縱價(jià)格的公司進(jìn)行調(diào)查時(shí),我們完全可以借助大數(shù)據(jù)分析先作出大概判定,然后監(jiān)管機(jī)構(gòu)再以傳統(tǒng)手段立案和進(jìn)行調(diào)查。不過(guò),當(dāng)然不能只因?yàn)榇髷?shù)據(jù)分析預(yù)測(cè)它們可能犯罪,就判定其有罪。
大數(shù)據(jù)管理的基本支撐是保證我們依然是通過(guò)考慮他人的個(gè)人責(zé)任對(duì)其進(jìn)行評(píng)判,而不是借助“客觀”數(shù)據(jù)處理去決定他們是否違法。只有這樣,我們才是把其當(dāng)作人來(lái)對(duì)待——當(dāng)作有行為選擇自由和通過(guò)自主行為被評(píng)判的人。這是從大數(shù)據(jù)推論到今天的無(wú)罪推定原則。
3.3隱私保護(hù)方法之三——擊碎黑盒子,大數(shù)據(jù)算法師倔起
日前,計(jì)算機(jī)系統(tǒng)做出決策的方式是基于程序明確設(shè)定所需遵循的規(guī)則。這樣,如果它們的決策出錯(cuò)(這是不可避免的),我們就可以回過(guò)頭來(lái)找出計(jì)算機(jī)做出錯(cuò)誤決策的原因?!盀槭裁赐獠扛袘?yīng)器遭遇空氣濕度激增的情況時(shí),智能飛行系統(tǒng)使飛機(jī)以5度的角度上升?”等?,F(xiàn)在的計(jì)算機(jī)編碼能被解碼、檢查,并且可以解讀其決策依據(jù)——無(wú)論多么復(fù)雜,至少對(duì)于懂得如何解碼的人不存在問(wèn)題。
然而。有了大數(shù)據(jù)分析,這種追蹤會(huì)變得愈發(fā)困難。對(duì)人們而言,進(jìn)行預(yù)測(cè)分析的計(jì)算機(jī)系統(tǒng)往往過(guò)于復(fù)雜,根本無(wú)法理解。但當(dāng)計(jì)算機(jī)按程序設(shè)置明確執(zhí)行一系列指令時(shí),情況就不一樣了。例如1954年早期,在IBM將俄文譯成英文的翻譯程序中,人們就能輕松理解一個(gè)單詞譯成另一個(gè)單詞的原因。但是,對(duì)于谷歌利用幾十億頁(yè)的翻譯數(shù)據(jù)開(kāi)發(fā)出的翻譯系統(tǒng),當(dāng)其將英文單詞“l(fā)ight”譯成“光”而不是“重量輕”時(shí),就不可能清楚地解釋如此選擇的原因,畢竟這個(gè)預(yù)測(cè)分析是基于海量數(shù)據(jù)和龐大的統(tǒng)計(jì)計(jì)算之上的。在這些背景下,我們能看到大數(shù)據(jù)預(yù)測(cè)、運(yùn)算法則和數(shù)據(jù)庫(kù)有變?yōu)楹诤凶硬煌该?、不可解釋、不可追蹤,因而我們?duì)其信心全無(wú)。為了防止這些情況的出現(xiàn),大數(shù)據(jù)將需要被監(jiān)測(cè)并保持透明度,當(dāng)然還有使這兩項(xiàng)得以實(shí)現(xiàn)的新型專(zhuān)業(yè)技術(shù)和機(jī)構(gòu)。它們將為許多領(lǐng)域提供支持,在這些領(lǐng)域里社會(huì)需要檢測(cè)預(yù)測(cè)結(jié)果并能夠?yàn)楸黄溴e(cuò)誤引導(dǎo)的我們提供彌補(bǔ)方法。
大數(shù)據(jù)將要求一個(gè)新的人群來(lái)扮演這種角色,也許他們會(huì)被稱(chēng)作“算法師”。他們有兩種形式:在機(jī)構(gòu)外部工作的獨(dú)立實(shí)體和機(jī)構(gòu)內(nèi)部的工作人員——正如公司有內(nèi)部的會(huì)計(jì)人員和進(jìn)行鑒證的外部審計(jì)師,即外部算法師和內(nèi)部算法師!
3.4隱私保護(hù)方法之四——反數(shù)據(jù)壟斷大享
數(shù)據(jù)之于信息社會(huì)就如燃料之于工業(yè)革命,是人們進(jìn)行創(chuàng)新的力量源泉。沒(méi)有大量鮮活的數(shù)據(jù)和健全的服務(wù)市場(chǎng),這些創(chuàng)新就實(shí)現(xiàn)不了。隨著我們管理上的轉(zhuǎn)變[1],我們相信,大數(shù)據(jù)的不利影響將會(huì)得到控制。然則,隨著尚未成熟的大數(shù)據(jù)產(chǎn)業(yè)的不斷發(fā)展,另一個(gè)重要的挑戰(zhàn)將會(huì)是如何保護(hù)極具競(jìng)爭(zhēng)力的大數(shù)據(jù)市場(chǎng)。我們必須防止21世紀(jì)數(shù)據(jù)大享的崛起,它相當(dāng)于19世紀(jì)強(qiáng)盜大享的現(xiàn)代翻版,那些強(qiáng)盜大享曾壟斷了美國(guó)的鐵路、鋼鐵生產(chǎn)和電報(bào)網(wǎng)絡(luò)。