胡 坤,劉 鏑,劉明輝
(1.中國(guó)聯(lián)合網(wǎng)絡(luò)通信集團(tuán)有限公司博士后科研工作站 北京100033;2.中國(guó)聯(lián)通研究院平臺(tái)與云計(jì)算研究中心 北京100032)
大數(shù)據(jù)的產(chǎn)生使數(shù)據(jù)分析與應(yīng)用更加復(fù)雜,難以管理。據(jù)統(tǒng)計(jì),過去3年里全球產(chǎn)生的數(shù)據(jù)量比以往400年的數(shù)據(jù)加起來(lái)還多,這些數(shù)據(jù)包括文檔、圖片、視頻、Web頁(yè)面、電子郵件、微博等不同類型,其中,只有20%是結(jié)構(gòu)化數(shù)據(jù),80%則是非結(jié)構(gòu)化數(shù)據(jù)[1]。數(shù)據(jù)的增多使數(shù)據(jù)安全和隱私保護(hù)問題日漸突出,各類安全事件給企業(yè)和用戶敲醒了警鐘。在整個(gè)數(shù)據(jù)生命周期里,企業(yè)需要遵守更嚴(yán)格的安全標(biāo)準(zhǔn)和保密規(guī)定,對(duì)數(shù)據(jù)存儲(chǔ)與使用的安全性和隱私性要求越來(lái)越高,傳統(tǒng)數(shù)據(jù)保護(hù)方法常常無(wú)法滿足新變化。網(wǎng)絡(luò)和數(shù)字化生活也使黑客更容易獲得他人信息,有了更多不易被追蹤和防范的犯罪手段,而現(xiàn)有的法律法規(guī)和技術(shù)手段卻難于解決此類問題。因此,在大數(shù)據(jù)環(huán)境下數(shù)據(jù)安全和隱私保護(hù)是一個(gè)重大挑戰(zhàn)。
但是也應(yīng)該看到,在大數(shù)據(jù)時(shí)代,業(yè)務(wù)數(shù)據(jù)和安全需求相結(jié)合能夠有效提高企業(yè)的安全防護(hù)水平。通過對(duì)業(yè)務(wù)數(shù)據(jù)的大量搜集、過濾與整合,經(jīng)過細(xì)致的業(yè)務(wù)分析和關(guān)聯(lián)規(guī)則挖掘,企業(yè)能夠感知自身的網(wǎng)絡(luò)安全態(tài)勢(shì),預(yù)測(cè)業(yè)務(wù)數(shù)據(jù)走向,了解業(yè)務(wù)運(yùn)營(yíng)安全情況,這對(duì)企業(yè)來(lái)說(shuō)具有革命性的意義。目前,在一些運(yùn)營(yíng)商的業(yè)務(wù)部門已經(jīng)開始使用安全基線和大數(shù)據(jù)分析技術(shù),及時(shí)檢測(cè)與發(fā)現(xiàn)網(wǎng)絡(luò)中的各種異常行為和安全威脅,從而采取相應(yīng)的安全措施。據(jù)Gartner公司預(yù)測(cè),2016年40%的企業(yè)(以銀行、保險(xiǎn)、醫(yī)藥、電信、金融和國(guó)防等行業(yè)為主)將積極地對(duì)至少10 TB數(shù)據(jù)進(jìn)行分析,以找出潛在的安全危險(xiǎn)[2]。
隨著對(duì)大數(shù)據(jù)的廣泛關(guān)注,有關(guān)大數(shù)據(jù)安全的研究和實(shí)踐也已逐步展開,包括科研機(jī)構(gòu)、政府組織、企事業(yè)單位、安全廠商等在內(nèi)的各方力量,正在積極推動(dòng)與大數(shù)據(jù)安全相關(guān)的標(biāo)準(zhǔn)制定和產(chǎn)品研發(fā),為大數(shù)據(jù)的大規(guī)模應(yīng)用奠定更加安全和堅(jiān)實(shí)的基礎(chǔ)。
在理解大數(shù)據(jù)安全內(nèi)涵、制定相應(yīng)策略之前,有必要對(duì)各領(lǐng)域大數(shù)據(jù)的安全需求進(jìn)行全面了解和掌握,以分析大數(shù)據(jù)環(huán)境下的安全特征與問題。
互聯(lián)網(wǎng)企業(yè)在應(yīng)用大數(shù)據(jù)時(shí),常會(huì)涉及數(shù)據(jù)安全和用戶隱私問題。隨著電子商務(wù)、手機(jī)上網(wǎng)行為的發(fā)展,互聯(lián)網(wǎng)企業(yè)受到攻擊的情況比以前更為隱蔽,攻擊的目的并不僅是讓服務(wù)器宕機(jī),更多是以滲透APT的攻擊方式進(jìn)行。因此,防止數(shù)據(jù)被損壞、篡改、泄露或竊取的任務(wù)十分艱巨。同時(shí),由于用戶隱私和商業(yè)機(jī)密涉及的技術(shù)領(lǐng)域繁多、機(jī)理復(fù)雜,很難有專家可以貫通法理與專業(yè)技術(shù),界定出由于個(gè)人隱私和商業(yè)機(jī)密的傳播而產(chǎn)生的損失,也很難界定侵權(quán)主體是出于個(gè)人目的還是企業(yè)行為。因此,互聯(lián)網(wǎng)企業(yè)的大數(shù)據(jù)安全需求是:可靠的數(shù)據(jù)存儲(chǔ),安全的挖掘分析,嚴(yán)格的運(yùn)營(yíng)監(jiān)管,呼喚針對(duì)用戶隱私的安全保護(hù)標(biāo)準(zhǔn)、法律法規(guī)、行業(yè)規(guī)范,期待從海量數(shù)據(jù)中合理發(fā)現(xiàn)和發(fā)掘商業(yè)機(jī)會(huì)和商業(yè)價(jià)值。
大量數(shù)據(jù)的產(chǎn)生、存儲(chǔ)和分析,使得運(yùn)營(yíng)商在數(shù)據(jù)對(duì)外應(yīng)用和開放過程中面臨著數(shù)據(jù)保密、用戶隱私、商業(yè)合作等一系列問題。運(yùn)營(yíng)商需要利用企業(yè)平臺(tái)、系統(tǒng)和工具實(shí)現(xiàn)數(shù)據(jù)的科學(xué)建模,確定或歸類這些數(shù)據(jù)的價(jià)值。由于數(shù)據(jù)通常散亂在眾多系統(tǒng)中,信息來(lái)源十分龐雜,因此運(yùn)營(yíng)商需要進(jìn)行有效的數(shù)據(jù)收集與分析,保障數(shù)據(jù)的完整性和安全性。在對(duì)外合作時(shí),運(yùn)營(yíng)商需要能夠準(zhǔn)確地將外部業(yè)務(wù)需求轉(zhuǎn)換成實(shí)際的數(shù)據(jù)需求,建立完善的數(shù)據(jù)對(duì)外開放訪問機(jī)制。在此過程中,如何有效保護(hù)用戶隱私,防止企業(yè)核心數(shù)據(jù)泄露,成為運(yùn)營(yíng)商對(duì)外開展大數(shù)據(jù)應(yīng)用需要考慮的重要問題。因此,電信運(yùn)營(yíng)商的大數(shù)據(jù)安全需求是:確保核心數(shù)據(jù)與資源的保密性、完整性和可用性,在保障用戶利益、體驗(yàn)和隱私的基礎(chǔ)上充分發(fā)揮數(shù)據(jù)價(jià)值。
金融行業(yè)的系統(tǒng)具有相互牽連、使用對(duì)象多樣化、安全風(fēng)險(xiǎn)多方位、信息可靠性、保密性要求高等特征。而且金融業(yè)對(duì)網(wǎng)絡(luò)的安全性、穩(wěn)定性要求更高,系統(tǒng)要能夠高速處理數(shù)據(jù),提供冗余備份和容錯(cuò)功能,具備較好的管理能力和靈活性,以應(yīng)對(duì)復(fù)雜的應(yīng)用。雖然金融行業(yè)一直在數(shù)據(jù)安全方面追加投資和技術(shù)研發(fā),但是由于金融領(lǐng)域業(yè)務(wù)鏈條的拉長(zhǎng)、云計(jì)算模式的普及、自身系統(tǒng)復(fù)雜度的提升以及對(duì)數(shù)據(jù)的不當(dāng)利用,都增加了金融業(yè)大數(shù)據(jù)的安全風(fēng)險(xiǎn)。因此,金融行業(yè)的大數(shù)據(jù)安全需求是:對(duì)數(shù)據(jù)訪問控制、處理算法、網(wǎng)絡(luò)安全、數(shù)據(jù)管理和應(yīng)用等方面提出安全要求,期望利用大數(shù)據(jù)安全技術(shù)加強(qiáng)金融機(jī)構(gòu)的內(nèi)部控制,提高金融監(jiān)管和服務(wù)水平,防范和化解金融風(fēng)險(xiǎn)。
隨著醫(yī)療數(shù)據(jù)的幾何倍數(shù)增長(zhǎng),數(shù)據(jù)存儲(chǔ)壓力也越來(lái)越大。數(shù)據(jù)存儲(chǔ)是否安全可靠,已經(jīng)關(guān)乎醫(yī)院業(yè)務(wù)的連續(xù)性。因?yàn)橄到y(tǒng)一旦出現(xiàn)故障,首先考驗(yàn)的就是數(shù)據(jù)的存儲(chǔ)、災(zāi)備和恢復(fù)能力。如果數(shù)據(jù)不能迅速恢復(fù),而且恢復(fù)不到斷點(diǎn),則對(duì)醫(yī)院的業(yè)務(wù)、患者滿意度構(gòu)成直接損害。同時(shí),醫(yī)療數(shù)據(jù)具有極強(qiáng)的隱私性,大多數(shù)醫(yī)療數(shù)據(jù)擁有者不愿意將數(shù)據(jù)直接提供給其他單位或個(gè)人進(jìn)行研究利用,而數(shù)據(jù)處理技術(shù)和手段的有限性也造成了寶貴數(shù)據(jù)資源的浪費(fèi)。因此,醫(yī)療行業(yè)對(duì)大數(shù)據(jù)安全的需求是:數(shù)據(jù)隱私性高于安全性和機(jī)密性,同時(shí)需要安全和可靠的數(shù)據(jù)存儲(chǔ)、完善的數(shù)據(jù)備份和管理,以幫助醫(yī)生與病人進(jìn)行疾病診斷、藥物開發(fā)、管理決策、完善醫(yī)院服務(wù),提高病人滿意度,降低病人流失率。
大數(shù)據(jù)分析在安全上的潛能已經(jīng)被各國(guó)政府組織發(fā)現(xiàn),它的作用在于能夠幫助國(guó)家構(gòu)建更加安全的網(wǎng)絡(luò)環(huán)境。例如,美國(guó)進(jìn)口安全申報(bào)委員會(huì)不久前宣布,通過6個(gè)關(guān)鍵性的調(diào)查結(jié)果證明,大數(shù)據(jù)分析不僅具備強(qiáng)大的數(shù)據(jù)分析能力,而且能確保數(shù)據(jù)的安全性。美國(guó)國(guó)防部已經(jīng)在積極部署大數(shù)據(jù)行動(dòng),利用海量數(shù)據(jù)挖掘高價(jià)值情報(bào),提高快速響應(yīng)能力,實(shí)現(xiàn)決策自動(dòng)化。而美國(guó)中央情報(bào)局通過利用大數(shù)據(jù)技術(shù),提高從大型復(fù)雜的數(shù)字?jǐn)?shù)據(jù)集中提取知識(shí)和觀點(diǎn)的能力,加強(qiáng)國(guó)家安全[3]。因此,政府組織對(duì)大數(shù)據(jù)安全的需求是:隱私保護(hù)的安全監(jiān)管、網(wǎng)絡(luò)環(huán)境的安全感知、大數(shù)據(jù)安全標(biāo)準(zhǔn)的制定、安全管理機(jī)制的規(guī)范等內(nèi)容。
通過上述分析可知,各領(lǐng)域的安全需求正在發(fā)生改變,從數(shù)據(jù)采集、數(shù)據(jù)整合、數(shù)據(jù)提煉、數(shù)據(jù)挖掘、安全分析、安全態(tài)勢(shì)判斷、安全檢測(cè)到發(fā)現(xiàn)威脅,已經(jīng)形成一個(gè)新的完整鏈條。在這一鏈條中,數(shù)據(jù)可能會(huì)丟失、泄露、被越權(quán)訪問、被篡改,甚至涉及用戶隱私和企業(yè)機(jī)密等內(nèi)容。通常,大數(shù)據(jù)安全具有以下6個(gè)方面的特征和問題。
社交媒體、電子商務(wù)、物聯(lián)網(wǎng)等新應(yīng)用的興起,打破了企業(yè)原有價(jià)值鏈的圍墻,僅對(duì)原有價(jià)值鏈各個(gè)環(huán)節(jié)的數(shù)據(jù)進(jìn)行分析,已經(jīng)不能滿足需求。需要借助大數(shù)據(jù)戰(zhàn)略打破數(shù)據(jù)邊界,使企業(yè)了解更全面的運(yùn)營(yíng)及運(yùn)營(yíng)環(huán)境的全景圖[4]。但是,這顯然會(huì)對(duì)企業(yè)的移動(dòng)數(shù)據(jù)安全防范能力提出更高的要求。此外,數(shù)據(jù)價(jià)值的提升會(huì)造成更多敏感性分析數(shù)據(jù)在移動(dòng)設(shè)備間傳遞,一些惡意軟件甚至具備一定的數(shù)據(jù)上傳和監(jiān)控功能,能夠追蹤到用戶位置、竊取數(shù)據(jù)或機(jī)密信息,嚴(yán)重威脅個(gè)人的信息安全,使安全事故等級(jí)升高。在移動(dòng)設(shè)備與移動(dòng)平臺(tái)威脅飛速增長(zhǎng)的情況下,如何跟蹤移動(dòng)惡意軟件樣本及其始作蛹者,分析樣本相互間關(guān)系,成為移動(dòng)大數(shù)據(jù)安全需要解決的問題。
在網(wǎng)絡(luò)空間里,大數(shù)據(jù)是更容易被發(fā)現(xiàn)的大目標(biāo)。一方面,網(wǎng)絡(luò)訪問便捷化和數(shù)據(jù)流的形成,為實(shí)現(xiàn)資源的快速?gòu)椥酝扑秃蛡€(gè)性化服務(wù)提供基礎(chǔ)。正因?yàn)槠脚_(tái)的暴露,使得蘊(yùn)含著潛在價(jià)值的大數(shù)據(jù)更容易吸引黑客的攻擊。另一方面,在開放的網(wǎng)絡(luò)化社會(huì),大數(shù)據(jù)的數(shù)據(jù)量大且相互關(guān)聯(lián),使得黑客成功攻擊一次就能獲得更多數(shù)據(jù),無(wú)形中降低了黑客的進(jìn)攻成本,增加了收益率[5]。例如,黑客能夠利用大數(shù)據(jù)發(fā)起僵尸網(wǎng)絡(luò)攻擊,同時(shí)控制上百萬(wàn)臺(tái)傀儡機(jī)并發(fā)起攻擊,或者利用大數(shù)據(jù)技術(shù)最大限度地收集更多有用信息。
大數(shù)據(jù)的匯集不可避免地加大了用戶隱私數(shù)據(jù)信息泄露的風(fēng)險(xiǎn)。由于數(shù)據(jù)中包含大量的用戶信息,使得對(duì)大數(shù)據(jù)的開發(fā)利用很容易侵犯公民的隱私,惡意利用公民隱私的技術(shù)門檻大大降低。在大數(shù)據(jù)應(yīng)用環(huán)境下,數(shù)據(jù)呈現(xiàn)動(dòng)態(tài)特征,面對(duì)數(shù)據(jù)庫(kù)中屬性和表現(xiàn)形式不斷隨機(jī)變化,基于靜態(tài)數(shù)據(jù)集的傳統(tǒng)數(shù)據(jù)隱私保護(hù)技術(shù)面臨挑戰(zhàn)。各領(lǐng)域?qū)τ谟脩綦[私保護(hù)有多方面要求和特點(diǎn),數(shù)據(jù)之間存在復(fù)雜的關(guān)聯(lián)和敏感性,而大部分現(xiàn)有隱私保護(hù)模型和算法都是僅針對(duì)傳統(tǒng)的關(guān)系型數(shù)據(jù),不能直接將其移植到大數(shù)據(jù)應(yīng)用中。
隨著結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)量的持續(xù)增長(zhǎng)以及分析數(shù)據(jù)來(lái)源的多樣化,以往的存儲(chǔ)系統(tǒng)已經(jīng)無(wú)法滿足大數(shù)據(jù)應(yīng)用的需要。對(duì)于占數(shù)據(jù)總量80%以上的非結(jié)構(gòu)化數(shù)據(jù),通常采用NoSQL存儲(chǔ)技術(shù)完成對(duì)大數(shù)據(jù)的抓取、管理和處理。雖然NoSQL數(shù)據(jù)存儲(chǔ)易擴(kuò)展、高可用、性能好,但是仍存在一些問題。例如,訪問控制和隱私管理模式問題、技術(shù)漏洞和成熟度問題、授權(quán)與驗(yàn)證的安全問題、數(shù)據(jù)管理與保密問題等[6]。而結(jié)構(gòu)化數(shù)據(jù)的安全防護(hù)也存在漏洞,例如物理故障、人為誤操作、軟件問題、病毒、木馬和黑客攻擊等因素都可能嚴(yán)重威脅數(shù)據(jù)的安全性。大數(shù)據(jù)所帶來(lái)的存儲(chǔ)容量問題、延遲、并發(fā)訪問、安全問題、成本問題等,對(duì)大數(shù)據(jù)的存儲(chǔ)系統(tǒng)架構(gòu)和安全防護(hù)提出挑戰(zhàn)。
傳統(tǒng)數(shù)據(jù)安全往往是圍繞數(shù)據(jù)生命周期部署的,即數(shù)據(jù)的產(chǎn)生、存儲(chǔ)、使用和銷毀。隨著大數(shù)據(jù)應(yīng)用越來(lái)越多,數(shù)據(jù)的擁有者和管理者相分離,原來(lái)的數(shù)據(jù)生命周期逐漸轉(zhuǎn)變成數(shù)據(jù)的產(chǎn)生、傳輸、存儲(chǔ)和使用[7]。由于大數(shù)據(jù)的規(guī)模沒有上限,且許多數(shù)據(jù)的生命周期極為短暫,因此,傳統(tǒng)安全產(chǎn)品要想繼續(xù)發(fā)揮作用,則需要及時(shí)解決大數(shù)據(jù)存儲(chǔ)和處理的動(dòng)態(tài)化、并行化特征,動(dòng)態(tài)跟蹤數(shù)據(jù)邊界,管理對(duì)數(shù)據(jù)的操作行為。
大數(shù)據(jù)的最大障礙不是在多大程度上取得成功,而是讓人們真正相信大數(shù)據(jù)、信任大數(shù)據(jù),這包括對(duì)別人數(shù)據(jù)的信任和自我數(shù)據(jù)被正確使用的信任。例如,近年來(lái)工資“被增長(zhǎng)”、CPI“被下降”、房?jī)r(jià)“被降低”、失業(yè)率“被減少”,因百姓的切身感受與統(tǒng)計(jì)數(shù)據(jù)之間的差異以及國(guó)家和地方之間GDP數(shù)據(jù)嚴(yán)重不符,都導(dǎo)致了市場(chǎng)對(duì)統(tǒng)計(jì)數(shù)據(jù)的質(zhì)疑。同時(shí),大數(shù)據(jù)的信任安全問題也不僅是指要相信大數(shù)據(jù)本身,還包括要相信可以通過數(shù)據(jù)獲得的成果。但是,要讓人們相信和信任通過大數(shù)據(jù)模型獲得的洞察信息卻并不容易,而證明大數(shù)據(jù)本身的價(jià)值比成功完成一個(gè)項(xiàng)目要更加困難。因此,構(gòu)建對(duì)大數(shù)據(jù)的安全信任至關(guān)重要,這需要政府機(jī)構(gòu)、企事業(yè)單位、個(gè)人等多方面共同建設(shè)和維護(hù)好大數(shù)據(jù)可信任的安全環(huán)境。
基于以上大數(shù)據(jù)環(huán)境的安全分析,作者認(rèn)為大數(shù)據(jù)安全應(yīng)該包括兩個(gè)層面的含義,如圖1所示。
圖1 大數(shù)據(jù)安全內(nèi)涵
大數(shù)據(jù)安全不同于關(guān)系型數(shù)據(jù)安全,大數(shù)據(jù)無(wú)論是在數(shù)據(jù)體量、結(jié)構(gòu)類型、處理速度、價(jià)值密度方面,還是在數(shù)據(jù)存儲(chǔ)、查詢模式、分析應(yīng)用上都與關(guān)系型數(shù)據(jù)有著顯著差異。大數(shù)據(jù)意味著數(shù)據(jù)及其承載系統(tǒng)的分布式,單個(gè)數(shù)據(jù)和系統(tǒng)的價(jià)值相對(duì)降低,空間和時(shí)間的大跨度、價(jià)值的稀疏,使得外部人員尋找價(jià)值攻擊點(diǎn)更不容易。但是,在大數(shù)據(jù)環(huán)境下完全的去中心化很難,只要存在中心就可能成為被攻擊的穴道,而對(duì)于低密度價(jià)值的提煉過程也是吸引攻擊的內(nèi)容。針對(duì)這些問題,傳統(tǒng)安全產(chǎn)品所使用的監(jiān)視、分析日志文件、發(fā)現(xiàn)數(shù)據(jù)和評(píng)估漏洞的技術(shù)在大數(shù)據(jù)環(huán)境中并不能有效運(yùn)行。很多傳統(tǒng)安全技術(shù)方案中,數(shù)據(jù)的大小會(huì)影響到安全控制或配套操作能否正確運(yùn)行。多數(shù)安全產(chǎn)品不能進(jìn)行調(diào)整,無(wú)法滿足大數(shù)據(jù)領(lǐng)域,也不能完全理解其面對(duì)的信息。而且,在大數(shù)據(jù)時(shí)代會(huì)有越來(lái)越多的數(shù)據(jù)開放,交叉使用,在這個(gè)過程中如何保護(hù)用戶隱私是最需要考慮的問題。圖2說(shuō)明了保障大數(shù)據(jù)安全的相關(guān)要點(diǎn)。
為解決大數(shù)據(jù)自身的安全問題,需要重新設(shè)計(jì)和構(gòu)建大數(shù)據(jù)安全架構(gòu)和開放數(shù)據(jù)服務(wù),從網(wǎng)絡(luò)安全、數(shù)據(jù)安全、災(zāi)難備份、安全風(fēng)險(xiǎn)管理、安全運(yùn)營(yíng)管理、安全事件管理、安全治理等各個(gè)角度考慮,部署整體的安全解決方案,保障大數(shù)據(jù)計(jì)算過程、數(shù)據(jù)形態(tài)、應(yīng)用價(jià)值的安全。
圖2 保障大數(shù)據(jù)安全
大數(shù)據(jù)為安全分析提供新的可能性,對(duì)于海量數(shù)據(jù)的分析有助于更好地刻畫網(wǎng)絡(luò)異常行為,從而找出數(shù)據(jù)中的風(fēng)險(xiǎn)點(diǎn),制定更好的預(yù)防攻擊、防止信息泄露的策略。例如網(wǎng)絡(luò)攻擊行為總會(huì)留下蛛絲馬跡,這些痕跡都以數(shù)據(jù)的形式隱藏在大數(shù)據(jù)中,利用大數(shù)據(jù)技術(shù)整合計(jì)算和處理資源有助于更有針對(duì)性地應(yīng)對(duì)信息安全威脅,有助于找到攻擊的源頭。在此過程中,需要注意兩個(gè)問題:一是大數(shù)據(jù)可能成為高級(jí)可持續(xù)攻擊的載體;二是大數(shù)據(jù)分析技術(shù)也容易被黑客利用到攻擊中去。需要明確大數(shù)據(jù)安全保障對(duì)象,加強(qiáng)對(duì)敏感和要害數(shù)據(jù)的監(jiān)管,加快面向大數(shù)據(jù)的信息安全技術(shù)的研究,建立并完善大數(shù)據(jù)信息安全體系。
大數(shù)據(jù)也為企業(yè)提供一個(gè)更寬廣的新視角,幫助它們更加前瞻性地發(fā)現(xiàn)安全威脅,利用大數(shù)據(jù)技術(shù)可以提升企業(yè)數(shù)據(jù)防護(hù)系統(tǒng)的安全效能、安全能力和安全效果??梢赃@樣講,大數(shù)據(jù)給信息安全帶來(lái)的最大改變是通過自動(dòng)化分析處理與深度挖掘,將之前很多時(shí)候亡羊補(bǔ)牢式的事中、事后處理,轉(zhuǎn)向事前自動(dòng)評(píng)估預(yù)測(cè)、應(yīng)急處理,讓安全防護(hù)主動(dòng)起來(lái)。
目前,大數(shù)據(jù)在信息安全領(lǐng)域的應(yīng)用包括兩個(gè)方面:宏觀上的網(wǎng)絡(luò)安全態(tài)勢(shì)感知和微觀上的安全威脅發(fā)現(xiàn)[8]。前者是指運(yùn)用大數(shù)據(jù)技術(shù)特有的海量存儲(chǔ)、并行計(jì)算、高效查詢等特點(diǎn),解決大規(guī)模網(wǎng)絡(luò)安全事件數(shù)據(jù)的有效獲取,海量安全事件數(shù)據(jù)的實(shí)時(shí)關(guān)聯(lián)分析,客觀、可理解的網(wǎng)絡(luò)安全指標(biāo)體系建立等問題,從中發(fā)現(xiàn)主機(jī)和網(wǎng)絡(luò)異常行為,起到全局安全預(yù)警的作用。后者是指從大數(shù)據(jù)中發(fā)現(xiàn)微觀事件,特別是APT攻擊發(fā)現(xiàn)。通過全面收集重要終端和服務(wù)器上的日志信息以及采集網(wǎng)絡(luò)設(shè)備上的原始流量,利用大數(shù)據(jù)技術(shù)進(jìn)行分析和挖掘,檢測(cè)并還原整個(gè)APT攻擊場(chǎng)景,能夠起到動(dòng)態(tài)預(yù)防的安全作用,如圖3所示。
在大數(shù)據(jù)產(chǎn)業(yè)鏈的各個(gè)環(huán)節(jié),安全問題無(wú)處不在,面對(duì)這一系列的安全風(fēng)險(xiǎn)和關(guān)鍵問題,如何保障大數(shù)據(jù)安全,并在信息安全領(lǐng)域有效利用,是企業(yè)需要認(rèn)真解決的問題。只有大數(shù)據(jù)技術(shù)和大數(shù)據(jù)安全“兩條腿”并行走路,大數(shù)據(jù)才可以真正成為企業(yè)的驅(qū)動(dòng)力。根據(jù)傳統(tǒng)信息安全成功經(jīng)驗(yàn)及最新安全技術(shù)發(fā)展結(jié)果,作者認(rèn)為可以從以下幾方面開展大數(shù)據(jù)安全工作。
數(shù)據(jù)信息安全是指數(shù)據(jù)信息的硬件、軟件及數(shù)據(jù)受到保護(hù),不因偶然的或者惡意的原因而遭到破壞、更改、泄露,系統(tǒng)連續(xù)可靠正常地運(yùn)行,信息服務(wù)不中斷。通常數(shù)據(jù)信息安全強(qiáng)調(diào)CIA三元組的目標(biāo),即保密性、完整性和可用性,另外還有一些其他目標(biāo),包括可追溯性、抗抵賴性、真實(shí)性、可控性等[9]。只有在正確完整的安全體系指導(dǎo)下,大數(shù)據(jù)信息安全建設(shè)所需的技術(shù)、產(chǎn)品、人員和操作等材料才能真正發(fā)揮各自的效力。設(shè)計(jì)大數(shù)據(jù)信息安全體系的目的在于:從管理和技術(shù)上保證數(shù)據(jù)安全策略得以完整準(zhǔn)確的實(shí)現(xiàn),全面準(zhǔn)確地滿足大數(shù)據(jù)安全需求。從具體內(nèi)容上來(lái)看,該安全體系應(yīng)該包含實(shí)現(xiàn)大數(shù)據(jù)環(huán)境下的信息安全所必需的功能或服務(wù)、安全機(jī)制和技術(shù)、管理和操作以及這些因素在整個(gè)體系中的合理部署和相互關(guān)系。所以,該安全體系應(yīng)該是多層次多方面的,必須能夠完整描述大數(shù)據(jù)環(huán)境下的數(shù)據(jù)信息安全建設(shè)所要實(shí)現(xiàn)的最終形態(tài)。
圖3 大數(shù)據(jù)與APT攻擊
大數(shù)據(jù)信息安全體系可以通過多種途徑表示,例如非常具體的框架或者比較抽象的模型。無(wú)論表現(xiàn)形式如何,大數(shù)據(jù)信息安全體系都應(yīng)該結(jié)合防護(hù)、檢測(cè)、響應(yīng)和恢復(fù)這幾個(gè)關(guān)鍵環(huán)節(jié)在一起的動(dòng)態(tài)發(fā)展的完整體系,能夠?yàn)榇髷?shù)據(jù)安全的解決方案和工程實(shí)施提供參考和依據(jù),幫助企業(yè)規(guī)范化、標(biāo)準(zhǔn)化大數(shù)據(jù)的安全防控內(nèi)容和防護(hù)框架。
大數(shù)據(jù)安全保障技術(shù)可以從物理安全、系統(tǒng)安全、網(wǎng)絡(luò)安全、存儲(chǔ)安全、訪問安全、審計(jì)安全、運(yùn)營(yíng)安全等角度進(jìn)行考慮,圍繞大數(shù)據(jù)全生命周期,即數(shù)據(jù)產(chǎn)生、采集、傳輸、存儲(chǔ)、處理、分析、發(fā)布、展示和應(yīng)用、產(chǎn)生新數(shù)據(jù)等階段進(jìn)行安全防護(hù)。其目標(biāo)在于:最大程度地保護(hù)具有流動(dòng)性和開放性特征的大數(shù)據(jù)自身安全,防止數(shù)據(jù)泄露、越權(quán)訪問、數(shù)據(jù)篡改、數(shù)據(jù)丟失、密鑰泄露、侵犯用戶隱私等問題的出現(xiàn)。因此,大數(shù)據(jù)安全保障技術(shù)需要設(shè)計(jì)和構(gòu)建更多的技術(shù)標(biāo)準(zhǔn)、安全規(guī)范、工具產(chǎn)品、安全服務(wù)等形式來(lái)保護(hù)大數(shù)據(jù)的安全。
1)農(nóng)機(jī)裝備水平高。主要表現(xiàn)為裝備標(biāo)準(zhǔn)高,配套農(nóng)具數(shù)量多;科技含量高,自動(dòng)化、智能化、機(jī)電液一體化程度高。
通過了解大數(shù)據(jù)安全內(nèi)涵和技術(shù)特點(diǎn),可以在信息安全領(lǐng)域利用大數(shù)據(jù)分析技術(shù),得到相關(guān)的安全預(yù)警和防護(hù)建議。例如,在大數(shù)據(jù)采集的基礎(chǔ)上,企業(yè)可以從原始數(shù)據(jù)中進(jìn)行二次提取,建立基礎(chǔ)指標(biāo)、應(yīng)用層指標(biāo)等多種類型指標(biāo),然后基于指標(biāo)之間的關(guān)聯(lián)分析、每個(gè)指標(biāo)的變化狀況,通過大數(shù)據(jù)分析幫助企業(yè)建立信譽(yù)評(píng)估機(jī)制,感知信息安全態(tài)勢(shì)。
通過技術(shù)保護(hù)大數(shù)據(jù)的安全必然重要,但安全管理制度也很關(guān)鍵。要從海量數(shù)據(jù)中提取價(jià)值,提高企業(yè)生產(chǎn)效率,就必須使用科學(xué)的大數(shù)據(jù)管理方法,降低各種安全隱患[10]。具體來(lái)說(shuō),可以從以下幾個(gè)方面進(jìn)行安全管理。
·規(guī)范大數(shù)據(jù)建設(shè)。規(guī)范化建設(shè)可以促進(jìn)大數(shù)據(jù)管理過程的正規(guī)有序,實(shí)現(xiàn)各級(jí)各類信息系統(tǒng)的網(wǎng)絡(luò)互連、數(shù)據(jù)集成、資源共享,在統(tǒng)一的安全規(guī)范框架下運(yùn)行。
·完善大數(shù)據(jù)資產(chǎn)管理。大數(shù)據(jù)資產(chǎn)管理要能夠清楚地定義數(shù)據(jù)元素,包括數(shù)據(jù)格式、別名、統(tǒng)計(jì)表以及其他特性標(biāo)識(shí)符等;描述數(shù)據(jù)元素定義的信息來(lái)源及其相關(guān)數(shù)據(jù)元素的信息;記錄使用信息,包括數(shù)據(jù)元素的產(chǎn)生及修改信息、安全及訪問控制信息、訪問歷史記錄。
·建立以數(shù)據(jù)為中心的安全系統(tǒng)。為了確保數(shù)據(jù)中心系統(tǒng)的安全,防護(hù)系統(tǒng)主要通過防火墻、入侵檢測(cè)系統(tǒng)、安全審計(jì)、抵抗拒絕服務(wù)攻擊、流量整形和控制、網(wǎng)絡(luò)防病毒系統(tǒng)來(lái)實(shí)現(xiàn)全面的安全防護(hù)。同時(shí),通過使用加密、識(shí)別管理并結(jié)合其他主動(dòng)安全管理技術(shù),貫穿于數(shù)據(jù)從使用到遷移、停用的全部過程。
·做好大數(shù)據(jù)安全風(fēng)險(xiǎn)評(píng)估。不同類型的數(shù)據(jù)形式以及數(shù)據(jù)的不同狀態(tài),都有其不同的泄密風(fēng)險(xiǎn)層級(jí)。針對(duì)大數(shù)據(jù)的固有特點(diǎn),可以將其分為不同的安全風(fēng)險(xiǎn)等級(jí),從而加強(qiáng)安全防范,并在實(shí)際生產(chǎn)中明確安全風(fēng)險(xiǎn)治理目標(biāo),降低企業(yè)數(shù)據(jù)泄露風(fēng)險(xiǎn),分析并消除信息安全盲點(diǎn)。
·提高企業(yè)員工安全意識(shí)。需要提升員工對(duì)大數(shù)據(jù)安全威脅的識(shí)別能力,了解正在使用的數(shù)據(jù)的價(jià)值,充分認(rèn)識(shí)到自己在企業(yè)數(shù)據(jù)安全中的重要角色。企業(yè)也需要對(duì)員工進(jìn)行安全培訓(xùn),讓員工對(duì)彼此在安全防護(hù)中的職責(zé)和戰(zhàn)略有所了解,并結(jié)合周期性的安全攻擊演習(xí),以檢驗(yàn)培訓(xùn)的成果。
本文梳理了互聯(lián)網(wǎng)、電信、金融、醫(yī)療、政府組織五大行業(yè)的大數(shù)據(jù)安全需求,分析出大數(shù)據(jù)環(huán)境下的6個(gè)安全特征和問題,即移動(dòng)數(shù)據(jù)安全、易攻擊目標(biāo)、用戶隱私保護(hù)難題、安全存儲(chǔ)問題、數(shù)據(jù)安全進(jìn)化、信任安全問題等。隨后,文中提煉出大數(shù)據(jù)的安全內(nèi)涵,即保障大數(shù)據(jù)安全和應(yīng)用大數(shù)據(jù)技術(shù),并給出了相關(guān)的應(yīng)對(duì)策略。
1 The big data security gap:protecting the Hadoop custer challenges and opportunities with big data.http://www.zettaset.com/info-center/datasheets/zettaset_wp_security_0413.pdf
2 馮偉.大數(shù)據(jù)時(shí)代面臨的信息安全機(jī)遇和挑戰(zhàn).中國(guó)科技投資,2012(34):49~53
3 王文超,石海明,曾華鋒.芻議大數(shù)據(jù)時(shí)代的國(guó)家信息安全.國(guó)防科技,2013,34(2):1~5
4 聶元銘.大數(shù)據(jù)及其安全研究.信息安全與通信.2013(5):15~16
5 楊建春.網(wǎng)絡(luò)環(huán)境下數(shù)據(jù)安全控制技術(shù)研究,甘肅科技,2011(16):22~24
6 劉正偉,張華忠,文中領(lǐng)等.海量數(shù)據(jù)持續(xù)數(shù)據(jù)保護(hù)技術(shù)研究及實(shí)現(xiàn).計(jì)算機(jī)研究與發(fā)展,2012(s1):37~41
7 郭三強(qiáng),郭燕錦.大數(shù)據(jù)環(huán)境下的數(shù)據(jù)安全研究.科技廣場(chǎng).2013(2):28~31
8潘柱廷.高端信息安全與大數(shù)據(jù).信息安全與通信保密,2012(12):19~20
9 嚴(yán)霄鳳,張德馨.大數(shù)據(jù)研究.計(jì)算機(jī)技術(shù)與發(fā)展,2013(4):168~172
10 楊高明,楊靜,張健沛.隱私保護(hù)的數(shù)據(jù)發(fā)布研究.計(jì)算機(jī)科學(xué),2011,38(9):11~17