王東 陳靜
摘 要:在當(dāng)前移動互聯(lián)時代,云計算、物聯(lián)網(wǎng)等新的信息技術(shù)的發(fā)展,大數(shù)據(jù)逐漸成了通信運營商關(guān)注的焦點。文章結(jié)合大數(shù)據(jù)的相關(guān)概念,對大數(shù)據(jù)平臺建設(shè)中所面臨的安全問題進(jìn)行分析,希望為運營商大數(shù)據(jù)平臺的安全建設(shè)提供一些借鑒。
關(guān)鍵詞:大數(shù)據(jù);安全;數(shù)據(jù)脫敏;數(shù)據(jù)防泄漏
自移動互聯(lián)網(wǎng)、云計算之后,現(xiàn)在最流行的詞語莫過于“大數(shù)據(jù)”。隨著各種網(wǎng)絡(luò)的融合、移動終端設(shè)備便捷消費與服務(wù)的興起,所積累的數(shù)據(jù)也在呈幾何級增長,這些數(shù)據(jù)量大、移動速度快,我們通常稱之為“大數(shù)據(jù)”。大數(shù)據(jù)已經(jīng)無處不在,當(dāng)人們晚上在家看電視劇時,拿著手機在瀏覽新聞頁面時,或是使用各種手機軟件時,無形中大數(shù)據(jù)已經(jīng)包圍著我們形成了一個流量的氣場。
1 大數(shù)據(jù)的相關(guān)概念
大數(shù)據(jù),是指由許多不同的數(shù)據(jù)集匯合而成的數(shù)據(jù)集合,規(guī)模極其龐大復(fù)雜,采用當(dāng)前常規(guī)的數(shù)據(jù)處理工具和數(shù)據(jù)管理技術(shù)無法進(jìn)行有效處理。當(dāng)前,業(yè)界廣泛認(rèn)同的大數(shù)據(jù)的特征,主要體現(xiàn)在4個方面,即容量、類型、價值以及速度[1]。
(1)數(shù)據(jù)量巨大,數(shù)據(jù)成倍增長。最近幾年,全球數(shù)據(jù)量呈現(xiàn)出前所未有的增長趨勢,計量單位由TB級別躍升到PB、EB乃至 ZB級別(1024進(jìn)制),其所帶來的技術(shù)挑戰(zhàn),是巨量數(shù)據(jù)存儲技術(shù)。
(2)數(shù)據(jù)類型多,包括了結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)以及非結(jié)構(gòu)化數(shù)據(jù),而且數(shù)據(jù)也不再是單一的文本形式,而是包括了日志、圖表、視頻等,對于數(shù)據(jù)處理能力提出了更高的要求。多樣化的數(shù)據(jù)類型所帶來的挑戰(zhàn),是非結(jié)構(gòu)化數(shù)據(jù)處理技術(shù)。
(3)價值密度低,在龐雜的數(shù)據(jù)中,可能僅僅只有極少的數(shù)據(jù)才有相應(yīng)的價值,如何對數(shù)據(jù)進(jìn)行提純和深入挖掘,找出有價值的信息,是一個亟待解決的問題。
(4)處理速度快,要求實現(xiàn)信息的實時獲取,其所帶來的挑戰(zhàn)是實時數(shù)據(jù)處理技術(shù)。
2 大數(shù)據(jù)的安全
隨著數(shù)據(jù)資產(chǎn)價值持續(xù)攀升、大數(shù)據(jù)產(chǎn)業(yè)規(guī)模不斷壯大,大數(shù)據(jù)技術(shù)在改善社會生產(chǎn)生活的同時,其安全問題也逐漸顯現(xiàn)出來。2017年1月,大數(shù)據(jù)基礎(chǔ)軟件陷入一場全球范圍的大規(guī)模勒索攻擊,Hadoop集群被黑客鎖定為攻擊對象。同時,據(jù)Shodan互聯(lián)網(wǎng)設(shè)備搜索引擎的分析顯示,因Hadoop服務(wù)器配置不當(dāng)導(dǎo)致5 120 TB數(shù)據(jù)暴露在公網(wǎng)上,涉及近4 500臺HDFS服務(wù)器。同時,近年來全球數(shù)據(jù)安全事件層出不窮,如何在大數(shù)據(jù)時代處理好數(shù)據(jù)安全問題成為全球普遍關(guān)注的熱點[2]。
下面針對某運營商關(guān)于大數(shù)據(jù)安全問題進(jìn)行詳細(xì)介紹。
2.1 大數(shù)據(jù)中心面臨的安全挑戰(zhàn)
大數(shù)據(jù)中心面臨的安全挑戰(zhàn)如圖1所示。
數(shù)據(jù)安全風(fēng)險分析如圖2所示。
2.2 大數(shù)據(jù)安全發(fā)展的建議
面對大數(shù)據(jù)時代嚴(yán)峻復(fù)雜的安全問題,亟需采取針對性的手段措施,構(gòu)建大數(shù)據(jù)安全保障體系,為大數(shù)據(jù)產(chǎn)業(yè)健康發(fā)展保駕護(hù)航[3]。
2.2.1 安全防護(hù)技術(shù)體系架構(gòu)
安全防護(hù)技術(shù)體系架構(gòu)如圖3所示。
可以看出,大數(shù)據(jù)在不斷發(fā)展的同時,也伴隨著巨大的風(fēng)險。接下來針對國內(nèi)某運營商關(guān)于數(shù)據(jù)安全中的數(shù)據(jù)脫敏以及數(shù)據(jù)防泄漏進(jìn)行詳細(xì)介紹。
2.2.2 數(shù)據(jù)脫敏
數(shù)據(jù)脫敏,又稱數(shù)據(jù)漂白、數(shù)據(jù)去隱私化或數(shù)據(jù)變形。數(shù)據(jù)脫敏的定義為:指對某些敏感信息通過脫敏規(guī)則進(jìn)行數(shù)據(jù)的變形,實現(xiàn)敏感隱私數(shù)據(jù)的可靠保護(hù)。這樣,就可以在開發(fā)、測試和其他非生產(chǎn)環(huán)境以及外包環(huán)境中安全地使用脫敏后的真實數(shù)據(jù)集。
2.2.3 數(shù)據(jù)脫敏系統(tǒng)
針對敏感數(shù)據(jù)的脫敏工作,建設(shè)數(shù)據(jù)脫敏系統(tǒng)。系統(tǒng)功能架構(gòu)至少包含數(shù)據(jù)源管理、分類分級、敏感數(shù)據(jù)自動發(fā)現(xiàn)、敏感數(shù)據(jù)手工定義、敏感數(shù)據(jù)分布視圖、支持脫敏算法類型、靜態(tài)脫敏、動態(tài)脫敏等。
系統(tǒng)架構(gòu)按照“高內(nèi)聚、松耦合”的設(shè)計原則,脫敏節(jié)點具備良好的可擴展性,在數(shù)據(jù)源管理上實現(xiàn)數(shù)據(jù)庫創(chuàng)建、數(shù)據(jù)庫編輯、數(shù)據(jù)庫列表查詢、數(shù)據(jù)庫聯(lián)通性測試、數(shù)據(jù)庫刪除等功能[4]。
(1)敏感數(shù)據(jù)分類分級。
敏感數(shù)據(jù)分類管理,支持將企業(yè)的敏感數(shù)據(jù)分類信息進(jìn)行電子化管理,根據(jù)實際情況,業(yè)務(wù)上滿足分類信息多層級聯(lián)。系統(tǒng)主要實現(xiàn)分類信息的創(chuàng)建、分類信息編輯、分類列表查詢、分類信息刪除等功能。
敏感數(shù)據(jù)分級管理,支持將企業(yè)的敏感數(shù)據(jù)進(jìn)行敏感定級,根據(jù)敏感數(shù)據(jù)對企業(yè)的重要程度,來規(guī)劃數(shù)據(jù)敏感級別,由高到低可以分為:高敏感級、中敏感級、低敏感級。管理上根據(jù)敏感級別來設(shè)定脫敏策略。系統(tǒng)主要實現(xiàn)分級信息的創(chuàng)建、分級信息編輯、分級列表查詢、分級信息刪除等功能。
(2)動態(tài)脫敏。
動態(tài)脫敏系統(tǒng)包括默認(rèn)脫敏策略管理、代理管理、脫敏特性幾大模塊。
默認(rèn)脫敏策略管理針對動態(tài)脫敏任務(wù),為每種敏感數(shù)據(jù)標(biāo)簽設(shè)定默認(rèn)脫敏算法。如有特殊需求,可以配置例外,即針對某數(shù)據(jù)庫,根據(jù)訪問用戶的不同,修改脫敏算法配置。
代理管理可配置代理主機、代理程序、代理端口等內(nèi)容,配置完成后,用戶通過代理通道進(jìn)行數(shù)據(jù)庫業(yè)務(wù)訪問。
關(guān)于脫敏特性,系統(tǒng)將實現(xiàn)數(shù)據(jù)庫函數(shù)脫敏,函數(shù)包括不限于acos(),asin(),acos(),asin(),acos(),asin();實現(xiàn)敏感數(shù)據(jù)遷移脫敏,當(dāng)用戶將某張表的敏感數(shù)據(jù)遷移到新表中,隨后用戶對新表進(jìn)行查詢操作,對于新表中的敏感數(shù)據(jù)同樣需要進(jìn)行敏感數(shù)據(jù)處理;實現(xiàn)跨schema訪問脫敏,同一數(shù)據(jù)庫用戶,一次查詢的數(shù)據(jù)來源于多個schema時,對多個schema中存在的敏感數(shù)據(jù)進(jìn)行脫敏;實現(xiàn)分權(quán)限脫敏,當(dāng)多個不同數(shù)據(jù)庫用戶訪問同一份敏感數(shù)據(jù)時,可以根據(jù)預(yù)先設(shè)定的規(guī)則,做到不同的數(shù)據(jù)庫用戶查詢到不同的敏感數(shù)據(jù)。
(3)靜態(tài)脫敏。
靜態(tài)脫敏包括默認(rèn)脫敏策略管理、脫敏任務(wù)管理、調(diào)度任務(wù)管理、子集模板管理幾大模塊。
針對靜態(tài)脫敏任務(wù),為每種敏感數(shù)據(jù)標(biāo)簽設(shè)定默認(rèn)脫敏算法。使用默認(rèn)策略,降低了每個任務(wù)的配置工作量,提升效率。如有特殊需求,在脫敏任務(wù)中可以修改敏感數(shù)據(jù)的脫敏算法;支持默認(rèn)脫敏策略查詢;支持默認(rèn)脫敏策略列表展示;支持通過標(biāo)簽進(jìn)行條件查詢;支持默認(rèn)脫敏策略編輯。
脫敏任務(wù)管理要求系統(tǒng)在脫敏任務(wù)中配置源庫、目標(biāo)庫、數(shù)據(jù)表范圍、任務(wù)級脫敏算法等信息。脫敏任務(wù)一次配置,支持多次執(zhí)行。脫敏任務(wù)執(zhí)行過程中提供數(shù)據(jù)表脫敏進(jìn)度條提示。脫敏任務(wù)執(zhí)行后,有詳細(xì)的脫敏任務(wù)報告。同時脫敏任務(wù)可兼容執(zhí)行過程中遇到的異常情況,支持跳過異常數(shù)據(jù)繼續(xù)執(zhí)行任務(wù)。
調(diào)度任務(wù)管理需要脫敏任務(wù)按時間維度配置定時調(diào)度,解決周期性脫敏工作需要手工執(zhí)行的問題,包括調(diào)度任務(wù)創(chuàng)建、編輯、列表查詢、刪除等功能。
子集模板管理中可以指定從表中抽取固定條數(shù),也可以指定where條件,將滿足條件的數(shù)據(jù)脫敏。同時系統(tǒng)支持子集模板的創(chuàng)建、子集表的配置、子集模板查詢、子集模板刪除等功能。
2.2.4 數(shù)據(jù)防泄密系統(tǒng)
數(shù)據(jù)防泄密(Data Leak Prevention,DLP)系統(tǒng),將DLP管理平臺、第三方權(quán)限控制系統(tǒng)實現(xiàn)無縫結(jié)合,支持大規(guī)模的網(wǎng)絡(luò)快速部署,實現(xiàn)最完美優(yōu)化整合。
平臺集中部署,用戶終端設(shè)備通過部署在DMZ區(qū)的認(rèn)證中心對應(yīng)用進(jìn)行訪問;管理員通過訪問部署在內(nèi)網(wǎng)的核心服務(wù)器、應(yīng)用服務(wù)器核心機密數(shù)據(jù)進(jìn)行管理。結(jié)合DLP系統(tǒng)平臺架構(gòu)和模塊特性,考慮到核心業(yè)務(wù)模塊如數(shù)據(jù)庫、應(yīng)用等具備熱備能力,核心服務(wù)器應(yīng)具有負(fù)載均衡能力,進(jìn)行服務(wù)器功能調(diào)整,通過對物理機劃分虛擬空間的做法,實現(xiàn)服務(wù)器劃分主備,從而達(dá)到熱備及容災(zāi)的功能。
DLP系統(tǒng)提供了一整套完整的公鑰、私鑰生成、管理、回收機制和審計機制,可以覆蓋海量用戶管理全生命周期過程。
(1)集中管理、權(quán)限管理。
DLP系統(tǒng)提供完整的配置集中管理功能,管理人員可以通過配置集中管理服務(wù),對DLP系統(tǒng)進(jìn)行配置的集中管理。
DLP系統(tǒng)提供完整的權(quán)限分類分級管理功能,管理人員可以通過權(quán)限分類分級管理服務(wù),對DLP系統(tǒng)進(jìn)行權(quán)限的集中管理。所有管控權(quán)限均在一套完整的體系系統(tǒng)中實現(xiàn),具備多層橫縱管控體系設(shè)計,整體權(quán)限管控明晰、隔離、合理。
(2)文件識別與防護(hù)。
DLP系統(tǒng)具有完善的文件加密功能。
按文件類型分DLP系統(tǒng)支持文件類型包括word,ppt,pdf,excel,txt,常見的功能類文件,設(shè)計文件和信息系統(tǒng)運維類文件。
按文件來源分,DLP系統(tǒng)支持業(yè)務(wù)系統(tǒng)數(shù)據(jù)和后臺系統(tǒng)數(shù)據(jù)。
業(yè)務(wù)系統(tǒng):業(yè)務(wù)系統(tǒng)數(shù)據(jù)可通過接口方式實現(xiàn)數(shù)據(jù)重定向,從業(yè)務(wù)系統(tǒng)的下載數(shù)據(jù)轉(zhuǎn)存到數(shù)據(jù)防泄密系統(tǒng)的個人文件夾中。
后臺系統(tǒng)數(shù)據(jù)通過運維工具的統(tǒng)一管理直接實現(xiàn)數(shù)據(jù)下載管理。
(3)用戶認(rèn)證。
DLP系統(tǒng)支持多種認(rèn)證實現(xiàn)方式:支持LDAP認(rèn)證、支持Radius認(rèn)證、支持AD認(rèn)證、支持短信認(rèn)證等各種二次認(rèn)證方式,具有豐富的認(rèn)證對接經(jīng)驗。
支持用戶名密碼認(rèn)證、臨時用戶認(rèn)證、機器捆綁認(rèn)證、手機短信認(rèn)證、AD域認(rèn)證、LDAP認(rèn)證、U-KEY認(rèn)證等;可查看登陸狀態(tài)、登錄時間等。
(4)數(shù)據(jù)防泄密功能設(shè)計。
DLP系統(tǒng)要全天候地為用戶提供工程系統(tǒng)故障維護(hù)、故障設(shè)備維修服務(wù)及受理用戶各類投訴,以保證用戶系統(tǒng)能連續(xù)、高效、穩(wěn)定運行。
具有完善的防泄密文件服務(wù)管理功能。企業(yè)可通過文件集中存儲服務(wù)器對企業(yè)數(shù)據(jù)進(jìn)行統(tǒng)一管理,通過對文件的歸集和管理,實現(xiàn)對文件流向的管控和事后審計;通過對文件的加密、轉(zhuǎn)換實現(xiàn)對外發(fā)文件的保護(hù);通過對文件的備份、打水印等操作實現(xiàn)對核心文件的保護(hù);通過提供的在線查閱、在線編輯功能,實現(xiàn)云端文件保護(hù);通過文件數(shù)據(jù)接口與三方系統(tǒng)和底層存儲設(shè)備通信,達(dá)到文件存儲的適配性以及文件交互的通用性。總之,通過DLP系統(tǒng)文件服務(wù)器,可以實現(xiàn)文件的集中存儲、統(tǒng)一管理。
擁有完全獨立且可配置配額的個人文件夾,以非對稱加密進(jìn)行加密存儲日常工作中的各種數(shù)據(jù)。
客戶端作為加密客戶端的計算機,其下載的文檔自動加密,加密文檔在內(nèi)部授權(quán)環(huán)境內(nèi)可正常使用,未經(jīng)授權(quán)無法使用。
系統(tǒng)通過透明加密的模式,實現(xiàn)了電子文件無論是由人工生產(chǎn)還是由應(yīng)用系統(tǒng)生成的,只要寫在磁盤上就是加密存儲的;文件生成的參與者被系統(tǒng)授權(quán)許可使用這些加密的文件,可以接觸操作這些內(nèi)容;如果未經(jīng)合法許可將加密文件數(shù)據(jù)體帶走,加密文件內(nèi)容將不能夠被正常打開,文件內(nèi)容不會因為文件數(shù)據(jù)體擴散而擴散。
系統(tǒng)采用系統(tǒng)內(nèi)核層文件過濾驅(qū)動實現(xiàn)文件的加密、解密,速度快、安全、穩(wěn)定,不易損壞文件。采用符合國家標(biāo)準(zhǔn)的國密算法,保證了加密過后的文件的安全性。最大支持1024位的秘鑰長度,也大幅度提升了加密文件的安全級別。
2.3 本章小結(jié)
本章節(jié)通過對國內(nèi)某運營商進(jìn)行分析,將其在大數(shù)據(jù)中心實際運營中所遇到的問題進(jìn)行列舉,并重點針對其中的數(shù)據(jù)脫敏與數(shù)據(jù)防泄漏進(jìn)行詳細(xì)介紹,將數(shù)據(jù)脫敏系統(tǒng)與數(shù)據(jù)防泄漏系統(tǒng)的建設(shè)方案與所實現(xiàn)的功能一一講解。
3 結(jié)語
大數(shù)據(jù)時代已經(jīng)到來,運營商在意識到其中數(shù)據(jù)價值重要性的同時,關(guān)于隨之而來的大數(shù)據(jù)安全性也應(yīng)該給予重視。在網(wǎng)絡(luò)時代,犯罪分子能夠更加容易地獲取他人的信息及隱私,犯罪手段和方法也在不斷增加。如何保護(hù)用戶的信息安全是大數(shù)據(jù)時代一個很重要的課題。隨著大數(shù)據(jù)的不斷增加,在數(shù)據(jù)存儲安全方面的要求也會越來越高??傊?,運營商在運用大數(shù)據(jù)創(chuàng)造價值的時候也要有效地解決好安全問題。
[參考文獻(xiàn)]
[1]趙躍東,王雋峰,曾王平.電信運營商大數(shù)據(jù)應(yīng)用系統(tǒng)建設(shè)方案研究[J].中國新通信,2015(4):81-82.
[2]馮明麗,陳志彬.基于電信運營商的大數(shù)據(jù)解決方案分析[J].通信與信息技術(shù),2013(5):35-40.
[3]趙晶.針對運營商的大數(shù)據(jù)建設(shè)方案研究[J].電信工程技術(shù)與標(biāo)準(zhǔn)化,2015(3):17-21.
[4]高智衡.運營商勇闖“大數(shù)據(jù)”機遇大于挑戰(zhàn)[J].通信世界,2012(29):33.