張新華
(太原學(xué)院 山西 太原 030012)
現(xiàn)如今互聯(lián)網(wǎng)信息技術(shù)發(fā)展迅速,人們對信息保護(hù)的要求也在不斷提高,國家也出臺了多項(xiàng)法律法規(guī)及相關(guān)文件,保護(hù)廣大用戶的合法權(quán)益。目前大數(shù)據(jù)技術(shù)得到了各行各業(yè)的廣泛應(yīng)用,但是對一些敏感數(shù)據(jù)的保護(hù)仍不完善,需要不斷進(jìn)行優(yōu)化。因此對大數(shù)據(jù)安全與敏感數(shù)據(jù)保護(hù)技術(shù)的應(yīng)用進(jìn)行研究十分重要。
現(xiàn)如今大數(shù)據(jù)技術(shù)得到了企業(yè)的廣泛應(yīng)用,取得了明顯的成效,Hdaoop屬于一種高效的分布式處理系統(tǒng),應(yīng)用十分廣泛。大數(shù)據(jù)平臺中涵蓋著海量資源數(shù)據(jù),基于平臺體系的安全性,平臺安全防護(hù)技術(shù)需要滿足信任性、可靠性、追溯性、保密性等要求,將安全基線控制點(diǎn)、基線描述情況及檢測作為評估標(biāo)準(zhǔn),有效提高安全性能[1]。
大數(shù)據(jù)平臺構(gòu)件源于開源體系,企業(yè)版的安全防護(hù)性能較強(qiáng),但是相較于傳統(tǒng)數(shù)據(jù)庫安全管理要求,需要重點(diǎn)管理開源構(gòu)件安全防護(hù)的脆弱性,不斷強(qiáng)化安全技術(shù)保障工作。
大數(shù)據(jù)平臺安全防護(hù)需要收集的數(shù)據(jù)較多,并且數(shù)據(jù)類型豐富多樣,例如文件數(shù)據(jù)、庫表數(shù)據(jù)等。需要根據(jù)數(shù)據(jù)類型選擇不同的收集方式。數(shù)據(jù)進(jìn)入大數(shù)據(jù)安全平臺需要通過多項(xiàng)措施確保其安全性,并且整個(gè)收集流程均需要通過4A系統(tǒng)加以監(jiān)管。
2.2.1 數(shù)據(jù)收集認(rèn)證健全
工作人員在對數(shù)據(jù)進(jìn)行收集的過程中,需要根據(jù)不同的收集方法選擇不同的鑒權(quán),主要包括下述幾點(diǎn)。第一,落實(shí)Kerberos認(rèn)證服務(wù)對用戶身份認(rèn)證。第二,使用賬號密碼、短信及口令等認(rèn)證方法對收集過程的身份進(jìn)行有效認(rèn)證。第三,對收集系統(tǒng)的IP地址和端口號進(jìn)行限制,保證IP和端口的規(guī)范性和合格性。
2.2.2 HDFS平臺安全
HDFS平臺應(yīng)用較為廣泛,具有認(rèn)證功能和授權(quán)功能。認(rèn)證主要指確保某個(gè)用戶為自己的用戶,授權(quán)主要指用戶能夠操作全新實(shí)體,如果不具備則無法進(jìn)行操作。在這一前提下增設(shè)一些其他方法,例如HDFS透明加密、HDFS快照等,提高安全防護(hù)的水平。
2.2.3 多租戶安全
大數(shù)據(jù)安全平臺在使用過程中不但需要符合內(nèi)部使用的要求,并且還要符合外部相關(guān)要求,提高對不同類型數(shù)據(jù)存儲的實(shí)效性,使用戶和用戶間數(shù)據(jù)隔離開,并且保證租戶運(yùn)行不同作業(yè)不會(huì)互相影響,確保不同業(yè)務(wù)在平臺的安全運(yùn)轉(zhuǎn)。除此之外,還需要為租戶創(chuàng)設(shè)或者提供資源,其主要范圍為大數(shù)據(jù)管理Hadoop集群資源,建立Hadoop用戶,對存儲容量進(jìn)行分配。
根據(jù)外部應(yīng)用和環(huán)境,可以將敏感數(shù)據(jù)分為以下四大類。第一,A類主要指用戶身份數(shù)據(jù),其主要內(nèi)容包括身份顯示、網(wǎng)絡(luò)身份、相關(guān)基本資料和身份證明等。第二,B類,主要指的服務(wù)及內(nèi)容相關(guān)數(shù)據(jù),內(nèi)容多為訂購內(nèi)容相關(guān)數(shù)據(jù)信息。第三,C類,通常指服務(wù)和衍生數(shù)據(jù),其內(nèi)容多為服務(wù)記錄、消費(fèi)信息及賬單明細(xì)等。第四,D類,主要指管理數(shù)據(jù)。其內(nèi)容豐富,多為企業(yè)管理數(shù)據(jù)、運(yùn)維數(shù)據(jù)以及合作企業(yè)數(shù)據(jù)等。
大數(shù)據(jù)平臺中體現(xiàn)的數(shù)據(jù)形式也屬于類別規(guī)定的一種,例如原始數(shù)據(jù)以及脫敏數(shù)據(jù)等。前者不具有開放性的特點(diǎn),安全等級較高。脫敏數(shù)據(jù)具有一定的復(fù)雜性,主要指則是將網(wǎng)絡(luò)身份標(biāo)識等一系列敏感特性進(jìn)行相應(yīng)處理后,產(chǎn)生無法識別。推算的全新數(shù)據(jù),具有一定的安全性。在工作人員匿名化操作或者脫敏數(shù)據(jù)時(shí),需要嚴(yán)格遵守分級安全防護(hù)的具體規(guī)范,在此前提下結(jié)合使用環(huán)境,做好準(zhǔn)備工作,對敏感風(fēng)險(xiǎn)數(shù)據(jù)進(jìn)行全面分析[2]。
3.2.1 動(dòng)態(tài)數(shù)據(jù)脫敏
動(dòng)態(tài)數(shù)據(jù)脫敏較為常用,主要指在對敏感數(shù)據(jù)訪問時(shí)進(jìn)行脫敏,符合生產(chǎn)環(huán)境相關(guān)要求,同時(shí)需要注意,如果需要對同一敏感數(shù)據(jù)在讀取時(shí)進(jìn)行不同等級的脫敏,對于解決身份訪問問題、靜態(tài)數(shù)據(jù)屏蔽等相關(guān)問題具有積極作用。
數(shù)據(jù)脫敏環(huán)境的類型豐富,根據(jù)其性質(zhì)可以對其類型進(jìn)行合理劃分,主要包括前端展示、外部接口調(diào)用以及投訴處理查詢后臺等。對不同的用戶來說,能夠直觀地看到不同敏感數(shù)據(jù)經(jīng)過脫敏處理后得到的具體結(jié)果。在進(jìn)行開發(fā)測試的過程中,對報(bào)表取數(shù)的結(jié)果進(jìn)修分析,分析人員可以得到不同的脫敏結(jié)果。主要方法包括下述兩點(diǎn)。第一,動(dòng)態(tài)脫敏能夠根據(jù)數(shù)據(jù)訪問用戶名、IP信息等實(shí)現(xiàn)脫敏的訪問管控。第二,工作人員還需要加強(qiáng)對生產(chǎn)數(shù)據(jù)庫中的返回?cái)?shù)據(jù)的重視,采取動(dòng)態(tài)脫敏的方法效果理想,有助于保證屏蔽、加密等措施的有效實(shí)施。
3.2.2 數(shù)據(jù)匿名處理及敏感信息保護(hù)
該項(xiàng)技術(shù)的主要內(nèi)容為分析敏感數(shù)據(jù)存在的風(fēng)險(xiǎn),K匿名、等價(jià)匿名是較為常用的匿名處理方法,對其進(jìn)行合理應(yīng)用能夠在數(shù)據(jù)分析時(shí)減少安全隱患風(fēng)險(xiǎn)問題發(fā)生。其中K匿名算法具有實(shí)用性,屬于新型算法的一種,能夠在應(yīng)用過程中強(qiáng)化對用戶位置信息的保護(hù),效果確切。通過對該算法的有效應(yīng)用對于預(yù)防數(shù)據(jù)脫敏嚴(yán)重致使數(shù)據(jù)價(jià)值下滑問題具有積極作用。同時(shí)還能夠有效解決敏感數(shù)據(jù)在準(zhǔn)標(biāo)識符分析環(huán)節(jié)攻擊鏈數(shù)據(jù)遺失以及泄露等問題,具有一定的安全性[3]。
綜上所述,目前大數(shù)據(jù)平臺安全及敏感數(shù)據(jù)保護(hù)已經(jīng)得到了廣泛的應(yīng)用,通過實(shí)踐證明其作用明顯、效果理想,得到了諸多企業(yè)的廣泛應(yīng)用。萬物連接物聯(lián)網(wǎng)未來安全的重心在于基礎(chǔ)設(shè)施安全保護(hù)和敏感數(shù)據(jù)保護(hù)。隨著科技的飛速發(fā)展,大數(shù)據(jù)安全的內(nèi)容也會(huì)變得愈發(fā)豐富多樣,未來發(fā)展過程中還需要提高對人工智能等技術(shù)的應(yīng)用水平,加強(qiáng)對大數(shù)據(jù)海量信息數(shù)據(jù)的應(yīng)用,保證安全態(tài)勢感知的。