書名:大數(shù)據(jù)治理與安全:從理論到開源實踐
作者:劉馳,胡柏青,謝一,等
出版社:機械工業(yè)出版社
ISBN: 9787111579977
出版時間:2017年8月
定價:79元
在當今的時代背景下,大數(shù)據(jù)已經(jīng)逐漸成為人們?nèi)粘U務摰臒狳c話題。大數(shù)據(jù)是伴隨互聯(lián)網(wǎng)與信息技術(shù)發(fā)展而產(chǎn)生的一類新興技術(shù),在各個行業(yè)的應用均具有廣闊前景。但需要注意的是,在大數(shù)據(jù)應用為人們提供便利的同時,在具體使用過程中也帶來不少安全問題。關于大數(shù)據(jù)治理以及安全技術(shù)的相關問題,已有學者從理論到開源實踐進行了專門的分析和研究。
《大數(shù)據(jù)治理與安全:從理論到開源實踐》一書共7章,主要分為2個部分,分別是理論篇和實現(xiàn)篇,除介紹相關基礎理論以外,十分重視技術(shù)平臺的搭建與部署。書中對相關內(nèi)容的介紹本著“從簡單到復雜,逐步深化”的原則。對于涉及到的其他相關知識點和難點都給予了比較細致的解釋。該書作者結(jié)合一些實際的情境,分析相關方案的設計與實現(xiàn)過程,為一些學習者的實踐提供有效的參考。本書理論章節(jié)主要包含前2章,第1章介紹大數(shù)據(jù)治理技術(shù),包含基本概念、大數(shù)據(jù)治理的意義和重要價值,治理框架、治理的原則、范圍、實施和評估;第2章介紹大數(shù)據(jù)的安全、隱私保護以及審計技術(shù),具體內(nèi)容包含:大數(shù)據(jù)安全的意義和重要作用,面臨的問題與挑戰(zhàn),大數(shù)據(jù)安全防護技術(shù),大數(shù)據(jù)隱私保護的意義作用,面臨的問題和挑戰(zhàn),大數(shù)據(jù)審計的相關內(nèi)容概述。在開源實現(xiàn)篇當中,包含其余5章,第3章闡述Apache Falcon技術(shù)的概況、發(fā)展近況、技術(shù)優(yōu)勢以及架構(gòu)和使用情況,同時涵蓋這一技術(shù)的場景設計和實現(xiàn)、性能與優(yōu)化分析;第4章介紹大數(shù)據(jù)治理當中的Apache Atlas技術(shù),對該技術(shù)的整體發(fā)展情況、技術(shù)優(yōu)勢、架構(gòu)以及發(fā)展近況、配置和使用情況進行闡述,在使用當中具體介紹添加或者修改、配置Hive、配置Sqoop、配置Storm、配置Falcon等,同時也包含相關的場景設計、優(yōu)化和性能分析等;第5章介紹大數(shù)據(jù)安全當中的Apache Ranger,對該技術(shù)的整體情況、發(fā)展史、概況、特點和作用、應用場景、架構(gòu)和安裝布置等內(nèi)容進行介紹,包含其功能配置和優(yōu)化、性能分析;第6章介紹大數(shù)據(jù)安全內(nèi)容當中的Apache Sentry,具體分析其技術(shù)基本情況、發(fā)展歷程、技術(shù)優(yōu)勢和架構(gòu)、安裝配置等內(nèi)容;第7章介紹大數(shù)據(jù)安全當中的Kerberos認證內(nèi)容,同樣對該技術(shù)的基本概況、發(fā)展歷史、近況以及認證流程、風險缺陷和實際應用舉例等內(nèi)容進行分析。
作者認為,在大數(shù)據(jù)日益快速發(fā)展的時代背景下,信息量呈現(xiàn)出快速的增長趨勢,數(shù)據(jù)價值得到更多人的關注和認可。但是大數(shù)據(jù)在得到快速發(fā)展的過程中也帶來了不少的問題,比如怎樣對數(shù)據(jù)進行管理,讓數(shù)據(jù)價值可以在安全的背景下實現(xiàn)最大化,這些問題還都沒有得到比較完美的答案。在不同的時間段當中,結(jié)合業(yè)務需求的具體差異,數(shù)據(jù)也會呈現(xiàn)出差異化的價值。為了讓數(shù)據(jù)價值得到最大化實現(xiàn),互聯(lián)網(wǎng)數(shù)據(jù)之間的共享也是不可避免的。但是,因為不同的企業(yè)和部門之間是一種相互獨立的關系。在數(shù)據(jù)系統(tǒng)當中,所采用的存儲結(jié)構(gòu)也會存在著十分明顯的差別,數(shù)據(jù)之間想要實現(xiàn)共享的目標很難,因此也就導致出現(xiàn)了信息孤島的情況?;ヂ?lián)網(wǎng)擁有十分龐大的群體,不僅需要推動數(shù)據(jù)共享發(fā)展的進程,同時還要確保數(shù)據(jù)和信息的安全性,讓用戶的隱私得到最大限度的保護。為了讓這些問題得到有效解決,大數(shù)據(jù)的安全性維護和治理內(nèi)容就成為了當前工業(yè)領域和學術(shù)領域的研究熱點之一。大數(shù)據(jù)的治理目標就是為了構(gòu)建起足夠統(tǒng)一和標準的平臺,從不同的數(shù)據(jù)體系當中獲得相關的數(shù)據(jù)。作者認為,在采用生命周期理論對數(shù)據(jù)進行管理時,應允許不同主體針對數(shù)據(jù)開展相關的操作,比如數(shù)據(jù)的審計、篩選或者數(shù)據(jù)遷移等,讓數(shù)據(jù)的價值可以得到更大程度的發(fā)揮。在數(shù)據(jù)業(yè)務流程處理的過程中,如果可以構(gòu)建起比較標準的平臺,可以針對用戶、地點以及IP地址的差異,針對元數(shù)據(jù)的差異設置具體的對應權(quán)限,讓數(shù)據(jù)的安全性能得到切實有效的保障。
綜上,該書對大數(shù)據(jù)的治理和安全相關內(nèi)容進行了深入分析,采用理論與實際應用相結(jié)合的方式,讓讀者對于大數(shù)據(jù)的安全以及治理有更加全面和詳細的了解與認識,也為今后實際應用奠定堅實的基礎。