洪克詩
摘 要 大數(shù)據(jù)時代下,數(shù)據(jù)海量且紛繁復(fù)雜,這在豐富圖書館資源的同時也給圖書館數(shù)據(jù)存儲安全管理等方面帶來了新的挑戰(zhàn)。本文立足于對大數(shù)據(jù)的特征把握,結(jié)合目前圖書館面臨的存儲安全管理問題,探討了圖書館存儲安全管理的有效策略,以期構(gòu)建更加科學(xué)、高效的圖書館存儲與安全管理模式。
關(guān)鍵詞 圖書館;大數(shù)據(jù);數(shù)據(jù)存儲;安全管理
中圖分類號 G2 文獻(xiàn)標(biāo)識碼 A 文章編號 1674-6708(2016)164-0125-02
1 大數(shù)據(jù)時代下的數(shù)據(jù)特征
關(guān)于大數(shù)據(jù)至今各界尚未有一個統(tǒng)一且全面的定義,但筆者比較認(rèn)同的一個定義方式是:大數(shù)據(jù)是難以在傳統(tǒng)思維及常規(guī)軟件的基礎(chǔ)上,在規(guī)定時間內(nèi)對其內(nèi)容實施采集、管理及分析的數(shù)據(jù)集合[1]。大數(shù)據(jù)時代下的數(shù)據(jù)具有數(shù)據(jù)量大、數(shù)據(jù)類多、流動速度快、價值密度低等特點。不難看出,在大數(shù)據(jù)的背景下無論是從管理角度還是技術(shù)角度,對于圖書館的數(shù)據(jù)安全管理,尤其是基于海量數(shù)據(jù)的數(shù)據(jù)存儲安全管理,都是新的挑戰(zhàn)。
1.1 數(shù)量巨大
通常認(rèn)為,數(shù)據(jù)量大于10TB即為大數(shù)據(jù)。伴隨著計算機、云計算、物聯(lián)網(wǎng)等技術(shù)普及,以及社交網(wǎng)絡(luò)對人們生活的不斷滲入,人們的個人信息、網(wǎng)絡(luò)足跡、網(wǎng)絡(luò)交際等數(shù)據(jù)爆炸性增長,這些信息與長期積累的結(jié)構(gòu)化數(shù)據(jù)共同構(gòu)成了大數(shù)據(jù)。對于圖書館來說,紙質(zhì)電子資源增多,以及用戶增多帶來的大量用戶信息,隨著時間推移,數(shù)據(jù)量會越來越大。
1.2 種類繁多
數(shù)據(jù)種類繁多主要是指數(shù)據(jù)結(jié)構(gòu)的多樣化。伴隨著傳感器技術(shù)、移動終端、通信設(shè)備的廣泛應(yīng)用,數(shù)據(jù)結(jié)構(gòu)形成結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化共存的局面,如音頻、視頻、網(wǎng)頁等形式。
1.3 流動速度快
流動速度快主要指數(shù)據(jù)創(chuàng)建與處理速度。實時性是大數(shù)據(jù)的一個顯著特征,生活在互聯(lián)網(wǎng)環(huán)境中,人們通過移動終端使用的各類應(yīng)用,如天氣、物流、交通等應(yīng)用,這些應(yīng)用使用或產(chǎn)生的數(shù)據(jù)都是具有實時性的,即為流式數(shù)據(jù)。對于這些數(shù)據(jù),傳統(tǒng)的軟件顯然不能處理。
1.4 價值密度低
大數(shù)據(jù)的價值獲取和應(yīng)用是大數(shù)據(jù)應(yīng)用的最終目標(biāo)。然而在數(shù)據(jù)大量增長的同時,蘊含于其中的數(shù)據(jù)價值并未顯著增長,因而數(shù)據(jù)價值密度降低,這就大大增加了獲取有價值信息的難度。
2 大數(shù)據(jù)時代圖書館面臨的存儲安全問題
在大數(shù)據(jù)背景下,圖書館非結(jié)構(gòu)化數(shù)據(jù)占80%以上,這為圖書館數(shù)據(jù)存儲方面提出了新的要求,具體體現(xiàn)在存儲模式、安全級別劃分、身份驗證等方面。
2.1 存儲模式局限
隨著數(shù)據(jù)量及數(shù)據(jù)復(fù)雜程度的迅速增長,非關(guān)系型數(shù)據(jù)庫由于可擴展性及可用性較強優(yōu)勢被廣泛應(yīng)用,成為圖書館數(shù)據(jù)存儲的主要方式。然而,由于非關(guān)系型數(shù)據(jù)庫系統(tǒng)服務(wù)器軟件內(nèi)置安全管理系統(tǒng)不足且存在較大安全漏洞,造成在數(shù)據(jù)訪問控制及用戶隱私管理方面存在較大難度。
2.2 安全級別劃分問題
圖書館在統(tǒng)一管理平臺對數(shù)據(jù)進(jìn)行存儲、管理、分析、應(yīng)用的過程中,難以對數(shù)據(jù)按照安全級別進(jìn)行劃分并分類存儲。同時,數(shù)據(jù)庫在用戶進(jìn)行訪問的過程中,會將組織架構(gòu)暴露給發(fā)起訪問的程序,安全性受到威脅。另外,由于用戶在操作中與多個信息節(jié)點進(jìn)行通信,數(shù)據(jù)庫難以對訪問者身份權(quán)限進(jìn)行即時驗證。
2.3 安全管理產(chǎn)品局限
非結(jié)構(gòu)型數(shù)據(jù)庫在進(jìn)行大數(shù)據(jù)資源操作中,會在多個網(wǎng)絡(luò)通信會話間建立協(xié)調(diào)任務(wù),因而傳統(tǒng)安全管理產(chǎn)品具有的系統(tǒng)監(jiān)視、日志分析以及安全評估等功能難以運行或難以取得良好效果,同時還可能對大數(shù)據(jù)應(yīng)用效率等方面帶來不利影響。
3 大數(shù)據(jù)背景下的圖書館存儲安全管理策略
3.1 利用大數(shù)據(jù)決策及時發(fā)現(xiàn)安全威脅
圖書館在利用大數(shù)據(jù)技術(shù)來保護(hù)自身系統(tǒng)與服務(wù)安全時,不應(yīng)僅僅將防范目標(biāo)鎖定在惡意事件的發(fā)現(xiàn)上,也應(yīng)結(jié)合大數(shù)據(jù)安全資源進(jìn)行分析,確定惡意攻擊的來源、攻擊途徑及危害程度等,并結(jié)合數(shù)據(jù)挖掘與關(guān)聯(lián)技術(shù),實現(xiàn)對未來攻擊的來源、途徑及目的預(yù)測,提前把握危害程度,做好防范。
同時,在安全管理大數(shù)據(jù)平臺的構(gòu)建過程中,在維持平臺一定的復(fù)雜程度與合理建設(shè)成本的條件下,盡可能選取技術(shù)成熟且兼容性強的數(shù)據(jù)包捕捉與分析工具,以此來實現(xiàn)信息的快速采集、定位與科學(xué)分析、決策的過程。而系統(tǒng)結(jié)構(gòu)過于復(fù)雜的安全管理產(chǎn)品會導(dǎo)致平臺功能性與可控性的大幅度降低。
同時,加強對安全數(shù)據(jù)倉庫諸如監(jiān)控日志、工作日志、服務(wù)器日志、防火墻日志等的管理控制,有助于圖書館大數(shù)據(jù)資源安全高效地處理以及安全攻擊行為的及時發(fā)現(xiàn)。
另外,在了解圖書館大數(shù)據(jù)服務(wù)與安全管理需求的基礎(chǔ)上,定制大數(shù)據(jù)資源挖掘工具以及相應(yīng)的分析師,來提高圖書館利用大數(shù)據(jù)技術(shù)發(fā)現(xiàn)安全威脅的效率與主動性。
3.2 構(gòu)建大數(shù)據(jù)安全威脅與防御能力為基礎(chǔ)的評估體系
建設(shè)以大數(shù)據(jù)安全威脅與防御能力為基礎(chǔ)的評估體系,是圖書館構(gòu)建高效安全防御系統(tǒng)的關(guān)鍵內(nèi)容,評估體系分為宏觀網(wǎng)絡(luò)感知與微觀威脅檢測2部分。
網(wǎng)絡(luò)是圖書館各類信息傳輸?shù)妮d體,在網(wǎng)絡(luò)層面上,對于數(shù)據(jù)中心內(nèi)部網(wǎng)絡(luò)與外部傳輸網(wǎng)絡(luò)的評估,需廣泛地在網(wǎng)絡(luò)上設(shè)置大量安全檢測與數(shù)據(jù)采集設(shè)備,以此來保證安全評估平臺全面且客觀地收集網(wǎng)絡(luò)安全評估數(shù)據(jù)。
在微觀層面上,應(yīng)注重數(shù)據(jù)采集并構(gòu)建安全評估指標(biāo)。應(yīng)重點采集APT攻擊方法、路徑、后果等,并建立模型模擬預(yù)測。而在評估指標(biāo)的建立上,應(yīng)從大數(shù)據(jù)平臺二次提取數(shù)據(jù),并分為基礎(chǔ)指標(biāo)與應(yīng)用層指標(biāo)等多種類型,結(jié)合不同指標(biāo)對圖書館安全的影響,進(jìn)行科學(xué)的動態(tài)評估。
同時,由于結(jié)構(gòu)化數(shù)據(jù)可降低對大數(shù)據(jù)平臺的性能要求并提高分析效率,圖書館也應(yīng)加強對采集數(shù)據(jù)的結(jié)構(gòu)化處理,從而提高安全分析效率與分析結(jié)果的可靠性。
3.3 整合大數(shù)據(jù)安全管理軟硬件平臺
大數(shù)據(jù)安全管理平臺應(yīng)實現(xiàn)安全管理工具與流程的整合,以便圖書館依據(jù)相關(guān)信息來完成對安全事件的管理、分析與決策。將監(jiān)控設(shè)備采集的信息進(jìn)行傳輸時,需提前進(jìn)行預(yù)處理,并經(jīng)由SIEM工具傳輸至大數(shù)據(jù)安全倉庫,傳輸數(shù)據(jù)需標(biāo)準(zhǔn)、高價值且具備可用性。同時,通過實時控制,以及安全管理平臺數(shù)據(jù)的反饋,來實現(xiàn)對圖書館應(yīng)用平臺的參數(shù)設(shè)置及管理。
同時,大數(shù)據(jù)安全管理平臺應(yīng)使用科學(xué)算法、可視化決策與自動化管理,應(yīng)通過大數(shù)據(jù)平臺對用戶行為數(shù)據(jù)、閱讀終端參數(shù)分析,實現(xiàn)對用戶行為特征模擬,以此來進(jìn)行大數(shù)據(jù)下的讀者身份認(rèn)證。
3.4 執(zhí)行安全的大數(shù)據(jù)管理與應(yīng)用策略
針對圖書館大數(shù)據(jù)的具體特征,為提高數(shù)據(jù)的安全性與可用性,圖書館必須對原始數(shù)據(jù)進(jìn)行有效精簡,即通過過濾、刪減、標(biāo)準(zhǔn)化、匹配、評估、清洗等過程,以及結(jié)合云存儲平臺,將無用數(shù)據(jù)和重復(fù)數(shù)據(jù)進(jìn)行刪除。同時,圖書館的大數(shù)據(jù)平臺在保證開放共享的同時,也應(yīng)保證數(shù)據(jù)不被非法訪問和過度分析,因此,應(yīng)允許用戶查看、糾正或刪除自身隱私數(shù)據(jù),增加用戶隱私數(shù)據(jù)使用的透明度。
另外,圖書館在大數(shù)據(jù)安全管理中,通常將內(nèi)部系統(tǒng)視為可信環(huán)境,執(zhí)行較為寬松的安全管理策略,往往造成內(nèi)部環(huán)境相較于外部環(huán)境安全威脅更大。所以,為防止黑客利用內(nèi)部系統(tǒng)漏洞提高攻擊成功率,加強圖書館內(nèi)部系統(tǒng)環(huán)境安全控制與監(jiān)控十分必要。
4 結(jié)論
在大數(shù)據(jù)的背景下,圖書館的資源建設(shè)與管理存在大量的發(fā)展機遇,同時也存在更大的挑戰(zhàn)。在圖書館的數(shù)據(jù)存儲安全管理方面,應(yīng)運用大數(shù)據(jù)決策敏銳感知安全威脅,構(gòu)建起以大數(shù)據(jù)安全威脅與防御能力為基礎(chǔ)的評估體系,對大數(shù)據(jù)軟硬件平臺進(jìn)行整合,并執(zhí)行安全的大數(shù)據(jù)管理與應(yīng)用策略,真正提高圖書館的數(shù)據(jù)存儲安全管理能力,以求更加穩(wěn)定長遠(yuǎn)的發(fā)展。
參考文獻(xiàn)
[1]張瑜.大數(shù)據(jù)環(huán)境下圖書館公共媒體數(shù)據(jù)庫建設(shè)與利用研究[D].大連:遼寧師范大學(xué),2014.
[2]陳臣.大數(shù)據(jù)環(huán)境下數(shù)字圖書館安全威脅與對策研究[J].圖書館工作與研究,2014(11):34-38.
[3]高煜紅.云計算數(shù)據(jù)存儲安全的研究[D].杭州:浙江工業(yè)大學(xué),2014.
[4]鮑劼,李蘇豐.大數(shù)據(jù)環(huán)境下圖書館信息安全問題與對策分析[J].科技情報開發(fā)與經(jīng)濟,2014(22):12-14.
[5]陳臣.基于大數(shù)據(jù)的圖書館個性化服務(wù)安全體系構(gòu)建研究[J].新世紀(jì)圖書館,2014(11):47-51.
[6]陳臣.大數(shù)據(jù)環(huán)境下數(shù)字圖書館安全威脅與對策研究[J].圖書館工作與研究,2014(11):34-38.
[7]張毅,趙元媛.大數(shù)據(jù)技術(shù)在數(shù)字圖書館中的應(yīng)用分析[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2015(3):52-53.
[8]張鶴明.大數(shù)據(jù)對公共圖書館服務(wù)的影響探討[J].圖書館界,2015(3):75-77.