基金項(xiàng)目:2012年教育部人文社會(huì)科學(xué)青年基金項(xiàng)目“云計(jì)算環(huán)境下數(shù)字圖書館云服務(wù)信息化平臺(tái)架構(gòu)策略與用戶服務(wù)模式研究”(項(xiàng)目編號(hào):12YJC870019)研究成果。
作者簡介:王志強(qiáng)(1988-),男,講師,碩士,研究方向:云計(jì)算,數(shù)字圖書館建設(shè)、數(shù)字圖書館網(wǎng)絡(luò)安全。?信息資源開發(fā)與利用?
〔摘要〕核心數(shù)據(jù)的管理與保護(hù)問題,給云計(jì)算環(huán)境下的數(shù)字圖書館的發(fā)展帶來了巨大挑戰(zhàn)。本文首先分析了云計(jì)算環(huán)境下數(shù)字圖書館海量數(shù)據(jù)的高效管理,以及云端數(shù)據(jù)快速、精確查詢問題。然后,提出了一種基于云計(jì)算的數(shù)字圖書館核心數(shù)據(jù)管理與保護(hù)策略。該策略能夠有效提升系統(tǒng)資源的利用率、服務(wù)可用性和解決資源瓶頸問題,并保證了用戶核心數(shù)據(jù)的安全。
〔關(guān)鍵詞〕云計(jì)算;數(shù)字圖書館;核心數(shù)據(jù);管理;保護(hù)
DOI:10.3969/j.issn.1008-0821.2014.05.018
〔中圖分類號(hào)〕G25076〔文獻(xiàn)標(biāo)識(shí)碼〕A〔文章編號(hào)〕1008-0821(2014)05-0088-03
Study of Core Data Management and Protection Strategy
for Digital Library Based on Cloud ComputingWang Zhiqiang
(School of Information Engineering,Lanzhou University of Finance and Economics,Lanzhou 730020,China)
〔Abstract〕Core data management and protection imposes a grand challenge to the development for digital library under cloud environment.In this paper,firstly it analyzed problem of the mass of data of efficient management and the clouds accurate data precision quickly of digital library under cloud environment.And then,a core data management and protection strategy for digital library based on cloud computing was proposed.It could improve system resource utilization,improve service availability and resolve resource bottlenecks,and effectively solve the security problem of uses core data.
〔Keywords〕cloud computing;digital library;core data;management;protection
隨著云計(jì)算技術(shù)的發(fā)展和在數(shù)字圖書館應(yīng)用的不斷深入,圖書館可為讀者提供安全、高效、經(jīng)濟(jì)、便捷的云個(gè)性化服務(wù),讀者已擺脫了所處地域、閱讀模式、網(wǎng)絡(luò)帶寬和閱讀成本等問題的束縛。
但是,圖書館云個(gè)性化閱讀服務(wù)所具有的海量數(shù)據(jù)存儲(chǔ)、高效處理、快速訪問與檢索、高速傳輸和無縫擴(kuò)展能力,在提高圖書館云個(gè)性化服務(wù)質(zhì)量和讀者滿意度的同時(shí),也大幅度增加了數(shù)據(jù)環(huán)境的復(fù)雜性和管理難度,數(shù)據(jù)具有海量、異構(gòu)和非確定性的特點(diǎn)。因此,如何加強(qiáng)云圖書館數(shù)據(jù)結(jié)構(gòu)和管理的安全性、可用性、容錯(cuò)性、可控性和可擴(kuò)展,對(duì)于提高圖書館市場競爭力、云服務(wù)模式有效性和讀者云閱讀滿意度具有重要的意義。
1云圖書館核心數(shù)據(jù)管理面臨的問題與挑戰(zhàn)
11須加強(qiáng)云虛擬化資源部署與配置數(shù)據(jù)的管理
云計(jì)算環(huán)境下,圖書館將云基礎(chǔ)設(shè)施資源深度虛擬化為一個(gè)大的資源池,根據(jù)讀者云閱讀服務(wù)需求動(dòng)態(tài)部署、分配和管理。如何加強(qiáng)云虛擬化資源部署、分配過程控制數(shù)據(jù)的管理,并對(duì)全過程進(jìn)行準(zhǔn)確、實(shí)時(shí)、動(dòng)態(tài)的數(shù)據(jù)采集、跟蹤、處理和修正,是關(guān)系圖書館數(shù)據(jù)中心自動(dòng)、準(zhǔn)確地描繪虛擬化資源不同對(duì)象之間的關(guān)聯(lián)關(guān)系,以及能否智能、實(shí)時(shí)地采集云服務(wù)系統(tǒng)虛擬化資源配置種類、數(shù)量和需求變化數(shù)據(jù)的關(guān)鍵。同時(shí),也是能否以可視化的方式描述資源配置組織結(jié)構(gòu),為有效制定、執(zhí)行云虛擬化資源的分配、部署、調(diào)度和管理策略,提供準(zhǔn)確、可靠數(shù)據(jù)支持的保證[1]。
12云圖書館數(shù)據(jù)管理的層次劃分
云圖書館數(shù)據(jù)環(huán)境具有海量、非確定性、分布異構(gòu)和動(dòng)態(tài)變化的特點(diǎn),要求數(shù)據(jù)管理層次的劃分過程科學(xué)、可控和邏輯性強(qiáng)。
從數(shù)據(jù)處理的功能性和過程劃分,云圖書館數(shù)據(jù)管理層次主要分為數(shù)據(jù)的組織與管理、數(shù)據(jù)的集成與管理、分布式并行處理和數(shù)據(jù)分析4部分。數(shù)據(jù)組織與管理層要求數(shù)據(jù)庫具有海量數(shù)據(jù)分布式存儲(chǔ)的功能,具有較強(qiáng)的存儲(chǔ)經(jīng)濟(jì)性和容錯(cuò)性。數(shù)據(jù)集成與管理層要求數(shù)據(jù)中心具有海量數(shù)據(jù)處理、分析和滿足讀者QOS(服務(wù)質(zhì)量)需求的能力。分布式并行處理層可實(shí)現(xiàn)分布式環(huán)境下數(shù)據(jù)的挖掘和處理,具有高效的云資源分配和并發(fā)任務(wù)調(diào)度能力。數(shù)據(jù)分析層可對(duì)云圖書館數(shù)據(jù)庫中海量的結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化的文本、語音、圖形和圖像數(shù)據(jù),在不確定的知識(shí)條件下通過高效數(shù)據(jù)挖掘和分析,為讀者提供語意明確、高價(jià)值密度的關(guān)系化服務(wù)數(shù)據(jù)[2]。
13核心數(shù)據(jù)管理的安全性與可靠性
核心數(shù)據(jù)管理的安全性與可靠性,是關(guān)系云圖書館個(gè)性化服務(wù)有效性和讀者閱讀滿意度的重要問題。首先,云服務(wù)商數(shù)據(jù)存儲(chǔ)具有環(huán)境復(fù)雜、安全威脅多、多用戶共享和可用性要求高的特點(diǎn)。圖書館應(yīng)根據(jù)云閱讀服務(wù)安全級(jí)別需求,與云服務(wù)商簽署相應(yīng)安全等級(jí)的云服務(wù)租賃協(xié)議,確保圖書館管理與用戶服務(wù)數(shù)據(jù)的安全性。其次,云圖書館應(yīng)保證所存儲(chǔ)的數(shù)據(jù)能夠科學(xué)管理、高效訪問、快速查找和準(zhǔn)確定位,且數(shù)據(jù)管理與使用具有較低的成本和較高可用性。第三,數(shù)據(jù)管理應(yīng)具備較強(qiáng)的冗余性、容錯(cuò)性并支持災(zāi)難恢復(fù),能夠依據(jù)數(shù)據(jù)管理可靠性劃分等級(jí),制定相應(yīng)的存儲(chǔ)、使用、冗余和災(zāi)難恢復(fù)策略。
14核心數(shù)據(jù)管理有效性的評(píng)估與保障
核心數(shù)據(jù)管理有效性的評(píng)估,是云圖書館依據(jù)讀者服務(wù)水平協(xié)議,對(duì)云圖書館數(shù)據(jù)管理的科學(xué)性、安全性、經(jīng)濟(jì)性、可用性和用戶閱讀愉悅感整體評(píng)估的過程。同時(shí),也是云圖書館量化數(shù)據(jù)管理質(zhì)量,發(fā)現(xiàn)數(shù)據(jù)管理平臺(tái)和策略存在的問題,優(yōu)化平臺(tái)管理性能和管理策略的關(guān)鍵。
云圖書館核心數(shù)據(jù)管理有效性的評(píng)估與保障,主要應(yīng)包括云圖書館數(shù)據(jù)結(jié)構(gòu)的科學(xué)性、數(shù)據(jù)采集與知識(shí)發(fā)現(xiàn)的有效性、數(shù)據(jù)管理的效率與可用性、數(shù)據(jù)管理過程是否符合國家法律規(guī)定和保護(hù)讀者隱私、云租賃協(xié)議的合理性與經(jīng)濟(jì)性、數(shù)據(jù)管理平臺(tái)的兼容性與可擴(kuò)展性等方面的內(nèi)容。此外,還應(yīng)根據(jù)云圖書館服務(wù)模式和讀者閱讀需求轉(zhuǎn)變,及時(shí)修改評(píng)估指標(biāo)內(nèi)容和修正評(píng)估指標(biāo)的影響因子,確保評(píng)估結(jié)果科學(xué)、全面、準(zhǔn)確和可用[3]。
15核心數(shù)據(jù)管理的可持續(xù)發(fā)展保障
隨著讀者云個(gè)性化服務(wù)內(nèi)容、模式和用戶需求的轉(zhuǎn)變,圖書館必須加強(qiáng)數(shù)據(jù)管理平臺(tái)的管理效率、方式、可用性和運(yùn)營成本控制,才能適應(yīng)云圖書館未來數(shù)據(jù)管理需求和確保云服務(wù)可持續(xù)發(fā)展。
endprint
首先,應(yīng)重點(diǎn)關(guān)注云服務(wù)租賃商基礎(chǔ)設(shè)施數(shù)據(jù)存儲(chǔ)、管理與服務(wù)性能的提升,以及所簽署的云服務(wù)租賃協(xié)議在數(shù)據(jù)存儲(chǔ)、應(yīng)用管理方面的安全性、效率、經(jīng)濟(jì)性和可用性。其次,應(yīng)通過技術(shù)革新和管理策略優(yōu)化,提高云圖書館數(shù)據(jù)管理資金的投資使用效率。在保證讀者云閱讀質(zhì)量的前提下,通過有效降低數(shù)據(jù)管理與云服務(wù)成本來提高圖書館服務(wù)市場競爭力。第三,圖書館可預(yù)測未來云數(shù)據(jù)庫存儲(chǔ)容量、云資源需求和管理內(nèi)容的變化趨勢,通過制定短期和長期的數(shù)據(jù)管理與服務(wù)能力提升計(jì)劃,有效降低圖書館數(shù)據(jù)管理、用戶服務(wù)和可持續(xù)發(fā)展的風(fēng)險(xiǎn)[4]。
2云圖書館核心數(shù)據(jù)的管理與保護(hù)策略
21實(shí)現(xiàn)核心數(shù)據(jù)的全流動(dòng)性
隨著無線通信技術(shù)的發(fā)展和圖書館智能移動(dòng)閱讀終端的普及,高速數(shù)據(jù)接入的移動(dòng)閱讀方式,成為讀者云閱讀體驗(yàn)活動(dòng)的重要組成內(nèi)容。在服務(wù)數(shù)據(jù)的高速、移動(dòng)傳輸?shù)沫h(huán)境下,如何降低圖書館云數(shù)據(jù)存儲(chǔ)的固化程度,實(shí)現(xiàn)數(shù)據(jù)完整、智能、自主的流動(dòng),是關(guān)系讀者云計(jì)算環(huán)境下移動(dòng)閱讀質(zhì)量和滿意度的關(guān)鍵。
首先,圖書館應(yīng)利用云計(jì)算海量存儲(chǔ)、高性能計(jì)算和快速傳輸?shù)奶匦?,將服?wù)數(shù)據(jù)的管理、查詢和數(shù)據(jù)下載任務(wù)交付云端完成,以此大幅度降低云移動(dòng)閱讀活動(dòng)對(duì)閱讀終端性能的要求。同時(shí),須將在云端采集、查詢的數(shù)據(jù),通過透明化的同步過程下載到閱讀終端,保證讀者閱讀終端數(shù)據(jù)和云端數(shù)據(jù)實(shí)時(shí)同步。其次,云圖書館應(yīng)根據(jù)云閱讀服務(wù)數(shù)據(jù)的重要性、可用性和使用頻率,將數(shù)據(jù)劃分為不同的優(yōu)先存儲(chǔ)級(jí)別,根據(jù)存儲(chǔ)級(jí)別判定結(jié)果將數(shù)據(jù)分別存儲(chǔ)于高性能在線磁盤或者低成本磁盤上,并根據(jù)判定結(jié)果的周期變化進(jìn)行核心數(shù)據(jù)動(dòng)態(tài)存儲(chǔ),實(shí)現(xiàn)存儲(chǔ)資源與成本的最優(yōu)化配置。
22加強(qiáng)核心數(shù)據(jù)的管理和價(jià)值發(fā)現(xiàn)
云圖書館數(shù)據(jù)主要包括云系統(tǒng)運(yùn)營與管理數(shù)據(jù)、用戶服務(wù)數(shù)據(jù)、讀者注冊與社會(huì)關(guān)系數(shù)據(jù)、圖書館運(yùn)營決策數(shù)據(jù)等。圖書館根據(jù)數(shù)據(jù)對(duì)讀者服務(wù)有效性和閱讀活動(dòng)可持續(xù)發(fā)展的影響程度,將數(shù)據(jù)分為核心數(shù)據(jù)和一般數(shù)據(jù)。核心數(shù)據(jù)具有精確、集成、跨越信息系統(tǒng)不同功能模塊、可重復(fù)使用和存在于多個(gè)異構(gòu)應(yīng)用系統(tǒng)中的特點(diǎn),對(duì)云圖書館的高效運(yùn)營和服務(wù)質(zhì)量保障具有重要意義。
云圖書館核心數(shù)據(jù)的管理是一個(gè)復(fù)雜和由多個(gè)信息系統(tǒng)共同作用的過程。首先,在核心數(shù)據(jù)采集、處理、清洗、轉(zhuǎn)換、管理、復(fù)制和同步過程中,云圖書館應(yīng)保證核心數(shù)據(jù)存儲(chǔ)模式統(tǒng)一和內(nèi)容完整、準(zhǔn)確、權(quán)威,可為圖書館管理員和讀者提供清晰、具有較高價(jià)值密度的,云圖書館運(yùn)營、管理和讀者服務(wù)決策支持。其次,圖書館應(yīng)實(shí)時(shí)對(duì)核心數(shù)據(jù)進(jìn)行管理、監(jiān)督、維護(hù)和完善,確保核心數(shù)據(jù)信息具有較高的真實(shí)性、準(zhǔn)確性、時(shí)效性和可用性,可真實(shí)反映圖書館運(yùn)營服務(wù)與讀者閱讀活動(dòng)狀況。第三,圖書館應(yīng)加強(qiáng)核心數(shù)據(jù)的價(jià)值發(fā)現(xiàn)和提取,及時(shí)預(yù)測、發(fā)現(xiàn)在云圖書館運(yùn)營與用戶服務(wù)過程中存在的威脅與隱患。同時(shí),依據(jù)核心數(shù)據(jù)的決策支持作用來優(yōu)化云服務(wù)資源和服務(wù)模式,不斷提高讀者云閱讀活動(dòng)的滿意度[5]。
23確保云圖書館核心數(shù)據(jù)安全、保密
根據(jù)云安全聯(lián)盟(CSA)發(fā)布的30版《云計(jì)算關(guān)鍵領(lǐng)域的安全指南》描述,云圖書館數(shù)據(jù)安全內(nèi)容主要涉及用戶數(shù)據(jù)不被非授權(quán)的用戶獲取,以及數(shù)據(jù)可隨時(shí)獲取兩方面的內(nèi)容。因此,云圖書館在核心數(shù)據(jù)安全管理中,應(yīng)重點(diǎn)加強(qiáng)數(shù)據(jù)可控性和可用性的管理。
231加強(qiáng)圖書館數(shù)據(jù)管理系統(tǒng)的自身安全建設(shè)
隨著數(shù)據(jù)環(huán)境和用戶服務(wù)過程復(fù)雜度的增加,云圖書館面臨著許多新的數(shù)據(jù)管理安全威脅和挑戰(zhàn)。
云計(jì)算環(huán)境下,數(shù)據(jù)可在云服務(wù)商云存儲(chǔ)設(shè)備、圖書館數(shù)據(jù)中心、用戶終端之間大規(guī)模、大范圍的遷移,已成為云服務(wù)模式的一個(gè)突出特點(diǎn)。因此,云圖書館在數(shù)據(jù)遷移之初,首先應(yīng)準(zhǔn)確評(píng)估擬遷移數(shù)據(jù)與其它數(shù)據(jù)源整合的有效性,以及如何通過數(shù)據(jù)過濾、凈化和審核過程提升數(shù)據(jù)質(zhì)量,保證數(shù)據(jù)提取、轉(zhuǎn)換和加載過程安全、高效。其次,云圖書館應(yīng)通過系統(tǒng)防護(hù)、入侵檢測、安全配置、身份認(rèn)證、訪問控制、數(shù)據(jù)加密、多租戶隔離、數(shù)據(jù)備份等手段,提高數(shù)據(jù)管理系統(tǒng)的自身安全性和防御能力。第三,云圖書館可在云服務(wù)商云服務(wù)平臺(tái)、云圖書館和讀者之間建立VPN(虛擬專用網(wǎng)絡(luò)),通過VPN安全加密的方式將云服務(wù)商、云圖書館和讀者的核心數(shù)據(jù)傳輸安全管理,納入到云圖書館數(shù)據(jù)管理的安全架構(gòu)下,確保云圖書館核心數(shù)據(jù)在云服務(wù)商、圖書館、讀者三者之間的傳輸安全。
232制定并執(zhí)行科學(xué)、可靠的核心數(shù)據(jù)安全管理策略
首先,云圖書館應(yīng)結(jié)合核心數(shù)據(jù)管理面臨的安全威脅與風(fēng)險(xiǎn),加強(qiáng)云圖書館管理員和用戶的數(shù)據(jù)安全管理、使用教育。同時(shí),通過云服務(wù)商安全管理級(jí)別評(píng)估,制定切實(shí)可行的安全管理制度和設(shè)定關(guān)鍵系統(tǒng)的分級(jí)、分權(quán)管理策略,在制度上保證核心數(shù)據(jù)管理、應(yīng)用安全。其次,應(yīng)將核心數(shù)據(jù)的安全管理融入數(shù)據(jù)生命周期管理全過程中,結(jié)合數(shù)據(jù)環(huán)境特點(diǎn)重點(diǎn)關(guān)注數(shù)據(jù)安全級(jí)別劃分、虛擬機(jī)隔離、多租戶數(shù)據(jù)隔離、殘余數(shù)據(jù)安全擦除、數(shù)據(jù)存儲(chǔ)安全保障與備份、災(zāi)難恢復(fù)、讀者隱私保護(hù)、數(shù)據(jù)安全傳輸?shù)确矫鎯?nèi)容。第三,實(shí)現(xiàn)數(shù)據(jù)保密設(shè)施和性能、數(shù)據(jù)完整性和可用性、數(shù)據(jù)的銷毀和可恢復(fù)性、數(shù)據(jù)虛擬化安全管理水平的自動(dòng)評(píng)估和優(yōu)化,提高云圖書館核心數(shù)據(jù)安全管理的智能、自動(dòng)化水平[6]。
24加強(qiáng)數(shù)據(jù)管理平臺(tái)和運(yùn)營中心的功能建設(shè)
云圖書館應(yīng)加強(qiáng)數(shù)據(jù)管理平臺(tái)和運(yùn)營中心的功能建設(shè),確保數(shù)據(jù)管理過程安全、高效、可靠、容錯(cuò)、可擴(kuò)展和能夠提供數(shù)據(jù)管理接口。
首先,圖書館云數(shù)據(jù)管理平臺(tái)可根據(jù)數(shù)據(jù)管理任務(wù)特點(diǎn)進(jìn)行云資源的分配、管理與調(diào)度,為圖書館提供可靠、靈活和高性價(jià)比的數(shù)據(jù)管理服務(wù)。可支持云圖書館管理員通過遠(yuǎn)程登錄的方式,進(jìn)行海量數(shù)據(jù)的實(shí)時(shí)管理、分析、查詢處理、數(shù)據(jù)庫維護(hù)與優(yōu)化工作。其次,云圖書館應(yīng)加強(qiáng)自建和云服務(wù)商數(shù)據(jù)庫系統(tǒng)的計(jì)劃、組織、協(xié)調(diào)與控制工作,確保數(shù)據(jù)管理和運(yùn)營平臺(tái)符合云計(jì)算標(biāo)準(zhǔn)和用戶服務(wù)質(zhì)量要求。第三,云圖書館應(yīng)重點(diǎn)關(guān)注數(shù)據(jù)中心機(jī)房基礎(chǔ)設(shè)施標(biāo)準(zhǔn)、云系統(tǒng)設(shè)備性能和兼容性、管理運(yùn)營系統(tǒng)的性能和可控性、數(shù)據(jù)維護(hù)與使用人員的技術(shù)水平等,并將圖書館數(shù)據(jù)管理平臺(tái)和運(yùn)營中心的建設(shè)標(biāo)準(zhǔn)量化,確保平臺(tái)建設(shè)與數(shù)據(jù)管理過程中,風(fēng)險(xiǎn)能夠識(shí)別、評(píng)價(jià)、分配和可控。
3結(jié)束語
云計(jì)算環(huán)境下,圖書館數(shù)據(jù)中心具有數(shù)據(jù)海量、異構(gòu)和非確定性的特點(diǎn),大幅度增加了數(shù)據(jù)遷移、管理、存儲(chǔ)、應(yīng)用和維護(hù)的難度。此外,讀者云個(gè)性化閱讀服務(wù)的不確定性和較高體驗(yàn)需求,對(duì)云圖書館數(shù)據(jù)管理的安全性、效率、經(jīng)濟(jì)性和可用性提出了更高的要求。因此,為了提高云服務(wù)保障能力和讀者云閱讀活動(dòng)滿意度,圖書館應(yīng)加強(qiáng)核心數(shù)據(jù)的存儲(chǔ)、管理、查詢和使用能力,實(shí)現(xiàn)核心數(shù)據(jù)的智能、自動(dòng)化管理,才能保證云圖書館數(shù)據(jù)管理過程規(guī)范、一致、完整、實(shí)用性和可擴(kuò)充性。
參考文獻(xiàn)
[1]劉正偉,文中領(lǐng),張海濤.云計(jì)算和云數(shù)據(jù)管理技術(shù)[J].計(jì)算機(jī)研究與發(fā)展,2012,49(增刊):26-31.
[2]趙宏偉,宋寶燕,邵一川.云計(jì)算環(huán)境下的一種高效的資源管理策略[J].計(jì)算機(jī)科學(xué),2012,39(2):212-215.
[3]常潤梅,孟利青,劉萬軍.電信企業(yè)云計(jì)算數(shù)據(jù)中心容量管理[J].遼寧工程技術(shù)大學(xué)學(xué)報(bào):自然科學(xué)版,2013,32(8):1112-1117.
[4]楊健,王劍,汪海航,等.移動(dòng)云計(jì)算環(huán)境中基于代理的可驗(yàn)證數(shù)據(jù)存儲(chǔ)方案[J].計(jì)算機(jī)應(yīng)用,2013,33(3):743-747,792.
[5]馮登國,張敏,張妍,等.云計(jì)算安全研究[J].軟件學(xué)報(bào),2011,22(1):71-83.
[6]孫福權(quán),張達(dá)偉,程勖,等.基于Hadoop企業(yè)私有云存儲(chǔ)平臺(tái)的構(gòu)建[J].遼寧工程技術(shù)大學(xué)學(xué)報(bào):自然科學(xué)版,2011,30(6):913-916.
(本文責(zé)任編輯:馬卓)
endprint