王康?王曉慧
摘 要 論文以數(shù)據(jù)安全相關(guān)文獻(xiàn)為研究對(duì)象,選取CNKI核心期刊庫和CSSCI期刊庫為數(shù)據(jù)來源,利用Excel描述論文的年代分布和學(xué)科分布,同時(shí)利用Bibexcel、Ucinet和CiteSpace可視化軟件對(duì)高頻關(guān)鍵詞進(jìn)行分析。結(jié)果表明:數(shù)據(jù)安全研究熱點(diǎn)主要集中于云計(jì)算、云存儲(chǔ)、隱私保護(hù)、大數(shù)據(jù)、網(wǎng)絡(luò)安全和圖書館領(lǐng)域,其中研究前沿包括大數(shù)據(jù)、隱私保護(hù)、Hadoop架構(gòu)、敏感數(shù)據(jù)、屬性加密、代理重加密、數(shù)據(jù)存儲(chǔ)與數(shù)據(jù)共享研究。
關(guān)鍵詞 數(shù)據(jù)安全 云計(jì)算 大數(shù)據(jù) 可視化分析
分類號(hào) TP309.2
DOI 10.16810/j.cnki.1672-514X.2018.09.019
Abstract Taking relevant study achievements on data security as the research object,selecting the CNKI core journals and CSSCI journals as the data source, and using Excel to describe the distribution and discipline distribution of papers.And using Bibexcel, Ucinet and CiteSpace software to analyze the high frequency keywords. The results show that the hot spots of study on data security include cloud computing, cloud storage, privacy protection, big data, network security,libraries and so on,and the research fronts include big data, privacy protection, Hadoop architecture, sensitive data, attribute encryption, proxy re-encryption, data storage and data sharing.
Keywords Data security. Cloud computing. Big data. Visual analysis.
大數(shù)據(jù)、云計(jì)算和互聯(lián)網(wǎng)的快速發(fā)展帶來的數(shù)據(jù)安全問題日趨嚴(yán)重,數(shù)據(jù)泄露將會(huì)給政府、企業(yè)和個(gè)人帶來極大的危害。如何在利用新技術(shù)的同時(shí)保護(hù)隱私數(shù)據(jù)和防止敏感數(shù)據(jù)的泄露是亟待解決的問題,籍此我國學(xué)者對(duì)數(shù)據(jù)安全做了大量的研究。本文選取中國知網(wǎng)(CNKI) 核心期刊庫和CSSCI期刊庫作為文獻(xiàn)的統(tǒng)計(jì)來源,以題名OR關(guān)鍵詞為檢索字段,“數(shù)據(jù)安全”為檢索詞對(duì)所有學(xué)科領(lǐng)域進(jìn)行精確檢索,時(shí)間限定為2006—2017年。進(jìn)行數(shù)據(jù)清理,剔除通知、簡(jiǎn)訊、報(bào)道和無關(guān)鍵詞字段等不符合要求的文獻(xiàn),得到相關(guān)文獻(xiàn)874篇,檢索時(shí)間為2017年4月1日。本文利用文獻(xiàn)處理工具Excel、Bibexcel、Ucinet和CiteSpace對(duì)相關(guān)文獻(xiàn)進(jìn)行統(tǒng)計(jì)并繪制圖表,然后利用定性的方法對(duì)可視化圖表進(jìn)行分析,探究和評(píng)價(jià)國內(nèi)數(shù)據(jù)安全研究現(xiàn)狀與趨勢(shì),以期為后續(xù)研究提供參考。
1 國內(nèi)數(shù)據(jù)安全研究熱點(diǎn)概述
2006-2017年間有關(guān)數(shù)據(jù)安全研究的文獻(xiàn)經(jīng)過統(tǒng)計(jì),可以認(rèn)為文獻(xiàn)量總體趨勢(shì)呈逐年增加的態(tài)勢(shì),其中2016年增加幅度比其它年份大。由此說明,數(shù)據(jù)安全意識(shí)有所增強(qiáng),數(shù)據(jù)安全問題逐漸受到重視。
數(shù)據(jù)安全研究在諸多學(xué)科領(lǐng)域均有涉及,其中計(jì)算機(jī)與互聯(lián)網(wǎng)技術(shù)是數(shù)據(jù)安全中的主要學(xué)科陣地,其次是電信技術(shù)、圖書情報(bào)與檔案管理、自動(dòng)化技術(shù)、電力工業(yè)、自然地理學(xué)、測(cè)繪學(xué)和貿(mào)易經(jīng)濟(jì)等學(xué)科,形成了一種多元化研究的態(tài)勢(shì)。隨著大數(shù)據(jù)、云計(jì)算和物聯(lián)網(wǎng)等新一代信息技術(shù)的發(fā)展,數(shù)據(jù)安全在計(jì)算機(jī)、互聯(lián)網(wǎng)、自動(dòng)化等領(lǐng)域的關(guān)注度有望繼續(xù)升溫。本文以高頻關(guān)鍵詞為基礎(chǔ),采用社會(huì)網(wǎng)絡(luò)分析和中心性分析兩種方法,從不同角度進(jìn)行相互驗(yàn)證以確定該領(lǐng)域的研究熱點(diǎn)。
1.1 社會(huì)網(wǎng)絡(luò)分析提取研究熱點(diǎn)
利用Bibexcel作出高頻關(guān)鍵詞共現(xiàn)矩陣,然后將數(shù)據(jù)安全、安全、安全性等概括性關(guān)鍵詞剔除,利用Ucinet對(duì)高頻關(guān)鍵詞進(jìn)行聚類分析,如圖1所示,其中矩形越大代表關(guān)鍵詞出現(xiàn)的頻率越高,線條代表關(guān)鍵詞之間的聯(lián)系。社會(huì)網(wǎng)絡(luò)分析結(jié)果顯示位于網(wǎng)絡(luò)中心位置的云計(jì)算、云存儲(chǔ)、大數(shù)據(jù)、物聯(lián)網(wǎng)、隱私保護(hù)、網(wǎng)絡(luò)安全、圖書館是數(shù)據(jù)安全研究領(lǐng)域熱點(diǎn)問題。
1.2 中心性分析提取研究熱點(diǎn)
中心性是測(cè)量個(gè)體處于網(wǎng)絡(luò)中的地位,個(gè)體越是處于網(wǎng)絡(luò)中的中心位置,其影響力越大,分為三種形式:點(diǎn)度中心性、接近中心性和中間中心性。點(diǎn)度中心性可以用網(wǎng)絡(luò)中與該點(diǎn)有直接聯(lián)系的點(diǎn)的數(shù)目來衡量[1],數(shù)目越多越是網(wǎng)絡(luò)的核心,擁有的“權(quán)利”越大。接近中心性反映一個(gè)節(jié)點(diǎn)不受其他節(jié)點(diǎn)控制的程度[2],是指一個(gè)節(jié)點(diǎn)與其它所有節(jié)點(diǎn)的距離之和,這個(gè)距離越小說明越是網(wǎng)絡(luò)的核心。中間中心性是指一個(gè)節(jié)點(diǎn)若處于許多其他兩點(diǎn)之間的路徑上,可以認(rèn)為該節(jié)點(diǎn)居于重要地位,因?yàn)樗哂锌刂破渌麅蓚€(gè)節(jié)點(diǎn)之間聯(lián)系的能力[3]。
利用Ucinet對(duì)關(guān)鍵詞進(jìn)行中心性分析得到高頻關(guān)鍵詞的點(diǎn)度中心性、接近中心性和中間中心性,如表1所示,從表1中可知以三種不同的角度對(duì)關(guān)鍵詞的中心性進(jìn)行分析,最終得出的結(jié)果基本相同,即數(shù)據(jù)安全相關(guān)研究主要集中在云計(jì)算與云存儲(chǔ)、隱私保護(hù)、大數(shù)據(jù)、圖書館、網(wǎng)絡(luò)安全等方面。
綜上,通過社會(huì)網(wǎng)絡(luò)分析方法和中心性分析方法對(duì)數(shù)據(jù)安全的研究熱點(diǎn)進(jìn)行提取,最終得出的研究熱點(diǎn)基本相同,從而有效印證了每種方法的可靠性。通過綜合考量提取出的研究熱點(diǎn),最終概括出國內(nèi)數(shù)據(jù)安全研究的主要熱點(diǎn)領(lǐng)域
2 云計(jì)算、云存儲(chǔ)與數(shù)據(jù)安全
隨著云計(jì)算與云存儲(chǔ)技術(shù)的快速發(fā)展,越來越多的企業(yè)和個(gè)人選擇利用云存儲(chǔ)來保存和備份數(shù)據(jù)。用戶對(duì)云存儲(chǔ)數(shù)據(jù)的安全性十分關(guān)切。數(shù)據(jù)加密是確保數(shù)據(jù)安全的有效方法之一,但在云存儲(chǔ)中傳統(tǒng)的數(shù)據(jù)加密將使數(shù)據(jù)的檢索運(yùn)算異常困難,此外,云存儲(chǔ)在數(shù)據(jù)隔離、數(shù)據(jù)遷移、數(shù)據(jù)殘留和數(shù)據(jù)安全審計(jì)方面面臨的挑戰(zhàn)依然嚴(yán)峻。目前,密文訪問控制、加密存儲(chǔ)和完整性審計(jì)三個(gè)方面是云存儲(chǔ)針對(duì)數(shù)據(jù)安全的重點(diǎn)研究方面。李暉[4]認(rèn)為需要綜合采用加密機(jī)制、密文搜索、完整性審計(jì)機(jī)制以及安全數(shù)據(jù)刪除等技術(shù)保護(hù)數(shù)據(jù)。胡光永[5]提出一種新的加密、解密方案,用以保護(hù)云存儲(chǔ)過程中的數(shù)據(jù),防止數(shù)據(jù)泄漏。此外,在法律制度方面齊愛民,祝高峰[6]以云存儲(chǔ)的特征、架構(gòu)模式、數(shù)據(jù)安全危機(jī)為基礎(chǔ)構(gòu)建了云存儲(chǔ)數(shù)據(jù)安全的法律保護(hù)制度。
3 大數(shù)據(jù)與數(shù)據(jù)安全
大數(shù)據(jù)技術(shù)具有大量、多樣、高價(jià)值和高速等特點(diǎn),其更加注重事物整體性和事物之間的關(guān)聯(lián)性。大數(shù)據(jù)技術(shù)在提升數(shù)據(jù)價(jià)值的同時(shí),數(shù)據(jù)安全問題也伴隨而來。目前,傳統(tǒng)的數(shù)據(jù)安全保護(hù)技術(shù)和政策已無法滿足大數(shù)據(jù)環(huán)境下的數(shù)據(jù)安全問題,甚至成為大數(shù)據(jù)發(fā)展的瓶頸。大數(shù)據(jù)時(shí)代實(shí)時(shí)在線計(jì)算、海量數(shù)據(jù)訪問、實(shí)時(shí)的數(shù)據(jù)流動(dòng)、頻繁的數(shù)據(jù)流轉(zhuǎn)和交換利用等業(yè)務(wù)和技術(shù)需要新的安全防護(hù)方案給予支撐。因此,在新的環(huán)境下要做到政策和技術(shù)的同步發(fā)展完善。首先,對(duì)目前存在的數(shù)據(jù)保護(hù)法律政策進(jìn)一步完善,同時(shí)針對(duì)大數(shù)據(jù)應(yīng)用制定細(xì)化和針對(duì)性的指引,明確哪些數(shù)據(jù)未經(jīng)授權(quán)不得私自采集,采集的哪些數(shù)據(jù)屬于敏感數(shù)據(jù),哪些非敏感數(shù)據(jù)通過二次或三次組合有可能成為敏感數(shù)據(jù)以及私自泄露敏感數(shù)據(jù)如何懲罰等問題;其次,要重視大數(shù)據(jù)標(biāo)準(zhǔn)化工作,建立相關(guān)采集、處理、分析和發(fā)布標(biāo)準(zhǔn),使數(shù)據(jù)脫敏、清洗規(guī)范化,防止數(shù)據(jù)泄露;最后,需要加快研發(fā)數(shù)據(jù)安全保護(hù)技術(shù),數(shù)據(jù)處理的每一步都存在數(shù)據(jù)泄露問題,政府和企業(yè)要不斷提高自身技術(shù)水平,提高自身承受非法入侵的能力,加強(qiáng)數(shù)據(jù)加密技術(shù)和訪問權(quán)限等防護(hù)措施。
4 隱私保護(hù)與網(wǎng)絡(luò)安全
互聯(lián)網(wǎng)的快速發(fā)展給人們的生活帶來了極大的便捷。與此同時(shí),網(wǎng)絡(luò)也成為數(shù)據(jù)泄露的重災(zāi)區(qū),互聯(lián)網(wǎng)安全已成為公眾關(guān)注的焦點(diǎn)。目前,各電商網(wǎng)站、門戶網(wǎng)站、手機(jī)APP等對(duì)個(gè)人數(shù)據(jù)的收集輕而易舉,若其遭受黑客攻擊,數(shù)據(jù)安全將難以得到保證,如大麥網(wǎng)、俄羅斯約會(huì)網(wǎng)站和益百利公司都曾發(fā)生過數(shù)據(jù)泄露事件。網(wǎng)絡(luò)安全已嚴(yán)重影響到人們的生活,補(bǔ)天平臺(tái)統(tǒng)計(jì)顯示,2015年由于網(wǎng)站漏洞的存在,可能或已造成55.3億條個(gè)人信息的泄露。如何有效保護(hù)隱私是亟待解決的問題,政府應(yīng)進(jìn)一步完善相關(guān)法律,企業(yè)應(yīng)積極研發(fā)數(shù)據(jù)保護(hù)技術(shù),公眾應(yīng)該提高隱私保護(hù)意識(shí),盡量避免敏感信息的泄露。
同時(shí),網(wǎng)絡(luò)安全也事關(guān)國家安全。目前我國不論個(gè)人還是機(jī)構(gòu)使用的電腦、操縱系統(tǒng)大部分還是采用美國的核心技術(shù),給我國的網(wǎng)絡(luò)安全留下了重大隱患。隨著大數(shù)據(jù)技術(shù)的應(yīng)用,我國各個(gè)領(lǐng)域的海量數(shù)據(jù)流向美國,美國利用先進(jìn)技術(shù)對(duì)我國的政治、經(jīng)濟(jì)和社會(huì)的最新情況進(jìn)行分析,有可能給我國造成嚴(yán)重的災(zāi)難。國家應(yīng)鼓勵(lì)研發(fā)國產(chǎn)操作系統(tǒng),政府等對(duì)信息安全要求高的機(jī)構(gòu)應(yīng)帶頭使用國產(chǎn)操作系統(tǒng)。
無論是從個(gè)人角度還是國家層面都必須重視網(wǎng)絡(luò)安全問題,迫切需要建立健全網(wǎng)絡(luò)安全法律體系,增強(qiáng)網(wǎng)絡(luò)安全意識(shí),同時(shí)對(duì)危害網(wǎng)絡(luò)安全的行為進(jìn)行相應(yīng)的處罰。
5 圖書館與數(shù)據(jù)安全
數(shù)據(jù)安全是圖書館服務(wù)用戶與穩(wěn)定發(fā)展的基礎(chǔ)。隨著互聯(lián)網(wǎng)的快速發(fā)展,圖書館面臨的數(shù)據(jù)安全、知識(shí)產(chǎn)權(quán)和用戶個(gè)人隱私問題日益突出。隨著新一代信息技術(shù)的發(fā)展,圖書館廣泛利用大數(shù)據(jù)、云計(jì)算技術(shù)進(jìn)行自身數(shù)據(jù)的保護(hù)。金志敏[7]研究了云計(jì)算下的高校圖書館數(shù)據(jù)安全策略。張凌云[8]以天津圖書館為例,研究和探討了連續(xù)數(shù)據(jù)保護(hù)技術(shù)在數(shù)據(jù)安全保護(hù)中所起的作用。馬曉亭,梁俊榮[9]設(shè)計(jì)了敏感大數(shù)據(jù)保護(hù)系統(tǒng),用以防護(hù)圖書館敏感數(shù)據(jù)的泄露。
此外,圖書館在統(tǒng)一身份認(rèn)證、嚴(yán)格控制訪問權(quán)限、加快信息安全基礎(chǔ)設(shè)施建設(shè)、制定相關(guān)標(biāo)準(zhǔn)及政策法規(guī)等方面也進(jìn)行了相關(guān)研究。
6 國內(nèi)數(shù)據(jù)安全研究熱點(diǎn)變化分析
關(guān)鍵詞是一篇文獻(xiàn)主題的最精煉表達(dá),因此可以通過關(guān)鍵詞的變化來研究主題的變化。利用Citespace5.0軟件做出數(shù)據(jù)安全的主題演化圖譜(見圖2)。
從圖2可知,2006年出現(xiàn)的“數(shù)據(jù)安全”“網(wǎng)絡(luò)安全”和“信息安全”字體較大,且與后續(xù)出現(xiàn)的關(guān)鍵詞聯(lián)系緊密,說明數(shù)據(jù)安全研究是以“網(wǎng)絡(luò)安全”和“信息安全”為主要研究對(duì)象。隨著時(shí)間推移,該領(lǐng)域的研究對(duì)象正在發(fā)生變化,依次出現(xiàn)了以“隱私保護(hù)”“云計(jì)算”“云存儲(chǔ)”“物聯(lián)網(wǎng)”和“大數(shù)據(jù)”為主的研究對(duì)象。
關(guān)鍵詞的數(shù)量及增長情況能夠有效反映各學(xué)術(shù)領(lǐng)域的發(fā)展及熱點(diǎn)前沿問題[10]。為了探究數(shù)據(jù)安全研究前沿,利用Citespace5.0軟件自帶的膨脹詞探測(cè)技術(shù)及算法進(jìn)行突現(xiàn)詞(某一時(shí)間段內(nèi)突然大量出現(xiàn)的詞)的探測(cè),如表2所示,較單獨(dú)計(jì)算關(guān)鍵詞出現(xiàn)頻次的高低確定研究前沿更具可靠性。由表2可知突現(xiàn)度最大的關(guān)鍵詞是大數(shù)據(jù),說明大數(shù)據(jù)是目前數(shù)據(jù)安全中研究的前沿,此外該領(lǐng)域研究的前沿還涉及隱私保護(hù)、Hadoop架構(gòu)、敏感數(shù)據(jù)、數(shù)據(jù)加密、數(shù)據(jù)存儲(chǔ)與數(shù)據(jù)共享。
大數(shù)據(jù)技術(shù)的快速發(fā)展給各行各業(yè)帶來了巨大的價(jià)值,Hadoop是較為流行的開源大數(shù)據(jù)處理平臺(tái),其為大數(shù)據(jù)處理和分析提供了創(chuàng)新性和低成本基礎(chǔ)架構(gòu),然而在大數(shù)據(jù)存儲(chǔ)、分析、開放和共享過程中數(shù)據(jù)安全存在著一定的隱患,個(gè)人隱私與敏感數(shù)據(jù)的保護(hù)成為關(guān)注的重點(diǎn)。如何在利用新技術(shù)的同時(shí)防止數(shù)據(jù)泄露是亟待解決的問題。今后應(yīng)加強(qiáng)數(shù)據(jù)安全策略的研究,政府應(yīng)該在舊法規(guī)的基礎(chǔ)上制定與大數(shù)據(jù)相適應(yīng)的新法規(guī),以數(shù)據(jù)安全體系建設(shè)為核心,加快數(shù)據(jù)立法的頂層設(shè)計(jì),制定數(shù)據(jù)開放的行動(dòng)計(jì)劃,重視個(gè)人數(shù)據(jù)隱私權(quán)保護(hù),而企業(yè)在市場(chǎng)競(jìng)爭(zhēng)中更應(yīng)研發(fā)新技術(shù)對(duì)數(shù)據(jù)安全程度進(jìn)行有效監(jiān)測(cè),防止企業(yè)關(guān)鍵技術(shù)數(shù)據(jù)泄露。
參考文獻(xiàn):
張世怡,劉春茂.中文網(wǎng)站社會(huì)網(wǎng)絡(luò)分析方法的實(shí)證研究[J].情報(bào)科學(xué),2011,29(2):246-252.
陳遠(yuǎn),李韞慧,張敏.基于節(jié)點(diǎn)度測(cè)度SNS用戶信息傳播貢獻(xiàn)的實(shí)證研究:以騰訊微博為例[J].情報(bào)雜志,2014,33(10):159-164.
王衛(wèi),吳丹,潘京華.國內(nèi)外博弈論研究的計(jì)量分析[J].圖書情報(bào)工作,2013(S2)228-232,223.
李暉,孫文海,李鳳華,等.公共云存儲(chǔ)服務(wù)數(shù)據(jù)安全及隱私保護(hù)技術(shù)綜述[J].計(jì)算機(jī)研究與發(fā)展,2014,51(7):1397-1409.
胡光永.基于云計(jì)算的數(shù)據(jù)安全存儲(chǔ)策略研究[J].計(jì)算機(jī)測(cè)量與控制,2011,19(10):2539-2541.
齊愛民,祝高峰.論云存儲(chǔ)中數(shù)據(jù)安全的法律保護(hù)[J].重慶大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2017,23(1):101-108.
金志敏.基于云計(jì)算下的高校圖書館數(shù)據(jù)安全策略的探討[J].計(jì)算機(jī)安全,2011(6):96-99.
張凌云.略論連續(xù)數(shù)據(jù)保護(hù)技術(shù)為圖書館數(shù)據(jù)安全護(hù)航:以天津圖書館為例[J].圖書館工作與研究,2013(11):44-47.
馬曉亭,梁俊榮.大數(shù)據(jù)環(huán)境下圖書館敏感數(shù)據(jù)保護(hù)方法研究[J].圖書館學(xué)研究,2016(21):50-55.
陳美家,于海洋,張婉瀅,等.我國OA期刊研究的可視化分析[J].圖書情報(bào)工作,2011,55(22):133-137.
王 康 遼寧師范大學(xué)管理學(xué)院2016級(jí)碩士研究生。 遼寧大連, 116029。
王曉慧 遼寧師范大學(xué)管理學(xué)院副教授、系主任。 遼寧大連, 116029。
(收稿日期:2017-05-04 編校:劉 明,陳安琪)