徐培德 郭德成
摘 要:大數(shù)據(jù)是國家重要的戰(zhàn)略資源,其應(yīng)用前景極其廣闊,已滲透進了各行各業(yè)當(dāng)中,為社會各領(lǐng)域的發(fā)展帶來前所未有的發(fā)展機遇。大數(shù)據(jù)及其應(yīng)用價值日漸凸顯,其帶來的數(shù)據(jù)安全問題已成為影響其應(yīng)用發(fā)展的一個重要因素。如何實現(xiàn)對大數(shù)據(jù)的安全應(yīng)用,發(fā)揮其重要的戰(zhàn)略作用,是當(dāng)前國內(nèi)外學(xué)者高度關(guān)注的重要課題之一。
關(guān)鍵詞:大數(shù)據(jù);應(yīng)用;安全
Security Research on Big Data and Its Application
Xu Peide,Guo Decheng
The Party School of Qinghai Provincial committee of CPC,Xining,810001
Abstract:Big data is an important strategic resource of the country. Its application prospect is extremely broad. It has penetrated into all walks of life and brought unprecedented opportunities for development in all fields of society. Big data and its application value are becoming increasingly prominent, and the data security problems it brings have become an important factor affecting its application development. How to realize the safe application of big data and play its important strategic role is one of the important topics that scholars at home and abroad pay attention at present.
Keywords:Big data; Application; Security
隨著社會網(wǎng)絡(luò)化和信息化的快速發(fā)展,各類數(shù)據(jù)得以迅速增長、膨脹,據(jù)統(tǒng)計,全球的數(shù)據(jù)量每兩年便會翻倍增長,且短短兩年所產(chǎn)生的數(shù)據(jù)量幾乎與之前多年產(chǎn)生的全部數(shù)據(jù)量持平。由大數(shù)據(jù)引發(fā)的信息風(fēng)暴使信息形態(tài)實現(xiàn)量變到質(zhì)變地跨越式發(fā)展,當(dāng)前大數(shù)據(jù)成為了一種重要的生產(chǎn)要素,表現(xiàn)出極其廣闊的應(yīng)用前景,并滲透進了各行各業(yè)當(dāng)中,為社會各領(lǐng)域的發(fā)展帶來前所未有的發(fā)展機遇。我國在“十三五”十四大戰(zhàn)略中提出了“國家大數(shù)據(jù)戰(zhàn)略”,大數(shù)據(jù)被視為重要的戰(zhàn)略資源,甚至上升為國家戰(zhàn)略的高度,這對大數(shù)據(jù)的應(yīng)用發(fā)展起到了宏觀的推動和指導(dǎo)作用。大數(shù)據(jù)及其應(yīng)用價值日漸凸顯,其帶來的數(shù)據(jù)安全問題已成為影響其應(yīng)用發(fā)展的一個重要因素。如何實現(xiàn)對大數(shù)據(jù)的安全應(yīng)用,發(fā)揮其重要的戰(zhàn)略作用,是當(dāng)前國內(nèi)外學(xué)者高度關(guān)注的重要課題之一。
1.大數(shù)據(jù)的內(nèi)涵及其應(yīng)用特點
大數(shù)據(jù)(big data)又被稱為巨量資料,從字面理解,可將其視為具由互聯(lián)網(wǎng)、移動網(wǎng)絡(luò)等的發(fā)展應(yīng)用產(chǎn)生的具有較強決策力和流程優(yōu)化效果的海量、高增長率及多樣化的信息資產(chǎn)。 但大數(shù)據(jù)的內(nèi)涵遠遠超出了其字面上的定義,而是呈現(xiàn)出了更為深刻、抽象的概念。全球知名咨詢公司麥肯錫指出大數(shù)據(jù)是時代創(chuàng)新和生產(chǎn)力發(fā)展的前沿力量,是有別于傳統(tǒng)數(shù)據(jù)庫范疇的收集、存儲、管理和分析數(shù)據(jù)信息的新型方式,該公司認為,大數(shù)據(jù)的數(shù)量呈現(xiàn)出不斷增長的狀態(tài),且不同機構(gòu)所需的數(shù)據(jù)集存在著差異,這也意味著其本身具備的數(shù)據(jù)集不同,因而大數(shù)據(jù)具有不斷增長、日益龐大,且具有時效性,以多樣化形式存在等新的特質(zhì),這是基于數(shù)量、速度、種類這三個方面維度的闡述,而對大數(shù)據(jù)的控制同樣也基于三個方面維度。盡管當(dāng)前學(xué)界對大數(shù)據(jù)的定義各執(zhí)一詞,但對其基本要素的界定卻是一致的,即包括數(shù)據(jù)的生成、采集、存儲和處理。大數(shù)據(jù)極大地改變了信息的形態(tài),呈現(xiàn)出非常廣闊的應(yīng)用前景和廣泛的應(yīng)用范圍,能用以推測趨勢,或是預(yù)測社會現(xiàn)象、開展個性化預(yù)測,剔除個體數(shù)據(jù),辨識真相,為用戶提供決策、營銷等方面的依據(jù)等,這為各行各業(yè)的發(fā)展創(chuàng)造良好的機遇。結(jié)合大數(shù)據(jù)的內(nèi)涵,可以將其應(yīng)用特點概括為幾點:其一是大數(shù)據(jù)的數(shù)量極為龐大,且增長速度通常呈現(xiàn)出幾何級數(shù)的發(fā)展事態(tài);其二,大數(shù)據(jù)種類多樣、類別繁多,可分為原始類數(shù)據(jù)、函數(shù)數(shù)據(jù)、多元型數(shù)據(jù)等。其三,當(dāng)前數(shù)據(jù)的處理速度日益加快,且處理分析的能力日益增強,能更持久、廣泛地服務(wù)于用戶,為用戶提供大量有價值的信息參考依據(jù)。
2.大數(shù)據(jù)的應(yīng)用及安全隱患
大數(shù)據(jù)的應(yīng)用歷經(jīng)了諸多演化過程,從最開始的不成熟逐步走向成熟,最終得以廣泛地應(yīng)用在社會各個領(lǐng)域當(dāng)中,被廣大用戶所熟悉和使用。最早的大數(shù)據(jù)應(yīng)用是從互聯(lián)網(wǎng)搜索平臺中檢索海量數(shù)據(jù),且經(jīng)由互聯(lián)網(wǎng)搜索平臺的推動,大數(shù)據(jù)的應(yīng)用模式也逐漸增多。首先是在商業(yè)領(lǐng)域中,商業(yè)網(wǎng)站通過構(gòu)建關(guān)系型數(shù)據(jù)庫系統(tǒng),用以收集并存儲企業(yè)的數(shù)據(jù),利于查詢及處理。隨著網(wǎng)絡(luò)和移動通訊的普及,互聯(lián)網(wǎng)用戶越來越多,商業(yè)網(wǎng)站的用戶信息隨之增多,可通過網(wǎng)站抓取數(shù)據(jù)日志和用戶行為,這為商業(yè)企業(yè)深入地分析用戶、施行商業(yè)決策提供了基本數(shù)據(jù)。其次,互聯(lián)網(wǎng)應(yīng)用領(lǐng)域中,網(wǎng)絡(luò)在線社交的普及應(yīng)用,各種結(jié)構(gòu)類型的數(shù)據(jù)(諸如圖片、視頻等)不斷涌現(xiàn),互聯(lián)網(wǎng)的功能日益豐富,非結(jié)構(gòu)化的數(shù)據(jù)技術(shù)日趨成熟。再次,科學(xué)研究領(lǐng)域需進行大量數(shù)據(jù)的收集,并研究數(shù)據(jù)分析、共享的平臺,為大數(shù)據(jù)的廣泛應(yīng)用創(chuàng)造條件。
俗話說:“任何事物總是利弊交織,像一把雙刃劍”,大數(shù)據(jù)及其應(yīng)用同樣如此。大數(shù)據(jù)在社會經(jīng)濟各個領(lǐng)域中發(fā)揮作用的同時,其安全隱患也較為突出,國內(nèi)外發(fā)生數(shù)據(jù)泄露的事件屢見不鮮,用戶的個人隱私被泄密等現(xiàn)象不一而足,隱私受到極大的挑戰(zhàn),隨著互聯(lián)網(wǎng)的深入普及,大量的用戶信息,甚至是姓名、電話、地址等敏感數(shù)據(jù)被集中于不同的應(yīng)用服務(wù)提供商系統(tǒng)中,信息的暴露點越來越多,發(fā)生數(shù)據(jù)泄露的風(fēng)險也隨著增多,而一旦發(fā)生大量數(shù)據(jù)的集中及信息泄露,其后果將不堪設(shè)想。尤其是一些關(guān)鍵領(lǐng)域的網(wǎng)絡(luò)及系統(tǒng)極易成為網(wǎng)絡(luò)競爭攻擊的重要目標(biāo),尤其是在數(shù)據(jù)驅(qū)動的環(huán)境下,一些存儲著重要敏感信息的系統(tǒng)更是遭受頻繁的網(wǎng)絡(luò)工具,極大地影響了大數(shù)據(jù)應(yīng)用的安全性。大數(shù)據(jù)是國家重要的戰(zhàn)略資源,其安全應(yīng)用直接影響著國家的科技、經(jīng)濟發(fā)展,因而做好對大數(shù)據(jù)的開發(fā)及應(yīng)用,保障其安全性,是當(dāng)前亟待解決的重要問題。
3.大數(shù)據(jù)的安全應(yīng)用路徑探討
當(dāng)前,大數(shù)據(jù)數(shù)據(jù)安全問題已經(jīng)成為國內(nèi)外專家學(xué)者非常關(guān)注的事情。大數(shù)據(jù)環(huán)境下,數(shù)據(jù)一方面成為人們獲取各類信息的關(guān)鍵,越來越的企事業(yè)單位和個人更多的依賴大數(shù)據(jù)帶來的價值,但是另一方面數(shù)據(jù)的安全問題也不斷暴露,由于大數(shù)據(jù)中有大量具有商用價值的數(shù)據(jù),這些數(shù)據(jù)必然就成為眾多黑客所覬覦的目標(biāo),同時,因為數(shù)據(jù)規(guī)模大,種類繁多,結(jié)構(gòu)越來越復(fù)雜,對數(shù)據(jù)的成本變得非常高,怎么樣確保數(shù)據(jù)的安全轉(zhuǎn)移,以及控制數(shù)據(jù)不發(fā)生冗余現(xiàn)象,都是我們所必須要及時應(yīng)對的棘手問題。
3.1保持?jǐn)?shù)據(jù)隱私的安全性。
大數(shù)據(jù)中,數(shù)據(jù)采集和信息挖掘時數(shù)據(jù)隱私的安全性是一個重要話題,數(shù)據(jù)信息量的超大量增多,數(shù)據(jù)處理的陸續(xù)開放,數(shù)據(jù)獲得渠道的變多,這會加急數(shù)據(jù)隱私被泄露,給數(shù)據(jù)隱私的安全性造成非常大的挑戰(zhàn)。數(shù)據(jù)隱私主要是敏感的數(shù)據(jù)信息,包括個人的隱私,也包括沒經(jīng)過許可的信息。個人隱私主要指使用者個人的興趣愛好,家庭關(guān)系等信息在毫無征兆的狀況下被獲取,同時甚至被大數(shù)據(jù)分析出來的信息也毫不知情。其次是沒經(jīng)過許可的信息,也就是通過大數(shù)據(jù)的分析獲取的信息,沒有得到使用者的許可,就隨意的將信息進行傳輸與應(yīng)用,在傳輸應(yīng)用過程中存在信息的泄露問題。大數(shù)據(jù)存在非常多的數(shù)據(jù)存貯需求,在分布計算的信息傳輸與數(shù)據(jù)交換時,對保存點中的使用者隱私數(shù)據(jù)不被非法泄露與應(yīng)用是關(guān)鍵問題。但是大數(shù)據(jù)的數(shù)據(jù)比傳統(tǒng)數(shù)據(jù)更為復(fù)雜,在數(shù)據(jù)隱私保護方面,傳統(tǒng)數(shù)據(jù)是靜態(tài)數(shù)據(jù),而大數(shù)據(jù)是動態(tài)數(shù)據(jù)屬性,因此對于使用者隱私數(shù)據(jù)的保護需要做到這幾個方面:一是替換、混合等數(shù)據(jù)加密,增強數(shù)據(jù)庫的安全度,二是做好隱私保護的宣傳工作,提高網(wǎng)絡(luò)安全防范意識,養(yǎng)成良好的上網(wǎng)習(xí)慣,如上網(wǎng)過程中,電話號碼,身份證號,家庭住址等個人信息更是不能輕易泄露。三是完善我國網(wǎng)絡(luò)立法制度。
3.2保證大數(shù)據(jù)的質(zhì)量
企業(yè)和個人對大數(shù)據(jù)的獲取最終目的是得到數(shù)據(jù)的價值。數(shù)據(jù)的價值是通過大數(shù)據(jù)分析處理后的最終結(jié)果,并在企業(yè)應(yīng)用過程與使用者感知中衡量大數(shù)據(jù)分析與預(yù)測結(jié)果的價值。大數(shù)據(jù)的價值體現(xiàn)不僅是海量的數(shù)據(jù),來源的多樣性,快捷的速度,還有數(shù)據(jù)中所體現(xiàn)的質(zhì)量,質(zhì)量的高低成為影響大數(shù)據(jù)健康發(fā)展的一個重要因素,低劣的質(zhì)量數(shù)據(jù)會造成網(wǎng)絡(luò)資源的浪費,同時也會讓使用者不能被有效使用。數(shù)據(jù)的質(zhì)量認定是通過數(shù)據(jù)的精準(zhǔn)性、數(shù)據(jù)可用性、數(shù)據(jù)真實性、數(shù)據(jù)的時效性、數(shù)據(jù)的冗余度、數(shù)據(jù)的一致性、數(shù)據(jù)的完整性、等方面體現(xiàn),影響數(shù)據(jù)質(zhì)量的因素包括數(shù)據(jù)的生成、數(shù)據(jù)的搜集、數(shù)據(jù)的輸送與保存等方面有關(guān)。當(dāng)前,在數(shù)據(jù)的質(zhì)量提升方面,有關(guān)的專家學(xué)者是通過消除數(shù)據(jù)的冗余問題來提升質(zhì)量,但是這只是一個方面,另外還要考慮數(shù)據(jù)的自我修復(fù)與自我檢測的能力。通過對上面分析,在大數(shù)據(jù)質(zhì)量方面的構(gòu)建措施,可以采取以下幾個方面:一是在數(shù)據(jù)的搜集過程中加強對數(shù)據(jù)的保護和甄別驗證,確保數(shù)據(jù)的真實與有效性。二是大數(shù)據(jù)保存過程中,為了確保數(shù)據(jù)的可用性、完整性、私密性。還需要加強一定的技術(shù)保障措施,如利用校驗措施確保數(shù)據(jù)的完整性,以及利用冗余方式確保數(shù)據(jù)的可用性。三是加強大數(shù)據(jù)的分析處理來提升數(shù)據(jù)的質(zhì)量,可以采用讀寫操作的權(quán)限設(shè)置完成安全性管理,采用各種分析辦法所形成的結(jié)果,來彼此驗證,以確保數(shù)據(jù)分析獲得結(jié)果的準(zhǔn)確無誤性和可使用性。四是采用設(shè)置訪問控制、認證授權(quán)等措施確保獲得的結(jié)果進行安全保護。五是強化大數(shù)據(jù)處理流程的整體管理,如在數(shù)據(jù)的保存形式中,所選擇的方式,需要考慮所搜集的大數(shù)據(jù)類型而定。
3.3 完善大數(shù)據(jù)的安全機制
大數(shù)據(jù)種類的越來越豐富, 以及大數(shù)據(jù)應(yīng)用的過程中,網(wǎng)絡(luò)共享平臺深入開放,給數(shù)據(jù)的安全帶來非常大的風(fēng)險,隨著計算機病毒、黑客時有入侵,對商業(yè)機密和個人隱私等形成了巨大威脅,通?!耙粋€數(shù)據(jù)造成的損失可能會導(dǎo)致154美元損失,數(shù)據(jù)攻擊者幾個小時就可以獲得數(shù)據(jù),一旦進入數(shù)據(jù)庫,便可以悄無聲息地把數(shù)據(jù)拿走……”過去采取小規(guī)模加密措施已經(jīng)無法有效地在大數(shù)據(jù)環(huán)境下運用。為了有效確保數(shù)據(jù)的安全,必須對大數(shù)據(jù)的安全機制進行完善,應(yīng)根據(jù)數(shù)據(jù)結(jié)構(gòu)與非結(jié)構(gòu)數(shù)據(jù)的差別,數(shù)據(jù)加密措施應(yīng)有所不同。隨著大數(shù)據(jù)應(yīng)用增強,還要提升對數(shù)據(jù)的隔離辦法增強研究,以及構(gòu)建數(shù)據(jù)可追溯機制,讓數(shù)據(jù)在高效使用時能夠獲得具有可用性和完整性的保持。
3.4發(fā)展大數(shù)據(jù)備份和恢復(fù)技術(shù)
人們利用計算機進行學(xué)習(xí)與工作,會產(chǎn)生大量的數(shù)據(jù)與信息,計算機數(shù)據(jù)庫就成為容納這些數(shù)據(jù)與信息的重要工具。為了避免數(shù)據(jù)在輸入輸出中發(fā)生損失等安全問題,大數(shù)據(jù)備份和恢復(fù)技術(shù)也是計算數(shù)據(jù)庫技術(shù)所面對的一個熱門話題。大數(shù)據(jù)備份主要是將現(xiàn)有數(shù)據(jù)復(fù)制拷貝出同樣一份,作為后備副本。在大數(shù)據(jù)備份過程中可以采取定期備份與不定期備份,定期備份是在一定的時間周期中實施備份,時間可以設(shè)定為一天,一周,一月進行備份。不定期備份沒有規(guī)定一定時間,隨機性強,只要計算機數(shù)據(jù)庫在運行,對重要文件隨時進行備份。在采取不定期備份時,要構(gòu)建備份日志的建立工作,目的是當(dāng)計算機發(fā)生故障時,數(shù)據(jù)可以及時恢復(fù),這樣可以杜絕滯后狀況出現(xiàn)。在數(shù)據(jù)備份中,我們還可以采取數(shù)據(jù)遠程復(fù)制備份措施,該方法是利用軟件數(shù)據(jù)復(fù)制和硬件數(shù)據(jù)復(fù)制技術(shù)完成,當(dāng)出現(xiàn)人為的誤刪,修改,軟硬件的故障與黑客入侵,病毒植入使得數(shù)據(jù)的完整性與可用性遭到破壞后,能夠確保本地數(shù)據(jù)中心和遠程備份數(shù)據(jù)中心的數(shù)據(jù)一致性。
其次是數(shù)據(jù)庫恢復(fù)技術(shù)。當(dāng)數(shù)據(jù)庫發(fā)生故障后,使得前后數(shù)據(jù)存在差異時,把數(shù)據(jù)恢復(fù)到正常的情況,該技術(shù)的完成本質(zhì)就是冗余,也就是數(shù)據(jù)庫是不是可以在冗余空間中完整地保存數(shù)據(jù)。在數(shù)據(jù)庫恢復(fù)的過程中,按照實際的不同需求采取不同程度的恢復(fù)措施,如全盤恢復(fù)、指定文件恢復(fù)和重定向恢復(fù)等。全盤恢復(fù)是發(fā)生火災(zāi)等不可抵抗因素時,將所有的信息都恢復(fù)到以前的某一個狀態(tài),這類恢復(fù)會使得一定程度的數(shù)據(jù)丟失,所以很少使用。指定文件恢復(fù)是將被用作單一文件的恢復(fù),主要是對已經(jīng)完成的文件備份,就可以實現(xiàn)單個文件的恢復(fù)。重定向恢復(fù)類似克隆的方式,是在新的境況中建立起與當(dāng)前數(shù)據(jù)庫一樣的一個新數(shù)據(jù),重定向恢復(fù)與定向恢復(fù)原理一樣,但是具有對文件恢復(fù)的便捷性和適應(yīng)性,可以適應(yīng)不同的需求。
3.5 優(yōu)化信息安全技術(shù)
大數(shù)據(jù)時代下,以往的信息體系架構(gòu)已經(jīng)完全改變,數(shù)據(jù)倉庫已經(jīng)變成流動的、連接與信息共享的數(shù)據(jù)池,能夠讓人們在使用時變得更全,尤其是以往不能使用的多種數(shù)據(jù)類型也被大家所利用。但是在數(shù)據(jù)的信息量增加,處理形式的變化,信息安全的問題也更加突出,有必要針對大數(shù)據(jù)信息安全保護采取一定的優(yōu)化措施,例如,針對入侵日志情況,通過分析可以找到里面隱藏的安全漏洞,這樣能夠?qū)崿F(xiàn)對更高級別的安全威脅處理。又如,針對計算機病毒和漏洞認識,可以對計算機病毒或者漏洞存在的某些類型特征掌握,以更好的應(yīng)對這存在的威脅。
參考文獻:
[1]安暉.大數(shù)據(jù)競爭前沿動態(tài)[J].人民論壇,2013年,(15):14-16頁
[2]周錦昌,孟昭莉.大數(shù)據(jù)應(yīng)用的轉(zhuǎn)變.邏輯判斷到系統(tǒng)思考[J],通信世界,2013年,(22):29頁
[3]馮永強.張良.馮怡等.大數(shù)據(jù)應(yīng)用的現(xiàn)狀與展望[J].信息化建設(shè),2015年,(12):292頁
[4]李燁. 云計算安全防護技術(shù)探索與研究[J]. 數(shù)字技術(shù)與應(yīng)用,2017年,(06) :219-223頁
[5]何亨.黃偉.基于SDS架構(gòu)的多級DDoS防護機制[J].計算機工程與應(yīng)用, 2016年,(1):P81-88頁
[6]維克托·邁爾-舍恩伯格.盛楊燕.周濤 譯.大數(shù)據(jù)時代[M].杭州:浙江人民出版社,2013 :267頁