裴亮
摘要:大數(shù)據(jù)是近年來發(fā)展迅速的一種新的信息技術(shù)。它是基于海量數(shù)據(jù)的綜合應(yīng)用技術(shù),對我們的日常生活、經(jīng)濟(jì)發(fā)展和社會生活都有著至關(guān)重要的影響。特別是在網(wǎng)絡(luò)信息系統(tǒng)中,基礎(chǔ)性和高層次的應(yīng)用越來越明顯,本文主要探討了大數(shù)據(jù)技術(shù)在計算機(jī)信息系統(tǒng)中的特性和相關(guān)應(yīng)用。
關(guān)鍵詞:大數(shù)據(jù)技術(shù);計算機(jī)信息系統(tǒng);大數(shù)據(jù)應(yīng)用技術(shù);數(shù)據(jù)安全;數(shù)據(jù)分析
1.引言
大數(shù)據(jù)技術(shù)從本質(zhì)上來說,是從海量數(shù)據(jù)中發(fā)展而來的,但是大數(shù)據(jù)和海量數(shù)據(jù)有著重要的區(qū)別,海量數(shù)據(jù)是以數(shù)據(jù)的容量為基礎(chǔ)的,一般情況下,海量數(shù)據(jù)是分散的,數(shù)據(jù)之間比較混雜而無邏輯,而大數(shù)據(jù)除了海量數(shù)據(jù)外,還有其重要的內(nèi)涵,數(shù)據(jù)之間也有著特定的關(guān)系,可以從中收集特定的信息。
所以,現(xiàn)階段,大數(shù)據(jù)的定義基本可以歸納如下:在一定時間范圍內(nèi)可以捕獲、管理和處理的數(shù)據(jù)集合,它是一個龐大的、高增長率的、多樣化的信息資產(chǎn),可以從中歸納和總結(jié)出一定的信息。
2.大數(shù)據(jù)的特點
2.1? 數(shù)據(jù)總量巨大
大數(shù)據(jù)最重要的基本特征是其巨大的容量。因此,在處理大數(shù)據(jù)時,需要有不同于一般容量數(shù)據(jù)的技術(shù)和處理方式,主要是速度和算法要能適應(yīng)它的巨大容量。
2.2數(shù)據(jù)類型的多樣性
大數(shù)據(jù)不僅包括普通文字,還包括音頻、視頻、圖片等多種數(shù)據(jù)類型。因此,在處理這些不同的數(shù)據(jù)時,應(yīng)根據(jù)其特點和要求采用不同的技術(shù)。
2.3數(shù)據(jù)的分散性和相關(guān)性
大數(shù)據(jù)存儲在不同的地方,但它們在邏輯上有很大的相關(guān)性。因此,大數(shù)據(jù)技術(shù)的關(guān)鍵是從不同的地方采集數(shù)據(jù),然后利用這些數(shù)據(jù)進(jìn)行相關(guān)性分析和處理。
2.4云存儲和計算能力
大數(shù)據(jù)通常需要更好的云存儲和計算能力,以解決普通人力無法處理的情況,使數(shù)據(jù)具有更好的共享,分布存儲和計算能力,這是未來發(fā)展的主要方向。
3.大數(shù)據(jù)技術(shù)發(fā)展與應(yīng)用中的幾個問題
3.1 在許多領(lǐng)域落后
總的來說,目前在我國,大數(shù)據(jù)應(yīng)該的規(guī)模和技術(shù)都比較落后,各類存儲、應(yīng)用和研發(fā)水平都落后于社會的需要,必須要加大研究和開發(fā)的資金和人力的投入,以及全面和深入的應(yīng)用,特別是在一些關(guān)系國計民生的行業(yè),比如,在軍事和金融安全領(lǐng)域,要全面整理各種破壞和入侵行為的信息,在數(shù)據(jù)的采集、排序和處理過程中,進(jìn)行合理有效的分類和排序,如果采集的強(qiáng)度和廣度不夠,技術(shù)水平不到位,設(shè)備簡陋,它將不能滿足要求。
3.2 缺乏所需的數(shù)據(jù)和信息
在數(shù)據(jù)采集方面,如果各行業(yè)、各部門的數(shù)據(jù)分散化,分布廣泛的數(shù)據(jù)不能共享和相互操作,缺乏統(tǒng)一的軟件支持,那么數(shù)據(jù)的采集,分析和應(yīng)用效果必然有限。
3.3 專業(yè)技術(shù)水平不高
大數(shù)據(jù)技術(shù)涉及計算機(jī)領(lǐng)域的各個方面,包括數(shù)學(xué)、算法等知識,要求從業(yè)人員具備較全面的知識和較強(qiáng)的綜合能力,具有預(yù)測和應(yīng)變能力,具有相關(guān)軟件的使用能力,目前,在我國,這方面的人才還是相對匱乏,很大一部分還是初級水平,遠(yuǎn)遠(yuǎn)不能滿足市場的需要。
3.4相關(guān)人才培養(yǎng)的力度不夠
雖然許多高校已經(jīng)開設(shè)與大數(shù)據(jù)相關(guān)的專業(yè)和課程,但由于該專業(yè)培養(yǎng)周期長、對相關(guān)知識和能力要求較高,人才總量和質(zhì)量遠(yuǎn)遠(yuǎn)不能滿足整個社會的需求,是我國各級各類教育機(jī)構(gòu)亟待解決的一個重要問題。
4.大數(shù)據(jù)技術(shù)在信息系統(tǒng)中的應(yīng)用分析
4.1 在云計算中的應(yīng)用
大數(shù)據(jù)的本質(zhì)是挖掘海量數(shù)據(jù)中有用的信息,在不同領(lǐng)域的應(yīng)用將是大數(shù)據(jù)發(fā)展的關(guān)鍵,比如,包含數(shù)據(jù)分析與處理的云計算只需要少量的工作就可以獲得較好的處理效能,可以通過多種方式訪問并根據(jù)需要進(jìn)行操作,采用分布式云存儲和虛擬技術(shù)來實現(xiàn),人工智能=云計算+大數(shù)據(jù)。人工智能是利用機(jī)器設(shè)備模擬人類的思維方式和行為方式(比如學(xué)習(xí)、分析和行動),并最終形成類似人類模型的學(xué)科,它將涉及人類知識領(lǐng)域的所有方面,其范圍遠(yuǎn)遠(yuǎn)超出計算機(jī)科學(xué)的范圍。長期來說,人工智能將改變?nèi)祟惖纳罘绞?,而大?shù)據(jù)技術(shù)是人工智能的基礎(chǔ)和關(guān)鍵技術(shù)。
4.2 在存儲備份中的應(yīng)用
很多行業(yè)都有大量的數(shù)據(jù)需要存儲、備份和遷移。但目前國內(nèi)的機(jī)構(gòu)在數(shù)據(jù)存儲和安全保護(hù)方面做得還不夠,主要有三個原因:
4.2.1 數(shù)據(jù)備份意識淡薄
平時不注意完整、有序、定期的備份。當(dāng)出現(xiàn)數(shù)據(jù)丟失等問題時,才會引起一定的重視。
4.2.2 備份方法相對落后
例如只使用移動設(shè)備或本地設(shè)備,而不考慮遠(yuǎn)程存儲、云存儲技術(shù)等,應(yīng)該發(fā)展各方面的備份和存儲技術(shù),以防各種不測事件的發(fā)生所造成的不可彌補(bǔ)的損失。
4.2.3 缺乏安全意識和措施
一旦數(shù)據(jù)被盜或丟失,很容易引發(fā)安全危機(jī)。據(jù)統(tǒng)計,目前我國有數(shù)據(jù)備份的企業(yè)僅占30%左右,具有容災(zāi)系統(tǒng)的企業(yè)不高于10%。有鑒于此,有關(guān)單位領(lǐng)導(dǎo)和技術(shù)人員首先要充分認(rèn)識到數(shù)據(jù)備份和安全的重要性,不要等到事故發(fā)生后再考慮補(bǔ)救措施,這很可能會造成巨大損失。其次,要注意運用傳統(tǒng)手段與現(xiàn)代手段相結(jié)合、本地手段與遠(yuǎn)程手段相結(jié)合等不同手段。還應(yīng)該考慮存儲和備份的安全因素,確保備份地點和方式的合理性和安全性。
5.大數(shù)據(jù)信息系統(tǒng)應(yīng)用軟件
大數(shù)據(jù)分析處理的高效平臺不多,仍在開發(fā)和完善中。同時,Hadoop系統(tǒng)是目前大數(shù)據(jù)存儲、備份和管理的良好軟件。它以可靠、高效、可擴(kuò)展的方式處理數(shù)據(jù),具有良好的通用性、各組件間良好的協(xié)作性、充分發(fā)揮系統(tǒng)整體功能、細(xì)化、準(zhǔn)確的功能劃分,是一個全面、強(qiáng)大的大數(shù)據(jù)分析應(yīng)用平臺。
另外,近年來,市場上也出現(xiàn)了不少專注于大數(shù)據(jù)技術(shù)某個方面和領(lǐng)域的專業(yè)平臺,這對提高大數(shù)據(jù)技術(shù)的應(yīng)用水平和領(lǐng)域有極大的益處,也不斷地擴(kuò)展應(yīng)用系統(tǒng)本身的層次和規(guī)模。
6.提高大數(shù)據(jù)應(yīng)用技術(shù)的方法
鑒于大數(shù)據(jù)技術(shù)的廣泛應(yīng)用和整體應(yīng)用水平的不足,必須進(jìn)一步采取措施加強(qiáng)相關(guān)工作,特別是在相關(guān)國家級別層面的機(jī)構(gòu)和研究單位,應(yīng)該加大資金,人力、物力的投入,讓研究水平和應(yīng)用水平向更高更深的層次躍進(jìn)。
6.1政府部門參與,優(yōu)化平臺建設(shè)
政府有關(guān)部門要從宏觀上和微觀上介入,開展個別企業(yè)不能獨立完成的工作,如建立專業(yè)的質(zhì)量監(jiān)督評價機(jī)構(gòu),強(qiáng)化宣傳和合作,建立和健全統(tǒng)計和質(zhì)量評價制度,構(gòu)建長期有效的機(jī)制,有關(guān)部門應(yīng)統(tǒng)一建立影響數(shù)據(jù)的干擾項的集成管理和分析平臺,對數(shù)據(jù)采集進(jìn)行透明化和規(guī)范化管理,實現(xiàn)統(tǒng)一存儲和管理,分散應(yīng)用,提高數(shù)據(jù)集成和分析效率??傊?,我們應(yīng)該加強(qiáng)政府有關(guān)部門的協(xié)調(diào)和引導(dǎo)作用,創(chuàng)新技術(shù)和應(yīng)用,提供一個可供社會各界使用的共享平臺,這也是政府服務(wù)社會的重要舉措。
6.2? 改進(jìn)大數(shù)據(jù)應(yīng)用技術(shù)
大力發(fā)展大數(shù)據(jù)技術(shù)和應(yīng)用,特別是云存儲,算法,云安全等領(lǐng)域,進(jìn)而提高大數(shù)據(jù)技術(shù)在人工智能方面的應(yīng)用,不斷提高平臺的易用性和通用性,使大數(shù)據(jù)技術(shù)在社會生活的各個方面都得到充分應(yīng)用,讓每個人都能體驗到大數(shù)據(jù)技術(shù)的價值。
6.3提高員工的專業(yè)技能
要充分認(rèn)識大數(shù)據(jù)應(yīng)用和管理的重要性、復(fù)雜性和關(guān)鍵性,大力提高從事大數(shù)據(jù)應(yīng)用和管理人員的專業(yè)技能,而不是僅僅應(yīng)付了事或停留在初級階段。在人員招聘、培訓(xùn)和使用等方面的要求要高于其他領(lǐng)域,包括工資和待遇,以提高他們在這個領(lǐng)域的的工作積極性,還要給他們一定的壓力,考核和獎懲要與他們的具體表現(xiàn)掛鉤,使他們成為單位的核心人員。同時,鑒于大數(shù)據(jù)技術(shù)的快速發(fā)展,有必要讓他們經(jīng)常參與學(xué)習(xí)和培訓(xùn),以避免應(yīng)用的水平落后于時代和各方面的需要。此外,企業(yè)領(lǐng)導(dǎo)也要重視這項工作,加強(qiáng)和完善大數(shù)據(jù)領(lǐng)域的規(guī)章制度,提高大數(shù)據(jù)應(yīng)用質(zhì)量。
7.結(jié)論
目前,大數(shù)據(jù)技術(shù)在世界范圍內(nèi)得到了廣泛的應(yīng)用。因此,我國各級政府部門、企事業(yè)單位和個人應(yīng)積極參與建設(shè)、學(xué)習(xí)、管理和應(yīng)用,使大數(shù)據(jù)技術(shù)全面造福人類。但是,鑒于網(wǎng)絡(luò)安全方面的嚴(yán)峻形式,在使用大數(shù)據(jù)方面也要特別注意安全方面的措施,否則將會給大數(shù)據(jù)應(yīng)用造成難以彌補(bǔ)的損失。同時,也應(yīng)該不斷提升大數(shù)據(jù)應(yīng)用的各方面的技術(shù)水平和應(yīng)用水平,擴(kuò)展應(yīng)用領(lǐng)域和范圍,讓大數(shù)據(jù)技術(shù)能安全、高效、全面地服務(wù)于人類生活、科技領(lǐng)域的方方面面。
參考文獻(xiàn):
[1]張祖平.教師數(shù)據(jù)備份技巧[J].計算機(jī)知識與技術(shù)(經(jīng)驗技能),2018(11).(中文)
[2]連淑娟.基于虛擬化的數(shù)據(jù)備份機(jī)制[J].計算機(jī)系統(tǒng)應(yīng)用,2019(08).(中文)
[3]詹明.銀行業(yè)數(shù)據(jù)備份與安全分析[J].金融科技時代,2019(09).