摘要:計算機網(wǎng)絡(luò)技術(shù)的升級換代極大地推動了社會的發(fā)展進步,當(dāng)前階段,依托互聯(lián)網(wǎng)誕生的各類新興媒體使得人類社會的數(shù)據(jù)規(guī)模持續(xù)擴大,且相較于傳統(tǒng)數(shù)據(jù)模式,現(xiàn)階段人們面對的大部分都是非結(jié)構(gòu)數(shù)據(jù),想要實現(xiàn)對數(shù)據(jù)價值的有效發(fā)掘和應(yīng)用,必須尋求全新的數(shù)據(jù)分析技術(shù)和存儲技術(shù)?;诖耍撐膶⒔Y(jié)合現(xiàn)階段數(shù)據(jù)發(fā)展形勢對大數(shù)據(jù)分析和云計算網(wǎng)絡(luò)技術(shù)的優(yōu)劣進行探討分析,希望可以為計算機網(wǎng)絡(luò)領(lǐng)域的發(fā)展提供參考借鑒。
關(guān)鍵詞:大數(shù)據(jù);數(shù)據(jù)分析;云計算
中圖分類號:TP393 文獻標(biāo)識碼:A
文章編號:1009-3044(2020)18-0061-02
開放科學(xué)(資源服務(wù))標(biāo)識碼(OSID):
現(xiàn)如今,互聯(lián)網(wǎng)已經(jīng)深入到人們工作生活的方方面面,基于此產(chǎn)生的數(shù)據(jù)量也呈現(xiàn)出持續(xù)提升的趨勢,這些規(guī)模龐大、內(nèi)容豐富的數(shù)據(jù)包含著大量的信息,在諸多領(lǐng)域的發(fā)展中都具有巨大的價值。數(shù)據(jù)分析就是對數(shù)據(jù)進行采集、存儲、加工、變換和傳輸。在大數(shù)據(jù)時代下,傳統(tǒng)的數(shù)據(jù)分析技術(shù)已經(jīng)面臨淘汰,需要探索更加高效的數(shù)據(jù)集合處理、分布式存儲、計算等方面的技術(shù)。
1 大數(shù)據(jù)時代以及數(shù)據(jù)處理
1.1大數(shù)據(jù)的發(fā)展
大數(shù)據(jù)是誕生與互聯(lián)網(wǎng)高度發(fā)達時代下的一個全新概念,其主要是指信息大爆炸背景下所產(chǎn)生的海量數(shù)據(jù)以及與之相關(guān)的技術(shù)創(chuàng)新發(fā)展。在網(wǎng)絡(luò)信息時代下,整個人類社會的數(shù)據(jù)規(guī)模正在持續(xù)快速的擴大,數(shù)據(jù)在社會生產(chǎn)生活中所占據(jù)的地位越來越重要。尤其是在商業(yè)、經(jīng)濟等領(lǐng)域,基于大數(shù)據(jù)分析而做出決策的模式正在逐漸占據(jù)主流。
和傳統(tǒng)數(shù)據(jù)相比,大數(shù)據(jù)不僅包含結(jié)構(gòu)化數(shù)據(jù),還涵蓋著大量的非結(jié)構(gòu)化數(shù)據(jù),因此大數(shù)據(jù)分析工作的難度相較于過去也出現(xiàn)了大幅度的提升。在現(xiàn)代社會生產(chǎn)生活中,大數(shù)據(jù)應(yīng)用展現(xiàn)出了階段的優(yōu)勢,許多傳統(tǒng)行業(yè)領(lǐng)域在大數(shù)據(jù)應(yīng)用的幫助下煥發(fā)出了新的活力。大數(shù)據(jù)分析在消費者行為判斷、市場發(fā)展趨勢預(yù)測、營銷范圍控制等方面均有著顯著的作用。
大數(shù)據(jù)的發(fā)展應(yīng)用使得現(xiàn)階段人們的數(shù)據(jù)應(yīng)用觀念發(fā)生了一定的變化,具體體現(xiàn)在三個方面:首先,在大數(shù)據(jù)時代下,人們用來分析的數(shù)據(jù)規(guī)模變得更大,在對某個事件或是對象進行處理時,甚至可以獲取與之相關(guān)的所有數(shù)據(jù),不必再依賴隨機采樣。其次,大數(shù)據(jù)種類繁雜,規(guī)模龐大,在對其進行分析、挖掘、應(yīng)用的過程中不可能再像過去那樣,一味地追求精確度,正確的思路是從全局角度出發(fā),把握大致發(fā)展方向。再次,基于大數(shù)據(jù)的事件走向分析將關(guān)注點從因果關(guān)系轉(zhuǎn)向相關(guān)關(guān)系,探求事物之間存在的普遍聯(lián)系。
2 新時期追求高水平數(shù)據(jù)處理能力的必要性分析
結(jié)合上文論述可知,在現(xiàn)代社會生產(chǎn)生活中,數(shù)據(jù)所發(fā)揮的作用正在逐步提升,任何機構(gòu)和單位想要獲得更加的發(fā)展,都必須重視數(shù)據(jù)的價值,提高自身的數(shù)據(jù)分析挖掘能力。面對規(guī)模龐大、結(jié)構(gòu)不平衡且內(nèi)容繁雜的數(shù)據(jù),廣大企業(yè)應(yīng)該追求更加高效的數(shù)據(jù)處理,其意義主要體現(xiàn)在四個方面:
其一,高效、精準(zhǔn)的數(shù)據(jù)處理可以將客觀情況完整、翔實地反映出來?,F(xiàn)代企業(yè)、單位發(fā)展所面臨的內(nèi)外部環(huán)境變得更加復(fù)雜多變,在做出一項決策時需要考慮的因素也在變多,因為稍有不慎就可能造成不可挽回的惡劣后果。而通過大量、豐富的統(tǒng)計資料和數(shù)據(jù)加工處理分析,則可以幫助人們掌握當(dāng)前實際情況,在此基礎(chǔ)上做出更加科學(xué)的判斷和決策。
其二,實現(xiàn)對數(shù)據(jù)資料的深度開發(fā)利用,將其價值充分發(fā)揮出來。大數(shù)據(jù)的特點是種類多、結(jié)構(gòu)復(fù)雜以及價值密度低,因此想要在浩如煙海的數(shù)據(jù)海中尋找到所需的信息需要十分強大的數(shù)據(jù)分析處理技術(shù)作為支撐。通常來講,數(shù)據(jù)深度挖掘是一項十分艱苦的工作,分析部門需要定期對數(shù)據(jù)進行統(tǒng)計、調(diào)查和采集,之后對采集到的數(shù)據(jù)資料進行深度加工整理,進一步分析研究之后才能進行多層次的開發(fā)利用,形成具有實際應(yīng)用價值的信息。此外,針對數(shù)據(jù)的深度開發(fā)利用實際上也是對資源的全新整合,基于此誕生了許多全新的服務(wù)項目,為社會經(jīng)濟發(fā)展提供了極大的助力。但有一點不可忽視,那就是分析和服務(wù)的信息技術(shù)對模型管理有著較高的要求。
其三,為科學(xué)化管理與決策提供支撐。在現(xiàn)代管理工作中,想要踐行科學(xué)化管理,不能僅僅關(guān)注表面問題,需要對事物的內(nèi)在本質(zhì)進行透徹了解,厘清其存在的關(guān)聯(lián)和因果,如此才能針對性的采取管理措施。而想要達到這一目標(biāo),就需要借助數(shù)據(jù)資料的優(yōu)勢。通過對數(shù)據(jù)的分析可以將事物運行的機理展現(xiàn)出來,幫助人們從感性認(rèn)知轉(zhuǎn)變?yōu)槔硇哉J(rèn)知,精準(zhǔn)把握事物的現(xiàn)狀、內(nèi)在聯(lián)系以及發(fā)展規(guī)律。
其四,其他方面的需要?,F(xiàn)代社會生產(chǎn)生活對數(shù)據(jù)處理提出了許多新的要求,如大量、高速、多樣、真實性等,這些都是提高數(shù)據(jù)處理能力的必要性體現(xiàn)。其中數(shù)據(jù)質(zhì)量是數(shù)據(jù)處理的重要一環(huán),其關(guān)鍵環(huán)節(jié)就是數(shù)據(jù)的真實性,它是數(shù)據(jù)有效應(yīng)用的基礎(chǔ)。此外,大數(shù)據(jù)的發(fā)展應(yīng)用也推動了科學(xué)領(lǐng)域的發(fā)展,數(shù)據(jù)模型分析已經(jīng)成為諸多領(lǐng)域的重要研究手段。
3 傳統(tǒng)數(shù)據(jù)處理存在的問題分析
數(shù)據(jù)處理主要由采集、存儲、檢索、加工、變換、傳輸?shù)葞讉€環(huán)節(jié)構(gòu)成,在大數(shù)據(jù)背景下,傳統(tǒng)的數(shù)據(jù)處理已經(jīng)表現(xiàn)出明顯的頹勢,其問題主要集中在兩個方面:
首先,傳統(tǒng)數(shù)據(jù)處理無法有效應(yīng)對非結(jié)構(gòu)化數(shù)據(jù)。基于現(xiàn)有認(rèn)知來看,數(shù)據(jù)主要可以分為結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)兩大類,前者是指可使用統(tǒng)一結(jié)構(gòu)進行表示的數(shù)據(jù),包括數(shù)字、符號等。后者則是指無法通過統(tǒng)一結(jié)構(gòu)表示的信息,多誕生于互聯(lián)網(wǎng)背景下,如圖像、音視頻、網(wǎng)頁等?,F(xiàn)代生產(chǎn)生活中,人們所面對的數(shù)據(jù)通常是結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的混合體,若是采用傳統(tǒng)的數(shù)據(jù)分析技術(shù),將無法處理其中的非結(jié)構(gòu)化數(shù)據(jù)部分。就目前的發(fā)展趨勢來看,非結(jié)構(gòu)化數(shù)據(jù)的規(guī)模正在持續(xù)擴大,其與結(jié)構(gòu)化數(shù)據(jù)的比值也在增大,這將使傳統(tǒng)數(shù)據(jù)分析技術(shù)逐漸被淘汰。
其次,數(shù)據(jù)安全性無法保障。數(shù)據(jù)價值的突顯使得數(shù)據(jù)安全問題逐漸引起重視,現(xiàn)如今,很多企業(yè)、單位所擁有的數(shù)據(jù)中都包含有大量的機密信息,想要將數(shù)據(jù)以安全的方式傳輸?shù)酱髷?shù)據(jù)公司,需要消耗大量的時間和成本。
4 大數(shù)據(jù)分析和云計算網(wǎng)絡(luò)技術(shù)分析
4.1 大數(shù)據(jù)分析
對于大數(shù)據(jù),很難在短時間內(nèi)使用常規(guī)軟件對其進行捕捉、管理和處理,因此需要探求全新的數(shù)據(jù)處理模式,以應(yīng)對更加海量、增長率更高且更加多樣化的信息。經(jīng)過一段時間的實踐研究之后,許多針對大數(shù)據(jù)的分析處理方法紛紛涌現(xiàn),為大數(shù)據(jù)應(yīng)用提供了極大的便利。結(jié)合實際情況來看,大數(shù)據(jù)分析的優(yōu)勢主要集中在五個方面:
其一,大數(shù)據(jù)分析實現(xiàn)了可視化,能夠?qū)?shù)據(jù)的結(jié)構(gòu)及特點直觀清晰地展現(xiàn)出來。
其二,數(shù)據(jù)挖掘。作為大數(shù)據(jù)分析的理論核心,多樣化的數(shù)據(jù)挖掘算法能夠有效地應(yīng)對不同類型和格式的數(shù)據(jù)資料,通過數(shù)據(jù)挖掘可以將數(shù)據(jù)所具有的特征表現(xiàn)出來,捕捉數(shù)據(jù)所擁有的潛在價值,更好地服務(wù)于現(xiàn)代化管理決策活動。
其三,預(yù)測性分析。大數(shù)據(jù)分析可以將某些事物和事件在未來一段時間內(nèi)的發(fā)展走向展現(xiàn)出來,這種預(yù)測性的分析往往需要借助科學(xué)模型來實現(xiàn)。
其四,語義引擎,這是一種主動分析數(shù)據(jù)并提取關(guān)鍵信息的技術(shù)方法。
其五,數(shù)據(jù)質(zhì)量和數(shù)據(jù)管理。大數(shù)據(jù)分析同樣可以作用于數(shù)據(jù)管理和數(shù)據(jù)質(zhì)量優(yōu)化,在商業(yè)經(jīng)濟、學(xué)術(shù)科研等諸多領(lǐng)域中,高效精準(zhǔn)的數(shù)據(jù)管理都有著十分重要的意義。
除了具有多方面的優(yōu)勢之外,大數(shù)據(jù)分析同樣存在一定的缺陷和不足,具體表現(xiàn)在兩個方面:一方面,雖然大數(shù)據(jù)的發(fā)展應(yīng)用為人類發(fā)展帶來了便利,但數(shù)據(jù)膨脹之下的信息爆炸也對普通人的隱私安全產(chǎn)生了威脅。人們在應(yīng)用互聯(lián)網(wǎng)的過程中產(chǎn)生了大量的數(shù)據(jù),其中很大一部分都通過社交媒體被傳播出去,這意味人們的日常生活已經(jīng)變得透明化,一些隱私派甚至特意收集這部分?jǐn)?shù)據(jù)進行商用。另一方面,數(shù)據(jù)真實性問題。在海量的數(shù)據(jù)集合之下存在著大量的虛假信息,若是不加甄別直接應(yīng)用于實際工作中,比如預(yù)測性分析中,會導(dǎo)致預(yù)測結(jié)果嚴(yán)重偏移實際發(fā)展,從而做出錯誤的決策。數(shù)據(jù)本身并不存在屬性,但使用數(shù)據(jù)的人卻存在屬性,數(shù)據(jù)應(yīng)用的不加節(jié)制最終也必然會引發(fā)惡果。
4.2 云計算網(wǎng)絡(luò)技術(shù)
云計算是分布式運算、并行計算、效用計算、網(wǎng)絡(luò)儲存、虛擬化、負(fù)載均衡以及熱備份冗余等傳統(tǒng)計算機和網(wǎng)絡(luò)技術(shù)融合發(fā)展的產(chǎn)物。結(jié)合實際應(yīng)用情況,云計算網(wǎng)絡(luò)技術(shù)所具有的優(yōu)勢有兩項:
其一,云計算可以將數(shù)據(jù)存儲在云端,這樣可以將大量的硬盤空間節(jié)省出來,為計算機運行提供堅強的后盾,同時所有應(yīng)用的運行也被轉(zhuǎn)移到云端,這樣不僅可以降低計算機的成本,且由于程序和進程的減少,計算機的性能將獲得極大的改進,實現(xiàn)運行效率的提升。
其二,存儲容量龐大,以目前的計算發(fā)展來看,云端計算機的存儲容量近乎無限,且所有存儲于云端的數(shù)據(jù)均相當(dāng)于一個備份,完全不必?fù)?dān)心數(shù)據(jù)丟失的情況發(fā)生,數(shù)據(jù)安全可以得到有效保障。
云計算網(wǎng)絡(luò)技術(shù)存在的缺陷同樣有兩項:
其一,云端數(shù)據(jù)被隨意訪問?,F(xiàn)如今,云計算網(wǎng)絡(luò)只能保障用戶數(shù)據(jù)的存儲安全,其他方面的安全尚不能有效兼顧。一旦選擇將數(shù)據(jù)或是主機應(yīng)用程度存儲在云端之后,將無法在通過物理渠道對這部分?jǐn)?shù)據(jù)進行訪問。而由于云端數(shù)據(jù)安全防護力度不足,一些未經(jīng)授權(quán)的用戶也可能會通過一定特殊的手段進行數(shù)據(jù)訪問,造成用戶數(shù)據(jù)的泄露。
其二,云計算網(wǎng)絡(luò)的虛擬化同樣存在安全隱患。在加持虛擬化技術(shù)之后,操作系統(tǒng)和底層硬件的關(guān)系將發(fā)生巨大的轉(zhuǎn)變,受此影響,相應(yīng)的存儲、運算以及網(wǎng)絡(luò)都可能會發(fā)生變化。虛擬化在云基礎(chǔ)設(shè)置這一方面的使用,為使用者帶來了安全隱患。
5 結(jié)語
綜上所述,計算機網(wǎng)絡(luò)技術(shù)的快速發(fā)展使得人們的工作、生活方式發(fā)生了巨大的變化,新媒體、網(wǎng)絡(luò)平臺的普及為人們的生活帶來了便利,伴生而來的則是不斷膨脹的數(shù)據(jù)規(guī)模,在這種形勢下,大數(shù)據(jù)分析技術(shù)和云計算網(wǎng)絡(luò)技術(shù)應(yīng)運而生,解決了數(shù)據(jù)分析處理和存儲方面的問題。但不可忽視的是,現(xiàn)階段大數(shù)據(jù)分析以及云計算都仍舊存在一定的弊端和問題,需要在未來將進行更加深入的開發(fā)研究。
參考文獻:
[1]熊俊.基于云計算的大數(shù)據(jù)分析流程優(yōu)化路徑研究[Jl.電腦知識與技術(shù),2019,15(8):181-182,185.
[2]呂維昕.基于智能計算的數(shù)據(jù)分析方法的研究與設(shè)計[J].中國科技縱橫,2017(21):33,35.
[3]楊競?cè)A.基于大數(shù)據(jù)分析的計算機信息處理技術(shù)研究[J].電腦知識與技術(shù),2017,13(30):33-34,36.
[4]羅陽倩子,廖威,芻議計算機大數(shù)據(jù)分析與云計算網(wǎng)絡(luò)技術(shù)[Jl.數(shù)字技術(shù)與應(yīng)用,2019(9):223-224.
[5]陳臣.基于云計算的圖書館大數(shù)據(jù)分析和決策支持平臺構(gòu)建[J].圖書館理論與實踐,2016(5):101-104.
[6]熊志正,官思發(fā),朝樂門.計算機輔助信息分析的技術(shù)框架及其發(fā)展趨勢[Jl.圖書情報工作,2015,59(3):19-25.
【通聯(lián)編輯:代影】
作者簡介:李江鵬(1983-),男,廣西梧州人,碩士研究生,研究方向:計算機數(shù)據(jù)庫應(yīng)用、數(shù)據(jù)挖掘推薦等。