陸峰
(廣西瑞豪科技有限公司 廣西南寧 530022)
基于大數(shù)據(jù)時(shí)代下的計(jì)算機(jī)信息處理技術(shù)探析
陸峰
(廣西瑞豪科技有限公司 廣西南寧 530022)
在科學(xué)技術(shù)不斷進(jìn)步的背景下,各種計(jì)算機(jī)的信處理技術(shù)不斷更新,并且互聯(lián)網(wǎng)技術(shù)也迅速發(fā)展,使得人類社會(huì)開始進(jìn)入大數(shù)據(jù)的時(shí)代。在大數(shù)據(jù)時(shí)代下,計(jì)算機(jī)的信息數(shù)據(jù)處理技術(shù)逐漸受到重視。本文分析了大數(shù)據(jù)概念、特點(diǎn)與影響,并探討在大數(shù)據(jù)的時(shí)代下,計(jì)算機(jī)的信息數(shù)據(jù)處理技術(shù),提出大數(shù)據(jù)下計(jì)算機(jī)的信息處理技術(shù)未來發(fā)展展望,以期為信息處理提供參考。
大數(shù)據(jù)時(shí)代;計(jì)算機(jī);信息處理技術(shù)
隨著計(jì)算機(jī)的技術(shù)出現(xiàn),使得傳統(tǒng)計(jì)算模式發(fā)生改變,給社會(huì)的科學(xué)技術(shù)發(fā)展與完善提供了一個(gè)新方向。近年來,計(jì)算機(jī)的技術(shù)逐漸廣泛應(yīng)用在各行各業(yè)中,在人們的生活與工作中占據(jù)著重要位置。但是在發(fā)展過程中還面臨著諸多挑戰(zhàn),大部分互聯(lián)網(wǎng)公司為獲得更多的盈利,對(duì)于計(jì)算機(jī)的數(shù)據(jù)存儲(chǔ)研究過于重視,而對(duì)大數(shù)據(jù)時(shí)代特點(diǎn)與發(fā)展趨勢(shì)沒有全面掌握,從而導(dǎo)致自身發(fā)展受到影響。因此,需要相關(guān)人員深入分析大數(shù)據(jù)時(shí)代背景下,可能存在的挑戰(zhàn)與機(jī)遇,從而針對(duì)自身情況研究計(jì)算機(jī)的信息處理技術(shù),進(jìn)而給互聯(lián)網(wǎng)用戶提供最優(yōu)質(zhì)服務(wù)。
1.1 大數(shù)據(jù)特點(diǎn)
大數(shù)據(jù)主要特點(diǎn)就是多樣化、數(shù)據(jù)量比較大、復(fù)查比較容易以及快速化等。其中,數(shù)據(jù)量比較大主要指大數(shù)據(jù)的時(shí)代計(jì)算機(jī)的信息數(shù)據(jù)處理量相對(duì)較大,并且呈現(xiàn)出與日俱增的情況,已經(jīng)從原先TB的數(shù)量級(jí)轉(zhuǎn)變成ZB數(shù)量級(jí),1ZB等于10242PB;快速化主要指新時(shí)代網(wǎng)絡(luò)的數(shù)據(jù)流中,大部分?jǐn)?shù)據(jù)傳輸都比較高速與實(shí)時(shí),在處理這類數(shù)據(jù)時(shí)需要持續(xù)、實(shí)時(shí)與快速,必要時(shí)還要對(duì)這類數(shù)據(jù)處理工具進(jìn)行不斷更新;數(shù)據(jù)復(fù)查主要指計(jì)算機(jī)中海量數(shù)據(jù)信息的處理難度比較大,很多信息處理的技術(shù)還需要不斷完善;多樣化主要指在大數(shù)據(jù)的時(shí)代背景下,數(shù)據(jù)的類型非常復(fù)雜,通常包含圖片、文本、視頻以及音頻等,并且格式多種多樣,這就加大了計(jì)算機(jī)的信息處理難度[1]。
1.2 大數(shù)據(jù)時(shí)代對(duì)信息數(shù)據(jù)處理的影響
物聯(lián)網(wǎng)的技術(shù)與云計(jì)算的技術(shù)產(chǎn)生為大數(shù)據(jù)時(shí)代到來創(chuàng)造了必然條件,而大數(shù)據(jù)時(shí)代會(huì)對(duì)政府機(jī)關(guān)活動(dòng)方式、計(jì)算機(jī)的用戶使用以及企事業(yè)單位的運(yùn)營(yíng)有著直接性影響。此外,在大數(shù)據(jù)的時(shí)代背景下,其核心與重要內(nèi)容內(nèi)容就是數(shù)據(jù),并且在大數(shù)據(jù)的時(shí)代下,網(wǎng)民、企業(yè)與消費(fèi)者間界限變得越發(fā)模糊,界限不夠明確,這在某種程度上嚴(yán)重影響了企業(yè)發(fā)展方向、運(yùn)行、管理以及經(jīng)營(yíng)。
1.3 大數(shù)據(jù)下信息數(shù)據(jù)處理技術(shù)發(fā)展情況
大數(shù)據(jù)屬于計(jì)算機(jī)的技術(shù)發(fā)展的階段性產(chǎn)物,大數(shù)據(jù)時(shí)代則是IT行業(yè)第三次的技術(shù)性變革,在其開始誕生之時(shí)就對(duì)企業(yè)、國(guó)家管理以及人們?nèi)粘I?、工作有著重要影響。近年來,隨著大數(shù)據(jù)的理念逐漸形成,網(wǎng)民與計(jì)算機(jī)的網(wǎng)絡(luò)消費(fèi)界限越來越模糊,數(shù)據(jù)逐漸變成一種可以展現(xiàn)社會(huì)價(jià)值的重要資產(chǎn),對(duì)于企業(yè)文化樹立、組織結(jié)構(gòu)調(diào)整以及運(yùn)營(yíng)模式創(chuàng)新都有良好推動(dòng)與導(dǎo)向的作用,這表明大數(shù)據(jù)的時(shí)代背景給人才培養(yǎng)、企業(yè)文化與組織建設(shè)提供了挑戰(zhàn),同時(shí)也創(chuàng)造了機(jī)遇。當(dāng)下大數(shù)據(jù)時(shí)代已經(jīng)是時(shí)代發(fā)展典型的特征,其可以代表當(dāng)今時(shí)代的信息技術(shù)發(fā)展態(tài)勢(shì)。而且在大數(shù)據(jù)時(shí)代背景下,可以看出現(xiàn)今是信息的大爆炸時(shí)代,同時(shí)也是競(jìng)爭(zhēng)和機(jī)遇共存的時(shí)代[2]。
計(jì)算機(jī)的信息數(shù)據(jù)處理流程從圖1中可以看出,具體處理技術(shù)如下:
2.1 數(shù)據(jù)分析與可視化的技術(shù)
①數(shù)據(jù)分析的技術(shù):數(shù)據(jù)的分析技術(shù)主要包含情感的分析、網(wǎng)絡(luò)的分析、空間的分析、各種時(shí)域序列的分析以及回歸分析等。網(wǎng)絡(luò)分析主要指在網(wǎng)絡(luò)的特征下所實(shí)施的分析技術(shù)之一;空間的分析主要是幾何統(tǒng)計(jì)的分析、集拓?fù)浞治雠c地理編碼分析;而情感分析也就是自然語言的主觀分析。②可視化的技術(shù)。應(yīng)用可視化的技術(shù)可以創(chuàng)建圖片、圖形以及圖表等,以便人們對(duì)數(shù)據(jù)結(jié)果進(jìn)行正確分析與理解,同時(shí)應(yīng)用可視化的技術(shù)可以幫助相關(guān)人員充分認(rèn)識(shí)數(shù)據(jù)集。
圖1 計(jì)算機(jī)信息數(shù)據(jù)處理的流程圖
2.2 關(guān)聯(lián)規(guī)則的學(xué)習(xí)技術(shù)、分類與聚類分析的技術(shù)
分類的分析技術(shù)主要是在數(shù)據(jù)點(diǎn)歸納基礎(chǔ)上,給出新數(shù)據(jù)點(diǎn),并在假設(shè)結(jié)構(gòu)確定基礎(chǔ)上,合理預(yù)測(cè)客戶可能發(fā)生的行為;聚類的分析技術(shù)一般是在限制因素不明確情況下,將集合分成不同的對(duì)象組,然后對(duì)對(duì)象組進(jìn)行分析與處理,這種技術(shù)分析比較詳細(xì),因此在數(shù)據(jù)的挖掘方面應(yīng)用比較廣泛。另外,在數(shù)據(jù)的挖掘中還會(huì)應(yīng)用關(guān)聯(lián)規(guī)則的技術(shù)與機(jī)械學(xué)習(xí)的技術(shù),其中,關(guān)聯(lián)規(guī)則的技術(shù)指在數(shù)據(jù)處理過程中,探索不同數(shù)據(jù)之間可能存在的關(guān)聯(lián)規(guī)則;機(jī)器的學(xué)習(xí)技術(shù)屬于人工智能中的關(guān)鍵性內(nèi)容,主要目的就是對(duì)人們學(xué)習(xí)的行為進(jìn)行模擬。近年來,計(jì)算機(jī)的網(wǎng)絡(luò)技術(shù)開始向著云計(jì)算的網(wǎng)絡(luò)方向進(jìn)步與發(fā)展,換句話說,在今后計(jì)算機(jī)的信息處理不再只是依賴于計(jì)算機(jī)的硬件,其更重視網(wǎng)絡(luò)的連接,即在計(jì)算機(jī)的網(wǎng)絡(luò)技術(shù)基礎(chǔ)上,對(duì)信息的處理技術(shù)進(jìn)行完善,從而提高大數(shù)據(jù)的處理效果。
2.3 網(wǎng)絡(luò)深層的空間技術(shù)與公布型的數(shù)據(jù)存儲(chǔ)技術(shù)
①分布型的數(shù)據(jù)存儲(chǔ)主要在可擴(kuò)展分布式的文件系統(tǒng)技術(shù)(GFS)上所發(fā)展起來的新技術(shù)之一,這種技術(shù)在IBM與百度等公司都有著廣泛應(yīng)用。通常情況下,分布型的存儲(chǔ)技術(shù)使用列存儲(chǔ)的概念,列存儲(chǔ)的概念則是把列當(dāng)做基本的單位,從而對(duì)數(shù)據(jù)進(jìn)行存儲(chǔ),與行存儲(chǔ)比起來,列存儲(chǔ)的技術(shù)主要優(yōu)勢(shì)是數(shù)據(jù)可以壓縮與循環(huán)速度比較快等。而較為常用的一種技術(shù)主要是行列的混合存儲(chǔ),這種結(jié)構(gòu)能夠快速加工與處理海量數(shù)據(jù),充分應(yīng)用磁盤的空間,縮短搜索的時(shí)間。②網(wǎng)絡(luò)深層的空間技術(shù)主要特點(diǎn)是信息的規(guī)模比較大、分布性比較特殊與訪問的途徑復(fù)雜等,這種技術(shù)可以集成處理海量數(shù)據(jù),從而方便數(shù)據(jù)的整合。
2.4 遺傳算法和數(shù)據(jù)的高效索引
①遺傳的算法:這種計(jì)算方式是在生物書進(jìn)化規(guī)律基礎(chǔ)上發(fā)展而來,屬于一種隨機(jī)的搜索方式,并且隨機(jī)該搜索方式可以自動(dòng)調(diào)整搜索的方向,廣泛應(yīng)用在信號(hào)處理、機(jī)器學(xué)習(xí)以及物流選址等方面。②數(shù)據(jù)高效的索引:目前關(guān)于數(shù)據(jù)高效的索引研究重點(diǎn)主要是聚簇索引與互補(bǔ)型的聚簇索引兩個(gè)部分,互補(bǔ)型的聚簇索引一般是將不同副本當(dāng)做索引列,建立互補(bǔ)索引表;而聚簇索引則是與具體索引順序相結(jié)合,然后存儲(chǔ)數(shù)據(jù)。
2.5 在相關(guān)內(nèi)容信息基礎(chǔ)上挖掘數(shù)據(jù)
在相關(guān)內(nèi)容數(shù)據(jù)的基礎(chǔ)上挖掘數(shù)據(jù)的技術(shù)研究重點(diǎn)是:實(shí)體關(guān)聯(lián)的研究技術(shù)和網(wǎng)絡(luò)搜索技術(shù)。在網(wǎng)絡(luò)搜索技術(shù)研究中,排序?qū)W習(xí)的算法是最重要的部分,提出排序?qū)W習(xí)的算法是為了方便海量數(shù)據(jù)處理。究其原因,各種社會(huì)媒體中關(guān)鍵資料存在的形式都是短文本,這在某種程度上就推動(dòng)了排序的學(xué)習(xí)算法產(chǎn)生,通過這種主逐對(duì)、逐列與逐點(diǎn)計(jì)算,可以提高社交媒體海量數(shù)據(jù)處理的效率。
計(jì)算機(jī)的互聯(lián)網(wǎng)主要是依托于相關(guān)計(jì)算機(jī)的硬件設(shè)施存在,在這某種程度上會(huì)造成計(jì)算機(jī)的信息數(shù)據(jù)處理技術(shù)發(fā)展存在一定局限性,致使計(jì)算機(jī)無法和計(jì)算機(jī)的應(yīng)用軟件發(fā)展同步,進(jìn)而與網(wǎng)絡(luò)發(fā)展需要不適應(yīng)。因此,計(jì)算機(jī)的信息數(shù)據(jù)處理技術(shù)要想在今后獲得更好的發(fā)展,需要徹底擺脫計(jì)算機(jī)硬件設(shè)施的限制,漸漸與互聯(lián)網(wǎng)技術(shù)相接軌。①信息的處理技術(shù)漸漸朝著云計(jì)算的方向發(fā)展,因?yàn)樵朴?jì)算的技術(shù)屬于新興數(shù)據(jù)處理的技術(shù),可以在處理數(shù)據(jù)時(shí),徹底分離開存儲(chǔ)空間與硬件設(shè)施,也就是在不依賴計(jì)算機(jī)硬件設(shè)施基礎(chǔ)上,完整保留數(shù)據(jù)的信息。②計(jì)算機(jī)的信息數(shù)據(jù)處理技術(shù)傳輸方式需要轉(zhuǎn)變成開放式,建立開放式的傳輸通道,可以割開硬件設(shè)施和數(shù)據(jù)信息。③需要不斷完善與發(fā)展計(jì)算機(jī)的硬件技術(shù),有機(jī)結(jié)合網(wǎng)絡(luò)與硬件設(shè)施,將計(jì)算機(jī)硬件設(shè)施限制性削弱,進(jìn)而推動(dòng)計(jì)算機(jī)的網(wǎng)絡(luò)技術(shù)發(fā)展與完善。
總而言之,在大數(shù)據(jù)時(shí)代背景下,雖然計(jì)算機(jī)信息數(shù)據(jù)處理技術(shù)獲得一定發(fā)展,但仍然存在很多缺陷與不足。因此,為了完善計(jì)算機(jī)信息數(shù)據(jù)處理技術(shù),需要深入探索與研究各種先進(jìn)信息數(shù)據(jù)處理的技術(shù),確保計(jì)算機(jī)互聯(lián)網(wǎng)更好和為用戶服務(wù),進(jìn)而推動(dòng)社會(huì)進(jìn)步。
[1]黃俊俊.基于大數(shù)據(jù)背景下的計(jì)算機(jī)信息處理技術(shù)探析[J].大科技,2016,16(03):256.
[2]楊曜宇.計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)在大數(shù)據(jù)時(shí)代的重要作用研究[J].中小企業(yè)管理與科技,2015,21(19):201.
TP274
A
1004-7344(2016)23-0256-02
2016-7-3
陸峰(1970-),男,漢族,廣西南寧人,助理工程師,本科,主要從事計(jì)算機(jī)信息系統(tǒng)集成、計(jì)算機(jī)網(wǎng)絡(luò)工程、機(jī)房工程、音視頻會(huì)議系統(tǒng)工程、小區(qū)及樓宇智能化工程的設(shè)計(jì)與建設(shè)工作。