鄭州工業(yè)應(yīng)用技術(shù)學(xué)院 李春艷 張雪
我國(guó)科技飛速發(fā)展,計(jì)算機(jī)與網(wǎng)絡(luò)技術(shù)的應(yīng)用日益普及,給人們的生活與工作帶來(lái)了極大的便利,也促進(jìn)了整個(gè)社會(huì)的發(fā)展與進(jìn)步。隨著大數(shù)據(jù)時(shí)代的來(lái)臨,數(shù)據(jù)的規(guī)模越來(lái)越大,在這種情況下,計(jì)算機(jī)信息處理技術(shù)變得越來(lái)越重要,對(duì)其應(yīng)用的需求也越來(lái)越高。因此,必須要對(duì)大數(shù)據(jù)計(jì)算機(jī)信息處理技術(shù)進(jìn)行持續(xù)研究,從而對(duì)計(jì)算機(jī)信息處理技術(shù)有更深入的認(rèn)識(shí),也能極大地提高計(jì)算機(jī)信息處理整體水平?;诖耍疚奶接懘髷?shù)據(jù)的特點(diǎn)及影響和優(yōu)化,分析大數(shù)據(jù)時(shí)代計(jì)算機(jī)數(shù)據(jù)信息處理面臨的機(jī)遇和挑戰(zhàn),研究大數(shù)據(jù)技術(shù)在計(jì)算機(jī)數(shù)據(jù)信息處理中的應(yīng)用。通過(guò)分析計(jì)算機(jī)數(shù)據(jù)處理技術(shù),旨在促進(jìn)技術(shù)創(chuàng)新和發(fā)展。
大數(shù)據(jù)本身所包含的數(shù)據(jù)量十分龐大,對(duì)數(shù)據(jù)進(jìn)行采集和處理,以及數(shù)據(jù)的存儲(chǔ)和數(shù)據(jù)的傳輸?shù)裙ぷ?,都需要利用?jì)算機(jī)主流軟件來(lái)完成。盡管目前還不能衡量大數(shù)據(jù)的真實(shí)數(shù)量,但是大數(shù)據(jù)的總量仍然可以從TB到PB,它本身的現(xiàn)實(shí)特征包括:速度快、多樣性、數(shù)量大等。大數(shù)據(jù)本身就需要對(duì)大量的計(jì)算機(jī)信息進(jìn)行處理,而隨著社會(huì)的飛速發(fā)展和數(shù)據(jù)量的迅速增加,數(shù)據(jù)的種類和數(shù)量變得越來(lái)越多,呈現(xiàn)出不同程度的復(fù)雜性,從而也就極大地增加了處理計(jì)算機(jī)信息的難度[1]。在未來(lái),大數(shù)據(jù)將會(huì)對(duì)社會(huì)各行各業(yè)的發(fā)展產(chǎn)生巨大的影響,計(jì)算機(jī)信息技術(shù)的飛速發(fā)展,必將助推并提高大數(shù)據(jù)的影響力。
大數(shù)據(jù)可以為用戶提供更為個(gè)性化的服務(wù),提升社會(huì)的服務(wù)質(zhì)量,如何有效地利用大數(shù)據(jù)具有非常重要的意義。建立大數(shù)據(jù)庫(kù)與計(jì)算機(jī)信息處理系統(tǒng)之間的良好關(guān)系,方便對(duì)數(shù)據(jù)進(jìn)行應(yīng)用和分析,進(jìn)而深入了解客戶的需要等。對(duì)數(shù)據(jù)進(jìn)行全面分析,既可以提高數(shù)據(jù)使用者對(duì)數(shù)據(jù)的利用率,也可以增強(qiáng)數(shù)據(jù)使用者所提供服務(wù)的針對(duì)性,促進(jìn)大數(shù)據(jù)價(jià)值的有效提升。大數(shù)據(jù)本身就是一個(gè)巨大的數(shù)據(jù)庫(kù),而計(jì)算機(jī)的處理系統(tǒng)又具備模塊化的功能,在對(duì)數(shù)據(jù)進(jìn)行分析的時(shí)候,系統(tǒng)還可以對(duì)數(shù)據(jù)進(jìn)行分類,使得不同板塊的數(shù)據(jù)可以相互獨(dú)立,而且還可以保證其穩(wěn)定性。在處理特定的數(shù)據(jù)時(shí),可以避免因?yàn)檫^(guò)多的信息而導(dǎo)致系統(tǒng)崩潰。在現(xiàn)代社會(huì),隨著生活和工作節(jié)奏的不斷加快,對(duì)信息的精確獲取也提出了更高的要求,這就要求對(duì)計(jì)算機(jī)信息處理系統(tǒng)進(jìn)行更深層次的優(yōu)化,更好地發(fā)揮數(shù)據(jù)信息的價(jià)值,更好地滿足信息用戶不斷增長(zhǎng)的內(nèi)在需求。在大數(shù)據(jù)視域之下,社會(huì)中的每個(gè)行業(yè)都可以通過(guò)對(duì)數(shù)據(jù)的分析,對(duì)不同客戶群體的喜好進(jìn)行了解,為不同的客戶群體提供具有差異性的服務(wù),讓客戶可以感受到人性化的服務(wù),從而推動(dòng)企業(yè)更好的發(fā)展[2]。
由此可以看出,將大數(shù)據(jù)技術(shù)與計(jì)算機(jī)信息處理系統(tǒng)相結(jié)合非常有必要。在大數(shù)據(jù)背景下,需要將計(jì)算機(jī)信息處理系統(tǒng)與現(xiàn)實(shí)工作過(guò)程相結(jié)合,采用“適當(dāng)超前”與“高效”的架構(gòu),構(gòu)建出具有易用性與穩(wěn)定性的“合格”的系統(tǒng)。因此,在對(duì)信息處理系統(tǒng)進(jìn)行優(yōu)化的過(guò)程中,可以與大數(shù)據(jù)技術(shù)相結(jié)合,以B/S 結(jié)構(gòu)為基礎(chǔ),建立在功能上與標(biāo)準(zhǔn)化管理流程及涉及到的標(biāo)準(zhǔn)化文件管理、存儲(chǔ)、采集等內(nèi)容相一致的大數(shù)據(jù)處理平臺(tái)。
在挖掘數(shù)據(jù)的過(guò)程中,也會(huì)對(duì)任意數(shù)據(jù)進(jìn)行有效的分析,這樣就能夠在海量的數(shù)據(jù)中找到與其規(guī)律相一致的技術(shù)。一般信息挖掘可分三個(gè)步驟進(jìn)行:第一步是資料的預(yù)備;第二步是發(fā)現(xiàn)規(guī)律;第三步是對(duì)規(guī)則的表達(dá)。
對(duì)數(shù)據(jù)進(jìn)行挖掘,能夠有效地改善行業(yè)相關(guān)的決策。大部分公司在把大量的數(shù)據(jù)集中起來(lái)之后,就會(huì)發(fā)現(xiàn)各種各樣問題。例如,數(shù)據(jù)龐大、信息匱乏、數(shù)據(jù)的錄入和查詢、數(shù)據(jù)的統(tǒng)計(jì)等不能快速、準(zhǔn)確地提出有效的信息等,不能從數(shù)據(jù)中總結(jié)出更有價(jià)值的相關(guān)信息,也不能在目標(biāo)數(shù)據(jù)中找到相關(guān)的規(guī)律。如果能夠?qū)Υ罅康臄?shù)據(jù)進(jìn)行全面的分析,就能夠獲得更深入的信息。比如,目標(biāo)群體在該領(lǐng)域的行為習(xí)慣和興趣愛好,可以通過(guò)專員對(duì)目標(biāo)群體進(jìn)行相應(yīng)的定制,并采取相應(yīng)的措施,從而能夠極大地提升工作效率。比如,在瀏覽器查詢某一詞條的過(guò)程中,在輸入某些關(guān)鍵詞后,就會(huì)出現(xiàn)與該關(guān)鍵詞的前綴和后綴相關(guān)的短組選項(xiàng),在某些情況下,只要輸入關(guān)鍵詞的漢語(yǔ)拼音的首個(gè)字母,就可以搜索到該詞條。在這樣的情況下,我們可以通過(guò)瀏覽器對(duì)大部分網(wǎng)友的“行為軌跡”進(jìn)行采集和分析,從而得出用戶的共同習(xí)慣和行為,不但能進(jìn)一步提升搜索的速度,還能將搜索結(jié)果推送給其他網(wǎng)友。
物聯(lián)網(wǎng)是在計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)日漸成熟后應(yīng)用于新興產(chǎn)業(yè)的重要一環(huán)。在大數(shù)據(jù)時(shí)代,物聯(lián)網(wǎng)不僅衍生出了很多新的產(chǎn)業(yè),而且還對(duì)信息化的養(yǎng)老系統(tǒng)進(jìn)行了進(jìn)一步的完善。與此同時(shí),IC 一卡通已經(jīng)被大眾所接受,便捷的電子錢包也得到了廣泛的使用,如在傳統(tǒng)節(jié)日期間取代傳統(tǒng)的現(xiàn)金紅包等,其核心是以人為本,這說(shuō)明大數(shù)據(jù)和云服務(wù)的作用得到了最大程度的發(fā)揮[3]。而且,云服務(wù)的趨勢(shì)也在不斷上升,云計(jì)算能夠?qū)?shù)據(jù)集中起來(lái),在進(jìn)行數(shù)據(jù)交換的時(shí)候,可以利用云平臺(tái)和各種電子設(shè)備來(lái)實(shí)現(xiàn),這樣就可以按照用戶的需要,將相關(guān)的信息上傳、下載。隨著政策的持續(xù)升級(jí),云計(jì)算的業(yè)務(wù)能力得到進(jìn)一步的增強(qiáng),其發(fā)展程度也得到極大的提升。
隨著大數(shù)據(jù)時(shí)代的來(lái)臨,人們對(duì)互聯(lián)網(wǎng)的使用日益頻繁,無(wú)論是大公司還是用戶自身,都日益重視信息的安全性。在網(wǎng)上購(gòu)物的時(shí)候,要注意分辨網(wǎng)上信息的真?zhèn)?,一旦誤入一些釣魚網(wǎng)站,就有可能將自己的隱私泄露給不法分子,導(dǎo)致信息安全受到威脅,甚至有可能引發(fā)財(cái)產(chǎn)損失。因此,我國(guó)應(yīng)建立大數(shù)據(jù)法律法規(guī),有關(guān)機(jī)構(gòu)應(yīng)采取相應(yīng)的安全技術(shù),使其能夠充分發(fā)揮自己的優(yōu)勢(shì)。此外,我們也要加強(qiáng)個(gè)人隱私的保護(hù),才能避免信息泄露和人身財(cái)產(chǎn)安全。
大數(shù)據(jù)時(shí)代是一個(gè)科技飛速發(fā)展的時(shí)代,既需要專業(yè)技術(shù)人員,也需要專業(yè)管理人員。在新興產(chǎn)業(yè)中,技術(shù)人才是最重要的,也是最稀缺的,處在人類社會(huì)飛速發(fā)展的今天,專業(yè)人才將對(duì)大數(shù)據(jù)時(shí)代的發(fā)展產(chǎn)生重要影響。比如,大部分管理者的傳統(tǒng)激勵(lì)方式,對(duì)新生代員工已經(jīng)沒有任何的激勵(lì)效果,而對(duì)于上下級(jí)之間也會(huì)存在著溝通不暢等問題,這都是因?yàn)樗L(zhǎng)的環(huán)境不同所造成的[4]。當(dāng)然,可以根據(jù)自身的經(jīng)驗(yàn)找到最合適的解決方案。
大數(shù)據(jù)的真正價(jià)值在于對(duì)數(shù)據(jù)進(jìn)行分析,不管是政府還是企業(yè),都需要對(duì)這些數(shù)據(jù)的真實(shí)情況進(jìn)行分析,而決策者則根據(jù)分析結(jié)果進(jìn)行決策和管理,并對(duì)這些數(shù)據(jù)進(jìn)行檢測(cè)和評(píng)價(jià),使其能夠在人們的生產(chǎn)生活中發(fā)揮出真正的價(jià)值。在大數(shù)據(jù)中,數(shù)據(jù)不但種類繁多,而且還存在著一定程度的冗雜,這就導(dǎo)致產(chǎn)生大量的虛假信息和無(wú)用信息,增加了篩選的難度。大數(shù)據(jù)的分析,是一個(gè)需要長(zhǎng)期探索的過(guò)程。就像是百度的關(guān)鍵詞搜索,就是建立在無(wú)數(shù)網(wǎng)友不斷搜索的基礎(chǔ)上,才產(chǎn)生了“智能搜索”。
隨著大數(shù)據(jù)時(shí)代的到來(lái),計(jì)算機(jī)信息安全問題日益突出。即便是一條簡(jiǎn)單的信息,也有可能存在著巨大的信息安全隱患,如果出現(xiàn)信息泄露,將會(huì)給人們的生命和財(cái)產(chǎn)安全造成極大的威脅,不利于社會(huì)的穩(wěn)定發(fā)展。根據(jù)實(shí)際情況,要建立相應(yīng)的計(jì)算機(jī)信息安全保護(hù)機(jī)制,加大對(duì)數(shù)據(jù)維護(hù)和檢測(cè)的投資力度。因此,在建設(shè)網(wǎng)絡(luò)的過(guò)程中,企業(yè)需要對(duì)構(gòu)建代理服務(wù)器的重要性有充分的認(rèn)識(shí),并具有識(shí)別風(fēng)險(xiǎn)信息和對(duì)風(fēng)險(xiǎn)信息進(jìn)行攔截的能力,才能有效地避免數(shù)據(jù)在傳輸時(shí)出現(xiàn)的各種安全問題。在大數(shù)據(jù)時(shí)代的背景下,互聯(lián)網(wǎng)表現(xiàn)出了開放性的特點(diǎn),要保證計(jì)算機(jī)的安全穩(wěn)定運(yùn)行,就要求企業(yè)在發(fā)展的同時(shí),重視對(duì)更多專業(yè)人才的培養(yǎng)、對(duì)計(jì)算機(jī)系統(tǒng)的維護(hù)和更新工作重點(diǎn)關(guān)注,逐步提高數(shù)據(jù)信息安全防護(hù)能力,從而可以有效地避免在應(yīng)用計(jì)算機(jī)過(guò)程中產(chǎn)生的相關(guān)信息安全問題。
以大數(shù)據(jù)為支撐,構(gòu)建一套基于大數(shù)據(jù)的信息收集和技術(shù)處理體系,能夠?qū)ヂ?lián)網(wǎng)上的各種信息進(jìn)行高效的處理,達(dá)到實(shí)時(shí)收集的目的。大數(shù)據(jù)環(huán)境下的信息獲取與處理技術(shù),其數(shù)據(jù)模型大致可以劃分為兩種:一種是流數(shù)據(jù)模型;一種是批式數(shù)據(jù)模型。
流數(shù)據(jù)處理方式可對(duì)計(jì)算機(jī)數(shù)據(jù)的傳輸速度進(jìn)行調(diào)速,即對(duì)計(jì)算機(jī)中的大數(shù)據(jù)內(nèi)容做出正確、及時(shí)的調(diào)整,保證在計(jì)算機(jī)內(nèi)部大數(shù)據(jù)信息的精準(zhǔn)性,還可以對(duì)數(shù)據(jù)處理技術(shù)架構(gòu)進(jìn)行調(diào)整,支持對(duì)數(shù)據(jù)信息的有效篩選與采集,確保所有的數(shù)據(jù)信息都能被高效地處理。在這一過(guò)程中,我們將重點(diǎn)運(yùn)用分析和存儲(chǔ)等技術(shù)手段,以保證數(shù)據(jù)的質(zhì)量[5]。除此之外,還可以構(gòu)建一個(gè)數(shù)據(jù)動(dòng)態(tài)監(jiān)測(cè)機(jī)制,來(lái)監(jiān)控可能被忽視的數(shù)據(jù)內(nèi)容,并對(duì)數(shù)據(jù)的變化狀況進(jìn)行分析。聯(lián)合通訊技術(shù)可以將收集到的有用的資料即時(shí)傳輸至指定位置,凸顯資料資訊的預(yù)先設(shè)定功能,并使資料的使用價(jià)值得到最大程度的發(fā)揮。
數(shù)據(jù)信息的存儲(chǔ)需要大量的存儲(chǔ)空間,隨著人們對(duì)存儲(chǔ)空間的需求越來(lái)越大,計(jì)算機(jī)網(wǎng)絡(luò)正逐步向云計(jì)算發(fā)展。云計(jì)算作為一種新型的網(wǎng)絡(luò)模型,其存儲(chǔ)能力極強(qiáng),可以適應(yīng)大數(shù)據(jù)時(shí)代對(duì)信息存儲(chǔ)的需求,是大數(shù)據(jù)環(huán)境下信息存儲(chǔ)和處理的必然發(fā)展方向。
在信息存儲(chǔ)方面,采用分布式存儲(chǔ)技術(shù),實(shí)現(xiàn)對(duì)數(shù)據(jù)信息的處理與保存,并在各大企業(yè)中得到廣泛應(yīng)用。在對(duì)數(shù)據(jù)信息進(jìn)行處理的過(guò)程中,通常情況下,信息儲(chǔ)存技術(shù)是將列存儲(chǔ)和行存儲(chǔ)相結(jié)合,實(shí)現(xiàn)對(duì)數(shù)據(jù)信息的集中處理,從而減少時(shí)間成本,對(duì)網(wǎng)絡(luò)硬盤的空間進(jìn)行優(yōu)化。為提高分布式文件系統(tǒng)的功能,用戶可以借助內(nèi)存、固態(tài)硬盤等方式來(lái)保存數(shù)據(jù),進(jìn)行硬盤驅(qū)動(dòng)器(HardDiskDrive,HDD)、固態(tài)硬盤(SolidStateDisk 或SolidStateDrive,SSD)、MEM 內(nèi)存等分布式信息保存系統(tǒng)的研發(fā),資料的存儲(chǔ)能力得到極大的提高。
為了解決目前在硬盤上存儲(chǔ)的分散文件系統(tǒng)功能不完備的問題,引進(jìn)了一種支持分散存儲(chǔ)層次管理的開放源代碼系統(tǒng)[6]。根據(jù)目前的實(shí)際情況,即使是在容量超過(guò)256GB 的服務(wù)器節(jié)點(diǎn),對(duì)于TB 或PB 級(jí)的數(shù)據(jù)規(guī)模,采用內(nèi)存來(lái)存儲(chǔ)信息也是不現(xiàn)實(shí)的。因此,需要在多層次的大數(shù)據(jù)存儲(chǔ)系統(tǒng)下不斷地進(jìn)行優(yōu)化。在層次化存儲(chǔ)模式下,通過(guò)對(duì)緩存調(diào)度模式的探索,可以有效地提高信息的使用效率,使數(shù)據(jù)存儲(chǔ)的功能得到最大程度的發(fā)揮。
面對(duì)龐大的數(shù)據(jù)和信息,想要保證對(duì)信息和數(shù)據(jù)的有效分析,就必須與目前的計(jì)算機(jī)信息處理技術(shù)相結(jié)合,對(duì)數(shù)據(jù)和信息進(jìn)行收集、整理和分析。根據(jù)實(shí)際情況,加強(qiáng)對(duì)資料的篩選,確保在最短的時(shí)間內(nèi)收集到有用的資料。相關(guān)人員必須全面掌握關(guān)鍵信息,在數(shù)據(jù)的收集和傳達(dá)階段要提升數(shù)據(jù)傳輸效率,并要與當(dāng)前的大數(shù)據(jù)技術(shù)應(yīng)用要求相結(jié)合,并加強(qiáng)相應(yīng)管理模式的運(yùn)用,提升信息有效價(jià)值[7]。除此之外,在數(shù)據(jù)和信息獲取階段,還要解除垃圾信息和彈窗廣告的干擾,提升信息獲取的準(zhǔn)確性。因此,工作人員還需要對(duì)數(shù)據(jù)進(jìn)行科學(xué)的篩選,實(shí)現(xiàn)數(shù)據(jù)和信息價(jià)值的體現(xiàn),確保數(shù)據(jù)和信息不會(huì)被遺漏和濫用。
在現(xiàn)代信息技術(shù)中,大數(shù)據(jù)技術(shù)是一種非常優(yōu)秀的技術(shù),其強(qiáng)大的技術(shù)功能可以很好地彌補(bǔ)計(jì)算機(jī)數(shù)據(jù)信息處理方面的缺陷,可以讓數(shù)據(jù)采集更加全面。其具有較高的分類精度和較高的數(shù)據(jù)挖掘精度,能夠適應(yīng)多種類型、計(jì)算機(jī)和互聯(lián)網(wǎng)的數(shù)據(jù)及信息獲取的需要。