郝俊英
(神木市職業(yè)技術(shù)教育中心,陜西神木,719300)
計算機信息處理技術(shù)對于人們的生產(chǎn)生活來講非常重要,利用信息處理技術(shù)可以有效實現(xiàn)相關(guān)數(shù)據(jù)的傳輸和接收,對人們處理信息數(shù)據(jù)有非常大的幫助。隨著信息技術(shù)的發(fā)展,計算機信息處理技術(shù)已經(jīng)廣泛應(yīng)用于各個領(lǐng)域,基于信息處理技術(shù)的發(fā)展,傳感技術(shù)和網(wǎng)絡(luò)工程技術(shù)發(fā)展得越來越好。該技術(shù)在各大企業(yè)中的廣泛應(yīng)用,在很大程度上提升了企業(yè)員工處理信息數(shù)據(jù)的能力[1]。在過去的工作中,很多的信息數(shù)據(jù)均是由紙張和鋼筆來完成記錄的,而信息數(shù)據(jù)的存儲與提取則會耗費大量的時間與人力。而在計算機信息處理技術(shù)的輔助下,工作人員可以將信息數(shù)據(jù)錄入電腦,并使用各種軟件進行自動的信息數(shù)據(jù)加工,減輕工作人員的負(fù)擔(dān),提高工作效率。在對信息數(shù)據(jù)進行查詢時,只要使用計算機內(nèi)的查詢設(shè)備即可迅速查找到有關(guān)的資料,從而解決使用信息數(shù)據(jù)過程中出現(xiàn)的信息缺失問題。
從字面上解釋大數(shù)據(jù)的概念??梢詫⒋髷?shù)據(jù)看作是非常大的數(shù)據(jù),這個“大”并不是單純信息數(shù)據(jù)的量,也是指信息數(shù)據(jù)的復(fù)雜程度。大數(shù)據(jù)是人類社會發(fā)展的必然結(jié)果,相比于傳統(tǒng)的計算方法,大數(shù)據(jù)具有其自身的優(yōu)越性,在大數(shù)據(jù)中的投資成本相對于過去要更少,其能夠充分發(fā)揮各種信息資源的應(yīng)用價值,并能有效將各種信息資源進行綜合利用。然而,大數(shù)據(jù)也有自身的缺陷,即數(shù)據(jù)量過大,各種數(shù)據(jù)之間的關(guān)系十分復(fù)雜。不管是在日常生活中還是在生產(chǎn)中大數(shù)據(jù)都能將信息數(shù)據(jù)存儲起來,這些優(yōu)點正是大數(shù)據(jù)的核心關(guān)鍵。分類算法和遺傳分析技術(shù)均是當(dāng)前大數(shù)據(jù)中關(guān)鍵技術(shù)之一[2]。大數(shù)據(jù)具有前瞻性和敏銳的判斷力,這是傳統(tǒng)計算機信息數(shù)據(jù)處理技術(shù)所沒有的優(yōu)勢,其能夠滿足現(xiàn)代人的生活節(jié)奏和工作需要,大數(shù)據(jù)的出現(xiàn)使人們的生活和工作均發(fā)生了巨大的變化。云技術(shù)也是大數(shù)據(jù)的體現(xiàn),云空間中存儲了海量的數(shù)據(jù)資源,可以讓使用者在云端存儲、訪問和獲取數(shù)據(jù)信息。
大數(shù)據(jù)時代信息的特征主要包括以下幾個方面:
(1)信息多元化:隨著信息數(shù)據(jù)的革新和發(fā)展,數(shù)據(jù)信息在樣式、種類等方面更加豐富,再加上和多媒體的發(fā)展,信息形式不斷朝著媒體化特征發(fā)展,這特使得數(shù)據(jù)信息更加多元化。
(2)信息共享性:在大數(shù)據(jù)時代下信息本身就具有共享性,所有用戶均能夠利用云數(shù)據(jù)分析,獲取自身想要的數(shù)據(jù)信息。
(3)信息可量化:在想要獲取某項數(shù)據(jù)時,可以運用大數(shù)據(jù)的方式對這些信息進行處理,也正是因為能夠?qū)⒏黜検挛镛D(zhuǎn)化為數(shù)據(jù)進行儲存、提取的優(yōu)勢,使得信息數(shù)據(jù)不斷朝著量化的方向發(fā)展。
(4)可預(yù)測性:在利用大數(shù)據(jù)對各項信息進行處理的過程中,能夠找到信息數(shù)據(jù)的變化規(guī)律,然后就可以通過這個規(guī)律對事物進行預(yù)測。
在大數(shù)據(jù)的應(yīng)用中數(shù)據(jù)收集是必不可少的,尤其是在電子信息處理技術(shù)中。收集數(shù)據(jù)與技術(shù)運用的品質(zhì)有密切關(guān)系,做好收集數(shù)據(jù)工作,不但要保證數(shù)據(jù)質(zhì)量,更要為信息處理技術(shù)的推廣提供有利的環(huán)境。所以在收集數(shù)據(jù)過程中,要格外注重數(shù)據(jù)的品質(zhì),并要考慮收集數(shù)據(jù)的成本費用,在確保數(shù)據(jù)質(zhì)量的基礎(chǔ)上盡量減少成本費用的使用[3]。然而由于傳統(tǒng)計算機信息處理技術(shù)存在著諸多不足,在收集數(shù)據(jù)的過程中存在著效率低下、有效性差等問題,使得收集數(shù)據(jù)的有效性難以滿足理想化的需求。關(guān)鍵詞查找方法的出現(xiàn)可以提高收集數(shù)據(jù)的針對性和品質(zhì),利用關(guān)鍵詞搜索可以較快地獲得海量相似的數(shù)據(jù)信息,利用收集數(shù)據(jù)的對比可以實現(xiàn)完善數(shù)據(jù)搜索的目的,從而提高了大量查詢結(jié)果的準(zhǔn)確性,減少了分析時間。在數(shù)據(jù)庫技術(shù)實際應(yīng)用中,可以依據(jù)不同數(shù)據(jù)分類別,創(chuàng)建多個不同的數(shù)據(jù)庫,將不同類別的數(shù)據(jù)分別儲存于不同的數(shù)據(jù)庫,從而更好地完成數(shù)據(jù)的分類與儲存。
大數(shù)據(jù)時代的一個顯著特點是大量的數(shù)據(jù)量迅速增長,而常規(guī)的存儲設(shè)備無法保持幾十TB的數(shù)據(jù)有效存儲,而同時數(shù)據(jù)格式也打破了人們常規(guī)的認(rèn)識,數(shù)據(jù)形式變化的多樣性也對數(shù)據(jù)存儲方式提出了挑戰(zhàn),從理論上來說,數(shù)據(jù)系統(tǒng)必須能夠具備同時儲存大量數(shù)據(jù)的能力。目前的計算機信息處理技術(shù)難以應(yīng)對大量、多種數(shù)據(jù)格式的數(shù)據(jù)存儲,數(shù)據(jù)存儲量不能適應(yīng)大數(shù)據(jù)的需求,若技術(shù)體系不進行重大變革,將明顯減緩大數(shù)據(jù)時代發(fā)展進程。所以推進計算機信息處理技術(shù)創(chuàng)新的核心是開發(fā)新數(shù)據(jù)儲存技術(shù),以適應(yīng)新的數(shù)據(jù)儲存方案。在實際應(yīng)用過程中既可以進行數(shù)據(jù)儲存,又可以及時進行數(shù)據(jù)更新,確保數(shù)據(jù)可以及時使用。另外,這種新型儲存技術(shù)應(yīng)該具有對智能化處理數(shù)據(jù)的能力,可以對已有數(shù)據(jù)進行過濾,剔除無用數(shù)據(jù),提高儲存設(shè)備的利用率。
數(shù)據(jù)元素彼此間并非獨立存在,在與使用者進行互動的同時會進行相應(yīng)的數(shù)據(jù)處理,其實質(zhì)就是傳遞數(shù)據(jù)的表現(xiàn)?;ヂ?lián)網(wǎng)迅速發(fā)展和日益開放的生態(tài)系統(tǒng),為傳遞數(shù)據(jù)提供了極其便利的條件。然而在完全開放的環(huán)境中,數(shù)據(jù)的高度分享很可能會導(dǎo)致數(shù)據(jù)丟失和被盜,所以在數(shù)據(jù)公開傳遞過程中既要保證數(shù)據(jù)的安全性,又要保證數(shù)據(jù)傳遞的便捷性[4]。在理論型的傳遞數(shù)據(jù)系統(tǒng)中,數(shù)據(jù)信息是在全開放的情況下進行傳遞的,沒有進行相應(yīng)的保密措施,從而間接提高了數(shù)據(jù)信息被潛在危險因素所盜用的可能性,結(jié)果導(dǎo)致使用者的數(shù)據(jù)信息全部曝光。若能對數(shù)據(jù)信息進行編碼,尤其是對與使用者關(guān)系密切、敏感程度高的數(shù)據(jù)進行加密,就能使用者的權(quán)益得到全面保障。目前傳遞數(shù)據(jù)主要是依靠信道,使用加密信道技術(shù)可以確保數(shù)據(jù)的安全性,但由于網(wǎng)絡(luò)環(huán)境中信道具有多樣性、復(fù)雜等特點,所以信道加密不可能做到完全沒有紕漏,僅能確保部分?jǐn)?shù)據(jù)的安全性。為有效保證數(shù)據(jù)安全性,推出了數(shù)字簽名技術(shù),該項技術(shù)通過向簽署人發(fā)送簽名要求將其信息傳遞給簽署人,然后按照簽名信息來獲得簽名私有密鑰,驗證者將私有密鑰簽名與公開密鑰數(shù)據(jù)進行比較,從而判定簽名申請是否成功通過。數(shù)字簽名技術(shù)的運用離不開計算機專用的設(shè)施,其也是計算機信息處理技術(shù)重要門類之一。利用計算機設(shè)施在識別上的優(yōu)越性,可以迅速地對簽名進行密碼認(rèn)證,從而達到對敏感信息進行加密處理的有效性。
在計算機數(shù)據(jù)處理過程中,數(shù)據(jù)安全一直是比較熱門的課題,隨著信息技術(shù)的飛速發(fā)展服務(wù)大數(shù)據(jù)時代的到來,數(shù)據(jù)的安全性也越來越受到人們的關(guān)注。數(shù)據(jù)加密、數(shù)字簽名等技術(shù)是解決數(shù)據(jù)安全性問題的重要手段,其終極目標(biāo)是快速處理數(shù)據(jù)和防止數(shù)據(jù)泄露,同時保證數(shù)據(jù)的處理效率和安全性。眾所周知技術(shù)的高速發(fā)展會產(chǎn)生巨大的影響,隨著數(shù)據(jù)安全理念的提升,潛在的風(fēng)險也會隨之增加,這也說明在大數(shù)據(jù)時代下數(shù)據(jù)安全問題是沒有終點的。唯有持續(xù)改進現(xiàn)有的計算機數(shù)據(jù)處理技術(shù)模式,才能應(yīng)對更加復(fù)雜、更加精密的危險因素,同時還需持續(xù)加強大數(shù)據(jù)的防御體系[5]。數(shù)據(jù)更新頻率加快、規(guī)模不斷擴大,這就要求信息安全處理系統(tǒng)必須具備足夠的靈活性與敏感性,利用即時追蹤方式完成大量數(shù)據(jù)的追蹤,并利用快速測的方式找出其中存在的可疑因素。在任何情況下都要確保數(shù)據(jù)傳輸?shù)牧鲿承?,同時對數(shù)據(jù)的傳輸過程進行追蹤,對存在潛在風(fēng)險的數(shù)據(jù)進行及時處理,防止數(shù)據(jù)被盜而導(dǎo)致的損失。在進行數(shù)據(jù)處理過程中,必須對各類風(fēng)險因素的特點進行歸納和分析,并根據(jù)其特點找出正確的應(yīng)對方法,從而反映出計算機數(shù)據(jù)處理中的風(fēng)險應(yīng)對觀念。
在大數(shù)據(jù)的應(yīng)用中,數(shù)據(jù)建模一般采用流處理和批處理兩種方法,其中流處理具有較高的數(shù)據(jù)處理速度,可以為技術(shù)工作者準(zhǔn)確地進行數(shù)據(jù)分析。在金融業(yè)中流處理方式被廣泛運用,原因在于金融業(yè)需要大量的實時信息,而采用流處理方式,可以迅速處理客戶電子轉(zhuǎn)賬業(yè)務(wù),并為客戶提供高質(zhì)量的金融服務(wù)。批處理技術(shù)主要是對已處理過的數(shù)據(jù)進行整理和加工,提高大量數(shù)據(jù)的儲存和利用率,以便更好地進行其他工作。兩種數(shù)據(jù)建模方法各具優(yōu)勢,極大地豐富了計算機信息處理技術(shù)系統(tǒng)[6]。在實際的應(yīng)用中,要充分利用大批量數(shù)據(jù)資源制定有目標(biāo)的技術(shù)解決方案,并利用建模分析大量數(shù)據(jù)內(nèi)部的價值,從而為企業(yè)的生產(chǎn)和運營提供有效支持。
在大數(shù)據(jù)時代背景下,由于數(shù)據(jù)的數(shù)量不斷增加,數(shù)據(jù)的潛在的商業(yè)和經(jīng)濟價值不斷提高,使得數(shù)據(jù)挖掘的有效性越來越高。在此背景下,數(shù)據(jù)挖掘的效能和計算能力逐漸成為企業(yè)發(fā)展?jié)撃堋⒐芾砟芰推髽I(yè)決策計劃是否合理的關(guān)鍵評判標(biāo)準(zhǔn)。企業(yè)應(yīng)充分利用信息數(shù)據(jù),對其進行全面分析,以把握市場經(jīng)濟發(fā)展規(guī)律,制定有針對性的發(fā)展計劃,提高企業(yè)市場核心競爭能力。
當(dāng)前,各類計算機信息技術(shù)在實際運用中,存在著數(shù)據(jù)安全性缺乏必要保障和對數(shù)據(jù)價值認(rèn)識不足等兩個問題。一些公司和使用者在使用計算機管理系統(tǒng)時,沒有對各種虛擬化數(shù)據(jù)信息的真實價值進行準(zhǔn)確的判斷,也沒有給予足夠的關(guān)注。致使其在不知不覺中向外界泄漏一些重要的商業(yè)和經(jīng)濟價值,從而產(chǎn)生重大的經(jīng)濟損失,同時對社會造成嚴(yán)重的負(fù)面影響。比如經(jīng)常發(fā)生的個人信息泄露問題。其次,與各種數(shù)據(jù)高效索引挖掘、數(shù)據(jù)存儲等技術(shù)相比,各項計算機信息處理技術(shù)還需要進一步的優(yōu)化和改進,計算機信息管理系統(tǒng)在實際使用過程中存在著數(shù)據(jù)可能被盜和泄露等問題,這說明計算機防護能力有待增強,這會給計算機信息處理在實際中的推廣和運用帶來不利影響。