滕達+卞晨陽+錢文陽
摘 要:根據(jù)最新調(diào)查顯示,到2020年,人類產(chǎn)生的數(shù)據(jù)總量將達到40ZB,全球范圍內(nèi)服務(wù)器的數(shù)量將會增加10倍,由企業(yè)數(shù)據(jù)中心直接管理的數(shù)據(jù)量將會增加14倍,IT專業(yè)人員的數(shù)量將會增加1.5倍?;ヂ?lián)網(wǎng)、移動互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、云計算的快速興起以及移動智能終端的快速發(fā)展,造成當前數(shù)據(jù)增長的速度比人類社會任何時候的發(fā)展都要快。數(shù)據(jù)的規(guī)模越來越大,內(nèi)容越來越復(fù)雜,更新的速度也越來越快。數(shù)據(jù)的不斷衍生和發(fā)展,意味著人類將進入一個數(shù)據(jù)的世界。本文主要從四個方面對其進行簡析。
關(guān)鍵詞:大數(shù)據(jù);商業(yè)智能
1 大數(shù)據(jù)概念
大數(shù)據(jù),又稱海量數(shù)據(jù),指的是以不同形式存在于數(shù)據(jù)庫、網(wǎng)絡(luò)等媒介上含豐富信息的規(guī)模巨大的數(shù)據(jù),其是一個非常寬泛的概念。其中,大是一個最主要的特征,但遠遠不是全部,不能單純根據(jù)數(shù)據(jù)的規(guī)模來定義大數(shù)據(jù);由于數(shù)據(jù)存儲能力的不同,人們衡量數(shù)據(jù)規(guī)模的尺度也是不一樣的。大數(shù)據(jù)有4個基本特征。第一,Volume,數(shù)據(jù)體量巨大,可以是TB級別,也可以是PB級別。第二,Variety,數(shù)據(jù)類型繁多,如網(wǎng)絡(luò)日志、視頻、圖片、地理位置信息等;物聯(lián)網(wǎng)、云計算等各種各樣的傳感器,都是數(shù)據(jù)來源或承載的方式。第三,Value,價值密度低。以視頻為例,連續(xù)不間斷監(jiān)控過程中,可能有用的數(shù)據(jù)僅僅有一兩秒。第四,Velocity,處理速度快。
大數(shù)據(jù)不僅數(shù)量大,也擁有很多數(shù)據(jù)類型。按照數(shù)據(jù)結(jié)構(gòu)分,數(shù)據(jù)可分為結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù);非結(jié)構(gòu)化數(shù)據(jù)又包括半結(jié)構(gòu)數(shù)據(jù)和無結(jié)構(gòu)數(shù)據(jù)。結(jié)構(gòu)化數(shù)據(jù)的特點是不可再細分,并且所有關(guān)系型數(shù)據(jù)庫(如SQL Server、Oracle、MySQL、DB2等)中的數(shù)據(jù)全部為結(jié)構(gòu)化數(shù)據(jù);半結(jié)構(gòu)化數(shù)據(jù)是處于完全結(jié)構(gòu)化數(shù)據(jù)和完全無結(jié)構(gòu)化數(shù)據(jù)之間的數(shù)據(jù),這些數(shù)據(jù)類型的格式一般較為規(guī)范,都是純文本數(shù)據(jù),可以通過某種特定的方式解析得到每項數(shù)據(jù);無結(jié)構(gòu)化數(shù)據(jù),指那些非純文本類型的數(shù)據(jù),這類數(shù)據(jù)沒有特定的格式,因此無法直接解析出其相應(yīng)的值。
2 大數(shù)據(jù)與商業(yè)智能
2.1 商業(yè)智能
商業(yè)智能是描述一系列的概念和方法,通過應(yīng)用基于事實的支持決策系統(tǒng)輔助商業(yè)決策的指定和實施。商業(yè)智能技術(shù)提供使企業(yè)迅速計算分析數(shù)據(jù)的技術(shù)和方法,包括收集、組織、管理和分析數(shù)據(jù),并將這些數(shù)據(jù)轉(zhuǎn)化為有用的信息,然后分發(fā)到企業(yè)各處。
商業(yè)智能可以從四個層面來論述。第一,信息系統(tǒng)層面。它是物理基礎(chǔ),是一個面向特定應(yīng)用領(lǐng)域的信息系統(tǒng)平臺,具有非常強大的決策分析能力。第二,數(shù)據(jù)分析層面。首先是獲取數(shù)據(jù),獲取與所關(guān)心主題有關(guān)的數(shù)據(jù)或信息;然后分析信息、得出結(jié)論、形成假設(shè)和驗證假設(shè)。第三,知識發(fā)展層面??梢灾苯訉⑿畔⑥D(zhuǎn)變成知識或信息,借助大數(shù)據(jù)技術(shù)分析、挖掘、發(fā)現(xiàn)背后隱藏的東西,然后將信息變成知識。第四,戰(zhàn)略層面。主要是將知識或信息應(yīng)用在改善運營能力、提高決策能力以及企業(yè)建模上面。
2.2 商業(yè)智能與大數(shù)據(jù)的結(jié)合應(yīng)用
商業(yè)智能與大數(shù)據(jù)結(jié)合,在各行各業(yè)中得到了廣泛應(yīng)用,其典型的應(yīng)用主要現(xiàn)在四個方面。第一,產(chǎn)品銷售管理。包括產(chǎn)品銷售影響因素分析、銷售量分析、銷售策略、產(chǎn)品銷售方案的預(yù)測四個方面。第二,事實管理。無論是目標管理還是例外管理,都要用事實予以支持。這個可以借助商業(yè)智能進行科學(xué)決策。第三,異常處理。企業(yè)在實際應(yīng)用中總會出現(xiàn)一些偏差,商業(yè)智能系統(tǒng)可以監(jiān)測偏差,并在第一時間通知企業(yè)。第四,客戶關(guān)系管理。企業(yè)可以通過商業(yè)智能的客戶關(guān)系管理子系統(tǒng)對顧客消費傾向進行分析,以提高客戶的滿意度。
3 大數(shù)據(jù)相關(guān)技術(shù)與應(yīng)用概況
大數(shù)據(jù)技術(shù),就是從各種類型的數(shù)據(jù)中快速獲取有價值信息的技術(shù)。大數(shù)據(jù)領(lǐng)域已經(jīng)涌現(xiàn)了大量新的技術(shù),這些新的技術(shù)是大數(shù)據(jù)采集、存儲、處理和呈現(xiàn)的有力武器。與大數(shù)據(jù)處理相關(guān)的技術(shù)包括大數(shù)據(jù)采集、大數(shù)據(jù)準備、大數(shù)據(jù)存儲、大數(shù)據(jù)分析與挖掘以及大數(shù)據(jù)展示與可視化。這些大數(shù)據(jù)技術(shù)為大數(shù)據(jù)的使用提供了良好的便利條件,方便了企業(yè)的分析和使用。
大數(shù)據(jù)應(yīng)用自然科學(xué)知識很好地解決了社會科學(xué)的知識,在許多領(lǐng)域具有重要的作用。早期的大數(shù)據(jù)技術(shù)主要應(yīng)用在大型互聯(lián)網(wǎng)企業(yè)中,用于分析網(wǎng)站用戶數(shù)據(jù)以及用戶行為等。如今,大數(shù)據(jù)應(yīng)用基本上呈現(xiàn)出互聯(lián)網(wǎng)領(lǐng)先、其他行業(yè)積極效仿的狀態(tài),而各行業(yè)數(shù)據(jù)的共享開放已逐漸成為趨勢。
4 大數(shù)據(jù)的熱點問題與發(fā)展趨勢
目前,大數(shù)據(jù)時代已經(jīng)到來,不管是在學(xué)術(shù)界還是產(chǎn)業(yè)界,人們都希望通過對大數(shù)據(jù)熱點問題的研究,充分認識和了解大數(shù)據(jù),以便更好地把握投入方向、提升自身的指導(dǎo)價值。數(shù)據(jù)科學(xué)與大數(shù)據(jù)的學(xué)科邊界、數(shù)據(jù)計算的基本模式與范式、大數(shù)據(jù)特性與數(shù)據(jù)形態(tài)等都是大數(shù)據(jù)的熱點問題,我們可以從小的方面入手,自行分析。
大數(shù)據(jù)的應(yīng)用越來越廣泛,有著良好的發(fā)展趨勢,大數(shù)據(jù)正從概念化走向價值化,這將會成為當下的一大發(fā)展趨勢;同時,大數(shù)據(jù)的安全與隱私問題也會越來越重要、越來越得到重視;大數(shù)據(jù)的分析會越來越廣泛,隨著數(shù)據(jù)科學(xué)的興起,大數(shù)據(jù)會成為一種戰(zhàn)略性產(chǎn)業(yè)。
大數(shù)據(jù)是一種新興的技術(shù)與產(chǎn)業(yè),它能幫我們切實地解決一些問題。隨著科學(xué)互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,大數(shù)據(jù)逐漸嶄露頭角,并具有非常重要的實際意義。它的不斷發(fā)展適應(yīng)了信息經(jīng)濟時代的發(fā)展需要,符合科學(xué)技術(shù)的發(fā)展趨勢,必將帶領(lǐng)我們走進大數(shù)據(jù)時代。
參考文獻:
[1] 陶雪嬌,胡曉峰,劉洋.大數(shù)據(jù)研究綜述[J].系統(tǒng)仿真學(xué)報,2013(8).
[2] 鄒大斌.大數(shù)據(jù)動了誰的奶酪[J].計算機世界,2013(31).
[3] 于希國. Hitachi UCP融合基礎(chǔ)架構(gòu)解決方案[N].中國計算機報,2013.
[4] 伍永峰.商業(yè)智能及技術(shù)[D].貴州大學(xué),2008.