卜娜
面對“無用”信息的爆炸,如何盡快讓數(shù)據(jù)分析轉(zhuǎn)換為價值顯然更重要。大數(shù)據(jù)公司Actian認為,大數(shù)據(jù)應(yīng)該從1.0進入2.0時代了。如果說Hadoop是1.0時代的標志,它打破了收集和存儲大數(shù)據(jù)的技術(shù)壁壘,那么攻破讓海量數(shù)據(jù)體現(xiàn)價值的技術(shù)壁壘,就是2.0時代的標志,它將聚焦于如何讓數(shù)據(jù)的獲取、使用和實施變得更為容易??邕^這道坎,大數(shù)據(jù)才會走向“平民化”。
“隨著大數(shù)據(jù)2.0時代的到來,越來越多的企業(yè)將擁有從海量數(shù)據(jù)中獲取數(shù)據(jù)價值的能力。尤其在數(shù)據(jù)體量巨大的中國市場,除了傳統(tǒng)的金融、電信、政府等行業(yè)以外,零售、醫(yī)療、中型電商等都會從大數(shù)據(jù)分析中獲益。”Actian公司CEO Steve Shine如是說。
根據(jù)Gartner的預(yù)測,如果能實現(xiàn)對企業(yè)范圍內(nèi)全部未開發(fā)數(shù)據(jù)的充分利用,將帶來150億美元的潛在商業(yè)機會。但目前除了極少數(shù)企業(yè)可以利用大數(shù)據(jù)分析開展業(yè)務(wù)、輔助商業(yè)決策外,大多數(shù)企業(yè)還在大數(shù)據(jù)的門外徘徊。阻礙這些企業(yè)應(yīng)用數(shù)據(jù)分析的原因是獲取有價值數(shù)據(jù)的成本過高。
是否有降低成本的方法呢?Actian中國區(qū)總經(jīng)理程小龍告訴記者,幫助企業(yè)以簡單的方法連接數(shù)據(jù)、增強分析平臺的可擴展能力是解決這一問題的關(guān)鍵。“企業(yè)要找到一種簡單的方式連接不同的數(shù)據(jù)系統(tǒng),而不必關(guān)注數(shù)據(jù)是否來自云或其他地方。在連接上數(shù)據(jù)系統(tǒng)之后,企業(yè)還要有處理和分析越來越多數(shù)據(jù)的能力。分析平臺只有具備橫向和縱向彈性擴展的能力,才能保證實現(xiàn)秒級的快速分析和查詢,才能提升企業(yè)應(yīng)用大數(shù)據(jù)分析的成本效益。”程小龍指出。
大數(shù)據(jù)2.0的目標是打破大數(shù)據(jù)分析轉(zhuǎn)換為價值的技術(shù)壁壘。Actian破局的方法是:通過對底層技術(shù)架構(gòu)的改進,使數(shù)據(jù)更容易獲取、使用和實施。首先,Actian的分析平臺可以高速連接任何數(shù)據(jù)源,整合、轉(zhuǎn)換和分析數(shù)據(jù),還能在不斷擴展的數(shù)據(jù)集上按需進行預(yù)測分析。即使企業(yè)的數(shù)據(jù)分析平臺并未架構(gòu)在Hadoop之上,整合、轉(zhuǎn)換、分析數(shù)據(jù)的能力也不會受到影響。其次,Actian提供的是一種高性能的引擎,可以對并行執(zhí)行的分析過程的每一步進行細致設(shè)計,并隨企業(yè)業(yè)務(wù)發(fā)展的需求變化。這意味著各種規(guī)模的企業(yè)都可以利用數(shù)據(jù)來驅(qū)動業(yè)務(wù)創(chuàng)新。
在選擇大數(shù)據(jù)解決方案時,Actian認為企業(yè)應(yīng)該以一種新的視角看待大數(shù)據(jù),才能實現(xiàn)以數(shù)據(jù)驅(qū)動商業(yè)價值的目標。程小龍建議企業(yè)應(yīng)關(guān)注三點:第一,企業(yè)必須考慮解決方案是否能幫助他們將不同數(shù)據(jù)源集成在一起,并判別數(shù)據(jù)的質(zhì)量和清潔度;第二,解決方案要在數(shù)據(jù)量不斷增加的情況下依然保證高速、易用;第三,也是最重要的一點,即該解決方案能否讓企業(yè)獲得商業(yè)洞察力,獲得大數(shù)據(jù)的商業(yè)價值。
國內(nèi)在大數(shù)據(jù)應(yīng)用領(lǐng)域走得比較快的金融、電信等行業(yè)用戶目前也遇到了瓶頸。比目云公司總經(jīng)理吳昊告訴記者,傳統(tǒng)數(shù)據(jù)倉庫在中國已經(jīng)發(fā)展了很多年,但很多客戶在構(gòu)建新型的大數(shù)據(jù)平臺,深化大數(shù)據(jù)應(yīng)用的時候,依舊面臨很多困難,主要體現(xiàn)在以下幾方面:原系統(tǒng)和新系統(tǒng)并行時,數(shù)據(jù)來源復(fù)雜化;深化數(shù)據(jù)分析應(yīng)用,需要面向多個數(shù)據(jù)源抽取數(shù)據(jù);應(yīng)用并行計算平臺如何保證實時性;大數(shù)據(jù)平臺和底層Hadoop平臺的實施,以及它們和上層某些分析應(yīng)用對接時存在不少問題。借助Actian的方案,上述問題都可以得到解決。
“Actian提出了一個整體的并行計算中心的概念,在其解決方案中包含了并行的數(shù)據(jù)加載,可以大幅提高數(shù)據(jù)傳輸?shù)乃俣?。由于采用了列式預(yù)編譯的并行數(shù)據(jù)庫,Actian的系統(tǒng)還實現(xiàn)了完成數(shù)據(jù)加載即可進行分析的技術(shù)飛躍。同時,Actian還有準實時的流計算功能,可以將原本在數(shù)據(jù)庫外的分析更好地與分布式數(shù)據(jù)庫緊密結(jié)合,大幅提升分析效率。”吳昊表示,比目云正在參考Actian在亞馬遜和雅虎等重要客戶中的成功應(yīng)用,將其在大數(shù)據(jù)分析領(lǐng)域的成功經(jīng)驗引入中國市場。