當(dāng)前,呈爆炸式增長的數(shù)據(jù)——大數(shù)據(jù)已成為一種越來越重要的資源,各方關(guān)注的熱度也逐漸升溫?!都~約時(shí)報(bào)》曾撰文稱:“大數(shù)據(jù)正在對(duì)每個(gè)領(lǐng)域都造成影響,在商業(yè)、經(jīng)濟(jì)和其他領(lǐng)域中,決策行為將日益基于數(shù)據(jù)分析做出,而不是像過去更多憑借經(jīng)驗(yàn)和直覺?!笨梢?,對(duì)大數(shù)據(jù)的分析、預(yù)測等應(yīng)用儼然已成為了人們眼中的金礦。全球知名的企業(yè)如IBM、谷歌等已經(jīng)搶占先機(jī)提前布局了大數(shù)據(jù)戰(zhàn)略。而在這樣一個(gè)數(shù)字泛在、信息飛速流動(dòng)的時(shí)代,各個(gè)領(lǐng)域也有許多機(jī)會(huì)來拓展大數(shù)據(jù)的新應(yīng)用和新商業(yè)模式。不僅如此,政府同樣也充分認(rèn)識(shí)到了大數(shù)據(jù)應(yīng)用的價(jià)值。
領(lǐng)先企業(yè)引領(lǐng)大數(shù)據(jù)潮流
IBM在引領(lǐng)大數(shù)據(jù)潮流中走在了前頭。早在1958年,作為信息產(chǎn)業(yè)的藍(lán)色巨人IBM就提出了“商業(yè)智能”的概念。從2009年開始,IBM大舉收購在智能分析方面具有“一技之長”的多家企業(yè),建立了專門的數(shù)據(jù)分析中心,將戰(zhàn)略布局從傳統(tǒng)商業(yè)智能轉(zhuǎn)移到了更高級(jí)的大數(shù)據(jù)應(yīng)用上。其中,最為典型的例子要數(shù)IBM在人工智能方面開發(fā)的“沃森”機(jī)器人。“沃森”在2011年美國智力競猜節(jié)目《危險(xiǎn)邊緣》中擊敗了人類,這要?dú)w功于沃森對(duì)海量信息進(jìn)行分析處理并作出預(yù)測的能力。如今,沃森的這種能力無疑具有更大的商業(yè)價(jià)值。目前,美國第三大銀行花旗集團(tuán)已成為沃森的首位金融領(lǐng)域客戶。沃森可以處理各種金融、經(jīng)濟(jì)和用戶數(shù)據(jù),分析用戶需求,實(shí)現(xiàn)個(gè)性化服務(wù);沃森也可以快速閱讀和理解企業(yè)年報(bào),幫助金融機(jī)構(gòu)開展投資風(fēng)險(xiǎn)管理。
除了IBM,像惠普、甲骨文等IT界巨頭也紛紛斥巨資并購了多家大數(shù)據(jù)相關(guān)企業(yè)。在2010~2011年間,惠普總共以超過143.5億美元的價(jià)格先后收購了3PAR公司、Vertica公司和Autonomy公司。其中,3PAR公司以虛擬化存儲(chǔ)見長,惠普的3PAR方案將在公共存儲(chǔ)領(lǐng)域具有創(chuàng)新優(yōu)勢;Vertica公司專注于實(shí)時(shí)分析和數(shù)據(jù)管理,該技術(shù)將幫助惠普提高對(duì)大量復(fù)雜數(shù)據(jù)進(jìn)行實(shí)時(shí)商業(yè)分析的能力;Autonomy則是一家英國軟件公司,其開發(fā)的軟件可以增強(qiáng)惠普在非結(jié)構(gòu)化數(shù)據(jù)搜索方面的實(shí)力。甲骨文則在2011年10月收購了Endeca公司,之后,甲骨文有了一個(gè)更加先進(jìn)的企業(yè)數(shù)據(jù)管理平臺(tái),使得企業(yè)用戶能夠訪問、儲(chǔ)存、管理、搜索和分析結(jié)構(gòu)化和非結(jié)構(gòu)化的大數(shù)據(jù)。
谷歌公司可以說是擁有大數(shù)據(jù)的超級(jí)大戶,它與IBM等不同之處在于能夠充分結(jié)合自己掌握著最大網(wǎng)絡(luò)搜索用戶群這一優(yōu)勢,將大數(shù)據(jù)分析用于解決社會(huì)問題,以及運(yùn)用“集體智慧”方式涉足環(huán)境保護(hù)等科學(xué)技術(shù)領(lǐng)域。例如,“谷歌趨勢”就是將全球用戶搜索行為的數(shù)據(jù)用來觀察社會(huì)趨勢的一個(gè)開放應(yīng)用,而其中更加專業(yè)的“流感趨勢”則使用復(fù)雜的算法,跟蹤有關(guān)流感的網(wǎng)絡(luò)搜索行為,其展示的曲線與美國疾病控制中心耗用大量資源得出的疑似流感就診曲線非常擬合,而且時(shí)差大大縮小。
各主要領(lǐng)域受益大數(shù)據(jù)智慧
商業(yè)智能領(lǐng)域是大數(shù)據(jù)應(yīng)用最成熟,也是最大的市場。其中,世界零售業(yè)大亨沃爾瑪就受益其中,沃爾瑪通過對(duì)日常交易數(shù)據(jù)、消費(fèi)者購物行為、甚至災(zāi)害氣候等結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的關(guān)聯(lián),從而創(chuàng)造了“啤酒與尿布”等經(jīng)典商業(yè)案例。另一家美國電子商務(wù)公司亞馬遜與沃爾瑪在實(shí)體零售數(shù)據(jù)方面的分析應(yīng)用不同,其主要根據(jù)瀏覽過的網(wǎng)頁和曾經(jīng)購買的商品來挖掘用戶的興趣愛好和消費(fèi)習(xí)慣。除了大企業(yè)在這一領(lǐng)域的開拓性實(shí)踐外,也有如Netflix等中小企業(yè)對(duì)大數(shù)據(jù)的創(chuàng)新應(yīng)用。Netflix是一家在線網(wǎng)絡(luò)視頻點(diǎn)播互聯(lián)網(wǎng)公司。人們可以在Netflix的網(wǎng)站上觀看各種影視劇,進(jìn)行搜索和打分。Netflix網(wǎng)站不僅記錄下了用戶點(diǎn)播的劇集、每次快退快進(jìn)及暫停的操作,還嘗試收集用戶的地理位置和使用設(shè)備的數(shù)據(jù),并且還從Facebook等網(wǎng)站獲得相關(guān)社交媒體的數(shù)據(jù)。Netflix通過采集和分析這些海量數(shù)據(jù)來推算出下一步用戶想要看什么電影。目前其網(wǎng)站用戶所選擇的電影已經(jīng)有75%來自Netflix的推薦。根據(jù)美國市場研究公司IHS測算,2011年Netflix在美國的在線電影收入已經(jīng)超過蘋果公司,市場份額達(dá)到了45%。在中國,自有服裝品牌凡客開始根據(jù)不同的主題尋找各種數(shù)據(jù)之間的關(guān)聯(lián),建立起有效的數(shù)據(jù)分析輔助商業(yè)管理的機(jī)制。另外,阿里巴巴也利用淘寶網(wǎng)上的中小企業(yè)交易數(shù)據(jù)來篩選誠信企業(yè),為其提供無擔(dān)保貸款,事實(shí)證明,這些企業(yè)的壞賬率僅為0.9%。
金融是另一個(gè)利用大數(shù)據(jù)產(chǎn)生價(jià)值的重要領(lǐng)域。金融服務(wù)類企業(yè)不僅可以通過對(duì)大數(shù)據(jù)的挖掘和分析提高自身的競爭實(shí)力、改善用戶體驗(yàn)、監(jiān)督金融欺詐行為、驗(yàn)證合規(guī)性,還可以通過大數(shù)據(jù)對(duì)金融市場進(jìn)行預(yù)測,抓住投資先機(jī)。例如,華爾街有家名叫“德溫特資本市場”的公司,利用軟件程序公司分析了全球3.4億微博賬戶的留言,用以判斷民眾的情緒,據(jù)此來處理手中的股票。基于大數(shù)據(jù)分析他們得出結(jié)論:人們高興時(shí)會(huì)買股票,而焦慮時(shí)就會(huì)拋售。據(jù)此進(jìn)行經(jīng)營,該公司在今年第一季度獲得了7%的收益率。
醫(yī)療健康也是大數(shù)據(jù)應(yīng)用的熱點(diǎn)?;陔娮硬v的普及、基因研究以及制藥工程中對(duì)于大型數(shù)據(jù)庫的應(yīng)用,擁有大規(guī)模復(fù)雜性數(shù)據(jù)集在醫(yī)療機(jī)構(gòu)中變得很普遍。通過使用大數(shù)據(jù)分析工具對(duì)大量病人的數(shù)據(jù)進(jìn)行分析,醫(yī)學(xué)研究者能夠更有效地找出疾病成因,進(jìn)而提供有針對(duì)性的預(yù)防、診斷和治療措施。加拿大多倫多市兒童醫(yī)院的新生兒重癥監(jiān)護(hù)病房目前正在使用大數(shù)據(jù)分析平臺(tái)實(shí)時(shí)處理數(shù)據(jù),用來更精準(zhǔn)地預(yù)測早產(chǎn)兒出現(xiàn)疾病和感染的風(fēng)險(xiǎn)。醫(yī)院通過電子設(shè)備監(jiān)測、收集和分析早產(chǎn)兒的體溫、心率、血氧飽和濃度和血壓水平等數(shù)據(jù),在早產(chǎn)兒病情出現(xiàn)明顯的臨床癥狀之前提前預(yù)測病癥的發(fā)生。
政府開放姿態(tài)支持大數(shù)據(jù)應(yīng)用
這兩年,以美英為代表的西方各國政府都建立起了自己的數(shù)據(jù)門戶網(wǎng)站,將采集的各類民生數(shù)據(jù)放在網(wǎng)上與全民共享。這一“數(shù)據(jù)開放”運(yùn)動(dòng)催生了一系列對(duì)公開數(shù)據(jù)的應(yīng)用熱潮。例如,微軟公司就利用奧巴馬政府推出的退伍軍人醫(yī)療健康數(shù)據(jù)公開項(xiàng)目開發(fā)了一款新的在線平臺(tái),來幫助用戶管理自己和家人的數(shù)據(jù)。最近,另有一則新聞報(bào)道了一位13歲的以色列少年利用政府公開的導(dǎo)彈防御預(yù)警信息,開發(fā)了一款免費(fèi)手機(jī)應(yīng)用,當(dāng)加沙地帶向以色列南部發(fā)射導(dǎo)彈的時(shí)候,應(yīng)用系統(tǒng)就會(huì)給手機(jī)發(fā)送警報(bào)。更進(jìn)一步,除了政府公開數(shù)據(jù)的應(yīng)用外,英國政府也鼓勵(lì)商業(yè)數(shù)據(jù)的公開,提出了名為“我的數(shù)據(jù)”的計(jì)劃。在英國商業(yè)部的主導(dǎo)下,巴克萊信用卡、匯豐銀行等十多家不同行業(yè)的巨頭已經(jīng)加入了“我的數(shù)據(jù)”行動(dòng),對(duì)客戶開放與其相關(guān)的數(shù)據(jù)。第三方可以就這些數(shù)據(jù)設(shè)計(jì)出專業(yè)的算法,為客戶提供更多更好的服務(wù)。由此可見,政府和企業(yè)的數(shù)據(jù)開放行動(dòng)開創(chuàng)了一種全新的大數(shù)據(jù)應(yīng)用商業(yè)模式,為經(jīng)濟(jì)發(fā)展帶來了新的增長點(diǎn),并提供了新的就業(yè)機(jī)會(huì)。在保障數(shù)據(jù)安全和個(gè)人隱私的前提下,對(duì)這些公開數(shù)據(jù)的應(yīng)用不僅使沉睡多年的大量數(shù)據(jù)被利用起來創(chuàng)造價(jià)值,而且還能發(fā)揮眾人的智慧將這些取之于民的數(shù)據(jù)重新用之于民,以實(shí)現(xiàn)更大的社會(huì)效益。
從上文可以看到,行業(yè)交叉和數(shù)據(jù)公開正是大數(shù)據(jù)這座寶礦能夠散發(fā)出無窮魅力的所在。而對(duì)我國未來的大數(shù)據(jù)應(yīng)用發(fā)展來說,在掘金大數(shù)據(jù)之前,還需要破除幾道障礙,比如打破行業(yè)壟斷、開放政府?dāng)?shù)據(jù)、加強(qiáng)信息共享,這遠(yuǎn)比開發(fā)幾個(gè)軟件、做幾個(gè)試點(diǎn)來得重要。
(作者為上??茖W(xué)技術(shù)情報(bào)研究所信息分析師)