羅鳳飛
摘 要:大數(shù)據(jù)時代的到來,使得社會各界對大數(shù)據(jù)的關(guān)注度越來越高,并且成為近十幾年研究的熱點(diǎn)話題。然而,由于現(xiàn)代信息技術(shù)的不斷發(fā)展,大數(shù)據(jù)時代的到來給我們的生產(chǎn)生活帶來無限機(jī)遇的同時,也帶來了前所未有的挑戰(zhàn)。在科研工作者們的不斷探索下,人們對于大數(shù)據(jù)的認(rèn)知越來越明確,關(guān)于大數(shù)據(jù)的相關(guān)理論研究也得到不斷地更新,使得大數(shù)據(jù)在日新月異的今天,依然保持著它獨(dú)特的研究價值,以至于大數(shù)據(jù)時代被稱為“第三次科技革命”。本文就大數(shù)據(jù)近年來的發(fā)展進(jìn)行簡單地梳理,以使讀者們更加明確大數(shù)據(jù)的大概脈絡(luò),最后簡要的概括一下大數(shù)據(jù)發(fā)展的理論上和實(shí)踐上的意義。
關(guān)鍵詞:大數(shù)據(jù);綜述;科技革命;發(fā)展
早在20世紀(jì)80年代,在美國著名的未來學(xué)家阿爾文·托夫勒的《第三次浪潮》這本書中就提出了大數(shù)據(jù),并且把其比喻為“第三次浪潮的華彩樂章”,從此“大數(shù)據(jù)”這個詞就走進(jìn)了人們的視野。1996年大數(shù)據(jù)被美聯(lián)社再次提及,但這時的“大數(shù)據(jù)”還僅代表它的字面含義—數(shù)據(jù)量大,并不涉及它的處理技術(shù)和類型等方面。此后,大數(shù)據(jù)的發(fā)展開始備受關(guān)注,關(guān)于如何使用大數(shù)據(jù)進(jìn)行經(jīng)濟(jì)預(yù)測,以及大數(shù)據(jù)的相關(guān)特征和定義也更加明確。直到今日,大數(shù)據(jù)仍然具有它的科研價值,并在各行各業(yè)發(fā)揮著它的作用。
一、大數(shù)據(jù)的基本概念和特征
(一)大數(shù)據(jù)的概念
大數(shù)據(jù)時代的到來,促使一些專家學(xué)者展開了對大數(shù)據(jù)的研究。雖然研究領(lǐng)域涉及方方面面,但對大數(shù)據(jù)的定義至今沒有一個公認(rèn)的標(biāo)準(zhǔn)。
麥肯錫對大數(shù)據(jù)概念的解釋是:大數(shù)據(jù)是指大小超出傳統(tǒng)數(shù)據(jù)庫軟件工具抓取、存儲、管理和分析能力的數(shù)據(jù)群。
維基百科的表述是:大數(shù)據(jù)是難以用現(xiàn)有數(shù)據(jù)庫管理工具處理的兼具海量和復(fù)雜性特征的數(shù)據(jù)集成。
國內(nèi)專家涂子沛將大數(shù)據(jù)定義為那些大小已經(jīng)超出傳統(tǒng)意義上的尺度,一般的軟件工具難以捕捉、存儲、管理和分析的數(shù)據(jù)。
(二)大數(shù)據(jù)的特征
隨著人們對大數(shù)據(jù)的認(rèn)知更加清晰,大數(shù)據(jù)的特征也表述的更加具體、明確。目前,對于大數(shù)據(jù)的特征各界普遍的共識是4V特征,即數(shù)量大(Volume)、種類多(Variety)、實(shí)時性(Velocity)、價值密度低(Value)。
二、大數(shù)據(jù)發(fā)展的靜態(tài)分析
對于大數(shù)據(jù)的研究主要可以分為兩大方面,一方面是理論上的擴(kuò)展,另一方面是實(shí)踐上的應(yīng)用。首先理論研究上的擴(kuò)展可以從兩方面來了解,即大數(shù)據(jù)引發(fā)人類生產(chǎn)生活的思維變革,以及可供挖掘的巨大價值。
(一)思維變革
大數(shù)據(jù)時代的到來,引發(fā)了人們生產(chǎn)生活各方面的思維變革。在思維變革這一方面,舍恩伯格和巴拉巴西兩位學(xué)者在各自的著作中都有所提到。維克托·舍恩伯格、肯尼斯·庫克耶在2011年末出版的《大數(shù)據(jù)時代》一書中認(rèn)為,大數(shù)據(jù)思維是一種意識,在這種意識的驅(qū)動下,我們的思想發(fā)生了轉(zhuǎn)變,不再探求難于捉摸的因果關(guān)系,轉(zhuǎn)而關(guān)注事物的相關(guān)關(guān)系。而艾伯特-拉斯洛·巴拉巴西則在《爆發(fā):大數(shù)據(jù)時代預(yù)見未來的新思維》一書中對大數(shù)據(jù)思維的本質(zhì)進(jìn)行了分析,他認(rèn)為大數(shù)據(jù)所帶來的思維變革是科學(xué)由簡單走向復(fù)雜的反映,其本質(zhì)上就是復(fù)雜性思維。兩位專家學(xué)者都對大數(shù)據(jù)帶給我們的思維上的影響給出了肯定的回應(yīng)。除此之外,國內(nèi)學(xué)者鄔賀銓在《大數(shù)據(jù)思維》一文中,通過列舉大數(shù)據(jù)思維在各行業(yè)領(lǐng)域內(nèi)的應(yīng)用以及對大數(shù)據(jù)誤區(qū)的解讀,來說明大數(shù)據(jù)不僅可以應(yīng)用到各行業(yè)領(lǐng)域,還能夠深刻影響經(jīng)濟(jì)生活的方方面面。
(二)價值挖掘
涂子沛在《大數(shù)據(jù)時代的來臨》一文中這樣強(qiáng)調(diào),大數(shù)據(jù)的“大”,其側(cè)重點(diǎn)并不在于其字面理解上的大容量,而是在于大數(shù)據(jù)背后所潛藏的巨大價值。李國杰院士在《對大數(shù)據(jù)研究的科學(xué)價值》一文中提出,大數(shù)據(jù)的價值主要體現(xiàn)在它的驅(qū)動效應(yīng),即巨大的經(jīng)濟(jì)利益驅(qū)使下企業(yè)不斷擴(kuò)大數(shù)據(jù)處理規(guī)模。在大數(shù)據(jù)的價值方面,研究者多看中于大數(shù)據(jù)的協(xié)同效應(yīng)以及大數(shù)據(jù)背后所潛藏的巨大價值。另外,他還指出:對大數(shù)據(jù)進(jìn)行研究主要是將其視為一種研究方法或一種發(fā)現(xiàn)新知識、新技術(shù)的研究工具而存在,而不是把數(shù)據(jù)本身當(dāng)成研究目標(biāo)。大數(shù)據(jù)作為一種研究工具,與統(tǒng)計(jì)分析,人工智能等有著密切的聯(lián)系,可以通過大數(shù)據(jù)來探索事物發(fā)展的規(guī)律,幫助我們實(shí)現(xiàn)科學(xué)決策。
三、大數(shù)據(jù)發(fā)展的動態(tài)分析
在大數(shù)據(jù)的理論研究領(lǐng)域不斷取得成果的同時,各行各業(yè)對大數(shù)據(jù)在實(shí)踐上的應(yīng)用也如火如荼的進(jìn)行著。
(一)創(chuàng)造商業(yè)價值
大數(shù)據(jù)發(fā)揮其價值是建立在云計(jì)算的基礎(chǔ)之上,而云計(jì)算的概念是谷歌公司在2006年首次提出的。支撐谷歌公司內(nèi)部各種“大數(shù)據(jù)”應(yīng)用的,正是其自行研發(fā)的云計(jì)算服務(wù)器。從理論到實(shí)踐應(yīng)用,大數(shù)據(jù)經(jīng)歷了幾十年的時間,到現(xiàn)在成為各行各業(yè)重視的焦點(diǎn)。
根據(jù)麥肯錫數(shù)據(jù)報告顯示,在零售和金融行業(yè),運(yùn)用大數(shù)據(jù)進(jìn)行分析的企業(yè)領(lǐng)先于其他行業(yè)領(lǐng)域的企業(yè),且收入和利潤均有不同程度的增加。另外,“數(shù)據(jù)的全部價值遠(yuǎn)遠(yuǎn)大于其最初的使用價值,在初次使用之后的每次使用中都會發(fā)現(xiàn)其新的價值。”企業(yè)可以通過對原始數(shù)據(jù)的重組來獲得對企業(yè)有利的、全新的價值利用。
(二)制定政策決策
各國政府通過大數(shù)據(jù)的分析運(yùn)用和發(fā)展使政府和公共機(jī)構(gòu)的政務(wù)更加公開、透明。而數(shù)據(jù)的公開透明是大數(shù)據(jù)得到分析、價值得到挖掘的重要前提。英、德、法、美、新加坡等多國的政府機(jī)構(gòu)都推出了公共數(shù)據(jù)庫開放網(wǎng)站,以實(shí)現(xiàn)政府公務(wù)的公開透明。與此同時,大數(shù)據(jù)在民生領(lǐng)域例如醫(yī)療、交通、天氣預(yù)測和地理位置勘探等方面的創(chuàng)新應(yīng)用也使得社會的信息化水平得到提高和加強(qiáng)。
最典型的例子就是,美國的大衛(wèi)·羅斯柴爾德利用大數(shù)據(jù)對未來進(jìn)行了準(zhǔn)確的預(yù)測。大衛(wèi)·羅斯柴爾德是微軟紐約研究院的成員,2012年他通過對大量的數(shù)據(jù)進(jìn)行分析,建立一個分析模型,而成功預(yù)測出當(dāng)年美國總統(tǒng)大選51個選區(qū)當(dāng)中的50個選區(qū)的結(jié)果,準(zhǔn)確率高達(dá)98%。2013年初又利用大數(shù)據(jù)準(zhǔn)確的預(yù)測了除最佳導(dǎo)演之外的所有獲獎名單,準(zhǔn)確率高達(dá)95.8%。事實(shí)表明,利用好大數(shù)據(jù)對于準(zhǔn)確的預(yù)測未來具有重大的價值,也為人們進(jìn)行科學(xué)決策和防范于未然提供了依據(jù),可以說,在未來人們可以根據(jù)大數(shù)據(jù)預(yù)測分析的能力,更好的制定決策,實(shí)施對人類有利的舉措。
四、結(jié)語
大數(shù)據(jù)從誕生至今,與其說是信息技術(shù)發(fā)展到一定程度上的發(fā)明,不如說是一個發(fā)現(xiàn)。在面對飛速發(fā)展的信息技術(shù)時代,大數(shù)據(jù)的研究者們從大數(shù)據(jù)的理論層面延伸至實(shí)踐上的應(yīng)用,不斷地推進(jìn)、完善該領(lǐng)域的研究。從理論研究到實(shí)踐應(yīng)用,每個理論都有其適用的方面和無法解釋的現(xiàn)象,大數(shù)據(jù)領(lǐng)域也是如此,雖然仍舊有很多我們無法解決的難題,但這并不影響大數(shù)據(jù)在各個領(lǐng)域發(fā)揮著它舉足輕重的作用。另外在進(jìn)行實(shí)踐時,各行業(yè)、各領(lǐng)域在運(yùn)用大數(shù)據(jù)進(jìn)行經(jīng)濟(jì)決策、指導(dǎo)社會實(shí)踐的過程中,也要意識到大數(shù)據(jù)帶來的挑戰(zhàn),例如產(chǎn)生信息垃圾、隱私泄露、數(shù)據(jù)濫用等。應(yīng)該結(jié)合自己行業(yè)的特殊性,與大數(shù)據(jù)技術(shù)進(jìn)行適當(dāng)?shù)娜诤?,順?yīng)時代發(fā)展的潮流,做到改革創(chuàng)新,避免卷入大數(shù)據(jù)的洪流之中。與此同時,不僅是企業(yè)和個人,政府也要在經(jīng)濟(jì)迅速發(fā)展、信息技術(shù)不斷更新的今天,重視自身素質(zhì)的提高,利用大數(shù)據(jù)發(fā)揮更大、更廣泛的作用。(作者單位:河北經(jīng)貿(mào)大學(xué))
參考文獻(xiàn):
[1] 潘璠.走近大數(shù)據(jù)[J].調(diào)研世界.2014(10)
[2] 艾伯特·巴拉巴西.爆發(fā):大數(shù)據(jù)時代預(yù)見未來的新思維[M].北京:中國人民大學(xué)出版社,2012.
[3] 維克托·舍恩伯格,肯尼斯·庫克耶.大數(shù)據(jù)時代[M]杭州:浙江人民出版社,2013.
[4] 李國杰.大數(shù)據(jù)研究的科學(xué)價值[J].中國計(jì)算機(jī)學(xué)會通訊.2012(9)
[5] 涂子沛.大數(shù)據(jù)及其成因[J].科學(xué)與社會.2014(1)