舒勝
著者: 大數(shù)據(jù)戰(zhàn)略重點實驗室
出版者:中信出版集團(tuán)
出版時間:2015年5月
定價:45.00元
“大數(shù)據(jù)”是一個時髦且內(nèi)涵和外延均模糊的詞,這個詞在“馬云們”的口中、在“碼農(nóng)”的口中、在官員的口中,以及在蕓蕓屌絲口中,應(yīng)該是詞同而意殊的。但是,即便如此,從其頻繁地出現(xiàn)在人們生活中這一點來看,可以說明:對于數(shù)據(jù)的關(guān)心和依賴,已經(jīng)成為現(xiàn)今社會各個階層、社會經(jīng)濟(jì)各個領(lǐng)域的共性。
我們面前的這本關(guān)于大數(shù)據(jù)的編輯著作,為數(shù)據(jù)做了一個非常完美的概念游戲,將“大數(shù)據(jù)”概念的外延狠狠地“周延”了一把。使得“大數(shù)據(jù)”成為了概念,成為一種有固定性狀的“成果”,這就脫離了大數(shù)據(jù)“流動”、“變化”的本性。令人不解的是諸如包括馬云在內(nèi)的阿里巴巴高管等,都對該書不遺余力地褒獎。所以,筆者不得不收藏起自己的“偏見”,仔細(xì)研究書本的內(nèi)容,希望發(fā)現(xiàn)自己是錯的。但無論多么努力地去放棄自己的立場,都難以給眼下這本書打一個及格分,都不能克制抨擊該書的欲望。
該書不像一本討論互聯(lián)網(wǎng)或者大數(shù)據(jù)的書籍,更像是一本在數(shù)據(jù)領(lǐng)域的大而無當(dāng)?shù)囊?guī)劃大綱,如人們熟悉的各種文件那樣,通篇充滿了生造的概念及為其羅列各種特性和意義,而對實現(xiàn)的路徑并沒有過多的涉及。
書中寫道:“塊數(shù)據(jù)是一個新名詞。到目前為止,人類生活、生產(chǎn)產(chǎn)出的大數(shù)據(jù),無論是搜索引擎、電商、社交平臺形成的企業(yè)大數(shù)據(jù),還是天氣預(yù)報形成的科學(xué)大數(shù)據(jù),還是各個政府部門形成的行業(yè)大數(shù)據(jù),都可以定義成‘條數(shù)據(jù)。而塊數(shù)據(jù)則是以一個物理空間或行政區(qū)域形成的涉及人事物的各類數(shù)據(jù)的總和”。短短百來字,充滿了似是而非的概念和論斷:“塊數(shù)據(jù)”、“企業(yè)大數(shù)據(jù)”、“科學(xué)大數(shù)據(jù)”、“行業(yè)大數(shù)據(jù)”和“條數(shù)據(jù)”。
首先,搜索引擎、電商、社交平臺怎么就形成了“企業(yè)大數(shù)據(jù)”?難道不應(yīng)該是搜索、電子商務(wù)、社交參與者的行為產(chǎn)生的痕跡嗎?如果以數(shù)據(jù)占有者分類,那么無論數(shù)據(jù)怎么產(chǎn)生,中國社會只有三類數(shù)據(jù),即政府占有的數(shù)據(jù)、企業(yè)占有的數(shù)據(jù)、個人占有的數(shù)據(jù)。問題是這樣分類對解決現(xiàn)實議題有意義嗎?“科學(xué)大數(shù)據(jù)”、“行業(yè)大數(shù)據(jù)”似乎都必須回答同樣的詢問。
其次,人類生活、生產(chǎn)產(chǎn)生的數(shù)據(jù)難道不存在于時間空間系統(tǒng)里嗎?無論怎樣劃分時間和空間,實際的本質(zhì)并不會改變。所謂的“條數(shù)據(jù)”、“塊數(shù)據(jù)”就是一個數(shù)據(jù),不是兩個數(shù)據(jù),只是研究者從不同的角度看待和利用它們而已。那些對于數(shù)據(jù)的分門別類已經(jīng)毫無意義,越詳細(xì)越“反動”,是對新興的數(shù)據(jù)革命的“反動”。再次,本書對于觀點的論證更多地或者說全部來自描述,作為依賴于算法和邏輯的數(shù)據(jù)產(chǎn)業(yè)著作,脫離了邏輯的分析和路徑的設(shè)計,似乎只能給人隔靴捎癢、不知所云的感覺,沒有人從中獲得實際問題的解決方案。
作者團(tuán)隊可能需要明確幾點,才能夠在數(shù)據(jù)領(lǐng)域里做一些有意義的事。第一,數(shù)據(jù)的發(fā)生是人類活動的自然現(xiàn)象,當(dāng)其發(fā)生時就擁有時空上的整體性;條條塊塊是數(shù)據(jù)分析過程中解決人類能力局限的方法,隨著工具的升級,這個條條塊塊的內(nèi)容和范圍不停地發(fā)生變化。第二,在當(dāng)前技術(shù)和邏輯能力條件下,無法記錄和分析人類活動的,就不能成為數(shù)據(jù),數(shù)據(jù)是被記錄的生活、生產(chǎn),并最終會被分析;同時人類的活動必定有不可被記錄部分,那種包羅萬象的大數(shù)據(jù)是不存在的。第三,“大數(shù)據(jù)”的應(yīng)用并不包括所有現(xiàn)存數(shù)據(jù),所謂“大數(shù)據(jù)”在應(yīng)用層面都是局部的。大而全的大數(shù)據(jù),有;但是大而全的大數(shù)據(jù)應(yīng)用,沒有。第四,“大數(shù)據(jù)”的應(yīng)用是有風(fēng)險的,由于這是一個全新的領(lǐng)域,風(fēng)險的具體界線并不清晰,大數(shù)據(jù)應(yīng)用過程中應(yīng)該把應(yīng)用的目的和范圍人為降低和縮小。因為,數(shù)據(jù)是個人產(chǎn)生,而儲存、應(yīng)用、分析是與人對抗的組織(政府、企業(yè)、商業(yè)組織)進(jìn)行的,其中的沖突和道德風(fēng)險是與生俱來的。第五,“大數(shù)據(jù)”的應(yīng)用是個技術(shù)問題,撇開技術(shù)談數(shù)據(jù)都是空談;“大數(shù)據(jù)”的應(yīng)用同時是個邏輯問題,離開邏輯抽象,任何數(shù)據(jù)都不可能反映本質(zhì);大數(shù)據(jù)的應(yīng)用還帶有目的性,沒有目的推動的數(shù)據(jù)應(yīng)用,最終是找不到出路的,也是沒有意義的。
這本書告訴人們的其實不是關(guān)于數(shù)據(jù)的故事,而是關(guān)于某類數(shù)據(jù)使用者的單方面的非數(shù)據(jù)層面的設(shè)想。endprint