大數(shù)據(jù)技術(shù)是近年來全球高度關(guān)注的一項新興信息技術(shù),被譽為一場新的計算革命,將對現(xiàn)實世界產(chǎn)生深遠影響,是構(gòu)成國家競爭力、商業(yè)競爭力和個人素質(zhì)的重要部分,因此,各國都希望在大數(shù)據(jù)技術(shù)研發(fā)與應用上占得先機。然而,正像所有的新興技術(shù)一樣,大數(shù)據(jù)也存在著被人濫用、擴大社會不平等的弊端,有著不光彩的一面。此外,大數(shù)據(jù)技術(shù)還可能對國家安全帶來新的挑戰(zhàn),有必要在發(fā)展該技術(shù)同時預先關(guān)注其潛在風險。
數(shù)據(jù)的最好時代
2001年,美國著名咨詢公司高德納首次提出了“三維數(shù)據(jù)”的概念,認為在互聯(lián)網(wǎng)信息爆炸的時代,數(shù)據(jù)處理技術(shù)將向“三個維度”發(fā)展,即數(shù)據(jù)處理量不斷擴大、數(shù)據(jù)處理速度不斷加快、數(shù)據(jù)歸類分析能力不斷加強。這一概念成為了大數(shù)據(jù)技術(shù)的前身。
2012年,大數(shù)據(jù)突然成為了國際輿論的熱詞,不僅登上了《紐約時報》、《華爾街日報》等國際主流媒體封面,更引發(fā)了美國政府的高度關(guān)注。同年底,一本名為《大數(shù)據(jù)時代》的著作將這股風潮推向頂峰,該書對大數(shù)據(jù)技術(shù)的概念、應用前景和影響進行了系統(tǒng)介紹,并前瞻性地指出,大數(shù)據(jù)帶來的信息風暴正在變革我們的生活、工作和思維,它將開啟一次重大的時代轉(zhuǎn)型。
從當前的研究成果看,大數(shù)據(jù)技術(shù)在以下三個方面有超越以往數(shù)據(jù)處理技術(shù)的獨到優(yōu)勢:一是解決了信息爆炸時代的數(shù)據(jù)碎片化問題。大數(shù)據(jù)技術(shù)誕生之前,人們認為隨著互聯(lián)網(wǎng)上的信息量以幾何級別增長,其增長速度將遠超過人類理解和計算機分類處理的速度。最終,互聯(lián)網(wǎng)上的信息會雜亂無章,大量無用的信息“淹沒”有用信息,互聯(lián)網(wǎng)不僅未能幫助人類認識世界,反而成為了信息的“垃圾場”。大數(shù)據(jù)技術(shù)從另一個方向入手解決了這一難題,該技術(shù)不再試圖去“追逐”信息產(chǎn)生的速度,而是從源頭上對信息進行分類管理,并在一開始就過濾掉大量無用的信息。如果說傳統(tǒng)的數(shù)據(jù)處理模式類似于郵遞員分揀郵件,那么大數(shù)據(jù)就像礦井里的選礦,是將數(shù)據(jù)磨碎后再進行分類存放。
二是解決了數(shù)據(jù)樣本數(shù)量、有用性和準確性之間的矛盾。傳統(tǒng)觀點認為,樣本過多將導致研究分析的難度顯著上升,而且可能由于多個樣本之間的差異而得出相互矛盾的結(jié)論。因此,一般研究中都對樣本的范圍、數(shù)量進行嚴格控制。但是,控制樣本數(shù)量又可能導致另一個問題,即因樣本不夠普遍而得出片面、不準確的結(jié)論。大數(shù)據(jù)則對這個三重矛盾提出了一個創(chuàng)新性的解決方法。大數(shù)據(jù)技術(shù)不再關(guān)心單個數(shù)據(jù)樣本本身的內(nèi)容和價值,而是尋找數(shù)據(jù)樣本之間的關(guān)系、聯(lián)系及相互影響。利用這些數(shù)據(jù)之間的關(guān)系,大數(shù)據(jù)像拼圖一樣將數(shù)據(jù)樣本拼接在一起,最終得出一個完整的圖景。樣本越多只會讓這幅“拼圖”更加細致、完整,從而增加結(jié)論的準確性。因此,大數(shù)據(jù)在分析大趨勢、概率方面有著獨到優(yōu)勢。
三是具備了智能和學習功能。傳統(tǒng)的數(shù)據(jù)分析技術(shù)需要根據(jù)對象和目標進行較深程度的定制,建設數(shù)據(jù)模型的成本很高,系統(tǒng)封閉且模型無法反復使用。這也導致數(shù)據(jù)分析無法不斷深入,只能停留在較低的層次上。大數(shù)據(jù)技術(shù)則有所不同,該技術(shù)不僅分析“已存在”的數(shù)據(jù)樣本,而且還分析“正在生成”的數(shù)據(jù)樣本。因此,大數(shù)據(jù)是一項開放、有“生命力”的技術(shù),其分析結(jié)果持續(xù)被修正、完善,可以與人工智能或其他技術(shù)進行“嫁接”,從而使大數(shù)據(jù)能夠具有學習和智能分析的功能。
基于這些優(yōu)勢,政府、企業(yè)都將大數(shù)據(jù)視為一種革命性技術(shù),在社會管理、商業(yè)開發(fā)和個人服務上均具有巨大潛力。當前,大數(shù)據(jù)分析已在情報分析、營銷等方面有著成功的應用案例。2012年,美國中情局技術(shù)總監(jiān)在一場科技活動中稱,大數(shù)據(jù)使中情局的情報分析速度有質(zhì)的飛躍。之前,中情局針對某一研究對象需要63天分析有關(guān)材料,而運用大數(shù)據(jù)技術(shù)后,速度被縮短至27分鐘。該官員稱,大數(shù)據(jù)已被廣泛使用在反恐情報中,美國情報部門能據(jù)此確定恐怖分子的身份。大數(shù)據(jù)在營銷中的使用就更為普遍,早在大數(shù)據(jù)這一概念誕生前,亞馬遜等電商就已經(jīng)開始使用此類技術(shù)推送促銷信息,向消費者推薦其可能感興趣的商品。
大數(shù)據(jù)在趨勢預測方面的價值還有待挖掘。本屆巴西世界杯舉行期間,包括微軟、谷歌等互聯(lián)網(wǎng)公司已經(jīng)開始試著用大數(shù)據(jù)技術(shù)預測比分結(jié)果和最終冠軍。也有一些投資機構(gòu)開始嘗試運用大數(shù)據(jù)預測股市和大宗商品價格等,但從當前情況看,上述大數(shù)據(jù)模型仍不夠成熟,其預測結(jié)果還不夠靠譜。
隱私的最壞時代
雖然大數(shù)據(jù)技術(shù)前景廣大,并且能給民眾的生活帶來方便和福祉,然而,在一些批評人士的眼中,這一技術(shù)并非完美,甚至有些卑鄙。如果大數(shù)據(jù)技術(shù)的發(fā)展走上了邪路,它也可能成為一種新形式的霸權(quán)。
這些針對大數(shù)據(jù)的批評可被概括為以下四種:一是大數(shù)據(jù)技術(shù)嚴重侵犯了個人隱私。大數(shù)據(jù)表面上是一種神乎其神的數(shù)字技術(shù),實際上只是“未經(jīng)授權(quán)的商業(yè)調(diào)查”。大數(shù)據(jù)的真正獲益者并非普通民眾,而是利用大數(shù)據(jù)技術(shù)分析的商家,大數(shù)據(jù)成為后者操控前者的一種工具。此外,大數(shù)據(jù)技術(shù)抓取的數(shù)據(jù)來源多是帶有隱私成分的個人信息,如果將其聯(lián)系到一起,某個人的一舉一動就會躍然紙上。批評人士指出,無論是利用這些隱私信息引誘消費者購買其偏好的商品,還是保存這些信息本身都是極不道德的行為。當前法律框架下未有對此的嚴格約束。
二是認為大數(shù)據(jù)技術(shù)可能被政府濫用,產(chǎn)生類似于“老大哥”的社會。在奧威爾的經(jīng)典著作《1984》中,政府建設出了一個監(jiān)控無所不在的社會。而在現(xiàn)實生活中,美國國安局的網(wǎng)絡監(jiān)視行為也可謂無孔不入。人們擔心,如果大數(shù)據(jù)技術(shù)發(fā)展成熟,該技術(shù)可能成為一些國家政府監(jiān)控其國民的重要工具。毫無疑問,這將使社會陷入極度恐慌之中,公平和正義將成為空談。
三是認為大數(shù)據(jù)可能導致“大錯誤”。雖然從理論上來說,大數(shù)據(jù)的預測能力會不斷增強,但這項技術(shù)畢竟不能消除所有的不確定性和隨機性,其預測結(jié)果不會永遠正確。另外,大數(shù)據(jù)還有著樣本取樣趨同、運算模型近似的特點,這可能導致若干依賴大數(shù)據(jù)預測的機構(gòu)都忽視了同樣的風險,并且在變動發(fā)生時做出過激的反應。高頻交易導致市場崩潰的例證警告著我們,當一個社會高度依賴大數(shù)據(jù)技術(shù)時,這也將會是一個隨時可能崩盤、極為危險的社會。
四是認為大數(shù)據(jù)將助長貧富分化和知識鴻溝。大數(shù)據(jù)技術(shù)需要海量的數(shù)據(jù)存儲、運算設備提供硬件支持,其運算模型設計需要最頂尖的計算機人才。因此,大數(shù)據(jù)是一項門檻極高的信息技術(shù)。當前,微軟、英特爾、亞馬遜等互聯(lián)網(wǎng)巨頭才是這項技術(shù)的主要玩家,一些新創(chuàng)立的公司要想躋身其中難上加難,更不用說一般互聯(lián)網(wǎng)用戶或普通民眾了。但另一方面,大數(shù)據(jù)確實有著獨特優(yōu)勢,可以從網(wǎng)絡數(shù)據(jù)中率先發(fā)掘出財富。這導致了大數(shù)據(jù)可能成為一種帶有壟斷性質(zhì)的信息技術(shù),可能更有利于商業(yè)巨頭和知識精英,但卻會拉大社會上業(yè)已存在的不平等問題。
大數(shù)據(jù)時代的數(shù)字邊疆
大數(shù)據(jù)技術(shù)讓人們從另一個角度認識到數(shù)字邊疆的重要性。在大數(shù)據(jù)時代,一國之內(nèi)及其國民創(chuàng)造的數(shù)字財富的價值得到凸顯。這些數(shù)字財富不僅代表著巨大的商業(yè)利益,也可能成為另一國對本國發(fā)動輿論戰(zhàn)、金融戰(zhàn)的重要抓手。利用大數(shù)據(jù)技術(shù),一些國家可以在悄無聲息的情況下對另一國進行細致的情報搜集工作,并且能夠根據(jù)大數(shù)據(jù)的預測設計出有針對性的輿論戰(zhàn)、金融戰(zhàn)方案。這些都是傳統(tǒng)國家安全領(lǐng)域從未遇到的問題。在這個新的角逐場中,發(fā)展中國家由于信息科技技術(shù)無法自主、國內(nèi)研發(fā)水平較低、缺乏相關(guān)研究,毫無疑問居于劣勢。而美國在9.11事件后已在網(wǎng)絡情報領(lǐng)域持續(xù)發(fā)力,領(lǐng)先其他國家一個身位?!袄忡R門”事件中暴露出的情況不僅揭示了美國在價值觀上的虛偽,也清楚表露出其在信息技術(shù)上的超前。
在一國數(shù)字邊疆內(nèi)部,大數(shù)據(jù)也提出了一些新的挑戰(zhàn)。挑戰(zhàn)之一是大數(shù)據(jù)帶來的系統(tǒng)性風險,如何避免大數(shù)據(jù)預測錯誤導致的市場劇烈波動或社會控制混亂,這需要國家利用法律對大數(shù)據(jù)的壟斷程度和應用范圍加以限制。挑戰(zhàn)之二是大數(shù)據(jù)帶來的新型網(wǎng)絡攻擊和詐騙,大數(shù)據(jù)技術(shù)的發(fā)展必然伴隨著網(wǎng)絡信息抓取技術(shù)的不斷演進,而這種技術(shù)也可輕易用在網(wǎng)絡攻擊和網(wǎng)絡詐騙之中,這需要國家的執(zhí)法者們對該技術(shù)有著深入認識,未雨綢繆的發(fā)現(xiàn)某些犯罪行為。
(作者為中國現(xiàn)代國際關(guān)系研究院美國所助理研究員)