本報(bào)駐加拿大特約記者 陶短房 本報(bào)記者 段聰聰 芮曉煜不少人可能會(huì)奇怪地發(fā)現(xiàn),自己在購(gòu)物網(wǎng)站大量瀏覽過(guò)鞋子后,轉(zhuǎn)而跳去另一個(gè)門(mén)戶(hù)網(wǎng)站看新聞,新聞旁邊的廣告播放的正是他感興趣的鞋子!這不是偶然的,“這正是大數(shù)據(jù)的一個(gè)商業(yè)應(yīng)用”——對(duì)消費(fèi)者實(shí)施精準(zhǔn)化營(yíng)銷(xiāo)。大數(shù)據(jù)(Big Data)被視為云計(jì)算之后的又一科技熱點(diǎn),它可以讓中國(guó)的地方政府通過(guò)電力數(shù)據(jù)分析把脈當(dāng)?shù)亟?jīng)濟(jì),也可以讓美國(guó)國(guó)家安全局通過(guò)電話監(jiān)控記錄發(fā)現(xiàn)本·拉登的蛛絲馬跡,它還幫助美國(guó)一些青年男女在交友網(wǎng)站找到合適的對(duì)象,以及讓谷歌實(shí)現(xiàn)其無(wú)人駕駛汽車(chē)的夢(mèng)想。“大數(shù)據(jù)時(shí)代”來(lái)臨 美國(guó)福布斯雜志4日稱(chēng),如今,在瀏覽新聞網(wǎng)站或者參加行業(yè)會(huì)議時(shí),想看不見(jiàn)或聽(tīng)不到“大數(shù)據(jù)”這個(gè)詞幾乎不可能。路透社4日稱(chēng),透過(guò)數(shù)據(jù)研究消費(fèi)者行為絕不再是大型企業(yè)的專(zhuān)利了,一些創(chuàng)新企業(yè)正在幫助小公司使用數(shù)據(jù)來(lái)服務(wù)消費(fèi)者。英國(guó)《衛(wèi)報(bào)》4日則報(bào)道了一場(chǎng)圍繞大數(shù)據(jù)主題的圓桌會(huì)議。而有中國(guó)專(zhuān)家稱(chēng),2013年將是中國(guó)大數(shù)據(jù)元年,5日有消息稱(chēng),中國(guó)首個(gè)“大數(shù)據(jù)技術(shù)與應(yīng)用”碩士項(xiàng)目成立,“去年一些網(wǎng)站在春運(yùn)購(gòu)票高峰期間幾乎癱瘓就說(shuō)明大數(shù)據(jù)處理能力有待提高”。 實(shí)際上,早在2012年,《紐約時(shí)報(bào)》就刊文稱(chēng),“大數(shù)據(jù)時(shí)代”已經(jīng)來(lái)臨。哈佛大學(xué)量化社科院院長(zhǎng)加里·金等則稱(chēng),“大數(shù)據(jù)”將在學(xué)術(shù)界、企業(yè)界和政界迅速蔓延,“沒(méi)有哪個(gè)領(lǐng)域不會(huì)受到影響”?!兑?guī)劃數(shù)字化的未來(lái):美國(guó)總統(tǒng)科學(xué)技術(shù)顧問(wèn)委員會(huì)給總統(tǒng)和國(guó)會(huì)的報(bào)告》中曾提出,“聯(lián)邦政府的每一個(gè)機(jī)構(gòu)和部門(mén),都需要制定一個(gè)應(yīng)對(duì)‘大數(shù)據(jù)的戰(zhàn)略?!苯K于在2012年,美國(guó)6個(gè)聯(lián)邦政府部門(mén)宣布將投入2億多美元立即啟動(dòng)“大數(shù)據(jù)發(fā)展研究計(jì)劃”。 在開(kāi)頭買(mǎi)鞋子的故事中,美國(guó)為企業(yè)級(jí)市場(chǎng)提供大數(shù)據(jù)系統(tǒng)處理的公司Cloudera的軟件工程師王之明向《環(huán)球時(shí)報(bào)》記者介紹,神奇之處在于,購(gòu)物網(wǎng)站、新聞網(wǎng)站和廣告商是3個(gè)不同的主體,卻通過(guò)大數(shù)據(jù)技術(shù)實(shí)現(xiàn)精準(zhǔn)營(yíng)銷(xiāo)。廣告商通過(guò)數(shù)據(jù)分析服務(wù),知道正在看新聞的小王想買(mǎi)鞋子,于是就登了鞋子的廣告,而看同一個(gè)新聞網(wǎng)頁(yè)的小張看到的也許是手機(jī)廣告,因?yàn)樗谫?gòu)物網(wǎng)站曾搜索或?yàn)g覽過(guò)大量新款手機(jī)。 目前,已有越來(lái)越多的傳統(tǒng)行業(yè)走向大數(shù)據(jù)系統(tǒng),如銀行可以對(duì)用戶(hù)信用卡使用情況進(jìn)行分析,從而判斷賬戶(hù)是否被盜,以及對(duì)何種顧客提供定制增值服務(wù)等;大型連鎖超市可以通過(guò)分析,減少冷門(mén)商品的庫(kù)存;石油地質(zhì)勘測(cè)也因?yàn)閿?shù)據(jù)量龐大需要用到大數(shù)據(jù)技術(shù)。 電力系統(tǒng)也是產(chǎn)生大量數(shù)據(jù)的地方。中國(guó)一名電力領(lǐng)域?qū)<覍?duì)《環(huán)球時(shí)報(bào)》表示,中國(guó)的智能電網(wǎng)建成后,采集電力數(shù)據(jù)的成本進(jìn)一步降低?,F(xiàn)在每秒鐘在電力系統(tǒng)可以產(chǎn)生大量數(shù)據(jù)。通過(guò)大數(shù)據(jù)能夠把如此大規(guī)模的數(shù)據(jù)進(jìn)行整合、分析,加以利用,絕對(duì)可以產(chǎn)生新的價(jià)值。政府也可以通過(guò)用電量來(lái)確認(rèn)行業(yè)發(fā)展情況。如去年?yáng)|部沿海地區(qū)經(jīng)濟(jì)不好的時(shí)候,浙江省海鹽縣的縣長(zhǎng)就曾經(jīng)請(qǐng)電力部門(mén)采集和分析當(dāng)?shù)赜秒娗闆r數(shù)據(jù)。如果說(shuō)企業(yè)可以用財(cái)務(wù)報(bào)表來(lái)掩蓋經(jīng)營(yíng)狀況不良,用電量數(shù)據(jù)卻可以直接反映企業(yè)開(kāi)工狀況。電力大數(shù)據(jù)的分析和挖掘還可以為建立建筑節(jié)能標(biāo)準(zhǔn),以及為交通、銀行系統(tǒng)提供有用信息。這對(duì)中國(guó)建設(shè)智能城市有重要意義。 公共衛(wèi)生部門(mén)則可以通過(guò)互聯(lián)網(wǎng)上的大數(shù)據(jù)嘗試預(yù)估傳染性疾病的分布、傳染擴(kuò)散速度等趨勢(shì),這會(huì)極大提高醫(yī)院對(duì)床位、藥品準(zhǔn)備工作的有效性。 大數(shù)據(jù)理念也被美國(guó)反恐機(jī)構(gòu)所運(yùn)用。中國(guó)信息技術(shù)管理專(zhuān)家、《大數(shù)據(jù)》一書(shū)作者涂子沛向《環(huán)球時(shí)報(bào)》介紹,美國(guó)蘭德公司情報(bào)政策研究中心的主任帕拉契尼在接受美國(guó)媒體采訪時(shí)曾表示,國(guó)家安全局從電話監(jiān)控的記錄當(dāng)中發(fā)現(xiàn)了本·拉登的蛛絲馬跡。該局對(duì)全美的電話進(jìn)行監(jiān)控,每6小時(shí)收集的數(shù)據(jù)量就相當(dāng)于美國(guó)國(guó)會(huì)圖書(shū)館所有印刷體藏書(shū)的信息總量。 大數(shù)據(jù)顧名思義,有數(shù)據(jù)量巨大的含義,不過(guò),在王之明看來(lái),還有一種情況是,數(shù)據(jù)量不大,但運(yùn)算很復(fù)雜。如美國(guó)婚戀交友網(wǎng)站eHarmony,數(shù)據(jù)量不多,但系統(tǒng)需要進(jìn)行復(fù)雜計(jì)算和用戶(hù)配對(duì),才能得出如何幫助一名用戶(hù)找到心儀的對(duì)象。“自產(chǎn)生”,可“廢物利用” 大數(shù)據(jù)時(shí)代和傳統(tǒng)數(shù)據(jù)庫(kù)時(shí)代有什么不一樣呢? 很多人對(duì)數(shù)據(jù)的理解依然停留在“數(shù)字”的概念上,其實(shí),數(shù)據(jù)的范圍已經(jīng)擴(kuò)大。人們發(fā)的每一條微博、電腦上聽(tīng)到的聲音文件、監(jiān)控器收集到的視頻信息都成為數(shù)據(jù)。不僅有數(shù)字,還包括文本、圖片、聲音、影像、地理位置。未來(lái)還可能包括,利用生物技術(shù)收集的生物數(shù)據(jù),比如指紋、脈搏、眼球移動(dòng)記錄等等。正因如此,一些社交網(wǎng)站、微博網(wǎng)站由于用戶(hù)不斷自我更新信息,數(shù)據(jù)量倍增。中國(guó)人民大學(xué)信息學(xué)院院長(zhǎng)杜小勇對(duì)《環(huán)球時(shí)報(bào)》表示,原來(lái)的計(jì)算機(jī)系統(tǒng)都靠操作員把數(shù)據(jù)輸進(jìn)去,而現(xiàn)在每個(gè)人都成為數(shù)據(jù)的輸入者,加上存儲(chǔ)技術(shù)不斷發(fā)展,使得信息量劇增。益普索咨詢(xún)公司數(shù)字研究資深總監(jiān)李峰也因此認(rèn)為,“隨著技術(shù)能夠獲取的最基本原始數(shù)據(jù)不斷增加,大數(shù)據(jù)時(shí)代已經(jīng)到來(lái)?!? 大數(shù)據(jù)還可以實(shí)現(xiàn)“廢物利用”。王之明介紹,過(guò)去九成的原始數(shù)據(jù)在錄入時(shí)就丟棄了,大數(shù)據(jù)卻可以把丟掉的九成數(shù)據(jù)拿來(lái)做運(yùn)算。比如顧客在超市購(gòu)物,結(jié)賬時(shí),超市掌握所有原始購(gòu)買(mǎi)信息,如該顧客買(mǎi)了A品牌的牛奶和B品牌的雞蛋,超市甚至能通過(guò)積分卡一類(lèi)知道顧客是誰(shuí)。傳統(tǒng)上,超市只會(huì)保留很少的數(shù)據(jù),如賣(mài)了多少產(chǎn)品。但有了大數(shù)據(jù)技術(shù),超市可以保留所有原始數(shù)據(jù),以供將來(lái)需要從中挖掘出更多信息時(shí)使用。 與傳統(tǒng)數(shù)據(jù)庫(kù)相比,大數(shù)據(jù)還有一大優(yōu)勢(shì),可以用更便宜的技術(shù)實(shí)現(xiàn)計(jì)算目的,便于一些無(wú)力承擔(dān)大型數(shù)據(jù)庫(kù)開(kāi)支的小公司選用。此外,一些傳統(tǒng)數(shù)據(jù)庫(kù)在數(shù)據(jù)錄入時(shí)需要對(duì)原始數(shù)據(jù)進(jìn)行整理,按統(tǒng)一的格式輸入,但比如國(guó)家安全部門(mén)想通過(guò)數(shù)據(jù)分析來(lái)追蹤恐怖分子的蹤跡,無(wú)法事先判斷會(huì)出什么樣的報(bào)告,進(jìn)而需要怎樣的數(shù)據(jù)統(tǒng)一格式,因此也會(huì)用到大數(shù)據(jù)技術(shù)。 因此,有人說(shuō),數(shù)據(jù)是資產(chǎn),是財(cái)富。更有人將數(shù)據(jù)看成是生產(chǎn)要素,越來(lái)越活躍,可重復(fù)利用,而且環(huán)保無(wú)污染。有中國(guó)專(zhuān)家對(duì)《環(huán)球時(shí)報(bào)》記者表示,發(fā)展大數(shù)據(jù)對(duì)于中國(guó)向知識(shí)經(jīng)濟(jì)轉(zhuǎn)型具有重要意義。中國(guó)在大數(shù)據(jù)時(shí)代不能落后 在涂子沛看來(lái),和中國(guó)、印度的競(jìng)爭(zhēng)對(duì)手相比,西方國(guó)家的公司無(wú)法在產(chǎn)品的成本方面獲得優(yōu)勢(shì),他們只能在商業(yè)過(guò)程優(yōu)化方面戰(zhàn)勝對(duì)方。目前各行各業(yè)都出現(xiàn)了以數(shù)據(jù)分析為競(jìng)爭(zhēng)能力的企業(yè),谷歌甚至認(rèn)為其無(wú)人駕駛汽車(chē)也是一個(gè)大數(shù)據(jù)問(wèn)題。資料顯示,2011年,麥肯錫公司以2010年度各國(guó)新增的存儲(chǔ)器為基準(zhǔn),對(duì)全世界大數(shù)據(jù)分布做了一個(gè)統(tǒng)計(jì),中國(guó)2010年新增數(shù)據(jù)量約為250拍(一拍是2的50次方),不及日本的400拍,歐洲的2000拍,和美國(guó)的3500拍相比,更是連1/10都不到。 益普索的李峰對(duì)《環(huán)球時(shí)報(bào)》表示,大數(shù)據(jù)是全球性的,各國(guó)的差異在于數(shù)據(jù)獲取的能力。此外,如何把數(shù)據(jù)提煉成信息,并進(jìn)一步轉(zhuǎn)化為知識(shí)和應(yīng)用,這一體系的建立靠的是人,數(shù)據(jù)發(fā)掘能力涉及人的創(chuàng)造力。 杜小勇認(rèn)為,美國(guó)的技術(shù)更前沿一些,更早地關(guān)注了大數(shù)據(jù)的存在。但由于中國(guó)社會(huì)人口巨大,應(yīng)用都是世界最大應(yīng)用,帶來(lái)的挑戰(zhàn)也是世界級(jí)的。在一輪一輪的IT技術(shù)潮流中,中國(guó)與最先進(jìn)技術(shù)之間的差距是在縮小,而不是在擴(kuò)大。中國(guó)的863計(jì)劃已發(fā)布了與大數(shù)據(jù)相關(guān)的計(jì)劃。從國(guó)家層面上說(shuō),中國(guó)對(duì)大數(shù)據(jù)的關(guān)注基本上與美國(guó)是同步的。 不過(guò),“大數(shù)據(jù)”時(shí)代也不可避免地帶來(lái)創(chuàng)新挑戰(zhàn),它造就了一個(gè)傳感器和數(shù)據(jù)庫(kù)無(wú)所不在的世界,而政府、情報(bào)部門(mén)和大商業(yè)機(jī)構(gòu)在這方面有著先天優(yōu)勢(shì),這很容易造成數(shù)據(jù)的“單向透明”。數(shù)據(jù)流失、泄露和私下買(mǎi)賣(mài)也成為噩夢(mèng)。 李峰表示,大數(shù)據(jù)是公開(kāi)化的,要在保護(hù)個(gè)人隱私、商業(yè)機(jī)密、國(guó)家安全和共同分享大數(shù)據(jù)之間找到平衡。杜小勇舉例說(shuō),如果一個(gè)外國(guó)公司通過(guò)網(wǎng)絡(luò)商務(wù),知道一個(gè)國(guó)家更真實(shí)的經(jīng)濟(jì)運(yùn)行情況,也會(huì)影響國(guó)家安全。此外,大數(shù)據(jù)時(shí)代,一個(gè)人總要去參加各種活動(dòng),如電子商務(wù)、網(wǎng)上交流,只要有活動(dòng)就會(huì)留下痕跡,就會(huì)被記錄。個(gè)人信息泄密會(huì)帶來(lái)很大問(wèn)題,但這不應(yīng)成為反對(duì)大數(shù)據(jù)的理由,“技術(shù)上要解決,更重要的是立法?!绷硪环矫妫灿腥嗽诤粲鯏?shù)據(jù)的公開(kāi),一名中國(guó)專(zhuān)家對(duì)《環(huán)球時(shí)報(bào)》表示,推動(dòng)中國(guó)大數(shù)據(jù)發(fā)展,關(guān)鍵在于政府理念的轉(zhuǎn)變。應(yīng)推動(dòng)數(shù)據(jù)公開(kāi),帶動(dòng)從政府到各行業(yè)公開(kāi)數(shù)據(jù),讓數(shù)據(jù)這種生產(chǎn)要素自由流動(dòng),這樣才能不斷提高其附加值。美國(guó)和英國(guó)都已經(jīng)有了政府大數(shù)據(jù)網(wǎng)站,在數(shù)據(jù)公開(kāi)方面先行一步。不管怎么說(shuō),大數(shù)據(jù)這一新趨勢(shì)必將從理念到實(shí)踐帶來(lái)更多創(chuàng)新價(jià)值和挑戰(zhàn)?!?/p>