非常高興有機會跟大家共同分享一些關(guān)于大數(shù)據(jù)的話題。在演講之前,我想簡單介紹一下大數(shù)據(jù)的定義和特征。大數(shù)據(jù)不是什么新的技術(shù),也不是什么新的名詞,其實它一直都在我們身邊。它有很高的速度,很大的容量,以及很復雜的特性。其實,我覺得大數(shù)據(jù)最重要的一點是它的價值,如果你沒有發(fā)現(xiàn)它的價值,再大再多再復雜也沒有用。從數(shù)據(jù)的體征上來講,它很多的數(shù)據(jù),都是在人和人,物和物,人與物之間產(chǎn)生的。數(shù)據(jù)結(jié)構(gòu)和流程
像物聯(lián)網(wǎng),云計算等等,還有人機對話,各個領(lǐng)域復雜的數(shù)據(jù)來源,廣泛的業(yè)務范圍等等都會有。從最底層的社會管理、社會服務和社會生產(chǎn)三個方面能夠清晰表現(xiàn)出大數(shù)據(jù)的整體架構(gòu)。社會管理體現(xiàn)在政府的各個層面,如政府機構(gòu),政府政務,以及政府的電子商務。社會生產(chǎn)離不開農(nóng)業(yè)和工業(yè)。社會服務的范圍更廣泛,如交通、教育、醫(yī)療等領(lǐng)域。這個可以反應出來它是結(jié)構(gòu)性的,同時它也有一些非結(jié)構(gòu)性或者半結(jié)構(gòu)性的。
對于不同的數(shù)據(jù),比如銀行數(shù)據(jù),通訊數(shù)據(jù),以及個人信息,都是屬于傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)。像社區(qū)的網(wǎng)站,點擊率等都是非結(jié)構(gòu)化的數(shù)據(jù)。還有一些數(shù)據(jù)像大浪淘沙一樣,你是從深礦里面加工數(shù)據(jù)分析。接下來還需要做數(shù)據(jù)的分析管理,分析人們會關(guān)注哪個話題,是關(guān)注公關(guān)、社會、金融、市場、還是個人行為等。另外,不同的人群會有不同的需求,研發(fā)人員可能需要的數(shù)據(jù)也是不同的,管理人員還有一些市場人員都可以經(jīng)過從原生礦到金礦粉再到金產(chǎn)品來使用。這個我們會考慮到運營成本,在考慮數(shù)據(jù)分析的同時,也應該考慮它的整體應用成本,而不僅僅是一個單獨的存儲成本,有的存儲是很大,價格也很低廉,但是你又堆了一堆沒有用的東西,最后導致你使用的時候會覺得非常不方便。
我還想跟大家共享一下IDA流程,I是整合,是把一些數(shù)據(jù)搜集起來進行處理和管理。在這個基礎(chǔ)上,我們?nèi)ヌ剿饕恍┠P偷拈_發(fā),信息的挖掘,還有一些知識的發(fā)現(xiàn),在這個層面上我們要做一些管理的決策,渠道的協(xié)同和應用的交互,讓這三者不斷地形成反饋和洞察互動。我們有一個量化數(shù)據(jù),是通過我們?yōu)椴煌恼?、企業(yè)、事業(yè)單位、以及各個不同行業(yè)、不同領(lǐng)域的數(shù)據(jù)進行分析總結(jié)出來的。如果不用大數(shù)據(jù),我們也可以進行企業(yè)的經(jīng)營管理,不過,通過大數(shù)據(jù)分析可以節(jié)約3%的內(nèi)部成本。其實不同行業(yè)和不同領(lǐng)域是有高有低的,但是這個平均值是3%。
那么,從整體上來看,公司的高層領(lǐng)導需要對數(shù)據(jù)有一定的掌控,這就像飛機的駕駛員,駕駛艙是一個全景圖,他需要通過駕駛艙看氣象、航道的、以及地面的各種信息。
大數(shù)據(jù)實現(xiàn)智慧服務
我舉幾個例子,在政府管理和行業(yè)應用當中怎么通過大數(shù)據(jù)來實現(xiàn)智慧信息服務。前面講到了社會管理、社會生產(chǎn)和社會服務,其實我們的數(shù)據(jù)都來源于這三大塊,沒有這三大塊也談不上數(shù)據(jù),也用不著分析。我舉的其中一個例子是通訊運營商,因為通訊運營商有物理的網(wǎng)。他們怎么和物聯(lián)網(wǎng)和大數(shù)據(jù)整合來實現(xiàn)云,不同的實踐和不同的應用可能就會有不同的信息領(lǐng)域,醫(yī)療云,交通云,醫(yī)保卡云等等。另外,像澳大利亞的稅收,可能在國外生活過的同事朋友有一個感受,每到年底的時候,都會有一個TFIND,這個是跟你每年的納稅相掛鉤的。這個是精確到小數(shù)點后面兩位,要達到如此精度的計算,一定是需要大數(shù)據(jù)和特別精準的分析和計算來實現(xiàn)的,這樣才能夠拿到每一個人準確的稅收帳單,并且這種服務是終生的。我覺得國內(nèi)在稅收的管理方面還是與發(fā)達國家有一定差距的?,F(xiàn)在,一些發(fā)達國家這方面的經(jīng)驗真的值得我們學習。
此外,我們國家的智能電表還在開發(fā)當中,智能電表有什么好處?它是跟我們國家的電費緊密相關(guān)的。別的國家中有一些特別會過日子的家庭主婦,她們會選擇電價最低的時候做一些工作。白天的時候,大家都在搶著用電,這個時候電價就高。可是到了晚上,特別是12點以后,大家都休息了,這個時候,電費就很低。慢慢的,美國的家庭主婦就將一些事情放到晚上來做,這樣就可以使用價格便宜的電了。這樣做即省電,又節(jié)省時間。這個也是大數(shù)據(jù)的案例。
還有就是ADTA,它是汽車保險公司,它不斷地提醒大家養(yǎng)成一個良好的習慣。如果你這一年沒有交通事故,你的記錄就會特別好。這樣,你每年都可以得到不同的優(yōu)惠,另外它還會根據(jù)你的駕駛習慣提醒你如何會更好,現(xiàn)在微信微博朋友圈也都挺火爆的,有些人也愿意把自己良好的駕駛習慣跟朋友去分享,分享之后更多人說我的駕駛習慣比你還好,那我付的保費為什么比你還高呢,我也去享受ADTA服務吧,這樣就形成一種良性的互動。
我們再跟中央電視臺合作的時候,談到舌尖上的中國,它的背后可能有一串的產(chǎn)業(yè)鏈。比如拍跳跳魚就可能產(chǎn)生一條產(chǎn)業(yè)鏈。它的配料,最佳飲食季節(jié)等等。這樣,它的背后產(chǎn)業(yè)鏈就建成了,這就是簡單的連接,也是借助傳媒的速度和科技的力量。
大家可能都聽說過啤酒和尿布的故事,我們可以想像一下,完全不搭界的兩件事兒怎么結(jié)合一起,這個也是大數(shù)據(jù)的貢獻。沃爾瑪和我們合作20多年了,在收銀單的上他們發(fā)現(xiàn)好像尿布和啤酒總是在同一張單子出現(xiàn),為什么呢?其實很多因素都是關(guān)鍵關(guān)系,外國人請保姆比較少,很多都是主婦在家?guī)Ш⒆?,她會提醒先生出去買東西的時候買尿布,所以這個先生買尿布的時候肯定會拎著一箱啤酒,最后這兩個貨物就擺在一起了,擺在一起銷售量又提升了,而且還有一些商家希望他們銷售的產(chǎn)品擺得近一點,這樣能夠有一些邊際效應能夠做共享。再有是手電筒和餅干,也是風馬牛不相及,也是發(fā)現(xiàn)買這個手電筒的時候也發(fā)現(xiàn)這個餅干超出比平時高出七倍,因為遇到臺風的時候,就會買手電筒和餅干。這些都是通過大數(shù)據(jù)來實現(xiàn)的。
(根據(jù)黃北寧在2014第七屆中國信息主管年會上的演講整理而成)