郭夏星 葛 欣
山西財經(jīng)大學 會計學院 山西 太原 030006
阿里大數(shù)據(jù)之戰(zhàn)
郭夏星 葛 欣
山西財經(jīng)大學 會計學院 山西 太原 030006
21世紀的第二個十年已經(jīng)獲得和新技術(shù)提供的數(shù)據(jù)量有關(guān)的多個巨額標簽:“大數(shù)據(jù)” (CORDIS,2010; Manyika, 2011; ORT, 2011)、“數(shù)據(jù)爆炸” (Miller, 2010)和“數(shù)據(jù)洪水”(Swanson,2007)。 “大數(shù)據(jù)”正改變著我們的工作能力。本文將通過阿里巴巴十年“大數(shù)據(jù)之路”,解析IT企業(yè)中大數(shù)據(jù)的應(yīng)用。
大數(shù)據(jù)時代 阿里巴巴
大數(shù)據(jù)產(chǎn)生于現(xiàn)代信息大量沖擊的背景下,具有非凡新穎的用途。事實上,全球商業(yè)巨頭早已意識到了數(shù)據(jù)的重要意義: ZARA規(guī)定每個店鋪經(jīng)理要用平板電腦收集客戶信息與建議等海量數(shù)據(jù),為生產(chǎn)銷售決策提供意見,大大降低存貨率;農(nóng)夫山泉2011年引入數(shù)據(jù)庫平臺SAP Hana,加強數(shù)據(jù)分析能力;阿迪達斯基于外部環(huán)境、消費者調(diào)研和門店銷售數(shù)據(jù)的收集、分析,挖掘細分市場,促進戰(zhàn)略轉(zhuǎn)型—由批發(fā)轉(zhuǎn)為零售;還有搜狗熱詞、微博熱門排行榜等,無一不在顯示大數(shù)據(jù)帶來的商機。本文以阿里巴巴為例,解析IT企業(yè)中大數(shù)據(jù)的應(yīng)用。
數(shù)據(jù)和信用體系堪稱阿里最獨特的地方,這也是其有望實現(xiàn)爆發(fā)的關(guān)鍵。阿里巴巴十年數(shù)據(jù)建設(shè)最早可以追溯到2003年。2003年5月,阿里集團用一億元人民幣建立個人網(wǎng)上貿(mào)易市場平臺——淘寶網(wǎng)。2004年10月,創(chuàng)建支付寶公司,推出起中介作用的安全交易服務(wù)。公司業(yè)務(wù)做大,海量數(shù)據(jù)涌來,阿里“淘數(shù)據(jù)”應(yīng)運而生。隨后,阿里相繼推出“數(shù)據(jù)門戶”、“數(shù)據(jù)魔方”,進行了初步的數(shù)據(jù)開放,為2012年“聚賢塔”產(chǎn)品發(fā)布奠定基礎(chǔ)。至此,阿里正式宣布 “數(shù)據(jù)”、“平臺”、“金融” 三步走戰(zhàn)略。阿里運用大數(shù)據(jù),具體包括以下幾個方面。
1、提高數(shù)據(jù)精度,去粗取精
阿里巴巴是中國最大的、世界第二大網(wǎng)絡(luò)公司。其數(shù)據(jù)量之大,已經(jīng)沒有公司能夠給它提供相關(guān)數(shù)據(jù)業(yè)務(wù),因此阿里開始了自行開發(fā)之路。從“淘數(shù)據(jù)”起步,阿里將淘寶每天的交易量、用戶支付金額、年齡、購買時段等進行簡單收集,隨著數(shù)據(jù)數(shù)量、種類愈漸繁雜,阿里將傳統(tǒng)存儲系統(tǒng)擴展為Hadoop數(shù)據(jù)庫存儲。
數(shù)據(jù)一旦龐大,精度問題就成為關(guān)注點。稍微的偏差是可以被容忍的,但我們要呈現(xiàn)的是更為真實的數(shù)據(jù),凈化數(shù)據(jù)質(zhì)量就是首要任務(wù)。因而阿里相繼開發(fā)了多種數(shù)據(jù)軟件,尤其“聚寶塔”出現(xiàn),為其提供數(shù)據(jù)存儲和數(shù)據(jù)云計算服務(wù)。云計算會成為下一代互聯(lián)網(wǎng)經(jīng)濟的基礎(chǔ)設(shè)施。這種分析方法撥開了表面,看到最原始的數(shù)據(jù)。
2、擴寬數(shù)據(jù)廣度,海納百川
根據(jù)IBM公司調(diào)查,大多數(shù)公司大數(shù)據(jù)處于起步階段,也只是簡單重復的收集內(nèi)部數(shù)據(jù),并未特別關(guān)注外部數(shù)據(jù),內(nèi)外部數(shù)據(jù)并未做到相互聯(lián)系。從阿里大數(shù)據(jù)發(fā)展史不難看出,它曾與微軟合作,相繼收購中國雅虎、口碑網(wǎng)、phpwind、萬網(wǎng)、美國電子商務(wù)軟件提供商Vendio Services、Auctiva、CNZZ、蝦米網(wǎng),先后入股星辰急便、易圖通、美團網(wǎng)、丁丁網(wǎng)、新浪微博、高德、快的打車、360等,幾乎是沒有企業(yè)能達到阿里集團的數(shù)據(jù)規(guī)模。阿里并購之廣,幫助它得到一份堪稱完整的用戶數(shù)據(jù)地圖,涵蓋生活各個方面。
3、判斷數(shù)據(jù)關(guān)聯(lián),執(zhí)掌方向
阿里的模式?jīng)Q定了它賺不到各種國資背景銀行的大錢,只能賺賺小錢,但這正是國內(nèi)缺乏的銷售式銀行。阿里集團建立的數(shù)據(jù)和信用評價體系平臺,為阿里金融提供大量商家和消費者信息,這是阿里金融的核心地帶,是商業(yè)銀行無法企及的部分。這些數(shù)據(jù)為小微金融提供良好的業(yè)務(wù)支撐,這也是銀行無法做到的。阿里運用大數(shù)據(jù)關(guān)聯(lián)性,在金融領(lǐng)域扮演了越來越重要的角色,隨著余額寶的出現(xiàn),更暴露了阿里企圖占據(jù)每一分剩余資金的野心。2008年,阿里通過分析買家詢盤數(shù)急劇下滑,預(yù)測一場金融危機的到來,阿里逃過2008年危機,率先突出重圍。
首先,在大數(shù)據(jù)路上,我們不得不考慮投入產(chǎn)出比,如何能使其最大化。阿里的大數(shù)據(jù)收集與分析技術(shù)其實十分成熟,種類多,應(yīng)用廣,只是投資巨大。阿里投入數(shù)據(jù)和信用體系平臺,支撐金融體系,再加上近兩年阿里集團對外擴張步子過大,資金消耗過多,穩(wěn)妥的走路和降低成本勢在必行。資金得到周轉(zhuǎn),企業(yè)穩(wěn)步前進時,開始著手長期效益的投資。
其次,保護隱私要與收集數(shù)據(jù)并重。近些天我們都有體會,淘寶也會根據(jù)用戶最近搜索記錄,推薦給用戶相同相似產(chǎn)品。如何保護好數(shù)據(jù)隱私,成為當下熱點討論問題。每個數(shù)據(jù)分析部門,都要提高防火墻的安全系數(shù),設(shè)立專門的小組,來討論“什么數(shù)據(jù)可以用,什么數(shù)據(jù)不能用,什么數(shù)據(jù)必須在何種條件下才可以使用”。這樣商家可以免去競爭對手盜用,同時保護了消費者隱私不受侵犯。
最后,數(shù)據(jù)科學家早已被各商業(yè)領(lǐng)導者看中,然后招聘結(jié)果卻往往不如意。支付寶用戶價值創(chuàng)新中心的負責人秦予表示,“國內(nèi)不缺數(shù)據(jù)挖掘人才,但很難找到數(shù)據(jù)科學家”。公司在招聘中除了提供必要物質(zhì)條件,還要給予人才廣闊的發(fā)展空間。創(chuàng)新對于電商領(lǐng)域是致命的,要讓他們把整個數(shù)據(jù)“玩起來”,而并非算出來。大數(shù)據(jù)在未來成為一種根本性資源,大數(shù)據(jù)科學家是建設(shè)這種資源的主要動力。
大多數(shù)企業(yè)都已經(jīng)認識到“大數(shù)據(jù)”改善決策流程和業(yè)務(wù)成效的潛能,但他們卻不知道該如何入手。調(diào)查顯示,各行各業(yè)、全球各地的組織都已經(jīng)開始采取一種注重實效的方式開展“大數(shù)據(jù)”工作。雖然這些組織大多還處于早期接受階段,但其中的佼佼者已經(jīng)開始從“大數(shù)據(jù)”項目中獲得巨大的價值。為了迎接即將到來的大數(shù)據(jù)時代,各大互聯(lián)網(wǎng)公司都在爭分奪秒。大數(shù)據(jù)時代,掌握數(shù)據(jù)就是掌握財富。
[1]崔婧.阿里玩大數(shù)據(jù)[J].中國經(jīng)濟和信息化,2013,4:36~41.
[2]焦麗莎.云計算應(yīng)用落地 阿里“掘金”大數(shù)據(jù)[J].中國經(jīng)濟時報, 2012,12.
[3]蔡君.大數(shù)據(jù):從全新的角度挖掘數(shù)據(jù)價值[J].通訊世界,2013,08: 19~20.