孫偉軍
【摘 要】“十三五”期間,大數(shù)據(jù)寫入《交通運輸信息化規(guī)劃》,得到了有關(guān)部門的大力推廣。同時,公路養(yǎng)護行業(yè)面對新形勢和新挑戰(zhàn),需要推進養(yǎng)護轉(zhuǎn)型和決策科學化,大數(shù)據(jù)是實現(xiàn)這兩個目標的有力工具。目前,公路養(yǎng)護行業(yè)響應國家和部委的號召,對大數(shù)據(jù)在本行業(yè)的應用做了積極探索,但是筆者工作中發(fā)現(xiàn)這些嘗試不符合大數(shù)據(jù)本身的特點。本文闡述部分大數(shù)據(jù)應用的成功案例和公路養(yǎng)護面對的現(xiàn)狀,通過對成功案例的分析,探討“大數(shù)據(jù)”這一理念如何與公路養(yǎng)護有機結(jié)合。
【關(guān)鍵詞】大數(shù)據(jù);公路養(yǎng)護管理;預防性養(yǎng)護;全樣本分析
0 引言
隨著大數(shù)據(jù)進入公眾視野,引起了媒體的熱議,各行業(yè)均在探討大數(shù)據(jù)的應用,部分行業(yè)因為先天優(yōu)勢和行業(yè)特點,已經(jīng)開始嘗試使用大數(shù)據(jù)。公路養(yǎng)護行業(yè)作為一個傳統(tǒng)行業(yè),如何利用大數(shù)據(jù)這一新興的理念為公路養(yǎng)護事業(yè)服務是即將面對的難題。
1 大數(shù)據(jù)的概念
“Big Data”即大數(shù)據(jù),是指海量數(shù)據(jù),這里的大是相對概念,不是絕對概念,并沒有明確定義數(shù)據(jù)量達到某一量級才能稱為大數(shù)據(jù),大數(shù)據(jù)是相對過去隨機抽樣所取得的小樣本而言。通常來講,大數(shù)據(jù)指數(shù)據(jù)量大到傳統(tǒng)的分析手段無法應對的復雜數(shù)據(jù)集合。
2 大數(shù)據(jù)現(xiàn)階段的應用
大數(shù)據(jù)的先行者是在前二十年的互聯(lián)網(wǎng)浪潮中崛起的互聯(lián)網(wǎng)公司,國外的有谷歌、臉書、亞馬遜等,國內(nèi)的有百度、阿里巴巴、騰訊、京東等,這些互聯(lián)網(wǎng)公司能夠比其他行業(yè)更早的應用大數(shù)據(jù),不是因為他們對新概念新技術(shù)更敏感,而是因為互聯(lián)網(wǎng)公司擁有更低成本的數(shù)據(jù)。
互聯(lián)網(wǎng)公司普遍的特點是面對公眾免費開放、每天巨大的訪問量、核心業(yè)務都在線上完成,互聯(lián)網(wǎng)公司普遍擁有以億為單位計算的用戶,這些用戶在互聯(lián)網(wǎng)上購物、搜索、發(fā)布信息的同時,海量的數(shù)據(jù)就已經(jīng)通過高速寬帶網(wǎng)絡進入各大互聯(lián)網(wǎng)公司的服務器,而這一過程的成本是由核心業(yè)務承擔的,阿里巴巴為了開展網(wǎng)上購物業(yè)務搭建了淘寶網(wǎng)、購置了服務器、向網(wǎng)絡運營商購買高速寬帶、還擁有上萬人的工程師團隊,巨額成本已經(jīng)由淘寶網(wǎng)的營收承擔,海量的數(shù)據(jù)只是額外驚喜。
信息的流動可以分為四個階段:信息的采集、信息的傳輸、信息的存儲、信息的處理,而互聯(lián)網(wǎng)公司前三個階段的成本近乎為零。正是這種巨大的成本優(yōu)勢才使得互聯(lián)網(wǎng)公司成為大數(shù)據(jù)的先行者。
而在第四個階段——數(shù)據(jù)處理階段,全世界的互聯(lián)網(wǎng)公司也在引入相關(guān)人才,構(gòu)建各自的技術(shù)平臺。以亞馬遜為例,利用收集到的用戶數(shù)據(jù),使用“商品到商品的協(xié)同過濾”算法構(gòu)建的個性化推薦系統(tǒng)。該系統(tǒng)提供了一種精準有效的定向營銷模式,支撐了亞馬遜三分之一的銷售額。國內(nèi)方面,以京東為例,內(nèi)部代號為青龍的物流系統(tǒng)可以做到預測業(yè)務量來提升資源調(diào)度的效率,通過對海量的交易數(shù)據(jù)分析,描繪出用戶畫像,實現(xiàn)未買先送的庫存前置,用戶在瀏覽某一類商品時,該商品已經(jīng)向用戶最近的倉儲中心前置配送,下單時,商品已經(jīng)到達距離用戶很近的地方。這種模式超越了傳統(tǒng)被動等待的物流模式,打造了配送速度遠超過其他物流公司的京東211、次日達等新的物流理念。
亞馬遜的推薦系統(tǒng)和京東的青龍系統(tǒng)都體現(xiàn)了大數(shù)據(jù)最核心的應用,那就是預測,通過預測來調(diào)度資源和做出合理決策從而創(chuàng)造價值。
需要注意的是,大數(shù)據(jù)分析不是算命占卜,這里的預測不是我們通常意義的精準預測,而是通過數(shù)據(jù)的相關(guān)性分析對各種可能性的預測。這種誤解導致大數(shù)據(jù)遭到很多人的批判。
3 公路養(yǎng)護管理面對的現(xiàn)狀
根據(jù)國務院頒布的《“十三五”現(xiàn)代綜合交通運輸體系發(fā)展規(guī)劃》,在“十三五”期間,高速公路網(wǎng)絡覆蓋常住人口20萬以上城市,公路通車里程達到500萬公里,其中高速公路通車里程15萬公里,農(nóng)村道路硬化率達到99%。至2020年,中國將要基本建成安全、便捷、高效、綠色的現(xiàn)代綜合交通運輸體系,部分地區(qū)和領域率先實現(xiàn)交通運輸現(xiàn)代化。
隨著國家行政體制改革、財稅體制改革進一步深化,面對發(fā)展新形勢和公眾出行的新需求,公路養(yǎng)護管理還存在一些短板和問題。隨著通路通車里程的急劇增長,養(yǎng)護管理壓力快速上升。根據(jù)交通部2016年公布的數(shù)據(jù),十三五期間預計公路通車里程增加42萬公里,高速公路通車里程增加3萬公里。2016年度,全國收費公路通行費總收入為4548.5億元。全國收費公路支出總額為8691.7 億元。其中,養(yǎng)護支出476.3億元,收支缺口進一步拉大。公路養(yǎng)護行業(yè)面對任務加重和資金緊張的雙重難題。
4 大數(shù)據(jù)帶給公路養(yǎng)護管理的變革
以往的養(yǎng)護管理決策,所使用的數(shù)據(jù)都是自身收集自身使用,而且數(shù)據(jù)采集成本高,也得不到充分的挖掘利用。管理決策嚴重依賴領導干部的個人經(jīng)驗,沒有科學依據(jù)。
公路養(yǎng)護管理面對新形勢和新挑戰(zhàn),需有推動養(yǎng)護轉(zhuǎn)型和科學決策。公路養(yǎng)護需要從發(fā)生病害后修補的被動模式,轉(zhuǎn)變?yōu)轭A防性養(yǎng)護的主動模式,從個人經(jīng)驗指導轉(zhuǎn)變?yōu)閿?shù)據(jù)分析指導。
大數(shù)據(jù),就是在新技術(shù)的支撐下,從傳統(tǒng)的隨機抽樣變?yōu)槿珮颖痉治?。?shù)據(jù)不再是精確統(tǒng)一,而是紛繁復雜。數(shù)據(jù)分析也不再追求因果關(guān)系,而是相關(guān)關(guān)系。數(shù)據(jù)來源由傳統(tǒng)的本行業(yè)本部門采集變?yōu)楦餍袠I(yè)各領域的數(shù)據(jù)開放共享,數(shù)據(jù)像商品一樣自由流動,從而打破數(shù)據(jù)的封閉和碎片化,降低數(shù)據(jù)采集的成本,使全樣本分析成為可能。
根據(jù)國外的研究結(jié)果,當公路處于健康狀態(tài)時,延長其使用壽命的費用,要遠低于公路技術(shù)狀況惡化后修復或重建的費用。執(zhí)行路面預防性養(yǎng)護策略的關(guān)鍵,是在適當?shù)臅r間、應用適用的技術(shù),在適宜的路面上進行養(yǎng)護作業(yè)。要完成這些精準的任務,必須要進行大量的前期工作,對路況進行診斷,要識別出隱性病害。但是在以往的技術(shù)條件下,使用傳統(tǒng)的分析手段,想要做出準確的判斷難度非常高,這也是交通部門大力推廣預防養(yǎng)護多年,卻收效甚微的原因。
通過海量數(shù)據(jù)的全樣本分析,我們可以得出公路(下轉(zhuǎn)第193頁)(上接第228頁)病害災害和各種影響因素的相關(guān)關(guān)系,從而預測病害災害發(fā)生的可能性,做到提前養(yǎng)護、精準養(yǎng)護和搶險快速響應,有效的降低養(yǎng)護成本和災害損失。endprint
5 目前大數(shù)據(jù)在公路養(yǎng)護行業(yè)的應用情況
最近幾年,大數(shù)據(jù)得到了極高的關(guān)注度,公路養(yǎng)護行業(yè)也在積極探索大數(shù)據(jù)和自身業(yè)務的結(jié)合。但目前來看,這些探索并不成功,主要原因有以下幾個方面:
5.1 對“大數(shù)據(jù)”沒有真正了解
對其特點一無所知,思維沒有從過去的小樣本轉(zhuǎn)變到全樣本,沿用傳統(tǒng)的結(jié)構(gòu)性數(shù)據(jù)庫,錄入的數(shù)據(jù)要求規(guī)范統(tǒng)一,排除了大量不規(guī)則不規(guī)范的數(shù)據(jù)信息,與大數(shù)據(jù)的根本理念——全樣本分析背道而馳。這種思維變革需要時間,畢竟對于多數(shù)IT行業(yè)從業(yè)者,大數(shù)據(jù)都是一個新鮮事物。
5.2 對大數(shù)據(jù)應用的成功案例沒有詳細研究
這些成功案例的公司如亞馬遜和京東都集中在互聯(lián)網(wǎng)領域,根本原因在于這一領域的信息流動成本更低。公路養(yǎng)護行業(yè)在推動大數(shù)據(jù)應用的過程中,完全忽略了成本因素,成本因素對新技術(shù)、新理念的推廣普及有至關(guān)重要的作用。在現(xiàn)階段,如何降低大數(shù)據(jù)應用的成本和利用大數(shù)據(jù)降低自身業(yè)務的成本,這兩點是需要首先考慮的。
5.3 缺乏數(shù)據(jù)挖掘分析的人才
即便是互聯(lián)網(wǎng)公司,如果只收集海量的數(shù)據(jù),而沒有有效的挖掘利用,不能對自身業(yè)務有所幫助,就無法產(chǎn)生價值。目前,這種人才奇缺,是互聯(lián)網(wǎng)巨頭們爭搶的目標。公路養(yǎng)護行業(yè)中,幾乎沒有懂得數(shù)據(jù)挖掘的人員,更缺乏能對公路養(yǎng)護管理和數(shù)據(jù)挖掘兼顧的人才。需要外部引入的同時,注重培養(yǎng)適應自身行業(yè)特點的人才。
6 結(jié)語
大數(shù)據(jù)不是孤立的,它是下一次信息浪潮的一部分,只有得到5G網(wǎng)絡、物聯(lián)網(wǎng)、數(shù)據(jù)產(chǎn)業(yè)鏈、云計算等技術(shù)和基礎設施的支撐,以遠低于傳統(tǒng)手段的成本采集海量的數(shù)據(jù),大數(shù)據(jù)分析才有數(shù)據(jù)可分析,才能稱之為大。大數(shù)據(jù)不是一種技術(shù),而是技術(shù)進步后新的數(shù)據(jù)分析理念、方法,它所對應的是使用了幾百年的隨機抽樣分析。這種方法在公路養(yǎng)護行業(yè)的實現(xiàn),需要等待上述各種技術(shù)和基礎設施的完善。
【參考文獻】
[1]李亞曼,崔樂樂.基于精準畫像的京東1小時達——“大數(shù)據(jù)與智慧物流”連載之四[J].物流技術(shù)與應用,2017,22(04):148-150.[2017-08-02].
[2]李鵬濤.大數(shù)據(jù)與智慧物流概述——“大數(shù)據(jù)與智慧物流”連載之一[J].物流技術(shù)與應用,2017,22(01):133-135.[2017-08-02].
[3]Linden G, Smith B, York J. Amazon.com Recommendations: Item-to-Item Collaborative Filtering[J].IEEE Internet Computing,2003,7(1):76-80.
[4]姚輝寧.基于預防性養(yǎng)護的高速公路路面管理系統(tǒng)研究[D].長安大學,2008.
[5]維克托·邁爾-舍恩伯格,肯尼斯·庫克耶.大數(shù)據(jù)時代[M].杭州:浙江人民出版社,2012.
[6]Jiawei Han,Micheline Kamber等.數(shù)據(jù)挖掘[M].北京:機械工業(yè)出版社,2012.
[責任編輯:朱麗娜]endprint