梁山清 李博
摘要:通過(guò)八爪魚(yú)數(shù)據(jù)采集軟件,爬取部分加油站位置信息,并將Spark2大數(shù)據(jù)平臺(tái)連接到貨運(yùn)車(chē)輛的北斗/GPS導(dǎo)航定位數(shù)據(jù)庫(kù)。利用大數(shù)據(jù)平臺(tái)的組件搭建大數(shù)據(jù)分析流程,對(duì)貨車(chē)途經(jīng)各加油站的時(shí)空規(guī)律進(jìn)行多維分析。根據(jù)大數(shù)據(jù)分析結(jié)果,提出加油站競(jìng)爭(zhēng)對(duì)手研判、加油站位置調(diào)整輔助決策、貨車(chē)加油規(guī)律挖掘、客戶黏性分析、客源地分析等具體應(yīng)用場(chǎng)景,對(duì)大數(shù)據(jù)技術(shù)在加油站業(yè)務(wù)推廣方面的應(yīng)用進(jìn)行了探索。
關(guān)鍵詞:Spark2大數(shù)據(jù)平臺(tái);多維分析;精準(zhǔn)營(yíng)銷(xiāo);大數(shù)據(jù)技術(shù)
中圖分類號(hào):TP311.5; U495文獻(xiàn)標(biāo)志碼:A文章編號(hào):1008-1739(2021)06-64-4
0引言
大數(shù)據(jù)發(fā)展至今,已經(jīng)大量應(yīng)用于金融、電商及零售等行業(yè)的精準(zhǔn)營(yíng)銷(xiāo)場(chǎng)景[1-2],成為了企業(yè)營(yíng)銷(xiāo)創(chuàng)新的利器。大數(shù)據(jù)營(yíng)銷(xiāo)通過(guò)大數(shù)據(jù)技術(shù)來(lái)處理多源的企業(yè)數(shù)據(jù),將分析和挖掘結(jié)果應(yīng)用于企業(yè)線上、線下的營(yíng)銷(xiāo)活動(dòng)。這種營(yíng)銷(xiāo)模式幫助企業(yè)真正了解用戶、洞察用戶,對(duì)用戶進(jìn)行差異化、定制化的各類營(yíng)銷(xiāo)活動(dòng),解決企業(yè)營(yíng)銷(xiāo)觸達(dá)和活動(dòng)閉環(huán)分析,從而找到合適的用戶和時(shí)間,實(shí)現(xiàn)“千人千策”的精準(zhǔn)營(yíng)銷(xiāo)模式。
對(duì)于石油行業(yè),利用大數(shù)據(jù)為銷(xiāo)售板塊營(yíng)銷(xiāo)創(chuàng)新是必然趨勢(shì)。項(xiàng)目車(chē)輛位置服務(wù)平臺(tái)利用北斗/GPS衛(wèi)星定位技術(shù)對(duì)各類交通車(chē)輛提供綜合位置監(jiān)控[3-5]管理服務(wù)。本文依托大數(shù)據(jù)平臺(tái),將車(chē)輛位置服務(wù)平臺(tái)的貨運(yùn)車(chē)輛數(shù)據(jù)遷移到Hadoop分布式文件系統(tǒng),運(yùn)用大數(shù)據(jù)分析與挖掘算法對(duì)貨運(yùn)車(chē)輛數(shù)據(jù)進(jìn)行大數(shù)據(jù)分析和挖掘,實(shí)現(xiàn)針對(duì)加油站業(yè)務(wù)的大數(shù)據(jù)精準(zhǔn)營(yíng)銷(xiāo)。
1大數(shù)據(jù)平臺(tái)
大數(shù)據(jù)平臺(tái)采用Hadoop2.x的技術(shù)體系[6]進(jìn)行架構(gòu)設(shè)計(jì)[7-9],架構(gòu)圖如圖1所示。
大數(shù)據(jù)平臺(tái)包括數(shù)據(jù)源層、數(shù)據(jù)采集與存儲(chǔ)層、數(shù)據(jù)分析與挖掘?qū)?、?shù)據(jù)展示層和數(shù)據(jù)管理層共五部分。其中,數(shù)據(jù)源層是存在于關(guān)系數(shù)據(jù)庫(kù)PostgresSQL中的貨運(yùn)車(chē)輛業(yè)務(wù)數(shù)據(jù)和八爪魚(yú)采集器爬取的加油站的位置數(shù)據(jù);數(shù)據(jù)采集與存儲(chǔ)層將數(shù)據(jù)源的數(shù)據(jù)遷移并存儲(chǔ)于分布式文件系統(tǒng)HDFS中;數(shù)據(jù)分析與挖掘?qū)踊赮ARN計(jì)算架構(gòu),協(xié)同Spark2,Mahout,Avro,Ooize,Solr等組件,對(duì)貨運(yùn)車(chē)輛數(shù)據(jù)進(jìn)行分析和挖掘;數(shù)據(jù)展示層對(duì)大數(shù)據(jù)分析結(jié)果進(jìn)行圖形化展現(xiàn);數(shù)據(jù)管理層負(fù)責(zé)整個(gè)系統(tǒng)的應(yīng)用程序協(xié)調(diào)、數(shù)據(jù)安全管理、系統(tǒng)運(yùn)行動(dòng)態(tài)監(jiān)控等任務(wù)。
1.1數(shù)據(jù)采集與存儲(chǔ)
本文運(yùn)用數(shù)據(jù)源組件將貨運(yùn)車(chē)輛數(shù)據(jù)從PostgreSQL數(shù)據(jù)庫(kù)抽取到大數(shù)據(jù)庫(kù)平臺(tái)Hive庫(kù),并存儲(chǔ)于HDFS分布式文件系統(tǒng)[10]。貨運(yùn)車(chē)輛數(shù)據(jù)主要包括行業(yè)信息、企業(yè)信息、分組信息、車(chē)輛信息、司機(jī)信息、SIM信息、入網(wǎng)信息、指令信息、日志信息、元數(shù)據(jù)信息、軌跡信息及狀態(tài)信息。其中,軌跡信息包括經(jīng)緯度、地址、時(shí)間、速度、方向、高程及油量等,狀態(tài)信息包括車(chē)輛狀態(tài)信息、報(bào)警狀態(tài)信息、車(chē)機(jī)狀態(tài)信息等。
運(yùn)用八爪魚(yú)數(shù)據(jù)采集軟件抽取百度地圖上若干個(gè)城市的加油站名稱、地址、經(jīng)緯度坐標(biāo)等數(shù)據(jù),并進(jìn)行了數(shù)據(jù)合并和初步處理,共1 200個(gè)加油站。從網(wǎng)上數(shù)據(jù)分析,大概有10 000個(gè)加油站,抽取量大概是實(shí)際情況的10%。
1.2數(shù)據(jù)預(yù)處理
受衛(wèi)星定位終端設(shè)備故障、信號(hào)不良、冷啟動(dòng)等各種客觀因素的影響,采集的北斗/GPS數(shù)據(jù)存在一定的誤差。本文通過(guò)均值濾波、速度濾波、航向角檢測(cè)等方法來(lái)對(duì)數(shù)據(jù)進(jìn)行簡(jiǎn)單的預(yù)處理操作,剔除無(wú)效數(shù)據(jù)。
1.3數(shù)據(jù)分析與挖掘
數(shù)據(jù)分析與挖掘?qū)硬捎闷脚_(tái)算法庫(kù)自帶的算法模塊進(jìn)行數(shù)據(jù)的并行化計(jì)算和分析,主要包含數(shù)據(jù)預(yù)處理與數(shù)據(jù)分析挖掘。
1.4數(shù)據(jù)可視化展示
數(shù)據(jù)展示層[11]將平臺(tái)分析的部分結(jié)果以直觀的形式進(jìn)行展示。平臺(tái)可以根據(jù)UE的柱狀圖、餅狀圖、折線、雷達(dá)圖、地理分布圖、氣泡圖等多種圖表化元素對(duì)上述分析結(jié)果進(jìn)行可視化展示。
2大數(shù)據(jù)分析
2.1熱門(mén)加油站分析
通過(guò)計(jì)算一段時(shí)間內(nèi)平臺(tái)大數(shù)據(jù)車(chē)輛在各加油站附近的軌跡點(diǎn)數(shù)量[12],結(jié)合自身加油站業(yè)務(wù)量,分析各加油站潛在的業(yè)務(wù)增長(zhǎng)空間,輔助加油站經(jīng)營(yíng)管理團(tuán)隊(duì)及時(shí)調(diào)整自身經(jīng)營(yíng)策略。
2.2加油站位置分析
通過(guò)分析一段時(shí)間內(nèi)的貨車(chē)軌跡中心的地理坐標(biāo)動(dòng)態(tài)變化規(guī)律,與加油站分布空間特征進(jìn)行對(duì)比,為加油站經(jīng)營(yíng)管理團(tuán)隊(duì)動(dòng)態(tài)調(diào)整加油站的位置和數(shù)量提供數(shù)據(jù)支撐。
2.3加油高峰時(shí)段分析
分析各加油站在全天各個(gè)小時(shí)的加油頻次,一方面輔助加油站調(diào)節(jié)員工工作時(shí)段,另一方面輔助加油站制定不同時(shí)段的優(yōu)惠策略,為業(yè)務(wù)不飽滿時(shí)段吸引更多客戶。
2.4貨車(chē)軌跡聚類分析
通過(guò)對(duì)平臺(tái)上貨車(chē)經(jīng)緯度坐標(biāo)信息進(jìn)行聚類分析[13-16],確定軌跡中心坐標(biāo),計(jì)算平臺(tái)貨車(chē)在一定時(shí)間段(天、周、月)內(nèi)的軌跡活動(dòng)中心,動(dòng)態(tài)挖掘熱門(mén)地理位置,從而輔助加油站經(jīng)營(yíng)管理團(tuán)隊(duì)精確掌握商業(yè)發(fā)展規(guī)律,及時(shí)調(diào)整經(jīng)營(yíng)方案和策略。
根據(jù)每天的分析結(jié)果,可以分析聚類中心[17-18]的動(dòng)態(tài)變化。加油站經(jīng)營(yíng)管理團(tuán)隊(duì)可以根據(jù)軌跡中心變化規(guī)律,動(dòng)態(tài)調(diào)整加油站的促銷(xiāo)策略。
2.5貨車(chē)加油規(guī)律分析
貨車(chē)加油規(guī)律分析如下:
(1)貨車(chē)停靠加油站頻次分析
計(jì)算平臺(tái)大數(shù)據(jù)車(chē)輛在各加油站的加油頻次,分析各加油站受貨車(chē)客戶歡迎程度。
(2)貨車(chē)途經(jīng)聚類中心分析
分析每輛貨車(chē)所途經(jīng)的聚類中心,實(shí)現(xiàn)車(chē)過(guò)留痕。具體來(lái)說(shuō),通過(guò)計(jì)算每輛車(chē)在各聚類中心的軌跡數(shù)量,分析貨車(chē)活動(dòng)的空間規(guī)律,輔助加油站經(jīng)營(yíng)管理團(tuán)隊(duì)實(shí)現(xiàn)對(duì)客戶的精準(zhǔn)營(yíng)銷(xiāo)。
(3)貨車(chē)途經(jīng)加油站分析
分析每輛貨車(chē)所途經(jīng)的加油站,輔助加油站精準(zhǔn)定位潛在客戶。
2.6客戶粘性分析
通過(guò)分析平臺(tái)貨車(chē)軌跡停留歷史,根據(jù)用戶軌跡點(diǎn)的分布,可以為各加油站的用戶分別建立老客戶、新客戶、中間客戶及流失客戶等用戶標(biāo)簽。
對(duì)不同類型的用戶采取不同的營(yíng)銷(xiāo)策略,可以輔助加油站經(jīng)營(yíng)管理團(tuán)隊(duì)建立精準(zhǔn)的成長(zhǎng)型會(huì)員體系,最大優(yōu)惠匹配最高價(jià)值用戶,分層營(yíng)銷(xiāo),從而將新客戶過(guò)渡為中間客戶,中間客戶過(guò)渡為老客戶,老客戶被鞏固,并減少流失客戶??蛻粽承苑治鼋⒌木珳?zhǔn)客戶成長(zhǎng)體系,可以有效提高營(yíng)銷(xiāo)效率。
2.7客源地分析
分析每個(gè)加油站的客戶歸屬地結(jié)構(gòu),為加油站勾勒清晰的客戶地域畫(huà)像,分析不同地區(qū)司機(jī)的社會(huì)活動(dòng)趨勢(shì)[19]。
3分析結(jié)果與應(yīng)用賦能
3.1加油站競(jìng)爭(zhēng)對(duì)手研判
運(yùn)營(yíng)人員可以根據(jù)數(shù)據(jù)分析結(jié)果研判出不同城市的熱門(mén)加油站點(diǎn),實(shí)時(shí)鎖定近距離競(jìng)爭(zhēng)對(duì)手,再結(jié)合競(jìng)爭(zhēng)對(duì)手的營(yíng)銷(xiāo)策略,及時(shí)調(diào)整自身營(yíng)銷(xiāo)戰(zhàn)術(shù),精準(zhǔn)拉回流失客戶。
3.2加油站位置調(diào)整輔助決策
加油站位置動(dòng)態(tài)分析結(jié)果如表1所示。
通過(guò)分析不同季度、年度的加油站數(shù)目變化趨勢(shì),運(yùn)營(yíng)人員可以根據(jù)表中數(shù)據(jù)分析不同地理范圍內(nèi)的加油站密級(jí)程度,從而為現(xiàn)有加油站位置調(diào)整和新建加油站的選址提供精準(zhǔn)的數(shù)據(jù)支撐。
3.3加油高峰時(shí)段鎖定
運(yùn)營(yíng)人員可以通過(guò)表1精準(zhǔn)了解各加油站的高頻工作時(shí)段,可以采取相應(yīng)措施,加大低頻工作時(shí)段的加油優(yōu)惠力度,并動(dòng)態(tài)調(diào)整加油站員工工作時(shí)段,從而在增加加油站營(yíng)業(yè)額的同時(shí),減少人力投入。
3.4貨車(chē)整體分布態(tài)勢(shì)挖掘
通過(guò)分析貨車(chē)軌跡中心,運(yùn)營(yíng)人員可以研判出平臺(tái)貨車(chē)的活躍范圍,根據(jù)此部分?jǐn)?shù)據(jù)及時(shí)掌握加油站周邊車(chē)輛的總體態(tài)勢(shì),及時(shí)調(diào)整營(yíng)銷(xiāo)策略。
3.5貨車(chē)加油規(guī)律挖掘
運(yùn)營(yíng)人員可以根據(jù)貨車(chē)途徑聚類中心和加油站的分析結(jié)果精準(zhǔn)掌握某一時(shí)間段內(nèi)途徑某一地理范圍內(nèi)的具體情況,從而結(jié)合自己團(tuán)隊(duì)的加油站集群的地理分布,做出最優(yōu)的營(yíng)銷(xiāo)方案。
3.6基于客戶粘性分析的精準(zhǔn)客戶成長(zhǎng)體系建設(shè)
各加油站老客戶分析結(jié)果如表2所示,新客戶分析結(jié)果如表3所示,中間客戶分析結(jié)果如表4所示。
通過(guò)分析以上表格,各加油站運(yùn)營(yíng)人員可以精準(zhǔn)區(qū)分出不同粘性的客戶群體,從而采取精確的營(yíng)銷(xiāo)策略,在減少老客戶流失的同時(shí),推動(dòng)新客戶過(guò)渡為回頭客,中間客戶成長(zhǎng)為老客戶。
3.7基于客源地分析的社會(huì)化營(yíng)銷(xiāo)輔助決策
運(yùn)營(yíng)人員可以根據(jù)客源地分析結(jié)果掌握自身加油站網(wǎng)絡(luò)的貨車(chē)客戶來(lái)源地,并以此來(lái)推斷不同客戶的社會(huì)行為習(xí)慣,為采取不同營(yíng)銷(xiāo)手段提供輔助參考。比如,四川人愛(ài)吃辣,在營(yíng)銷(xiāo)過(guò)程中可以對(duì)四川牌照的貨車(chē)采取加油積分兌換辣椒醬的策略。
4結(jié)束語(yǔ)
本文基于大數(shù)據(jù)平臺(tái),將存儲(chǔ)于車(chē)輛位置服務(wù)平臺(tái)傳統(tǒng)數(shù)據(jù)庫(kù)的貨運(yùn)車(chē)輛數(shù)據(jù)遷移到分布式文件系統(tǒng),并結(jié)合爬取的加油站數(shù)據(jù),進(jìn)行了加油站大數(shù)據(jù)的分析和挖掘;設(shè)計(jì)并實(shí)現(xiàn)了一系列算法,對(duì)貨運(yùn)車(chē)輛和加油站數(shù)據(jù)進(jìn)行了多維分析,挖掘貨車(chē)加油的行為規(guī)律和特征。本文所做工作對(duì)于加油站運(yùn)營(yíng)人員實(shí)施精準(zhǔn)多樣的營(yíng)銷(xiāo)策略具有一定的實(shí)用價(jià)值和借鑒意義。
參考文獻(xiàn)
[1]林慶鵬.基于大數(shù)據(jù)挖掘的精準(zhǔn)營(yíng)銷(xiāo)策略研究[D].蘭州:蘭州理工大學(xué),2016.
[2]卓慧.大數(shù)據(jù)背景下成品油零售市場(chǎng)的精準(zhǔn)營(yíng)銷(xiāo)研究[D].南寧:廣西大學(xué),2017.
[3]陳敏偉.大數(shù)據(jù)技術(shù)在鐵路貨運(yùn)電子商務(wù)系統(tǒng)中的基本應(yīng)用研究[D].成都:西南交通大學(xué),2015.
[4]陳嬌娜.大數(shù)據(jù)驅(qū)動(dòng)下的高速公路交通運(yùn)行狀態(tài)評(píng)價(jià)與分析[D].西安:長(zhǎng)安大學(xué),2016:31-118.
[5]李洪烈,王倩,宋斌.衛(wèi)星通信導(dǎo)航在海上搜救的應(yīng)用[J].無(wú)線電工程,2017,47(6):15-19,37.
[6]曾憲宇.基于大數(shù)據(jù)技術(shù)的車(chē)輛監(jiān)控系統(tǒng)的優(yōu)化與實(shí)現(xiàn)[D].長(zhǎng)春:吉林大學(xué),2016:1-2.
[7] YAN X, ZHANG H, WU C. Research and Development of Intelligent Transportation Systems[C]//International Symposium on Distributed Computing and Applications To Business,Engineering & Science. Guilin:IEEE,2012: 321-327.
[8]朱進(jìn)云,陳堅(jiān),王德政.大數(shù)據(jù)架構(gòu)師指南[M].北京:清華大學(xué)出版社,2016:122-144.
[9] TURKINGTON G.Hadoop基礎(chǔ)教程[M].北京:人民郵電出版社,2014.
[10] WHITE T.Hadoop權(quán)威指南:大數(shù)據(jù)的存儲(chǔ)與分析[M].王海,華東,劉喻,等,譯.北京:清華大學(xué)出版社,2017.
[11]張新陽(yáng),孫夢(mèng)覺(jué),牛斌.大屏可視化技術(shù)在電力系統(tǒng)中的應(yīng)用研究[J].電力大數(shù)據(jù),2017,20(10):61-64.
[12] CAPRIOLO E,WAMPLER D,RUTHERGLEN J.Hive編程指南[M].曹坤,譯.北京:人民郵電出版社,2013.
[13] SEAN Owen,ROBIN Anil,TED Dunning,et al. Mahout實(shí)戰(zhàn)[M].王斌,韓冀中,萬(wàn)吉,譯.北京::人民郵電出版社, 2014:10-296.
[14]樊哲.Mahout算法解析與案例實(shí)戰(zhàn)[M].北京:機(jī)械工業(yè)出版社,2014.
[15]張亞茹.基于車(chē)聯(lián)網(wǎng)大數(shù)據(jù)分析的實(shí)時(shí)路況信息系統(tǒng)關(guān)鍵技術(shù)研究[D].南京:南京郵電大學(xué),2017:17-22.
[16] HAN Jiawei,KAMBER M,PEI Jian.數(shù)據(jù)挖掘:概念與技術(shù)[M].范明,孟小峰,譯.北京:機(jī)械工業(yè)出版社,2012.
[17]趙衛(wèi)中,馬慧芳,傅燕翔,等.基于云計(jì)算平臺(tái)Hadoop的并行k-means聚類算法設(shè)計(jì)研究[J].計(jì)算機(jī)科學(xué),2011,38(10):166-168,176.
[18]甘波.基于海量物流軌跡數(shù)據(jù)的分析挖掘系統(tǒng)[D].武漢:武漢理工大學(xué),2014.
[19]劉速,楊文軍.基于互聯(lián)網(wǎng)及大數(shù)據(jù)的加油站智能營(yíng)銷(xiāo)[J].信息技術(shù)與標(biāo)準(zhǔn)化,2019(5):53-57.