■呂珊 孫瓊
互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)、大數(shù)據(jù)等技術(shù)的普及,為高鐵網(wǎng)絡(luò)大數(shù)據(jù)的發(fā)展提供了良好的孕育土壤?;诟哞F網(wǎng)絡(luò)大數(shù)據(jù)是通過應(yīng)用信息和通信技術(shù)來開發(fā)、收集和使用來自網(wǎng)絡(luò)、物理基礎(chǔ)設(shè)施等平臺(tái)的數(shù)據(jù),以提高組織效率、旅客體驗(yàn)和高鐵發(fā)展可持續(xù)性。隨著高鐵網(wǎng)絡(luò)大數(shù)據(jù)的積累和大數(shù)據(jù)技術(shù)的應(yīng)用,利用大數(shù)據(jù)分析手段和方法進(jìn)行旅客出行規(guī)劃成為高鐵研究發(fā)展的新方向。
高鐵網(wǎng)絡(luò)大數(shù)據(jù)是指將大數(shù)據(jù)技術(shù)應(yīng)用于高鐵行業(yè)運(yùn)營(yíng)中,不只是數(shù)據(jù)采集技術(shù)、大數(shù)據(jù)分析技術(shù)和統(tǒng)計(jì)預(yù)測(cè)技術(shù)[1],還包括將大數(shù)據(jù)思想和概念應(yīng)用于高鐵行業(yè)。從更深層次的角度來看,數(shù)據(jù)將從傳統(tǒng)的報(bào)告和統(tǒng)計(jì)數(shù)據(jù)分析轉(zhuǎn)換為智能、準(zhǔn)確、聯(lián)網(wǎng)和協(xié)作的流程,從傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)分析到非結(jié)構(gòu)化數(shù)據(jù)挖掘的流程,將從有限的數(shù)據(jù)轉(zhuǎn)換為具有更大維度、更細(xì)粒度的大量數(shù)據(jù)以及大量的模型和形狀。
以云計(jì)算、物聯(lián)網(wǎng)、虛擬現(xiàn)實(shí)以及大數(shù)據(jù)和智能管理系統(tǒng)等其他技術(shù)為代表的先進(jìn)技術(shù)的應(yīng)用為基于高鐵出行的旅客信息管理的發(fā)展做出了貢獻(xiàn)。這項(xiàng)技術(shù)在高鐵部門中的應(yīng)用已啟動(dòng)了鐵路內(nèi)部各個(gè)區(qū)域的知識(shí)轉(zhuǎn)化、開發(fā)過程,從而提高了高鐵建設(shè)的整體水平?!爸悄堋辈粌H是現(xiàn)代設(shè)備的智能使用,也是對(duì)全部工作人員智慧化的發(fā)掘。
基于高鐵網(wǎng)絡(luò)的大數(shù)據(jù)來源渠道豐富,以互聯(lián)網(wǎng)和社交媒體為核心數(shù)據(jù)來源,另有部分來自政府服務(wù)和企業(yè)運(yùn)營(yíng)平臺(tái)。從數(shù)據(jù)收集的角度來看,大多數(shù)研究過程都使用相對(duì)低價(jià)且便捷的互聯(lián)網(wǎng)和社交媒體。然而,由于諸如個(gè)人隱私或商業(yè)秘密之類的原因,從政府機(jī)構(gòu)和企業(yè)獲取數(shù)據(jù)并不容易。從數(shù)據(jù)處理的角度來看,由于接收到的大部分大型高鐵出行數(shù)據(jù)都是半結(jié)構(gòu)化的圖像、語音和視頻,因此處理過程變得更加復(fù)雜,容易造成處理結(jié)果的準(zhǔn)確性下降。
在云計(jì)算、物聯(lián)網(wǎng)等技術(shù)的引領(lǐng)下,高鐵網(wǎng)絡(luò)大數(shù)據(jù)研究涉及了計(jì)算機(jī)科學(xué)、地理學(xué)、統(tǒng)計(jì)學(xué)等多學(xué)科的、綜合性的研究工具和方法,具有研究工具和方法多樣化特點(diǎn)。依托于計(jì)算機(jī)科學(xué)的研究工具,主要以數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)技術(shù)的應(yīng)用為核心。將數(shù)據(jù)挖掘技術(shù)應(yīng)用于高鐵和旅游業(yè),可深挖高價(jià)值的信息、探索消費(fèi)者旅行意愿、為旅客優(yōu)化出行線路、推薦旅游項(xiàng)目和目的地等[1]。借助于MapReduce 的計(jì)算框架,Hadoop、PUMA、Cosmos 等運(yùn)算器,保障了高鐵網(wǎng)絡(luò)大數(shù)據(jù)分析的精準(zhǔn)性和有效性。在地理學(xué)相關(guān)的工具應(yīng)用上,主要用到了GPS 技術(shù)和GIS 技術(shù),研究旅客需求[2]、旅游交通[3]、旅游流[4]等。在基于統(tǒng)計(jì)學(xué)的工具和方法開展研究時(shí),通常將計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)與之結(jié)合,用于估計(jì)、預(yù)測(cè)、聚類和關(guān)聯(lián)分析、多元統(tǒng)計(jì)分析、時(shí)間序列分析、復(fù)雜網(wǎng)絡(luò)分析、模糊擬合分析等[5]。
高鐵網(wǎng)絡(luò)大數(shù)據(jù)分析系統(tǒng)是在大數(shù)據(jù)算法和模型的基礎(chǔ)上開發(fā)的。它可以基于海量交通主數(shù)據(jù)、動(dòng)態(tài)監(jiān)控?cái)?shù)據(jù)、系統(tǒng)運(yùn)營(yíng)數(shù)據(jù)和互聯(lián)網(wǎng)數(shù)據(jù)為政府、相關(guān)企業(yè)以及游客提供挖掘、分析功能,從而提高鐵路管理部門的行業(yè)監(jiān)管能力,促進(jìn)企業(yè)精準(zhǔn)營(yíng)銷效能的提升。該系統(tǒng)主要包括基本信息管理、旅客流量概況分析、準(zhǔn)營(yíng)銷分析、目的地流量分析、游客出行特征分析,目的地關(guān)聯(lián)影響分析,交通出行指標(biāo)分析等功能[6]。
高鐵網(wǎng)絡(luò)大數(shù)據(jù)系統(tǒng)不僅限于將下一代通信網(wǎng)絡(luò)技術(shù)(如云計(jì)算和物聯(lián)網(wǎng))應(yīng)用到專用工具以及巧妙的項(xiàng)目和服務(wù)管理方法上,使用各種高新技術(shù)和設(shè)備。由于智能出行的標(biāo)準(zhǔn)是確保交通行業(yè)的可持續(xù)發(fā)展,同時(shí)考慮到旅客的需求和高鐵部門的管理需求。因而,諸如物聯(lián)網(wǎng)和云計(jì)算技術(shù)之類的下一代信息技術(shù)只是完成智能出行的途徑和手段,而不是目標(biāo)。
現(xiàn)階段很多交通部門相互之間及高鐵內(nèi)部每個(gè)部門系統(tǒng)相互之間的團(tuán)結(jié)互助體制還未完善,外部獨(dú)立性和內(nèi)部分散性相對(duì)較大。這種情況不僅僅主要在協(xié)作的業(yè)務(wù)過程中表現(xiàn)出來,而且也發(fā)生在信息交換和資源共享中。這會(huì)導(dǎo)致整個(gè)組織服務(wù)項(xiàng)目的效率低下,陷入無法應(yīng)對(duì)乘客的問題、及時(shí)解決旅客難題以及組織發(fā)展動(dòng)力不足等困境。因此,實(shí)現(xiàn)基于高鐵網(wǎng)絡(luò)的大數(shù)據(jù)發(fā)展須首先完成信息資源的共享。
數(shù)據(jù)收集和監(jiān)控是基于大數(shù)據(jù)的高鐵網(wǎng)絡(luò)促進(jìn)智能旅游發(fā)展的基礎(chǔ)。通常在同一時(shí)間進(jìn)行數(shù)據(jù)收集和監(jiān)視活動(dòng)。通常包括以下幾種數(shù)據(jù)收集方法:第一,自主收集。數(shù)據(jù)收集是通過構(gòu)建基站和鋪設(shè)點(diǎn)來進(jìn)行的。其次,數(shù)據(jù)集成。一方面,數(shù)據(jù)可通過業(yè)務(wù)處理系統(tǒng)(12306平臺(tái)、火車票達(dá)人等)、電信運(yùn)營(yíng)商(移動(dòng)、聯(lián)通等)、OTA(同程、攜程等)和目的地公司(如景區(qū)、酒店、碼頭等)的處理系統(tǒng)進(jìn)行數(shù)據(jù)集成;另一方面還可借助百度搜索等搜索引擎、社交化網(wǎng)絡(luò)、網(wǎng)絡(luò)日志、微博、手機(jī)游系統(tǒng)等獲取部分?jǐn)?shù)據(jù)[7]。第三,數(shù)據(jù)共享。與鐵路、公安、旅游、銀聯(lián)等部門實(shí)現(xiàn)旅客出行數(shù)據(jù)的強(qiáng)關(guān)聯(lián)。當(dāng)數(shù)據(jù)樣本足夠豐富時(shí),可以將流量控制在特定區(qū)域中的特定點(diǎn)。如今,無論是城市還是景區(qū),數(shù)據(jù)收集方法都比較完善和綜合,數(shù)據(jù)收集和監(jiān)視也正在成為管理的基本內(nèi)容。
數(shù)據(jù)的挖掘和分析是基于大數(shù)據(jù)的高鐵網(wǎng)絡(luò)智能出行推進(jìn)的依據(jù)。由大數(shù)據(jù)驅(qū)動(dòng)的高鐵網(wǎng)絡(luò)智能出行服務(wù)于提取和分析有關(guān)旅客屬性、旅行行為、消費(fèi)者交易、出行目的地等數(shù)據(jù),為營(yíng)銷決策和精準(zhǔn)推送提供數(shù)據(jù)支撐。數(shù)據(jù)收集僅需要技術(shù),而提取和分析則需要技術(shù)和市場(chǎng)敏感性。從大量大數(shù)據(jù)中提取和可視化數(shù)據(jù)結(jié)果是實(shí)現(xiàn)大數(shù)據(jù)價(jià)值的關(guān)鍵一步。借助旅客出行大數(shù)據(jù)可視化方式,準(zhǔn)確、及時(shí)地獲取和了解每日的訂單數(shù)量、內(nèi)容,分析客源地等信息。由此,從全局的角度來看,一方面可以看到全國(guó)客流分布行為的整體趨勢(shì),另一方面還可以根據(jù)數(shù)據(jù)和預(yù)期結(jié)果的偏差,引導(dǎo)市場(chǎng)中心更好地調(diào)整營(yíng)銷策略,提升績(jī)效。
高鐵網(wǎng)絡(luò)大數(shù)據(jù)的數(shù)據(jù)洞察和指導(dǎo)功能,可用于進(jìn)一步指導(dǎo)高鐵網(wǎng)絡(luò)項(xiàng)目未來的建設(shè)與發(fā)展。通過數(shù)據(jù)洞察,深入梳理和分析所獲得數(shù)據(jù),更加精準(zhǔn)地把握市場(chǎng)的發(fā)展態(tài)勢(shì),以及了解本地發(fā)展中可能存在的問題。如基于用戶畫像功能,可以加強(qiáng)對(duì)性別比例、消費(fèi)偏好、用戶軌跡、出行習(xí)慣等的判斷,深化對(duì)目的地和目的地產(chǎn)品的指導(dǎo)與規(guī)劃。因而,所謂的數(shù)據(jù)指導(dǎo)即通過數(shù)據(jù)洞察結(jié)果進(jìn)行的就下一步發(fā)展、改善方向提出建議,明確下一步發(fā)展目標(biāo)及重點(diǎn)的過程。
高鐵網(wǎng)絡(luò)大數(shù)據(jù)以數(shù)據(jù)為中心,以通信網(wǎng)絡(luò)為支撐,通過終端接口開放、智能化管理的多樣化高鐵服務(wù)網(wǎng)絡(luò),為旅客管理、旅客服務(wù)、旅游營(yíng)銷等領(lǐng)域提供服務(wù)。高鐵大數(shù)據(jù)包括數(shù)據(jù)采集和檢測(cè)、數(shù)據(jù)挖掘和分析、數(shù)據(jù)洞察和指導(dǎo)三個(gè)步驟。數(shù)據(jù)的采集和監(jiān)測(cè)是基于大數(shù)據(jù)的高鐵網(wǎng)絡(luò)智能出行推進(jìn)的基礎(chǔ),數(shù)據(jù)采集一般有自主采集、數(shù)據(jù)集成、數(shù)據(jù)共享三種方式。數(shù)據(jù)的挖掘和分析是基于大數(shù)據(jù)的高鐵網(wǎng)絡(luò)智能出行推進(jìn)的依據(jù)?;诖髷?shù)據(jù)的高鐵網(wǎng)絡(luò)智能出行即通過對(duì)旅客屬性、旅客行為、消費(fèi)交易、旅行目的地等數(shù)據(jù)進(jìn)行挖掘和分析,為市場(chǎng)營(yíng)銷決策和精準(zhǔn)推送提供數(shù)據(jù)支持。對(duì)數(shù)據(jù)的深入了解和引導(dǎo)為旅游目的的下一步發(fā)展提供方向?;跀?shù)據(jù)洞察功能,進(jìn)一步增強(qiáng)數(shù)據(jù)挖掘和分析能力,以實(shí)現(xiàn)對(duì)市場(chǎng)趨勢(shì)和本地發(fā)展問題的及時(shí)了解和精準(zhǔn)把控。