李得偉 張?zhí)煊?周瑋騰 尹浩東
(北京交通大學(xué)交通運(yùn)輸學(xué)院 北京 100044)
?
軌道交通大數(shù)據(jù)運(yùn)用現(xiàn)狀及發(fā)展趨勢(shì)研究
李得偉 張?zhí)煊?周瑋騰 尹浩東
(北京交通大學(xué)交通運(yùn)輸學(xué)院 北京 100044)
為了確保大數(shù)據(jù)在軌道交通領(lǐng)域規(guī)范運(yùn)用、良性發(fā)展,在總結(jié)大數(shù)據(jù)基本概念的基礎(chǔ)上,系統(tǒng)梳理軌道交通行業(yè)內(nèi)大數(shù)據(jù)的基本特點(diǎn)、數(shù)據(jù)類型、主要內(nèi)容、處理流程及關(guān)鍵技術(shù),并選擇其中的某個(gè)典型專業(yè),總結(jié)軌道交通大數(shù)據(jù)在統(tǒng)計(jì)分析、應(yīng)急輔助決策、乘客出行誘導(dǎo)、客流預(yù)測(cè)和調(diào)度管理等方面的運(yùn)用現(xiàn)狀。最后,闡述大數(shù)據(jù)在軌道交通應(yīng)用方面的挑戰(zhàn),從軌道交通數(shù)據(jù)系統(tǒng)內(nèi)部和外部兩個(gè)方面提出軌道交通大數(shù)據(jù)應(yīng)用的發(fā)展趨勢(shì)。 關(guān)鍵詞 軌道交通;大數(shù)據(jù);運(yùn)用;發(fā)展趨勢(shì)
進(jìn)入21世紀(jì)以來,隨著信息、傳感和移動(dòng)互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,社會(huì)各個(gè)領(lǐng)域數(shù)據(jù)呈現(xiàn)爆炸式增長態(tài)勢(shì)。這些數(shù)據(jù)具有海量、多源異構(gòu)、產(chǎn)生和傳播速度極快等特征,并且蘊(yùn)含了許多有用的信息,由于運(yùn)用常規(guī)數(shù)據(jù)管理、數(shù)據(jù)統(tǒng)計(jì)、回歸分析等技術(shù)處理數(shù)據(jù)所耗時(shí)間超過可容忍時(shí)間[1],因此,這些信息難以挖掘,使人們開始高度關(guān)注對(duì)這 類 數(shù) 據(jù) 運(yùn)用和 處 理 問 題 的 研究,這類數(shù)據(jù)和所采用的技術(shù)也被專門稱為大數(shù)據(jù)和大數(shù)據(jù)技術(shù)。
軌道交通領(lǐng)域涉及運(yùn)輸、土木、車輛、機(jī)電、供電、通信、信號(hào)、環(huán)控等多個(gè)專業(yè),每天各專業(yè)通過人工、設(shè)備等方式采集產(chǎn)生的數(shù)據(jù)量以百萬條計(jì),應(yīng)用大數(shù)據(jù)運(yùn)用和處理技術(shù),深入探索軌道交通系統(tǒng)的規(guī)律,進(jìn)而指導(dǎo)運(yùn)營實(shí)踐,對(duì)提升軌道交通的運(yùn)營管理水平和乘客服務(wù)水平具有重要的理論和現(xiàn)實(shí)意義。
然而,目前對(duì)軌道交通領(lǐng)域大數(shù)據(jù)運(yùn)用問題的研究還很有限?;谶@一背景,本文通過系統(tǒng)梳理軌道交通行業(yè)的大數(shù)據(jù)運(yùn)用現(xiàn)狀、存在的問題,探討其發(fā)展趨勢(shì),以期對(duì)大數(shù)據(jù)在本行業(yè)的發(fā)展提供參考。
1.1 軌道交通大數(shù)據(jù)的特點(diǎn)
軌道交通大數(shù)據(jù)相比于其他領(lǐng)域大數(shù)據(jù)具有獨(dú)特的特征。
1) 數(shù)據(jù)動(dòng)態(tài)性強(qiáng)。軌道交通系統(tǒng)處于時(shí)刻變化之中,大部分人和物的數(shù)據(jù)動(dòng)態(tài)性強(qiáng)、隨機(jī)性強(qiáng)、個(gè)體化差異明顯、變化粒度多樣,并且數(shù)據(jù)之間的連帶性強(qiáng),尤其遇到干擾或擾動(dòng)時(shí),某一方面的故障或延遲往往會(huì)影響其他方面。
2) 數(shù)據(jù)異構(gòu)性更加廣泛。首先,數(shù)據(jù)來源廣,軌道交通系統(tǒng)涉及多個(gè)部門,業(yè)務(wù)復(fù)雜多樣,數(shù)據(jù)存儲(chǔ)分散,難以集中;其次,數(shù)據(jù)種類紛繁復(fù)雜,非結(jié)構(gòu)化數(shù)據(jù)占比較大,且較難形成統(tǒng)一的結(jié)構(gòu);再次,數(shù)據(jù)產(chǎn)生周期參差不齊,有的數(shù)據(jù)隨時(shí)產(chǎn)生,有的數(shù)據(jù)按天、周、月為周期產(chǎn)生等;另外,數(shù)據(jù)產(chǎn)生方式多樣,有的由設(shè)備產(chǎn)生,有的則是通過人員記錄產(chǎn)生,有的在車站產(chǎn)生,有的隨車產(chǎn)生。
3) 數(shù)據(jù)依賴外部環(huán)境。一方面,軌道交通系統(tǒng)處于城市大環(huán)境中,運(yùn)營載體和服務(wù)對(duì)象都與城市息息相關(guān);另一方面,軌道交通大系統(tǒng)易受外界因素的影響,天氣變化、重大活動(dòng)、國家政策、節(jié)假日等對(duì)軌道交通的客流和計(jì)劃會(huì)產(chǎn)生很大的影響。
4) 數(shù)據(jù)呈一定規(guī)律性。軌道交通系統(tǒng)在各種計(jì)劃的指導(dǎo)下運(yùn)營,如列車運(yùn)行計(jì)劃、人員排班計(jì)劃、動(dòng)車組檢修計(jì)劃等,客流按照年、月、日、時(shí)呈現(xiàn)時(shí)間和空間周期性,空調(diào)通風(fēng)等設(shè)備呈現(xiàn)季節(jié)周期性,因此軌道交通大數(shù)據(jù)具有一定的規(guī)律性。
5) 保密性要求較高。如對(duì)涉及技術(shù)或安全方面信息的保密性要求較高。
6) 數(shù)據(jù)帶有明顯的時(shí)空特性。如乘客流線、列車運(yùn)行數(shù)據(jù)都在時(shí)間和空間兩個(gè)維度上同時(shí)變化。
1.2 軌道交通數(shù)據(jù)的主要類型
根據(jù)與軌道交通運(yùn)營的關(guān)聯(lián)性可以將軌道交通數(shù)據(jù)分為內(nèi)部數(shù)據(jù)和外部數(shù)據(jù)兩大類。
1.2.1 內(nèi)部數(shù)據(jù)
內(nèi)部數(shù)據(jù)主要指在軌道交通系統(tǒng)內(nèi)部產(chǎn)生的數(shù)據(jù),如表1所示。
表1 軌道交通內(nèi)部數(shù)據(jù)
1.2.2 外部數(shù)據(jù)
外部數(shù)據(jù)指與軌道交通直接或間接相關(guān)的軌道交通系統(tǒng)外部的數(shù)據(jù)(見表2)。
1.3 軌道交通大數(shù)據(jù)運(yùn)用的流程
軌道交通大數(shù)據(jù)的處理流程需要面向決策需求,從數(shù) 據(jù) 來 源 入手,按照 數(shù) 據(jù)的采集、存儲(chǔ)、處理、分析、解釋架構(gòu)進(jìn)行[4]。后者又可以統(tǒng)稱為數(shù)據(jù)處理技術(shù)。通過對(duì)廣泛異構(gòu)的數(shù)據(jù)源進(jìn)行抽取、集成、統(tǒng)一存儲(chǔ),進(jìn)行知識(shí)挖掘和結(jié)果呈現(xiàn),具體流程如圖1所示。
表2 與軌道交通系統(tǒng)相關(guān)的外部數(shù)據(jù)
圖1 軌道交通大數(shù)據(jù)處理階段
軌道交通大數(shù)據(jù)運(yùn)用的決策需求貫穿軌道交通生命周期的全過程,數(shù)據(jù)對(duì)軌道交通的規(guī)劃、建設(shè)、管理起著重要的決策支撐作用。這種決策支撐主要體現(xiàn)在可視化規(guī)律挖掘、預(yù)測(cè)、預(yù)警與控制等方面。僅以運(yùn)輸專業(yè)為例,主要的決策需求包括:線網(wǎng)規(guī)劃中平行、交叉線路的規(guī)劃,確定合理的線路開通時(shí)序,列車運(yùn)行圖編制,日??土鹘M織中客流預(yù)警,列車運(yùn)行調(diào)整,限流方案確定,突發(fā)客流組織,客運(yùn)營銷方案的確定,票款清分,軌道交通運(yùn)營效果評(píng)價(jià),運(yùn)營節(jié)能方案的動(dòng)態(tài)評(píng)估與優(yōu)化,應(yīng)急資源配置優(yōu)化等方面。
然而,從運(yùn)用現(xiàn)狀來看,目前軌道交通大數(shù)據(jù)的運(yùn)用還處于初級(jí)階段,由于軌道交通專業(yè)繁多,其需求具有較強(qiáng)的多樣性。以下僅就運(yùn)輸專業(yè)為例,總結(jié)主要的運(yùn)用方向。
2.1 統(tǒng)計(jì)分析方面
對(duì)軌道交通運(yùn)營中產(chǎn)生的數(shù)據(jù)進(jìn)行平臺(tái)化管理,方便查詢、分析。如:開發(fā)具備大數(shù)據(jù)分析能力的運(yùn)營數(shù)據(jù)管理系統(tǒng),采集全樣本的數(shù)據(jù),記錄包含客流信息、行車信息、運(yùn)營指標(biāo)、運(yùn)力配置、客運(yùn)服務(wù)和運(yùn)營大事件等在內(nèi)的重要運(yùn)營數(shù)據(jù)[5],為運(yùn)營管理提供動(dòng)態(tài)分析依據(jù)(如圖2所示)。
圖2 運(yùn)營動(dòng)態(tài)統(tǒng)計(jì)分析
2.2 應(yīng)急輔助決策方面
根據(jù)物資、設(shè)備的數(shù)據(jù)制定電子化預(yù)案,自動(dòng)啟動(dòng)應(yīng)急處理機(jī)制,調(diào)配人力物力。例如上海地鐵中將人、電、車等資源按時(shí)間和空間進(jìn)行分布,對(duì)各條線路的各類資源進(jìn)行調(diào)配。又如在京港地鐵中,全線設(shè)備受系統(tǒng)監(jiān)控,分析在各站點(diǎn)的員工對(duì)企業(yè)制度的貫徹情況、維修任務(wù)的執(zhí)行狀況、備品備件的詳細(xì)信息等數(shù)據(jù),系統(tǒng)派工,對(duì)資源進(jìn)行合理部署和調(diào)配,實(shí)現(xiàn)了效率更高、響應(yīng)更及時(shí)的管理[6]。筆者通過對(duì)歷史設(shè)備設(shè)施故障發(fā)生頻次和客流數(shù)據(jù)的深層次挖掘,確定合理的應(yīng)急資源配置方案(見圖3)。
圖3 基于大數(shù)據(jù)的應(yīng)急資源配置
2.3 乘客出行誘導(dǎo)方面
在北京、上海、廣州等地鐵中,對(duì)軌道交通各線路區(qū)段的客流密度與運(yùn)營狀態(tài)進(jìn)行實(shí)時(shí)監(jiān)控,并根據(jù)即時(shí)運(yùn)營狀態(tài),用“綠、黃、紅、黑”表示路線運(yùn)營情況,便于乘客調(diào)整出行計(jì)劃,避開擁堵和發(fā)生故障的區(qū)段(見圖4)。此外,上海地鐵乘客還可以通過站臺(tái)、車廂顯示屏、自助查詢屏、上海地鐵網(wǎng)站等載體,在出行前進(jìn)行網(wǎng)站路徑查詢,出行中利用微信、手機(jī)進(jìn)行信息發(fā)布,出行后使用手機(jī)電子地圖,對(duì)周邊資源進(jìn)行搜索等[7]。
圖4 基于大數(shù)據(jù)的客流誘導(dǎo)
在深圳,基于手機(jī)APP,獲取用戶位置信息。根據(jù)用戶的居住地、工作地、APP使用習(xí)慣、消費(fèi)習(xí)慣等關(guān)聯(lián)信息,識(shí)別用戶性別、年齡、職業(yè)、愛好等信息,區(qū)分不同類別人群,精細(xì)化分析用戶行為特征,針對(duì)不同人群的多樣化出行制定交通改善方案[8]。
2.4 客流預(yù)測(cè)方面
大數(shù)據(jù)技術(shù)的一個(gè)重要應(yīng)用是對(duì)客流數(shù)據(jù)的運(yùn)用和處理。通過動(dòng)態(tài)獲取票務(wù)系統(tǒng)和自動(dòng)售檢票系統(tǒng)中的數(shù)據(jù),以及天氣、大型活動(dòng)等外部數(shù)據(jù),采集海量的原始信息,通過分析客流特征,實(shí)時(shí)分析客流出行的時(shí)空分布規(guī)律,發(fā)掘客流規(guī)律,進(jìn)而預(yù)測(cè)未來客流的走勢(shì),為運(yùn)營管理提供必要的參考信息(見圖5)。
圖5 基于大數(shù)據(jù)的客流在線預(yù)測(cè)
2.5 調(diào)度管理方面
在京港地鐵,通過對(duì)運(yùn)營信息的二次提煉、分析,大數(shù)據(jù)運(yùn)營平臺(tái)可以及時(shí)掌握乘客出行習(xí)慣,預(yù)測(cè)早、晚高峰時(shí)間,實(shí)現(xiàn)了實(shí)時(shí)調(diào)度[6](見圖6)。又如在深圳,滾動(dòng)識(shí)別擁堵區(qū)以及近期擁堵明顯加劇片區(qū),為交通綜合治理工作的開展提供依據(jù)。
圖6 基于大數(shù)據(jù)的運(yùn)營調(diào)度
3.1 數(shù)據(jù)采集
軌道交通數(shù)據(jù)采集的來源有兩種:1) 來自于人。人在出行及運(yùn)營管理中產(chǎn)生、記錄的數(shù)據(jù)。2) 來自于設(shè)備。各類計(jì)算機(jī)信息系統(tǒng)、數(shù)字設(shè)備所采集的數(shù)據(jù),如全球移動(dòng)通信系統(tǒng)(GSM)、閘機(jī)、手機(jī)、交通服務(wù)平臺(tái)、攝像頭、傳感器、WiFi等。
為保證數(shù)據(jù)的完整性與準(zhǔn)確性,大數(shù)據(jù)時(shí)代的數(shù)據(jù)采集將更加突出設(shè)備的自動(dòng)化采集,采集內(nèi)容將基于全量而非基于采樣的方式,采集方式多樣化而非只采集基本數(shù)據(jù)。采集數(shù)據(jù)的類型將涵蓋結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化的用戶行為數(shù)據(jù)、文本或音頻類型的用戶意見和反饋數(shù)據(jù)、設(shè)備和傳感器采集的數(shù)據(jù),以及網(wǎng)絡(luò)爬蟲獲取的互聯(lián)網(wǎng)數(shù)據(jù)等。
除了常規(guī)采集技術(shù)外,城市軌道交通大數(shù)據(jù)可以采用如下新型的采集技術(shù):
1) 應(yīng)用移動(dòng)互聯(lián)網(wǎng)技術(shù)采集移動(dòng)設(shè)備的數(shù)據(jù)(如統(tǒng)計(jì)APP的基礎(chǔ)數(shù)據(jù),包括用戶數(shù)、活躍情況、流失比例、使用時(shí)長及用戶的位置等)[9]。
2) 應(yīng)用網(wǎng)絡(luò)爬蟲采集全網(wǎng)信息、輿情監(jiān)控等。
3) 應(yīng)用無線射頻標(biāo)簽(RFID)技術(shù)解決物品信息與互聯(lián)網(wǎng)自動(dòng)鏈接的問題。
4) 應(yīng)用傳感器(Sensor)采集自動(dòng)檢測(cè)和控制等環(huán)節(jié)的數(shù)據(jù)。
5) 其他數(shù)據(jù)采集方法。對(duì)于保密性要求較高的數(shù)據(jù),可以使用特定系統(tǒng)接口等方式采集。
3.2 數(shù)據(jù)處理
軌道交通大數(shù)據(jù)處理的主要技術(shù)包括數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)清洗和云計(jì)算技術(shù)。
3.2.1 數(shù)據(jù)存儲(chǔ)
對(duì)數(shù)據(jù)進(jìn)行分類,通過過濾和去重來減少存儲(chǔ)量,便于檢索。由于軌道交通數(shù)據(jù)量龐大,以往一般采用Oracle數(shù)據(jù)管理系統(tǒng),并采用分布式存儲(chǔ)方式。目前在大數(shù)據(jù)存儲(chǔ)、管理和處理方面,BigTable和Hadoop技術(shù)應(yīng)用廣泛。
3.2.2 數(shù)據(jù)清洗
數(shù)據(jù)量的增加導(dǎo)致數(shù)據(jù)質(zhì)量低劣,噪聲增多。由于數(shù)據(jù)采集設(shè)備、安裝位置以及數(shù)據(jù)傳輸能力的限制,軌道交通大數(shù)據(jù)一般存在數(shù)據(jù)的準(zhǔn)確性缺陷、完備性缺陷和時(shí)效性缺陷,這些缺陷極大地降低了數(shù)據(jù)的可用性。因此,為保證數(shù)據(jù)質(zhì)量和可信性,在數(shù)據(jù)集成過程中,應(yīng)對(duì)數(shù)據(jù)進(jìn)行清洗。同時(shí)清洗粒度要適中,應(yīng)既達(dá)到清洗效果,又能保留有用信息。
3.2.3 云計(jì)算
云計(jì)算是一種基于互聯(lián)網(wǎng)模式的計(jì)算[10],以虛擬化技術(shù)為基礎(chǔ),以網(wǎng)絡(luò)為載體[11],提供平臺(tái)、軟件等服務(wù),是進(jìn)行協(xié)同工作的超級(jí)計(jì)算模式。大數(shù)據(jù)和云計(jì)算相輔相成,大數(shù)據(jù)是云計(jì)算的材料,大數(shù)據(jù)的挖掘,又必須依托云計(jì)算的分布式處理、分布式數(shù)據(jù)庫、云存儲(chǔ)和虛擬化技術(shù)。
3.3 數(shù)據(jù)分析與解釋
數(shù)據(jù)分析階段最重要的技術(shù)是數(shù)據(jù)挖掘,即分析數(shù)據(jù)間及類別間的關(guān)系,揭示數(shù)據(jù)間的內(nèi)在聯(lián)系,發(fā)現(xiàn)深層次的模式、規(guī)則及知識(shí)。適用大數(shù)據(jù)挖掘的處理技術(shù)有MapReduce(當(dāng)前廣泛采用的大數(shù)據(jù)計(jì)算模型和框架)、NOSQL類數(shù)據(jù)庫(在查詢與索引方面適用于大量的非結(jié)構(gòu)化或半結(jié)構(gòu)化數(shù)據(jù))。
數(shù)據(jù)解釋旨在更好地呈現(xiàn)數(shù)據(jù)分析結(jié)果,不恰當(dāng)?shù)慕忉尫椒赡軐?dǎo)致理解很晦澀,甚至誤導(dǎo)用戶。大數(shù)據(jù)分析結(jié)果的呈現(xiàn)要更加注重交互式和可視化。傳統(tǒng)的數(shù)據(jù)呈現(xiàn)形式難以應(yīng)對(duì)海量的數(shù)據(jù)分析結(jié)果。目前大數(shù)據(jù)解釋技術(shù)主要有可視化和人機(jī)交互[12]。
3.3.1 可視化技術(shù)
可視化既是數(shù)據(jù)分析的關(guān)鍵技術(shù)也是分析結(jié)果呈現(xiàn)的關(guān)鍵技術(shù)[3]1897。多維數(shù)據(jù)的對(duì)比、映照通過圖形、動(dòng)畫等視覺化手段展現(xiàn)出來時(shí),易于揭示出數(shù)據(jù)中的規(guī)律、各因素之間的相關(guān)關(guān)系,發(fā)現(xiàn)異常數(shù)據(jù)等,同時(shí)方便對(duì)大數(shù)據(jù)分析結(jié)果的溝通與理解(見圖7)。
圖7 客流數(shù)據(jù)的可視化
大數(shù)據(jù)可視化不同于傳統(tǒng)的信息可視化,最大的挑戰(zhàn)是能夠適用于分析大規(guī)模、高維度、多來源、動(dòng)態(tài)演化的信息,并輔助做出實(shí)時(shí)決策。
3.3.2 人機(jī)交互
即讓用戶在一定程度上參與分析的具體過程,引導(dǎo)用戶進(jìn)行分析,讓用戶得到結(jié)果的同時(shí)更好地理解分析結(jié)果的由來,有助于用戶理解結(jié)果。
4.1 軌道交通大數(shù)據(jù)運(yùn)用面臨的挑戰(zhàn)
除了保護(hù)個(gè)人隱私和數(shù)據(jù)安全等大數(shù)據(jù)應(yīng)用時(shí)普遍存在的挑戰(zhàn)外,從現(xiàn)有軌道交通大數(shù)據(jù)的應(yīng)用情況可以看出,還存在以下典型問題:
1) 在決策內(nèi)容和方式方面,與軌道交通每天產(chǎn)生的大量數(shù)據(jù)相比,現(xiàn)有的應(yīng)用內(nèi)容還很簡(jiǎn)單,軌道交通生命周期各階段數(shù)據(jù)之間的反饋應(yīng)用幾乎沒有,多源數(shù)據(jù)的交叉應(yīng)用還很少。從運(yùn)用的方式上看,目前對(duì)于大數(shù)據(jù)的應(yīng)用還只存在于進(jìn)行決策支持,尚未達(dá)到智能化。
2) 數(shù)據(jù)采集方面,在由人員記錄的數(shù)據(jù)中,存在數(shù)據(jù)缺失、記錄格式不統(tǒng)一現(xiàn)象,造成原始數(shù)據(jù)的語義不明、甚至缺失;且各部門之間存在數(shù)據(jù)編碼和分類的差異,數(shù)據(jù)缺乏統(tǒng)一管理和標(biāo)準(zhǔn)。因此,鑒于當(dāng)前數(shù)據(jù)采集技術(shù)參差不齊,自動(dòng)化程度不一致,導(dǎo)致獲取數(shù)據(jù)質(zhì)量存在差異。所以應(yīng)該創(chuàng)新某些數(shù)據(jù)采集方式;同時(shí)在獲取海量原始交通數(shù)據(jù)的同時(shí),應(yīng)對(duì)數(shù)據(jù)進(jìn)行初步處理,便于分析,從而及時(shí)、準(zhǔn)確、快速地獲取交通數(shù)據(jù)。
3) 數(shù)據(jù)集成方面,軌道交通涉及的大數(shù)據(jù)種類和數(shù)量繁雜,且散布于不同的數(shù)據(jù)管理系統(tǒng)和部門中,數(shù)據(jù)壁壘現(xiàn)象嚴(yán)重,存在公用數(shù)據(jù)重復(fù)建設(shè)現(xiàn)象,數(shù)據(jù)維護(hù)和保障不健全、數(shù)據(jù)共享度低,為便于數(shù)據(jù)分析需要進(jìn)行數(shù)據(jù)的集成。
4) 在人才需求方面,目前軌道交通領(lǐng)域主要是管理人員較多,缺乏高級(jí)IT人才,即技術(shù)與數(shù)據(jù)相分離現(xiàn)象嚴(yán)重[13]。
5) 在數(shù)據(jù)交叉分析方面,目前對(duì)于多源異構(gòu)數(shù)據(jù)的挖掘比較少,大部分?jǐn)?shù)據(jù)挖掘還是基于對(duì)軌道交通系統(tǒng)內(nèi)部數(shù)據(jù)的分析,只有少量與外部數(shù)據(jù)的交叉分析,且都與交通信息有明顯的相關(guān)性,缺乏更廣泛的數(shù)據(jù)交叉分析。
6) 在系統(tǒng)內(nèi)部物聯(lián)網(wǎng)方面,對(duì)軌道交通內(nèi)部資源進(jìn)行聯(lián)網(wǎng)跟蹤記錄,便于人力、物力的合理配置。
7) 在思維方式的轉(zhuǎn)變方面,由傳統(tǒng)的粗放型向大數(shù)據(jù)精細(xì)化轉(zhuǎn)變,讓數(shù)據(jù)分析指導(dǎo)決策,進(jìn)行事前預(yù)測(cè),而非事后統(tǒng)計(jì)。
4.2 軌道交通大數(shù)據(jù)運(yùn)用的發(fā)展趨勢(shì)
通過以上分析可以發(fā)現(xiàn),未來軌道交通大數(shù)據(jù)運(yùn)用將有必要打破軌道交通數(shù)據(jù)系統(tǒng)內(nèi)部的障礙,全面融合匯總數(shù)據(jù),對(duì)軌道交通內(nèi)部大數(shù)據(jù)和外部大數(shù)據(jù)進(jìn)行綜合分析,指導(dǎo)軌道交通規(guī)劃、設(shè)計(jì)、建設(shè)、運(yùn)營的良性發(fā)展。
4.2.1 軌道交通大數(shù)據(jù)的內(nèi)部應(yīng)用
除上文中提到的大數(shù)據(jù)技術(shù)已實(shí)現(xiàn)的應(yīng)用外,還應(yīng)該深層次、多角度挖掘數(shù)據(jù),詳見表3。
此外還可對(duì)軌道交通大數(shù)據(jù)按運(yùn)營中的各環(huán)節(jié)對(duì)多類數(shù)據(jù)進(jìn)行評(píng)估。例如,可以評(píng)價(jià)線路間連接、運(yùn)力與運(yùn)量匹配關(guān)系,尋找車站客流聚散瓶頸,進(jìn)行實(shí)時(shí)、短期的客流預(yù)測(cè)等。
表3 軌道交通大數(shù)據(jù)的內(nèi)部應(yīng)用
4.2.2 與外部多源異構(gòu)數(shù)據(jù)的交叉分析應(yīng)用
開放的交通系統(tǒng)由于受各種外因的影響,因此需要建立多方的信息基礎(chǔ)環(huán)境,融合并深度分析各個(gè)行業(yè)的數(shù)據(jù),對(duì)多源異構(gòu)數(shù)據(jù)進(jìn)行融合,并進(jìn)行多角度精準(zhǔn)分析,多層次關(guān)聯(lián)處理,打破數(shù)據(jù)壁壘,真正做到數(shù)據(jù)共享,更大發(fā)揮各個(gè)行業(yè)數(shù)據(jù)的價(jià)值,同時(shí)使預(yù)測(cè)結(jié)果為多方利用。
根據(jù)當(dāng)前軌道交通大數(shù)據(jù)的應(yīng)用對(duì)可進(jìn)行交叉分析的數(shù)據(jù)方向進(jìn)行分級(jí),詳見表4。
表4 外部數(shù)據(jù)與軌道交通數(shù)據(jù)交叉分析應(yīng)用
本文總結(jié)了軌道交通大數(shù)據(jù)運(yùn)用的主要內(nèi)容,特別以運(yùn)輸專業(yè)為例分析了大數(shù)據(jù)運(yùn)用的決策需求和關(guān)鍵技術(shù),提出了軌道交通大數(shù)據(jù)運(yùn)用面臨的挑戰(zhàn)以及發(fā)展趨勢(shì)。通過分析,將有助于軌道交通行業(yè)做好大數(shù)據(jù)運(yùn)用的頂層設(shè)計(jì),促進(jìn)大數(shù)據(jù)在軌道交通行業(yè)的
良性發(fā)展。由于軌道交通涉及專業(yè)較多,因此本文無法較全面地涉及每個(gè)專業(yè)。對(duì)于各專業(yè)大數(shù)據(jù)應(yīng)用的深入挖掘,將是本文進(jìn)一步拓展的方向。
[1] 維基百科:大數(shù)據(jù)[EB/OL].(2016-08-09)[2016-08-12] https://en.wikipedia.org/wiki/Big_data.
[2] 王荃.地鐵及城市軌道綜合安防規(guī)劃設(shè)計(jì)[J].現(xiàn)代建筑電氣, 2012,2(3):46-51.
[3] 程學(xué)旗,靳小龍,王元卓,等.大數(shù)據(jù)系統(tǒng)和分析技術(shù)綜述[J]. 軟件學(xué)報(bào),2014,25(9):1889-1908.
[4] 孟小峰,慈祥.大數(shù)據(jù)管理:概念、技術(shù)與挑戰(zhàn)[J].計(jì)算機(jī)研究與發(fā)展,2013,50(1):146-169.
[5] 京港地鐵4號(hào)線開通運(yùn)營四周年[EB/OL].(2013-09-08)[2016-08-25] http://www.mtr.bj.cn/content/details34_12215.html.
[9] 張?zhí)O.數(shù)據(jù)挖掘技術(shù)在企業(yè)中的應(yīng)用[J].科技廣場(chǎng),2011(8):41-44.
[10] 鄭瑋.Hadoop釋放大數(shù)據(jù)潛能[J].軟件和信息服務(wù),2012(10):9.
[11] 姜浩.云計(jì)算環(huán)境下的安全應(yīng)用[J].信息安全與通信保密,2013(7):41-44.
[12] 馮登國,張敏,李昊.大數(shù)據(jù)安全與隱私保護(hù)[J].計(jì)算機(jī)學(xué)報(bào),2014,37(1):246-258.
[13] 陶雪嬌,胡曉峰,劉洋.大數(shù)據(jù)研究綜述[J].系統(tǒng)仿真學(xué)報(bào), 2013,25(8):142-146.
(編輯:曹雪明)
Li Dewei Zhang Tianyu Zhou Weiteng Yin Haodong
(School of Traffic and Transportation, Beijing Jiaotong University, Beijing 100044)
rail transit; big data; application; trend
10.3969/j.issn.1672-6073.2016.06.001
2016-08-15
2016-08-27
李得偉,男,副教授,博士,交通運(yùn)輸規(guī)劃與管理專業(yè),運(yùn)輸組織現(xiàn)代化方向,lidw@bjtu.edu.cn
教育部高等學(xué)校基本科研業(yè)務(wù)費(fèi)(2016JBM030);北京市科委課題(Z151100001315004);朝陽區(qū)科委課題(CYXC1607)
U231
A
1672-6073(2016)06-0001-07
編者按 城市軌道交通成網(wǎng)建設(shè)與運(yùn)營的快速發(fā)展,產(chǎn)生巨量的數(shù)據(jù)和信息流,呈現(xiàn)大數(shù)據(jù)井噴式發(fā)展,使傳統(tǒng)的數(shù)據(jù)統(tǒng)計(jì)分析、應(yīng)用、評(píng)估不能適應(yīng)這一發(fā)展的需求。近年來,大數(shù)據(jù)的研究應(yīng)用成為行業(yè)發(fā)展的新熱點(diǎn),本期《熱點(diǎn)研討》欄目發(fā)表3篇文章,期望提升城市軌道交通行業(yè)對(duì)大數(shù)據(jù)采集、分析挖掘、管理決策、融合應(yīng)用的技術(shù)研究和工程化水平,為行業(yè)發(fā)展提供新動(dòng)力。