李 斌,梁軼濤
(廣東聯(lián)合電子服務(wù)股份有限公司,廣州 510000)
在廣東省委省政府的統(tǒng)一規(guī)劃下,廣東省的高速公路路網(wǎng)建設(shè),實(shí)現(xiàn)了“鎮(zhèn)鎮(zhèn)通高速”的目標(biāo),為廣大車主的出行和物流業(yè)的發(fā)展提供了堅(jiān)實(shí)的交通基礎(chǔ)設(shè)施保障. 2020年,廣東省根據(jù)交通部的統(tǒng)一部署,實(shí)施取消省界收費(fèi)站工程,為全省高速公路架設(shè)了大量的感知設(shè)備,快速提升了路面的數(shù)據(jù)采集和信息感知能力. 高速公路的數(shù)字化水平得到了大幅度提升. 如何充分利用好高速公路通行數(shù)據(jù),成為目前行業(yè)內(nèi)的1個(gè)熱點(diǎn)問題.
廣東省聯(lián)網(wǎng)中心在2019年開展取消省界收費(fèi)站工程項(xiàng)目建設(shè)之初,就已為有效開展高速公路通行大數(shù)據(jù)應(yīng)用做了系統(tǒng)化的準(zhǔn)備,于2020年取消省界收費(fèi)站系統(tǒng)切換的同時(shí),上線了廣東省聯(lián)網(wǎng)中心數(shù)據(jù)中臺(tái). 基于數(shù)據(jù)中臺(tái),廣東省聯(lián)網(wǎng)中心進(jìn)行了多項(xiàng)跨行業(yè)的通行大數(shù)據(jù)應(yīng)用,并取得了一定成效. 本文主要對(duì)廣東省聯(lián)網(wǎng)中心面向非收費(fèi)領(lǐng)域的應(yīng)用進(jìn)行了介紹.
隨著國家大數(shù)據(jù)戰(zhàn)略的推進(jìn),以及“交通強(qiáng)國”項(xiàng)目逐步實(shí)施,高速公路通行大數(shù)據(jù)應(yīng)用逐漸引起了行業(yè)內(nèi)、外各單位的重視. 2019年底,國家《交通強(qiáng)國建設(shè)綱要》,明確了“大力發(fā)展智慧交通. 推動(dòng)大數(shù)據(jù)、互聯(lián)網(wǎng)、人工智能、區(qū)塊鏈、超級(jí)計(jì)算等新技術(shù)與交通行業(yè)深度融合”的要求. 2020年4月,國家發(fā)展改革委明確了“新基建”中“融合基礎(chǔ)設(shè)施”是指深度應(yīng)用互聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能等技術(shù),支撐傳統(tǒng)基礎(chǔ)設(shè)施轉(zhuǎn)型升級(jí),進(jìn)而形成的融合基礎(chǔ)設(shè)施,而“智能交通基礎(chǔ)設(shè)施”是其中重要的一項(xiàng). 上述政策都表明,交通大數(shù)據(jù)與人工智能應(yīng)用正處于快速發(fā)展階段.
過去,高速公路的通行數(shù)據(jù)主要應(yīng)用于聯(lián)網(wǎng)收費(fèi)場(chǎng)景. 但隨著近年來國民經(jīng)濟(jì)的發(fā)展和人民生活水平的提高,高速公路客、貨運(yùn)輸量逐年穩(wěn)步提升;私家車普及率的提升,加大了自駕游的普及,重大節(jié)假日客運(yùn)車流量急劇增長. 這些現(xiàn)象既要求各級(jí)主管部門實(shí)時(shí)掌握高速公路出行狀況,提升管理水平,也為各種商業(yè)化的出行服務(wù)平臺(tái)提供了極好的商機(jī). 而基于高速公路行業(yè)的大數(shù)據(jù)應(yīng)用,為這些應(yīng)用場(chǎng)景提供了高效、精準(zhǔn)、客觀的解決方案. 因此,高速大數(shù)據(jù)應(yīng)用需求越來越迫切,其重要性不言而喻.
過去,高速公路的通行數(shù)據(jù)維度較為單一,主要是車輛的出口信息,滿足的是出口收費(fèi)的需要. 2020年取消省界收費(fèi)站后,由于在路上架設(shè)了較多的ETC門架,其數(shù)據(jù)維度極大豐富,數(shù)據(jù)量也快速增加. 在數(shù)據(jù)維度上,除了結(jié)構(gòu)化數(shù)據(jù)外,還增加了通行車輛的圖像數(shù)據(jù)和視頻數(shù)據(jù). 對(duì)于結(jié)構(gòu)化數(shù)據(jù),也在原來出口信息的基礎(chǔ)上,增加了入口信息、通行的ETC門架信息、貨車入口稱重信息和出口查驗(yàn)信息等.
除了數(shù)據(jù)本身,對(duì)于數(shù)據(jù)的處理技術(shù),近年來也有了很大進(jìn)步. 人工智能和大數(shù)據(jù)處理技術(shù)已在交通行業(yè)有大量的落地應(yīng)用. 大數(shù)據(jù)條件下的交通系統(tǒng)分析不是將大數(shù)據(jù)技術(shù)簡單套用或者移植到交通領(lǐng)域,而是將大數(shù)據(jù)技術(shù)融入到交通系統(tǒng)分析體系中,是將數(shù)據(jù)組織成為信息,從信息提煉特征,從特征變化中發(fā)現(xiàn)規(guī)律,并就對(duì)策進(jìn)行追蹤評(píng)估的信息處理過程[1]. 進(jìn)一步,楊超等[2]將交通大數(shù)據(jù)分為道路定點(diǎn)檢測(cè)器、出租車GPS、公交IC卡、車牌識(shí)別、手機(jī)數(shù)據(jù)等,具有一定的預(yù)見性. 就目前而言,高速公路通行數(shù)據(jù)屬于道路定點(diǎn)檢測(cè)器產(chǎn)生的數(shù)據(jù)和車牌識(shí)別數(shù)據(jù)2大類. 這些信息和技術(shù)在高速公路的融合,能較完整地呈現(xiàn)每一輛車的高速通行路徑,為各種應(yīng)用場(chǎng)景提供了基礎(chǔ)支撐.
高速公路通行數(shù)據(jù)當(dāng)前有多個(gè)應(yīng)用研究領(lǐng)域,包括車輛逃費(fèi)稽核、實(shí)時(shí)交通分析和車路協(xié)同等.
1.3.1 車輛漏逃費(fèi)稽核
該領(lǐng)域是高速公路通行數(shù)據(jù)服務(wù)于本行業(yè)的典型場(chǎng)景. 在我國,高速公路的車輛通行費(fèi)收費(fèi)標(biāo)準(zhǔn)主要涉及收費(fèi)車型、行駛里程2個(gè)因素,而漏逃費(fèi)行為的本質(zhì),是對(duì)這2個(gè)因素的主觀隱瞞或客觀誤識(shí)別. 通過對(duì)收費(fèi)車輛的真實(shí)收費(fèi)車型和實(shí)際通行里程進(jìn)行大數(shù)據(jù)分析,則能對(duì)車輛的漏逃費(fèi)行為進(jìn)行稽核. 目前,在國家交通運(yùn)輸部應(yīng)急處置中心的統(tǒng)籌下,已建立起1套由“國家- 省(直轄市)”組成的兩級(jí)稽核體系,“大數(shù)據(jù)稽核”已寫入高速公路聯(lián)網(wǎng)收費(fèi)的國家級(jí)總體建設(shè)方案中.
1.3.2 實(shí)時(shí)交通分析
該領(lǐng)域是高速公路通行數(shù)據(jù)在數(shù)據(jù)維度豐富后衍生的新應(yīng)用領(lǐng)域. 過去該領(lǐng)域主要由導(dǎo)航軟件提供商所壟斷,其基于用戶數(shù)據(jù)進(jìn)行的實(shí)時(shí)交通分析,是1種基于樣本的分析方法,能較好地反應(yīng)出實(shí)時(shí)路程況. 國內(nèi)的百度地圖、高德地圖、騰訊地圖,國外的谷歌地圖等均是典型的例子. 現(xiàn)在,由于高速公路通行數(shù)據(jù)維度越來越豐富,數(shù)據(jù)的實(shí)時(shí)性越來越高,基于此類數(shù)據(jù)進(jìn)行的實(shí)時(shí)交通分析突顯出“全量數(shù)據(jù)”的獨(dú)特價(jià)值. 例如,利用此類數(shù)據(jù),不僅能分析實(shí)時(shí)路況,還能統(tǒng)計(jì)實(shí)時(shí)的車流量,從而判斷高速公路當(dāng)前的通行飽和度,為各級(jí)路段管理單位提供數(shù)據(jù)支持. 目前,廣東、江蘇、浙江等高速公路車流量大省均開展這方面的應(yīng)用,取得成效.
經(jīng)過近10 a的快速發(fā)展,廣東省高速公路路網(wǎng)發(fā)達(dá),車流量大,聯(lián)網(wǎng)路段數(shù)量、通車?yán)锍?、車流量均居全國首?
截止至2021年6月30日,廣東省聯(lián)網(wǎng)收費(fèi)高速公路超過160條,通車?yán)锍虜?shù)超過1萬km,占全國的5.7%,每百平方公里里程密度超過5.5 km,是全國的3倍. 廣東省近10 a聯(lián)網(wǎng)里程發(fā)展趨勢(shì)如圖1所示.
圖1 廣東省近10 a聯(lián)網(wǎng)里程發(fā)展趨勢(shì)
在車流量方面,廣東省高速公路日均出口車流量超過650萬車次,占全國超20%,日均車流密度超過600車次/km,是全國的3.7倍. 在取消省界收費(fèi)站項(xiàng)目實(shí)施后的1 a多時(shí)間里,廣東省整體車流量基本穩(wěn)定在全國20%左右,比排在第2、3、4位的省份的車流量之和還大.
圖2 廣東省高速公路原生數(shù)據(jù)維度和數(shù)據(jù)量示意圖
隨著全國取消省界收費(fèi)站工程的實(shí)施,高速公路通行數(shù)據(jù)采集的維度快速增加. 通過推廣ETC發(fā)行,在高速公路大量架設(shè)ETC門架,布設(shè)RSU天線和圖像抓拍設(shè)備,高速公路通行數(shù)據(jù)已從過去的單一維度的結(jié)構(gòu)化數(shù)據(jù),擴(kuò)展到車牌識(shí)別數(shù)據(jù)、車輛抓拍圖片數(shù)據(jù)、視頻監(jiān)控?cái)?shù)據(jù)等維度. 同時(shí),隨著各路段對(duì)橋梁、隧道的智能化管理水平的提升,各類橋隧傳感器的數(shù)據(jù)也在快速增加,成為除通行數(shù)據(jù)以外的有益補(bǔ)充. 以廣東省為例,高速公路的原生數(shù)據(jù)維度和數(shù)據(jù)量如圖2所示. 從圖中可看出,全國取消省界收費(fèi)站工程實(shí)施后,短短1 a內(nèi)積累的數(shù)據(jù)量,就已經(jīng)超過了廣東省聯(lián)網(wǎng)收費(fèi)工作開展以來的全部數(shù)據(jù)的總和.
全國取消省界收費(fèi)站工程實(shí)施后,交通部對(duì)通行數(shù)據(jù)的上傳時(shí)間給出了明確規(guī)定,要求通行流水產(chǎn)生后的30 min內(nèi)必須上傳至省聯(lián)網(wǎng)中心. 廣東省經(jīng)過“省站直傳”等項(xiàng)目的改造后,通行數(shù)據(jù)上傳時(shí)效性進(jìn)一步提升,平均上傳時(shí)間小于120 s. 時(shí)間性的加強(qiáng),為許多準(zhǔn)實(shí)時(shí)的數(shù)據(jù)應(yīng)用場(chǎng)景提供了基礎(chǔ)保障.
廣東省聯(lián)網(wǎng)中心數(shù)據(jù)中臺(tái)采用云平臺(tái)的架構(gòu)進(jìn)行建設(shè). 數(shù)據(jù)中臺(tái)的核心是1個(gè)高性能的行業(yè)大數(shù)據(jù)存儲(chǔ)和計(jì)算引擎,現(xiàn)已實(shí)現(xiàn)數(shù)據(jù)的集中存儲(chǔ)和元數(shù)據(jù)的標(biāo)準(zhǔn)化;集成了多種主流的數(shù)據(jù)處理引擎和人工智能算法框架,能支撐離線計(jì)算、實(shí)時(shí)計(jì)算、圖計(jì)算等業(yè)務(wù)場(chǎng)景;建立了多項(xiàng)面向大數(shù)據(jù)和人工智能應(yīng)用的平臺(tái)層服務(wù),大幅度提升數(shù)據(jù)應(yīng)用開發(fā)的效率;依托聯(lián)網(wǎng)收費(fèi)的安全體系,構(gòu)建了較完善的數(shù)據(jù)安全保障體系,有效保證數(shù)據(jù)開發(fā)應(yīng)用方面的安全性. 數(shù)據(jù)中臺(tái)的應(yīng)用系統(tǒng)架構(gòu)如圖3所示.
3.1.1 行業(yè)大數(shù)據(jù)應(yīng)用的系統(tǒng)架構(gòu)存在問題分析
圖3 廣東省聯(lián)網(wǎng)中心數(shù)據(jù)中臺(tái)架構(gòu)示意圖
高速公路通行數(shù)據(jù)的數(shù)據(jù)量急劇增加,僅1 a的數(shù)據(jù)量,已遠(yuǎn)超過去十幾年的總和. 過往,大數(shù)據(jù)應(yīng)用一般被整合于聯(lián)網(wǎng)收費(fèi)業(yè)務(wù)系統(tǒng)中,為其子模塊之一. 由于聯(lián)網(wǎng)收費(fèi)系統(tǒng)是典型的聯(lián)機(jī)事務(wù)處理(OLTP)系統(tǒng),均采用基于關(guān)系數(shù)據(jù)庫系統(tǒng)(RDBMS)的數(shù)據(jù)應(yīng)用技術(shù),在面對(duì)數(shù)據(jù)量劇增的情況下,其數(shù)據(jù)處理性能已無法支撐實(shí)際需要. 基于聯(lián)機(jī)分析處理(OLAP)的數(shù)據(jù)倉庫技術(shù),在數(shù)據(jù)存儲(chǔ)和查詢上能表現(xiàn)得比OLTP系統(tǒng)更好,但是,其數(shù)據(jù)處理環(huán)節(jié)基本上仍基于RDBMS,不能為大數(shù)據(jù)應(yīng)用場(chǎng)景提供完整的解決方案. 因此,本行業(yè)的大數(shù)據(jù)應(yīng)用亟需采用更為合理的數(shù)據(jù)架構(gòu).
3.1.2 行業(yè)大數(shù)據(jù)應(yīng)用的系統(tǒng)架構(gòu)選型分析
從系統(tǒng)架構(gòu)上講,Eric Brewer于2000年提出并被后續(xù)證明的CPA定律認(rèn)為,在一個(gè)系統(tǒng)中,數(shù)據(jù)一致性(Consistency,C)、服務(wù)可用性(Availability,A)和分區(qū)容忍性(Partition Tolerance,P)這3個(gè)要素中只能同時(shí)滿足2個(gè)[3]. RDBMS通過弱化分區(qū)容忍性(即P)來保證ACID準(zhǔn)則,屬于“CA”系統(tǒng). 因此,在面對(duì)海量數(shù)據(jù)時(shí),將難以快速提升性能(數(shù)據(jù)量的增加要求有更高的分區(qū)容忍性,因數(shù)據(jù)一般以分區(qū)的形式存儲(chǔ)于DBMS中). 而大數(shù)據(jù)應(yīng)用的特點(diǎn)是查詢操作占絕大部分,可弱化數(shù)據(jù)一致性(即C)來提升性能,因此,“PA”系統(tǒng)更適合該類應(yīng)用場(chǎng)景. CPA定理盡管提出于多年以前,但經(jīng)歷過12 a的軟、硬件技術(shù)發(fā)展,Eric Brewer于2012年重新審視該定律時(shí),認(rèn)為其依然成立[4].
圖4 谷歌大數(shù)據(jù)架構(gòu)與Hadoop大數(shù)據(jù)架構(gòu)的聯(lián)系
互聯(lián)網(wǎng)行業(yè)廣泛采用大數(shù)據(jù)平臺(tái)架構(gòu)來解決大數(shù)據(jù)量環(huán)境下的數(shù)據(jù)計(jì)算問題. 2003年,谷歌發(fā)布了Google File System(GFS)的系統(tǒng)架構(gòu),提出了大數(shù)據(jù)和云計(jì)算環(huán)境下的高效數(shù)據(jù)存儲(chǔ)解決方案[5];2004年,谷歌發(fā)布了MapReduce編程模型,提出了分布式計(jì)算環(huán)境下的編程框架[6];2006年,谷歌發(fā)布了BigTable系統(tǒng),提出1種處理大數(shù)據(jù)的非關(guān)系型數(shù)據(jù)庫[7]. 這3個(gè)系統(tǒng)及對(duì)應(yīng)的3篇論文的發(fā)表,基本確定了現(xiàn)代大數(shù)據(jù)處理系統(tǒng)的基礎(chǔ)架構(gòu). 與谷歌公司的系統(tǒng)相對(duì)應(yīng),開源組織Apache 的Hadoop也提供了其開源解決方案. 二者對(duì)應(yīng)關(guān)系如圖4所示. 從近20 a的實(shí)際應(yīng)用效果來看,非常好地滿足了大數(shù)據(jù)環(huán)境下數(shù)據(jù)處理對(duì)性能、穩(wěn)定性和易用性的要求.
3.1.3 廣東省聯(lián)網(wǎng)中心大數(shù)據(jù)應(yīng)用的系統(tǒng)架構(gòu)介紹
廣東省聯(lián)網(wǎng)中心數(shù)據(jù)中臺(tái)的大數(shù)據(jù)存儲(chǔ)和計(jì)算引擎是基于Apache Hadoop大數(shù)據(jù)框架系統(tǒng)構(gòu)建. 在基礎(chǔ)設(shè)施服務(wù)層(Infrastructure as a Service,IaaS),由超過100臺(tái)PC服務(wù)器,逾600核計(jì)算單元和2.4 TB內(nèi)存構(gòu)成,保證計(jì)算資源充足可用,成本可控. 在計(jì)算模型方面,支持MR、DAG、SQL和ML,既能滿足一般業(yè)務(wù)人員,以及熟悉SQL的工程師的需求,又能滿足新一代技術(shù)人員對(duì)DAG和ML的需求,保證技術(shù)友好性. 在集群類型方面,既支持基于分析集群的離線計(jì)算,又支持流式集群的實(shí)時(shí)計(jì)算,且能和聯(lián)網(wǎng)收費(fèi)系統(tǒng)的數(shù)據(jù)傳輸通道無縫對(duì)接,保證了數(shù)據(jù)的實(shí)時(shí)性和完整性.
徐子沛[8]認(rèn)為從Data.gov開展,面向數(shù)據(jù)領(lǐng)域的服務(wù)平臺(tái)逐漸成為大數(shù)據(jù)應(yīng)用行業(yè)的主流,這在一定程度上,是被近10 a證實(shí)了的預(yù)見. 國家《新一代人工智能發(fā)展規(guī)劃》中明確了重點(diǎn)工作是“圍繞增加人工智能創(chuàng)新的源頭供給,從前沿基礎(chǔ)理論、關(guān)鍵共性技術(shù)、基礎(chǔ)平臺(tái)、人才隊(duì)伍等方面強(qiáng)化部署……”[9],其實(shí)質(zhì),是把平臺(tái)作為理論、技術(shù)和人才隊(duì)伍的載體. 可見,一個(gè)良好的人工智能服務(wù)平臺(tái)是開展行業(yè)大數(shù)據(jù)應(yīng)用的支撐. 這里所說的人工智能服務(wù)平臺(tái),是指集成了多種人工智能關(guān)鍵共性技術(shù)的操作系統(tǒng),各種人工智能計(jì)算能力通過服務(wù)的形式在平臺(tái)上提供,是“平臺(tái)即服務(wù)(Platform as a Service,PaaS)”的云計(jì)算服務(wù)模式在大數(shù)據(jù)與人工智能領(lǐng)域的具體實(shí)現(xiàn).
廣東省聯(lián)網(wǎng)中心數(shù)據(jù)中臺(tái)基于互聯(lián)網(wǎng)行業(yè)成熟的大數(shù)據(jù)云平臺(tái)解決方案,構(gòu)建了涵蓋備數(shù)據(jù)匯聚、數(shù)據(jù)處理、基礎(chǔ)支撐、平臺(tái)管理、人工智能和大數(shù)據(jù)開發(fā)等支撐能力的服務(wù)平臺(tái). 數(shù)據(jù)匯聚具備實(shí)時(shí)或離線從各種數(shù)據(jù)源采集數(shù)據(jù)的能力;數(shù)據(jù)處理具備實(shí)時(shí)計(jì)算和離線分析等數(shù)據(jù)加工能力;基礎(chǔ)支撐和平臺(tái)管理具備對(duì)各種數(shù)據(jù)業(yè)務(wù)的統(tǒng)一管理能力;人工智能和大數(shù)據(jù)開發(fā)提供對(duì)平臺(tái)匯聚的數(shù)據(jù)資源進(jìn)行各類人工智能應(yīng)用研發(fā)的能力.
在大數(shù)據(jù)時(shí)代,數(shù)據(jù)的分析和整合才是最大的挑戰(zhàn). 在國家政策層面,交通運(yùn)輸部于2019年發(fā)布的《推進(jìn)綜合交通運(yùn)輸大數(shù)據(jù)發(fā)展行動(dòng)綱要(2020—2025年)》中,明確提出夯實(shí)大數(shù)據(jù)發(fā)展基礎(chǔ)的主要任務(wù)之一,是“完善信息資源目錄編制、采集、傳輸、交換共享等標(biāo)準(zhǔn)規(guī)范”. 信息資源目錄作為組織開展數(shù)據(jù)的分析和整合的基礎(chǔ)工作之一,可被視為工作的起點(diǎn). 在行業(yè)技術(shù)層面,要讓計(jì)算機(jī)完成該項(xiàng)工作,就要讓其能理解數(shù)據(jù). 目前,行業(yè)普遍利用知識(shí)圖譜完成該項(xiàng)工作. 從狹義上理解,知識(shí)圖譜就是大規(guī)模的語義網(wǎng)絡(luò)(Semantic Web)[10]. 所謂“語義”,是指遵循1個(gè)統(tǒng)一的標(biāo)準(zhǔn),給每1片信息賦予1個(gè)計(jì)算機(jī)都能理解的“意義”則是“元數(shù)據(jù)”[8]. 對(duì)于語義網(wǎng)絡(luò),構(gòu)建實(shí)體(Entity)、概念(Concept)及其之間的各種語義關(guān)系,是一件關(guān)鍵、基礎(chǔ)且重要的工作.
廣東省聯(lián)網(wǎng)中心數(shù)據(jù)中臺(tái)的建設(shè)團(tuán)隊(duì),從數(shù)據(jù)中臺(tái)技術(shù)建設(shè)開始,就同步開展數(shù)據(jù)資源目錄和元數(shù)據(jù)標(biāo)準(zhǔn)體系的編制工作. 到2020年6月,陸續(xù)發(fā)布了《廣東省聯(lián)網(wǎng)中心元數(shù)據(jù)標(biāo)準(zhǔn)》《廣東省聯(lián)網(wǎng)中心元數(shù)據(jù)目錄》《廣東省聯(lián)網(wǎng)中心元數(shù)據(jù)管理制度》,并初步構(gòu)建了元數(shù)據(jù)目錄管理系統(tǒng),實(shí)現(xiàn)元數(shù)據(jù)的查詢和維護(hù). 事實(shí)證明,此項(xiàng)工作是后續(xù)開展數(shù)據(jù)治理、數(shù)據(jù)研發(fā)利用和數(shù)據(jù)安全管理的基礎(chǔ),所以,可被稱為廣東省聯(lián)網(wǎng)中心開展行業(yè)大數(shù)據(jù)應(yīng)用的起點(diǎn).
2020年3月30日中共中央、國務(wù)院《關(guān)于構(gòu)建更加完善的要素市場(chǎng)化配置體制機(jī)制的意見》中,明確將數(shù)據(jù)作為一種新型生產(chǎn)要素. 為保證新型生產(chǎn)要素能充分釋放其價(jià)值,全國人大于2021年6月10日通過《中華人民共和國數(shù)據(jù)安全法》,將于2021年9月1日起施行,于2021年8月20日通過《中華人民共和國個(gè)人信息保護(hù)法》,將于2021年11月1日是起施行. 上述法律的陸續(xù)出臺(tái),對(duì)行業(yè)大數(shù)據(jù)應(yīng)用在安全方面提出了更嚴(yán)格的要求.
廣東省聯(lián)網(wǎng)中心在開展大數(shù)據(jù)應(yīng)用時(shí),充分考慮到數(shù)據(jù)安全對(duì)整個(gè)開發(fā)應(yīng)用鏈條的重要性. 從一開始,廣東省聯(lián)網(wǎng)中心就為數(shù)據(jù)的開發(fā)利用,在組織內(nèi)部發(fā)布了一系列的制度規(guī)范,包括《數(shù)據(jù)分類分級(jí)保護(hù)制度》《數(shù)據(jù)資源開發(fā)利用管理制度》《數(shù)據(jù)安全服務(wù)與運(yùn)營制度》等,對(duì)數(shù)據(jù)的收集、存儲(chǔ)、使用、加工、傳輸、提供等工作中的人與行為進(jìn)行了規(guī)范,為大數(shù)據(jù)應(yīng)用提供了重要保障.
為提高廣東省防疫抗疫工作的科學(xué)性、精準(zhǔn)性和實(shí)時(shí)性,廣東省聯(lián)網(wǎng)中心基于數(shù)據(jù)中臺(tái),充分發(fā)揮大數(shù)據(jù)優(yōu)勢(shì),為廣東省應(yīng)急廳、公安廳、交通運(yùn)輸廳、各地市交通局提供了多項(xiàng)“云戰(zhàn)疫”交通大數(shù)據(jù)服務(wù),建立起集防控圍欄標(biāo)定、數(shù)據(jù)融合處理、信息精準(zhǔn)推送等全流程功能為一體的精準(zhǔn)防疫數(shù)據(jù)服務(wù),實(shí)現(xiàn)廣東省高速公路防疫工作的信息化和系統(tǒng)化,實(shí)現(xiàn)全天候監(jiān)測(cè)分析離(入)粵涉疫車輛,為疫情流調(diào)溯源工作提供了精準(zhǔn)的高速公路通行數(shù)據(jù)支撐,為科學(xué)精準(zhǔn)防疫發(fā)揮了重要作用.
該服務(wù)基于廣東省聯(lián)網(wǎng)中心數(shù)據(jù)中臺(tái)的流式集群構(gòu)建,通過對(duì)目標(biāo)車輛在高速公路的通行流水進(jìn)行實(shí)時(shí)流式處理,實(shí)現(xiàn)對(duì)符合監(jiān)控要求的車輛通行信息進(jìn)行甄別、轉(zhuǎn)換、業(yè)務(wù)處理和按需推送等操作,從而實(shí)現(xiàn)向有關(guān)部門的監(jiān)控系統(tǒng)提供實(shí)時(shí)數(shù)據(jù)服務(wù). 系統(tǒng)的框架如圖5所示.
圖5 廣東省聯(lián)網(wǎng)中心防疫數(shù)據(jù)服務(wù)系統(tǒng)架構(gòu)示意圖
從2020年初,廣東省聯(lián)網(wǎng)中心就持續(xù)向相關(guān)部門提供該數(shù)據(jù)服務(wù). 如,武漢疫情期間,我們克服“點(diǎn)亮費(fèi)顯”工程正在如火如荼開展的困難,提供了鄂車入粵、經(jīng)鄂入粵、粵車往鄂返粵、鄂籍車主返程等多項(xiàng)防疫數(shù)據(jù)服務(wù). 香港疫情期間,我們針對(duì)港牌車進(jìn)入服務(wù)區(qū)的情況提供數(shù)據(jù)預(yù)警,支撐服務(wù)區(qū)管理人員引導(dǎo)港牌車輛進(jìn)入專門的隔離區(qū)域停放和休整. 廣州疫情期間,我們實(shí)現(xiàn)從廣州市和佛山市的高速公路入口進(jìn)入高速公路的車輛信息在其行駛至省界前3個(gè)門架時(shí)實(shí)時(shí)向檢查站推送車輛相關(guān)信息,為檢查站精準(zhǔn)甄別疫區(qū)出省車輛提供數(shù)據(jù)支撐,同時(shí),還實(shí)現(xiàn)了車輛離開廣州區(qū)域時(shí)向車主發(fā)送“出省需有48 h內(nèi)核酸陰性證明”的提示短信,提高了相關(guān)防疫政策的精準(zhǔn)觸達(dá)率.
為提高高速公路管理水平,發(fā)揮現(xiàn)有交通資源的優(yōu)勢(shì),在一定程度上緩解高速公路擁堵狀況,廣東省聯(lián)網(wǎng)中心基于數(shù)據(jù)中臺(tái),充分發(fā)揮大數(shù)據(jù)的優(yōu)勢(shì),建立了全省各路段的車流量預(yù)測(cè)模型,為路段業(yè)主緩解交通擁堵提供了1種除道路改擴(kuò)建外的有效途徑.
該預(yù)測(cè)模型通過建立一套包括長短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)和生成對(duì)抗網(wǎng)絡(luò)(GAN),對(duì)實(shí)時(shí)輸入的全省車流量信息未來2 h內(nèi)每5、15、30 min等時(shí)間粒度車流量數(shù)據(jù)進(jìn)行滾動(dòng)預(yù)測(cè),其加權(quán)平均準(zhǔn)確率達(dá)到95%.
圖6和圖7顯示了廣東省某一收費(fèi)單元車流量預(yù)測(cè)值和實(shí)際值的回歸驗(yàn)證結(jié)果. 可看到,圖中的虛線(即預(yù)測(cè)值)與實(shí)線(即實(shí)際值)具有很高的吻合程度. 同時(shí),可留意到,在實(shí)線框框出的一組數(shù)據(jù)中,實(shí)際值出現(xiàn)了之前從未有過的車流量態(tài)勢(shì),而預(yù)測(cè)值也能很好地預(yù)測(cè)出這一態(tài)勢(shì).
圖6 廣東省聯(lián)網(wǎng)中心某收費(fèi)單元車流量回歸驗(yàn)證示意圖(1)
圖7 廣東省聯(lián)網(wǎng)中心某收費(fèi)單位車流量回歸驗(yàn)證示意圖(2)
為提高對(duì)非法運(yùn)營車輛和運(yùn)營行為的打擊效率,提升執(zhí)法人員的精準(zhǔn)布控水平,廣東省聯(lián)網(wǎng)中心基于數(shù)據(jù)中臺(tái),充分分揮大數(shù)據(jù)的優(yōu)勢(shì),為廣東省交通運(yùn)輸廳執(zhí)法部門建立了高速公路非法運(yùn)營車輛通行特征識(shí)別系統(tǒng).
該系統(tǒng)利用決策樹算法建立起非法營運(yùn)車輛通行行為的特征規(guī)則,并利用歷史執(zhí)法樣本建立起基于循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的識(shí)別算法. 這樣做的目的,一是建立起一套可解釋的執(zhí)法規(guī)則解釋機(jī)制,二是建立起符合此規(guī)則的更高效的行為識(shí)別系統(tǒng),實(shí)現(xiàn)了執(zhí)法知識(shí)與經(jīng)驗(yàn)到系統(tǒng)能力的轉(zhuǎn)變.
在2021年下半年的實(shí)際應(yīng)用中,此算法共識(shí)別出了1 500多輛非法營運(yùn)車輛,后續(xù)通過執(zhí)法結(jié)果驗(yàn)證,識(shí)別準(zhǔn)確率達(dá)到85%. 從2021年10月起,廣東省相關(guān)執(zhí)法部門開展的高速公路出入口秩序集中整治行動(dòng)中,根據(jù)系統(tǒng)產(chǎn)生的執(zhí)法線索進(jìn)行精準(zhǔn)執(zhí)法,僅一天晚上就成功查處超過30臺(tái)違法車輛,相關(guān)成效將在應(yīng)用過程中逐步展現(xiàn).
從國家一系列政策和法律法規(guī)的出臺(tái),到各地的實(shí)踐性應(yīng)用情況都表明,交通大數(shù)據(jù)與人工智能應(yīng)用正處于快速發(fā)展階段. 廣東省聯(lián)網(wǎng)中心的研究與實(shí)踐結(jié)果表明,利用合理的大數(shù)據(jù)系統(tǒng)架構(gòu),通過將高速公路聯(lián)網(wǎng)收費(fèi)行業(yè)的數(shù)據(jù)資源與大數(shù)據(jù)和人工智能算法技術(shù)進(jìn)行跨界融合,能賦能各級(jí)主管部門,在精準(zhǔn)防疫、實(shí)時(shí)車流分析與預(yù)測(cè)、高速精準(zhǔn)執(zhí)法等方面發(fā)揮實(shí)際作用,能助力高速公路營運(yùn)機(jī)構(gòu)落實(shí)創(chuàng)新驅(qū)動(dòng)、提升管理水平. 在大數(shù)據(jù)與人工智能發(fā)展的熱潮中,高速公路行業(yè)的數(shù)字化轉(zhuǎn)型一定能發(fā)揮更大的增值應(yīng)用價(jià)值.