王 健,徐 煒,張 寧,婁永梅,朱 國(guó),章瀾嵐
(1. 南京地鐵建設(shè)有限責(zé)任公司,南京 210024;2. 東南大學(xué)自動(dòng)化學(xué)院,南京 210018;3. 東南大學(xué)智能運(yùn)輸系統(tǒng)研究中心軌道交通研究所,南京 210018;4. 北京全路通信信號(hào)研究設(shè)計(jì)院集團(tuán)有限公司,北京 100073;5. 南京熊貓信息產(chǎn)業(yè)有限公司,南京 210008)
“十三五”以來(lái),我國(guó)綜合交通運(yùn)輸體系不斷完善,城市軌道交通運(yùn)營(yíng)里程已經(jīng)位居世界第一,很多城市的軌道交通已經(jīng)進(jìn)入規(guī)?;途W(wǎng)絡(luò)化運(yùn)營(yíng)管理時(shí)期。軌道交通網(wǎng)絡(luò)化運(yùn)營(yíng)管理的特征是多樣化、層次化、精細(xì)化,互聯(lián)互通、資源共享,靈活供需調(diào)節(jié)、統(tǒng)籌協(xié)調(diào)管理[1-4],要求能夠根據(jù)線網(wǎng)的實(shí)時(shí)狀態(tài),實(shí)現(xiàn)各線路統(tǒng)一管理、協(xié)調(diào)運(yùn)作,其基礎(chǔ)是對(duì)獲得的各專業(yè)運(yùn)營(yíng)生產(chǎn)數(shù)據(jù)以及外部支撐信息進(jìn)行充分有效的整合、挖掘,形成基于大數(shù)據(jù)驅(qū)動(dòng)的車站-線路-線網(wǎng)多層次決策體系。然而,由于對(duì)實(shí)際需求和管理服務(wù)手段認(rèn)識(shí)不足,存在多系統(tǒng)缺乏協(xié)調(diào)聯(lián)動(dòng)、供需協(xié)調(diào)難度大、信息交換效率低下等問(wèn)題[4-6],嚴(yán)重制約了軌道交通系統(tǒng)的整體效能發(fā)揮。在規(guī)?;途W(wǎng)絡(luò)化運(yùn)營(yíng)管理階段,如何通過(guò)大數(shù)據(jù)平臺(tái)建設(shè),打破各系統(tǒng)之間的“信息孤島”,突破“煙囪式”應(yīng)用建設(shè),增強(qiáng)信息交互,提升數(shù)據(jù)安全性和可靠性,以提升城市軌道交通系統(tǒng)的運(yùn)營(yíng)管理效率和服務(wù)水平,切實(shí)發(fā)揮其在城市公共交通系統(tǒng)中的骨干作用,成為當(dāng)前迫切需要解決的核心問(wèn)題。
筆者以南京線網(wǎng)指揮中心(network control center,NCC)為例,對(duì)城市軌道交通大數(shù)據(jù)平臺(tái)進(jìn)行詳細(xì)的研究和分析。
軌道交通大數(shù)據(jù)平臺(tái)架構(gòu)目前有以下幾種實(shí)現(xiàn)方式:一是基于傳統(tǒng)數(shù)據(jù)庫(kù),面向聯(lián)機(jī)事務(wù)處理(online transaction processing,OLTP),側(cè)重日常事務(wù)處理的具體業(yè)務(wù)系統(tǒng);二是基于數(shù)據(jù)倉(cāng)庫(kù),面向聯(lián)機(jī)分析處理(online analytical processing,OLAP),支持復(fù)雜分析操作,側(cè)重決策支持[7];三是基于數(shù)據(jù)湖,面向信息處理和高并發(fā)任務(wù),側(cè)重挖掘和提煉大規(guī)模的原始數(shù)據(jù)。依據(jù)是否采用虛擬化的云存儲(chǔ)和云計(jì)算平臺(tái),可以進(jìn)一步細(xì)化為對(duì)應(yīng)的物理架構(gòu)和云架構(gòu)[8-9]。這些實(shí)現(xiàn)方式在職能、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)處理模式、數(shù)據(jù)訪問(wèn)等方面存在顯著區(qū)別,具體如表1 所示。
表1 數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)湖的區(qū)別Tab. 1 Difference between data warehouse, database and data lake
圖1 線網(wǎng)指揮中心大數(shù)據(jù)平臺(tái)的總體架構(gòu)Fig. 1 System architecture
南京地鐵線網(wǎng)指揮中心(NCC)采用的是基于數(shù)據(jù)倉(cāng)庫(kù)物理架構(gòu)的大數(shù)據(jù)平臺(tái),包含數(shù)據(jù)采集、數(shù)據(jù)治理、數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)集市以及上層決策系統(tǒng)服務(wù)等模塊,其架構(gòu)如圖1 所示。其中,數(shù)據(jù)源層基于海量多源異構(gòu)原始數(shù)據(jù)采集和治理功能,形成線網(wǎng)數(shù)據(jù)資源目錄;混合式大數(shù)據(jù)平臺(tái)基于平臺(tái)邏輯架構(gòu)設(shè)計(jì)和物理架構(gòu)設(shè)計(jì),對(duì)存儲(chǔ)數(shù)據(jù)進(jìn)行重新組織,提高系統(tǒng)執(zhí)行效率和穩(wěn)定性;上層決策系統(tǒng)服務(wù)通過(guò)提供信息交互平臺(tái)和高性能運(yùn)算資源,為上層應(yīng)用提供支持。同時(shí),數(shù)據(jù)安全管理貫穿于數(shù)據(jù)傳輸、處理、分析和應(yīng)用的全過(guò)程。此外,通過(guò)網(wǎng)絡(luò)鏈接,對(duì)大量計(jì)算資源和存儲(chǔ)資源進(jìn)行統(tǒng)一管理與調(diào)度的云平臺(tái)和云計(jì)算技術(shù),主要應(yīng)用在南京地鐵線網(wǎng)指揮中心NCC 項(xiàng)目后續(xù)二期工程中(筆者將另文展開(kāi)論述)。
軌道交通數(shù)據(jù)來(lái)源有多種分類方法[10-11],根據(jù)其與軌道交通運(yùn)營(yíng)管理的關(guān)聯(lián)性,可以分為內(nèi)部數(shù)據(jù)、協(xié)同數(shù)據(jù)和外部數(shù)據(jù)三類。內(nèi)部數(shù)據(jù),包含地理信息數(shù)據(jù)等靜態(tài)數(shù)據(jù),以及客流數(shù)據(jù)、環(huán)境數(shù)據(jù)、票務(wù)數(shù)據(jù)、事件數(shù)據(jù)、能耗數(shù)據(jù)、各部門設(shè)備設(shè)施數(shù)據(jù)等動(dòng)態(tài)數(shù)據(jù);協(xié)同數(shù)據(jù),包含法律法規(guī)、公共交通、氣象、地質(zhì)災(zāi)害、醫(yī)療衛(wèi)生、安防等數(shù)據(jù);外部數(shù)據(jù),包含基站、互聯(lián)網(wǎng)地圖、大型活動(dòng)、社交媒體等數(shù)據(jù)。其中,包含了結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),也包含實(shí)時(shí)數(shù)據(jù)和歷史數(shù)據(jù),具有多源、異構(gòu)、動(dòng)態(tài)、多維度的特點(diǎn)。
為保證數(shù)據(jù)的完整性與準(zhǔn)確性,軌道交通更加突出自動(dòng)化數(shù)據(jù)采集,常見(jiàn)的數(shù)據(jù)接口方式包括Socket、Modbus TCP/IP 協(xié)議、HTTP 協(xié)議、消息隊(duì)列、FTP文件傳輸?shù)葘S媒涌趨f(xié)議或通信機(jī)制。此外,還包括人為主動(dòng)或被動(dòng)產(chǎn)生的數(shù)據(jù)、應(yīng)用爬蟲(chóng)技術(shù)采集的全網(wǎng)信息等。為保證數(shù)據(jù)的時(shí)效性,應(yīng)對(duì)軌道交通未來(lái)高速無(wú)人駕駛和精準(zhǔn)人臉識(shí)別等應(yīng)用在數(shù)據(jù)快速處理和分析方面提供支持,在數(shù)據(jù)采集和接入階段即需要運(yùn)用集群或分布式等架構(gòu),充分提高系統(tǒng)并行處理能力,同時(shí)降低各接口服務(wù)之間的耦合度,提高開(kāi)發(fā)效率。
南京地鐵NCC 系統(tǒng)通過(guò)數(shù)據(jù)接入平臺(tái),與線路綜合監(jiān)控系統(tǒng)(integrated supervisory control system,ISCS)、數(shù)據(jù)采集與監(jiān)視控制系統(tǒng)(supervisory control and data acquisition,SCADA)建立基于 TCP/IP 協(xié)議的冗余網(wǎng)絡(luò)連接,與移動(dòng)支付系統(tǒng)建立基于HTTP 協(xié)議的實(shí)時(shí)行程傳輸,與ACC 建立基于FTP 協(xié)議的歷史客流數(shù)據(jù)傳輸,與區(qū)域線路中心(zone line center,ZLC)建立基于Modbus TCP/IP 協(xié)議的冗余網(wǎng)絡(luò)連接。此外,還預(yù)留與地鐵公司其他相關(guān)系統(tǒng)(集團(tuán)辦公自動(dòng)化OA,資產(chǎn)管理系統(tǒng)等)、企業(yè)外部單位的信息接口。
由于軌道交通的數(shù)據(jù)分散在各個(gè)業(yè)務(wù)系統(tǒng)中,形成豎井式架構(gòu),造成多個(gè)信息孤島,導(dǎo)致數(shù)據(jù)冗余、數(shù)據(jù)不一致、有效性差、共享性差、擴(kuò)展性差等問(wèn)題。因此,軌道交通數(shù)據(jù)的有效融合需要數(shù)據(jù)治理(data governance)過(guò)程,即通過(guò)抽取、轉(zhuǎn)換、加載等方法,將軌道交通多源異構(gòu)數(shù)據(jù)抽取到臨時(shí)中間層進(jìn)行清洗、整合、探查、分析等處理,然后再存儲(chǔ)到統(tǒng)一的數(shù)據(jù)中心,實(shí)現(xiàn)高質(zhì)量的數(shù)據(jù)資產(chǎn),最終形成城市軌道交通線網(wǎng)數(shù)據(jù)資源目錄。
南京地鐵線網(wǎng)指揮中心大數(shù)據(jù)平臺(tái)數(shù)據(jù)治理主要包含以下內(nèi)容:
1) 數(shù)據(jù)標(biāo)準(zhǔn)管理:數(shù)據(jù)標(biāo)準(zhǔn)是數(shù)據(jù)治理的依據(jù),通過(guò)對(duì)基礎(chǔ)數(shù)據(jù)、指標(biāo)數(shù)據(jù)和二次數(shù)據(jù)制定統(tǒng)一的標(biāo)準(zhǔn),形成數(shù)據(jù)源和標(biāo)準(zhǔn)數(shù)據(jù)之間的映射。
2) 元數(shù)據(jù)管理:基于數(shù)據(jù)標(biāo)準(zhǔn),建立軌道交通數(shù)據(jù)倉(cāng)庫(kù)元數(shù)據(jù)模型(包含業(yè)務(wù)元數(shù)據(jù)、技術(shù)元數(shù)據(jù)、管理元數(shù)據(jù)3 個(gè)方面),促進(jìn)數(shù)據(jù)抽取、加載、轉(zhuǎn)換(extract-transform-load,ETL)過(guò)程的規(guī)范化,為數(shù)據(jù)質(zhì)量管理和主數(shù)據(jù)管理提供基礎(chǔ)。
3) 主數(shù)據(jù)管理:通過(guò)構(gòu)建統(tǒng)一完整的主數(shù)據(jù)視圖,解決部門之間的業(yè)務(wù)和數(shù)據(jù)交叉問(wèn)題,避免因業(yè)務(wù)和數(shù)據(jù)交叉導(dǎo)致的主數(shù)據(jù)不一致問(wèn)題。
4) 數(shù)據(jù)質(zhì)量管理:一方面,按照預(yù)定義的檢查規(guī)則,對(duì)數(shù)據(jù)的準(zhǔn)確性、有效性、一致性、關(guān)聯(lián)性和時(shí)效性進(jìn)行檢查,及時(shí)發(fā)現(xiàn)并掌握數(shù)據(jù)質(zhì)量問(wèn)題;另一方面,對(duì)存在質(zhì)量問(wèn)題數(shù)據(jù)的影響、成因和解決措施進(jìn)行分析和總結(jié),形成有效的閉環(huán)反饋。
5) 數(shù)據(jù)安全和隱私管理:根據(jù)數(shù)據(jù)安全級(jí)別,設(shè)置數(shù)據(jù)安全規(guī)則,制定安全管理策略,包含用戶隱私保護(hù)、數(shù)據(jù)可信傳輸和數(shù)據(jù)訪問(wèn)控制等。
6) 數(shù)據(jù)生命周期管理:對(duì)軌道交通數(shù)據(jù)創(chuàng)建、使用、更新、歸檔和銷毀的整個(gè)生命周期進(jìn)行有效管理。
大數(shù)據(jù)平臺(tái)綜合了多種數(shù)據(jù)存儲(chǔ)方式,其基礎(chǔ)是數(shù)據(jù)倉(cāng)庫(kù)。數(shù)據(jù)倉(cāng)庫(kù)的邏輯架構(gòu)設(shè)計(jì)直接關(guān)系到數(shù)據(jù)庫(kù)的性能和管理,在明確軌道交通各部門業(yè)務(wù)規(guī)則和業(yè)務(wù)對(duì)象的基礎(chǔ)上,通過(guò)抽象的方式描述業(yè)務(wù)中概念實(shí)體與實(shí)體之間的關(guān)系,由實(shí)體、屬性、關(guān)系三部分組成。數(shù)據(jù)倉(cāng)庫(kù)的邏輯架構(gòu)設(shè)計(jì)是面向所有系統(tǒng)的通用性模型,不針對(duì)任何單一應(yīng)用,保存的是不可拆分的原子粒度數(shù)據(jù)和輕度匯總數(shù)據(jù)。為了實(shí)現(xiàn)特定功能需求,還需要進(jìn)一步對(duì)各部門或主題的數(shù)據(jù)集市(data marts,DM)進(jìn)行相應(yīng)的邏輯架構(gòu)設(shè)計(jì)。
數(shù)據(jù)集市作為數(shù)據(jù)倉(cāng)庫(kù)的子集,是一種面向特定主題或部門需求而建立的分析環(huán)境,通過(guò)預(yù)先計(jì)算好相應(yīng)的數(shù)據(jù),滿足用戶對(duì)性能的需求,可以在一定程度上緩解數(shù)據(jù)倉(cāng)庫(kù)訪問(wèn)的瓶頸。因此,在其邏輯架構(gòu)的構(gòu)建過(guò)程中,更關(guān)注復(fù)雜的業(yè)務(wù)規(guī)則。
在數(shù)據(jù)集市建模中,提倡采用面向主題、穩(wěn)定、時(shí)變、非易失的維度建模,包含星型模式、雪花模式和星座模式等。運(yùn)用維度建模,需要根據(jù)業(yè)務(wù)分析模型,確定數(shù)據(jù)的粒度和每個(gè)事實(shí)所需要關(guān)聯(lián)的維度、屬性和層次,通過(guò)預(yù)先計(jì)算、保留冗余等方式,提高執(zhí)行效率,極大地提高數(shù)據(jù)倉(cāng)庫(kù)的性能。由于維度建模在業(yè)務(wù)發(fā)生變化時(shí)需要重新進(jìn)行維度定義,且無(wú)法保證數(shù)據(jù)來(lái)源的一致性和準(zhǔn)確性,所以不適用于數(shù)據(jù)倉(cāng)庫(kù)的底層。
因此,在大數(shù)據(jù)平臺(tái)的底層采用第三范式建模,構(gòu)建企業(yè)級(jí)數(shù)據(jù)倉(cāng)庫(kù)(enterprise data warehouse,EDW)邏輯架構(gòu)。第三范式建模是在數(shù)據(jù)庫(kù)建模中常見(jiàn)的建模方法,具有體系化、擴(kuò)展性好、避免冗余和更新異常的特點(diǎn),能夠保證數(shù)據(jù)來(lái)源的一致性、完整性和準(zhǔn)確性。
南京地鐵線網(wǎng)指揮中心采用自上而下的方法,基于企業(yè)級(jí)數(shù)據(jù)倉(cāng)庫(kù),為數(shù)據(jù)存取頻繁的信息系統(tǒng)構(gòu)建從屬型數(shù)據(jù)集市,提高查詢速度。在這種方法中,數(shù)據(jù)在進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)之后都進(jìn)行清洗和整理,之后才分發(fā)到數(shù)據(jù)集市中,這對(duì)于維護(hù)全局?jǐn)?shù)據(jù)的一致性十分有利。
隨著數(shù)據(jù)量的不斷增加,數(shù)據(jù)倉(cāng)庫(kù)的查詢性能急劇下降,產(chǎn)生嚴(yán)重延時(shí),對(duì)關(guān)鍵、實(shí)時(shí)、動(dòng)態(tài)數(shù)據(jù)進(jìn)行及時(shí)的分析和處理就顯得力不從心。同時(shí),跨專業(yè)、跨部門、跨領(lǐng)域的業(yè)務(wù)數(shù)據(jù)存在標(biāo)準(zhǔn)不一致等問(wèn)題,需要在深入了解業(yè)務(wù)需求的基礎(chǔ)上,通過(guò)主題模型設(shè)計(jì),對(duì)數(shù)據(jù)進(jìn)行重新組織。主題是指業(yè)務(wù)分析所需的某一方面信息,用于定義數(shù)據(jù)模型的范圍,為數(shù)據(jù)邏輯模型的設(shè)計(jì)提供總體框架。主題模型采用名稱和定義的形式來(lái)標(biāo)示所有的主題域,以一對(duì)一、一對(duì)多、多對(duì)多等形式標(biāo)示主題域之間的邏輯關(guān)系,滿足數(shù)據(jù)共享要求。
南京地鐵線網(wǎng)指揮中心大數(shù)據(jù)平臺(tái)設(shè)計(jì)了當(dāng)事人、路網(wǎng)、設(shè)備設(shè)施、行車、票務(wù)、渠道、OD、客流、清分、事件、能耗等11 個(gè)主題,各個(gè)主題之間存在著密切的關(guān)聯(lián)。其中,票務(wù)主題包含產(chǎn)品、交易、庫(kù)存、關(guān)系、票價(jià)等信息,客流主題包含多維基礎(chǔ)客流信息、修正信息、路徑集信息等,設(shè)備設(shè)施主題包含履歷表、分類、配置點(diǎn)、狀態(tài)檢測(cè)、關(guān)系、故障等信息,事件主題包含周邊環(huán)境、突發(fā)事件、天氣、節(jié)假日、應(yīng)急預(yù)案等信息。
軌道交通數(shù)據(jù)具有體量大、類型多樣、產(chǎn)生速度快、處理復(fù)雜、多元交互的特點(diǎn),使得傳統(tǒng)單機(jī)處理方式難以滿足其應(yīng)用的需求,需要對(duì)大數(shù)據(jù)平臺(tái)的物理架構(gòu)進(jìn)行優(yōu)化設(shè)計(jì)。適用于分布式環(huán)境下的混合數(shù)據(jù)物理架構(gòu),可以作為軌道交通數(shù)據(jù)處理的有效途徑,以滿足高擴(kuò)展、高吞吐、高可用的應(yīng)用需求,實(shí)現(xiàn)分類分級(jí)的數(shù)據(jù)共享。
大數(shù)據(jù)IO 密集和計(jì)算密集的特點(diǎn),決定了在云平臺(tái)上建立大數(shù)據(jù)應(yīng)用是必然趨勢(shì)。然而,傳統(tǒng)的基于虛擬機(jī)的云平臺(tái)技術(shù)和大數(shù)據(jù)技術(shù)存在技術(shù)沖突,目前包含南京地鐵在內(nèi)的多家軌道交通數(shù)據(jù)中心將大數(shù)據(jù)應(yīng)用進(jìn)行裸機(jī)(物理機(jī))部署。隨著容器化技術(shù)的成熟,可以通過(guò)運(yùn)用資源隔離和限制技術(shù),降低系統(tǒng)硬件要求和耦合度,實(shí)現(xiàn)性能與物理機(jī)幾乎無(wú)差別的多租戶應(yīng)用;根據(jù)資源的動(dòng)態(tài)需求變換,實(shí)時(shí)調(diào)整集群計(jì)算節(jié)點(diǎn)的類型和規(guī)模,達(dá)到錯(cuò)峰的目的,從而提高資源利用率,降低運(yùn)維成本。
軌道交通大數(shù)據(jù)平臺(tái)物理架構(gòu)設(shè)計(jì)的核心是運(yùn)用分布式技術(shù),為支撐系統(tǒng)提供可擴(kuò)展、可彈性配置的存儲(chǔ)資源和運(yùn)算資源。軌道交通數(shù)據(jù)混合式的大數(shù)據(jù)平臺(tái)可以分為以下三類:
1) 實(shí)時(shí)數(shù)據(jù)庫(kù):用于采集各業(yè)務(wù)系統(tǒng)實(shí)時(shí)數(shù)據(jù),通過(guò)快速提取和轉(zhuǎn)換,將源系統(tǒng)數(shù)據(jù)標(biāo)準(zhǔn)化,然后傳入數(shù)據(jù)倉(cāng)庫(kù)和可視化平臺(tái)進(jìn)行存儲(chǔ)和展示。
2) 分區(qū)數(shù)據(jù)倉(cāng)庫(kù):基于元數(shù)據(jù)和主題域,構(gòu)建具有高可擴(kuò)展性的數(shù)據(jù)倉(cāng)庫(kù),將多個(gè)具有獨(dú)立資源的分區(qū)運(yùn)行在不同的物理節(jié)點(diǎn)上,由數(shù)據(jù)庫(kù)系統(tǒng)進(jìn)行統(tǒng)一協(xié)調(diào)和管理,對(duì)用戶和上層應(yīng)用來(lái)說(shuō)依然是單一的系統(tǒng)鏡像。通過(guò)設(shè)置合理的分區(qū)鍵和連接方式,保證數(shù)據(jù)跨所有分區(qū)均勻分布,提高并行查詢效率。
3) 分布式系統(tǒng):通過(guò)將運(yùn)算資源和存儲(chǔ)資源虛擬化,為非結(jié)構(gòu)化數(shù)據(jù)提供獨(dú)立管理和智能檢索功能;為數(shù)據(jù)倉(cāng)庫(kù)提供定期的數(shù)據(jù)備份功能,避免因?yàn)橹鞅砩L(zhǎng)而降低數(shù)據(jù)查詢的性能;為海量數(shù)據(jù)分析處理提供運(yùn)算資源。
南京地鐵線網(wǎng)指揮中心大數(shù)據(jù)平臺(tái)采用Kafka 分布式消息發(fā)布訂閱系統(tǒng)、MPP 大規(guī)模并行處理架構(gòu)數(shù)據(jù)庫(kù)和Hadoop 分布式系統(tǒng),作為軌道交通大數(shù)據(jù)平臺(tái)的物理架構(gòu)。其中,Kafka 用來(lái)進(jìn)行實(shí)時(shí)數(shù)據(jù)采集和處理,MPP 數(shù)據(jù)庫(kù)用來(lái)進(jìn)行結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ),Hadoop 用來(lái)提供非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)和結(jié)構(gòu)化數(shù)據(jù)備份,以實(shí)現(xiàn)軌道交通海量多源異構(gòu)數(shù)據(jù)存儲(chǔ)和高效分析。
城市軌道交通大數(shù)據(jù)平臺(tái)面向上層決策系統(tǒng),除了提供統(tǒng)一、共享的數(shù)據(jù)資源以外,還面對(duì)多系統(tǒng)數(shù)據(jù)交互需要提供穩(wěn)定、可靠的信息交互支撐,面對(duì)高負(fù)荷的數(shù)據(jù)分析和挖掘應(yīng)用需要提供高性能的計(jì)算資源。
由于上層決策應(yīng)用系統(tǒng)間數(shù)據(jù)需求的異構(gòu)性,所以系統(tǒng)之間數(shù)據(jù)交互共享就會(huì)出現(xiàn)問(wèn)題,特別是在需要多個(gè)信息系統(tǒng)數(shù)據(jù)支撐的綜合決策中問(wèn)題尤為突出。這會(huì)導(dǎo)致上層決策系統(tǒng)依然處于孤立狀態(tài),因此需要一種獨(dú)立于各信息系統(tǒng)、完全解耦、能夠容納系統(tǒng)變化的中間信息交換平臺(tái)[12]。
南京地鐵線網(wǎng)指揮中心大數(shù)據(jù)平臺(tái)采用基于企業(yè)服務(wù)總線(enterprise service bus,ESB)技術(shù),構(gòu)建城市軌道交通信息交換平臺(tái),并制定信息交換規(guī)范。平臺(tái)基于多線程體系支撐,規(guī)范異構(gòu)系統(tǒng)的數(shù)據(jù)格式、交換和路由,消除不同應(yīng)用之間的技術(shù)差異,實(shí)現(xiàn)包括線網(wǎng)監(jiān)控、應(yīng)急處置、視頻分析、客流預(yù)測(cè)和仿真等不同系統(tǒng)和服務(wù)之間的信息交互。
對(duì)于需要批量存取共享數(shù)據(jù)的信息系統(tǒng),如客流預(yù)測(cè)系統(tǒng)和客流仿真系統(tǒng),可以直接與數(shù)據(jù)倉(cāng)庫(kù)進(jìn)行數(shù)據(jù)交互,其他信息系統(tǒng)可通過(guò)訪問(wèn)數(shù)據(jù)倉(cāng)庫(kù)的方式獲取交互數(shù)據(jù)。
高性能計(jì)算(high performance computing,HPC)基于高性能計(jì)算平臺(tái),充分利用數(shù)據(jù)中心的集群、分布式網(wǎng)絡(luò)以及專業(yè)硬件設(shè)備等高性能處理單元的聚合能力[13],運(yùn)用機(jī)器學(xué)習(xí)、人工智能、深度學(xué)習(xí)等方法進(jìn)行分析和建模,解決軌道交通網(wǎng)絡(luò)化運(yùn)營(yíng)中的復(fù)雜問(wèn)題。
目前,南京地鐵線網(wǎng)指揮中心大數(shù)據(jù)平臺(tái)在列車運(yùn)行圖編制、視頻目標(biāo)檢測(cè)和識(shí)別、線網(wǎng)客流仿真、客流分析和預(yù)測(cè)等具體應(yīng)用場(chǎng)景中,能夠提供高性能計(jì)算資源。例如:視頻分析系統(tǒng)運(yùn)用高性能GPU 集群,實(shí)現(xiàn)多路視頻實(shí)時(shí)智能分析(包括人員計(jì)數(shù)、人群密度分析、異常事件檢測(cè)等模塊);客流分析和預(yù)測(cè)系統(tǒng)利用分布式存儲(chǔ)和運(yùn)算資源,將復(fù)雜問(wèn)題分解為許多小部分,分配給不同的計(jì)算機(jī)處理,從而節(jié)約了整體計(jì)算時(shí)間,極大地提高了計(jì)算效率。
貫穿于整個(gè)城市軌道交通大數(shù)據(jù)平臺(tái)架構(gòu)的功能,除了以數(shù)據(jù)標(biāo)準(zhǔn)為核心的數(shù)據(jù)組織和數(shù)據(jù)治理外,還包含了數(shù)據(jù)安全管理功能,以滿足城市軌道交通在列車運(yùn)行等多種應(yīng)用場(chǎng)景下對(duì)于數(shù)據(jù)安全性和可靠性的需求。建立與城市軌道交通具體業(yè)務(wù)深度結(jié)合的數(shù)據(jù)安全管理模塊,是線網(wǎng)指揮大數(shù)據(jù)平臺(tái)的可靠性和合理性的必要保障。數(shù)據(jù)安全管理功能,除了最基本的物理環(huán)境數(shù)據(jù)安全保障外,還應(yīng)包含網(wǎng)絡(luò)通信安全管理和應(yīng)用分析安全管理,具體功能如下:
1) 物理環(huán)境安全:是數(shù)據(jù)安全最基礎(chǔ)的保障,通過(guò)對(duì)線網(wǎng)指揮數(shù)據(jù)中心機(jī)房設(shè)備進(jìn)行合理布置和安裝,為基礎(chǔ)支撐和業(yè)務(wù)應(yīng)用系統(tǒng)提供一個(gè)穩(wěn)定、安全、可靠的數(shù)據(jù)生成、處理、存儲(chǔ)和傳輸?shù)奈锢憝h(huán)境,有效防護(hù)靜電、溫濕度變化、電磁干擾等情況。
2) 網(wǎng)絡(luò)通信安全:面對(duì)具有高可靠和高優(yōu)先級(jí)需求的信息傳輸,充分利用各種軟硬件安全設(shè)備和產(chǎn)品,在邊界防護(hù)、入侵防范、集中管控等方面實(shí)現(xiàn)數(shù)據(jù)安全防護(hù),如為列車控制系統(tǒng)提供獨(dú)立、高可靠的冗余數(shù)據(jù)通信信道。
3) 業(yè)務(wù)應(yīng)用安全:分析和應(yīng)用安全進(jìn)一步與城市軌道交通業(yè)務(wù)相結(jié)合,一方面包含了對(duì)系統(tǒng)自身的脆弱性風(fēng)險(xiǎn)和漏洞的防范,運(yùn)用身份鑒別、訪問(wèn)控制、數(shù)據(jù)完整性和保密性驗(yàn)證、主備部署、數(shù)據(jù)備份和恢復(fù)等綜合性全生命周期管理手段,實(shí)現(xiàn)對(duì)應(yīng)用和(敏感)數(shù)據(jù)安全的可靠防護(hù);另一方面包含了城市軌道交通運(yùn)營(yíng)調(diào)度行為的可靠性評(píng)判,從輔助支撐線網(wǎng)指揮決策的角度,保證城市軌道交通運(yùn)營(yíng)的數(shù)據(jù)安全高效。
線網(wǎng)指揮中心大數(shù)據(jù)平臺(tái)是城市軌道交通最上層指揮調(diào)度系統(tǒng)的關(guān)鍵支撐,其架構(gòu)的合理設(shè)計(jì)和成功實(shí)施,對(duì)地鐵系統(tǒng)科學(xué)合理管理數(shù)據(jù)資產(chǎn)、安全高效協(xié)調(diào)管控系統(tǒng)和健全智能決策支持的實(shí)現(xiàn)起到至關(guān)重要的作用。筆者結(jié)合南京地鐵大數(shù)據(jù)平臺(tái)建設(shè)實(shí)例,自下而上地從數(shù)據(jù)采集治理、邏輯架構(gòu)和物理架構(gòu)設(shè)計(jì)、應(yīng)用支持、數(shù)據(jù)安全等多個(gè)角度,梳理軌道交通大數(shù)據(jù)平臺(tái)架構(gòu)的實(shí)現(xiàn)方案,對(duì)相應(yīng)的關(guān)鍵技術(shù)進(jìn)行詳細(xì)分析和探討。
線網(wǎng)指揮中心大數(shù)據(jù)平臺(tái)的建設(shè)是一個(gè)復(fù)雜、長(zhǎng)期的系統(tǒng)工程,會(huì)隨著業(yè)務(wù)需求的變化不斷完善,發(fā)揮自身數(shù)據(jù)富集的優(yōu)勢(shì),促進(jìn)城市軌道交通信息化、智能化發(fā)展。