邢小琴,王衛(wèi)東,王惠生,高利民
(1. 中國(guó)鐵道科學(xué)研究院 研究生部,北京 100081;2. 中國(guó)鐵道科學(xué)研究院 基礎(chǔ)設(shè)施檢測(cè)研究所,北京 100081)
“數(shù)據(jù)挖掘是一種技術(shù),它將傳統(tǒng)的數(shù)據(jù)分析方法與處理大量數(shù)據(jù)的復(fù)雜算法相結(jié)合,為探查和分析新的數(shù)據(jù)類型,以及采用新方法分析舊有數(shù)據(jù)類型提供了令人振奮的機(jī)會(huì)”,“是在大型數(shù)據(jù)存儲(chǔ)庫(kù)中,自動(dòng)地發(fā)現(xiàn)有用信息的過(guò)程”[1]。進(jìn)入21世紀(jì)以來(lái),隨著信息化技術(shù)在我國(guó)的發(fā)展和推進(jìn),國(guó)內(nèi)大中型企業(yè)大多都建立了先進(jìn)的信息化系統(tǒng),甚至構(gòu)建了數(shù)據(jù)倉(cāng)庫(kù),數(shù)據(jù)爆炸式的增長(zhǎng),人們?cè)絹?lái)越意識(shí)到應(yīng)用數(shù)據(jù)挖掘技術(shù)的重要性,迫切希望告別基于簡(jiǎn)單統(tǒng)計(jì)分析的“報(bào)表”決策時(shí)期,跨入使用數(shù)據(jù)挖掘技術(shù)的“知識(shí)”決策時(shí)代。
近幾年來(lái),隨著鐵路信息化建設(shè)的發(fā)展,我國(guó)逐步建成多個(gè)面向應(yīng)用的管理信息系統(tǒng),如貨物運(yùn)輸管理系統(tǒng)、旅客運(yùn)輸管理系統(tǒng)、列車調(diào)度命令系統(tǒng)、自動(dòng)列車身份認(rèn)證系統(tǒng)、車輛管理信息系統(tǒng)、通信信號(hào)管理信息系統(tǒng)、工務(wù)管理信息系統(tǒng)等[2]。但是,這些系統(tǒng)各自為政,鮮有信息交互,給跨部門(mén)協(xié)作帶來(lái)較大困難。針對(duì)這種現(xiàn)象,我國(guó)提出了建立鐵路智能運(yùn)輸系統(tǒng)的概念[3],目標(biāo)在于通過(guò)各個(gè)系統(tǒng)的協(xié)同工作,使固定設(shè)施、移動(dòng)設(shè)施和維修設(shè)施有機(jī)協(xié)調(diào)成為一個(gè)整體,以提高整個(gè)鐵路運(yùn)輸?shù)男?。為此,?guó)內(nèi)專家學(xué)者紛紛開(kāi)展了大量的基礎(chǔ)理論研究,如基于元數(shù)據(jù)的信息共享研究、基于XML 的通用數(shù)據(jù)模型研究、物聯(lián)網(wǎng)技術(shù)研究、云計(jì)算技術(shù)研究、知識(shí)推理、數(shù)據(jù)挖掘技術(shù)研究等,同時(shí)也在一些鐵路關(guān)鍵子系統(tǒng)內(nèi)進(jìn)行了應(yīng)用試驗(yàn)研究。在貨運(yùn)方面,通過(guò)對(duì)鐵路貨票歷史數(shù)據(jù)的挖掘分析預(yù)測(cè)未來(lái)的貨運(yùn)量,以便為鐵路各級(jí)管理者優(yōu)化運(yùn)力資源配置、策劃市場(chǎng)營(yíng)銷提供決策支持[4-6];針對(duì)貨運(yùn)客戶信息數(shù)據(jù)進(jìn)行挖掘,便于根據(jù)不同類別的貨主制定不同的優(yōu)惠措施,提高鐵路企業(yè)的客戶關(guān)系管理和決策水平[7]。在客運(yùn)方面,主要以鐵路客票發(fā)售和預(yù)定系統(tǒng)為研究主體,以數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘技術(shù)(主要是神經(jīng)網(wǎng)絡(luò)技術(shù))為手段建立客流分析預(yù)測(cè)模型,為鐵路部門(mén)合理安排客運(yùn)能力提供決策信息[8]。
目前,鐵路基礎(chǔ)設(shè)施管理維護(hù)部門(mén)積累了大量各專業(yè)的檢測(cè)/監(jiān)測(cè)數(shù)據(jù)和養(yǎng)護(hù)維修記錄,如工務(wù)的軌道、弓網(wǎng)專業(yè)數(shù)據(jù),電務(wù)的通信、信號(hào)專業(yè)數(shù)據(jù)。如何有效地利用這些海量數(shù)據(jù),通過(guò)數(shù)據(jù)挖掘和知識(shí)推理技術(shù),研究軌道、弓網(wǎng)、通信、信號(hào)各子系統(tǒng)內(nèi)部部件或參數(shù)之間的復(fù)雜關(guān)系,進(jìn)而分析預(yù)測(cè)其狀態(tài)和演變趨勢(shì),為養(yǎng)護(hù)維修部門(mén)的故障診斷、預(yù)防性養(yǎng)護(hù)維修提供參考。為此,從全路高速鐵路全球移動(dòng)通信系統(tǒng)(Global System for Mobile Communications for Railways,GSM-R)網(wǎng)絡(luò)的檢測(cè)/監(jiān)測(cè)數(shù)據(jù)入手,通過(guò)分析當(dāng)前各類數(shù)據(jù)的應(yīng)用現(xiàn)狀及需求,提出建立全路通信檢測(cè)/監(jiān)測(cè)數(shù)據(jù)分析平臺(tái),并且對(duì)平臺(tái)功能及結(jié)構(gòu)進(jìn)行整體規(guī)劃。
在 CTCS(Chinese Train Control System)-3級(jí)列車運(yùn)行控制系統(tǒng)(簡(jiǎn)稱C3列控系統(tǒng))中,GSM-R 網(wǎng)絡(luò)作為系統(tǒng)的一部分,為列車車載設(shè)備與無(wú)線閉塞中心(Radio Block Centre,RBC)提供雙向信息交互的通道。車載設(shè)備通過(guò) GSM-R 網(wǎng)絡(luò)接收 RBC 發(fā)出的線路參數(shù)、行車許可和臨時(shí)限速等信息;車載設(shè)備通過(guò) GSM-R 網(wǎng)絡(luò)向 RBC 傳送列車的運(yùn)行速度、位置等動(dòng)態(tài)信息。GSM-R 網(wǎng)絡(luò)狀態(tài)及服務(wù)質(zhì)量對(duì)C3列控系統(tǒng)運(yùn)行狀態(tài)具有重大影響。
列控系統(tǒng)遵循故障導(dǎo)向安全的原則,C3降級(jí)至 C2(CTCS-2級(jí)列控系統(tǒng))雖然不會(huì)引起重大安全事故,但在一定程度上會(huì)影響鐵路運(yùn)營(yíng)效率,亟需通過(guò)科學(xué)的方法從列控系統(tǒng)設(shè)備、GSM-R 網(wǎng)絡(luò)設(shè)備相關(guān)的大量數(shù)據(jù)中尋找規(guī)律,發(fā)現(xiàn)導(dǎo)致降級(jí)的深層次原因。
鐵路綜合檢測(cè)列車每月對(duì)高速鐵路線路的GSM-R 網(wǎng)絡(luò)進(jìn)行測(cè)試,測(cè)試主要內(nèi)容包括場(chǎng)強(qiáng)覆蓋、語(yǔ)音通信服務(wù)質(zhì)量和電路域服務(wù)質(zhì)量中的多個(gè)指標(biāo)。目前,對(duì)測(cè)試問(wèn)題的發(fā)現(xiàn)和原因分析完全依靠分析人員憑經(jīng)驗(yàn)判斷,受分析人員的經(jīng)驗(yàn)、精力,以及數(shù)據(jù)本身和分析工具的限制,尚無(wú)法對(duì)1條線路的多次測(cè)試數(shù)據(jù)進(jìn)行全面、多角度的比較分析和趨勢(shì)分析,使大量的檢測(cè)數(shù)據(jù)沒(méi)有得到充分的利用。
在鐵路局核心網(wǎng)機(jī)房安裝的 A 接口、應(yīng)用二進(jìn)制標(biāo)準(zhǔn)(Application Binary Interface Standard,ABIS)接口和主速率接口(Primary Rate Interface,PRI)監(jiān)測(cè)系統(tǒng),能夠?qū)軆?nèi)所有運(yùn)營(yíng)列車通過(guò)上述3個(gè)接口的信令和業(yè)務(wù)數(shù)據(jù)進(jìn)行全面監(jiān)測(cè)。按照中國(guó)鐵路總公司在2010年頒布的《 GSM-R 數(shù)字移動(dòng)通信網(wǎng)ABIS、A、PRI 接口監(jiān)測(cè)系統(tǒng)技術(shù)條件(V1.0)》,地面接口監(jiān)測(cè)系統(tǒng)除了實(shí)時(shí)監(jiān)測(cè)、記錄、解析網(wǎng)絡(luò)信令和列控?cái)?shù)據(jù)業(yè)務(wù)外,還具備 C3降級(jí)異常捕獲及一些指標(biāo)或參數(shù)的統(tǒng)計(jì)功能,供系統(tǒng)維護(hù)人員參考。網(wǎng)管系統(tǒng)可以對(duì)常見(jiàn)的網(wǎng)絡(luò)故障和異常進(jìn)行自動(dòng)檢測(cè)。然而,在實(shí)際應(yīng)用中,面對(duì)每天產(chǎn)生的海量監(jiān)測(cè)數(shù)據(jù),系統(tǒng)維護(hù)人員多是針對(duì)某個(gè)問(wèn)題在相關(guān)時(shí)間點(diǎn)內(nèi)的數(shù)據(jù)進(jìn)行查詢,而不可能有足夠的時(shí)間去深入分析數(shù)據(jù),導(dǎo)致大量數(shù)據(jù)信息閑置。
GSM-R 網(wǎng)絡(luò)動(dòng)態(tài)檢測(cè)、接口監(jiān)測(cè)數(shù)據(jù)是對(duì)鐵路通信網(wǎng)絡(luò)運(yùn)用質(zhì)量評(píng)價(jià)的重要依據(jù)。然而,這些數(shù)據(jù)資源的現(xiàn)狀卻是分散、保密、不流通的,成為一個(gè)個(gè)的信息孤島,真正價(jià)值無(wú)法得到實(shí)現(xiàn)。
(1)鐵道部基礎(chǔ)設(shè)施檢測(cè)中心的動(dòng)態(tài)檢測(cè)數(shù)據(jù)。目前,鐵道部基礎(chǔ)設(shè)施檢測(cè)中心已經(jīng)實(shí)現(xiàn)了綜合檢測(cè)列車動(dòng)態(tài)檢測(cè)數(shù)據(jù)的存儲(chǔ)管理,并且以文件的形式向鐵路局提供下載。但是,檢測(cè)文件需要檢測(cè)設(shè)備廠家提供的專用回放軟件才能進(jìn)行查看,數(shù)據(jù)分析人員無(wú)法獲取全面、有效的原始數(shù)據(jù)信息,只能局限于與測(cè)試指標(biāo)相關(guān)的部分信息。因此,由于數(shù)據(jù)格式保密,并且不得不以文件形式進(jìn)行存儲(chǔ)的方式大大限制了后續(xù)數(shù)據(jù)的分析應(yīng)用。
(2)鐵路局電務(wù)檢測(cè)車的檢測(cè)數(shù)據(jù)。目前,各鐵路局根據(jù)需要自主選擇不同廠家的通信檢測(cè)設(shè)備,用于鐵路局電務(wù)檢測(cè)車。對(duì)于鐵路局而言,即使同時(shí)擁有同一條線路的綜合檢測(cè)列車和鐵路局電務(wù)檢測(cè)車的檢測(cè)數(shù)據(jù),由于文件格式不相同依然會(huì)導(dǎo)致分析人員無(wú)法進(jìn)行融合分析。另外,即使綜合檢測(cè)列車和鐵路局電務(wù)檢測(cè)車使用相同的檢測(cè)設(shè)備,目前也沒(méi)有工具或手段能夠?qū)@2種格式相同的檢測(cè)數(shù)據(jù)或更多的數(shù)據(jù)進(jìn)行比較分析或趨勢(shì)分析。
(3)接口監(jiān)測(cè)數(shù)據(jù)。鐵路局核心網(wǎng)接口監(jiān)測(cè)系統(tǒng)、網(wǎng)管系統(tǒng)負(fù)責(zé)監(jiān)測(cè)運(yùn)營(yíng)旅客列車在 GSM-R網(wǎng)絡(luò)中的通信運(yùn)用情況,以及 GSM-R 網(wǎng)絡(luò)自身的狀態(tài),其監(jiān)測(cè)數(shù)據(jù)信息量大、內(nèi)容豐富。然而,由于各廠家對(duì)數(shù)據(jù)格式保密,網(wǎng)絡(luò)維護(hù)人員無(wú)法獲取原始數(shù)據(jù),也無(wú)法利用數(shù)據(jù)分析工具分析這些原始數(shù)據(jù),更無(wú)法將各類檢測(cè)數(shù)據(jù)、接口監(jiān)測(cè)數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析,進(jìn)而達(dá)到故障診斷、發(fā)現(xiàn)隱性故障的目的。另外,每個(gè)鐵路局使用的接口監(jiān)測(cè)系統(tǒng)不一樣,產(chǎn)生的數(shù)據(jù)格式也不盡相同。由此造成對(duì)于一條跨越多個(gè)鐵路局的高速鐵路,通過(guò)關(guān)聯(lián)各個(gè)接口監(jiān)測(cè)系統(tǒng)的數(shù)據(jù)無(wú)法了解全線的網(wǎng)絡(luò)運(yùn)用情況,上級(jí)單位只能看到各鐵路局分別給出的統(tǒng)計(jì)分析報(bào)表。
綜上所述,目前對(duì) GSM-R 網(wǎng)絡(luò)檢測(cè)/監(jiān)測(cè)數(shù)據(jù)的應(yīng)用還非常有限,主要停留在對(duì)當(dāng)時(shí)、當(dāng)次數(shù)據(jù)的簡(jiǎn)單統(tǒng)計(jì)和部分問(wèn)題的報(bào)警處理上,亟需利用高效的分析方法和手段對(duì)大量歷史數(shù)據(jù)進(jìn)行挖掘分析,從中找出有用的規(guī)律和知識(shí),幫助維護(hù)部門(mén)快速準(zhǔn)確地進(jìn)行故障診斷,并且提供合理的預(yù)防性養(yǎng)護(hù)維修決策支持。
為了有效利用 GSM-R 網(wǎng)絡(luò)的通信檢測(cè)/監(jiān)測(cè)數(shù)據(jù),首先應(yīng)建立全路數(shù)據(jù)共享平臺(tái),使各種數(shù)據(jù)成為可利用的資源,在此基礎(chǔ)上建立數(shù)據(jù)分析平臺(tái),利用數(shù)據(jù)挖掘技術(shù)為各級(jí)部門(mén)提供決策支持。全路GSM-R 網(wǎng)絡(luò)通信檢測(cè)/監(jiān)測(cè)數(shù)據(jù)分析平臺(tái)不僅為分析人員提供數(shù)據(jù)綜合分析應(yīng)用的條件,也為高校和科研院所創(chuàng)造科研開(kāi)發(fā)的環(huán)境,促進(jìn)數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、專家系統(tǒng)等方法和技術(shù)在鐵路通信業(yè)務(wù)中的應(yīng)用。
依托鐵路數(shù)據(jù)網(wǎng),實(shí)現(xiàn)全路電務(wù)系統(tǒng)內(nèi)通信相關(guān)業(yè)務(wù)部門(mén)之間數(shù)據(jù)信息的互聯(lián)互通。在此基礎(chǔ)上,動(dòng)態(tài)檢測(cè)數(shù)據(jù)、接口監(jiān)測(cè)數(shù)據(jù)、網(wǎng)管數(shù)據(jù)、RBC 司法記錄單元(RBC Judicial Record Units,RJRU)系統(tǒng)的監(jiān)測(cè)記錄(預(yù)留)、列控設(shè)備動(dòng)態(tài)監(jiān)測(cè)系統(tǒng)(Dynamic Monitoring System for Train Control Equipment,DMS)的監(jiān)測(cè)數(shù)據(jù)(預(yù)留)等實(shí)現(xiàn)在各級(jí)業(yè)務(wù)部門(mén)內(nèi)的流通,形成全路通信檢測(cè) / 監(jiān)測(cè)數(shù)據(jù)共享平臺(tái),如圖1所示。
圖1 全路通信檢測(cè) / 監(jiān)測(cè)數(shù)據(jù)共享平臺(tái)示意圖
(1)數(shù)據(jù)共享。在原始數(shù)據(jù)格式公開(kāi)的基礎(chǔ)上實(shí)現(xiàn)數(shù)據(jù)共享或提供數(shù)據(jù)接入適配單元,目的在于使存儲(chǔ)到平臺(tái)的數(shù)據(jù)具有統(tǒng)一的格式,這是保證數(shù)據(jù)可分析的前提條件。運(yùn)用數(shù)據(jù)共享平臺(tái),鐵路局可以獲取全面的動(dòng)態(tài)檢測(cè)數(shù)據(jù),作為故障診斷、網(wǎng)絡(luò)優(yōu)化的重要參考;鐵道部基礎(chǔ)設(shè)施檢測(cè)中心可以獲取測(cè)試終端、綜合檢測(cè)列車的接口監(jiān)測(cè)數(shù)據(jù),通過(guò)綜合分析提高檢測(cè)數(shù)據(jù)的分析質(zhì)量。
(2)分布式數(shù)據(jù)存儲(chǔ)管理。原則上各檢測(cè)、監(jiān)測(cè)系統(tǒng)所屬單位自行存儲(chǔ)其原始數(shù)據(jù)。在數(shù)據(jù)分析中心設(shè)置文件管理目錄系統(tǒng),各級(jí)單位可以對(duì)檢測(cè)/監(jiān)測(cè)數(shù)據(jù)文件進(jìn)行檢索和查詢,根據(jù)需要從平臺(tái)上獲取權(quán)限范圍內(nèi)的數(shù)據(jù)。
在數(shù)據(jù)共享平臺(tái)的基礎(chǔ)上,建立以數(shù)據(jù)挖掘、專家系統(tǒng)等技術(shù)為核心的數(shù)據(jù)分析平臺(tái),向全路各級(jí)用戶提供應(yīng)用服務(wù)。
2.2.1 數(shù)據(jù)分析平臺(tái)功能
數(shù)據(jù)分析平臺(tái)的功能劃分為以下3類,數(shù)據(jù)分析功能、檢測(cè)/監(jiān)測(cè)問(wèn)題閉環(huán)管理功能和決策支持功能,如圖2所示。其中數(shù)據(jù)分析功能為整個(gè)平臺(tái)的核心功能,是后面2類應(yīng)用功能的基礎(chǔ)。
圖2 數(shù)據(jù)分析及應(yīng)用
(1)數(shù)據(jù)分析功能。①全面的數(shù)據(jù)回放功能,能夠接入并且回放全路主流檢測(cè)系統(tǒng)產(chǎn)生的檢測(cè)數(shù)據(jù),具備多項(xiàng)指標(biāo)聯(lián)動(dòng)分析功能,具備信令分析功能。②典型故障自診斷功能,對(duì)動(dòng)態(tài)檢測(cè)、接口監(jiān)測(cè)中發(fā)現(xiàn)的典型問(wèn)題實(shí)現(xiàn)自動(dòng)診斷,可以將接口監(jiān)測(cè)數(shù)據(jù)與動(dòng)態(tài)檢測(cè)數(shù)據(jù)進(jìn)行融合分析。③網(wǎng)絡(luò)運(yùn)行狀態(tài)評(píng)價(jià)功能,通過(guò)對(duì)線路多次檢測(cè)、監(jiān)測(cè)結(jié)果的歷史數(shù)據(jù)進(jìn)行對(duì)比分析,分析網(wǎng)絡(luò)運(yùn)行狀態(tài)及其發(fā)展趨勢(shì)。④網(wǎng)絡(luò)運(yùn)用質(zhì)量評(píng)價(jià)功能,將接口監(jiān)測(cè)數(shù)據(jù)與動(dòng)態(tài)檢測(cè)數(shù)據(jù)進(jìn)行融合分析,結(jié)合實(shí)際列控系統(tǒng)車地通信應(yīng)用情況,對(duì)網(wǎng)絡(luò)運(yùn)用質(zhì)量進(jìn)行評(píng)價(jià)。⑤專題數(shù)據(jù)挖掘分析工具,針對(duì)實(shí)際應(yīng)用中的重點(diǎn)、難點(diǎn)問(wèn)題設(shè)計(jì)專用數(shù)據(jù)挖掘算法及流程,對(duì)分析結(jié)果進(jìn)行可視化展示。⑥其他分析工具,如指標(biāo)統(tǒng)計(jì)功能、報(bào)表輸出功能等。可以根據(jù)通信專業(yè)數(shù)據(jù)特點(diǎn)設(shè)計(jì)多種統(tǒng)計(jì)分析工具,供分析人員根據(jù)需要自行調(diào)用進(jìn)行感興趣的分析。
(2)檢測(cè)/監(jiān)測(cè)問(wèn)題閉環(huán)管理功能。鐵道部基礎(chǔ)設(shè)施檢測(cè)中心已經(jīng)實(shí)現(xiàn)對(duì)動(dòng)態(tài)檢測(cè)數(shù)據(jù)的閉環(huán)管理,包括檢測(cè)結(jié)果發(fā)布、問(wèn)題整改反饋、復(fù)測(cè)銷號(hào)等,未來(lái)還應(yīng)增加對(duì)接口監(jiān)測(cè)系統(tǒng)中存在問(wèn)題的閉環(huán)管理。
(3)決策支持功能。①分析 GSM-R 網(wǎng)絡(luò)狀態(tài)變化趨勢(shì)和 C3列控系統(tǒng)通信質(zhì)量,為網(wǎng)絡(luò)維護(hù)部門(mén)提供故障診斷、預(yù)防性維修計(jì)劃建議。②為鐵路局提供管內(nèi)線路網(wǎng)絡(luò)運(yùn)行狀態(tài)、C3列控系統(tǒng)運(yùn)用質(zhì)量的總體評(píng)價(jià),為鐵路局主管領(lǐng)導(dǎo)提供決策支持。③提供全路各線路網(wǎng)絡(luò)運(yùn)行狀態(tài)、C3列控系統(tǒng)運(yùn)用質(zhì)量的總體評(píng)價(jià),為中國(guó)鐵路總公司主管領(lǐng)導(dǎo)提供決策支持。
2.2.2 數(shù)據(jù)分析平臺(tái)結(jié)構(gòu)
數(shù)據(jù)分析平臺(tái)由數(shù)據(jù)集成及清洗(接入)、數(shù)據(jù)倉(cāng)庫(kù)(存儲(chǔ))、數(shù)據(jù)分析工具和可視化展示4個(gè)部分組成,如圖3所示。采用分布式數(shù)據(jù)挖掘方式,分別在鐵道部基礎(chǔ)設(shè)施檢測(cè)中心、鐵路局網(wǎng)管中心、電務(wù)檢測(cè)所等地建立數(shù)據(jù)倉(cāng)庫(kù),各數(shù)據(jù)倉(cāng)庫(kù)之間能夠進(jìn)行數(shù)據(jù)流通,并且按需配備分析工具。
全路 GSM-R 網(wǎng)絡(luò)通信檢測(cè)/監(jiān)測(cè)數(shù)據(jù)分析平臺(tái)的實(shí)現(xiàn),需要解決以下關(guān)鍵技術(shù)。
(1)設(shè)計(jì)檢測(cè)/監(jiān)測(cè)數(shù)據(jù)的統(tǒng)一接入格式和數(shù)據(jù)倉(cāng)庫(kù)結(jié)構(gòu)。對(duì)各類數(shù)據(jù)源進(jìn)行調(diào)研,綜合考慮數(shù)據(jù)功能和后續(xù)數(shù)據(jù)分析需要,設(shè)計(jì)統(tǒng)一數(shù)據(jù)接入格式和數(shù)據(jù)倉(cāng)庫(kù)結(jié)構(gòu)。
(2)研究網(wǎng)絡(luò)狀態(tài)表示模型、典型故障表示模型,建立網(wǎng)絡(luò)狀態(tài)數(shù)據(jù)庫(kù)和故障庫(kù)。研究GSM-R 網(wǎng)絡(luò)動(dòng)態(tài)檢測(cè)數(shù)據(jù)、地面接口監(jiān)測(cè)數(shù)據(jù)中關(guān)鍵特征量的提取、表示和特性分析,研究各特征量之間的關(guān)聯(lián)關(guān)系,建立網(wǎng)絡(luò)狀態(tài)表示模型;研究C3列控系統(tǒng)中運(yùn)營(yíng)列車列控信息的傳輸特性和傳輸質(zhì)量的表示方法;對(duì)檢測(cè)和實(shí)際應(yīng)用中發(fā)現(xiàn)的典型故障數(shù)據(jù)進(jìn)行分類整理,研究故障現(xiàn)象數(shù)據(jù)的特征量提取、表示和特性分析,研究各特征量之間的關(guān)聯(lián)關(guān)系,建立故障模型;形成網(wǎng)絡(luò)狀態(tài)數(shù)據(jù)庫(kù)和C3列控系統(tǒng)降級(jí)故障庫(kù)。
(3)研究數(shù)據(jù)挖掘技術(shù)在通信檢測(cè)/監(jiān)測(cè)數(shù)據(jù)中的應(yīng)用。調(diào)研系統(tǒng)內(nèi)各級(jí)單位的實(shí)際應(yīng)用需求,確定數(shù)據(jù)挖掘任務(wù),按照“數(shù)據(jù)整理—數(shù)據(jù)清洗—數(shù)據(jù)挖掘方法選擇—數(shù)據(jù)挖掘—模型驗(yàn)證”的思路逐步開(kāi)展研究工作。研究數(shù)據(jù)挖掘方法在數(shù)據(jù)分析平臺(tái)中的實(shí)現(xiàn),如應(yīng)用基于規(guī)則的分類方法設(shè)計(jì) C3降級(jí)故障分類器,實(shí)現(xiàn)降級(jí)故障自動(dòng)診斷功能。
圖3 數(shù)據(jù)分析平臺(tái)結(jié)構(gòu)
(4)研究數(shù)據(jù)本身及數(shù)據(jù)挖掘分析結(jié)果的可視化展示技術(shù)。研究業(yè)務(wù)數(shù)據(jù)的可視化技術(shù),便于分析人員多角度、動(dòng)態(tài)地觀察、跟蹤數(shù)據(jù);研究基于地理信息系統(tǒng)(Geographic Information System,GIS)的 GSM-R 網(wǎng)絡(luò)狀態(tài)、列控系統(tǒng)運(yùn)用質(zhì)量的可視化方法,以及動(dòng)態(tài)檢測(cè)/地面監(jiān)測(cè)中報(bào)警病害數(shù)據(jù)的動(dòng)態(tài)可視化展示技術(shù)。
基于鐵路通信專業(yè)各級(jí)單位的實(shí)際應(yīng)用需求,提出建設(shè)全路 GSM-R 網(wǎng)絡(luò)通信檢測(cè)/監(jiān)測(cè)數(shù)據(jù)分析平臺(tái)。該平臺(tái)建立在全路數(shù)據(jù)共享平臺(tái)的基礎(chǔ)上,利用計(jì)算機(jī)科學(xué)和數(shù)據(jù)挖掘領(lǐng)域的先進(jìn)技術(shù),解決鐵路電務(wù)部門(mén)生產(chǎn)中的實(shí)際問(wèn)題,實(shí)現(xiàn)生產(chǎn)方式由人工到自動(dòng)化、智能化的轉(zhuǎn)變,促進(jìn)全路數(shù)據(jù)分析應(yīng)用水平的提高,為養(yǎng)護(hù)維修部門(mén)的故障診斷、預(yù)防性養(yǎng)護(hù)維修提供參考,提高鐵路運(yùn)輸企業(yè)的生產(chǎn)效率。
:
[1]Pang-Ning Tan,Michael Steinbach,Vipin Kumar. 數(shù)據(jù)挖掘?qū)д揫M]. 范 明,范宏建,譯. 北京:人民郵電出版社,2013.
[2]Hanning Wang. Metadata-oriented Data Model Supporting Railway Distributed System Integration[J]. Journal Of Software,2012,7(4):814-822.
[3]徐 杰,賈利民,秦 勇,等. 鐵路智能運(yùn)輸系統(tǒng)通用信息平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)[J]. 中國(guó)鐵道科學(xué),2006,27(3):89-95.
[4]徐 薇,黃厚寬,李昆侖. 數(shù)據(jù)挖掘和數(shù)據(jù)倉(cāng)庫(kù)的關(guān)系研究[J]. 廣西師范大學(xué)學(xué)報(bào),2003,21(1):131-135.
[5]劉雄鵬,雷定猷. 基于數(shù)據(jù)倉(cāng)庫(kù)的鐵路貨票數(shù)據(jù)分析決策支持系統(tǒng)[J]. 電腦與信息技術(shù),2004(4):51-54.
[6]梁毅剛,耿立艷,張占福. 基于核主成分-最小二乘支持向量機(jī)的區(qū)域物流需求預(yù)測(cè)[J]. 鐵道運(yùn)輸與經(jīng)濟(jì),2012,34(11):63-67.
[7]鐘 雁,郭雨松. 數(shù)據(jù)挖掘技術(shù)在鐵路貨運(yùn)客戶細(xì)分中的應(yīng)用[J]. 北京交通大學(xué)學(xué)報(bào),2008,32(3):25-29.
[8]鄭 丹,王 耀. 數(shù)據(jù)挖掘在鐵路客流分析預(yù)測(cè)中的應(yīng)用[J]. 計(jì)算機(jī)系統(tǒng)應(yīng)用,2009(11):169-171.