李新琴,劉承亮,代明睿,李國華,史維峰
(中國鐵道科學(xué)研究院集團(tuán)有限公司 電子計(jì)算技術(shù)研究所,北京 100081)
鐵路運(yùn)輸設(shè)備狀態(tài)是鐵路安全運(yùn)輸?shù)母?,良好的設(shè)備狀態(tài)既是運(yùn)輸生產(chǎn)的物質(zhì)基礎(chǔ),又是運(yùn)輸安全的重要保證[1]。隨著鐵路運(yùn)營里程的積累和鐵路設(shè)備的更新迭代,積累了大量的鐵路運(yùn)輸設(shè)備故障數(shù)據(jù)。這些故障數(shù)據(jù)記錄了故障發(fā)生的詳細(xì)信息,包括故障的基礎(chǔ)信息和對(duì)故障的人工分析數(shù)據(jù),蘊(yùn)含了鐵路運(yùn)輸設(shè)備的重要價(jià)值信息??茖W(xué)分析設(shè)備故障數(shù)據(jù)是將故障從消極轉(zhuǎn)變?yōu)榉e極的有效途徑,但由于這些故障數(shù)據(jù)存在存儲(chǔ)分散、數(shù)據(jù)格式不同、存儲(chǔ)形式各異的情況,給數(shù)據(jù)分析帶來了困難[2]。知識(shí)圖譜能夠有效地將多源異構(gòu)數(shù)據(jù)轉(zhuǎn)化為基于深層語義的知識(shí)服務(wù),基于知識(shí)圖譜技術(shù)實(shí)現(xiàn)設(shè)備故障的深度挖掘和智能應(yīng)用,是分析鐵路運(yùn)輸設(shè)備故障數(shù)據(jù)的有效途徑[3-6]。
知識(shí)圖譜技術(shù)在各行業(yè)事故故障智能化服務(wù)中已得到了廣泛的研究和應(yīng)用。在電力行業(yè),李新鵬等人[7]通過構(gòu)建調(diào)度自動(dòng)化系統(tǒng)的知識(shí)圖譜,實(shí)現(xiàn)系統(tǒng)故障的智能診斷和分析;郭榕等人[8]針對(duì)電網(wǎng)故障處置預(yù)案數(shù)據(jù),構(gòu)建電網(wǎng)故障處置知識(shí)圖譜,提升了電網(wǎng)故障處置能力和智能化水平;在中石油領(lǐng)域,陳傳剛等人[9]構(gòu)建基于知識(shí)圖譜的站場故障預(yù)警模型,實(shí)現(xiàn)現(xiàn)場事故預(yù)警;在鐵路領(lǐng)域,楊連報(bào)等人[10]通過構(gòu)建鐵路設(shè)備事故故障部位知識(shí)圖譜,實(shí)現(xiàn)了設(shè)備故障關(guān)聯(lián)分析和原因推薦。基于各行業(yè)對(duì)知識(shí)圖譜構(gòu)建方法及應(yīng)用模式的研究,本文在研究鐵路運(yùn)輸設(shè)備安全保障體系的基礎(chǔ)上,提出了鐵路運(yùn)輸設(shè)備故障知識(shí)圖譜構(gòu)建與應(yīng)用架構(gòu),以及設(shè)備故障知識(shí)圖譜應(yīng)用場景。
為保障鐵路運(yùn)輸安全,面向鐵路運(yùn)輸系統(tǒng)構(gòu)建了健全的鐵路運(yùn)輸設(shè)備安全保障體系。在該體系下,可對(duì)運(yùn)輸設(shè)備的基礎(chǔ)信息、運(yùn)行維護(hù)(簡稱:運(yùn)維)信息及故障數(shù)據(jù)進(jìn)行有效管理。鐵路運(yùn)輸設(shè)備安全保障體系包含針對(duì)鐵路基礎(chǔ)設(shè)施設(shè)備構(gòu)建的鐵路運(yùn)輸設(shè)備監(jiān)測檢測系統(tǒng)、鐵路運(yùn)輸設(shè)備信息管理系統(tǒng)及鐵路運(yùn)營集成化平臺(tái),可實(shí)現(xiàn)鐵路運(yùn)輸設(shè)備的全生命周期管理、設(shè)備故障信息管理,以及設(shè)備故障數(shù)據(jù)一體化分析。鐵路運(yùn)輸安全保障體系架構(gòu)如圖1 所示。
圖1 鐵路運(yùn)輸設(shè)備安全保障體系
鐵路運(yùn)輸基礎(chǔ)設(shè)備設(shè)施主要指鐵路橋梁、道岔、信號(hào)機(jī)、接觸網(wǎng)、動(dòng)車組等固定設(shè)備和移動(dòng)設(shè)備。鐵路運(yùn)輸設(shè)備故障數(shù)據(jù)管理和設(shè)備全生命周期管理主要是圍繞鐵路運(yùn)輸基礎(chǔ)設(shè)備設(shè)施開展安全監(jiān)控和信息化建設(shè)。
鐵路運(yùn)輸設(shè)備故障數(shù)據(jù)管理可實(shí)現(xiàn)設(shè)備基礎(chǔ)信息、維修維護(hù)、故障信息的全面管理。鐵路運(yùn)輸設(shè)備信息管理系統(tǒng)中存儲(chǔ)了大量的設(shè)備故障數(shù)據(jù),這些數(shù)據(jù)記載了設(shè)備故障發(fā)生的詳細(xì)情況,包括故障發(fā)生的時(shí)間、線別、鐵路局集團(tuán)公司、車間、故障部位、原因分析等數(shù)據(jù)。根據(jù)數(shù)據(jù)來源和價(jià)值,可將其分為客觀記實(shí)、主觀選項(xiàng)及主觀描述等數(shù)據(jù)。
(1)客觀記實(shí)數(shù)據(jù)
客觀記實(shí)數(shù)據(jù)主要包括故障發(fā)生的時(shí)間、線別、鐵路局集團(tuán)公司、車間等數(shù)據(jù),這些數(shù)據(jù)可根據(jù)故障的具體情況直接通過鐵路運(yùn)輸設(shè)備信息管理系統(tǒng)的選項(xiàng)進(jìn)行選擇??陀^記實(shí)數(shù)據(jù)是不可更改的事實(shí),具有真實(shí)性,通常以結(jié)構(gòu)化形式存儲(chǔ)。
(2)主觀選項(xiàng)數(shù)據(jù)
主觀選項(xiàng)數(shù)據(jù)主要包括故障發(fā)生的部位、故障原因分類等數(shù)據(jù)。這些數(shù)據(jù)是相關(guān)人員通過對(duì)故障的分析,根據(jù)信息系統(tǒng)的選項(xiàng)進(jìn)行選擇,通常以結(jié)構(gòu)化形式存儲(chǔ)。由于人員對(duì)故障數(shù)據(jù)認(rèn)知經(jīng)驗(yàn)不同,通常,故障原因分類數(shù)據(jù)存在隨意性。
(3)主觀描述數(shù)據(jù)
主觀描述數(shù)據(jù)主要是指故障原因分析數(shù)據(jù)。此類數(shù)據(jù)以大段的文本形式記錄了故障發(fā)生的現(xiàn)象、原因分析、處理結(jié)果、原因定性等內(nèi)容,是人員根據(jù)自身經(jīng)驗(yàn)對(duì)故障的詳細(xì)分析描述,蘊(yùn)含重要價(jià)值。主觀描述數(shù)據(jù)以非結(jié)構(gòu)化文本的形式進(jìn)行存儲(chǔ)。
鐵路運(yùn)輸設(shè)備的全生命周期管理包括對(duì)設(shè)備的狀態(tài)巡檢、維護(hù)維修、計(jì)劃保養(yǎng)、檔案管理和決策分析。通過構(gòu)建工務(wù)、電務(wù)、供電等專業(yè)的檢測監(jiān)測系統(tǒng),實(shí)現(xiàn)設(shè)備狀態(tài)的實(shí)時(shí)采集和監(jiān)控,有效輔助設(shè)備信息管理,進(jìn)行設(shè)備故障檢測、故障數(shù)據(jù)管理和故障數(shù)據(jù)分析。
設(shè)備故障一體化分析主要基于鐵路運(yùn)營集成化平臺(tái)實(shí)現(xiàn)鐵路各專業(yè)的設(shè)備信息匯集,打破設(shè)備信息傳遞阻隔,實(shí)現(xiàn)設(shè)備的跨專業(yè)分析。通過對(duì)鐵路運(yùn)輸設(shè)備故障數(shù)據(jù)的類別分析可知,設(shè)備故障數(shù)據(jù)包括結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),且蘊(yùn)含價(jià)值豐富,知識(shí)圖譜能夠有效的組織和表達(dá)結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),并將其進(jìn)行充分的關(guān)聯(lián),實(shí)現(xiàn)數(shù)據(jù)的分析與挖掘。因此,基于知識(shí)圖譜技術(shù)實(shí)現(xiàn)故障知識(shí)的構(gòu)建和故障數(shù)據(jù)的科學(xué)分析,是分析鐵路設(shè)備故障數(shù)據(jù)的有效方法。
鐵路運(yùn)輸設(shè)備故障知識(shí)圖譜的構(gòu)建過程主要包括設(shè)備故障本體結(jié)構(gòu)定義、知識(shí)抽取及知識(shí)對(duì)齊。
本體結(jié)構(gòu)定義是構(gòu)建鐵路運(yùn)輸設(shè)備故障知識(shí)圖譜的首要環(huán)節(jié),通過對(duì)鐵路運(yùn)輸設(shè)備故障結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)的全面分析,定義設(shè)備故障的知識(shí)單元、知識(shí)單元關(guān)系和知識(shí)層次結(jié)構(gòu),將設(shè)備故障數(shù)據(jù)有序地組織為知識(shí)圖譜結(jié)構(gòu),如圖2 所示。
圖2 鐵路運(yùn)輸設(shè)備故障本體結(jié)構(gòu)
針對(duì)存儲(chǔ)于設(shè)備故障主觀描述數(shù)據(jù)中的設(shè)備故障非結(jié)構(gòu)化文本數(shù)據(jù),定義設(shè)備現(xiàn)象、設(shè)備現(xiàn)象采取的措施、設(shè)備故障的處理結(jié)果等為命名實(shí)體,將實(shí)體之間的引起、發(fā)生、結(jié)果等關(guān)系作為實(shí)體關(guān)系,采用命名實(shí)體識(shí)別和實(shí)體關(guān)系抽取的方法獲取文本中的知識(shí)。
由于設(shè)備故障主觀描述數(shù)據(jù)的隨意性,對(duì)同一設(shè)備、故障現(xiàn)象、處理措施等內(nèi)容的描述不同,可導(dǎo)致抽取的知識(shí)存在大量知識(shí)重復(fù)現(xiàn)象,例如“道岔失去表示”和“道岔無表示”實(shí)際為同一設(shè)備故障現(xiàn)象,采用知識(shí)對(duì)齊技術(shù)解決設(shè)備故障知識(shí)冗余問題,知識(shí)對(duì)齊過程能夠有效地將設(shè)備故障知識(shí)圖譜精細(xì)化。
鐵路運(yùn)輸設(shè)備故障知識(shí)圖譜構(gòu)建與應(yīng)用涉及的技術(shù)眾多,需要設(shè)計(jì)完整的架構(gòu)支持。鐵路運(yùn)輸設(shè)備故障知識(shí)圖譜構(gòu)建與應(yīng)用架構(gòu)如圖3 所示。
圖3 鐵路運(yùn)輸設(shè)備故障知識(shí)圖譜構(gòu)建與應(yīng)用架構(gòu)
通過對(duì)鐵路運(yùn)輸設(shè)備故障的本體結(jié)構(gòu)構(gòu)建,匯集鐵路各專業(yè)設(shè)備故障數(shù)據(jù),包括設(shè)備故障的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。在進(jìn)行數(shù)據(jù)分析前需要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,包括非結(jié)構(gòu)化數(shù)據(jù)的正文抽取和結(jié)構(gòu)化數(shù)據(jù)的ETL(Extract、Transform、Load)處理。
知識(shí)圖譜構(gòu)建技術(shù)主要包括知識(shí)獲取、知識(shí)對(duì)齊及知識(shí)存儲(chǔ)。知識(shí)獲取技術(shù)包括命名實(shí)體識(shí)別、關(guān)系抽取、文本分類等,通過對(duì)設(shè)備故障主觀描述文本數(shù)據(jù)的上下文語義學(xué)習(xí),有效地從非結(jié)構(gòu)化文本數(shù)據(jù)中抽取出與故障密切的關(guān)鍵數(shù)據(jù);知識(shí)對(duì)齊技術(shù)是整合故障結(jié)構(gòu)化數(shù)據(jù)的有效方法,通過實(shí)體對(duì)齊、實(shí)體去重、實(shí)體鏈接計(jì)算等技術(shù)將相同的、有關(guān)聯(lián)關(guān)系的、有歧義的知識(shí)單元進(jìn)行整合;知識(shí)存儲(chǔ)是將設(shè)備故障知識(shí)以“圖”的形式存儲(chǔ)在數(shù)據(jù)庫中,通常存儲(chǔ)在Neo4j、OrientDB 等圖數(shù)據(jù)庫中。
知識(shí)圖譜應(yīng)用基于鐵路運(yùn)輸設(shè)備故障知識(shí)圖譜,通過對(duì)知識(shí)單元的計(jì)算和推理,實(shí)現(xiàn)設(shè)備故障知識(shí)的智能應(yīng)用。通過路徑計(jì)算、規(guī)則推理等方法實(shí)現(xiàn)設(shè)備故障的知識(shí)搜索,采用本體推理、相似圖計(jì)算等方法實(shí)現(xiàn)設(shè)備故障單元間的關(guān)聯(lián)關(guān)系推理,并將這種關(guān)聯(lián)關(guān)系連接,對(duì)設(shè)備故障知識(shí)圖譜進(jìn)行擴(kuò)展和豐富,實(shí)現(xiàn)設(shè)備故障知識(shí)補(bǔ)全。同時(shí),通過知識(shí)圖譜不一致檢測技術(shù)發(fā)現(xiàn)設(shè)備故障知識(shí)圖譜中錯(cuò)誤或冗余的數(shù)據(jù),實(shí)現(xiàn)設(shè)備故障準(zhǔn)確的知識(shí)體系和推理。知識(shí)圖譜應(yīng)用可支持鐵路運(yùn)輸設(shè)備故障應(yīng)用場景的構(gòu)建。
鐵路運(yùn)輸設(shè)備故障知識(shí)圖譜具有海量的知識(shí)單元,在模型訓(xùn)練過程中,需采用分布式計(jì)算實(shí)現(xiàn)模型的高效訓(xùn)練。在知識(shí)圖譜應(yīng)用過程中,為保障知識(shí)圖譜的快速檢索與較高的推理性能,需要借助Spark、Hadoop 等大數(shù)據(jù)技術(shù)支持知識(shí)快速的運(yùn)算與推理,所以在整個(gè)設(shè)備故障知識(shí)圖譜的構(gòu)建與應(yīng)用過程中,都需要大數(shù)據(jù)技術(shù)的支撐。
基于鐵路運(yùn)輸設(shè)備故障知識(shí)圖譜,推理實(shí)現(xiàn)設(shè)備故障的智能診斷與處理、智能問答、風(fēng)險(xiǎn)管理等應(yīng)用場景,高效利用設(shè)備故障相關(guān)知識(shí),幫助鐵路運(yùn)輸設(shè)備運(yùn)維人員快速查找故障致因鏈、定位故障原因、確定故障維修措施,達(dá)到減少故障處理時(shí)間、提高故障處理效率的目的。
鐵路運(yùn)輸設(shè)備故障知識(shí)圖譜蘊(yùn)含了設(shè)備、故障部位、故障現(xiàn)象、故障原因、維修措施等本體間的隱含關(guān)系,通過對(duì)關(guān)系的多級(jí)匹配和知識(shí)推理技術(shù),可使鐵路運(yùn)維人員了解故障背后的隱含知識(shí),實(shí)現(xiàn)故障原因推理、故障鏈條分析、故障結(jié)果推理和故障處理建議等功能,可應(yīng)用于鐵路各專業(yè)智能運(yùn)維系統(tǒng)中,有效提升運(yùn)維系統(tǒng)智能化程度。
鐵路運(yùn)輸設(shè)備故障知識(shí)圖譜通過對(duì)設(shè)備故障數(shù)據(jù)的知識(shí)化,可從復(fù)雜的設(shè)備故障中分析出每個(gè)設(shè)備發(fā)生故障的數(shù)量、原因,以及與之關(guān)聯(lián)的設(shè)備狀況,通過知識(shí)圖譜對(duì)設(shè)備故障的分析,可有效輔助人員對(duì)相關(guān)設(shè)備進(jìn)行重點(diǎn)關(guān)注,協(xié)助鐵路日常設(shè)備風(fēng)險(xiǎn)管理工作,可應(yīng)用于鐵路安全大數(shù)據(jù)系統(tǒng),實(shí)現(xiàn)設(shè)備的風(fēng)險(xiǎn)研判和風(fēng)險(xiǎn)管理。
鐵路運(yùn)輸設(shè)備故障種類復(fù)雜,查詢?cè)O(shè)備故障數(shù)據(jù)往往需要多次查詢或展開多級(jí)查詢目錄。設(shè)備故障智能問答通過語音或手動(dòng)輸入對(duì)故障的簡單描述,即可得到多級(jí)、深層次的關(guān)系,快速準(zhǔn)確地找到所需要的設(shè)備故障知識(shí),提高工作效率和知識(shí)共享能力,輔助鐵路工作人員對(duì)設(shè)備知識(shí)進(jìn)行快速學(xué)習(xí)和實(shí)時(shí)查詢。設(shè)備故障智能問答可應(yīng)用于鐵路各專業(yè)智能運(yùn)維系統(tǒng)中,實(shí)現(xiàn)設(shè)備故障知識(shí)的有效應(yīng)用。
本文針對(duì)鐵路運(yùn)輸設(shè)備安全保障體系內(nèi)產(chǎn)生的設(shè)備故障數(shù)據(jù),闡述針對(duì)鐵路運(yùn)輸設(shè)備故障數(shù)據(jù)的知識(shí)圖譜構(gòu)建過程,提出設(shè)備故障知識(shí)圖譜構(gòu)建和應(yīng)用架構(gòu)及設(shè)備故障知識(shí)圖譜的應(yīng)用場景,為鐵路領(lǐng)域?qū)W者基于知識(shí)圖譜技術(shù)進(jìn)行設(shè)備故障數(shù)據(jù)分析提供參考。鐵路運(yùn)輸安全問題風(fēng)險(xiǎn)庫、隱患庫等也存儲(chǔ)了非結(jié)構(gòu)化文本形式的蘊(yùn)含重要價(jià)值的數(shù)據(jù),本文的研究方法也可為該類數(shù)據(jù)的分析提供參考。