劉彬,邵軍,陸航,李燕,謝名源
(1.中國國家鐵路集團(tuán)有限公司 機(jī)輛部,北京 100844;2.中國鐵道科學(xué)研究院集團(tuán)有限公司 機(jī)車車輛研究所,北京 100081;3.中國鐵道科學(xué)研究院集團(tuán)有限公司 電子計(jì)算技術(shù)研究所,北京 100081;4.中國鐵路上海局集團(tuán)有限公司 科技和信息化部,上海 200071)
隨著現(xiàn)代裝備集成度、復(fù)雜度及智能化程度的不斷提升,傳統(tǒng)故障診斷、維修保障技術(shù)逐漸難以適應(yīng)新的要求,故障預(yù)測(cè)與健康管理(Prognostics and Health Management,PHM)技術(shù)應(yīng)運(yùn)而生,并迅速得到各國的高度重視,當(dāng)前該技術(shù)已被視為提高系統(tǒng)“六性”和降低全生命周期費(fèi)用的關(guān)鍵技術(shù)。PHM技術(shù)是指利用傳感器采集系統(tǒng)的數(shù)據(jù)信息,借助信息技術(shù)、人工智能推理算法來評(píng)估、監(jiān)控與管理系統(tǒng)自身的健康狀態(tài),在系統(tǒng)發(fā)生故障前對(duì)其故障進(jìn)行預(yù)測(cè),并結(jié)合現(xiàn)有資源信息提供一系列維護(hù)保障建議或決策,是一種集故障檢測(cè)、隔離、健康評(píng)估與預(yù)測(cè)及維護(hù)決策于一體的綜合技術(shù)[1-2]。PHM是實(shí)現(xiàn)預(yù)測(cè)性維修和自主式保障的技術(shù)基礎(chǔ),也是基于狀態(tài)維修(Condition Based Maintains,CBM)的提升,在有些場(chǎng)合也被稱為CBM+[3]。
近20年來,PHM技術(shù)已在航空航天、國防軍事及工業(yè)領(lǐng)域得到了廣泛應(yīng)用。如直升機(jī)完好性與使用監(jiān)控系統(tǒng)(HUMS)用來監(jiān)控直升機(jī)三大動(dòng)部件狀態(tài),提升直升機(jī)飛行安全;飛機(jī)中央維護(hù)系統(tǒng)(ACMS)能夠保證航空公司減少飛行延誤、航班取消、中途返航和中途換機(jī)等事件。在動(dòng)車組領(lǐng)域,前期法國TGV、德國ICE、英國IC125型高速列車及我國動(dòng)車組,均依靠關(guān)鍵測(cè)點(diǎn)的傳感器網(wǎng)絡(luò)與車載網(wǎng)絡(luò)控制系統(tǒng)實(shí)現(xiàn)了全列動(dòng)車組關(guān)鍵部件及系統(tǒng)實(shí)時(shí)狀態(tài)監(jiān)控和自診斷。PHM技術(shù)應(yīng)用于動(dòng)車組,從動(dòng)車組運(yùn)用檢修各場(chǎng)景需求出發(fā),基于現(xiàn)階段傳感器、數(shù)據(jù)傳輸與信息化現(xiàn)狀,通過多來源檢測(cè)監(jiān)測(cè)數(shù)據(jù)的匯集處理,借助智能推理算法,設(shè)計(jì)研制開放式PHM系統(tǒng)。一方面能夠進(jìn)一步提升動(dòng)車組的安全性、可靠性等質(zhì)量特性,另一方面可實(shí)現(xiàn)現(xiàn)有動(dòng)車組修程修制優(yōu)化,并為實(shí)現(xiàn)視情維修奠定基礎(chǔ)。梳理動(dòng)車組PHM技術(shù)國內(nèi)外研究和應(yīng)用現(xiàn)狀,有助于理清當(dāng)前PHM技術(shù)在動(dòng)車組中的應(yīng)用情況,對(duì)比國內(nèi)外動(dòng)車組PHM發(fā)展的差距,為我國動(dòng)車組PHM技術(shù)的發(fā)展提供借鑒[4]。
系統(tǒng)架構(gòu)定義是將需求、功能、邏輯和物理架構(gòu)(RFLP)的概念融合到PHM架構(gòu)方案的過程,并以系統(tǒng)性建模的方式為PHM體系架構(gòu)提供指導(dǎo)(見圖1)。
圖1 系統(tǒng)架構(gòu)定義過程
RFLP分析方法是現(xiàn)代工程領(lǐng)域著名的正向設(shè)計(jì)方法之一,幾乎所有復(fù)雜系統(tǒng)設(shè)計(jì)研制流程都遵循該理念。RFLP分析方法一經(jīng)提出,由于其符合頂層設(shè)計(jì)規(guī)律的思路及簡(jiǎn)單易記的名字,為各種設(shè)計(jì)方法論所廣泛學(xué)習(xí)和借鑒。具體來說,RFLP要依次完成4個(gè)層次的分析:
(1)需求分析:定義產(chǎn)品需求,定義用戶想要的產(chǎn)品和服務(wù)。
(2)功能分析:定義并分解產(chǎn)品功能,定義為滿足客戶需求產(chǎn)品需要具有怎樣的功能及子功能。
(3)邏輯設(shè)計(jì):從邏輯角度設(shè)計(jì)系統(tǒng)的架構(gòu),定義實(shí)現(xiàn)系統(tǒng)的邏輯組件及邏輯接口。
(4)物理設(shè)計(jì):從物理角度實(shí)現(xiàn)系統(tǒng)的架構(gòu),定義最終實(shí)現(xiàn)系統(tǒng)的物理組件實(shí)體及物理接口。
系統(tǒng)架構(gòu)設(shè)計(jì)是針對(duì)一組系統(tǒng)需求和全生命周期概念構(gòu)建滿足要求的系統(tǒng)屬性和特征,系統(tǒng)需求(Sys?tem Requirements)需追溯至動(dòng)車組PHM各業(yè)務(wù)參與方的細(xì)化需要(Stakeholder Needs),全生命周期概念提示需考慮系統(tǒng)的運(yùn)行和支持全過程。一般來說,系統(tǒng)需求的提出獨(dú)立于解決方案或具體技術(shù),而滿足系統(tǒng)需求的系統(tǒng)架構(gòu)(主要是物理架構(gòu))則是通過具體技術(shù)實(shí)現(xiàn),PHM這類復(fù)雜系統(tǒng)的技術(shù)包括通信與大數(shù)據(jù)、核心專家知識(shí)、人工智能、軟件、服務(wù)和程序等。
RFLP方法可從系統(tǒng)需求發(fā)展到功能/邏輯架構(gòu)的中間表示,再到后續(xù)將核心功能元素分配至物理架構(gòu)的系統(tǒng)元素。相對(duì)來說,功能架構(gòu)和邏輯架構(gòu)還保持著與具體技術(shù)的獨(dú)立性,而物理架構(gòu)則與具體技術(shù)相關(guān),需考慮動(dòng)車組各場(chǎng)景數(shù)據(jù)交互、運(yùn)用檢修信息、傳遞流程等,是設(shè)計(jì)具體方案的過程。
邏輯架構(gòu)帶有可追溯性信息(包括版本歷史、父需求、派生需求的系統(tǒng)架構(gòu)規(guī)范),尤其是需求可追溯性至關(guān)重要,直接決定了設(shè)計(jì)是否滿足用戶需求[5]。如系統(tǒng)報(bào)出關(guān)鍵部件故障預(yù)測(cè)結(jié)果后,由輸出端推送給用戶相關(guān)維修建議,現(xiàn)場(chǎng)用戶通過系統(tǒng)回填或其他方式將復(fù)核反饋、相關(guān)更正/預(yù)防修結(jié)果上傳,形成完整的追溯機(jī)制,也稱閉環(huán)反饋。更重要的是,系統(tǒng)設(shè)計(jì)中的任一環(huán)節(jié)都可由各層級(jí)用戶驗(yàn)證,不斷進(jìn)行迭代。
上述活動(dòng)在構(gòu)建PHM架構(gòu)的細(xì)節(jié)上起著至關(guān)重要的作用,功能架構(gòu)、邏輯架構(gòu)和物理架構(gòu)的逐步建立過程,也可以理解為從功能、邏輯和物理視角去理解和定義系統(tǒng)架構(gòu)。動(dòng)車組PHM系統(tǒng)具有復(fù)雜性、跨學(xué)科性,是“系統(tǒng)之上的系統(tǒng)”。其一,PHM系統(tǒng)有自身的功能架構(gòu),簡(jiǎn)單理解為信息采集模塊、核心處理模塊和輸出交互模塊;其二,PHM系統(tǒng)監(jiān)測(cè)、管理的對(duì)象又是構(gòu)成動(dòng)車組的各關(guān)鍵部件及系統(tǒng),乃至是整車平臺(tái),因此不同具體對(duì)象系統(tǒng)會(huì)帶來不同的PHM具體技術(shù)[5-6]。一般來說,系統(tǒng)功能架構(gòu)和邏輯架構(gòu)定義屬于系統(tǒng)虛擬設(shè)計(jì)范疇,往往獨(dú)立于具體技術(shù),而對(duì)于像PHM這類偏軟件集成的復(fù)雜系統(tǒng),功能架構(gòu)和邏輯架構(gòu)的定義顯得更為重要。
根據(jù)PHM總體需求調(diào)研,按用戶層級(jí)劃分,可分為中國國家鐵路集團(tuán)有限公司(簡(jiǎn)稱國鐵集團(tuán))、鐵路局集團(tuán)公司、動(dòng)車段3個(gè)層級(jí);按業(yè)務(wù)范疇劃分,可分為模型構(gòu)建、業(yè)務(wù)管理、應(yīng)急監(jiān)控、數(shù)據(jù)分析等(見圖2)。
圖2 動(dòng)車組PHM系統(tǒng)用戶層級(jí)與業(yè)務(wù)劃分
(1)國鐵集團(tuán)用戶需求。依托系統(tǒng)查看全路動(dòng)車組及其關(guān)鍵配件全生命周期健康狀態(tài);督促、監(jiān)管系統(tǒng)預(yù)測(cè)故障的后續(xù)處理;開展數(shù)字化精準(zhǔn)維修,推動(dòng)動(dòng)車組造修水平提升,構(gòu)建中國特色現(xiàn)代化動(dòng)車組運(yùn)維標(biāo)準(zhǔn)體系;根據(jù)健康狀態(tài)評(píng)估,指導(dǎo)動(dòng)車組系統(tǒng)優(yōu)化,推進(jìn)我國動(dòng)車組造修技術(shù)進(jìn)步。從業(yè)務(wù)維度劃分,該層級(jí)用戶以業(yè)務(wù)管理為主,負(fù)責(zé)系統(tǒng)統(tǒng)籌規(guī)劃、相關(guān)方活動(dòng)參與及職責(zé)劃分;同時(shí)從模型構(gòu)建的角度,調(diào)動(dòng)各研發(fā)單位積極性,統(tǒng)籌模型管理、優(yōu)化迭代策略。
(2)鐵路局集團(tuán)公司用戶需求。依托系統(tǒng)監(jiān)控、掌握鐵路局集團(tuán)公司配屬動(dòng)車組的健康狀態(tài);跟蹤、分析系統(tǒng)一定時(shí)間范圍內(nèi)的多源故障成因及后續(xù)處理情況,依據(jù)故障等級(jí)組織開展應(yīng)急指揮、預(yù)警故障復(fù)核確認(rèn)及視情維修工作;組織、落實(shí)開展檢修項(xiàng)目、內(nèi)容、周期優(yōu)化工作。從業(yè)務(wù)維度劃分,鐵路局集團(tuán)公司用戶在業(yè)務(wù)管理方面根據(jù)對(duì)配屬動(dòng)車組健康狀態(tài)的把控動(dòng)態(tài)調(diào)整相應(yīng)運(yùn)用檢修工作,并依據(jù)相應(yīng)關(guān)鍵部件的模型報(bào)警結(jié)果制定處置方式;同時(shí),可從運(yùn)用經(jīng)驗(yàn)出發(fā)提出模型需求,并參與相應(yīng)部件模型研發(fā)工作。
(3)動(dòng)車段用戶。依托系統(tǒng)監(jiān)控、掌握配屬動(dòng)車組健康狀態(tài),根據(jù)不同狀態(tài)等級(jí)具體落實(shí)應(yīng)急處置、安排后續(xù)維修策略并反饋結(jié)果,完成預(yù)警預(yù)測(cè)的閉環(huán)管理;落實(shí)檢修項(xiàng)目、內(nèi)容、周期優(yōu)化工作。從業(yè)務(wù)范圍而言,動(dòng)車段用戶需實(shí)時(shí)關(guān)注PHM系統(tǒng)預(yù)警報(bào)警結(jié)果,對(duì)于與安全直接相關(guān)、影響較大的部件報(bào)警及時(shí)進(jìn)行處置;對(duì)各級(jí)報(bào)警結(jié)果進(jìn)行數(shù)據(jù)層分析復(fù)核、檢修層作業(yè)檢查;也承擔(dān)模型初上線的實(shí)車驗(yàn)證工作。
研究動(dòng)車組PHM技術(shù)體系時(shí),一方面需充分考慮現(xiàn)階段動(dòng)車組各環(huán)節(jié)信息化(包括CBM)技術(shù)現(xiàn)狀,包括各車型、各系統(tǒng)傳感器布局、檢測(cè)監(jiān)測(cè)信息傳輸能力、車地通信水平、地面數(shù)據(jù)匯集與治理效率;另一方面需針對(duì)動(dòng)車組新造、運(yùn)用、檢修場(chǎng)景產(chǎn)生的數(shù)據(jù)特點(diǎn)進(jìn)行分析,才可確保各場(chǎng)景數(shù)據(jù)層交叉融合,滿足模型有機(jī)運(yùn)轉(zhuǎn)需求,最終實(shí)現(xiàn)診斷與預(yù)測(cè)、輔助決策各級(jí)用戶需求。因此,技術(shù)體系研究需綜合考量現(xiàn)有動(dòng)車組檢測(cè)監(jiān)測(cè)體系下動(dòng)車組造修與運(yùn)用中產(chǎn)生的多源數(shù)據(jù)、各業(yè)務(wù)場(chǎng)景的車地傳輸環(huán)節(jié)和車地通信技術(shù)現(xiàn)狀、PHM系統(tǒng)信息層中模型部署技術(shù)及模型預(yù)警/預(yù)測(cè)信息全流程貫通要素,最終形成技術(shù)體系的邏輯架構(gòu)與物理架構(gòu)。
通用復(fù)雜系統(tǒng)信息流傳輸架構(gòu)主要從具體系統(tǒng)的業(yè)務(wù)層級(jí)出發(fā),描述了從數(shù)據(jù)采集、傳輸?shù)綉?yīng)用層的狀態(tài)監(jiān)測(cè)、健康評(píng)估及最終給用戶呈現(xiàn)輸出等全部鏈路。動(dòng)車組PHM系統(tǒng)有數(shù)據(jù)采集和傳輸、數(shù)據(jù)處理、狀態(tài)監(jiān)測(cè)、故障預(yù)測(cè)、維修決策、健康評(píng)估和系統(tǒng)輸出等主要功能模塊(見圖3)。
圖3 動(dòng)車組PHM系統(tǒng)功能信息流
(1)數(shù)據(jù)采集和傳輸:主要通過各類傳感器收集部件、設(shè)備的相關(guān)數(shù)據(jù)或獲得其他系統(tǒng)的基礎(chǔ)履歷、新造設(shè)計(jì)、維修與環(huán)境數(shù)據(jù)。
(2)數(shù)據(jù)處理:從上一層信息流接收數(shù)據(jù)并對(duì)其進(jìn)行清洗、治理、特征提取等處理,使數(shù)據(jù)符合后續(xù)模型或算法的使用要求。
(3)狀態(tài)監(jiān)測(cè):多指在運(yùn)行中的單一系統(tǒng)或設(shè)備中,針對(duì)某幾項(xiàng)的檢測(cè)監(jiān)測(cè)參數(shù),結(jié)合專家知識(shí)庫進(jìn)行閾值與邏輯組合判斷。
(4)故障預(yù)測(cè):以模型為載體,針對(duì)多設(shè)備或系統(tǒng)的運(yùn)行參數(shù)、基礎(chǔ)履歷數(shù)據(jù)進(jìn)行特征提取及模型綜合研判,也可結(jié)合環(huán)境參數(shù)進(jìn)行綜合故障預(yù)測(cè)。
(5)維修決策:也稱決策支持,是基于歷史狀態(tài)信息、維修履歷,進(jìn)行部件狀態(tài)評(píng)估,在系統(tǒng)或設(shè)備性能退化或失效之前提供有效的維修措施。
(6)健康評(píng)估:對(duì)部件、設(shè)備和整車結(jié)構(gòu)等的健康狀況進(jìn)行量化,預(yù)測(cè)其未來狀態(tài)趨勢(shì)。
(7)系統(tǒng)輸出端:即以可視化或系統(tǒng)接口方式實(shí)現(xiàn)的結(jié)果展示與表達(dá),一方面可以信息化的形式將預(yù)測(cè)結(jié)果或健康趨勢(shì)以友好的圖形方式展示給最終用戶;另一方面,PHM系統(tǒng)將結(jié)果以信息化推送的方式傳遞給其他業(yè)務(wù)系統(tǒng),或直接對(duì)相關(guān)設(shè)備進(jìn)行控制。
根據(jù)以上通用信息流架構(gòu),結(jié)合動(dòng)車組PHM數(shù)據(jù)、功能和動(dòng)車組各場(chǎng)景全生命周期業(yè)務(wù),梳理出PHM系統(tǒng)核心業(yè)務(wù)功能架構(gòu)(見圖4)。自左至右各模塊分別實(shí)現(xiàn)以下業(yè)務(wù)功能:
圖4 動(dòng)車組PHM系統(tǒng)核心業(yè)務(wù)功能架構(gòu)
(1)狀態(tài)監(jiān)測(cè)模塊是對(duì)全路動(dòng)車組上線狀態(tài)及運(yùn)行狀態(tài)進(jìn)行實(shí)時(shí)監(jiān)測(cè)。
(2)故障預(yù)測(cè)模塊是對(duì)動(dòng)車組故障早期的提前預(yù)判,以便及早采取措施確保安全。
(3)健康狀態(tài)評(píng)估主要負(fù)責(zé)根據(jù)各項(xiàng)指標(biāo)對(duì)動(dòng)車組功能狀態(tài)進(jìn)行綜合評(píng)估。預(yù)測(cè)結(jié)果和健康評(píng)估結(jié)果結(jié)合動(dòng)車組運(yùn)行計(jì)劃,在故障發(fā)生前提出合理的維修建議。
(4)決策支持(視情維修)是基于歷史、狀態(tài)和維修數(shù)據(jù)等對(duì)部件進(jìn)行剩余壽命預(yù)測(cè),在部件出現(xiàn)潛在故障風(fēng)險(xiǎn)前及時(shí)進(jìn)行維護(hù)、更換。
(5)模型管理模塊是將各研發(fā)單位研發(fā)的模型進(jìn)行統(tǒng)計(jì),方便查看各模型適用車型范圍及報(bào)警相關(guān)閾值的界定范圍。
此外,考慮到數(shù)據(jù)集成、數(shù)據(jù)質(zhì)量、安全和平臺(tái)的需要,PHM系統(tǒng)還要有數(shù)據(jù)交換接口、賬號(hào)管理、資源管理和任務(wù)管理功能。數(shù)據(jù)交換接口模塊確保在不同系統(tǒng)之間可有效交換數(shù)據(jù);賬號(hào)管理模塊提供賬號(hào)管理功能,以及鑒權(quán)和授權(quán);資源管理模塊負(fù)責(zé)管理和調(diào)度平臺(tái)資源,提高整個(gè)系統(tǒng)的資源利用率;任務(wù)管理是監(jiān)控和管理不同計(jì)算任務(wù)的模塊。
動(dòng)車組PHM系統(tǒng)重在識(shí)別和管理故障的發(fā)生、規(guī)劃維修和決策保障,是提高動(dòng)車組運(yùn)用效率、提升檢修質(zhì)量、降低維修成本、優(yōu)化修程修制、推動(dòng)技術(shù)發(fā)展的重要技術(shù)手段。面向動(dòng)車組線上應(yīng)急處置、日常運(yùn)用管理、高級(jí)檢修管理和健康評(píng)估管理4種業(yè)務(wù)場(chǎng)景,PHM系統(tǒng)與相關(guān)系統(tǒng)之間的交互融合體現(xiàn)在3個(gè)方面:
(1)動(dòng)車組管理信息系統(tǒng)(EMIS)。EMIS是動(dòng)車組信息化管理的統(tǒng)一平臺(tái),PHM系統(tǒng)依托EMIS中動(dòng)車組履歷、構(gòu)型、故障、運(yùn)用、檢修、交互式電子技術(shù)手冊(cè)(IETM)等數(shù)據(jù)進(jìn)行模型計(jì)算,將產(chǎn)生的故障預(yù)測(cè)結(jié)果、預(yù)測(cè)性維修建議、健康評(píng)估結(jié)果等在EMIS檢修生產(chǎn)各環(huán)節(jié)進(jìn)行落實(shí)與執(zhí)行,并將EMIS中生成的故障復(fù)核與處理、檢修作業(yè)實(shí)績等信息進(jìn)行反饋,支撐PHM系統(tǒng)各類模型的迭代更新。
(2)多平臺(tái)行車安全監(jiān)測(cè)系統(tǒng)。行車安全監(jiān)測(cè)系統(tǒng)作為PHM系統(tǒng)的重要數(shù)據(jù)源,依托PHM系統(tǒng)跨業(yè)務(wù)域的數(shù)據(jù)匯集和基于并行計(jì)算的數(shù)據(jù)處理能力,實(shí)現(xiàn)對(duì)動(dòng)車組車載信息無線傳輸系統(tǒng)(WTDS)及動(dòng)車組滾動(dòng)軸承故障軌邊聲學(xué)診斷系統(tǒng)(TADS)、動(dòng)車組運(yùn)行故障動(dòng)態(tài)圖像檢測(cè)系統(tǒng)(TEDS)、動(dòng)車組運(yùn)行品質(zhì)軌旁動(dòng)態(tài)檢測(cè)系統(tǒng)(TPDS)等監(jiān)測(cè)系統(tǒng)數(shù)據(jù)的實(shí)時(shí)采集處理;并通過與應(yīng)急指揮和EMIS的聯(lián)動(dòng),實(shí)現(xiàn)故障的預(yù)警預(yù)測(cè)和對(duì)動(dòng)車組及其部件的健康評(píng)估,完成故障預(yù)測(cè)、應(yīng)急處置和故障處理的流程管理。
(3)主機(jī)企業(yè)與核心供應(yīng)商。動(dòng)車組生產(chǎn)制造企業(yè)內(nèi)的系統(tǒng),作為動(dòng)車組構(gòu)型、履歷、IETM各類手冊(cè)等數(shù)據(jù)的參與方,通過與EMIS交互,實(shí)現(xiàn)對(duì)PHM系統(tǒng)的支撐,也是PHM系統(tǒng)輸出的設(shè)計(jì)制造優(yōu)化建議的執(zhí)行載體。
動(dòng)車組PHM系統(tǒng)邏輯架構(gòu)見圖5,通過傳統(tǒng)方式描述了動(dòng)車組PHM系統(tǒng)各業(yè)務(wù)場(chǎng)景中與外部數(shù)據(jù)交互流程、系統(tǒng)內(nèi)部數(shù)據(jù)流轉(zhuǎn)過程,與國鐵集團(tuán)(鐵路局集團(tuán)公司)用戶、主機(jī)企業(yè)(核心供應(yīng)商)和模型研發(fā)單位等PHM系統(tǒng)參與方的業(yè)務(wù)活動(dòng)流程[7],以及相關(guān)核心PHM系統(tǒng)元數(shù)據(jù)處理技術(shù)、模型封裝技術(shù)和評(píng)價(jià)與驗(yàn)證技術(shù),構(gòu)成完整邏輯架構(gòu)。邏輯架構(gòu)自左至右描述了PHM系統(tǒng)的信息傳遞流轉(zhuǎn)過程,其中數(shù)據(jù)源涵蓋目前動(dòng)車組檢測(cè)監(jiān)測(cè)體系下,車載WTDS、軌旁安全監(jiān)測(cè)設(shè)備(TEDS、TADS、TPDS等)及根據(jù)《動(dòng)車組技術(shù)履歷信息采集技術(shù)規(guī)范》約定的入段自動(dòng)化檢測(cè)設(shè)備數(shù)據(jù)。
圖5 動(dòng)車組PHM系統(tǒng)邏輯架構(gòu)
同時(shí),考慮未來模型跨專業(yè)分析研判、跨交路應(yīng)用,考慮納入跨專業(yè)及外部環(huán)境數(shù)據(jù)。邏輯架構(gòu)的中、下部框架簡(jiǎn)化描述了為支撐服務(wù)PHM系統(tǒng)的數(shù)據(jù)源匯集、并行處理的功能:
(1)具備大數(shù)據(jù)獲取、存儲(chǔ)、處理和應(yīng)用能力的信息化技術(shù)框架,目前規(guī)劃應(yīng)用的有Hadoop、Storm、Spark等利用ETL、數(shù)據(jù)倉庫、分布式并行計(jì)算等高效的大數(shù)據(jù)處理技術(shù)??珊?jiǎn)單理解為數(shù)據(jù)匯集、清洗處理的環(huán)節(jié)[8]。
(2)模型封裝與部署方面,擬采用容器式和任務(wù)流式部署以對(duì)比其效率,2種方式都可實(shí)現(xiàn)模型程序在系統(tǒng)中的運(yùn)轉(zhuǎn),但各有優(yōu)缺點(diǎn)。容器式部署方式利用容器技術(shù),將模型程序及其運(yùn)行所需的環(huán)境組件封裝成容器,并通過k8s對(duì)容器組件進(jìn)行管理,具有統(tǒng)一的管理頁面,使得各容器間資源相互隔離,不會(huì)相互影響,但在Windows環(huán)境下日常管理的復(fù)雜度較高,且每個(gè)容器占用的系統(tǒng)資源較高,其優(yōu)化方式有待進(jìn)一步深入研究。任務(wù)流式部署方式利用調(diào)度工具實(shí)現(xiàn)模型程序的管理,方式較為靈活,可針對(duì)不同運(yùn)維、管理技術(shù)需求的模型進(jìn)行獨(dú)立維護(hù),且系統(tǒng)資源占用較為均衡。具體部署方式需要在后續(xù)的試驗(yàn)與驗(yàn)證階段評(píng)價(jià)優(yōu)劣及適用度。
動(dòng)車組PHM系統(tǒng)定位于車輛管理中的動(dòng)車組管理部分,是整個(gè)動(dòng)車組信息化保障體系的重要組成環(huán)節(jié),從系統(tǒng)建設(shè)方面也可理解為EMIS主要功能架構(gòu)的延伸,服務(wù)于運(yùn)用檢修主體業(yè)務(wù)。動(dòng)車組PHM系統(tǒng)依托分布式存儲(chǔ)、分布式計(jì)算、數(shù)據(jù)倉庫、數(shù)據(jù)挖掘等技術(shù),打造集“易用性、伸縮性、開放性”于一體的系統(tǒng)平臺(tái),滿足用戶量高并發(fā)和高可用;基于數(shù)據(jù)標(biāo)準(zhǔn)化、業(yè)務(wù)集成化、應(yīng)用平臺(tái)化、模型組件化的設(shè)計(jì)理念,采用統(tǒng)一的應(yīng)用開發(fā)框架,定義標(biāo)準(zhǔn)的軟件開發(fā)測(cè)試規(guī)范、安全管理規(guī)范、運(yùn)維規(guī)范,實(shí)現(xiàn)基于云化、分布式和服務(wù)化的技術(shù)架構(gòu)。自下向上整個(gè)架構(gòu)劃分為數(shù)據(jù)接入層、基礎(chǔ)設(shè)施層、平臺(tái)層和應(yīng)用層(見圖6)。
圖6 動(dòng)車組PHM系統(tǒng)物理架構(gòu)
2.4.1 數(shù)據(jù)接入層
數(shù)據(jù)接入層可通過鐵路內(nèi)部服務(wù)網(wǎng)(簡(jiǎn)稱內(nèi)網(wǎng))從機(jī)輛信息管理平臺(tái)、數(shù)據(jù)服務(wù)平臺(tái)獲取路內(nèi)既有支撐系統(tǒng)數(shù)據(jù),主要包括運(yùn)用檢修數(shù)據(jù)、檢測(cè)監(jiān)測(cè)數(shù)據(jù);通過互聯(lián)網(wǎng)、鐵路外部服務(wù)網(wǎng)(簡(jiǎn)稱外網(wǎng))獲取主機(jī)企業(yè)及關(guān)鍵設(shè)備供應(yīng)商數(shù)據(jù),主要包括新造、設(shè)計(jì)與構(gòu)型數(shù)據(jù)、高級(jí)修相關(guān)數(shù)據(jù)。通過內(nèi)、外網(wǎng)實(shí)現(xiàn)跨平臺(tái)、跨網(wǎng)絡(luò)、跨系統(tǒng)多源異構(gòu)數(shù)據(jù)的接入。
2.4.2 基礎(chǔ)設(shè)施層
基礎(chǔ)設(shè)施層支撐PHM系統(tǒng)硬件資源調(diào)配及網(wǎng)絡(luò)鏈路安全。主要通過對(duì)基礎(chǔ)計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)資源的池化和虛擬化,為上層應(yīng)用與服務(wù)提供統(tǒng)一硬件資源調(diào)度和監(jiān)控管理,支持按需分配與動(dòng)態(tài)擴(kuò)展(硬件資源),并通過標(biāo)準(zhǔn)化接口向上層提供計(jì)算、存儲(chǔ)等基礎(chǔ)服務(wù),提高IT資源的易用性、敏捷性。依托國鐵集團(tuán)主數(shù)據(jù)中心服務(wù)器集群,實(shí)現(xiàn)海量數(shù)據(jù)的存儲(chǔ)與計(jì)算,緩解資源壓力,提升服務(wù)器整體性能[9-11]。通過高穩(wěn)定、高帶寬的網(wǎng)絡(luò)鏈路,實(shí)現(xiàn)網(wǎng)絡(luò)資源的高吞吐、高可用、低延時(shí)。同時(shí),根據(jù)國家網(wǎng)絡(luò)安全等級(jí)保護(hù)要求,通過邊界防護(hù)、入侵防范等技術(shù)手段,確?;A(chǔ)設(shè)施安全可靠。
2.4.3 平臺(tái)層
平臺(tái)層包括數(shù)據(jù)平臺(tái)層和集成平臺(tái)層。數(shù)據(jù)平臺(tái)層面向數(shù)據(jù)處理關(guān)鍵技術(shù),實(shí)現(xiàn)數(shù)據(jù)采集、數(shù)據(jù)抽取、數(shù)據(jù)存儲(chǔ)和數(shù)據(jù)分析挖掘,通過資源調(diào)度、多租戶管理等手段,打造松耦合、高效和高可用的數(shù)據(jù)支撐平臺(tái);集成平臺(tái)層通過關(guān)系型數(shù)據(jù)庫、內(nèi)存數(shù)據(jù)庫、安全認(rèn)證及報(bào)表組件等,提供服務(wù)運(yùn)行環(huán)境與模型管理,實(shí)現(xiàn)中間件服務(wù),面向應(yīng)用開發(fā),提供安全可靠的平臺(tái)支撐。
(1)數(shù)據(jù)平臺(tái)層。根據(jù)數(shù)據(jù)結(jié)構(gòu)、類型、量級(jí)及狀態(tài)的不同,實(shí)現(xiàn)多源數(shù)據(jù)采集功能。例如,對(duì)于時(shí)效性、并發(fā)性(保證3 000多列動(dòng)車組同時(shí)傳輸)要求極高的WTDS數(shù)據(jù),采用分布式消息隊(duì)列解決系統(tǒng)實(shí)時(shí)、高吞吐量的流數(shù)據(jù)問題,采用分布式發(fā)布訂閱機(jī)制,依托消費(fèi)組、主題、分區(qū)等技術(shù),滿足數(shù)據(jù)的實(shí)時(shí)、并行處理要求[9-13]。同時(shí),對(duì)于通過關(guān)系型數(shù)據(jù)庫獲取的EMIS構(gòu)型履歷、高級(jí)修信息等靜態(tài)數(shù)據(jù)庫,多采用分布式文件系統(tǒng),具有高容錯(cuò)性、高吞吐量的特點(diǎn)。
根據(jù)數(shù)據(jù)規(guī)模、結(jié)構(gòu)、類型、狀態(tài)的不同,PHM系統(tǒng)提供了不同的數(shù)據(jù)存儲(chǔ)方式,主要采用數(shù)據(jù)倉庫、非關(guān)系型數(shù)據(jù)庫及關(guān)系型數(shù)據(jù)庫,既保障了系統(tǒng)應(yīng)用的響應(yīng)時(shí)間,也滿足了海量數(shù)據(jù)的存儲(chǔ)與批量計(jì)算。同時(shí),分布式協(xié)調(diào)調(diào)度組件提供集群利用率管理、資源統(tǒng)一管理、數(shù)據(jù)共享、配置維護(hù)、分布式同步、選舉Leader等功能,實(shí)現(xiàn)數(shù)據(jù)平臺(tái)的高效、穩(wěn)定運(yùn)行[8,14]。面向主題的、集成的、隨時(shí)間變化的但信息本身相對(duì)穩(wěn)定的數(shù)據(jù)集合,可將海量數(shù)據(jù)進(jìn)行多維建模,并通過加工、匯總和整理,形成數(shù)據(jù)倉庫,用于對(duì)管理決策過程的支持,包括OLTP和OLAP分析。
(2)集成平臺(tái)層。描述了PHM系統(tǒng)提供的多開發(fā)語言和運(yùn)行環(huán)境,包括Java、Python、JDK環(huán)境、API管理工具及應(yīng)用中間件服務(wù)等;搭建基于內(nèi)存鍵值對(duì)存儲(chǔ)的分布式內(nèi)存數(shù)據(jù)庫,將靜態(tài)數(shù)據(jù)和熱交互數(shù)據(jù)在分布式緩存和數(shù)據(jù)網(wǎng)格中存放,實(shí)現(xiàn)性能方面的快速響應(yīng);通過電子證書、數(shù)字簽名等身份認(rèn)證機(jī)制,確認(rèn)操作者身份及對(duì)特定資源的訪問和使用權(quán)限,確保系統(tǒng)訪問策略可靠、安全;使用報(bào)表組件,實(shí)現(xiàn)動(dòng)車組故障統(tǒng)計(jì)分析、健康狀態(tài)統(tǒng)計(jì)、部件壽命到限分析等功能;使用開源的JS圖形庫輔助開發(fā),如D3和Echarts等工具對(duì)數(shù)據(jù)分析的結(jié)果集進(jìn)行圖形化展示,清晰有效地傳達(dá)與溝通信息;基于模型管理工具,方便快捷地實(shí)現(xiàn)已封裝自定義模型的申請(qǐng)、注冊(cè)、部署、運(yùn)行、監(jiān)控管理,實(shí)現(xiàn)自主建模模型的引用、轉(zhuǎn)換、演化等。
動(dòng)車組PHM系統(tǒng)的驗(yàn)證與確認(rèn)工作在開展初期,關(guān)鍵一步是確定一套科學(xué)合理且適用于動(dòng)車組PHM系統(tǒng)特點(diǎn)的頂層工作流程規(guī)劃,形成標(biāo)準(zhǔn)規(guī)范指導(dǎo)動(dòng)車組PHM系統(tǒng)驗(yàn)證與確認(rèn)頂層工作(見圖7)。然后根據(jù)各階段的驗(yàn)證確認(rèn)活動(dòng),結(jié)合具體對(duì)象進(jìn)行詳細(xì)活動(dòng)的方案設(shè)計(jì)與實(shí)施。
圖7 動(dòng)車組PHM系統(tǒng)工程驗(yàn)證與確認(rèn)
當(dāng)前裝備系統(tǒng)設(shè)計(jì)研制的流程通?;谙到y(tǒng)工程的指導(dǎo)。系統(tǒng)工程是涉及多學(xué)科的復(fù)雜系統(tǒng)在綜合考慮各種約束條件下達(dá)到最優(yōu)的方法和手段,其核心思想是在產(chǎn)品開發(fā)周期的早期階段進(jìn)行需求分析與系統(tǒng)功能分析,并進(jìn)行設(shè)計(jì)綜合和系統(tǒng)驗(yàn)證。動(dòng)車組PHM系統(tǒng)的設(shè)計(jì)研制及驗(yàn)證確認(rèn)也應(yīng)確保在系統(tǒng)工程思想的指導(dǎo)下進(jìn)行。
確認(rèn)活動(dòng)是針對(duì)PHM系統(tǒng)在設(shè)計(jì)研制等過程中的要求進(jìn)行確認(rèn),目標(biāo)是保證要求的正確性和完整性。理想情況下,在設(shè)計(jì)執(zhí)行開始前應(yīng)對(duì)所有要求進(jìn)行確認(rèn),但對(duì)于動(dòng)車組PHM這種復(fù)雜集成系統(tǒng),確認(rèn)成為研制周期內(nèi)正常且持續(xù)的階段性過程,即每個(gè)階段的確認(rèn)活動(dòng)都會(huì)保證系統(tǒng)研制朝著預(yù)想的方向進(jìn)行。
驗(yàn)證是通過一系列活動(dòng)證明所研制系統(tǒng)是否滿足所設(shè)定的需求和要求,即該系統(tǒng)被正確開發(fā),常用方法包括符合性說明、計(jì)算/分析、安全評(píng)估、試驗(yàn)驗(yàn)證和類比推理等,解決“驗(yàn)什么”“何時(shí)驗(yàn)”“怎么驗(yàn)”的問題。因此動(dòng)車組PHM系統(tǒng)的驗(yàn)證與確認(rèn)工作在系統(tǒng)工程的指導(dǎo)下,根據(jù)動(dòng)車組PHM系統(tǒng)特點(diǎn),形成驗(yàn)證與確認(rèn)流程,用以在合適時(shí)機(jī)對(duì)待檢查對(duì)象進(jìn)行需要的驗(yàn)證確認(rèn)工作。
確認(rèn)包括在方案階段用戶直接提出的需求和后續(xù)各系統(tǒng)詳細(xì)設(shè)計(jì)時(shí)分配的需求,并明確PHM系統(tǒng)的最終目的,形成平臺(tái)級(jí)的驗(yàn)證確認(rèn)指標(biāo)。在進(jìn)行PHM系統(tǒng)總體設(shè)計(jì)時(shí),需對(duì)設(shè)計(jì)類文檔進(jìn)行確認(rèn)審查,對(duì)上級(jí)分解需求進(jìn)行確認(rèn),并構(gòu)建初步的驗(yàn)證策略和評(píng)價(jià)指標(biāo)體系,主要針對(duì)平臺(tái)級(jí)。設(shè)計(jì)階段結(jié)束后,PHM系統(tǒng)進(jìn)入工程研制階段,包括軟硬件開發(fā)、制造和組成,該階段的驗(yàn)證主要為軟硬件的功能驗(yàn)證及確認(rèn),如傳感器性能驗(yàn)證測(cè)試、數(shù)據(jù)采集功能及接口驗(yàn)證,該階段形成了PHM系統(tǒng)的核心算法群,需對(duì)算法性能進(jìn)行驗(yàn)證,包括診斷功能、預(yù)測(cè)功能及相關(guān)評(píng)價(jià)。對(duì)于動(dòng)車組PHM系統(tǒng)決策支持、運(yùn)維分析等輸出層的核心功能,需對(duì)PHM系統(tǒng)與其他平臺(tái)系統(tǒng)的交互功能進(jìn)行驗(yàn)證,保證其能夠?qū)崿F(xiàn)決策支持的能力,并對(duì)PHM系統(tǒng)作出綜合評(píng)價(jià)。PHM系統(tǒng)在完成設(shè)計(jì)研發(fā)投入使用后,其日常的運(yùn)行及維護(hù)可能會(huì)通過數(shù)據(jù)積累對(duì)算法及相關(guān)軟硬件進(jìn)行迭代優(yōu)化,則需考慮需求更新的確認(rèn)及算法迭代后的更新驗(yàn)證。
采用RFLP系統(tǒng)建模方法,從業(yè)務(wù)需求、核心功能、邏輯框架和物理架構(gòu)等方面進(jìn)行了動(dòng)車組PHM體系架構(gòu)研究,并從方案設(shè)計(jì)、系統(tǒng)研發(fā)和驗(yàn)證熟化3個(gè)階段對(duì)動(dòng)車組PHM系統(tǒng)相關(guān)技術(shù)要素進(jìn)行了歸納梳理。通過系統(tǒng)工程的正向設(shè)計(jì),PHM系統(tǒng)可以更好地集中行業(yè)各參與方優(yōu)勢(shì),使其在動(dòng)車組檢修運(yùn)用各場(chǎng)景中發(fā)揮作用。后續(xù)將根據(jù)動(dòng)車組技術(shù)發(fā)展、運(yùn)用檢修需求和各層級(jí)不同業(yè)務(wù)用戶反饋,持續(xù)完善動(dòng)車組PHM系統(tǒng)建設(shè),針對(duì)系統(tǒng)核心功能、各類模型不斷優(yōu)化迭代,支撐動(dòng)車組的安全運(yùn)用和智能維修,促進(jìn)動(dòng)車組造修技術(shù)發(fā)展。