卓 卉,喬志剛
(1.國家能源投資集團有限責任公司科技部,北京 100001;2.北京京天威科技發(fā)展有限公司,北京 100085)
神華鐵路絕大部分運營列車均為重載煤炭運輸列車,部分列車為煤礦等機構(gòu)使用的建材或者鋼材等。這些列車載重較大,車速略低于普通列車,車輛調(diào)度管理難度大。相關(guān)研究中,從列車實時報送信息中獲得數(shù)據(jù)規(guī)律,根據(jù)規(guī)律的深度挖掘結(jié)果產(chǎn)生列車狀態(tài)的領(lǐng)先特征數(shù)據(jù)。
基于列車軸溫數(shù)據(jù)、制動氣壓數(shù)據(jù)、車速-油耗對照數(shù)據(jù)等建立加權(quán)指標預(yù)警機制;原始序列、差值序列等不同數(shù)據(jù)序列處理方法得到的線性離散數(shù)據(jù)矩陣,使用傅里葉變換獲得其周期規(guī)律,使用移動窗口法獲得振幅、頻率的相關(guān)信息并對這些信息執(zhí)行線性回歸,從而獲得一組貨車狀態(tài)的綜合評價因子,然后對這些因子構(gòu)建加權(quán)整合因子,得到更為精確的貨車運行狀態(tài)。該研究提出的貨車狀態(tài)評價算法可以更為精確的反映貨車實際狀態(tài)。
該研究中重點考察3列數(shù)據(jù),數(shù)據(jù)均由列車實時監(jiān)測系統(tǒng)通過車載物聯(lián)網(wǎng)報送到數(shù)據(jù)中心機房,其中的數(shù)據(jù)產(chǎn)生機制如下:
軸溫數(shù)據(jù)、制動氣壓數(shù)據(jù),均來自特定探頭的時序數(shù)據(jù),這些數(shù)據(jù)無需進行前置數(shù)據(jù)處理,數(shù)據(jù)的量綱和值域可以通過線性重投影算法執(zhí)行歸一化處理。線性重投影指歷史最大值與歷史最小值的差值記為A值;當前值與歷史最小值的差值記為B值,將B/A的結(jié)果作為重投影結(jié)果值。經(jīng)過重投影后,所有序列數(shù)值均取消了量綱,且值域控制在了[0,1]。
車輛油耗可以反映出機車的牽引性能,此時需要獲得不同車速條件下的油耗狀態(tài)。即單位距離下油耗與車速的比值,原始量綱為t/s,即t/m與m/s的量綱比值;同樣采用線性重投影法獲得去量綱數(shù)據(jù)。
軸溫數(shù)據(jù)可以反映出貨車結(jié)構(gòu)的扛負荷能力,與車輛結(jié)構(gòu)力學(xué)相關(guān)的故障可以在數(shù)據(jù)中直觀展示;制動氣壓數(shù)據(jù)可以反映出貨車壓氣系統(tǒng)的氣密性狀態(tài),與車輛運行安全保障和系統(tǒng)穩(wěn)定性相關(guān)的故障可以在數(shù)據(jù)中直觀展示。車輛油耗可以反映出貨車機車的牽引效率,機車系統(tǒng)故障可以在數(shù)據(jù)中直觀展示。上述數(shù)據(jù)還可以產(chǎn)生低信噪比的其他故障,如貨車運行阻力系數(shù)對油耗、軸溫等均會產(chǎn)生影響,壓氣系統(tǒng)氣密性也可以反映出其他控制系統(tǒng)的相關(guān)故障。
上述3個數(shù)據(jù)序列提取加權(quán)因子的算法流程相同,此處僅討論線性離散序列數(shù)據(jù)的因子提取方案。在原始序列中劃分移動窗口,將原始序列的可挖掘特征構(gòu)成重組序列,具體如圖1所示。
圖1 重組序列的構(gòu)建算法分解圖Fig.1 Decomposition diagram of construction algorithm of recombination sequence
由圖1可知,移動窗口的規(guī)模如果過小,則難以獲得較長周期內(nèi)的數(shù)據(jù)變化規(guī)律;移動窗口的規(guī)模如果過大,則早期數(shù)據(jù)將會對實時數(shù)據(jù)產(chǎn)生干擾。所以,一方面通過后置數(shù)據(jù)挖掘算法增加數(shù)據(jù)的敏感性;另一方面窗口規(guī)模應(yīng)控制在合理范圍內(nèi)。參考相關(guān)文獻的研究成果,每隔10個數(shù)據(jù)周期提取一次移動窗口,每個移動窗口前推200個數(shù)據(jù)周期,即每個移動窗口新增10個新產(chǎn)生數(shù)據(jù),且移動窗口包含190個之前數(shù)據(jù)。每個移動窗口的數(shù)據(jù),使用差值序列法生成原始序列和差值序列的2個平行序列,每個序列分別使用算數(shù)平均數(shù)法、線性回歸法、傅里葉變換法獲得4個輸出數(shù)據(jù)(2列數(shù)據(jù)共8個輸出數(shù)據(jù)),其中傅里葉變換法的輸出數(shù)據(jù)為最大振幅表現(xiàn)下的特定頻率下的振幅積分值,多個移動窗口輸出的對應(yīng)輸出數(shù)據(jù)構(gòu)建出對應(yīng)的重組序列。
對每個重組序列執(zhí)行一次線性重投影,在對其進行線性回歸,得到對應(yīng)的截距數(shù)據(jù)和斜率數(shù)據(jù);再對截距和斜率數(shù)據(jù)執(zhí)行一次線性重投影,獲得截距和斜率的值域同構(gòu)化整理數(shù)據(jù)。斜率加權(quán)因子設(shè)定為0.85,截距加權(quán)因子設(shè)定為0.15,對8列數(shù)據(jù)分別進行加權(quán)充足后,按照下述方案進行因子加權(quán)處理,具體如圖2所示。
圖2 加權(quán)因子的加權(quán)系數(shù)分配表Fig.2 Distribution table of weighting factors
由圖2可知,重組序列的斜率和截距數(shù)據(jù)經(jīng)過加權(quán)整合后的振幅、斜率、截距、均值4個結(jié)果,分別按照0.60、0.18、0.07和0.15的加權(quán)因子進行加權(quán)處理,形成原始序列產(chǎn)生的原始因子、差值序列產(chǎn)生的差值因子;然后,分別再使用0.75、0.25的加權(quán)因子進行第3層加權(quán),從而形成軸溫因子、氣壓因子、油耗因子3個評價因子。最后,在分別使用0.55、0.20、0.25這3個加權(quán)因子再次進行第4層加權(quán),從而獲得貨車系統(tǒng)的綜合評價因子。對軸溫因子、氣壓因子、油耗因子、綜合因子分別進行模糊矩陣處理,得到紅色、橙色、黃色、藍色4層預(yù)警機制并提供無預(yù)警狀態(tài)。模糊矩陣為二階原始數(shù)據(jù)、差值數(shù)據(jù)交叉矩陣,因為該模糊矩陣為常見模糊矩陣的基本形式,此處不展開論述。
綜合所述,該加權(quán)整合因子算法,除使用了二階模糊矩陣外,并未引入任何傳統(tǒng)意義的人工智能算法,所有算法模塊僅限于移動數(shù)據(jù)窗口、一維差值重組、線性重投影、線性回歸等傳統(tǒng)數(shù)據(jù)挖掘算法。這些算法模塊對系統(tǒng)算力要求較小,所以該算法同時管理神華鐵路上運行的數(shù)十列重載貨車時,響應(yīng)速度極快及中央機房的算力設(shè)備占用量較少。
參考相關(guān)文獻中對同類分析需求提出的神經(jīng)網(wǎng)絡(luò)算法、蟻群算法、超限學(xué)習(xí)機算法等,在Matlab環(huán)境中加載神華鐵路2020年全年所有列車的實時采集數(shù)據(jù)進行試運行仿真模擬,判斷4種算法在不同預(yù)警級別下的故障檢出率,得到如表1所示的結(jié)果。
表1 不同預(yù)警級別下故障檢出率比較Tab.1 Comparison of fault detection rate under different warning levels
由表1可知,本研究設(shè)計的加權(quán)因子算法相比較其他3種比較算法,除紅色預(yù)警的故障檢出率略高外,其他橙色、黃色、藍色預(yù)警的故障檢出率均無統(tǒng)計學(xué)差異;但研究設(shè)計的加權(quán)因子算法的無預(yù)警狀態(tài)時的故障檢出率顯著低于3種比較算法;加權(quán)因子算法無預(yù)警狀態(tài)的故障檢出率,為神經(jīng)網(wǎng)絡(luò)算法的8.65%,為蟻群算法的7.84%,為超限學(xué)習(xí)機算法的9.82%。究其原因,3種比較算法均依賴于機器學(xué)習(xí)的數(shù)據(jù)判斷,而該算法屬于剛性數(shù)據(jù)分析算法,該算法更貼近系統(tǒng)的實際表現(xiàn)。
因為前文假設(shè)中提出該算法對硬件算力的需求較低,所以在Matlab仿真驗證過程中將所有預(yù)警的反饋時間限定在190~200 ms,比較運行4種算法所需的算力硬件,比較結(jié)果如表2所示。
表2 不同算法的算力硬件需求量比較Tab.2 Comparison of computing power and hardware requirements of different algorithms 臺
由表2可知,相關(guān)算力設(shè)備均在IBM架構(gòu)服務(wù)器平臺上構(gòu)建,所有背板帶寬均為40 Gbps,主板總線結(jié)構(gòu)均完全一致,因為原始數(shù)據(jù)結(jié)構(gòu)一致,所以該比較過程并不包含數(shù)據(jù)倉庫的數(shù)據(jù)容量設(shè)備,其中:GPU(graphics processing unit)為浮點處理器,用于運行浮點數(shù)據(jù)的計算線程,為2.4 GHz,16線程,128位處理器,CPU(central processing unit)為通用處理器;用于運行操作系統(tǒng)并驅(qū)動算力平臺,為2.0 GHz,8線程,64位處理器,SSD(Solid State Disk)為高速硬盤驅(qū)動器;用于存儲操作系統(tǒng)和應(yīng)用程序數(shù)據(jù),為1 TB大容量硬盤驅(qū)動器,RAM(Random Access Memory)為動態(tài)緩存器;用于支持GPU或CPU的高速數(shù)據(jù)緩存,為DDR4代1TB高速緩存器。綜合上述數(shù)據(jù),發(fā)現(xiàn)在190~200 ms響應(yīng)速度下,加權(quán)因子算法的實際算力設(shè)備需求遠低于3種比較算法。
基于加權(quán)因子算法的重載貨車狀態(tài)預(yù)警算法,相比較相關(guān)研究中普遍使用的神經(jīng)網(wǎng)絡(luò)算法、蟻群算法、超限學(xué)習(xí)機算法,在紅色預(yù)警狀態(tài)下?lián)碛懈叩墓收蠙z出率;在無預(yù)警狀態(tài)下?lián)碛懈偷墓收蠙z出率,且在190~200 ms響應(yīng)速度需求下,其實際算力硬件需求遠低于上述3種比較算法。表明該加權(quán)因子算法適用于神華鐵路的重載貨車狀態(tài)監(jiān)測預(yù)警系統(tǒng)。