荊玉山
(中國(guó)國(guó)家鐵路集團(tuán)有限公司 北京 100055)
牽引電機(jī)是高速鐵路動(dòng)車組走行部的直接動(dòng)力來(lái)源,目前,對(duì)于牽引電機(jī)運(yùn)行狀態(tài)的掌握主要依靠安裝于定子鐵芯和兩端軸承的溫度傳感器發(fā)送的實(shí)時(shí)數(shù)據(jù),但對(duì)其應(yīng)用則以實(shí)時(shí)跟蹤為主,更偏向于事后分析,無(wú)法在故障發(fā)生之前預(yù)知或提示。國(guó)內(nèi)對(duì)牽引電機(jī)的故障預(yù)測(cè)方法的研究中,趙碩豐[1]等人通過(guò)對(duì)牽引電機(jī)的輸入輸出電流值的監(jiān)控,建立一種基于諧波分析的牽引電機(jī)預(yù)測(cè)模型。牛齊明[2]等人通過(guò)提取牽引電機(jī)的振動(dòng)特性,擬合了牽引電機(jī)正常情況下的標(biāo)準(zhǔn)振動(dòng)數(shù)據(jù),通過(guò)標(biāo)準(zhǔn)振動(dòng)數(shù)據(jù)與運(yùn)行數(shù)據(jù)的比對(duì),達(dá)到預(yù)測(cè)牽引電機(jī)故障的目的。然而根據(jù)本文的調(diào)查研究發(fā)現(xiàn),這些預(yù)測(cè)模型所需要的數(shù)據(jù),在高速鐵路動(dòng)車組中并沒有監(jiān)控設(shè)備可以進(jìn)行實(shí)時(shí)傳輸,只能在線下對(duì)動(dòng)車組牽引控制單元進(jìn)行數(shù)據(jù)下載得到。在動(dòng)車組運(yùn)營(yíng)單位中,針對(duì)動(dòng)車組某一部件的數(shù)據(jù)下載,有一定的作業(yè)時(shí)間及作業(yè)周期,因此很難通過(guò)這些數(shù)據(jù)對(duì)動(dòng)車組進(jìn)行相對(duì)實(shí)時(shí)的信息診斷及故障預(yù)測(cè)。本文基于動(dòng)車組WTDS傳輸?shù)膶?shí)時(shí)牽引電機(jī)溫度數(shù)據(jù),建立了一個(gè)牽引電機(jī)故障預(yù)測(cè)模型,滿足一定預(yù)測(cè)精度的同時(shí),也可以保證應(yīng)用方面的時(shí)效性。
目前,多元線性回歸算法[3-7]被廣泛用于各行各業(yè)的預(yù)測(cè)計(jì)算。本文結(jié)合動(dòng)車組實(shí)際情況,采用多元線性回歸算法建立牽引電機(jī)故障預(yù)測(cè)模型。相較于電流、電壓、振動(dòng)幅值、振動(dòng)頻率等數(shù)據(jù),牽引電機(jī)的溫度數(shù)據(jù)更容易得到且可以通過(guò)溫度傳感器傳輸?shù)絎TDS與地面進(jìn)行實(shí)時(shí)傳輸。通過(guò)動(dòng)車組運(yùn)營(yíng)單位的調(diào)查研究發(fā)現(xiàn),牽引電機(jī)的異常狀態(tài)完全可以通過(guò)運(yùn)行時(shí)的溫度特征體現(xiàn),因此可以將牽引電機(jī)運(yùn)行時(shí)的峰值溫度作為研判牽引電機(jī)故障的依據(jù)。下文以牽引電機(jī)溫度峰值作為預(yù)測(cè)的目標(biāo)函數(shù),考慮到牽引電機(jī)溫度傳感器或者網(wǎng)絡(luò)故障引起的牽引電機(jī)溫度突變會(huì)對(duì)函數(shù)的擬合結(jié)果造成精度缺失,進(jìn)行預(yù)測(cè)前需對(duì)車載數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗。
對(duì)于傳輸?shù)膎個(gè)運(yùn)行溫度數(shù)據(jù)tn,設(shè)定篩選變量ε。如果:
(1)
則對(duì)于采集的牽引電機(jī)溫度數(shù)據(jù)tmax進(jìn)行剔除,對(duì)剔除后的n-1個(gè)運(yùn)行數(shù)據(jù)進(jìn)行重新清洗,將滿足條件的tmax作為牽引電機(jī)溫度峰值。
對(duì)于剔除清洗后的n組預(yù)測(cè)目標(biāo)數(shù)據(jù)yn及其k個(gè)影響因子xk:
(2)
其中:β1為回歸系數(shù),μ1為隨機(jī)擾動(dòng)項(xiàng)。通過(guò)對(duì)動(dòng)車組牽引電機(jī)溫度數(shù)據(jù)的研究發(fā)現(xiàn),動(dòng)車組在不同運(yùn)行線路、不同的檢修條件下,牽引電機(jī)的溫度峰值有著顯著的不同。分析認(rèn)為:運(yùn)行中牽引電機(jī)溫度的峰值變化,是一個(gè)連續(xù)的、相互影響的過(guò)程,因此可以由前日牽引電機(jī)的運(yùn)行狀態(tài),結(jié)合當(dāng)日的運(yùn)行實(shí)際對(duì)當(dāng)日牽引電機(jī)的溫度峰值進(jìn)行表征。由于牽引電機(jī)采用強(qiáng)迫式風(fēng)冷散熱,無(wú)散熱格柵,結(jié)構(gòu)相對(duì)封閉,故外界溫度及天氣狀況因素對(duì)牽引電機(jī)峰值溫度的影響微乎其微。因此,此處將牽引電機(jī)檢修項(xiàng)目信息、運(yùn)行線路狀況、行車信息及前一天牽引電機(jī)運(yùn)行狀態(tài)作為牽引電機(jī)溫度峰值預(yù)測(cè)的影響因子,可以得到較為精準(zhǔn)的預(yù)測(cè)結(jié)果。
為保證擬合的回歸方程可以得到良好的精度,根據(jù)殘差的平方和最小原則,有:
(3)
為防止數(shù)據(jù)中存的離群值xout(對(duì)應(yīng)的殘差具有較大方差的值)降低預(yù)測(cè)精度,需對(duì)離群值xout進(jìn)行剔除處理。對(duì)于n組牽引電機(jī)溫度數(shù)據(jù)yn,使用奈爾檢驗(yàn)法檢驗(yàn)離群值,則有:
(5)
(6)
(7)
對(duì)數(shù)據(jù)進(jìn)行清洗后,則預(yù)測(cè)值yn+1可以表達(dá)為:
(8)
選取一組CRH5A型動(dòng)車組,對(duì)其牽引電機(jī)溫度數(shù)據(jù)進(jìn)行了長(zhǎng)期的數(shù)據(jù)跟蹤,使用牽引電機(jī)故障預(yù)測(cè)模型,對(duì)牽引電機(jī)的狀態(tài)參數(shù)進(jìn)行預(yù)測(cè)分析。以7月1日的牽引電機(jī)溫度峰值作為預(yù)測(cè)模型的初始迭代值。將初始迭代步的預(yù)測(cè)值設(shè)置為零,其后的溫度峰值數(shù)據(jù)作為算法的訓(xùn)練集。設(shè)定篩選度量ε=0.003 5,對(duì)溫度傳感器傳輸?shù)臏囟葦?shù)據(jù)進(jìn)行篩選,對(duì)清洗后的數(shù)據(jù)進(jìn)行預(yù)測(cè)分析,結(jié)果如圖1所示。
觀測(cè)圖1中動(dòng)車組的牽引電機(jī)預(yù)測(cè)結(jié)果可知,7月1日至7月20日的牽引電機(jī)溫度峰值預(yù)測(cè)結(jié)果均與實(shí)際值有較大的差距,這是由于在初始訓(xùn)練階段,影響因子的系數(shù)βk的個(gè)數(shù)k大于回歸方程的個(gè)數(shù)n,在回歸分析中,影響因子的系數(shù)βk存在空值,因此對(duì)于牽引電子的預(yù)測(cè)結(jié)果yn+1呈現(xiàn)著跳動(dòng)的不穩(wěn)定性。隨著數(shù)據(jù)的不斷積累,可用于回歸的方程數(shù)目不斷增加,影響因子的系數(shù)βk的空值漸漸消除,預(yù)測(cè)值也逐漸向真實(shí)值靠攏。由圖1可知,在經(jīng)過(guò)25天的數(shù)據(jù)訓(xùn)練之后,對(duì)于CRH5A型動(dòng)車組牽引電機(jī)的峰值溫度預(yù)測(cè)精度可達(dá)92.3%。
圖1 多元線性回歸算法的CRH5A型動(dòng)車組牽引電機(jī)預(yù)測(cè)結(jié)果
由圖1可知,采用多元線性回歸算法的預(yù)測(cè)模型精度可以達(dá)到92.3%,但實(shí)際生產(chǎn)應(yīng)用中,8.7%的誤差并不在一個(gè)可接受的范圍內(nèi)。多元線性回歸模型默認(rèn)各影響因子與預(yù)測(cè)結(jié)果間存在著線性關(guān)系,然而生產(chǎn)實(shí)際中,簡(jiǎn)單的線性關(guān)系并不能完全表達(dá)兩者間存在的聯(lián)系,這就導(dǎo)致了預(yù)測(cè)值與真實(shí)值間存在較大的誤差。本文采用多元非線性回歸算法[8-9]對(duì)牽引電機(jī)的預(yù)測(cè)模型進(jìn)行改進(jìn)。
在對(duì)傳感器傳輸?shù)臓恳姍C(jī)溫度數(shù)據(jù)進(jìn)行數(shù)據(jù)剔除和清洗后,對(duì)于采集的組牽引電機(jī)溫度數(shù)據(jù)及牽引電機(jī)溫度峰值的各影響因子的數(shù)據(jù),構(gòu)建多元非線性回歸方程:
(9)
對(duì)于多元非線性回歸方程,根據(jù)殘差的平方和最小原則,有:
(10)
(11)
并使用奈爾檢驗(yàn)法剔除檢驗(yàn)離群值xout后,則預(yù)測(cè)值yn可以表達(dá)為:
(12)
本文采用多元非線性回歸算法對(duì)上述CRH5A型動(dòng)車組牽引電機(jī)溫度數(shù)據(jù)進(jìn)行預(yù)測(cè)分析,以7月1日的牽引電機(jī)溫度峰值作為預(yù)測(cè)模型的初始迭代值。設(shè)置初始迭代步的預(yù)測(cè)值為0,設(shè)定篩選變量ε=0.003 5,多元非線性回歸算法與多元線性回歸算法的預(yù)測(cè)結(jié)果如圖2所示。
觀測(cè)圖2中動(dòng)車組的牽引電機(jī)預(yù)測(cè)結(jié)果可知,多元非線性回歸算法的收斂周期遠(yuǎn)遠(yuǎn)大于多元線性回歸算法,經(jīng)過(guò)43天的數(shù)據(jù)培養(yǎng)后才逐漸收斂于真實(shí)值。這是由于多元非線性回歸算法中,雖然未知數(shù)的數(shù)量與多元線性回歸算法一致,但其影響因子的二次方項(xiàng)同樣需要一定數(shù)量的方程進(jìn)行回歸。在積累到一定數(shù)量的數(shù)據(jù)之后,多元非線性回歸算法也逐漸向真實(shí)值靠攏,但其收斂程度遠(yuǎn)遠(yuǎn)優(yōu)于多元線性回歸算法,其對(duì)于CRH5A型動(dòng)車組牽引電機(jī)的峰值溫度預(yù)測(cè)精度最終可達(dá)95.2%。
圖2 多元非線性回歸算法的CRH5A型動(dòng)車組牽引電機(jī)預(yù)測(cè)結(jié)果
針對(duì)目前牽引電機(jī)故障預(yù)測(cè)模型中數(shù)據(jù)采集困難、實(shí)時(shí)傳輸不易的問題,提出了一種基于牽引電機(jī)溫度的故障預(yù)測(cè)模型。主要結(jié)論如下:
(1)通過(guò)多元線性回歸算法建立了牽引電機(jī)峰值溫度預(yù)測(cè)模型,該模型基于溫度傳感器采集的數(shù)據(jù),可以滿足實(shí)時(shí)傳輸?shù)男枨?。將牽引電機(jī)檢修項(xiàng)目信息、運(yùn)行線路狀況、行車信息及前一天牽引電機(jī)運(yùn)行狀態(tài)作為牽引電機(jī)溫度峰值預(yù)測(cè)的影響因子,預(yù)測(cè)精度可達(dá)92.3%。
(2)針對(duì)多元線性回歸算法精度難以滿足實(shí)際生產(chǎn)需求的問題,使用多元非線性回歸算法對(duì)預(yù)測(cè)模型進(jìn)行了改進(jìn)。改進(jìn)后的預(yù)測(cè)模型收斂周期增加,但最終可達(dá)到的預(yù)測(cè)精度有了大幅提升。多元非線性回歸算法的牽引電機(jī)峰值溫度預(yù)測(cè)精度可達(dá)95.2%。