趙麗琴,劉 昶,鄧丞君
(成都大學(xué) 信息科學(xué)與工程學(xué)院,成都 610106)
健康度是設(shè)備量化的健康程度,是一種設(shè)備健康狀態(tài)的定量評估,可以更準確的反映設(shè)備健康狀態(tài)。隨著大型機電設(shè)備系統(tǒng)集成化、信息化程度的提高,其故障診斷與后勤保障的難度增大。為保障這些系統(tǒng)連續(xù)穩(wěn)定的運行,不影響任務(wù)的正常執(zhí)行,減少資源浪費,提高設(shè)備保養(yǎng)和維修效率,需隨時掌握設(shè)備的健康度,并根據(jù)系統(tǒng)健康度做出適當(dāng)?shù)木S修維護決策,提高其工作效能。
根據(jù)文獻,目前對復(fù)雜系統(tǒng)健康度的評估,大部分都是基于向量距離的計算,也有部分是基于模糊評判或者信息熵方法。一般常規(guī)的方法包括:綜合權(quán)重法、模糊隸屬度、層次分析、灰色關(guān)聯(lián)、高斯模型等。如文獻[1-4]就運用了綜合權(quán)重和模糊評價法對設(shè)備的健康度進行了評估。文獻[5]利用模糊測度和模糊積分來計算配電網(wǎng)關(guān)鍵設(shè)備的健康度。文獻[6-7] 利用回歸算法預(yù)測健康度,取得了不錯效果。也有學(xué)者用灰色關(guān)聯(lián)法計算采集向量和虛擬向量的關(guān)聯(lián)度,得到健康度,對設(shè)備進行健康度評估[8-9]。文獻[10]分兩級計算設(shè)備健康度,在部件級計算了帶加權(quán)的距離,然后通過動態(tài)權(quán)重的模糊層次法計算系統(tǒng)級健康度。但這些方法都需要良好的先驗知識來確定權(quán)重及模糊函數(shù)等信息,且不適應(yīng)大量采樣數(shù)據(jù)場合。
隨著大數(shù)據(jù)分析技術(shù)的出現(xiàn),利用機器學(xué)習(xí)方法進行健康度評估的研究越來越多。例如為了對風(fēng)洞設(shè)備進行健康狀態(tài)評估,文獻[11]利用深度學(xué)習(xí)LSTM算法,先降維,再計算向量距離得到健康度。利用傳統(tǒng)機器學(xué)習(xí)技術(shù)如支持向量機(SVM)算法來進行健康狀態(tài)評估的研究也得到廣泛重視。比如有研究采用SVM算法對高鐵動車的軸承進行健康評估[12];還有研究利用SVM算法對艦船的推進系統(tǒng)進行健康管理[13]。相對于深度學(xué)習(xí)算法,SVM算法占用資源少,訓(xùn)練樣本要求不多,而準確度相差不大[14],因此成為設(shè)備健康狀態(tài)評估的主流研究方向。SVM方法是以多分類為框架,SVM通過對設(shè)備正常數(shù)據(jù)和異常數(shù)據(jù)進行學(xué)習(xí)構(gòu)建分類器進行測試。但在實際測量中,容易獲得大量的正常樣本,而異常樣本不易獲得,就會造成嚴重的數(shù)據(jù)不平衡問題。如果異常樣本匱乏,則SVM不能很好地發(fā)揮作用,對于異常情況的分類效果就不甚理想[15]。
鑒于大多數(shù)設(shè)備具備較多的正常數(shù)據(jù),缺乏或者只有少量異常狀態(tài)數(shù)據(jù),SVDD作為一種單分類學(xué)習(xí)方法,成為一種評價健康度較好的備選方法。如文獻[16]采用主成分分析法、SVDD算法和馬氏距離等方法,計算設(shè)備的實時健康度。文獻[17]將模糊理論與SVDD算法相結(jié)合,提出基于模糊SVDD的電子裝備狀態(tài)評估模型。但該方法未考慮不同屬性的權(quán)重,適用于樣本權(quán)重均衡的場合。鄭州大學(xué)的李凌均等[18]將支持向量數(shù)據(jù)描述用于機械設(shè)備狀態(tài)評估研究,僅僅依靠正常運行時的數(shù)據(jù)信號,而不需要故障數(shù)據(jù),就可以監(jiān)測機器的運行狀態(tài),對早期故障診斷提供很好的幫助。
基于SVDD的單類學(xué)習(xí)方法在機械設(shè)備異常檢測、設(shè)備故障預(yù)警,圖像異常檢測等領(lǐng)域逐漸得到廣泛應(yīng)用,但在設(shè)備健康狀態(tài)評估方面應(yīng)用甚少且準確性不高。本文以采集樣本不均衡的設(shè)備為評估研究對象,提出了基于動態(tài)權(quán)重的SVDD設(shè)備健康度評估方法。該方法首先采用SVDD算法訓(xùn)練正常健康狀態(tài)的樣本得到一個超球面,然后利用少量各種健康度的標記樣本計算其到超球面距離,再采用二項式回歸學(xué)習(xí)算法得到健康度計算的擬合曲線。為了提高評估的準確性,本方法特別考慮了設(shè)備采樣參數(shù)值在偏離最佳值越大時,健康度越差的事實,提出了基于指數(shù)函數(shù)的動態(tài)權(quán)重算法。將該算法與前面方法結(jié)合可顯著提高準確性。最后以某型雷達發(fā)射機為例進行測試驗證。實驗結(jié)果表明,該方法對設(shè)備健康度準確評估具有不錯實用價值。
作為一種典型的單分類器,采用SVDD模型,對健康數(shù)據(jù)進行訓(xùn)練后就可以對健康狀態(tài)和非健康狀態(tài)進行分類,適合缺乏全面樣本的場合。
假定健康樣本數(shù)據(jù)為集合{xi},xi∈Rd,i=1,…,N,訓(xùn)練SVDD模型的目標是找到一個最小體積的超球體,使所有向量xi都包含在該球體內(nèi)。用圓心a和半徑R來表示這個超球體。為了減少奇異點的影響,引入松弛變量ξi,問題轉(zhuǎn)化為求解下面的二次規(guī)劃問題[14]:
(1)
式中,C為懲罰系數(shù),ξi≥0(i=1,…,N),‖φ(xi)-a‖2為點φ(xi)到球心a的距離。通過建立拉格朗日函數(shù),并引入核函數(shù)κ(xi,xj)=φ(xi).φ(xj)代替內(nèi)積運算,將上述二次規(guī)劃問題轉(zhuǎn)化為如下對偶問題:
(2)
解上述不等式,得到球心:
(3)
取特征空間內(nèi)任一支持向量φ(xk),可得半徑:
(4)
相應(yīng)地,一個樣本點z到球心a歐式距離d為:
(5)
通常一個設(shè)備有多個與健康狀態(tài)相關(guān)的參數(shù),不同參數(shù)對設(shè)備健康狀態(tài)的影響不同。采用權(quán)重法是一種慣常做法。在工作中發(fā)現(xiàn),一個參數(shù)對健康狀態(tài)的影響并不是一成不變的,隨著其參數(shù)值大小變化而變化。比如某個參數(shù)平時在正常范圍內(nèi),對健康狀態(tài)影響不大。但是隨著參數(shù)值偏離正常值越多,對健康狀態(tài)的影響就越大。根據(jù)長期觀察和實驗驗證,參數(shù)值變化對健康狀態(tài)的影響程度比較貼近指數(shù)函數(shù)。因此,對于參數(shù)i的動態(tài)權(quán)重指數(shù),可用如下指數(shù)函數(shù)表示:
(6)
在公式(6)中g(shù)i是歸一化之后的參數(shù)檢測值。ψi是參數(shù)i的動態(tài)權(quán)重的指數(shù)函數(shù)參數(shù),要求ψi>1,其具體值根據(jù)參數(shù)在報警區(qū)域?qū)φ麄€設(shè)備的健康度影響程度而定。影響越大,可設(shè)定ψi的值越大。不同采集參數(shù)具有不同的ψ值,說明參數(shù)值增加時,對整個健康度的影響程度。xi是采集參數(shù)i的值,ηi是參數(shù)i最佳值。boundi是其邊界閾值。很明顯,當(dāng)采集參數(shù)值超過邊界值時,會快速增加,凸顯該參數(shù)對整個健康狀態(tài)的影響顯著增強。
參數(shù)i的綜合權(quán)重指數(shù)w’i是動態(tài)權(quán)重指數(shù)wid和靜態(tài)權(quán)重指數(shù)wis之和,如公式(7)。
(7)
(8)
為了得到含有權(quán)重因子的待處理數(shù)據(jù),在數(shù)據(jù)進行歸一化處理時,需要融合權(quán)重因子的影響,這樣就更好地反映了各個參數(shù)對健康度的影響。含有權(quán)重的歸一化采集數(shù)據(jù)值為:
(9)
在公式(9)中,xi是采集參數(shù)i的數(shù)據(jù)值,wi是其對應(yīng)的權(quán)重因子。μi則是該參數(shù)最佳值,δi是其標準差,考慮計算標準差的特殊性,可采用迭代算法[19]。這樣計算的結(jié)果代替原始采集數(shù)據(jù)xi用于SVDD建模及后續(xù)SVDD距離計算,可以很好地體現(xiàn)某些惡化參數(shù)對健康度的影響。
SVDD模型超球面反映了健康數(shù)據(jù)的范圍。對每個采集數(shù)據(jù)向量z,可以計算其到超球面圓心的距離d,然后根據(jù)這個距離大小可以得到量化的健康狀態(tài),即健康度。通常d越大表示數(shù)據(jù)所代表的健康狀態(tài)越差,如圖1所示。
圖1 不同樣本與SVDD超球體位置關(guān)系
通過擬合運算可以從距離d得到健康度。要進行擬合運算需要有各種健康狀態(tài)的樣本數(shù)據(jù)。但在樣本不均衡情況下,很難有全面的樣本數(shù)據(jù)。通常對缺乏的數(shù)據(jù)樣本通過人工經(jīng)驗進行構(gòu)造。訓(xùn)練樣本的距離d和健康度E之間屬于一種函數(shù)關(guān)系,根據(jù)設(shè)備健康度的變化特點,采用二項式回歸模型具有較好的擬合效果。二項式回歸的本質(zhì)是通過學(xué)習(xí),構(gòu)造一條二項式曲線:
Eθ(d)=θ0+θ1d+θ2d2
(10)
二項式曲線應(yīng)該盡可能擬合所有用于訓(xùn)練樣本的距離d及其評估健康度E。當(dāng)未來的采集數(shù)據(jù)計算出距離d后,可以很快根據(jù)曲線函數(shù)得到對應(yīng)的健康度Eθ。
1)主成分分析法:
為了降低處理強度,在采集數(shù)據(jù)較多時,需要進行降維處理。即在盡可能保留原始數(shù)據(jù)特征的同時,盡可能降低處理數(shù)據(jù)的維度。本方法采用了PCA主成分分析法(Principal Component Analysis)來進行降維處理。它是一種常用的高維數(shù)據(jù)降維方法。其基本處理流程如圖2所示。
圖2 PCA降維處理方法流程
圖2是M條N維數(shù)據(jù)進行降維處理后,得到k維數(shù)據(jù)的處理過程。由于其處理過程比較簡單固定,在此不做過多分析。
2)異常值剔除算法:
異常值一般是由于采集器件出現(xiàn)漂移或者故障出現(xiàn)的,對健康狀態(tài)的評估具有錯誤的指示,需要剔除?;舅枷胧且?guī)定一個置信限度,凡是誤差超過該限度的值認為是異常值。本文采用一階差分法,即用兩個測量值來預(yù)估新的測量值,然后與實際測量值進行比較,如果大于設(shè)定的閾值,則認為是異常值需要剔除。令xn是采集值,則:
x′n=xn-1+(xn-1-xn-2)
(11)
|xn-x′n| (12) 公式(11)計算出參數(shù)的當(dāng)前估計值x’n,在公式(12)中與真實的參數(shù)進行比較。w為設(shè)定的閾值,與參數(shù)的變化幅度有關(guān)。 3)參數(shù)平滑處理方法: 設(shè)備檢測參數(shù)由于設(shè)備的原因,免不了有噪聲影響。采用平滑處理可以減少噪聲影響,還可以表現(xiàn)參數(shù)數(shù)據(jù)的周期趨勢。采用指數(shù)加權(quán)平均算法,運算量少,且具有不錯的效果。 vt=βvt-1+(1-β)xt (13) 其中:vt是要代替的估計值,即t時刻的指數(shù)加權(quán)平均值。xt是t時刻采集的參數(shù)值;β是一個權(quán)重參數(shù)(0 <β< 1 )。β越小,噪聲越多,雖然可以很快適應(yīng)參數(shù)的變化,但是容易出現(xiàn)異常值;β越大,得到的結(jié)果越平滑,但是對參數(shù)變化的適應(yīng)慢。一般需要根據(jù)參數(shù)的實際情況進行調(diào)節(jié),得到最佳效果。一般令β= 0.9。 綜合以上算法,可以總結(jié)出基于SVDD的健康度評估過程如圖3所示。整個過程分為兩階段進行: 圖3 基于SVDD的健康度評估算法 1)在學(xué)習(xí)階段,主要針對樣本訓(xùn)練集進行處理。鑒于樣本數(shù)據(jù)已經(jīng)經(jīng)過選擇,一般不需要再進行預(yù)處理。這里主要根據(jù)樣本向量中的參數(shù)值計算其動態(tài)權(quán)重指數(shù),得到各個參數(shù)的權(quán)重因子,然后利用公式(9)計算含權(quán)重因子的歸一化數(shù)據(jù)。如果樣本處于健康狀態(tài),則進行SVDD超球面訓(xùn)練得到SVDD模型。如果是非健康數(shù)據(jù),則利用SVDD模型計算到其到超球面圓心距離d,根據(jù)其評估的健康度E進行二項式回歸學(xué)習(xí),得到計算健康度的二項式回歸模型。 2)在檢測階段,主要針對測試和檢測集。首先進行數(shù)據(jù)預(yù)處理和權(quán)重因子計算,得到包含權(quán)重因子的歸一化數(shù)據(jù),然后利用SVDD模型計算到超球面圓心距離d,接著利用前面學(xué)習(xí)得到的二項式回歸模型計算健康度,從而得到評估結(jié)果。 無論在訓(xùn)練階段還是檢測階段,都利用了主成分分析的結(jié)果來選擇樣本向量參數(shù),降低分析向量維度,提高分析效率。 為了驗證前述方法的正確性,利用某型雷達發(fā)射機作為實際例子進行評估分析。雷達發(fā)射機是雷達最重要的關(guān)鍵子系統(tǒng),也是容易出現(xiàn)故障的部分,是重點健康管理監(jiān)控設(shè)備。 1)采集數(shù)據(jù)分析,構(gòu)建專家知識表: 雷達發(fā)射機的作用是在定時信號的激勵下,產(chǎn)生大功率的射頻信號。其狀態(tài)監(jiān)控參數(shù)較多,主要包括電磁信號參數(shù)、機械性能參數(shù)、電力參數(shù)及熱參數(shù)等。為了對本文所提方法進行評估,針對某型氣象雷達的發(fā)射機系統(tǒng)進行了實例評估。該雷達發(fā)射機采集了將近二十多個數(shù)據(jù),但并不是所有數(shù)據(jù)都與健康狀態(tài)密切有關(guān)。利用PCA算法及專家評估后,將與健康狀態(tài)有主要影響的參數(shù)分辨出來。最后選擇了11個與健康狀態(tài)密切相關(guān)的參數(shù)作為處理數(shù)據(jù)集,得到的專家知識表如表1所示。表中包括各個參數(shù)的最佳值、最大值、最小值邊界,以及靜態(tài)權(quán)重ws、動態(tài)權(quán)重參數(shù)φ等。需要根據(jù)采集值和最佳值的大小來決定bound值是選擇最大值還是最小值。雷達專家在長期維修過程中,對這些參數(shù)的含義具有非常深刻的理解,因此填寫表1的信息并不困難。雖然不是特別準確,但對用于驗證本方法已經(jīng)具有足夠的準確性。 表1 主要監(jiān)測參數(shù)基本信息表 2)構(gòu)建樣本數(shù)據(jù)集: 在實際采集的雷達發(fā)射機監(jiān)測數(shù)據(jù)中,共選取了3 000組數(shù)據(jù)作為訓(xùn)練和測試樣本。其中2 900組數(shù)據(jù)是健康數(shù)據(jù)樣本用來訓(xùn)練SVDD模型,另外100組數(shù)據(jù)是各種健康狀態(tài)下的數(shù)據(jù)樣本。選擇了其中92組用于二項式回歸學(xué)習(xí)建模,另外8組具有各種健康狀態(tài)的樣本作為測試集。由于非健康數(shù)據(jù)樣本積累較少,大部分非健康數(shù)據(jù)樣本利用了平時故障模型,并根據(jù)專家經(jīng)驗評估其健康度,作為有標記樣本。在整個處理過程中,所有樣本數(shù)據(jù)都需要計算動態(tài)權(quán)重,最后按照公式(9)進行加權(quán)的歸一化計算,便于后續(xù)分析。 3)利用SVDD模型進行訓(xùn)練得到超球面: 首先利用其中的2 900組健康數(shù)據(jù)樣本訓(xùn)練SVDD模型。為了比較不同情況下訓(xùn)練的結(jié)果,分別用兩種情況下的數(shù)據(jù)樣本進行了訓(xùn)練,即①原始數(shù)據(jù);②利用權(quán)重因子加權(quán)的數(shù)據(jù)。兩種情況下得到的超球面數(shù)據(jù)如表2所示。 表2 不同處理情況下的超球面數(shù)據(jù) 由于是11維的數(shù)據(jù)向量,其圓心也是由11個數(shù)據(jù)構(gòu)成的數(shù)組。很明顯,在同樣的樣本下,加權(quán)處理后的數(shù)據(jù)超球面半徑小很多,證明數(shù)據(jù)收斂程度更好。 4)利用二項式回歸訓(xùn)練方法建立健康度擬合曲線: 使用了92組數(shù)據(jù)進行二項式回歸訓(xùn)練。每個健康狀態(tài)有20多個樣本,得到樣本到超球面圓心的距離與健康度的映射關(guān)系。為了對比,也是針對SVDD的兩種情況進行分別訓(xùn)練,結(jié)果如表3所示。 表3 二項式回歸擬合結(jié)果 5)結(jié)果分析: 8個用于測試的樣本中,每個健康狀態(tài)有兩個樣本。與前面一樣,也是分別針對兩種數(shù)據(jù)處理情況,進行健康度評估測試。測試結(jié)果對比曲線如圖4所示。其中的標定健康度是根據(jù)專家經(jīng)驗人工標定的結(jié)果。 圖4 測試樣本的結(jié)果分析 測試表明,經(jīng)過加權(quán)處理之后評估健康度最接近人工標定的健康度,在各種不同健康狀態(tài)下的測試結(jié)果都比較穩(wěn)定,具有最佳效果。而沒有加權(quán)處理的結(jié)果偏離比較大。雖然整體趨勢也比較一致,但在很多情況下,并不嫩準確地反應(yīng)設(shè)備應(yīng)有的健康狀態(tài)。 針對設(shè)備在進行健康管理過程中存在的樣本不均衡性,本文利用了SVDD模型超球面的特點,通過權(quán)重因子融合了采集參數(shù)值變化對健康狀態(tài)的影響。結(jié)合二項式回歸擬合算法,提出了一種適用于采樣不均衡條件下的設(shè)備健康度評估方法。該方法有效解決了實際工作中由于樣本缺乏或樣本不均衡情況下設(shè)備健康度評價的難題。特別是利用指數(shù)函數(shù)動態(tài)調(diào)整各參數(shù)在取值不同情況下對健康狀態(tài)的影響,反映了各個參數(shù)對健康狀態(tài)影響的動態(tài)變化,對健康度的準確評估具有重要意義。通過對某型雷達發(fā)射機的實際評估和分析,該方法對于準確評估設(shè)備的健康度適應(yīng)性好,具有不錯的實用價值。2.5 健康度評估方法
3 健康度實例評估與分析
4 結(jié)束語