朱 亮,李東波,何 非,童一飛,袁延強
(1.南京理工大學機械工程學院,210094南京;2.南京三埃工控股份有限公司,211100南京)
散狀物料連續(xù)稱重設備工作環(huán)境惡劣且長時間高荷載作業(yè),致使計量精度失準以及各種設備故障頻繁發(fā)生,直接造成大量貿易經濟損失;同時其故障維修服務也一直困擾著用戶和廠家,大部分故障都要派遣經驗豐富的專業(yè)人員進行現(xiàn)場診斷維修,致使故障診斷維修成本一直居高不下;此外,許多故障都是在貿易運輸過程中產生的,需要及時檢測、診斷及維修,以避免更多經濟損失[1].散狀物料連續(xù)稱重設備使用較多的有電子皮帶秤、視覺秤、核子秤等,雖然稱重原理不同,但設備的數(shù)據(jù)形態(tài)具有很大的相似性,都會隨著流量的變化而變化,故本文以電子皮帶秤為代表、研究散狀物料連續(xù)稱重設備故障在線檢測和診斷.隨著計量精度要求的不斷提高,電子皮帶秤已從單稱重傳感器發(fā)展到多稱重傳感器,其故障在線檢測和診斷的主要途徑是對其多個稱重傳感器的數(shù)據(jù)進行在線檢測、分析、挖掘,以提取正常數(shù)據(jù)點,分離故障信息,最終識別故障數(shù)據(jù),其實質是一個在線“聚類&多分類”的問題.
在故障信息分離階段,應用聚類算法可降低故障數(shù)據(jù)維度,減少后續(xù)識別模型的訓練時間,從而大大提高故障識別效率.聚類是無監(jiān)督學習算法,算法簡單且效率高,對隨機性信號具有很強的魯棒性.Khediri等[2]將核k-means聚類算法應用于故障數(shù)據(jù)前處理,Alaei等[3]提出一種基于WFCM聚類的在線故障檢測方法,李亞敏等[4]將相似性傳播聚類算法引入到航空發(fā)動機突發(fā)故障診斷中.但文獻[2-3]中需要提前指定聚類類數(shù),文獻[4-5]在處理含噪聲數(shù)據(jù)時不太理想[5].DENCLUE(density-based clustEring)算法是一種基于核密度估計(Kernel Density Estimationbased)的聚類算法[6],無需提前指定聚類類數(shù)和聚類中心,而且對噪聲具有很好的免疫效果[7-8],但對密度不均勻的數(shù)據(jù)魯棒性不好.
在狀態(tài)識別的多分類階段,機械設備故障樣本的難以獲取制約了人工神經網(wǎng)絡等智能診斷方法的發(fā)展和應用[9-10].基于統(tǒng)計學習理論的支持向量機(support vector machine SVM)是一種針對有限樣本的通用機器學習方法,能夠避免過學習、局部極值等問題,有比神經網(wǎng)絡更好的泛化性能[11],通過引入再生核理論避免了維數(shù)災難,成功解決了高維非線性問題,已廣泛應用于故障診斷[12-14].故障診斷中常用的SVM多分類器主要有:“一對一”(1-a-1)、“一對其余”(1-a-r)、二叉樹和決策導向無環(huán)圖(decision directed acyclic graph DDAG)等等[15].本文采用二叉樹支持向量機(Binary Tree SVM),BTSVM 與 1-a-1、1-a-r、DDAG等組合策略相比,具有分類器數(shù)目少,不存在不可識別區(qū)域,分類速度快以及嚴格的泛化誤差理論[16-17]等優(yōu)點,廣泛應用于在線故障識別.
本文提出一種改進型DENCLUE聚類算法,將其應用于電子皮帶秤在線故障檢測,并提出一種二叉樹設計方法,結合二叉樹SVM對電子皮帶秤進行在線故障識別.通過試驗對本文診斷模型性能進行驗證.
電子皮帶秤稱重傳感器數(shù)據(jù)會隨著其瞬時流量的變化而變化,故其未知的故障數(shù)據(jù)也隨之變化,難以識別.正常數(shù)據(jù)點以及相同故障的數(shù)據(jù)點由于相似性極高會以集簇的形式出現(xiàn),故本文基于無監(jiān)督學習思想,通過在數(shù)據(jù)空間中進行集簇聚類,分離正常數(shù)據(jù)點和故障數(shù)據(jù)點,實現(xiàn)在線故障檢測.在線故障診斷即在檢測出故障后,判別故障為哪一種已知的故障模式,是有監(jiān)督學習的多分類問題.綜上所述,電子皮帶秤的故障在線檢測和診斷是一個在線“聚類&多分類”的問題.
本文結合DENCLUE聚類與BTSVM分類器對電子皮帶秤進行故障在線檢測和診斷.在線故障檢測時,采用基于DENCLUE的算法對實時采集到的稱重傳感器數(shù)據(jù)進行在線聚類分析,提取正常傳感器數(shù)據(jù).得到正常數(shù)據(jù)后,若正常數(shù)據(jù)數(shù)目等于傳感器總數(shù),則無故障;若)<#(Dt),則存在故障.
在線故障診斷是在檢測到故障后,采用已訓練好的BTSVM分類器,以正常傳感器數(shù)據(jù)的平均值、各現(xiàn)場環(huán)境數(shù)據(jù)以及原始數(shù)據(jù)為故障樣本特征,對多類故障進行在線故障模式識別,具體流程如圖1.
圖1 電子皮帶秤故障在線檢測和診斷流程
DENCLUE算法是一種基于密度的聚類算法,采用基于網(wǎng)格的方法提高了性能,其核心思想是采用核密度估計對數(shù)據(jù)空間中每點密度建模,并以自然的方式定義以密度吸引子(密度估計函數(shù)的局部極值點)為核心的集簇.
定義1 若函數(shù)K:Rm→R滿足且∫RmK(x)dx=1,則K為一核函數(shù).
樣本點xt∈X?Rm,m∈N對其周圍點x∈X的影響函數(shù)可用核函數(shù)表示,若用高斯核函數(shù),有
數(shù)據(jù)空間D={x1,x2,…,xn}?Rm,m,n∈N中任一點x的密度估計為其他所有樣本點對該點影響函數(shù)之和,即
定義2 點x∈D密度吸引于密度吸引子x*,當且僅當開始于x的爬山算法最后收斂于x*.DENCLUE算法中的多中心類定義見定義3.
定義3 集合C?D為一關于參數(shù)σ、ξ的多中心類,當且僅當其滿足:
1)?x∈C?x*∈X:fD(x*)≥ξ,且x密度吸引于x*,其中X為密度吸引子集合;
在上述定義基礎上,DENCLUE聚類(見圖2)步驟如下:
1)推導空間D中數(shù)據(jù)點的密度函數(shù);
2)對于任意密度吸引子,將密度吸引于其的點定義為一簇;
3)丟棄密度函數(shù)值小于噪聲閾ξ值的簇及點;
4)根據(jù)定義3合并相關簇.
圖2 DENCLUE聚類示意
雖然DENCLUE算法有諸如抗噪聲能力強,能發(fā)現(xiàn)任意形狀簇等優(yōu)點,但同時也存在著嚴重的缺陷,例如算法復雜度比其他基于密度的聚類算法要大,處理密度不相同簇的數(shù)據(jù)時不具有很好魯棒性等.因此,若要將其引入到電子皮帶秤在線故障檢測還有待改進.
稱重傳感器在線故障檢測
在實際情況中,故障點相對于正常數(shù)據(jù)點是少量的,因此可作出以下合理假設:
若Dt為t時刻N個稱重傳感器、含有k(未知)類故障的樣本數(shù)據(jù)為正常傳感器數(shù)據(jù)點集合為第i類故障樣本點集合,則集合Dt0中元素數(shù)目大于任一故障集合中數(shù)目,即
本文基于上述假設,提出采用在線聚類分析提取正常傳感器數(shù)據(jù)點,分離故障數(shù)據(jù)以檢測故障.在線提取正常傳感器數(shù)據(jù)點有兩種思路:一是采用諸如DBSCAN、DENCLUE、模糊系統(tǒng)聚類無需提前指定類數(shù)k的聚類算法,將t時刻數(shù)據(jù)點集合Dt聚類成{C1,C2,…,Ck},然后得到二是直接將正常數(shù)據(jù)從數(shù)據(jù)背景中提取出來.后者比前者直接、簡單、效率高,更適合在線.本文基于第二種思路,對DENCLUE算法進行改進,具體改進如下:
1)采用相似系數(shù)r(xt,x)替代距離函數(shù)d(xt,x).
電子皮帶秤在不同輸送流量時,稱重傳感器數(shù)據(jù)點集合Dt內密度不相同,d(xt,x)的分布也有較大變化,DENCLUE需采用不同噪聲閾值ξ和平滑因子σ才能將故障數(shù)據(jù)點與正常數(shù)據(jù)點分開,即DENCLUE處理不同流量數(shù)據(jù)時不具有很好魯棒性.針對這一問題,本文采用相似系數(shù)替代距離函數(shù)d(xt,x)、并重新構造密度估計函數(shù)以提高算法魯棒性.相似函數(shù)為
2)選取動態(tài)噪聲閾值,提取正常傳感器數(shù)據(jù)點.以全局極值點作為全局密度吸引子,再選取動態(tài)噪聲閾值ξ=λ·f
D(x*),λ∈(0,1),提取正常數(shù)據(jù)點集合ξ,x∈Dt},余下的噪聲信號即為故障數(shù)據(jù).Dt0中可能有多個吸引子,但符合定義3.
通過改進2),算法只需找出全局密度吸引子、無需找全所有,采用閾值過濾出正常數(shù)據(jù)點、取代了原算法中的2)、3)、4)步驟,將原先的多類聚類算法化簡為二類聚類,大大降低了算法復雜度,更適合在線.改進后算法具體步驟如下:
Step 1 采用相似系數(shù)r(xt,x)構造相似核函數(shù):
顯然,式(2)符合定義1.再將式(2)代入式(1)得相似密度估計函數(shù):
Step 2 尋找全局密度吸引子x*,提取正常數(shù)據(jù)點簇
圖3 改進型DENCLUE聚類示意圖
對于N類問題,二叉樹SVM采用二叉樹結構構造N-1個分類器.二叉樹的層次結構有兩種:一種是在每個內節(jié)點處,由一個類與剩下的類構造分割面,即偏二叉樹;另一種是在內節(jié)點處,可以是多個類與多個類的分割[18].本文采用偏二叉樹結構SVM進行故障診斷.
BTSVM整體分類性能主要與二叉樹生成順序、節(jié)點位置有關,越是上層節(jié)點,SVM的分類性能(分類間隔大)對BTSVM模型分類性能影響越大.為了減少誤差積累,以及讓分布廣的類擁有更大的分割區(qū)域,應最早分割可分性最大的類以提高分類推廣能力[17][19].本文以類內樣本和類間樣本的綜合分布情況計算可分性測度.
為了更準確地估計各個樣本類的分布情況,尋找可分性最大的類以及構建最優(yōu)性能的二叉樹結構,本文將DENCLUE聚類算法中的密度估計方法引入到二叉樹支持向量機中,以DENCLUE算法中的相似密度函數(shù)為基礎建立可分性測度,并以此對各個故障類進行排序.由于各類故障數(shù)據(jù)真實分布無法獲知,可用有限樣本數(shù)據(jù)的分布對真實分布進行近似估計,本文分別定義類內平均相似密度、類間平均相似密度,對類內、類間樣本分布情況進行估計.在含k類故障樣本的數(shù)據(jù)空間{D0,D1,D2,…,Dk}中,類內、類間平均相似密度定義如下:
第i類內平均相似密度為
第i類間平均相似密度為
其中,計算電子皮帶秤各個故障類可分性測度時,K(xj,x)為式(2)中所定義的核函數(shù),并且故障樣本必須是同一流量情況下的故障樣本,否則無意義.類內相似密度越小代表類內部分布越廣,類間相似密度越小代表該類與其他類差異越大、越可分.根據(jù)類內分布越廣、類間可分離度越大的原則[20-21],綜合式(3)、(4)得第i類的可分性測度:
式中α為調節(jié)類內相似密度和類間相似密度的權重系數(shù),可通過參數(shù)優(yōu)化確定.由式(5)可看出,μi值越大,該類可分性越強.
在計算電子皮帶秤k類故障的可分性測度時, 還需將樣本按不同流量分為{DQ1,DQ2,…,DQs}s個子樣本集,然后計算k類故障在每個流量樣本DQ1(j=1,2,…,s))中的可分性測度μQji,最后取所有流量樣本下的測度平均值作為每類故障的可分性測度:
改進后的BTSVM算法步驟如下:
1)確定權值,根據(jù)式(5)或式(6)計算各類故障的可分性測度;
2)將各類按其可分性測度由大到小排序(當存在兩個或兩個以上類別的可分性測度相同時,依據(jù)人工經驗自由排序),得到類別排列c1,c2,…,ck,ci∈{1,2,…,k},i=1,2,…,k,即為各故障類的可分性級別;
3)依據(jù)排列c1,c2,…,ck確定偏二叉樹各節(jié)點位置,并采用二分類C-SVM訓練算法構造各節(jié)點最優(yōu)分類超平面,構造流程與其他偏二叉樹SVM幾乎相同.
為驗證改進型偏二叉樹SVM算法的優(yōu)越性,本文以UCI機器學習數(shù)據(jù)庫中wine、iris、segment和vowel數(shù)據(jù)集[22]分別與一對一 SVM、一對多SVM及改進BTSVM進行試驗比較,各算法均在libsvm基礎上修改實現(xiàn),標準數(shù)據(jù)信息如表1.
表1 標準數(shù)據(jù)集信息
為了方便后續(xù)數(shù)據(jù)處理,加快算法收斂速度,試驗時對各樣本先進行歸一化處理,線性調整到[0,1].算法中核函數(shù)統(tǒng)一采用高斯核,以網(wǎng)格搜索最優(yōu)參數(shù)組合.改進BTSVM中的可分性測度權值α也采用網(wǎng)格搜索,通過搜索確定權值變化時對應的二叉樹層次結構以及各個結構的α臨界值.對每一種結構尋找其最優(yōu)SVM參數(shù)組合,以獲得最高識別準確率,并以此準確率為對應結構的識別準確率.試驗結果如表2,從表2中可看出改進后的BTSVM除了在vowel數(shù)據(jù)集中準確度稍遜于一對一算法,其他數(shù)據(jù)集中均高于其他算法,可見改進后BTSVM性能優(yōu)越.
表2 標準數(shù)據(jù)集試驗結果
本文以南京三埃工控股份有限公司QPS-皮帶秤全性能試驗中心的3#陣列式皮帶秤為故障診斷試驗對象(圖4),皮帶秤參數(shù)見表3.該試驗系統(tǒng)可循環(huán)走料.現(xiàn)場數(shù)據(jù)通過RS485總線傳輸,并采用單片機和周立功RSM485CHT轉換器接收,上位機采用串口通信實時采集.改進型DENCLUE聚類算法是在Matlab環(huán)境下完成的,BTSVM是在libsvm基礎上修改,采用Matlab和C/C++混合編程實現(xiàn)的.測試硬件環(huán)境為Core i3-2.35 G 的 CPU,內存 6G,硬盤 500 G.
圖4 3#陣列式皮帶秤示意
表3 QPS-皮帶秤全性能試驗中心的3#皮帶秤參數(shù)
3#陣列式皮帶秤由8個稱重單元組構成,8個單元都遠離落料點,從而避免了落料沖擊,尤其是突發(fā)的大塊物料沖擊對稱重故障的干擾[23].每個單元采樣頻率為10 Hz,一圈運行周期約49 s(2.21 m/s).每個時刻的每組采樣數(shù)據(jù)由8個稱重傳感器實時數(shù)據(jù)及現(xiàn)場環(huán)境數(shù)據(jù)組成.試驗過程中,在3#陣列式皮帶秤上分別模擬了表4中6類常見故障,每個稱重單元的故障模式相同.由于實際情況中同一時刻最多只會有3個稱重單元區(qū)域出現(xiàn)故障,故本研究在試驗時每組最多只模擬4個稱重單元產生故障數(shù)據(jù),通過在空載、200、500、800 t/h不同流量下多次模擬試驗,以驗證本文故障在線檢測和診斷模型的有效性.
表4 陣列式皮帶秤故障類別
電子皮帶秤在線故障檢測即對8個稱重單元的檢測數(shù)據(jù)進行聚類分析.試驗分別采用DENCLUE、DBSCAN、模糊層次聚類以及改進型DENCLUE對8個稱重單元工作在空載、200、500、800 t/h不同流量時的實時含噪聲數(shù)據(jù)進行在線聚類分析,并對比各算法的準確度和實時性(見圖5).
圖5 聚類算法精度比較
由圖 5可知,模糊層次聚類和改進型DENCLUE聚類算法的最優(yōu)模型在任何流量下的聚類精度都較高且無明顯變化,模糊層次聚類由于噪聲干擾,聚類精度受到一定影響,稍低于改進型 DENCLUE;而采用距離函數(shù)的 DBSCAN、DENCLUE算法在200 t/h得到最優(yōu)聚類模型不具備很好的推廣能力.采用距離函數(shù)的DBSCAN、DENCLUE算法在各個流量時最優(yōu)模型精度對比見圖6.
圖6 DBSCAN、DENCLUE聚類效果圖
由圖6可知,有必要使用相似函數(shù)替代距離函數(shù),以提高聚類算法對于不同流量數(shù)據(jù)的魯棒性.再次進行4種流量的在線聚類試驗,試驗中DENCLUE和DBSCAN算法中均采用相似函數(shù),試驗結果見表5.
表5 各聚類算法比較
從表5中可以看出,改進型DENCLUE較之其他聚類算法擁有較高的聚類精度以及相當快的聚類速度,更適合在線故障檢測.
從現(xiàn)場采集的空載、200、500、800 t/h等4組故障數(shù)據(jù)中各抽選250個樣本訓練診斷模型,比較各個診斷模型在散狀物料連續(xù)稱重設備在線故障診斷中的性能.為提高分類器在不同流量時的魯棒性,核函數(shù)均采用
并通過修改libsvm中的高斯核實現(xiàn);最優(yōu)參數(shù)是在網(wǎng)格C=[2-3,2-2,…,23],γ=(2-1,20,…,28)范圍內使用5折交叉驗證方法搜索獲得.
在使用數(shù)據(jù)集進行訓練和預測時,每個樣本包括6個特征:當前托輥傳感器數(shù)據(jù)、同一時刻平均正常數(shù)據(jù)、同一時刻前相鄰托輥稱重數(shù)據(jù)(第1單元的前相鄰稱重數(shù)據(jù)取其本身)、同一時刻后相鄰托輥數(shù)據(jù)(第8單元的后相鄰稱重數(shù)據(jù)取其本身)、現(xiàn)場溫度、傳感器靈敏度.在線診斷測試時,同一時刻平均正常數(shù)據(jù)為在線聚類分析所得.在訓練診斷模型前,本文需要根據(jù)式(3)~(6)對正常類及各個故障類進行可分性測度估計(見表6),以建立偏二叉樹結構.
由表7可看出,α取任何值,F(xiàn)2的可分性測度都是最大的,故該類故障應最優(yōu)先分離.權值α通過以1為指數(shù)增量進行網(wǎng)格搜索優(yōu)化,研究發(fā)現(xiàn),當28≤α≤222時,二叉樹結構為固定的8種結構,再以這8種結構構造BTSVM,對比8種結構的分類效果后,得到217≤α≤220為最優(yōu).
表6 各故障類間、類內相似密度
表7 各權值α對應的二叉樹結構
最后將二叉樹結構F2>F3>F4>F6>F5>F1>F0 的BTSVM與一對多算法以及一對一算法進行不同流量時的在線診斷試驗,將其診斷性能與其他分類器比較.從表8可以看出“1對1”SVMs平均測試時間最長,而本文方法的測試時間明顯最短,且精度最高,因此本文方法比較適合電子皮帶秤的故障在線檢測和診斷.
表8 幾種故障分類器性能比較
1)采用相似密度函數(shù)替代DENCLUE聚類算法中的距離函數(shù),解決了算法在處理密度不均勻數(shù)據(jù)時魯棒性很差的問題,并采用動態(tài)閾值法替代爬山法,降低了算法復雜度,更適于在線聚類.
2)引入DENCLUE中的密度估計方法,提出一種改進型偏二叉樹SVM多分類器.該分類器利用類間、類內平均相似密度建立了可分性測度,再根據(jù)可分性測度構建偏二叉樹結構.標準數(shù)據(jù)集試驗表明:該分類器具有很好的優(yōu)越性.
3)結合改進型DENCLUE和改進型偏BTSVM,提出了一種能準確對電子皮帶秤常見故障進行在線快速檢測和診斷的模型.最后通過陣列式皮帶秤試驗,驗證了本文所提出電子皮帶秤故障在線檢測和診斷模型的優(yōu)越性.
[1]方原柏.電子皮帶秤[M].北京:冶金工業(yè)出版社,2008:1-4.
[2]KHEDIRI I B,WEIHS C,LIMAM M.Kernelk-means clustering based local support vector domain description fault detection of multimodal processes[J].Expert Systems with Applications,2012,39(2):2166-2171.
[3]ALAEI H K,SALAHSHOOR K,ALAEI H K,et al.A new integrated on-line fuzzy clustering and segmentation methodology with adaptive PCA approach for process monitoring and fault detection and diagnosis[J].Soft Comput,2013,17(3):345-362.
[4]李麗敏,王仲生,姜洪開.基于相似性傳播聚類的航空發(fā)動機突發(fā)故障診斷[J].振動與沖擊,2014,33(1):51-55.
[5]楊小兵.聚類分析中若干關鍵技術的研究[D].杭州:浙江大學,2005:23-41.
[6]HINNEBURG A,KEIM D A.A general approach to clustering in large databases with noise[J].Knowledge and Information Systems,2003(5):387-415.
[7] HINNEBURG A,GABRIEL H H.DENCLUE 2.0:Fast clustering based on kernel density estimation[J].Lecture Notes in Computer Science,2007,4723:70-80.
[8]淦文燕,李德毅.基于核密度估計的層次聚類算法[J].系統(tǒng)仿真學報,2004,16(2):302-309.
[9]吳丹,金敏.基于容錯度自適應支持向量機的液壓泵故障診斷[J].中國機械工程,2011,22(11):2582-2587.
[10]任能.制冷系統(tǒng)故障檢測、診斷及預測研究[D].上海:上海交通大學,2008:3-4.
[11]LIU Zhiwen,CAO Hongrui,CHEN Xuefeng,et al.Multifault classification based on wavelet SVM with PSO algorithm to analyze vibration signals from rolling element bearings[J].Neurocomputing,2013,99:399-410.
[12]蘇小紅,趙玲玲,謝 琳,等.陰影集的模糊支持向量機樣本選擇方法[J].哈爾濱工業(yè)大學學報,2012,44(9):78-84.
[13]OTHMAN N S,LAOUTI N,VALOUR J P,et al.Support vector machines combined to observers for fault diagnosis in chemical reactors[J].The Canadian Journal of Chemical Engineering,2014,92(4):685-695.
[14]劉本德,胡昌華,蔡艷寧.基于聚類和SVM多分類的容差模擬電路故障診斷[J].系統(tǒng)仿真學報,2009,21(20):6479-6482.
[15]袁勝發(fā),褚福磊.支持向量機及其在機械故障診斷中的應用[J].振動與沖擊,2007,26(11):29-34.
[16]FEI B,LIU J.Binary Tree of SVM:A new fast multiclass training and classification algorithm[J].IEEE Trans on Neural Networks,2006,17(3):696-703.
[17]BENNETT K P,CRISTIANINI N,SHAWE T J,et al.Enlarging the margins in perceptron decision trees[J].Machine Learning,2000,4l(3):295-313.
[18]姚良,李艾華,王濤.運用改進二叉樹SVM算法的柴油機振動診斷[J].振動、測試與診斷,2010,30(6):689-693.
[19]趙海洋,徐敏強,王金東.改進二叉樹支持向量機及其故障診斷方法研究[J].振動工程學報,2013,26(5):764-769.
[20]唐發(fā)明,王仲東,陳綿云.支持向量機多類分類算法研究[J].控制與決策,2005,20(7):746-754.
[21]馮志剛,王祁,信太克規(guī).基于EMD和SVM的傳感器故障診斷方法[J].哈爾濱工業(yè)大學學報,2009,41(5):59-63.
[22]UC Irvine Machine Learning Repository[DB/OL].Irvine,California:University of California.2014-05-03[2014-05-10].http://archive.ics.uci.edu/ml/.
[23]DONIS V K,RACHKOVSKII A E,SIN V M.How the conveyor belt length affects belt weigher accuracy[J].Measurement Techniques,2004,47(2):163-167.