毛前軍 梁致遠 劉冬華 胡云鵬2 李冠男 方 曦
(1 武漢科技大學城市建設學院 武漢 430065; 2 武漢商學院 武漢 430056)
冷水機組作為空調系統(tǒng)的重要組成部分,在實際運行過程中,常因不同環(huán)境條件及運行模式的影響出現(xiàn)不同故障,造成能源浪費、用戶投訴、設備過度損耗[1-2]等問題。故障檢測和診斷(fault detection and diagnosis, FDD)方法作為確保冷水機組正常運行的重要方法,對空調系統(tǒng)高效運行及節(jié)能起至關重要的作用。值得注意的是,傳感器測量數(shù)據(jù)的準確性及可靠性[3-4]對故障檢測和診斷的效果有十分顯著的影響。由于傳感器故障導致的測量精確性下降可能造成系統(tǒng)控制策略不當,最終影響空調系統(tǒng)能耗及建筑服務成本[5-7],因此有必要對冷水機組傳感器故障的檢測和診斷進行研究。
近年來,基于冷水機組運行數(shù)據(jù)的FDD研究已成為制冷空調領域內的一個熱點課題。隨著研究方法的不斷發(fā)展和改進,支持向量數(shù)據(jù)描述(support vector data description, SVDD)及支持向量機(support vector machine, SVM)已被廣泛應用于冷水機組FDD領域。Zhao Yang等[8]利用SVDD進行了冷水機組及傳感器的故障檢測工作,與主元分析方法(principal component analysis, PCA)相比,該方法具有更高的故障檢測效率。Han Hua等[9]結合遺傳算法(genetic algorithm, GA)設計了“一對一”多類SVM模型應用于冷水機組重要傳感器的自動化FDD,在降低測試時間的同時取得了較優(yōu)的診斷效果。Yan Ke等[10]針對冷水機組FDD提出了一種結合外生變量的自回歸(auto-regressive modeling with exogeneous inputs, ARX)模型與SVM混合的方法,與傳統(tǒng)方法相比獲得了較高的預測準確率及較低的虛警率。
單類支持向量機(one-class support vector machine,OC-SVM)與SVDD類似[11],同為基于SVM理論的單分類方法。該方法在冷水機組故障數(shù)據(jù)樣本不足或難以獲得故障數(shù)據(jù)樣本時,能夠依據(jù)機組運行的正常數(shù)據(jù)進行學習并得到一個決策邊界用于檢測機組是否發(fā)生故障。OC-SVM在處理高維度、非線性數(shù)據(jù)集的分類問題時[12]具有較好的效果,目前已在手寫體識別[13]、衛(wèi)星圖像提取[14-15]、入侵檢測[16]、信息追蹤[17]等研究方向取得了不錯的成果,而在冷水機組傳感器故障檢測領域中鮮有應用。因此,本文提出一種基于OC-SVM的檢測方法,用于檢測冷水機組溫度傳感器偏差故障。
OC-SVM最先由B. Sch?lkopf等[18]提出,基本思想為通過訓練正常數(shù)據(jù)樣本,在特征空間中構造一個最優(yōu)超平面以實現(xiàn)訓練樣本與原點距離的最大化,如圖1所示。
圖1 OC-SVM原理Fig.1 The principle of OC-SVM
對于正常樣本數(shù)據(jù)集Χ=[x1,…,xN]T∈RN×L,為獲取決策超平面f(x)=ωφ(x)-ρ=0,考慮求解優(yōu)化問題:
(1)
(2)
式中:N為樣本個數(shù),υ∈(0,1)為正則化參數(shù);ξi為xi(i=0,1,…,N)對應的松弛變量;ω和ρ為決定決策超平面的參數(shù);φ為數(shù)據(jù)由原始非線性空間到特征空間的映射。
引入拉格朗日乘子αi≥0及βi≥0,求解拉格朗日方程:
(3)
對上述方程中的各變量求偏微分后可得該優(yōu)化問題的對偶形式:
(4)
(5)
式中:α=[α1,…,αN]T,H為由Hij構成的核矩陣,Hij可表示為:
(6)
K(xi,xj)為核函數(shù),采用如式(7)所示的RBF核函數(shù),僅有一個參數(shù)σ需調節(jié),該參數(shù)影響RBF核函數(shù)的寬幅。
(7)
通過求解上述二次規(guī)劃問題,即可解出α,于是ω和ρ可由式(8)~式(9)分別算出:
(8)
(9)
由解出的ω和ρ即可求得特征空間中的決策超平面。
對于訓練集Z=[z1,…,zM]T∈RM×L,建立了基于歐式距離的決策函數(shù)F(zk)(k=0,1,…,M)用于對測試樣本zk進行分類:
(10)
通過計算測試樣本zk的決策函數(shù)F(zk)來判斷zk與決策超平面的位置關系。若F(zk)=+1時,zk落在決策超平面之內,被分類為正類,即判斷為正常樣本;若F(zk)=-1時,zk落在決策超平面之外,被分類為負類,即判斷為故障樣本。
基于OC-SVM的溫度傳感器故障檢測流程如圖2所示,主要分為模型建立階段和故障檢測階段。
模型建立階段:1)建模前對訓練集X0∈RN×L進行均值為0、標準差為1的標準化處理;2)在標準化后的訓練集X∈RN×L上,依據(jù)十折交叉驗證法,尋找模型優(yōu)化參數(shù)(υopt,σopt);3)基于尋得的優(yōu)化參數(shù)建立OC-SVM模型用于故障檢測。
故障檢測階段:1)在測試集Z0∈RM×L中引入單變量固定幅值的傳感器故障偏差,使用與訓練集標準化相同的映射規(guī)則處理測試集數(shù)據(jù);2)通過已建立的OC-SVM模型處理標準化的測試集Z∈RM×L;3)依據(jù)所獲得的被測數(shù)據(jù)決策函數(shù)F(zk)判斷冷水機組運行狀況。
圖2 基于OC-SVM的冷水機組溫度傳感器故障檢測流程Fig.2 Flow chart of fault detection on temperature sensor in chiller based on OC-SVM
選取兩個工程實測數(shù)據(jù)集、兩個實驗數(shù)據(jù)集驗證了基于OC-SVM的冷水機組溫度傳感器故障檢測方法的有效性。
各數(shù)據(jù)集的基本特征如下:數(shù)據(jù)集Ⅰ為武漢市某電子廠7月份至9月份螺桿式冷水機組正常運行數(shù)據(jù)[19]。剔除記錄不完整的數(shù)據(jù)樣本后得到612組訓練數(shù)據(jù)和456組測試數(shù)據(jù);數(shù)據(jù)集Ⅱ為武漢市某高校地源熱泵機組(夏季氣候條件下,地源熱泵機組持續(xù)產生冷水,向室內風機盤管提供冷量)7月份和8月份正常運行數(shù)據(jù),該數(shù)據(jù)集包含460組訓練數(shù)據(jù)以及253組測試數(shù)據(jù);數(shù)據(jù)集Ⅲ及數(shù)據(jù)集Ⅳ均來自ASHARE RP-1043中離心式冷水機組正常運行數(shù)據(jù)[20]。
數(shù)據(jù)集Ⅲ的冷凍水供水的溫度設定值分別為10.0、7.2、4.4 ℃,包含410組訓練數(shù)據(jù)及410組測試數(shù)據(jù);數(shù)據(jù)集Ⅳ的冷凍水供水的溫度設定值為7.2 ℃,包括130組訓練數(shù)據(jù)及130組測試數(shù)據(jù)。兩組數(shù)據(jù)集冷卻水供水溫度在16.7~29.5 ℃階躍運行。
根據(jù)能量守恒定律及測試參數(shù)相關性[21],選擇8個特征變量建立OC-SVM模型,即[Tchws,Tchwr,Qchw,Tcws,Tcwr,Qcw,P,Mref],分別為冷凍水側供水溫度、冷凍水側回水溫度、冷凍水側體積流量、冷卻水側供水溫度、冷卻水側回水溫度、冷卻水側體積流量、機組功率及控制系統(tǒng)反饋信號。由于機組類型的不同,選用數(shù)據(jù)集Ⅱ時,采用機組制冷量Qref及耗電量W來替代變量Qcw和Mref進行建模。選用數(shù)據(jù)集Ⅲ時,變量Mref代表閥門控制反饋信號;選用數(shù)據(jù)集Ⅳ時,變量Mref代表滑閥位置反饋信號。
圖3 十折交叉驗證中優(yōu)化參數(shù)精細搜索區(qū)域(數(shù)據(jù)集Ⅰ)Fig.3 Results of 10-fold cross validation using grid search method (dataset Ⅰ)
采用十折交叉驗證法進行模型參數(shù)尋優(yōu),篩選出一組合理的優(yōu)化參數(shù)建立模型,避免出現(xiàn)過擬合現(xiàn)象。文獻[11, 22]表明,參數(shù)υ越小,模型擬合非線性的能力就越強,參數(shù)σ越大,支持向量個數(shù)越少,決策邊界越松散。本實驗中,十折交叉驗證準確率控制在90%以上,選擇υ較小、σ較大的區(qū)域為交叉驗證中網格參數(shù)的精細搜索范圍,于區(qū)域內得到一組基于訓練集的優(yōu)化參數(shù)(υopt,σopt),根據(jù)該組參數(shù)建立OC-SVM模型。圖3所示為黑色方框給出了選用數(shù)據(jù)集Ⅰ進行建模時,十折交叉驗證法網格參數(shù)尋優(yōu)的精細搜索范圍。表1所示為數(shù)據(jù)集Ⅰ~Ⅳ的模型優(yōu)化參數(shù)值,并給出了各訓練集冷凍水供、回水的最大值、最小值、標準差。
表1 訓練集統(tǒng)計學特征與模型優(yōu)化參數(shù)值Tab.1 Statistical characteristics of training sets and parameter values of model optimization
對數(shù)據(jù)集Ⅰ~Ⅳ的Tchws及Tchwr分別引入幅值范圍為-4~4 ℃、間隔1 ℃的傳感器偏差故障。定義負類分類率為:測試集中被模型分為負類的樣本個數(shù)與測試集樣本總數(shù)的比值,數(shù)值上等于傳感器偏差故障檢測效率(測試集中被檢測為故障樣本的個數(shù)與測試集樣本總數(shù)的比值)。
圖4 Tchws傳感器故障幅值為+0.5 ℃和+1 ℃時的決策函數(shù)值Fig.4 Decision function plots of Tchws sensor fault deviations at +0.5 ℃ and +1 ℃
以選用數(shù)據(jù)集Ⅰ為例進行基于OC-SVM方法的偏差故障檢測。圖4所示為Tchws傳感器故障幅值為+0.5 ℃及+1 ℃時的決策函數(shù)值。其中訓練集(樣本數(shù)量1~612)中有588個樣本的決策函數(shù)F(xi)取值為+1,即96%訓練數(shù)據(jù)被分類為正常樣本,訓練集整體保持穩(wěn)定。
由圖4中測試數(shù)據(jù)(樣本數(shù)量613~1 068)發(fā)現(xiàn),故障偏差為+0.5 ℃時,456個測試樣本中決策函數(shù)F(zk)取值為-1的樣本只有215個,即負類分類率為47%;而當故障幅值增至+1 ℃時,測試集中456個樣本的決策函數(shù)F(zk)取值全部為-1,負類分類率顯著提升至100%。隨著引入故障幅值的增大,測試樣本越容易向決策超平面外移動,決策函數(shù)F(zk)取得-1的概率顯著增加,即越容易被分類為負類樣本。
表2所示為數(shù)據(jù)集Ⅰ~Ⅳ的Tchws和Tchwr在不同偏差故障幅值下的傳感器故障檢測效率,可以看出基于OC-SVM的方法能有效檢測出Tchws及Tchwr傳感器上的偏差故障。
1)數(shù)據(jù)集Ⅰ:當偏差故障幅值絕對值≥1 ℃時,Tchws和Tchwr傳感器的故障檢測效率均≥95%,大于1 ℃時達到100%,檢測效果明顯。
2)數(shù)據(jù)集Ⅱ:對比Tchws與Tchwr傳感器在相同偏差故障幅值下的檢測效率,發(fā)現(xiàn)兩者具有十分接近的檢測效果。而對比兩者在負偏差與正偏差上的檢測效率發(fā)現(xiàn),基于OC-SVM的方法在負偏差上的故障檢測能力要明顯高于正偏差。在-4 ℃故障幅值下,Tchws和Tchwr傳感器的檢測效率均超過90%,檢測效果較好;在+4 ℃故障幅值下,兩者檢測效率超過60%。
3)數(shù)據(jù)集Ⅲ:基于OC-SVM的方法在該數(shù)據(jù)集上的檢測效率略低。在-4 ℃故障幅值下,Tchws和Tchwr傳感器檢測出了超過45%的故障數(shù)據(jù);在+4 ℃故障幅值下,兩者檢測效率均超過50%。
4)數(shù)據(jù)集Ⅳ:數(shù)據(jù)集Ⅲ與數(shù)據(jù)集Ⅳ的主要區(qū)別在于后者的冷凍水供水設定溫度保持在7.2 ℃,因此后者冷凍水供水的測量數(shù)據(jù)變化范圍要明顯小于前者。表2顯示,Tchws傳感器的偏差故障檢測效率要優(yōu)于Tchwr傳感器。當Tchws傳感器偏差故障幅值絕對值≥2 ℃時,檢測效率均大于95%,檢測效果顯著,同時Tchwr傳感器在-4 ℃故障幅值下的檢測效率可以達到72%。
本文提出了一種基于OC-SVM的冷水機組溫度傳感器故障檢測方法,選取了4組不同的冷水機組數(shù)據(jù),分別選擇每個數(shù)據(jù)集中的8個變量建立了對應的OC-SVM故障檢測模型。采用十折交叉驗證法尋得模型優(yōu)化參數(shù),運用優(yōu)化后的模型對傳感器偏差故障進行了檢測。通過對檢測結果進行分析,驗證了該方法的有效性,得到如下結論:
1)基于OC-SVM的方法對溫度傳感器偏差故障具有較好的檢測能力。對于螺桿式冷水機組(數(shù)據(jù)集Ⅰ)的檢測效果尤為明顯,在冷凍水側溫度傳感器偏差故障幅值絕對值≥1 ℃時,檢測效率達到100%。4個數(shù)據(jù)集的檢測結果顯示,檢測效率隨故障幅值的增大而增大。對于不同溫度傳感器的不同程度偏差故障,其檢測效率存在一定的差別。
2)OC-SVM模型十分依賴于訓練集的數(shù)據(jù)質量,數(shù)據(jù)變化范圍小、標準差小的訓練集有助于學習到一個邊界緊湊的OC-SVM分類模型,從而一定程度提高了模型檢測能力。
3)基于OC-SVM的檢測方法可應用于冷水機組故障檢測中,但對不同數(shù)據(jù)集的檢測效果并不一致。下一步將運用該方法進行不同類型冷水機組的傳感器故障檢測,與常見故障檢測方法進行對比并分析其優(yōu)缺點,研究不同類型數(shù)據(jù)對該方法檢測效率的影響。同時考慮將該方法運用于在線冷水機組故障檢測中,建立合適的距離監(jiān)測量以便實現(xiàn)故障檢測過程可視化。
符號說明
υ——正則化參數(shù)
ξi——松弛向量
ω、ρ——決策超平面參數(shù)
N——訓練集樣本個數(shù)
M——測試集樣本個數(shù)
L——樣本數(shù)據(jù)維度
φ——非線性映射
αi、βi——拉格朗日乘子
K(xi,xj)——核函數(shù)
σ——RBF核函數(shù)參數(shù)
F(xi)——訓練集樣本決策函數(shù)值
F(zk)——測試集樣本決策函數(shù)值
Tchws——冷凍水側供水溫度,℃
Tchwr——冷凍水側回水溫度,℃
Qchw——冷凍水側體積流量,m3/h
Tcws——冷卻水側供水溫度,℃
Tcwr——冷卻水側回水溫度,℃
Qcw——冷卻水側體積流量,m3/h
P——機組功率,kW
Mref——系統(tǒng)控制反饋信號
Qref——機組制冷量,kW
W——機組耗電量,kW·h