李冬輝 趙墨刊 高龍
摘要:針對冷水機組傳感器偏差故障識別率低的問題,提出一種基于卷積神經(jīng)網(wǎng)絡(Convolutional Neural Network,CNN)和門控遞歸單元(Gated Recurrent Unit,GRU)融合網(wǎng)絡模型(CNN-GRU)的冷水機組傳感器偏差故障診斷方法.該方法利用GRU記憶冷水機組因每個傳感器動態(tài)響應特性不同造成的其每個傳感器不同的時間相關性,克服了CNN在冷水機組傳感器偏差故障診斷中僅能提取時間序列實時特征的缺點.首先采用CNN自動提取傳感器時間序列的實時特征,然后利用具有長短期記憶能力的GRU實現(xiàn)對冷水機組傳感器不同時間相關性的記憶,從而充分利用時間序列中的特征信息對數(shù)據(jù)進行表征建模,進而有效提升了冷水機組傳感器偏差故障識別率.將該方法與CNN、主成分分析和自動編碼器方法進行比較,實驗結果表明:溫度類和壓力類傳感器的偏差故障識別率分別在85%以上和90%以上;驗證樣本得到了83%以上的偏差故障識別率,驗證了該方法的泛化能力良好;該方法對于同一傳感器、故障大小互為相反數(shù)的偏差故障的故障識別率均具有良好的對稱性;該方法的偏差故障識別率高于其他方法,尤其對于很小的偏差故障的識別率具有更明顯的優(yōu)勢.
關鍵詞:卷積神經(jīng)網(wǎng)絡;深度學習;冷水機組;傳感器;故障診斷
中圖分類號:TP277
文獻標志碼:A
在智能建筑中,冷水機組是制冷空調(diào)系統(tǒng)的主要耗能設備,冷水機組傳感器實時監(jiān)測系統(tǒng)的運行狀況,對實現(xiàn)系統(tǒng)的最優(yōu)控制和能源管理起到重要的作用.而冷水機組傳感器故障不僅會影響制冷空調(diào)系統(tǒng)的運行狀況,也會導致運行能耗的增加.因此冷水機組傳感器故障診斷技術的實現(xiàn)對于確保系統(tǒng)正常運行和降低系統(tǒng)能耗具有十分重要的意義.
近幾年來學者們對基于數(shù)據(jù)驅(qū)動的制冷空調(diào)系統(tǒng)傳感器故障診斷方法的研究取得了卓越成果.主成分分析(Principal Components Analysis,PCA)方法是傳感器故障診斷中比較流行的方法[1].文獻[2]首先運用經(jīng)驗模態(tài)分解閾值除噪方法對原始傳感器時序數(shù)據(jù)中的噪聲進行消除,從而提高傳感器時序數(shù)據(jù)的質(zhì)量,然后針對除噪后的傳感器時序數(shù)據(jù)建立PCA模型來實現(xiàn)冷水機組傳感器的偏差故障診斷.但PCA方法不能直接解決空調(diào)系統(tǒng)的非線性和多模態(tài)問題.其在診斷空調(diào)系統(tǒng)傳感器故障的問題上受到了一定限制.針對PCA方法存在的問題,文獻[3]首先提出了核主成分分析(Kernel Princpal Compo?nent Analysis,KPCA)法.文獻[4]利用KPCA方法提取空調(diào)系統(tǒng)的非線性特征來實現(xiàn)空調(diào)系統(tǒng)傳感器故障診斷.然而PCA方法及KPCA方法必須通過建立Q統(tǒng)計量貢獻圖的方式間接的確定故障傳感器,工作量大,費時費力.
深度學習方法也是制冷空調(diào)系統(tǒng)傳感器故障診斷中常用方法.遞歸神經(jīng)網(wǎng)絡(Recurrent Neural Net?work,RNN)引入了記憶單元使網(wǎng)絡具備了一定的記憶性,能夠處理和分析具有時間相關性的數(shù)據(jù)[5].RNN的問題是存在梯度消失或爆炸的缺點,長短期記憶網(wǎng)絡[6]及GRU解決了這個問題.文獻[7]通過利用LSTM深度學習方法對空調(diào)系統(tǒng)傳感器建立傳感器故障診斷模型,從而實現(xiàn)對空調(diào)系統(tǒng)傳感器偏差故障診斷.文獻[8]通過對LSTM的門結構進行改進和簡化來實現(xiàn)冷水機組傳感器偏差故障診斷.文獻[9]通過利用基于GRU單元的編碼-解碼神經(jīng)網(wǎng)絡對正常傳感器時序數(shù)據(jù)特征進行挖掘與提取來診斷傳感器偏差故障.
CNN是深度學習領域中另一種廣泛應用的方法[10-13].文獻[14]利用CNN和RNN深度學習方法通過學習空調(diào)傳感器采集的時間序列,進而根據(jù)時間序列對溫度進行預測來實現(xiàn)溫度的自適應調(diào)節(jié).文獻[15]利用一維卷積神經(jīng)網(wǎng)絡診斷空調(diào)系統(tǒng)中的空氣處理單元傳感器故障,該方法利用卷積神經(jīng)網(wǎng)絡自動提取時序數(shù)據(jù)實時特征,并使用小波聚類對其進行分析,通過表示簇對傳感器故障進行檢測和診斷.
由于冷水機組每個傳感器動態(tài)響應特性的不同造成冷水機組每個傳感器具有不同的時間相關特性,即每個傳感器當前采樣時刻的讀數(shù)都要受到過去采樣時刻讀數(shù)的影響,CNN雖然可以自動提取時間序列實時特征,但由于其自身結構的局限性,導致CNN難以記憶冷水機組傳感器不同的時間相關性,而具有長短期記憶能力的GRU能夠?qū)崿F(xiàn)對傳感器不同時間相關性的記憶,并且在GRU中加入CNN也增加了深度學習網(wǎng)絡對時間序列實時特征的提取能力并通過降低參數(shù)數(shù)量減少了運算量.因此本文針對冷水機組傳感器偏差故障識別率低的問題提出一種基于CNN-GRU融合網(wǎng)絡模型的冷水機組傳感器偏差故障診斷方法,并且以壓縮式冷水機組為研究對象,通過大量的實驗與對比分析驗證了本文所提方法的有效性.
1深度學習網(wǎng)絡結構
CNN和GRU網(wǎng)絡是深度學習中兩種常見的網(wǎng)絡.與淺層學習相比,深度學習能夠?qū)崿F(xiàn)數(shù)據(jù)的逐層轉換,保證了最有效的特征表達和信息提取.
1.1CNN原理結構
CNN模型采用權重共享和局部連接的方式,通過對原始數(shù)據(jù)進行逐層的特征提取,能夠有效自動提取數(shù)據(jù)內(nèi)部中的更高級更抽象的特征[16].如圖1所示,一般CNN是由輸入層、卷積層、池化層和全連接層構成的.
1.2GRU原理結構
GRU網(wǎng)絡的基本結構見圖2,其公式見式(1).
GRU[17]網(wǎng)絡由更新門和重置門構成.在時間序列處理任務中,GRU能夠記憶各個傳感器不同的時間相關性.
圖2與式(1)中,x,為當前時刻的輸入向量;h,和分別為當前時刻和上一時刻的狀態(tài)記憶變量;T,、z,分別為重置門狀態(tài)、更新門狀態(tài);為當前時刻候選集狀態(tài);W、W,和W表示可訓練權重參數(shù)矩陣;I表示單位矩陣;·表示矩陣點乘;[]表示向量連接;×表示矩陣乘積;o表示sigmoid激活函數(shù).tanh與sigmoid的表達分別見式(2)和式(3):
2基于CNN-GRU的冷水機組傳感器故障診斷模型
2.1CNN-GRU融合網(wǎng)絡模型原理
冷水機組傳感器時間序列是高度時間相關性的時序數(shù)據(jù).傳統(tǒng)方法提取高維時間序列潛在特征的能力有限,從而影響偏差故障診斷效果.CNN-GRU融合網(wǎng)絡模型利用CNN其特殊的卷積-池化運算,可以自動挖掘出時間序列的實時特征,為提高傳感器偏差故障診斷精度奠定基礎;GRU神經(jīng)網(wǎng)絡具有獨特的門結構,能夠記憶冷水機組因每個傳感器動態(tài)響應特性不同造成的其每個傳感器不同的時間相關性,從而充分對時序進行表征建模,進而實現(xiàn)冷水機組傳感器偏差故障診斷.
2.2CNN-GRU融合網(wǎng)絡模型結構
圖3為CNN-GRU融合網(wǎng)絡模型具體結構,其包括輸入層、CNN網(wǎng)絡層與GRU網(wǎng)絡層和輸出層.其每層描述如下:
輸入層:輸入層將冷水機組傳感器采集的時間序列經(jīng)歸一化處理后作為CNN-GRU融合網(wǎng)絡模型
式中:sam代表第sam份樣本,xsam代表在第t個采樣時刻下的傳感器時間序列,其內(nèi)部包含有當前時刻n個傳感器的讀數(shù)信息,n為冷水機組傳感器的數(shù)量,T為樣本中包含的采樣次數(shù).
CNN層:CNN層對輸入數(shù)據(jù)進行特征提取,本文采用Valid卷積方式并將卷積操作后輸出進行批量標準化操作[18],再與偏置相加通過Relu函數(shù)計算后作為卷積層的輸出.Relu函數(shù)公式為:
池化層采用最大池化和Valid池化方式.卷積池化見式(6):
其中y、Ci和Pi分別表示經(jīng)BN操作后的輸出矩陣、卷積層i的輸出和池化層i的輸出,1≤i≤3,且i為整數(shù);P1*和P2*是分別對P1和P2里所有的特征圖相加求平均值;W1、W2和W3為權重矩陣;b1、b2、b3、b4、b5和b6為偏置項;*和Maxpoo(l)分別為卷積運算和最大值池化函數(shù).
GRU層:將卷積得到的高維抽象特征矩陣,經(jīng)過reshape函數(shù)處理后作為三層GRU網(wǎng)絡的輸入,re?shape函數(shù)表達式為:
B=reshape(A,size)(7)
其含義為將A矩陣重構成與A元素相同的多維數(shù)組B,其維數(shù)由向量size來決定.
該文對卷積層的輸出重構為二維特征矩陣,維數(shù)為a×b,第sam個樣本經(jīng)CNN輸出后再reshape后的矩陣用向量表示為:
將b個維數(shù)為a的特征向量輸入到三層GRU中,得到輸出h3b.
輸出層:輸出層的輸入為上一層的輸出h3b,輸出通過全連接層和softmax計算輸出的概率值.
softmax公式表示為:
式中:xi表示第i個節(jié)點的輸出值,n為輸出節(jié)點個數(shù),g(x1≤i≤n.i=1表示第i個元素屬于第i個類別的概率值,
3基于CNN-GRU的冷水機組傳感器偏差故障診斷實驗
3.1冷水機組傳感器偏差故障表征方法
表1為傳感器的故障類型及表征方法.本文主要診斷11種冷水機組傳感器的偏差故障.因為冷水機組系統(tǒng)中多個傳感器同一時刻發(fā)生故障的概率非常小,所以本文只針對同一時刻至多有一個故障傳感器的情況進行研究.將每一種傳感器偏差故障對應一類標簽,本文的表征方式為:在發(fā)生偏差故障的傳感器對應位置上標1,其余位置都標0.本文標簽為診斷11種傳感器偏差故障再加上正常情況總共分為12類.
3.2基于CNN-GRU的冷水機組偏差故障診斷流程
圖4為偏差故障診斷流程圖,其具體步驟如下:
1)冷水機組實驗平臺持續(xù)采集不同負荷下正常運行的傳感器時間序列,去除掉異常數(shù)據(jù),建立傳感器數(shù)據(jù)集,并將數(shù)據(jù)集分割成n+1等份,其中n為傳感器個數(shù),將n個數(shù)據(jù)集隨機對應n個傳感器,剩下一份作為正常樣本;
2)將這n+1份數(shù)據(jù)集的每一份都拆分為訓練、測試和驗證樣本:隨機在每份數(shù)據(jù)集中選取70%和20%的連續(xù)樣本分別作為訓練樣本和測試樣本,10%作為驗證樣本,用于驗證該方法的泛化能力;
3)對第i份數(shù)據(jù)集的訓練樣本和測試樣本的第i個傳感器時序上分別隨機模擬加入超出誤差允許范圍的一定大小偏差故障,其中1≤i≤n,i為整數(shù);
4)由于不同傳感器的讀數(shù)具有不同的量綱,將步驟3處理過的n+1份數(shù)據(jù)集按照均值為0、方差為1進行歸一化處理;
5)設置主要參數(shù)的初始值.其包括輸入輸出的維數(shù)、CNN的參數(shù)、GRU的參數(shù)、權重、學習速率等參數(shù)的初始值;
6)將訓練樣本輸入到模型中進行模型訓練.選用交叉熵損失函數(shù)并選用自適應矩估計算法進行反向傳播,優(yōu)∑化權重和偏置項.損失函數(shù)表達式為:
式中:y和y?表示模型預測的概率分布和實際的概率分布.
7)當k>kmax,終止訓練并保存模型,否則返回步驟6,其中kmax=5,k表示當前輸出準確率連續(xù)高于歷史輸出最高準確率的次數(shù);
8)將測試樣本輸入到訓練好的模型中進行冷水機組傳感器偏差故障診斷.
4樣本數(shù)據(jù)采集及處理
本文在圖5所示的壓縮式冷水機組實驗平臺持續(xù)采集無故障的傳感器時序數(shù)據(jù).該研究通過利用水箱中的電加熱管對水箱溫度進行調(diào)節(jié)來改變冷水機組的負荷,從而得到冷水機組在不同負荷下的時序數(shù)據(jù).接下來進行數(shù)據(jù)采集,首先開啟實驗設備使其正常工作,上位機軟件讀取冷水機組每個傳感器時間序列.設備正常工作1000h,采樣周期為2min,并通過數(shù)據(jù)清理的方法來對所采集的數(shù)據(jù)進行預處理,獲得了28594組樣本數(shù)據(jù).將樣本數(shù)據(jù)按照采集順序分為12等份,然后將12份樣本數(shù)據(jù)分別隨機匹配11種傳感器和1種正常情況.對每一份樣本數(shù)據(jù)都隨機選擇其中70%和20%的連續(xù)樣本數(shù)據(jù)分別作為訓練樣本和測試樣本,剩下的10%作為驗證樣本用于對診斷模型的性能進行評估.依據(jù)每個傳感器的精度不同,本文給出了對第i份樣本數(shù)據(jù)的訓練樣本和測試樣的第i個傳感器數(shù)據(jù)分別模擬偏差故障的情況,其中1≤i≤n,i為整數(shù).如表2和表3所示.最后對訓練樣本和測試樣本進行歸一化處理.
5實驗驗證和對比分析
5.1CNN-GRU融合網(wǎng)絡模型參數(shù)的選擇網(wǎng)絡模型的參數(shù)選取,首先將各個參數(shù)都分別設置為幾個不同的取值,從每個參數(shù)中選取的每一個預設值分別組合在一起,然后再分別進行傳感器故診斷測試實驗,最終找到所有參數(shù)組合中偏差故障識別率最高的網(wǎng)絡參數(shù)組合作為本文所選定的參數(shù).具體參數(shù)如下:輸入維度為11×20(n×T),三層卷積核和三層池化核尺寸大小分別設為3×3和2×2;三層卷積核的數(shù)量分別為64、128、128;卷積步長和池化步長分別設為1;三層GRU的輸入為128個22維向量;全連接維度為12×45;學習速率為0.001;drop?out=0.5;batchsize=64.
5.2實驗結果與分析
5.2.1偏差故障識別率實驗及分析
將加入偏差故障的測試集數(shù)據(jù)輸入到訓練好的模型中測試模型性能,該方法的實驗結果如圖6、表4-5和圖7、表6-7所示.
1)本文所提方法對于同一傳感器、故障大小互為相反數(shù)的偏差故障的故障識別率均具有良好的對稱性;
2)由圖6和表4-5可知,采用本文所提方法診斷溫度類傳感器偏差故障時,對于偏差故障大小為±1.2°C、±0.9°C(針對T1、T5、T6和T7)和±2.5°C、±2°C(針對T2、T3和T4),各個傳感器的偏差故障識別率均在97%以上;對于偏差故障大小±0.6°C、±0.3°C(針對T1、T5、T6和T7)和±1.5°C、±1°C(針對T2、T3和T4),各個傳感器的偏差故障識別率均可達到85%以上;
3)由圖7和表6-7可知,采用本文所提方法診斷壓力類傳感器偏差故障時,對于偏差故障大小為±0.08MPa、±0.065MPa、±0.05MPa(針對P1和P4)和±0.1MPa、±0.09MPa、±0.08MPa(針對P2和P3),各個傳感器的偏差故障識別率基本上都達到或接近100%;對于偏差故障大小為±0.035MPa(針對P1和P4)和±0.07MPa(針對P2和P3),各個傳感器的偏差故障識別率均在90%以上.
5.2.2泛化能力實驗及分析
為了驗證本文已保存好的網(wǎng)絡模型的泛化性能,本文以節(jié)流前溫度傳感器T4為例,對前文提到的10%驗證樣本,隨機加入不同數(shù)量的±0.9°C、±1.4°C、±1.9°C和±2.4°C大小的偏差故障并進行歸一化處理,輸入到該網(wǎng)絡中進行泛化能力的驗證,診斷結果見表8.
由表8得出,T4的偏差故障識別率均在83%以上;偏差故障識別率能保持較好的對稱性.因此該方法具有良好的泛化性能.
5.3與其他方法對比
將CNN、PCA與自動編碼器(Autoencoder)方法和該方法進行對比.3種方法的設置參數(shù)如下:CNN輸出端選用全連接層和softmax進行12種偏差故障標簽分類,其他參數(shù)與CNN-GRU所提方法所選參數(shù)相同;將Q統(tǒng)計量作為PCA的偏差故障診斷標準,將Q的閾值設置為3.0652,累計貢獻率設置為88%,主成分數(shù)設置為6個;自動編碼器采用兩層編碼網(wǎng)絡,將節(jié)點設置為10、5,輸出端選用softmax進行分類.該文選擇T5進行分析對比,實驗結果見圖8和表9.
從圖8和表9中可以看出,T5對于±1.2°C和±0.9°C的偏差故障,CNN-GRU方法與CNN方法的偏差故障識別率都接近或達到100%,自動編碼器方法的偏差故障識別率高于80%,但PCA方法就本實驗而言正向偏差故障識別率要優(yōu)于負向偏差的故障識別率;對于±0.6°C的偏差故障,CNN-GRU方法和CNN方法的偏差故障識別率分別超過95%和80%,PCA方法以及自動編碼器方法的偏差故障識別率均低于20%;對于±0.3°C的偏差故障,CNN-GRU方法和CNN方法的偏差故障識別率分別超過90%和50%,PCA方法和自動編碼器方法此時均失效;相比于其他3種方法,CNN-GRU方法對于很小的偏差故障的識別率具有更明顯的優(yōu)勢;本文所提方法對于T5的偏差故障識別率具有較好的對稱性,其他3種方法都不具有較好的對稱性.
6結論
1)本文方法對于溫度類傳感器的偏差故障識別率均在85%以上;對于壓力類傳感器的偏差故障識別率均在90%以上,均具有良好的診斷效果;該方法對于同一傳感器、故障大小互為相反數(shù)的偏差故障的故障識別率均具有良好的對稱性;
2)本文方法在診斷未經(jīng)訓練過的傳感器偏差故障時,仍能保持較高的偏差故障識別率,因此具有良好的泛化能力;
3)相比于其他方法,本文所提方法具有更高的偏差故障識別率,尤其對于很小的偏差故障的識別率具有更明顯的優(yōu)勢;
4)CNN方法在冷水機組傳感器偏差故障診斷中僅能提取時序的實時特征,CNN-GRU方法加入了GRU網(wǎng)絡,能夠記憶冷水機組因每個傳感器動態(tài)響應特性不同造成的其每個傳感器不同的時間相關性,從而更充分地利用時間序列中的特征信息進行表征建模,進而提升了偏差故障識別率.
綜上所述,本文提出CNN-GRU診斷方法取得了較高的偏差故障識別率.但在搭建該模型時采取手動遍歷的方式進行參數(shù)選取,缺乏理論依據(jù).因此探尋一種行之有效的參數(shù)選取方法是接下來將要進行深入研究的側重點之一.
參考文獻
[1]王婉.基于PCA的空調(diào)水系統(tǒng)的傳感器故障檢測與診斷研究[D].長沙:湖南大學,2014.
[2]毛前軍,方曦,李冠男,等.基于經(jīng)驗模態(tài)分解去噪改進主成分分析的冷水機組傳感器故障檢測[J].暖通空調(diào),2019,49(7):106-110.
[3] SCH?LKOPF B,SMOLA A,MüLLER K R.Nonlinear compo?nent analysis as a kernel eigenvalue problem[J].Neural Compu?t a t i o n ,1 9 9 8 ,1 0( 5 ):1 2 9 9 - 1 3 1 9 .
[4]楊亞偉.基于KPCA法的定風量空調(diào)系統(tǒng)傳感器故障診斷[D].天津:天津大學,2010.
[5]張旭.基于循環(huán)神經(jīng)網(wǎng)絡的時間序列預測方法研究[D].南京:南京大學,2019.
[6]許淼,劉宏飛,初凱.基于AM-LSTM模型的共享單車時空需求預測[J].湖南大學學報(自然科學版),2020,47(12):77-85.
[7]王路瑤,吳斌,杜志敏,等.基于長短期記憶神經(jīng)網(wǎng)絡的數(shù)據(jù)中心空調(diào)系統(tǒng)傳感器故障診斷[J].化工學報,2018,69(S2):252-259.
[8]李冬輝,尹海燕,鄭博文,等.改進的LSTM方法在冷水機組傳感器故障檢測中的應用[J].電工技術學報,2019,34(11):2324-2332.
[9]LI D,LI D H,LI C D,et al.A novel data-temporal attention net?work based strategy for fault diagnosis of chiller sensors[J].En?ergy and Buildings,2019,198:377-394.
[10]林景棟,吳欣怡,柴毅,等.卷積神經(jīng)網(wǎng)絡結構優(yōu)化綜述[J].自動化學報,2020,46(1):24-37.
[11]郭敏鋼,宮鶴.AlexNet改進及優(yōu)化方法的研究[J].計算機工程與應用,2020,56(20):124-131.
[12]JIANG G Q,HE H B. Multiscale convolutional neural networks for fault diagnosis of wind turbine gearbox[J]. IEEE Transactions on Industrial Electronics,2018,66(4):3196-3207.
[13]宋青松,張超,田正鑫,等.基于多尺度卷積神經(jīng)網(wǎng)絡的交通標志識別[J].湖南大學學報(自然科學版),2018,45(8):131-137.
[14]黃景輝.基于神經(jīng)網(wǎng)絡技術的中央空調(diào)智能控制系統(tǒng)的研究[D].天津:天津大學,2018:14-34.
[15]劉晶晶.基于神經(jīng)網(wǎng)絡的AHU系統(tǒng)故障診斷方法研究[D].西安:西安電子科技大學,2019.
[16]何松華,張潤民,歐建平,等.基于卷積神經(jīng)網(wǎng)絡的高分辨率雷達目標識別[J].湖南大學學報(自然科學版),2019,46(8):141-148.
[17]李斯?jié)?基于深度學習的工業(yè)大數(shù)據(jù)時間序列分類技術研究[D].哈爾濱:哈爾濱工業(yè)大學,2019.
[18]劉可文,劉紫龍,汪香玉,等.基于級聯(lián)卷積神經(jīng)網(wǎng)絡的前列腺磁共振圖像分類[J].波譜學雜志,2020,37(2):152-161.