魏 超
(煙臺黃金職業(yè)學(xué)院招生與就業(yè)指導(dǎo)處,山東 煙臺 265401)
電氣設(shè)備長期運行后往往會出現(xiàn)故障,具體表現(xiàn)之一為局部或整體異常發(fā)熱,結(jié)合設(shè)備發(fā)熱特征對設(shè)備故障進行診斷,可有效保證電力設(shè)備安全與穩(wěn)定運行。傳統(tǒng)的識別方法是采用人工紅外成像技術(shù)對設(shè)備進行現(xiàn)場診斷,但這種方法過度依賴現(xiàn)場人員的經(jīng)驗,且耗時長、效率低。此后,人們開始引入計算機輔助識別技術(shù)進行故障診斷,如基于人工特征的紅外圖像識別方法,通過從區(qū)域中提取特征信息進行故障識別,但這種方法識別速度慢,且通用性不強,難以在實際中大范圍推廣。
隨著深度學(xué)習(xí)算法的崛起,人們開始將目光集中到卷積神經(jīng)網(wǎng)絡(luò)對紅外圖像進行識別的應(yīng)用上,并進行了大量學(xué)術(shù)研究。邢科等[1]提出對GoogLeNet網(wǎng)絡(luò)結(jié)構(gòu)進行改進,以達到提高豐富空間特征、增強特征多樣性的目的;賈鑫[2]提出在采用卷積算法對圖像進行識別前,通過聚類、SLIC超像素處理結(jié)合OTSU算法對圖像進行預(yù)處理,以提高卷積神經(jīng)網(wǎng)絡(luò)對圖像的識別率;周仿榮等[3]運用雙通道CNN網(wǎng)絡(luò)和隨機森林算法完成對紅外圖像的識別,提高了故障的識別率;韓紀(jì)普等[4]提出了一種基于SLIC和區(qū)域生長的圖像分割方法,再通過卷積神經(jīng)網(wǎng)絡(luò)進行圖像識別。由此可以看出,對卷積神經(jīng)網(wǎng)絡(luò)進行改進,提高對包括紅外圖像在內(nèi)的識別效率是研究的重點,對圖像進行預(yù)處理,也是保證提高識別率的又一重要途徑和方式。本文在上述文獻研究結(jié)果的基礎(chǔ)上,結(jié)合電氣設(shè)備紅外圖像具有對比度低和信噪比低的特點,參考文獻[2]、[4]關(guān)于圖像處理的聚類思路和區(qū)域生長算法,對圖像進行預(yù)處理與分割,然后通過卷積神經(jīng)網(wǎng)絡(luò)對圖像特征進行提取與識別,以提高整體紅外電氣設(shè)備圖像的識別率。
與傳統(tǒng)的可見光圖片相比,紅外圖像具有低信噪比、低對比度的特點。因此,在對紅外圖像進行特征提取前,首先對圖像進行灰度化和噪聲處理,然后參考文獻[2]圖像分割的聚類思路,通過K均值聚類對圖像像素進行聚類,再后通過區(qū)域生長算法分割出圖像中最亮的區(qū)域,以此分割出可能的故障區(qū)域,方便后續(xù)對圖像的識別。
紅外圖像其色彩由R、G、B組成,因此需采用加權(quán)平均的方法對圖像進行灰度化處理,具體處理公式為:
f(i,j)=0.298 9R(i,j)+0.587 0G(i,j)+
0.114 1B(i,j)
(1)
式中:f(i,j)為原圖像F的噪聲值,(i,j)表示像素點;R(i,j)為紅色的灰度值;G(i,j)為綠色的灰度值;B(i,j)為藍色的灰度值。
紅外圖像獲取過程中,由于受相機故障等因素的影響,可能導(dǎo)致獲取的電氣設(shè)備紅外圖像存在噪聲,因此本文采用線性濾波和非線性濾波結(jié)合的方式對紅外圖像噪聲進行處理。
1)線性濾波。
(2)
式中:g(i,j)為經(jīng)過均值濾波后圖像G的灰度值;S為中心像素為(i,j) 的鄰域像素集合;N為集合元素數(shù)量。
2)非線性濾波。
非線性濾波采用中值濾波器,具體濾波公式為:
yi=Med{f1,…,fi,…,fn}
(3)
式中:fi為采樣值;yi為采樣中值。
文獻[2]在超像素圖像處理過程中提出采用K均值聚類(K-means)對圖像進行聚類處理,從而找到像素內(nèi)的最亮區(qū)域。聚類的原理是篩選出k個中心,然后計算每個樣本到各中心的距離,與哪個中心的距離小,那么就將樣本歸納為該類。本文對圖像像素的聚類步驟可分為以下幾步:
1)輸入經(jīng)過灰度化、噪聲處理的圖像,選定像素中的k個像素點作為初始聚類中心;
2)遍歷圖像中的每個像素,計算其與每一類聚類中心像素灰度值的均值,并將該均值作為新的聚類中心;
3)根據(jù)新聚類中心,按照聚類最小原則對各個樣本與新聚類中心的距離進行計算,從而對樣本重新劃分;
4)若聚類中心的變化小于給定的閾值,或者是迭代計算次數(shù)達到最大,則算法終止,否則返回步驟2)。
在完成圖像像素聚類后,在該圖像中存在k個樣本均值,選擇樣本均值最大的作為區(qū)域生長的種子點。生長準(zhǔn)則為:
|μm-f(m,n)| |Tmax-f(m,n)| (4) 式中:f(m,n)為待測像素(m,n)的灰度值;μm為種子點為3×3的鄰域內(nèi)所有像素的灰度均值;Tmax為灰度均值中的最大值;k1,k2依據(jù)紅外電氣設(shè)備圖像故障處自身的特點選定。通過區(qū)域生長得到的圖像則為最終提取的“最亮圖像”。 目前,主流的神經(jīng)網(wǎng)絡(luò)包括GoogLeNet、VGGNet-16和Alex Net 3種,其中GoogLeNet神經(jīng)網(wǎng)絡(luò)憑借其良好的性能被廣泛應(yīng)用。Christian Szegedy(2014)創(chuàng)造性地提出了GoogLeNet模型,從而構(gòu)建起一種網(wǎng)中網(wǎng)(Network in Network)的結(jié)構(gòu)。相較于VGGNet-16網(wǎng)絡(luò)結(jié)構(gòu),GoogLeNet模型中的inception模塊居于核心地位。傳統(tǒng)的inception模塊如圖1所示。 圖1 inception 模塊 在inception模塊中,通過使用3×3和5×5的卷積核來提取高抽象性的特向特征,但這種設(shè)置的弊端是5×5卷積會增大網(wǎng)絡(luò)開銷,使得inception進一步發(fā)生變化。因此,為解決該問題,在GoogLeNet網(wǎng)絡(luò)設(shè)置上,搭建一個 1×1 的卷積,通過該卷積作用于3×3和5×5的卷積上,從而減少計算量,起到修正線性激活的作用,具體 inception 模塊改進如圖2所示。 圖2 改進的inception 模塊 傳統(tǒng)的圖像識別運用支持向量機(SVM)、BP神經(jīng)網(wǎng)絡(luò)(back propagation,BP)等傳統(tǒng)算法[5-7]。本文通過引入softmax損失和中心損失兩種監(jiān)督信號對GoogLeNet網(wǎng)絡(luò)進行改進。利用softmax loss監(jiān)督信號把多個神經(jīng)元的輸出映射至(0,1),最小化分類概率和真實分布的交叉熵,使得分類概率趨向于真實類別;利用center loss監(jiān)督信號配合softmax loss監(jiān)督信號進行訓(xùn)練,具體來說,在softmax loss監(jiān)督信號訓(xùn)練過程中,center loss監(jiān)督信號對各個種類的樣本和該種類樣本中心的偏移進行懲罰,促使同一類別中的不同樣本共同趨近于該類別的特征中心,從而優(yōu)化網(wǎng)絡(luò)的訓(xùn)練過程。這樣做的目的是為了防范梯度回傳消失的問題出現(xiàn)。 Softmax loss函數(shù)[8-9]: (5) Center loss函數(shù): (6) 式中:bi,bj為偏值;wj為全連接層參數(shù)矩陣第j列的權(quán)重;xi為第i類別的樣本特征;ci為第i類的特征中心;Lc為Center loss函數(shù);Ls為Softmax loss函數(shù)。 同時為平衡兩損失函數(shù),引入超參數(shù)λ,由此確定新的loss函數(shù)L為: (7) 實驗用圖像數(shù)據(jù)來源于某電力公司的電氣設(shè)備紅外圖像數(shù)據(jù)庫,總計2萬多幅,大小為256像素×256像素~1 024像素×1 024像素,包含桿塔、變壓器、絕緣子、斷路器等多種電氣設(shè)備故障圖像。在這些圖像中,歸納出10多種具體設(shè)備故障,如避雷器整體過熱、變壓器套管-柱頭發(fā)熱、變壓器外殼溫度異常、隔離開關(guān)轉(zhuǎn)頭過熱等。每一種故障圖像均有1 000多張。 根據(jù)卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練需求,首先對圖像數(shù)據(jù)集進行處理,以保證訓(xùn)練過程的精度。具體進行以下兩方面的工作:1)將圖像進行規(guī)范化處理,處理后的圖像大小均為256像素×256像素;2)將圖像的數(shù)據(jù)格式全部轉(zhuǎn)變?yōu)閘eveldb格式。 本次實驗配置:64位Windows7操作系統(tǒng),Intel Core i5-5200U處理器,內(nèi)存4 GB,顯卡AMD Radeon R7M260;編程工具:Visual Studio 2017、Python2.7、MATLAB R2017b,Caffe深度學(xué)習(xí)框架。 4.4.1圖像與處理結(jié)果 在圖像預(yù)處理部分,選擇主變高壓套管將軍帽故障圖像進行預(yù)處理。同時選擇K-means+區(qū)域生長、Canny、Otsu、K-means對圖像進行分割,得到的實驗測試結(jié)果如圖3所示。 圖3 主變高壓套管將軍帽故障圖像分割實驗對比圖 由圖3可以看出,K-means+區(qū)域生長能更好地提取電力設(shè)備故障區(qū)域圖像,因此本文選擇該方法進行圖像分割。 4.4.2特征提取 為了清晰地描述卷積網(wǎng)絡(luò)特征提取的過程,本文進行了以下實驗。 1)圖4展示了輸入網(wǎng)絡(luò)中的故障圖像,其中,圖4(a)展示的是待識別的故障圖像,圖4(b)展示的是提取故障設(shè)備后的圖像,對比可見,GoogLeNet成功提取了視覺特征,未發(fā)熱設(shè)備并未出現(xiàn)在圖4(b)中。 圖4 特征圖像提取 2)把圖4(b)導(dǎo)入GoogLeNet模型中,在完成第一層卷積層處理以后收獲了64張?zhí)卣鲌D,特征圖的尺寸均為112像素×112像素,如圖5所示;在完成第二層卷積層處理以后,收獲了196張?zhí)卣鲌D,特征圖的尺寸均為56像素×56像素,如圖6所示。 圖5 第一層卷積后的圖像 圖6 第二層卷積后的圖像 觀察發(fā)現(xiàn),卷積層成功提取了邊緣信息以及不同方向的色團、團塊、直線、點等特征信息。不同層級所對應(yīng)的卷積核權(quán)重存在差異,各特征圖所突出的區(qū)域是不一致的,應(yīng)用的卷積核數(shù)量越多,就能夠提取出越多的特征信息。綜上看出,本文采取GoogLeNet模型進行特征提取,在增加網(wǎng)絡(luò)寬度和深度的同時,可借助于inception模塊實現(xiàn)特征圖的降維,因而無需使用過多的參數(shù)。 4.4.3識別算法精度分析 在本次訓(xùn)練中,訓(xùn)練集包含500張圖片,測試集包含200張圖片,根據(jù)測試集數(shù)量=測試時迭代次數(shù)(test_iter) ×根據(jù)測試集中批處理尺寸(batch_size),計算得出測試集批處理尺寸(batch_size)為10,測試時迭代次數(shù)(test_iter)為20。本文設(shè)定最大迭代次數(shù)為1 500,設(shè)定學(xué)習(xí)率u為0.001,超參數(shù)λ為0.003。 分別運用4種深度學(xué)習(xí)模型(VGGNet、AlexNet、GoogLeNet、改進GoogLeNet)對電氣設(shè)備紅外故障圖像數(shù)據(jù)集進行訓(xùn)練及測試,每進行500次迭代執(zhí)行1次準(zhǔn)確率測試,記錄每次迭代的運算結(jié)果。同時以編號S1~S5對應(yīng)5種電氣設(shè)備故障,依次是:斷路器均壓電容過熱、變壓器套管-柱頭發(fā)熱、避雷器整體過熱、架空線路導(dǎo)線連接處過熱、合成絕緣子球頭過熱,利用以上4種模型分別對5種電氣設(shè)備故障進行識別,識別結(jié)果見表1。 表1 電氣設(shè)備故障識別 % 由表1可以看出,在識別率方面,本文構(gòu)建的改進GoogLeNet算法的識別率要明顯高于其他3種模型,驗證了本文改進算法的可行性與準(zhǔn)確性。 為解決傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)識別率低的問題,本文在K均值聚類與區(qū)域生長圖像分割處理基礎(chǔ)上,提出一種基于改進損失函數(shù)的卷積神經(jīng)網(wǎng)絡(luò)識別模型,得到以下結(jié)論: 1)在對卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練前,對紅外圖像進行圖像分割可有效提高電氣設(shè)備故障圖像的識別精度; 2)與單層的CNN卷積相比,采用多層的卷積可在降維的同時,提取多個圖像特征; 3)改進損失函數(shù)的卷積神經(jīng)網(wǎng)絡(luò)在圖像識別方面要明顯高于其他的算法,且準(zhǔn)確率高。3 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像識別
3.1 基于GoogLeNet的特征提取
3.2 卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練改進
4 實驗測試與分析
4.1 數(shù)據(jù)來源
4.2 數(shù)據(jù)集處理
4.3 測試環(huán)境搭建
4.4 實驗結(jié)果
5 結(jié)論