孫麗麗,翟 啟,張延童,翟洪婷,張慶銳
(國網(wǎng)山東省電力公司信息通信公司,山東 濟(jì)南 250001)
輸電線路系統(tǒng)作為當(dāng)今社會最復(fù)雜、最龐大的人工系統(tǒng)之一,合理的電力維修人員調(diào)度成為了保障高壓供電安全、維護(hù)電力系統(tǒng)正常工作的基本前提[1]。絕緣子缺陷作為輸電線路故障的主要原因,因其出現(xiàn)區(qū)域隨機性、故障面積不定性等特性,維修人員難以合理有效地進(jìn)行調(diào)度。可能會發(fā)生“嚴(yán)重故障點處找不到人、正常點或小故障處擠滿人”的情況,導(dǎo)致調(diào)度人員資源嚴(yán)重浪費。因此及時精準(zhǔn)進(jìn)行絕緣子缺陷檢測是合理調(diào)度維修人員的重要前提。同時,由于實景巡檢技術(shù)可以充分利用移動巡檢設(shè)備(如無人機、無人車)或者固定巡檢設(shè)備(如固定攝像終端等)進(jìn)行實景圖像采集,充分獲得檢測目標(biāo)的特征信息,增加對目標(biāo)的檢測精度,故實景巡檢技術(shù)在電力巡檢方面具有巨大的優(yōu)勢,結(jié)合實景巡檢的絕緣子檢測技術(shù)成為目前精準(zhǔn)調(diào)度絕緣子維修人員的主流方法。
隨著深度學(xué)習(xí)技術(shù)的不斷發(fā)展,實景巡檢設(shè)備與深度學(xué)習(xí)算法的融合被廣泛應(yīng)用在各種電力和通信場景中[2,3]。當(dāng)前常見的基于深度學(xué)習(xí)的目標(biāo)檢測算法主要分成兩階段算法和單階段算法兩大類。比如常見的兩階段檢測方法有區(qū)域卷積神經(jīng)網(wǎng)絡(luò)(Region convolutional neural network,RCNN)[4],F(xiàn)ast-RCNN,F(xiàn)aster-RCNN[5]和Mask-RCNN[6]。這類方法首先通過區(qū)域建議策略(Region proposals strategy,RPS)生成若干目標(biāo)候選區(qū)域,進(jìn)行特征提取后利用支持向量機識別目標(biāo)類別,最后輸出圖像中的目標(biāo)類型并標(biāo)記其位置。文獻(xiàn)[7]基于Faster-RCNN結(jié)構(gòu),引入正則化方法優(yōu)化參數(shù)權(quán)重,提高對絕緣子缺陷檢測的精度和準(zhǔn)確度,但這種方法先經(jīng)過候選區(qū)域生成網(wǎng)絡(luò)提取目標(biāo)潛在位置,再進(jìn)行檢測識別,在一定程度上制約了檢測速度。而單階段目標(biāo)檢測方法包括You only look once[8](YOLO)方法和Single shot multibox detector[9](SSD)方法。與兩階段方法相比,單階段目標(biāo)檢測方法利用深度卷積神經(jīng)網(wǎng)絡(luò)提取的特征直接對目標(biāo)進(jìn)行識別和定位。文獻(xiàn)[10]將SSD原有VGGNet網(wǎng)絡(luò)換成殘差網(wǎng)絡(luò)(Residual network,ResNet),提高對缺陷特征的提取能力,但是漏檢率仍較高。文獻(xiàn)[11]提出將最小凸集和預(yù)測框選擇方法相結(jié)合的YOLOv3框架,并加入單分類器,在高維空間進(jìn)行小樣本學(xué)習(xí),大大提高對絕緣子缺陷檢測的精準(zhǔn)度,但檢測速度降低明顯,不利于運用于實時檢測。文獻(xiàn)[12]使用YOLOv5模型對絕緣子缺陷進(jìn)行檢測,盡管檢測速度得到了提升,但是檢測精度并不高。
針對上述問題,本文提出在原本的YOLOv5l模型的骨干網(wǎng)絡(luò)中加入注意力機制,提高對重要特征的提取能力。特征融合網(wǎng)絡(luò)中使用雙向特征金字塔網(wǎng)絡(luò)(Bi-directional feature pyramid network,BiFPN)結(jié)構(gòu)代替原本金字塔注意力網(wǎng)絡(luò)(Pyramid attention network,PAN)結(jié)構(gòu),提高了特征融合能力。使用結(jié)合距離交并比損失的非極大值抑制(Non-max suppression using distance intersection over union,DIoU-NMS)代替原本的非極大值抑制(Non-max suppression,NMS)進(jìn)行檢測,提高了后續(xù)分類網(wǎng)絡(luò)的識別準(zhǔn)確率。最后進(jìn)行相應(yīng)的試驗驗證。
YOLOv5是Ultarlytics LLC公司基于YOLOv4[13]改進(jìn)的版本,在準(zhǔn)確性以及檢測速度上都表現(xiàn)優(yōu)秀。根據(jù)網(wǎng)絡(luò)深度和寬度的不同,YOLOv5共有4個 版 本:YOLOv5s、YOLOv5m、YOLOv5l和YOLOv5x。本文充分考慮精準(zhǔn)度和檢測速度兩方面因素后,決定選用YOLOv5l版本作為本文方法的基礎(chǔ)網(wǎng)絡(luò)模型。
YOLOv5的網(wǎng)絡(luò)模型主要分為4個部分,分別為輸入端、骨干網(wǎng)絡(luò)、特征融合網(wǎng)絡(luò)和預(yù)測端,其網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
(1)輸入端:輸入端沿用YOLOv4的Mosaic數(shù)據(jù)增強方式,通過隨機縮放、隨機裁剪、隨機排布的方式進(jìn)行圖片拼接,豐富了檢測數(shù)據(jù)集,增加了網(wǎng)絡(luò)的普遍適用性。
(2)骨干網(wǎng)絡(luò):YOLOv5的骨干網(wǎng)絡(luò)含有Focus結(jié)構(gòu)和跨級部分網(wǎng)絡(luò)(Cross stage partial network,CSP)結(jié)構(gòu)。Focus結(jié)構(gòu)通過切片操作對尺度為640×640×3的輸入圖片進(jìn)行裁剪,接著經(jīng)過一個通道數(shù)為32的卷積層,輸出一個320×320×32的特征映射。但是,CSP結(jié)構(gòu)對于小特征提取能力并不強,容易造成小目標(biāo)漏檢。
(3)特征融合網(wǎng)絡(luò):特征融合網(wǎng)絡(luò)使用了特征金字塔網(wǎng)絡(luò)(Feature pyramid network,F(xiàn)PN)+PAN結(jié)構(gòu)。FPN是自上而下的,采用上采樣的方式對信息進(jìn)行傳遞融合,獲得預(yù)測特征圖,PAN采用自底向上的特征金字塔,傳達(dá)強定位特征,兩者同時使用加強網(wǎng)絡(luò)特征融合能力。但是,F(xiàn)PN+PAN只是進(jìn)行簡單的雙向融合策略,對同層特征重要性并沒有很好地區(qū)分。
(4)預(yù)測端:Prediction包括邊界框(Bounding box)損失函數(shù)和NMS。YOLOv5通過使用通用交并比損失(Generalized intersection over union loss,GIoU loss)作為回歸邊框的損失函數(shù),解決邊界不重合問題,使用加權(quán)NMS剔除重復(fù)冗余的預(yù)測框,保留置信度最高的預(yù)測框信息,完成目標(biāo)檢測過程,但是GIoU loss會出現(xiàn)訓(xùn)練過程中發(fā)散的問題,使目標(biāo)框回歸不穩(wěn)定。
圖1 YOLOv5結(jié)構(gòu)圖[14]
考慮到絕緣子缺陷較小,傳統(tǒng)YOLOv5網(wǎng)絡(luò)識別度不高,本文在骨干網(wǎng)絡(luò)中的CSP1_3和CSP2_1位置加入注意力機制模塊,提高對重要特征的提取能力。在特征融合網(wǎng)絡(luò)中,使用BiFPN結(jié)構(gòu)代替原本的PAN結(jié)構(gòu),引入橫向通道,通過權(quán)重計算更好地平衡各個特征之間的關(guān)系,得到更好的特征融合效果。具體方案是:在YOLOv5的第2個通道拼接模塊中添加第一層注意力機制的輸出特征圖以及在第3個通道拼接模塊中使用第二層注意機制后通過CBL模塊后的輸出特征圖,添加后的特征與原本要融合的特征進(jìn)行按點逐位相加操作。最后本文使用DioUNMS代替原本的NMS,通過引入邊界框與真實框之間的中心點作為判斷,加速收斂過程,提高后續(xù)分類網(wǎng)絡(luò)的識別準(zhǔn)確率。本文將改進(jìn)的YOLOv5l模型命名為DSE-YOLOv5(Double squeeze and excitation-you only look once version 5),整體結(jié)構(gòu)如圖2所示。
圖2 DSE-YOLOv5整體結(jié)構(gòu)圖
針對傳統(tǒng)骨干網(wǎng)絡(luò)對絕緣子缺陷特征提取能力不強的問題,本文在骨干網(wǎng)絡(luò)的CSP1_3和CSP2_1的位置分別加入注意力機制模塊[15],構(gòu)成一種針對缺陷特征的雙層注意力機制,用于強化含有重要信息的通道特征,提高對重要特征信息的提取能力。注意力機制模塊的工作原理如圖3所示,首先對輸入特征圖(H×W×C)進(jìn)行全局池化,池化窗口大小為(H×W),通道數(shù)不變,輸出為(1×1×C)的特征描述,H、W、C分別為特征圖的高、寬和特征通道數(shù),計算過程如式(1)所示
式中:k∈(1,C)表示第k個通道,u k為經(jīng)過二維空間卷積后的輸出,z k為經(jīng)過通道壓縮后對應(yīng)輸出。
然后經(jīng)過兩個全連接層,分別具有個C/r神經(jīng)元和具有C個神經(jīng)元,從而更好地擬合通道間復(fù)雜的相關(guān)性。最后通過sigmod激活函數(shù)得到一個輸出為(1×1×C)權(quán)重因子并與原本的輸入特征圖相乘,獲得不同比重的輸出特征圖,相關(guān)計算如式(2)和式(3)所示
式中:z=(z1,z2,…,z C)為經(jīng)過通道壓縮后所獲得的全局信息,S=(s1,s2,…,s C)為通道激勵操作的輸出,s k表示第k個通道中的激勵操作輸出值,δ表示Relu函數(shù),W1、W2為兩個全連接層的系數(shù),其中,r為縮放參數(shù),用來降低網(wǎng)絡(luò)的計算復(fù)雜度和參數(shù)量,U=(u1,u2,…,u C)為尺度縮放時輸入到各通道的初始權(quán)重。
圖3 注意力機制結(jié)構(gòu)圖
傳統(tǒng)的YOLO5在特征融合網(wǎng)絡(luò)中采用了PAN的結(jié)構(gòu)。此結(jié)構(gòu)雖然可以將高層特征圖的強語義信息與低層特征圖的定位信息進(jìn)行雙向融合,但融合時是將不同層級的特征直接相加,并未考慮它們最后輸出貢獻(xiàn)不等的問題。為了解決PAN中出現(xiàn)的輸出貢獻(xiàn)不等問題,使網(wǎng)絡(luò)融合更加高效,本文提出使用BiFPN[16]替換PAN。BiFPN引入了橫向通道,通過權(quán)重計算更好地平衡不同尺度的特征信息,提高了特征融合能力,具體工作原理如圖4所示。為了與YOLOv5的3種輸出特征保持一致,本文使用了BiFPN結(jié)構(gòu)中的p3、p4和p7這3個節(jié)點作為輸入特征節(jié)點,記作為,,,相關(guān)計算過程如式(4)所示
式中:ωi(i=1,2)是自適應(yīng)權(quán)重因子,其它公式符號含義與式(4)中的定義一致。
圖4 BiFPN結(jié)構(gòu)
NMS是目標(biāo)檢測常用的后處理算法,用于剔除冗余檢測框。但是傳統(tǒng)的NMS只考慮兩個框的重疊面積,對邊界框與真實框重疊關(guān)系的描述不夠全面,時常會產(chǎn)生錯誤的抑制。因此本文選取DIoU-NMS[17]來代替原本的NMS,DIoU-NMS將邊界框和真實框之間重疊的面積和中心點距離共同作為對冗余框的剔除標(biāo)準(zhǔn),加快了收斂速度,提高了檢測精準(zhǔn)度,其公式如下
式中:s i是不同類別的評分;M為得分最高的邊界框;IoU表示邊界框和真實框的交并比;ε是設(shè)置的NMS的閾值;RDIoU(·)表示DIoU懲罰因子,具體公式如下
式中:ρ2(b,bgt)表示邊界框和真實框中心點之間的距離,c2表示兩個框的最小外接矩的對角線長度。
由2.2、2.3、2.4可知,DSE-YOLOv5結(jié)構(gòu)成功解決原本YOLOv5中存在的絕緣子缺陷識別度不高問題,為電網(wǎng)人員調(diào)度提供有效檢測前提。因此,本文基于DSE-YOLOv5檢測結(jié)果,提出一種維修人員調(diào)度算法,用來解決當(dāng)前面臨的絕緣子維修人員調(diào)度不充分的問題,具體調(diào)度步驟如下。
(1)實景巡檢設(shè)備通過DSE-YOLOv5模型把檢測出缺陷的絕緣子缺陷圖片實時回傳,并在回傳的缺陷圖片上標(biāo)注缺陷位置、缺陷識別置信度、以及拍攝區(qū)域的位置信息。
(2)根據(jù)回傳圖片中的缺陷置信度和缺陷位置受損大小,輸電線路監(jiān)測人員進(jìn)行受損情況分類,將置信度小于設(shè)定閾值以及受損程度較小的絕緣子所在區(qū)域記作一般受損情況;反之,對置信度大于設(shè)定閾值或者受損程度嚴(yán)重的絕緣子所區(qū)域,記作緊急受損情況。
(3)對于一般受損情況,監(jiān)測人員會自動將這一區(qū)域的位置信息記入后臺并發(fā)出預(yù)警。若當(dāng)前維修人員緊張,事件后移;若當(dāng)前人員充足,經(jīng)過調(diào)度人員確認(rèn)后,派遣相關(guān)人員去維修。
(4)對于緊急情況,檢測人員會將回傳圖片以及DSE-YOLOv5的判斷信息發(fā)送給維修人員進(jìn)行進(jìn)一步確定。如果維修人員對設(shè)備受損程度存在質(zhì)疑,監(jiān)測人員會給巡檢設(shè)備下達(dá)回傳指令,巡檢設(shè)備收到此指令后,會對絕緣子缺陷位置進(jìn)行多方位拍攝,并將拍攝結(jié)果進(jìn)行二次實景回傳,等待維修人員再次確認(rèn);如果維修人員確認(rèn)此輸電線路絕緣子受損嚴(yán)重,檢測人員會下發(fā)緊急調(diào)度指令,并調(diào)度相關(guān)的絕緣子維修人員進(jìn)行現(xiàn)場維修。
為了驗證改進(jìn)的YOLOv5l框架對絕緣子缺陷識別的可行性和準(zhǔn)確性,將此算法集成在PyTorch深度學(xué)習(xí)框架中,在NVIDIA GeForce RTX 3060 Laptop GPU顯卡上完成訓(xùn)練及測試,相關(guān)配置如表1所示。
表1 試驗環(huán)境配置
本文試驗采用的數(shù)據(jù)集主要來源于中國電力絕緣子數(shù)據(jù)集(China power insulator data,CPLID)[18],這個數(shù)據(jù)集包括無人機捕獲的正常絕緣子圖像以及合成的具有缺陷的絕緣子圖像兩部分。考慮到這個數(shù)據(jù)集的缺陷圖像均為人工合成,并沒有真實絕緣子缺陷圖像,本文添加了40張不同場景的真實缺陷絕緣子圖片進(jìn)入這個數(shù)據(jù)集。因此,本文采用數(shù)據(jù)集圖像包括600張無人機航拍的正常絕緣子圖像、40張真實絕緣子缺陷圖像以及248張人工合成的絕緣子缺陷圖像。同時,為了提高模型的泛化性能,本文通過添加光調(diào)節(jié)、噪聲、銳化等方法對數(shù)據(jù)集進(jìn)行增強,增強后的樣本數(shù)量為4 860。本文按照7∶3的比例,隨機將增強后的數(shù)據(jù)集分為訓(xùn)練集和測試集,一些示例圖像如圖5所示。
圖5 數(shù)據(jù)集中缺陷和正常的絕緣子圖
由于數(shù)據(jù)集和分類種類的不同,YOLOv5的初始錨框參數(shù)[116,90,156,198,373,326]、[30,61,62,45,59,119]、[10,13,16,30,33,23]并不適合本文任務(wù)檢測,所以本文采用K-means算法對初始錨框進(jìn)行修正,修正的后的錨框為[116,90,156,198,373,326]、[30,61,62,45,59,119]、[10,13,16,30,33,23]。此外,本文網(wǎng)絡(luò)模型訓(xùn)練所需要的超參數(shù)設(shè)置如下:迭代批量為2,衰減系數(shù)為0.000 5,總迭代次數(shù)為300次,初始學(xué)習(xí)率為0.001。
由上文可知,本文在試驗中的樣本分為具有缺陷的絕緣子和正常絕緣子兩部分,則試驗樣本的檢測結(jié)果與實際情況的對應(yīng)關(guān)系如下。
(1)真正例(True positive,TP):表示具有缺陷的絕緣子,判定為缺陷絕緣子,即正樣本判斷正確的情況;
(2)假正例(False positive,F(xiàn)P):表示正常的絕緣子,判定為缺陷絕緣子,即負(fù)樣本判斷錯誤的情況;
(3)真反例(True negative,TN):表示正常的絕緣子,判定正常絕緣子,即負(fù)樣本判斷正確的情況;
(4)假反例(False negative,F(xiàn)N):表示具有缺陷的絕緣子,判定為正常絕緣子,即正樣本判斷錯誤的情況。
在此基礎(chǔ)上,本文選取了精確率、召回率、平均精度均值(Mean average precision,mAP)、F1指數(shù)和每秒傳輸幀數(shù)(Frames per second,F(xiàn)PS)這5個指標(biāo)對檢測結(jié)果進(jìn)行評價,相關(guān)指標(biāo)定義如下:
(1)精確率(Precision):表示模型分類正確的缺陷絕緣子樣本占所有分類為缺陷絕緣子樣本的比例,如式(8)所示
(2)召回率(Recall):表示模型分類正確的缺陷絕緣子圖像占所有實際上為缺陷絕緣子的比例,如式(9)所示
(3)平均精度均值(mAP):作為網(wǎng)絡(luò)模型精度指標(biāo),其計算方式如式(10)所示
式中:r表示[0,0.1,0.2,…,1]中11個不同級別的閾值,C表示類別數(shù),由于本文只有正常絕緣子和缺陷絕緣子兩類,故本文中C取2。
(4)F1指數(shù)(F1-measure):常用于平衡精確率和召回率,是分類模型中常用的一個綜合評價指標(biāo),其計算方式如式(11)所示
(5)FPS:表示模型每秒可以預(yù)測的圖像數(shù)量,用于體現(xiàn)模型處理速度,其計算方式如式(12)所示
本文根據(jù)上述指標(biāo)對比DSE-YOLOv5、YOLOv5l和YOLOv5x這3種算法的性能,具體對比結(jié)果如表2所示。
從表2可以看出,DSE-YOLOv5網(wǎng)絡(luò)模型與原模型相比,在精準(zhǔn)率和召回率、mAP以及F1指數(shù)上都有很大的提升,而模型權(quán)重僅僅只增加8.8M,F(xiàn)PS僅下降了2.92。其次,通過與YOLOv5x對比可知,本文算法在精準(zhǔn)率、召回率和F1指數(shù)這3個指標(biāo)上仍然具有優(yōu)勢,但是模型權(quán)重比YOLOV5x模型降低了67.9M,F(xiàn)PS提高了12.94。由此可以看出本文改進(jìn)的YOLOv5l模型在保證檢測速度和輕量化優(yōu)勢的同時,保證了對缺陷絕緣子的識別精度。
表2 性能指標(biāo)對比表
為了進(jìn)一步驗證本文所提模型性能,本文對DSE-YOLOv5網(wǎng)絡(luò)整體的收斂性進(jìn)行了分析,圖6為3種模型總的DIoU損失、目標(biāo)損失和分類損失函數(shù)圖,橫坐標(biāo)為迭代的次數(shù),縱坐標(biāo)為損失度,可以看到本文的模型損失下降速度比YOLOV5l和YOLOV5x更快,因此本文提出模型對絕緣子缺陷檢測效果更好。
圖6 3種模型的訓(xùn)練損失對比
最后,本文使用1 458張測試圖片,對YOLOv5x模型和本文提出的DSE-YOLOv5進(jìn)行對比分析。相關(guān)結(jié)果表明,本文的檢測模型在曝光、陰暗和模糊的情況下對絕緣子缺陷定位更加精準(zhǔn),并且漏檢和錯檢比例有所下降,部分檢測結(jié)果對比如圖7所示。
圖7 DSE-YOLOv5與原YOLOv5模型檢測結(jié)果對比
圖7(a)從左到右分別是傳統(tǒng)的YOLOv5模型出現(xiàn)的對絕緣子缺陷圖片的漏檢、多檢、誤檢和對遠(yuǎn)景拍攝的絕緣子圖片識別度低的情況,而DSE-YOLOv5對這些特定的情況進(jìn)行改進(jìn),改進(jìn)后的識別結(jié)果,如圖7(b)所示。從圖中可以看出,本文模型可以精準(zhǔn)識別原模型漏檢的絕緣子缺陷,并且對多檢和誤檢情況進(jìn)行修正,同時對遠(yuǎn)景識別的精準(zhǔn)度有所增加。這些有效、精準(zhǔn)的檢測結(jié)果,為合理進(jìn)行人員調(diào)度打下了有效基礎(chǔ)。
針對由絕緣子缺陷檢測精度不高而造成的維修人員的人力資源浪費問題,本文在原始的YOLOv5l網(wǎng)絡(luò)基礎(chǔ)上,對YOLOv5l進(jìn)行改進(jìn),提出了基于DSE-YOLOv5的絕緣子缺陷檢測方法。試驗結(jié)果表明,DSE-YOLOv5的損失函數(shù)有著更好的收斂性,精準(zhǔn)率上升了5.1%,召回率上升了2.8%,mAP提高了5.26%。
將DSE-YOLOv5網(wǎng)絡(luò)應(yīng)用到電力缺陷絕緣子檢測領(lǐng)域,能夠進(jìn)一步加強對電力維修人員的合理調(diào)度,方便輸電線路的管理。此外,由于DSEYOLOv5在檢測絕緣子缺陷方面有著較好的檢測速度和精準(zhǔn)度,未來可以遷移到其他重要電氣領(lǐng)域,增加電網(wǎng)調(diào)度的廣泛性。