陳科羽,時 磊,劉博迪,嚴(yán)爾梅,歐進(jìn)永,徐梁剛
(貴州電網(wǎng)有限責(zé)任公司輸電運(yùn)行檢修分公司,貴州 貴陽 550002)
隨著中國對電力能源的需求不斷增加以及電力系統(tǒng)的規(guī)模不斷擴(kuò)大,高壓輸電線路和輸電系統(tǒng)變得越來越重要,及時了解電力系統(tǒng)的運(yùn)行狀態(tài)對電力系統(tǒng)的安全穩(wěn)定運(yùn)行至關(guān)重要[1]。絕緣子是電力系統(tǒng)中輸變電設(shè)備的重要組成部分,由于長期暴露在野外,經(jīng)常被惡劣的環(huán)境侵蝕,使絕緣子出現(xiàn)污染、裂紋以及破損等故障的情況大幅增加,會嚴(yán)重影響輸電線路的正常使用,縮短線路的使用壽命。絕緣子發(fā)生故障時,輸電線路與桿塔接觸會造成停電,甚至可能發(fā)生大規(guī)模停電事故。目前,電網(wǎng)采用人工巡檢方式,不僅費(fèi)時費(fèi)力,而且難以及時、全面地掌握線路、絕緣子等電氣設(shè)備的狀態(tài)。隨著人工智能技術(shù)的發(fā)展,基于深度學(xué)習(xí)算法實現(xiàn)了端到端的圖像識別,使得絕緣子識別在電力系統(tǒng)中的應(yīng)用成為可能。
絕緣子的識別主要有兩種途徑:(1)傳統(tǒng)方法:主要根據(jù)絕緣子的形狀和紋理,結(jié)合神經(jīng)網(wǎng)絡(luò)來識別絕緣子。這些特征包括HOG 特征、SUFS 特征[2-3]和小波系數(shù)[4]等。這種方法精度低、魯棒性差,對目標(biāo)視頻和圖片的拍攝角度要求高。(2)深度學(xué)習(xí)算法:端到端的圖像識別避免了對人工特征的需要。該方法識別精度高,泛化能力強(qiáng)。翁智等[5]在原有YOLOv3[6]的基礎(chǔ)上引入了Res2Net殘差模塊,以實現(xiàn)對高壓輸電線路部件的檢測。李雪峰等[7]提出了一種新型的特征金字塔網(wǎng)絡(luò)PinFPN,有效解決了在輸電線路故障巡檢中小尺寸目標(biāo)檢測困難的問題;趙銳等[8]將CenterNet 與DLA-SE 特征提取網(wǎng)絡(luò)相結(jié)合,實現(xiàn)了對故障絕緣子的實時檢測。蔣姍等[9]基于Faster R-CNN 提出了一種針對航拍絕緣子圖像的目標(biāo)檢測算法,有效提升了檢測精度,但其缺點是檢測速度有所下降。
本文通過改進(jìn)的YOLOv3 算法對絕緣子訓(xùn)練數(shù)據(jù)庫進(jìn)行訓(xùn)練,實現(xiàn)自然背景下的絕緣子識別和定位。首先使用VoVNet[10]作為算法的主干網(wǎng)絡(luò),相比于原先的DarkNet53,VoVNet 特殊的特征連接方式在保證網(wǎng)絡(luò)特征提取能力的同時,降低了模型計算量和參數(shù)量,提升網(wǎng)絡(luò)對特征的敏感度。同時本文提出一種新型的特征增強(qiáng)模塊,與特征金字塔相結(jié)合以解決淺層特征圖語義信息較弱的問題。
與其他深度學(xué)習(xí)算法如Faster R-CNN[11]相比,YOLOv3 算法將檢測模型轉(zhuǎn)換為回歸問題,通過端到端的架構(gòu)使用整個圖像的特征來預(yù)測每個邊界框,實現(xiàn)了高精度、高效率的檢測方式。在訓(xùn)練過程中,網(wǎng)絡(luò)將原始圖像尺度標(biāo)準(zhǔn)化為416×416 像素,并將圖像劃分為N×N 個單元,三個不同大小的特征圖用以預(yù)測不同尺度的目標(biāo),每個特征圖中的每一個單元內(nèi)預(yù)測三個邊界框,每個邊界框輸出兩套獨立的預(yù)測值,分別為邊界框的中心點偏值和邊框置信度,邊框置信度的計算公式如下所示:
其中Pr(object)表示單元格內(nèi)是否包含目標(biāo)物體,若目標(biāo)中心點在單元格內(nèi),則為 1,否則為 0;IOU(b,object)表示模型輸出的預(yù)測框與真實框的交并比,計算在原始圖像中預(yù)測框與真實標(biāo)注框的面積重合度。
若單元格內(nèi)包含目標(biāo),則還需通過該目標(biāo)類別的概率與置信度的乘積得到類別置信度,選出類別置信度最高的預(yù)測框并使用非極大抑制(Non-Maximum Suppression,NMS)進(jìn)行篩選,再通過解碼將中心點偏值轉(zhuǎn)換為邊界框的中點坐標(biāo),得到最終的預(yù)測框位置與類別。其計算公式如下所示:
其中 bx、by、bw、bh分別為預(yù)測框的中心點坐標(biāo)以及寬高;t 為偏差值;cx、cy為單元格左上點坐標(biāo);pw、ph為邊界框的寬高;σ 為激活函數(shù)。
YOLOv3 以殘差結(jié)構(gòu)作為基礎(chǔ)組成單元,并結(jié)合特征金字塔網(wǎng)絡(luò)FPN[12(]Feature Pyramid Networks)來進(jìn)一步提高精度,但將YOLOv3 應(yīng)用在絕緣子檢測上仍存在一些缺點。首先,當(dāng)YOLOv3 的輸入為416×416像素時,用于檢測的特征圖的最小尺寸為13×13 像素,檢測大物體時會出現(xiàn)漏檢現(xiàn)象,特征圖的最大尺寸為52×52 像素,在檢測小物體時會有漏檢和誤檢;其次,YOLOv3 雖然使用了殘差結(jié)構(gòu),但是每個階段的特征圖之間的關(guān)系并不緊密,較深和較淺的特征不具有相互操作性,降低了檢測精度,較深的特征層不能很好地利用淺層特征層的信息,隨著級數(shù)的增加和網(wǎng)絡(luò)的加深,更容易造成梯度消失現(xiàn)象;最后,YOLOv3 中對特征圖的處理多以3×3 的卷積為主,這種設(shè)置雖然可以有效降低網(wǎng)絡(luò)參數(shù),但3×3 的卷積層感受野不夠豐富,在應(yīng)對復(fù)雜背景下的目標(biāo)檢測時效果較差。
本文針對原始YOLOv3 算法進(jìn)行改進(jìn),首先采用VoVNet 作為主干網(wǎng)絡(luò),其擁有更高分辨率的輸入,特征圖的最小尺寸為16×16 像素,最大尺寸為64×64 像素,可以有效減少模型漏檢和誤檢的現(xiàn)象,并且VoVNet 的密集連接方式將每層特征圖與最后一層特征相連,從而加深特征圖之間的關(guān)系,并提高較深層中較淺特征的利用率,防止梯度消失,進(jìn)一步提高檢測精度;其次本文提出一種特征增強(qiáng)模塊用以解決原始YOLOv3 算法中淺層特征語義信息不足,感受野較小的問題。
本文采用VoVNet-39 網(wǎng)絡(luò),其結(jié)構(gòu)如圖1 所示,網(wǎng)絡(luò)輸入大小為512×512 像素,由一個包含3 個卷積層的Stem Block 和4 個階段的一次性聚合模塊(OSA)組成,OSA 模塊由 5 個 3×3 卷積和 1 個 1×1 的卷積層組成,所有3×3 的卷積層具有相同的輸入和輸出通道數(shù)。VoVNet-39 在第 2、第 3 階段分別布置 1 個 OSA 模塊,在第4、第5 階段分別布置2 個OSA 模塊。每階段OSA模塊之間使用3×3 的最大池化層進(jìn)行連接以及下采樣。
圖1 VoVNet-39 結(jié)構(gòu)圖
OSA 模塊獨特的特征連接方式如圖2 所示,每個卷積層均有兩個輸出與其他特征圖連接,一個輸出連接到后續(xù)特征圖,以產(chǎn)生具有更大感受野的特征圖信息,另一個輸出聚合到最終的特征圖中,并通過1×1 的卷積層壓縮通道數(shù),這種聚合方法可以一次聚合中間特征,在保持連接強(qiáng)度的同時,極大地提高了媒體訪問控制和圖形處理器的計算效率。
圖2 OSA 模塊連接方式(F 代表向后的卷積層,P 代表與最終層聚合的卷積層)
針對原始YOLOv3 算法感受野不足、淺層特征語義信息少的缺點,本文基于RFB[13](Receptive Field Block)感受野原理提出一種新型的特征增強(qiáng)模塊,對網(wǎng)絡(luò)淺層特征進(jìn)行增強(qiáng),提升網(wǎng)絡(luò)對絕緣子圖像的適應(yīng)能力。本文所使用的網(wǎng)絡(luò)結(jié)構(gòu)如圖3 所示,提取VoVNet-39 中第3、第4 和第5 階段的特征圖進(jìn)行預(yù)測,其尺寸分別為 64×64 像素、32×32 像素和 16×16 像素,同時對第3 和第4 階段的特征圖進(jìn)行增強(qiáng)處理。
圖3 整體網(wǎng)絡(luò)結(jié)構(gòu)
特征增強(qiáng)模塊的結(jié)構(gòu)如圖4 所示,采取多個支路對特征圖進(jìn)行處理,在每個支路布置尺度不同的卷積層,并引入了空洞卷積以增加感受野范圍。第一個支路為 1×1、3×3 的卷積級聯(lián);第二個支路為 1×1、3×3 以及大小為3×3,膨脹率為3 的空洞卷積級聯(lián);第三條支路結(jié)構(gòu)與第二條相同,區(qū)別為其空洞卷積層的膨脹率為5,對前三條支路的輸出層進(jìn)行堆疊(Concat),并通過1×1 的卷積調(diào)整通道數(shù);第四條支路為1×1 的卷積層,與堆疊后的特征圖進(jìn)行元素相加(Add)以達(dá)到增加感受野的目的。其計算如下:
圖4 特征增強(qiáng)模塊
圖5(a)為原始圖像,(b)為使用本文算法的檢測效果圖
式中,Xj表示輸入的特征圖;P 表示由1x1 的卷積、BN層和relu 層組成的非線性操作組合;Hi表示進(jìn)行i 次由 3×3、BN 層和 relu 層組成的非線性操作組合;Qi表示 i 次卷積操作后的特征圖;Ri表示空洞卷積;i=1,2,3 時,空洞卷積的膨脹率分別為 1,3,5;δi[.]表示Concatenation 特征融合操作;Zj表示融合后的新特征圖。
本實驗基于Tensorflow1.13 框架實現(xiàn),使用的編程語言為Python,訓(xùn)練與測試均在Ubuntu16.04 操作系統(tǒng)、NVIDIA Tesla T4(16G 顯存)上進(jìn)行。batch_size 設(shè)置為32,初始學(xué)習(xí)率設(shè)置為0.0001,采用余弦退火衰減法,學(xué)習(xí)率最高值為0.001,預(yù)熱期為16 批次。
本文所使用的數(shù)據(jù)集源于無人機(jī)巡檢輸電線路所拍攝的絕緣子故障圖片,使用labelimg 程序進(jìn)行標(biāo)注,數(shù)據(jù)集格式仿照PLSCAL VOC 構(gòu)建,包含自然場景下的故障絕緣子共1500 張圖片,數(shù)據(jù)集的分辨率為800×1000 像素。對數(shù)據(jù)集中的圖片進(jìn)行旋轉(zhuǎn)變換、色差變換以及添加噪聲等數(shù)據(jù)擴(kuò)增操作,并按照7∶3 的比例劃分為訓(xùn)練集和測試集。
將使用VoVNet 和特征增強(qiáng)模塊后的網(wǎng)絡(luò)與原始YOLOv3 算法進(jìn)行對比實驗,本文主要通過準(zhǔn)確率(AP)、精確度(Precision)、召回率(Recall)以及檢測速率(FPS)來對模型性能進(jìn)行評價。對比結(jié)果如表1 所示,本文改進(jìn)算法的檢測準(zhǔn)確率(AP)為98.01%,相較于原始YOLOv3 算法提高了6.07%,說明VoVNet 與本文提出的特征增強(qiáng)模塊可以有效提升對故障絕緣子的檢測效果。改進(jìn)后的算法精確度(Precision)提升較不明顯,但是召回率(Recall)提升顯著。由于VoVNet 相較于原始算法的DarkNet 在結(jié)構(gòu)上更復(fù)雜,因此在檢測速度上改進(jìn)后的算法略低于原始算法。
表1 實驗結(jié)果對比
圖5 為本文改進(jìn)算法對絕緣子的檢測效果圖,可以看出在多種復(fù)雜背景(如塔架、房屋以及植被等)下本文算法可以有效檢測出絕緣子目標(biāo),并且當(dāng)距離較遠(yuǎn)時,目標(biāo)在圖像中占比極小,本文算法仍可以檢出待檢目標(biāo),證明本文提出的算法可以有效完成對絕緣子的檢測任務(wù)。
本文針對高壓輸變電線路人工巡檢困難的問題,提出了一種基于YOLOv3 改進(jìn)的輸電線路絕緣子目標(biāo)檢測方法。該方法以VoVNet 為特征提取網(wǎng)絡(luò),通過密集的連接方式提升網(wǎng)絡(luò)的特征提取能力,結(jié)合多分支結(jié)構(gòu)與空洞卷積設(shè)計了能增強(qiáng)模型感受野與語義信息的特征增強(qiáng)模塊。通過實驗表明,本文算法在自然背景下的絕緣子圖像檢測中mAP 達(dá)到了98.01%,速度為29FPS,實現(xiàn)了高效率且高精度的絕緣子目標(biāo)檢測方式。