關(guān)鍵詞: 輸電通道; 防外力破壞; 目標(biāo)檢測(cè); SimAM注意力機(jī)制; Wise-IoU損失函數(shù)
中圖分類號(hào): TB9; TM85 文獻(xiàn)標(biāo)志碼: A 文章編號(hào): 1674–5124(2025)02–0155–07
0 引言
隨著電力行業(yè)快速發(fā)展,輸電線路長(zhǎng)度及覆蓋范圍在不斷擴(kuò)大,輸電線路“三跨”(跨越鐵路、高速公路和重要輸電通道的區(qū)域)安全問題日益突出[1]。外力破壞是導(dǎo)致“三跨”輸電線路事故的主要原因,輸電通道周圍施工的大型施工機(jī)械,如吊車、挖掘機(jī)和卡車等違章操作,導(dǎo)致輸電線路損壞、停電甚至人員傷亡。山東省某供電公司2019 年的停電跳閘次數(shù)統(tǒng)計(jì)顯示[2],外力破壞比例高達(dá)54.2%。所以對(duì)輸電通道進(jìn)行巡檢,預(yù)防隱患物造成外力破壞已成為亟待解決的問題。
過去很長(zhǎng)時(shí)間,對(duì)輸電通道進(jìn)行巡檢需要步行勘察或搭乘直升機(jī)巡線[3-4],效率低、勞動(dòng)強(qiáng)度大且存在人員安全風(fēng)險(xiǎn)[5]。隨著技術(shù)發(fā)展,配備傳感器的機(jī)器人和無人機(jī)已被用于巡檢[6],但存在滯后性,不能及時(shí)有效預(yù)警。在此背景下,通過安裝在鐵塔上的單目攝像頭實(shí)時(shí)獲取輸電通道狀況,并利用計(jì)算機(jī)視覺技術(shù)識(shí)別輸電通道周圍的外破隱患物[7],已成為輸電通道防外破監(jiān)測(cè)的一個(gè)重要研究方向。
近年來,隨著深度學(xué)習(xí)在計(jì)算機(jī)視覺領(lǐng)域的快速應(yīng)用和擴(kuò)展, 基于深度卷積神經(jīng)網(wǎng)絡(luò)( Deepconvolutional neural network, DCNN)的深度學(xué)習(xí)算法為輸電通道隱患目標(biāo)檢測(cè)引入了新的方法[8]。文獻(xiàn)[9] 通過使用視覺幾何組(VGG16) 和EfficientNetB7作為提取特征的骨干架構(gòu),將提取的特征圖數(shù)據(jù)轉(zhuǎn)換為SSD,提高了對(duì)電力線中的鳥巢檢測(cè)的準(zhǔn)確度、精確度和召回率。文獻(xiàn)[10] 利用跨階段局部模塊和路徑聚合網(wǎng)絡(luò)對(duì)YOLOv3模型進(jìn)行優(yōu)化進(jìn)而提高了模型對(duì)電力設(shè)備紅外目標(biāo)檢測(cè)的平均精度。文獻(xiàn)[11] 在原基線模型RetinaNet上融入注意力門(Attention gate, AG)來抑制輸入圖像中不相關(guān)的區(qū)域,最終提高了模型對(duì)輸電線路斷股和異物檢測(cè)的平均精度,但檢測(cè)精度仍較低,不適合在輸電通道邊緣設(shè)備中部署。
目前用于輸電通道目標(biāo)檢測(cè)的模型一方面需要大量的訓(xùn)練數(shù)據(jù),然而出于敏感性和安全性的考慮,少有可供使用的公開數(shù)據(jù)集,且公開數(shù)據(jù)集主要集中在輸電線、金具和絕緣子等設(shè)備的缺陷檢測(cè)上,較少涉及輸電線通道外力破壞隱患目標(biāo)。另一方面現(xiàn)有網(wǎng)絡(luò)模型復(fù)雜,參數(shù)眾多,導(dǎo)致模型訓(xùn)練時(shí)間延長(zhǎng)、檢測(cè)精度降低、運(yùn)行速度緩慢,所以不適合部署在輸電通道邊緣計(jì)算設(shè)備上。針對(duì)這些問題,本文通過構(gòu)建輸電通道外破隱患目標(biāo)數(shù)據(jù)集,提出基于改進(jìn)YOLOv5s 的輸電通道隱患目標(biāo)檢測(cè)方法:
1)在基線模型的頭部引入無參數(shù)注意力模塊SimAM[12],在不增加額外網(wǎng)絡(luò)參數(shù),避免過多的結(jié)構(gòu)調(diào)整工作的同時(shí),多尺度從輸入的輸電通道監(jiān)拍圖像數(shù)據(jù)中提取外破隱患物特征中的權(quán)重并抑制輸電通道背景干擾權(quán)重,從而提升模型檢測(cè)性能。
2)將原始的邊界框回歸損失函數(shù)CIoU 替換為WIoU[13],用以聚焦普通質(zhì)量錨框的預(yù)測(cè)回歸,降低高質(zhì)量錨框的競(jìng)爭(zhēng)力并掩蓋低質(zhì)量示例的有害梯度,提高預(yù)測(cè)輸電通道隱患目標(biāo)邊界框的回歸預(yù)測(cè)精度,加快回歸損失函數(shù)的收斂速度,提高改進(jìn)模型的整體性能。
1 方法介紹
1.1 YOLOv5算法原理
YOLOv5是一種以高性能和高效率而聞名的目標(biāo)檢測(cè)模型,具有快速、精確和適應(yīng)性強(qiáng)的特性。
它包含了四種不同深度的網(wǎng)絡(luò)模型(YOLOv5s、YOLOv5x、YOLOv5l、YOLOv5m),其中YOLOv5s是網(wǎng)絡(luò)深度最小、特征圖寬度最小和運(yùn)行速度最快的網(wǎng)絡(luò)模型。由于需要對(duì)輸電通道外破隱患目標(biāo)進(jìn)行實(shí)時(shí)檢測(cè),所以文章選擇相對(duì)輕量級(jí)的YOLOv5s網(wǎng)絡(luò)模型作為基礎(chǔ)框架,在確保模型對(duì)隱患目標(biāo)快速準(zhǔn)確檢測(cè)的同時(shí)又減小了模型的體積,利于后續(xù)部署在輸電通道移動(dòng)邊緣端設(shè)備上。
如圖1所示,YOLOv5s 的網(wǎng)絡(luò)結(jié)構(gòu)可以分為用于提取特征的骨干網(wǎng)絡(luò)(Backbone)和用于預(yù)測(cè)目標(biāo)的位置和類別的頭部(Head)兩個(gè)部分。模型首先對(duì)輸入網(wǎng)絡(luò)的原始輸電通道圖像進(jìn)行切片,在保存完整的圖像信息后達(dá)到下采樣效果。骨干網(wǎng)絡(luò)主要通過卷積模塊、具有殘差結(jié)構(gòu)的C3 模塊以及Spatial Pyramid Pooling-Fast(SPPF)模塊從處理后的圖像中提取隱患目標(biāo)特征,形成一組新的特征圖。頭部的特征融合網(wǎng)絡(luò)結(jié)構(gòu)采用特征金字塔網(wǎng)絡(luò)(Feature" Pyramid Networks, FPN)加路徑聚合網(wǎng)絡(luò)( Path Aggregation Network, PAN) 的結(jié)構(gòu), 其中FPN 自上而下傳遞高層語(yǔ)義特征,PAN自下而上傳遞低層定位特征,通過兩次上采樣操作,實(shí)現(xiàn)多尺度感受野的融合,增強(qiáng)了對(duì)待測(cè)隱患物的特征融合能力,使其能夠更準(zhǔn)確地識(shí)別輸電通道中不同大小和尺度的相同外破隱患物。
改進(jìn)型YOLOv5s模型中的損失函數(shù)包括基于交叉熵?fù)p失和均方誤差損失、比較預(yù)測(cè)框和真實(shí)框之間的差異、衡量模型對(duì)待測(cè)隱患目標(biāo)的檢測(cè)準(zhǔn)確性的目標(biāo)檢測(cè)損失函數(shù)(Object" Detection Loss);基于交叉熵?fù)p失、比較預(yù)測(cè)外破隱患物體類別和真實(shí)類別之間的差異、衡量模型對(duì)目標(biāo)類別的分類準(zhǔn)確性的分類損失函數(shù)(Classification Loss);基于均方誤差損失、比較預(yù)測(cè)框和真實(shí)框的位置差異、衡量提出的改進(jìn)型檢測(cè)算法對(duì)邊界框位置的回歸準(zhǔn)確性的邊界框回歸損失函數(shù)(Bounding Box RegressionLoss)。
1.2 SimAM注意力機(jī)制模塊
與地面捕獲的圖像不同,安裝在鐵塔上的單目攝像頭監(jiān)拍的圖像從俯視視角描繪輸電通道外破隱患目標(biāo),目標(biāo)的視覺特征表現(xiàn)主要集中在頂部,因此具有較高可區(qū)分性的特征不太明顯。這要求改進(jìn)后的模型具備將更多注意力集中在圖像中有可區(qū)分性的關(guān)鍵特征區(qū)域,而忽略非關(guān)鍵特征區(qū)域的能力?,F(xiàn)有研究表明,采用注意力機(jī)制有助于將模型集中在關(guān)鍵特征上,同時(shí)最大限度減少對(duì)無關(guān)信息的注意力。
然而,當(dāng)前主流注意力機(jī)制模塊存在兩個(gè)缺點(diǎn),影響其對(duì)外破隱患目標(biāo)檢測(cè)的效果[14]。首先,同時(shí)從通道和空間學(xué)習(xí)注意力權(quán)重來調(diào)整特征圖較為困難;其次,需要豐富的專業(yè)知識(shí)來確保依賴于超參數(shù)注意力模塊的性能。如圖2 所示,傳統(tǒng)的通道注意力機(jī)制或空間注意力機(jī)制是從特征中生成一維通道或二維空間權(quán)值,并對(duì)通道或空間的權(quán)值進(jìn)行擴(kuò)展。與之相比,SimAM 注意力機(jī)制無需增加原始網(wǎng)絡(luò)參數(shù),即可直接通過推斷特征圖上的三維注意力權(quán)重來提高檢測(cè)算法的準(zhǔn)確性。因此在改進(jìn)模型中融入SimAM 注意力機(jī)制模塊后,利用該模塊的能量函數(shù)的閉式解來評(píng)估模型頭部提取特征的重要性,增強(qiáng)了神經(jīng)元的輸出,專注于更有效的輸電通道外破隱患目標(biāo)信息并抑制不相關(guān)的輸電通道背景特征,能夠?qū)崿F(xiàn)對(duì)輸電通道隱患目標(biāo)更準(zhǔn)確地識(shí)別,使模型網(wǎng)絡(luò)在無需添加參數(shù)的同時(shí)還能更好發(fā)揮SimAM 的有效性、靈活性以及卷積網(wǎng)絡(luò)的代表性。
式中,TP為正確識(shí)別的樣本數(shù)量;FP為錯(cuò)誤地識(shí)別為其他類別的樣本數(shù)量;FN 為將其他類別錯(cuò)誤識(shí)別為本類別的樣本數(shù)量。
2.4消融實(shí)驗(yàn)
為了更好地評(píng)估文中提出的改進(jìn)YOLOv5s輸電通道隱患目標(biāo)檢測(cè)模型的有效性,在所構(gòu)建的輸電通道隱患目標(biāo)數(shù)據(jù)集中進(jìn)行消融實(shí)驗(yàn),定量分析不同改進(jìn)策略的實(shí)驗(yàn)效果。消融實(shí)驗(yàn)的結(jié)果如表2所示,其中實(shí)驗(yàn)A 表示YOLOv5s基線模型;實(shí)驗(yàn)B 表示在頭部加入SimAM注意力機(jī)制模塊;實(shí)驗(yàn)C表示將原始的邊界框回歸損失函數(shù)CIoU替換為WIoU損失函數(shù);實(shí)驗(yàn)D表示在頭部加入SimAM注意力機(jī)制的同時(shí)替換CIoU為WIoU損失函數(shù)。從表2中的數(shù)據(jù)可看出,文章提出的改進(jìn)策略在檢測(cè)性能指標(biāo)上取得了一定的提升,在加入SimAM模塊后在閾值為0.5和0.5:0.95時(shí)的精度分別提高了0.3和0.5百分點(diǎn);在替換為WIoU 損失函數(shù)后在閾值為0.5和0.5:0.95時(shí)的精度分別提高了0.6和0.3百分點(diǎn);同時(shí)引入兩種改進(jìn)策略后模型準(zhǔn)確率上升了2百分點(diǎn),召回率提高了1.1百分點(diǎn);在閾值為0.5和0.5:0.95時(shí)的精度分別提升了1.4和1百分點(diǎn)。實(shí)驗(yàn)表明:改進(jìn)后的輸電通道隱患目標(biāo)檢測(cè)模型在參數(shù)量和浮點(diǎn)運(yùn)算率保持不變的同時(shí)提高了對(duì)隱患目標(biāo)的檢測(cè)精度,取得了良好的改進(jìn)效果。
圖4展示了本文改進(jìn)模型在隨機(jī)挑選的測(cè)試集圖像上的檢測(cè)結(jié)果的可視化效果,其中圖4(a)和(b)表示帶有標(biāo)簽框的原始圖像,圖4(c)和(d)表示改進(jìn)模型檢測(cè)效果。從圖中可以看出,文章提出的模型不但滿足輸電通道外破隱患目標(biāo)檢測(cè)的需求,還在較高的背景復(fù)雜性,檢測(cè)目標(biāo)被遮擋等情況下仍可對(duì)輸電通道隱患目標(biāo)進(jìn)行準(zhǔn)確定位和正確分類。
2.5對(duì)比實(shí)驗(yàn)
為了進(jìn)一步驗(yàn)證本文模型的有效性,將YOLOv5s改進(jìn)模型與當(dāng)前主流的RetinaNet、SSD 和YOLOv3目標(biāo)檢測(cè)模型進(jìn)行對(duì)比實(shí)驗(yàn)。各對(duì)比模型均使用相同的參數(shù)和本文所構(gòu)建的輸電通道隱患目標(biāo)數(shù)據(jù)集進(jìn)行訓(xùn)練,主要測(cè)試算法的檢測(cè)精度,對(duì)比實(shí)驗(yàn)結(jié)果見表3。從表中可以看出提出的改進(jìn)模型在閾值分別為0.5、0.75 和0.5:0.95 時(shí)的mAP 值分別為96.1%、72.9% 和69.6%,均顯著高于其他對(duì)比模型的精度,所以本文提出的基于YOLOv5s 的改進(jìn)模型在檢測(cè)精度上達(dá)到了令人滿意的結(jié)果。
3結(jié)束語(yǔ)
本文提出了一種改進(jìn)YOLOv5s的輸電通道外破隱患目標(biāo)檢測(cè)模型,首先采集輸電通道監(jiān)拍圖像構(gòu)建輸電通道外破隱患目標(biāo)數(shù)據(jù)集,并通過引入注意力機(jī)制模塊和替換邊界框回歸損失函數(shù)對(duì)基線模型進(jìn)行改進(jìn)。提出的改進(jìn)模型針對(duì)卡車、汽車、吊車和起重機(jī)懸臂四類輸電通道隱患目標(biāo)進(jìn)行消融和對(duì)比實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明:
1)本文提出的改進(jìn)模型在不增加參數(shù)量的同時(shí)檢測(cè)四類輸電通道外破隱患目標(biāo)的準(zhǔn)確率達(dá)到了97.8%,召回率達(dá)到了93.3%,均值平均精度達(dá)到了96.1%。
2)在同一臺(tái)實(shí)驗(yàn)平臺(tái)上進(jìn)行訓(xùn)練測(cè)試,本文提出的模型對(duì)輸電通道外破隱患目標(biāo)進(jìn)行檢測(cè)的精度顯著高于當(dāng)前主流的RetinaNet、SSD和YOLOv3目標(biāo)檢測(cè)模型。
實(shí)驗(yàn)結(jié)果表明,本文提出的模型在不引入額外參數(shù)量的同時(shí),能夠準(zhǔn)確有效識(shí)別輸電通道隱患目標(biāo)的類別,對(duì)輸電通道防外破研究有一定的參考價(jià)值,也為電網(wǎng)輸電側(cè)安全有效巡檢提供了一種新的解決方案。下一步工作方向?qū)⒓{入更多類型的外破隱患物作為檢測(cè)目標(biāo),以擴(kuò)展模型的功能,同時(shí)構(gòu)建低復(fù)雜度的輕量化模型結(jié)構(gòu),滿足后續(xù)在輸電通道邊緣計(jì)算設(shè)備上部署的要求。