馬進(jìn)德,陶青川
(四川大學(xué)電子信息學(xué)院,成都 610065)
智能電網(wǎng)是通過(guò)利用先進(jìn)傳感與量測(cè)技術(shù)、通信與信息技術(shù)、分布式發(fā)電與集成技術(shù)、新進(jìn)儲(chǔ)能技術(shù)等來(lái)提升電網(wǎng)的可靠性、安全性、健壯性和效率(包括經(jīng)濟(jì)效率和能源效率),涉及的范圍包括大型的發(fā)電機(jī)組、輸電系統(tǒng)、用戶(hù)和分布式電源等。但是,國(guó)家在大力發(fā)展智能電網(wǎng)的同時(shí),電力供應(yīng)過(guò)程當(dāng)中存在居民和商家竊電的問(wèn)題,某些法律意識(shí)淡薄并存有僥幸心理的不法分子會(huì)私自改裝計(jì)量電能表,這使得國(guó)家以及電力公司遭受到了巨大的經(jīng)濟(jì)損失,所以定期檢查智能電表是否存在竊電行為對(duì)國(guó)家打擊竊電犯罪,保障智能電網(wǎng)安全化、智能化、經(jīng)濟(jì)化發(fā)展至關(guān)重要。
目前,國(guó)家電網(wǎng)的工作人員對(duì)某批次的智能電表進(jìn)行抽樣檢查時(shí),還是采用肉眼檢查的模式,這種檢查方式不但持續(xù)時(shí)間長(zhǎng),對(duì)工作人員的視力要求也極為苛刻。在常見(jiàn)的竊電方式中,最隱蔽的一種就是替換貼片電阻,替換貼片電阻的竊電方式具有極高的隱蔽性,不法分子即使在電表的電路板上替換了電阻,也不會(huì)留下明顯的改裝痕跡。通常情況下,巡檢的工作人員導(dǎo)致需要攜帶放大鏡等工具來(lái)輔助他們檢查,這導(dǎo)致其眼睛的負(fù)荷太大,并且檢查結(jié)果較為主觀。所以,本文針對(duì)替換貼片電阻的竊電方式展開(kāi)研究,基于深度學(xué)習(xí)的目標(biāo)檢測(cè)技術(shù)來(lái)對(duì)貼片電阻進(jìn)行識(shí)別,結(jié)果更加客觀、精準(zhǔn),對(duì)反竊電行為具有重要意義。
隨著深度卷積神經(jīng)網(wǎng)絡(luò)的持續(xù)發(fā)展,目標(biāo)檢測(cè)算法也取得了突破性的進(jìn)展。其中,單階段目標(biāo)檢測(cè)算法有YOLO(you only look once)系 列 和SSD(single shot multibox detector)等,兩 階段目標(biāo)檢測(cè)算法有Faster R-CNN、RFCN(region-based fully convolutional Networks)、Mask R-CNN 等。YOLO 系列作為目標(biāo)檢測(cè)發(fā)展道路上的又一重要里程碑,已被廣泛應(yīng)用于各個(gè)領(lǐng)域,例如視頻識(shí)別、車(chē)輛行人計(jì)數(shù)、人臉識(shí)別、醫(yī)學(xué)影像檢測(cè)和目標(biāo)跟蹤等。其中,YOLOv3 作為YOLO 系列最經(jīng)典的算法,使用了Darknet-53 作為主干網(wǎng),相較于ResNet 系列,不僅保持了分類(lèi)的精度,還顯著提升了檢測(cè)速度。另外YOLOv3還采用了多尺度預(yù)測(cè)和更好的分類(lèi)器,使之成為了后續(xù)YOLO 版本發(fā)展的基石,但是YOLOv3對(duì)識(shí)別目標(biāo)的位置精準(zhǔn)性比較差,并且召回率低。YOLOv4 采用了CSPDarknet-53 作為主干網(wǎng),CSPDarknet-53 是由Darknet-53 和CSPNet 發(fā)展演進(jìn)而來(lái),并且引入了空間金字塔池化(spatial pyramid pooling,SPP)結(jié)構(gòu)來(lái)增加網(wǎng)絡(luò)的感受野并得到顯著的上下文特征。使用路徑 聚 合 網(wǎng)絡(luò)(path aggregation NetWork,PANet)來(lái)增強(qiáng)特征層對(duì)目標(biāo)的表達(dá)能力,YOLOv4還提出了Mosaic數(shù)據(jù)增強(qiáng),它是將四張圖像按照一定方式拼接,不僅豐富了數(shù)據(jù)集還減少了GPU;另外,YOLOv4還使用了標(biāo)簽平滑策略來(lái)有效抑制過(guò)擬合。在YOLO 系列不斷演化的進(jìn)程當(dāng)中,它們的探測(cè)頭仍保持著耦合的關(guān)系,即分類(lèi)和回歸在1 × 1 的卷積中實(shí)現(xiàn),2021 年曠世科技發(fā)表的YOLOX論文認(rèn)為,這種耦合關(guān)系會(huì)給網(wǎng)絡(luò)的識(shí)別帶來(lái)不利影響,所以YOLOX 將分類(lèi)和回歸分別實(shí)現(xiàn),最終預(yù)測(cè)的時(shí)候再整合。
YOLOv4 的網(wǎng)絡(luò)結(jié)構(gòu)如圖1 所示。其算法是以CSPDarknet-53作為主干特征提取網(wǎng)絡(luò),例如輸入圖像的大小為(512,512,3),經(jīng)過(guò)主干網(wǎng)之后,將會(huì)輸出(64,64)、(32,32)、(16,16)這三種尺度的特征層。SPP 模塊將獲得的新特征層和送入到網(wǎng)絡(luò)之前的特征層進(jìn)行堆疊、卷積后傳入到PANet 結(jié)構(gòu)中,增加特征層的感受野。主干特征網(wǎng)絡(luò)輸出的三個(gè)特征層會(huì)通過(guò)PANet進(jìn)行特征融合,除了進(jìn)行自上而下的特征融合,還進(jìn)行自下而上的特征融合,即將(16,16)的特征層進(jìn)行兩次上采樣,然后分別與(32,32)、(64,64)的特征層堆疊后進(jìn)行卷積;再將(64,64)這個(gè)特征層進(jìn)行兩次下采樣,分別與(32,32)、(16,16)堆疊后卷積,因?yàn)槠渥韵露系穆窂皆鰪?qiáng),縮短了信息的傳播路徑,大大減少了計(jì)算量。經(jīng)過(guò)PANet 模塊的充分融合之后,得到三個(gè)不同尺度的特征層,YOLOv4 Head 負(fù)責(zé)對(duì)這三種尺度的特征層進(jìn)行預(yù)測(cè),YOLOv4 的Head 是將每個(gè)特征層劃分成×的網(wǎng)格,每個(gè)網(wǎng)格點(diǎn)都有3 個(gè)不同尺度的先驗(yàn)框,通過(guò)調(diào)整先驗(yàn)框的中心和寬高來(lái)獲得最終的預(yù)測(cè)框,預(yù)測(cè)的結(jié)果由目標(biāo)的坐標(biāo)、目標(biāo)的類(lèi)別概率、目標(biāo)的類(lèi)別信息組成。所以,針對(duì)上述網(wǎng)絡(luò)的優(yōu)缺點(diǎn)以及應(yīng)用場(chǎng)景,本文在YOLOv4的基礎(chǔ)上對(duì)其進(jìn)行了改進(jìn),提出YOLOv4-CBAMDW-X算法。
圖1 YOLOv4網(wǎng)絡(luò)結(jié)構(gòu)
本文算法主要針對(duì)YOLOv4網(wǎng)絡(luò)結(jié)構(gòu)的主干網(wǎng)、Neck、YOLOv4 Head 進(jìn)行改進(jìn):在主干網(wǎng)的殘差結(jié)構(gòu)和主干網(wǎng)輸出的低層次特征圖中加入了注意力機(jī)制,以此來(lái)提高對(duì)目標(biāo)的特征提取能力;用深度可分離卷積(Depthwise Separable Convolution)替換掉圖一Neck 中CBL 模塊所使用的3 × 3 傳統(tǒng)卷積,這樣可在一定程度上減少網(wǎng)絡(luò)的參數(shù)量;把YOLOv4 的Head 換成YOLOX 的Head,可以增加網(wǎng)絡(luò)的檢測(cè)精度。經(jīng)過(guò)上述改進(jìn)后的網(wǎng)絡(luò),本文將其命名為YOLOv4-CBAM-DW-X。
本文將YOLOv4 的backbone 保留,在CSPDarknet-53 中融入了注意力機(jī)制。注意力機(jī)制在神經(jīng)網(wǎng)絡(luò)中是一個(gè)非常重要且有效的組件,可以基于人類(lèi)的視覺(jué)系統(tǒng)進(jìn)行解釋?zhuān)热缛祟?lèi)的視覺(jué)系統(tǒng)會(huì)重點(diǎn)關(guān)注目標(biāo)區(qū)域,因此會(huì)對(duì)目標(biāo)投入更多的注意力來(lái)獲取更多有用的信息。Hu等提出了SENet(squeeze-and-excitation Net-works),SENet 是通過(guò)Squeeze 和Excitation 操作對(duì)通道之間的信息建模,讓SE(squeeze-andexcitation)學(xué)習(xí)到每個(gè)特征通道的重要性,再根據(jù)學(xué)習(xí)到的重要性來(lái)計(jì)算輸出的特征圖。但SENet僅僅是在特征圖通道上添加了注意力模型,并沒(méi)有考慮到在空間上添加注意力模型,而在目標(biāo)檢測(cè)中,空間位置對(duì)于網(wǎng)絡(luò)來(lái)說(shuō)是至關(guān)重要的。Woo等考慮在空間和通道兩個(gè)維度都加上注意力模型,提出了CBAM(convolutional block attention module),CBAM結(jié)構(gòu)如圖2所示。
圖2 CBAM結(jié)構(gòu)
CBAM 可以分為兩個(gè)模塊(見(jiàn)圖3和圖4),分別是CAM(channel attention module)和SAM(spatial attention module)。如公式(1)所示,CAM 的輸入是××的特征圖F,分別經(jīng)過(guò)基于寬高的全局最大池化和全局平均池化,分別得到一個(gè)1 × 1 ×的通道描述信息,兩個(gè)特征圖再經(jīng)過(guò)一個(gè)兩層的卷積神經(jīng)網(wǎng)絡(luò),對(duì)得到的結(jié)果執(zhí)行基于element-wise 的加和操作,再經(jīng)過(guò)sigmoid 激活函數(shù)就得到了最終的通道注意力的權(quán)重系數(shù)。將輸入進(jìn)來(lái)的特征圖F 和執(zhí)行element-wise 乘法操作,如公式(2)所示,其結(jié)果就是SAM 的輸入特征圖。如公式(3)所示,SAM 是將CAM 的輸出特征作為本模塊的輸入特征,之后仍然使用全局最大池化和全局平均池化操作,concat操作會(huì)將上一步的結(jié)果拼接,再經(jīng)過(guò)卷積層,通過(guò)sigmoid 函數(shù)將注意力權(quán)重進(jìn)行歸一化,然后把權(quán)重維度和輸入相乘就得到了最終的特征圖。加入注意力機(jī)制的過(guò)程可以簡(jiǎn)單用公式(2)和公式(4)描述。
圖3 CAM
圖4 SAM
為了加強(qiáng)網(wǎng)絡(luò)對(duì)貼片電阻特征提取的能力,從而提升貼片電阻的檢測(cè)精度,在CSPDarknet-53 的殘差結(jié)構(gòu)中加入了CBAM來(lái)對(duì)特征進(jìn)行細(xì)化處理,另外在主干網(wǎng)輸出的兩個(gè)低層次的特征層中也添加了CBAM模塊來(lái)提高對(duì)中小目標(biāo)的檢測(cè)能力,本文以512 × 512 尺度的圖像作為改進(jìn)網(wǎng)絡(luò)的輸入,增加了CBAM 之后的網(wǎng)絡(luò)結(jié)構(gòu)如圖5所示。
圖5 增加了CBAM的YOLOv4結(jié)構(gòu)
從圖1YOLOv4 的網(wǎng)絡(luò)結(jié)構(gòu)可以發(fā)現(xiàn),Neck中存在很多的CBL 結(jié)構(gòu),其中3 次卷積塊是圖1CBL 結(jié)構(gòu)上標(biāo)×3 的位置;5 次卷積塊是圖1 中CBL 結(jié)構(gòu)上標(biāo)×5 的位置。3 次卷積塊中包含一個(gè)3 × 3 的傳統(tǒng)卷積,5 次卷積塊包含兩個(gè)3 × 3的傳統(tǒng)卷積,所以可用深度可分離卷積替換掉3次卷積塊和5次卷積塊中的傳統(tǒng)卷積,這樣可以減少參數(shù)量,提高運(yùn)行效率。
在傳統(tǒng)卷積中,上一層的輸出通常有多個(gè)通道(假設(shè)通道數(shù)為),假設(shè)下一層的輸出通道數(shù)為,則需要個(gè)Filter,所以在卷積時(shí),每一個(gè)Filter 必須要求有個(gè)卷積核,即Filter 的卷積核個(gè)數(shù)要與上一層輸出的通道數(shù)對(duì)應(yīng),一個(gè)Filter 完成一次卷積過(guò)程就是個(gè)卷積核與上層對(duì)應(yīng)通道的特征圖卷積后相加,進(jìn)而輸出到下一層的通道特征層中,傳統(tǒng)卷積過(guò)程如圖6所示。
圖6 傳統(tǒng)卷積
MobileNetV1 使用的深度可分離卷積塊是由一個(gè)3 × 3 的深度可分離卷積加上一個(gè)1 × 1 的傳統(tǒng)卷積來(lái)代替?zhèn)鹘y(tǒng)的3 × 3 卷積,這個(gè)深度可分離卷積塊可以大幅減少網(wǎng)絡(luò)的參數(shù)數(shù)量,節(jié)省了運(yùn)算成本,換句話(huà)說(shuō),在參數(shù)量一致的前提下,深度可分離卷積可以得到更深層次的特征。它由逐通道卷積(depthwise convolution)和逐點(diǎn)卷積(pointwise convolution)組成,分別如圖7、圖8所示。逐通道卷積就是一個(gè)卷積核僅負(fù)責(zé)一個(gè)通道,而逐點(diǎn)卷積和傳統(tǒng)卷積的計(jì)算非常類(lèi)似。
圖7 逐通道卷積
圖8 逐點(diǎn)卷積
在YOLOv3 至YOLOv5 網(wǎng)絡(luò)中,分類(lèi)和回歸任務(wù)是在一個(gè)1 × 1 的卷積里實(shí)現(xiàn)的,為了增強(qiáng)網(wǎng)絡(luò)識(shí)別效果,YOLOX 將其劃分成了兩部分來(lái)分別實(shí)現(xiàn),最后預(yù)測(cè)時(shí)再整合到一起,這種解耦頭方式可以提高網(wǎng)絡(luò)的收斂速度。另外,YOLOv3 到Y(jié)OLOv5 都是基于錨框機(jī)制的,錨框機(jī)制會(huì)存在以下問(wèn)題:為了獲得最佳的檢測(cè)性能,在訓(xùn)練之前需要通過(guò)聚類(lèi)分析的方法來(lái)獲得一系列比較好的錨框,但是這些錨框沒(méi)有通用性;錨框機(jī)制也增加了檢測(cè)頭的復(fù)雜度。所以本文將YOLOv4 的Head 換成了YOLOX Head,網(wǎng)絡(luò)結(jié)構(gòu)如圖9所示。經(jīng)過(guò)PANet之后得到三個(gè)不通尺度的特征層,每一個(gè)特征層都會(huì)經(jīng)過(guò)一個(gè)解耦頭,每個(gè)解耦頭會(huì)輸出三種尺度的信息:(,,)用來(lái)判斷每個(gè)特征點(diǎn)所包含的目標(biāo)種類(lèi);(,,4)用來(lái)判斷每個(gè)特征點(diǎn)的回歸參數(shù),回歸參數(shù)進(jìn)行調(diào)整之后會(huì)獲得最終的預(yù)測(cè)框;(,,1)用來(lái)判斷每個(gè)特征點(diǎn)是否包含目標(biāo)。把這3 個(gè)預(yù)測(cè)結(jié)果進(jìn)行堆疊,就得到了(,,+4+1)尺度的結(jié)果。
圖9 YOLOX Head結(jié)構(gòu)
因?yàn)橘N片電阻非常小,所以本文所用電能表的電路板數(shù)據(jù)集是采用USB 3.0 面陣工業(yè)相機(jī)拍攝的,它使用性能強(qiáng)悍的感光芯片,通過(guò)USB3.0 接口與計(jì)算機(jī)進(jìn)行數(shù)據(jù)傳輸。圖10 是本文所使用的高清像機(jī),其技術(shù)參數(shù)如表1所示。
表1 高分辨率相機(jī)技術(shù)參數(shù)
圖10 高分辨率像機(jī)
本次實(shí)驗(yàn)共拍攝了500 張分辨率為5472 ×3648 的原始圖像,將原始圖像裁減成分辨率為512 × 512 的圖像以便更好地訓(xùn)練。裁剪時(shí)設(shè)置重疊率為0.1,一張?jiān)紙D像可以裁剪出96 張512 × 512 的圖像,在經(jīng)過(guò)去除背景操作以及部分沒(méi)有目標(biāo)的圖像之后得到了7714 張低分辨率圖像。裁剪之后的貼片電阻樣例如圖11 所示。訓(xùn)練平臺(tái)軟硬件參數(shù)如表2所示。
表2 訓(xùn)練平臺(tái)軟硬件參數(shù)
圖11 貼片電阻樣例
為了加快訓(xùn)練效率防止權(quán)值破壞,本文實(shí)驗(yàn)選擇前50 個(gè)epoch 凍結(jié)主干網(wǎng)訓(xùn)練,后50 個(gè)epoch 解凍訓(xùn)練,表3 展示了各網(wǎng)絡(luò)針對(duì)本次數(shù)據(jù)集的各項(xiàng)性能指標(biāo)的對(duì)比。YOLOv4-CBAMDW-X 代表本次對(duì)YOLOv4 使用了CBAM、深度可分離卷積、YOLOX Head 之后的網(wǎng)絡(luò),YOLOv4-DW-X 代表使用了深度可分離卷積、YOLOX Head。改進(jìn)后的算法對(duì)貼片電阻的檢測(cè)效果如圖12 所示,實(shí)驗(yàn)結(jié)果表明該網(wǎng)絡(luò)能夠有效檢測(cè)出貼片電阻。
表3 各網(wǎng)絡(luò)針對(duì)本次數(shù)據(jù)集的各項(xiàng)性能指標(biāo)
圖12 貼片電阻的檢測(cè)效果
本文針對(duì)電路板貼片電阻檢測(cè)任務(wù),提出了基于YOLOv4 網(wǎng)絡(luò)改進(jìn)的檢測(cè)算法YOLOv4-CBAM-DW-X,該算法相比于YOLOv4,和提高了2.96%,召回率提高了11.26%,參數(shù)量減少了31.03%。該算法能夠準(zhǔn)確地檢測(cè)出電路板上的貼片電阻,為后續(xù)進(jìn)一步檢測(cè)竊電行為提供了良好的基礎(chǔ)。相比于人工尋找貼片電阻,該方式更加精準(zhǔn)、安全,并在很大程度上節(jié)省了人力成本。本文的算法還可以推廣到針對(duì)電路板上的其他檢測(cè)需求,例如PCB 電路板的缺陷檢測(cè)、電路板元器件的檢測(cè)以及各種中小目標(biāo)的檢測(cè)等。