李巖 李建 李丹 楊豪杰 劉海峰 蘇國芳
【摘 ?要】針對電力及水利行業(yè)人工巡檢效率低、實時性差的問題,基于機器視覺模型,論文設計了針對電力設備及水利設施自動檢測系統(tǒng)。系統(tǒng)使用YOLO V5模型,通過數(shù)據(jù)增強、數(shù)據(jù)訓練,得到一種運算量較小、準確率較高的檢測模型。
【Abstract】Aiming at the problem of low efficiency and poor real-time performance of manual inspection in the power and water conservancy industry, based on the machine vision model, an automatic detection system for power equipment and water conservancy facilities is designed in this paper. The system uses the YOLO V5 model, through data enhancement and data training, a detection model with less computation and higher accuracy is obtained.
【關鍵詞】機器視覺;YOLO V5;電力;水利
【Keywords】machine vision; YOLO V5; power; water conservancy
【中圖分類號】TP18 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 【文獻標志碼】A ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 【文章編號】1673-1069(2021)12-0194-03
1 引言
隨著城市化進程的加快,人民生活水平的提高,電力及水利行業(yè)在社會生活中的重要性不斷增加。確保電力及水利設施的安全,保障社會需要,具有重要的現(xiàn)實意義。傳統(tǒng)的檢測系統(tǒng)普遍使用人工巡檢的方式進行工作。當需要確定設備安全時,需要專業(yè)的巡查人員定期巡查,而人工監(jiān)測的工作方式效率低、占用資源、實時性差且容易出現(xiàn)漏檢,對設備的安全運行帶來隱患。因此,使用機器視覺技術,利用捕捉的圖像對電力及水利設施進行自動監(jiān)測成為一種有效的解決方式。自動檢測高效、實時、成本低且安全可靠。本文以采集到的電力設備及水利設施混凝土圖像為訓練樣本,基于機器視覺方法,對電力設備運行情況及水利設施混凝土裂縫情況進行自動監(jiān)測,人員只需對檢查結(jié)果進行核查,高效、實時、成本低且安全可靠,具有一定的實用意義。
鄒雷(2014)使用BP神經(jīng)網(wǎng)絡對水下混凝土裂縫進行識別;李若星(2018)使用Gabor濾波器來進行濾波處理并提取特征并使用自適應遺傳算法對混凝土的方法對混凝土裂縫進行檢測;竇一民(2020)使用特征增強算法Feature GANs及目標檢測算法SSD對輸電線異物進行檢測;王斯凡(2018)使用支持向量機對門隔離開關狀態(tài)進行自動判斷并使用深度學習模型VGGNet對電力系統(tǒng)中變壓器紅外成像中故障點進行判斷。但是,電力設備及水利設施的自動化檢測中,由于圖像運算計算量較大,識別的實時性及準確度都需要進一步提高。因此,在保證目標檢測準確性的同時,提高目標識別的實時性是電力和水利行業(yè)自動檢測系統(tǒng)的發(fā)展方向。
2 總體設計
基于機器視覺的自動監(jiān)測系統(tǒng),主要由圖像采集、圖像處理及圖像輸出部分組成(見圖1)。圖像采集部分會自動獲取監(jiān)測目標圖像,如電力設備的運行中的圖像、水利設施混凝土表面圖像等。圖像傳入系統(tǒng)圖像處理部分進行處理,圖像處理部分一般由滿足算法計算力要求的處理器構(gòu)成。經(jīng)圖像處理計算,需要監(jiān)測目標的位置及類型會在圖像進行標注,經(jīng)輸出部分進行輸出。專業(yè)巡查人員只需對疑似故障地點進行檢查并處理,提高了監(jiān)測實時性,同時降低了漏檢的概率,具有一定的實際意義。
3 相關技術
3.1 機器視覺算法
隨著機器視覺領域近幾年的飛速發(fā)展,基于機器視覺技術的目標檢測速度越來越快,準確度不斷提高。目前有不少較為成熟的目標檢測模型,如Fast CNN、SSD、RetinaNet、YOLO系列算法等。目標檢測算法可以分為one-stage和two-stage兩種類型,two-stage指的是檢測算法需要分兩步完成,首先需要獲取候選區(qū)域,然后進行分類,如R-CNN系列;與之相對的是one-stage檢測,可以理解為一步到位,不需要單獨尋找候選區(qū)域,典型的有SSD/YOLO。one-stage檢測算法具有速度快、計算量小等優(yōu)點,目前應用越來越廣泛。
本文的目標檢測采用了YOLO算法,YOLO算法具有運算速度快、計算量小、識別準確率高等優(yōu)點,是近年來發(fā)展較快的優(yōu)秀算法之一。YOLO算法發(fā)布以來,到目前共有V1到V5等多個模型。YOLO V5模型共有4個版本,可以適應多種計算速度和精度要求。本設計采用了YOLO V5計算模型進行目標檢測。
3.2 YOLO目標檢測模型
YOLO V5目標檢測模型基于pytorch深度學習模型,較之前的檢測模型,是一種易于部署在嵌入式系統(tǒng)中的輕量化目標檢測模型,具有速度快、計算量小、精度較高等特點。YOLO V5主要由backbone、neck、head三部分組成。
模型backbone由CSPNet(跨階局域網(wǎng)絡)實現(xiàn),CSPNet可以有效緩解梯度消失問題,支持特征傳播,減少網(wǎng)絡參數(shù)數(shù)量。Backbone中主要由focus層,卷積層、bottleneckCSP層及SPP層組成,如圖2所示。在模型backbone圖中輸入數(shù)據(jù)為640*640*3,經(jīng)過運算,網(wǎng)絡輸出數(shù)據(jù)尺寸為20*20*1024。
模型的Neck結(jié)構(gòu)是路徑聚合網(wǎng)絡(PANET),PANET基于Mask R-CNN和FPN框架,用于生成特征金字塔。特征金字塔網(wǎng)絡能夠生成多種尺寸的檢測對象,可以較好地解決物體檢測中的多尺度問題,同時不過多地增加模型的計算量,如圖3所示。輸入數(shù)據(jù)會生成多個尺寸的圖像。
YOLO模型使用GIoU作為目標檢測位置預測的損失函數(shù),公式(1)中,A為目標預測框,B為目標真實框,C為包含A和B的最小區(qū)域,公式(2)中,IoU為預測框A與真實框B的交并比。
4 模型訓練
4.1 模型訓練過程
目標檢測模型需要經(jīng)過一定樣本的訓練之后,才能夠有較好的檢測效果。模型訓練過程如圖4所示。模型訓練數(shù)據(jù)集分為訓練集(Train)、訓練測試集(Val)和驗證集(Test)。模型訓練先加載訓練集數(shù)據(jù)進行訓練,訓練完成后需要使用訓練測試集數(shù)據(jù)進行訓練效果驗證。如果訓練效果能夠符合要求,需要使用驗證集的數(shù)據(jù)進行用戶測試。
4.2 數(shù)據(jù)集獲取
數(shù)據(jù)集分為公共數(shù)據(jù)集和自建數(shù)據(jù)集。公共數(shù)據(jù)集較為成熟且數(shù)據(jù)量大。自建數(shù)據(jù)集適用于對特殊目標進行識別訓練。數(shù)據(jù)集的獲取有實地拍攝及網(wǎng)上搜集2種途徑。對于水利設施混凝土裂縫的數(shù)據(jù)集采用實地拍攝的方式獲取(見圖5),對于電力設備故障數(shù)據(jù)集采用實地拍攝和網(wǎng)上搜集相結(jié)合的方式獲取。
4.3 數(shù)據(jù)集標注
對模型進行訓練的數(shù)據(jù)集,需要對數(shù)據(jù)集進行標注之后進行訓練。LabelImg是對目標識別數(shù)據(jù)進行標注的工具軟件,通過labelimg,可以對獲取到的圖像數(shù)據(jù)進行目標標注。標注樣本如圖6所示。
為進一步提高訓練的準確率,對樣本使用數(shù)據(jù)增強技術,通過對樣本進行部分遮擋、反轉(zhuǎn)等進一步擴充數(shù)據(jù)集,以達到更好的訓練效果(見圖7)。
5 結(jié)果及分析
5.1 平臺及訓練過程
本次實驗選用矩池云及Colab云平臺進行訓練,使用平臺環(huán)境為:Xeon E5-2678處理器,64G內(nèi)存,NVIDIA GeForce GTX 2080Ti 16G獨立顯卡。Linux操作系統(tǒng),python3.7,pytorch1.9開發(fā)環(huán)境。
本次訓練使用YOLO V5預訓練目標檢測模型作為知識源,240張數(shù)據(jù)圖片作為訓練集,50張圖片作為測試集,輸入圖像尺寸為640×640,批處理大小設置為16,迭代次數(shù)設置為1500,初始學習率設為0.01,權重衰減率設為0.0005,IoU閾值設為0.5。
5.2 結(jié)果評價
精確率(precision)、召回率(recall)是目標檢測模型的通用評價指標。TP為模型預測為正且預測正確的目標,F(xiàn)P為模型預測為負且預測錯誤的目標,F(xiàn)N為預測為負且預測錯誤的目標。精確率計算公式如式(5)所示。召回率計算公式如式(6)所示。
6 結(jié)論
針對電力設備及水利設施人工檢測困難、效率低、危險系數(shù)高的問題,本文設計了針對電力設備及水利設施自動檢測系統(tǒng)。系統(tǒng)通過數(shù)據(jù)訓練數(shù)據(jù)采集、增強,使用YOLO V5機器視覺模型訓練,得到一種運算量較小、準確率較高的檢測模型。經(jīng)過實際測試,本系統(tǒng)具有成本低、實時性強、性能穩(wěn)定等優(yōu)點,具有一定的使用價值。
【參考文獻】
【1】鄒雷.基于機器視覺的混凝土結(jié)構(gòu)水下表面裂縫檢測技術的研究[D].宜昌:三峽大學,2014.
【2】李若星.基于機器視覺的混凝土裂縫檢測方法的研究[D].重慶:重慶大學,2018.
【3】竇一民.機器學習在輸電系統(tǒng)監(jiān)控圖像中的應用研究[D].濟南:濟南大學,2020.
【4】王斯凡.基于機器視覺的電力設備識別與故障診斷技術研究[D].北京:華北電力大學,2018.
【5】蔣文萍,蔣珍存.基于多重遷移學習的Yolo V5初期火災探測研究[J].消防科學與技術,2021(1):109-112.
【6】王坤,房玉吉,劉華龍,等.基于YOLO-v5和ResNet的艙底水液位識別算法[J].船海工程,2020,49(06):39-43.