• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于融合特征及聚類分析的多尺度電力設(shè)備識(shí)別及定位

      2023-06-22 10:17:05馬靜怡楊金龍
      現(xiàn)代信息科技 2023年3期
      關(guān)鍵詞:特征融合聚類分析電力設(shè)備

      馬靜怡 楊金龍

      摘? 要:為解決數(shù)字圖像中復(fù)雜多目標(biāo)電力設(shè)備的分類識(shí)別與精確定位,提出了一種基于多特征融合與聚類分析的深度神經(jīng)網(wǎng)絡(luò)檢測(cè)模型。該模型通過(guò)跳躍連接的信息通道快連邊緣、角度及語(yǔ)義等多重特征,并通過(guò)階段上采樣融合不同尺度信息,以此構(gòu)建出待檢特征金字塔;然后對(duì)數(shù)據(jù)集進(jìn)行聚類分析,利用金字塔中各尺度網(wǎng)絡(luò)對(duì)原圖像的映射比例計(jì)算出與目標(biāo)最佳適配的區(qū)域生成框,最終得到適用于多尺度電力設(shè)備的檢測(cè)模型。通過(guò)對(duì)比實(shí)驗(yàn)結(jié)果表明,本改進(jìn)方法在檢測(cè)時(shí)能夠保持高精度并具有時(shí)效性,具備一定的工程實(shí)用價(jià)值。

      關(guān)鍵詞:深度學(xué)習(xí);電力設(shè)備;多目標(biāo)檢測(cè);特征融合;聚類分析;神經(jīng)網(wǎng)絡(luò)

      中圖分類號(hào):TP391.4;TP18;TM761? 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-4706(2023)03-0070-05

      Identification and Localization of Multi-Scale Power Equipment Based on Fusion Characteristics and Cluster Analysis

      MA Jingyi, YANG Jinlong

      (Zhengzhou University of Science and Technology, Zhengzhou? 450064, China)

      Abstract: In order to solve the classification identification and precise positioning of complex multi-target power devices in digital images, deep neural network detection model based on multi-feature fusion and clustering analysis is proposed. In this model, the edge, angle and semantic features are connected quickly through the jump-connected information channel, and the different scale information is fused through the stage sampling to construct the Pyramid of features to be examined. Then, the data set is analyzed by clustering, and the region generating frame which best adapts to the target is calculated by using the mapping proportion of the original image to the scale network in the pyramid. Finally, the detection model for multi-scale power equipment is obtained. By comparing the experimental results, it shows that the improved method can maintain high accuracy and timeliness at the time of detection, and has certain engineering practical value.

      Keywords: deep learning; power equipment; multi-object detection; feature fusion; cluster analysis; neural network

      0? 引? 言

      電力設(shè)備是電力系統(tǒng)的重要組成部分,其運(yùn)行狀態(tài)直接決定著電力系統(tǒng)是否能夠安全經(jīng)濟(jì)穩(wěn)定的運(yùn)行[1,2]。近年來(lái),隨著智能化電力系統(tǒng)的建設(shè)與發(fā)展,越來(lái)越多的變電站或野外輸電線路都采用無(wú)人機(jī)[3]、巡檢機(jī)器人等工具對(duì)電力設(shè)備進(jìn)行在線監(jiān)測(cè)[4]。但通過(guò)人工進(jìn)行實(shí)時(shí)圖像監(jiān)測(cè)的方法易受精力等主觀因素影響。因此,采用智能圖像分析技術(shù)自動(dòng)處理非結(jié)構(gòu)化的視頻和圖像數(shù)據(jù)具有重要意義。

      由于圖像采集距離遠(yuǎn)、角度多變且電力設(shè)備分布較密集,導(dǎo)致設(shè)備最終成像的灰度及紋理等視覺(jué)特征不明顯[5],且在尺度和形狀方面存在變化。因此無(wú)法使用依賴人工設(shè)計(jì)先驗(yàn)條件的圖像分割加分類器[6,7]類算法完成多尺度設(shè)備檢測(cè)。

      而另一種通過(guò)組建多層神經(jīng)網(wǎng)絡(luò)模擬人腦的深度學(xué)習(xí)[8-13]類方法,利用逐層的卷積計(jì)算,自行迭代調(diào)整信息權(quán)重以擬合目標(biāo)圖像與其類別的非線性映射,同時(shí)標(biāo)記目標(biāo)位置以實(shí)現(xiàn)定位。其中,F(xiàn)aster RCNN因其高精度而受到許多學(xué)者的青睞。例如:趙振兵等人[14]基于Faster RCNN,提出了使用KL散度作為網(wǎng)絡(luò)訓(xùn)練的損失函數(shù),同時(shí)將數(shù)據(jù)集中不同類別金具的形狀特征作為損失函數(shù)的約束,克服了輸電線路航拍巡檢圖像中金具目標(biāo)間以及金具與背景間的相互干擾。但他們構(gòu)建的數(shù)據(jù)集中的目標(biāo)寬高分布呈線性相關(guān),無(wú)法適用于不同尺度的設(shè)備檢測(cè)。為此,韓松臣[15]等人在使用ResNet[16]作為特征提取網(wǎng)絡(luò)的基礎(chǔ)上提出了一種類似金字塔[17]的特征融合模塊。但未考慮到異階特征層對(duì)原圖的映射比不同,因而忽略了對(duì)生成框的比例設(shè)計(jì),不滿足目標(biāo)生成域的精確度要求。

      針對(duì)上述問(wèn)題,本文針對(duì)現(xiàn)有Faster RCNN提出如下改進(jìn):采用ResNet作為特征提取網(wǎng)絡(luò)并抽取不同尺度特征層構(gòu)建待檢金字塔。同時(shí),根據(jù)計(jì)算得到的不同階網(wǎng)絡(luò)層對(duì)原圖像的映射比,結(jié)合對(duì)實(shí)際圖像中的目標(biāo)尺度的聚類分析[18]結(jié)果,修改每層金字塔中的生成框的尺寸和寬高比。在構(gòu)建的變電站圖像數(shù)據(jù)集中,通過(guò)實(shí)驗(yàn)驗(yàn)證了改進(jìn)方法可實(shí)現(xiàn)對(duì)多尺度設(shè)備的檢測(cè),本文提出的改進(jìn)算法較原Faster RCNN檢測(cè)性能更優(yōu),證明了該方法在工程應(yīng)用中的有效性和可行性。

      1? 改進(jìn)模型算法分析

      1.1? Faster RCNN算法在檢測(cè)小目標(biāo)時(shí)的缺陷

      Faster RCNN是目前主流算法中性能最強(qiáng)的檢測(cè)模型之一,如圖1所示,其檢測(cè)過(guò)程可分為三部分:首先,利用卷積神經(jīng)網(wǎng)絡(luò),通過(guò)對(duì)輸入圖像逐層計(jì)算得到包含位置、形狀、語(yǔ)義等信息的特征圖;隨后,區(qū)域建議網(wǎng)絡(luò)(Region Proposal Network, RPN)接收基礎(chǔ)網(wǎng)絡(luò)最后一次計(jì)算得到的特征圖,在其上利用錨框和非極大值抑制(Non-Maximum Suppression, NMS)[19]等篩選策略得出候選區(qū)域;最后,將各個(gè)候選區(qū)域映射回原特征圖,通過(guò)池化(ROI Pooling)固定尺寸,再輸入子網(wǎng)絡(luò)進(jìn)行目標(biāo)識(shí)別與定位[20,21]。

      由Faster RCNN的檢測(cè)過(guò)程可知,算法并未將輸入圖像的全部區(qū)域視作檢測(cè)對(duì)象,而是利用RPN網(wǎng)絡(luò)篩選出可能存在目標(biāo)的候選域。換言之,RPN的計(jì)算結(jié)果直接決定了哪些區(qū)域能夠參與檢測(cè)。當(dāng)RPN的選擇合理時(shí),這種事先淘汰無(wú)用區(qū)域的方法能夠降低計(jì)算量,提高檢測(cè)效率。但是當(dāng)RPN篩選策略并不合理時(shí),檢測(cè)子網(wǎng)也只能對(duì)RPN提供的候選域進(jìn)行分類和坐標(biāo)回歸。因此,為了保證模型的檢測(cè)性能和效率,需要構(gòu)建一個(gè)合理的區(qū)域建議網(wǎng)絡(luò)。

      由RPN的運(yùn)行過(guò)程可知,生成初步候選域的方法是使用卷積核在特征圖上進(jìn)行滑窗,隨后在原圖中對(duì)應(yīng)位置生成錨框后篩選出前景框。那么影響候選域結(jié)果的兩個(gè)主要因素就是基礎(chǔ)特征圖和錨框[12]。對(duì)這兩個(gè)因素進(jìn)行分析,得到原RPN不適用于多尺度電力設(shè)備識(shí)別與定位的原因有:

      (1)滑窗計(jì)算是在由基礎(chǔ)網(wǎng)絡(luò)計(jì)算得到的最后一層特征圖上進(jìn)行遍歷,由于單層特征圖的感受野是固定的,那么特征圖上每個(gè)單元在原圖上的映射區(qū)域面積就是一個(gè)定值。因?yàn)樘卣鲌D與原圖的映射縮放比例固定,即使錨框的生成設(shè)置是可以人為改動(dòng)的,原圖上劃分的候選域也被限制了檢測(cè)范圍,無(wú)法全面地對(duì)尺度變化大的電力設(shè)備進(jìn)行檢測(cè)。除此之外,因?yàn)榛A(chǔ)網(wǎng)絡(luò)中的下采樣計(jì)算會(huì)損失細(xì)節(jié)信息,所以最后得到的單張?zhí)卣鲌D上可能只保留了較大尺度的目標(biāo)信息,并不利于多尺度目標(biāo)檢測(cè)。

      (2)Faster RCNN中初始的錨框設(shè)置和電力設(shè)備的圖像并不適配,以原始設(shè)置生成的錨框在原圖上的映射框無(wú)法選中完整的目標(biāo),也就無(wú)法獲取正確的候選域,導(dǎo)致模型對(duì)多尺度目標(biāo)的檢測(cè)能力低。

      1.2? 改進(jìn)算法分析

      基于上述分析,本文針對(duì)性地提出兩點(diǎn)改進(jìn):首先,為了解決作為候選域計(jì)算依據(jù)的特征圖尺度單一的問(wèn)題,引入特征金字塔結(jié)構(gòu)。通過(guò)在不同感受野的多層特征圖上進(jìn)行滑窗,在原圖上映射得到多種的候選域,全面覆蓋了目標(biāo)尺度的可能性。然后根據(jù)實(shí)際圖像中電力設(shè)備的成像特點(diǎn),同時(shí)考慮不同特征層與原圖間的映射倍數(shù),設(shè)置合理的錨框生成參數(shù),從而提高模型對(duì)多尺度電力設(shè)備的檢測(cè)能力。為此,本文提出了一種結(jié)合多尺度特征的改進(jìn)區(qū)域建議網(wǎng)絡(luò)。

      1.2.1? 基于特征融合的改進(jìn)網(wǎng)絡(luò)結(jié)構(gòu)

      改進(jìn)的區(qū)域建議網(wǎng)絡(luò)的設(shè)計(jì)思想中并不改變錨框的生成方式,而是通過(guò)構(gòu)建特征金字塔,使用更多尺度的特征圖參與計(jì)算,消除單層特征圖固定感受野造成的限制。對(duì)基礎(chǔ)網(wǎng)絡(luò)ResNet,選擇每個(gè)stage的輸出結(jié)果構(gòu)建特征金字塔。改進(jìn)后的網(wǎng)絡(luò)整體結(jié)構(gòu)如圖2所示。

      改進(jìn)網(wǎng)絡(luò)中,C2~C5為ResNet中每個(gè)stage的輸出,C5經(jīng)過(guò)1×1卷積降維和3×3卷積后得到P5。每一層Pi都由Pi-1逐級(jí)上采樣并融合對(duì)應(yīng)的Ci后得到,其中每次融合后的3×3卷積都是為了緩沖不同層之間的混疊。最后,由P2~P5組成的特征金字塔即為改進(jìn)模型的區(qū)域建議網(wǎng)絡(luò)。

      假設(shè)原圖尺寸為224×224,網(wǎng)絡(luò)各級(jí)的輸出尺寸如表1所示。

      1.2.2? 錨框改進(jìn)措施

      為了根據(jù)目標(biāo)的區(qū)域特點(diǎn)設(shè)計(jì)少而精的錨框,需要先對(duì)目標(biāo)的尺寸進(jìn)行統(tǒng)計(jì)分析。在統(tǒng)計(jì)學(xué)中,能夠清晰、簡(jiǎn)明的表達(dá)某一類數(shù)據(jù)中存在某種共性的計(jì)算方法有描述統(tǒng)計(jì)、推論統(tǒng)計(jì)和聚類分析等。其中,描述統(tǒng)計(jì)傾向于表述數(shù)據(jù)的分布趨勢(shì);推論統(tǒng)計(jì)以統(tǒng)計(jì)結(jié)果為依據(jù),目的是證明或推翻某個(gè)命題;而聚類分析將數(shù)據(jù)分類到不同的簇,簇間數(shù)據(jù)具有強(qiáng)相似性,而簇與簇之間的差異性很大。根據(jù)三種統(tǒng)計(jì)方法的特點(diǎn),顯然聚類分析法更適用于統(tǒng)計(jì)電力設(shè)備目標(biāo)尺寸。

      K-means聚類分析[22]因其算法簡(jiǎn)單有效,且在許多軟件上都有成熟的應(yīng)用而廣受歡迎。算法通過(guò)提前設(shè)置k個(gè)中心,將n個(gè)數(shù)據(jù)對(duì)象歸到距離最近的中心完成聚類。使用K-means聚類分析目標(biāo)框尺寸流程為:

      (1)希望得到的目標(biāo)框類型盡可能的少且覆蓋全面,因此根據(jù)圖像中目標(biāo)區(qū)域特點(diǎn),選擇9個(gè)初始中心點(diǎn),點(diǎn)的坐標(biāo)代表目標(biāo)框的寬和高。

      (2)對(duì)所有樣本計(jì)算其到各中心的歐氏距離,將樣本歸到距離最短的中心所在的類。

      (3)取每一類中的樣本均值作為新一次迭代的初始值,即更新類的中心。

      (4)重復(fù)第(2)(3)步,直到更新后的中心維持不變。

      想要對(duì)目標(biāo)框進(jìn)行聚類分析,首先要統(tǒng)計(jì)數(shù)據(jù),根據(jù)標(biāo)注得到的.xml文件中坐標(biāo)信息可以計(jì)算得到目標(biāo)框的寬高。然后根據(jù)K-means聚類流程進(jìn)行迭代計(jì)算,最后按照提前設(shè)置好的聚類中心個(gè)數(shù),得到九個(gè)目標(biāo)框的寬高如表2所示。

      根據(jù)表中前兩行的數(shù)據(jù)可以計(jì)算得到各類框相應(yīng)的面積和寬高比,計(jì)算結(jié)果如表中第三行和第四行所示??梢钥闯?,目標(biāo)框的寬高比例近似集中于0.24、0.47、2.78和5.37。考慮到區(qū)域建議網(wǎng)絡(luò)中,參與候選域計(jì)算的特征圖有四種尺度,也就是說(shuō)特征圖與原圖之間存在四種放縮比例。因此,只能暫時(shí)選定最符合實(shí)際情況的錨框比例分別{0.2,0.5,2.5,5},然后針對(duì)不同層的特征圖分別進(jìn)行計(jì)算使用所需的錨框大小。

      根據(jù)上述中對(duì)目標(biāo)的聚類結(jié)果,得到了符合電力設(shè)備圖像中目標(biāo)特點(diǎn)的錨框的比例。為了進(jìn)一步得到錨框設(shè)置的大小,需要分別在4個(gè)具有不同感受野的金字塔網(wǎng)絡(luò)上進(jìn)行計(jì)算。根據(jù)原圖上的目標(biāo)框的原始大小,按照每層區(qū)域建議網(wǎng)絡(luò)與原圖之間的放縮倍數(shù),計(jì)算目標(biāo)在特征金字塔上對(duì)應(yīng)的錨框面積大小。計(jì)算過(guò)程如下:

      為了方便計(jì)算,假設(shè)原圖尺寸為224×224,根據(jù)表1可算出P5層中特征圖的尺寸是原圖的1/32。也就是說(shuō)P5上的每個(gè)像素點(diǎn)對(duì)應(yīng)著原圖上49個(gè)像素大小的面積,此時(shí)在原圖上寬高低于7的目標(biāo)信息已經(jīng)在卷積和下采樣的過(guò)程中損失掉了,P5上只存在較大尺寸的目標(biāo)信息。由此可得出,P5上只需要設(shè)置用于檢測(cè)較大物體的錨框,根據(jù)聚類結(jié)果可將尺寸設(shè)置為{16,25}。緊接著P4層由P5融合C4,其感受野大小維持不變。因此P4層的錨框尺寸仍可設(shè)為{16,25}。

      P4在上采樣之后融合C3得到P3,此時(shí)的感受野大小發(fā)生了改變。因?yàn)镃3中包含的中小目標(biāo)的信息量明顯高于C4,而P3又是由全局信息豐富的P4反卷積得到,因此P3上對(duì)中小型目標(biāo)的檢測(cè)能力明顯升高。由相同的理論可以推出,P2層可進(jìn)行對(duì)小尺寸目標(biāo)的檢測(cè)。綜合上述結(jié)論,可將P3和P2中的錨框尺寸分別設(shè)置為{10,16}和{6,10}。

      綜合上述分析可得,對(duì)于改進(jìn)區(qū)域建議網(wǎng)絡(luò)中的每一層特征圖,都有8種錨框。各層中錨框的生成參數(shù)如表3所示。

      2? 實(shí)驗(yàn)設(shè)計(jì)與分析

      2.1? 實(shí)驗(yàn)數(shù)據(jù)集及平臺(tái)

      本文中所使用的源數(shù)據(jù)集是實(shí)地采集的變電站內(nèi)電力設(shè)備圖像,數(shù)據(jù)集中涉及的目標(biāo)類型共9種:電流互感器(CT)、電壓互感器(VT)、絕緣子(Insulator)、隔離開(kāi)關(guān)(Insolating_switch)、變壓器(Transformer)、避雷器(Lightning_arrester)、環(huán)形斷路器(Circuit_breaker)、油枕(Conservator)和套管(Branch_pipe)。分別從不同的角度和距離對(duì)每個(gè)類型的設(shè)備圖像進(jìn)行采集,由于數(shù)據(jù)集的容量遠(yuǎn)遠(yuǎn)低于模型訓(xùn)練的需求量,因此需要通過(guò)平移、翻轉(zhuǎn)、縮放等手段對(duì)原始圖像進(jìn)行樣本擴(kuò)充,數(shù)據(jù)增強(qiáng)后的數(shù)據(jù)集共8 000張。為了訓(xùn)練模型并驗(yàn)證模型性能,需要將數(shù)據(jù)集以隨機(jī)的原則劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集,劃分比例取5:2:3。訓(xùn)練集用于訓(xùn)練模型得到網(wǎng)絡(luò)層權(quán)重,驗(yàn)證集用于調(diào)整訓(xùn)練超參數(shù)以優(yōu)化模型,最后在測(cè)試集上檢測(cè)模型性能。

      在數(shù)據(jù)收集完成后需要對(duì)所有圖像中的目標(biāo)進(jìn)行標(biāo)注,通過(guò)“標(biāo)簽值”讓模型學(xué)習(xí)輸入和輸出之間的映射關(guān)系。LabelImg是開(kāi)源的專用于圖像標(biāo)注的工具,使用方法非常簡(jiǎn)單:對(duì)圖像中的目標(biāo)一一進(jìn)行框選并標(biāo)注,每幅圖像生成一個(gè)儲(chǔ)存著標(biāo)注信息的XML文件,包含有圖像整體大小、所有目標(biāo)的類別信息以及標(biāo)注框的坐標(biāo)信息。標(biāo)注的過(guò)程及結(jié)果如圖3所示。

      本文所使用的硬件環(huán)境為個(gè)人PC端,搭載的CPU處理器型號(hào)為Intel(R)Core(TM)i7-9730H 2.60 GHz,配置

      NVIDIA GEFORCE GTX1660Ti顯卡;軟件環(huán)境為Windows 10+CUDA 10.0+cudnn-v 7.0,Python IDE使用Anaconda 3。

      2.2? 對(duì)比試驗(yàn)設(shè)計(jì)及評(píng)價(jià)指標(biāo)

      為了檢驗(yàn)本文中針對(duì)區(qū)域建議網(wǎng)絡(luò)提出的改進(jìn)措施的有效性,設(shè)計(jì)兩組對(duì)比實(shí)驗(yàn)測(cè)試不同模型的檢測(cè)性能:在分別采用50層和101層網(wǎng)絡(luò)結(jié)構(gòu)的基礎(chǔ)上,對(duì)比Faster RCNN+ResNet和加入特征金字塔的改進(jìn)模型Faster RCNN+P-ResNet。為了控制變量,兩模型中除了本身結(jié)構(gòu)不同以外,訓(xùn)練策略和各個(gè)超參數(shù)全部保持一致。

      因?yàn)镕aster RCNN是個(gè)多任務(wù)網(wǎng)絡(luò)模型,所以往往采用近似聯(lián)合訓(xùn)練以實(shí)現(xiàn)共享網(wǎng)絡(luò)權(quán)重。它將RPN和檢測(cè)子網(wǎng)視作一體進(jìn)行訓(xùn)練,在反向傳播過(guò)程中只傳回分類分支的梯度進(jìn)行訓(xùn)練,舍棄候選域的坐標(biāo)預(yù)測(cè)梯度,以此提高網(wǎng)絡(luò)訓(xùn)練的效率。

      為了純粹比較模型的優(yōu)劣,盡可能地減少在訓(xùn)練過(guò)程中加入tricks。因此訓(xùn)練方式采用小批量梯度下降(Mini-Batch Gradient Descent, MBGD)[23],考慮到樣本總數(shù),設(shè)置每批次訓(xùn)練樣本數(shù)為16。同時(shí),為了提高訓(xùn)練速度并避免訓(xùn)練陷入局部最小,引入動(dòng)量項(xiàng)并固定為0.9。設(shè)置訓(xùn)練的最大迭代次數(shù)為5×104,初始學(xué)習(xí)率為1×10-2,以0.1為調(diào)整倍數(shù)進(jìn)行階梯式衰減。

      常用的模型評(píng)估指標(biāo)有準(zhǔn)確率(Accuracy)、精確率(Precision)以及召回率(Recall)等,式(1)~(3)為:

      (1)

      (2)

      (3)

      其中,P、N分別表示區(qū)域類別為前景和背景;T、F分別表示預(yù)測(cè)結(jié)果正確和預(yù)測(cè)結(jié)果錯(cuò)誤。由公式可看出,準(zhǔn)確率衡量的是正確預(yù)測(cè)數(shù)目占所有觀測(cè)值比重;精確率是針對(duì)所有被模型預(yù)測(cè)為Positive的樣本而言,即在所有被預(yù)測(cè)為正例的樣本中,判斷正確的數(shù)目所占比重;召回率則是在所有真實(shí)值為Positive中,模型正確預(yù)測(cè)所占比重。而在這其中,由于計(jì)算因素的互補(bǔ)性,召回率與精確率兩種指標(biāo)是相互矛盾的,故而研究采用同一類別內(nèi)的平均準(zhǔn)確率(Average Precision, AP)以及不同類別間的平均準(zhǔn)確率均值(mean Average Precision, mAP)作為模型的評(píng)價(jià)指標(biāo)。

      為使衡量標(biāo)準(zhǔn)更加多樣化,降低實(shí)驗(yàn)結(jié)果隨機(jī)性。參考COCO數(shù)據(jù)集衡量標(biāo)準(zhǔn),在使用mAP的基礎(chǔ)上增加交并比(IoU)限制。

      3? 實(shí)驗(yàn)結(jié)果分析

      改進(jìn)算法與原Faster RCNN算法(基礎(chǔ)網(wǎng)絡(luò)分別為ResNet50及ResNet101)在多種交并比閾值下的mAP結(jié)果如表4所示。

      由結(jié)果可以看出,無(wú)論是在哪種交并比取值情況下,加入特征金字塔后的改進(jìn)算法的檢測(cè)精度均優(yōu)于Faster RCNN+ ResNet。分析第一組50層網(wǎng)絡(luò)結(jié)構(gòu)的實(shí)驗(yàn)結(jié)果可知,三種交并比下改進(jìn)算法對(duì)模型檢測(cè)準(zhǔn)確率的提高點(diǎn)分別為1.27%、2.7%和1.38%;分析第二組101層網(wǎng)絡(luò)結(jié)構(gòu)的實(shí)驗(yàn)結(jié)果可知,三種交并比下改進(jìn)算法對(duì)模型檢測(cè)準(zhǔn)確率的提高點(diǎn)分別為1.11%、0.4%和0.96%。由于交并比的取值越大,得到的預(yù)測(cè)框越接近真實(shí)值,預(yù)測(cè)結(jié)果也就越精確。由此可得出推論:本章中提出的改進(jìn)算法Faster RCNN+FSD-ResNet能夠有效地改善模型對(duì)多尺度的目標(biāo)的檢測(cè)能力。

      4? 結(jié)? 論

      針對(duì)Faster RCNN在檢測(cè)多尺度電力設(shè)備時(shí)的缺陷,本研究提出了相應(yīng)的改進(jìn)方法:

      首先,原檢測(cè)模型僅靠特征提取網(wǎng)絡(luò)最后一次卷積計(jì)算得到的結(jié)果生成錨框,而單張?zhí)卣鲌D不僅存在特征不均衡的問(wèn)題,而且以此生成的錨框的檢測(cè)尺度有下限,導(dǎo)致RPN無(wú)法實(shí)現(xiàn)全尺度、多特征的候選區(qū)域列舉。因此,在RPN中引入了特征金字塔結(jié)構(gòu),通過(guò)構(gòu)建多尺度和多層次感受野的區(qū)域建議網(wǎng)絡(luò)并在此之上計(jì)算候選域。

      其次,為了針對(duì)性的檢測(cè)電力設(shè)備,需要根據(jù)實(shí)際的目標(biāo)大小、形狀特點(diǎn)進(jìn)行錨框的生成設(shè)置。結(jié)合統(tǒng)計(jì)學(xué),采用聚類分析法得到目標(biāo)尺度特點(diǎn),而后根據(jù)感受野理論逐層的計(jì)算錨框的基礎(chǔ)大小和變換比例,實(shí)現(xiàn)以任務(wù)為導(dǎo)向的精確檢測(cè)。最后,通過(guò)實(shí)驗(yàn)驗(yàn)證了本章中提出的改進(jìn)方法可以有效地提升模型對(duì)多尺度目標(biāo)的檢測(cè)性能。

      雖然本研究已被證實(shí)能夠有效地提高多目標(biāo)電力設(shè)備的檢測(cè)性能,但仍存在一些可優(yōu)化的問(wèn)題,例如:引入特征融合模塊導(dǎo)致模型復(fù)雜度上升,損失了一部分檢測(cè)效率等。在后續(xù)的工作中,應(yīng)考慮優(yōu)化方法以在保證模型檢測(cè)精度的同時(shí)簡(jiǎn)化網(wǎng)絡(luò)結(jié)構(gòu)。

      參考文獻(xiàn):

      [1] 唐文虎,牛哲文,趙柏寧,等.數(shù)據(jù)驅(qū)動(dòng)的人工智能技術(shù)在電力設(shè)備狀態(tài)分析中的研究與應(yīng)用 [J].高電壓技術(shù),2020,46(9):2985-2999.

      [2] 周俊煌,黃廷城,謝小瑜,等.視頻圖像智能識(shí)別技術(shù)在輸變電系統(tǒng)中的應(yīng)用研究綜述 [J].中國(guó)電力,2021,54(1):124-134+166.

      [3] 林剛,王波,彭輝,等.基于改進(jìn)Faster-RCNN的輸電線巡檢圖像多目標(biāo)檢測(cè)及定位 [J].電力自動(dòng)化設(shè)備,2019,39(5):213-218.

      [4] 陳樹(shù)勇,宋書(shū)芳,李蘭欣,等.智能電網(wǎng)技術(shù)綜述 [J].電網(wǎng)技術(shù),2009,33(8):1-7.

      [5] 章立.可見(jiàn)光圖像弱小目標(biāo)的檢測(cè)與跟蹤研究 [D].西安:西安科技大學(xué),2018.

      [6] 趙振兵,王樂(lè).一種航拍絕緣子串圖像自動(dòng)定位方法 [J].儀器儀表學(xué)報(bào),2014,35(3):558-565.

      [7] 馮玲,黃新波,朱永燦.基于圖像處理的輸電線路覆冰厚度測(cè)量 [J].電力自動(dòng)化設(shè)備,2011,31(10):76-80.

      [8] LECUN Y,BENGIO Y,HINTON G. Deep Learning [J].Nature,2015,521(28):436-444.

      [9] KULKARNI A,CALLAN J. Selective Search [J].ACM Transactions on Information Systems (TOIS),2015,33(4):1-33.

      [10] XIANG P,ZHOU H X,LI H. Hyperspectral anomaly Detection by Local Joint Subspace Process and Support Vector Machine [J].International Journal of Remote Sensing,2020,41(10):3798-3819.

      [11] GIRSHICK R. Fast R-CNN [C]//2015 IEEE International Conference on Computer Vision (ICCV).Santiago:IEEE,2015:1440-1448.

      [12] REN S Q,HE K M,GIRSHICK R,et al. Faster R-CNN:towards Real-Time Object Detection with Region Proposal Networks [J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2017,39(6):1137-1149.

      [13] REDMON J,DIVVALA S,GIRSHICK R,et al. You only Look Once:Unified,Real-Time Object Detection [C]//2016 IEEE Conference on Computer Vision and Pattern Recognition(CVPR).Las Vegas:IEEE,2016:779-788.

      [14] 趙振兵,李延旭,甄珍,等.結(jié)合KL散度和形狀約束的Faster R-CNN典型金具檢測(cè)方法 [J].高電壓技術(shù),2020,46(9):3018-3026.

      [15] 韓松臣,張比浩,李煒,等.基于改進(jìn)Faster-RCNN的機(jī)場(chǎng)場(chǎng)面小目標(biāo)物體檢測(cè)算法 [J].南京航空航天大學(xué)學(xué)報(bào),2019,51(6):735-741.

      [16] HE K,ZHANG X Y,REN S Q,at al. Deep Residual Learning for Image Recognition [C]//2016 IEEE Conference on Computer Vision and Pattern Recognition(CVPR).Las Vegas:IEEE,2016:770-778.

      [17] LIN T Y,DOLL?R P,GIRSHICK R,et al. Feature Pyramid Networks for Object Detection [C]//2017 IEEE Conference on Computer Vision and Pattern Recognition(CVPR).Honolulu:IEEE,2017:936-944.

      [18] 馬秀麟,姚自明,鄔彤,等.數(shù)據(jù)分析方法及應(yīng)用——基于SPSS和EXCEL環(huán)境 [M].北京:人民郵電出版社,2015.

      [19] NEUBECK A,GOOL L V. Efficient Non-Maximum Suppression [C]//18th International Conference on Pattern Recognition(ICPR'06).Hongkong:IEEE,2006:850-855.

      [20] LONG J,SHELHAMER E,DARRELL T. Fully Convolutional Networks for Semantic Segmentation [C]//2015 IEEE Conference on Computer Vision and Pattern Recognition(CVPR).Boston:IEEE,2015:3431-3440

      [21] KRIZHEVSKY A,SUTSKEVER I,HINTON G E. Imagenet Classification with Deep Convolutional Neural Networks [J].Communications of the ACM,2017,60(6):84-90.

      [22] 張建萍,劉希玉.基于聚類分析的K-means算法研究及應(yīng)用 [J].計(jì)算機(jī)應(yīng)用研究,2007(5):166-168.

      [23] RUDER S. An Overview of Gradient Descent Optimization Algorithms [J/OL].arXiv:1609.04747 [cs.LG].[2022-09-03].https://arxiv.org/abs/1609.04747.

      作者簡(jiǎn)介:馬靜怡(1995—),女,漢族,四川巴中人,助教,碩士,研究方向:目標(biāo)檢測(cè);楊金龍(1990—),男,漢族,河南鶴壁人,助教,碩士,研究方向:精密儀器測(cè)量。

      收稿日期:2022-10-19

      猜你喜歡
      特征融合聚類分析電力設(shè)備
      加強(qiáng)電力設(shè)備運(yùn)維云平臺(tái)安全性管理
      基于移動(dòng)端的樹(shù)木葉片識(shí)別方法的研究
      科技資訊(2017年11期)2017-06-09 18:28:13
      基于SIFT特征的港口內(nèi)艦船檢測(cè)方法
      融合整體與局部特征的車輛型號(hào)識(shí)別方法
      農(nóng)村居民家庭人均生活消費(fèi)支出分析
      基于省會(huì)城市經(jīng)濟(jì)發(fā)展程度的實(shí)證分析
      基于聚類分析的互聯(lián)網(wǎng)廣告投放研究
      科技視界(2016年20期)2016-09-29 12:32:48
      電力設(shè)備運(yùn)維管理及安全運(yùn)行探析
      “縣級(jí)供電企業(yè)生產(chǎn)經(jīng)營(yíng)統(tǒng)計(jì)一套”表輔助決策模式研究
      基于壓縮感知的電力設(shè)備視頻圖像去噪方法研究
      嘉义县| 侯马市| 疏附县| 汉川市| 江津市| 虹口区| 措美县| 射阳县| 昭通市| 绍兴市| 巫溪县| 石柱| 榆社县| 平邑县| 玛多县| 东台市| 南江县| 印江| 天峨县| 临汾市| 通河县| 镇安县| 江华| 清镇市| 出国| 丁青县| 朝阳县| 济南市| 厦门市| 鄂尔多斯市| 天镇县| 平昌县| 大洼县| 松滋市| 澄江县| 正宁县| 工布江达县| 玛沁县| 杭锦后旗| 达日县| 宽甸|