• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于深度神經(jīng)網(wǎng)絡(luò)的電氣元件符號(hào)識(shí)別算法

      2022-03-15 05:37:36江再玉石文娟程瑛穎
      關(guān)鍵詞:元件卷積聚類

      江再玉,石文娟,馬 晶,程瑛穎

      (1.北京中電普華信息技術(shù)有限公司,北京 100085;2.國(guó)網(wǎng)重慶市電力公司營(yíng)銷服務(wù)中心,重慶 401121)

      圖紙中電氣符號(hào)識(shí)別的主體是以電氣設(shè)施原理圖為主要形式的電氣圖紙,識(shí)別對(duì)象主要是圖紙中的電氣元件,例如主變壓器、電流互感器、電壓互感器和電能表等。目前,在電網(wǎng)公司業(yè)擴(kuò)報(bào)裝的過(guò)程中,設(shè)計(jì)圖紙的審查環(huán)節(jié)需要對(duì)電氣圖紙中的元件以及標(biāo)注信息進(jìn)行識(shí)別,但是人工識(shí)別工作流程周期長(zhǎng),方案及設(shè)計(jì)審查依賴于業(yè)務(wù)人員對(duì)專業(yè)知識(shí)和經(jīng)驗(yàn)的掌握,效率低下。因此,急需一種高效的自動(dòng)化識(shí)別算法。

      現(xiàn)階段對(duì)于電氣元件符號(hào)的識(shí)別方法主要有2種方法:一種方法是通過(guò)圖元分割的方式對(duì)電氣元件進(jìn)行分割和匹配[1-4],這類方法的局限性在于會(huì)混淆具有相似的圖元構(gòu)成的電氣符號(hào);另一種方法是通過(guò)計(jì)算電氣符號(hào)的局部特征來(lái)識(shí)別電氣符號(hào)的類型[5-7],例如 SIFT[8]、LBP[9]和 HOG[10]。但上述方法都存在一個(gè)共同的問題,同種電氣元件可能會(huì)存在多種表示形式,另外技術(shù)人員在繪制圖紙時(shí)也會(huì)有不同的習(xí)慣,這就會(huì)造成同一類電氣元件會(huì)衍生出多種類型的表示方式,而上述方法對(duì)于同類電氣符號(hào)的不同表示形式的泛化能力較弱,很大程度上限制了算法在工程場(chǎng)景中的性能。卷積神經(jīng)網(wǎng)絡(luò)因其可以自主完成對(duì)目標(biāo)特征的提取和學(xué)習(xí),具有較強(qiáng)的魯棒性和泛化能力,成為目標(biāo)檢測(cè)領(lǐng)域的主流算法。有學(xué)者應(yīng)用LeNet-5、AlexNet、GoogLeNet和VggNet等網(wǎng)絡(luò)對(duì)手寫符號(hào)分類,相比于使用HOG等基于手工特征提取的識(shí)別算法,在缺乏色彩特征和紋理特征的手寫符號(hào)上具有很大的優(yōu)勢(shì)[11-12]。

      近年來(lái),以 Fast R-CNN[13]、Faster R-CNN[14-15]、SSD[16]、YOLOv3[17]等算法作為典型代表的深度卷積神經(jīng)網(wǎng)絡(luò)發(fā)展迅速,其中YOLOv3因兼具精度與速度優(yōu)勢(shì),在工業(yè)界得到了廣泛應(yīng)用。因此,本文提出一種基于YOLOv3的電氣符號(hào)識(shí)別算法和基于冗余的圖像預(yù)處理算法,能夠?qū)﹄姎庠?hào)進(jìn)行高精度的識(shí)別。

      本文的主要貢獻(xiàn)在于提出了使用深度卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行電氣圖紙中元件識(shí)別的新思路,搭建了全新的特征融合網(wǎng)絡(luò),并且采用K-means++聚類算法優(yōu)化了網(wǎng)絡(luò)參數(shù)。另外,還提出了一種針對(duì)于任意大尺寸圖片分割的預(yù)處理算法以及對(duì)應(yīng)的非極大值抑制NMS(non-maximum suppression)算法[18]。

      1 相關(guān)工作

      1.1 傳統(tǒng)電氣符號(hào)識(shí)別算法

      早期對(duì)于電氣圖紙中電氣符號(hào)的識(shí)別主要是通過(guò)將電氣符號(hào)抽象成各種幾何圖元,建立對(duì)應(yīng)的拓?fù)?,將目?biāo)元件的拓?fù)渑c標(biāo)準(zhǔn)拓?fù)溥M(jìn)行比對(duì)來(lái)實(shí)現(xiàn)電氣符號(hào)的識(shí)別。文獻(xiàn)[1]中所述方法將幾何圖元?dú)w為一個(gè)集合{圓,水平線,垂直線,斜線,矩形,半圓,文字},圖元之間的關(guān)系也歸為一個(gè)集合{包含,相交,貫穿,分離},之后將元件抽象成圖元和圖元間關(guān)系的鏈表,通過(guò)判斷拓?fù)涫欠翊嬖谕瑯?gòu)關(guān)系來(lái)進(jìn)行分類,但所提方法對(duì)于圖元的劃分較為粗糙,對(duì)于結(jié)構(gòu)復(fù)雜的元件進(jìn)行圖元提取時(shí)容易損失關(guān)鍵信息;在此基礎(chǔ)上,文獻(xiàn)[2]對(duì)圖元關(guān)系之間的分類進(jìn)行了細(xì)化,增強(qiáng)了圖元對(duì)于元件的表示能力,同時(shí)采用Ullman算法來(lái)進(jìn)行圖元拓?fù)涞膱D元計(jì)算;而文獻(xiàn)[3]在圖元拓?fù)涞钠ヅ渖咸岢龈蛹?xì)粒度的方法,提出了基于圖元數(shù)目、圖元類型、圖元交點(diǎn)數(shù)目、圖元交角、圖元交點(diǎn)位置和圖元位置關(guān)系的多角度相似度計(jì)算方法,很大程度地增強(qiáng)了圖元拓?fù)涞钠ヅ渚?;文獻(xiàn)[4]則使用決策樹來(lái)對(duì)元件類型進(jìn)行分類,集成了基于特征分類和基于相似性識(shí)別方法的優(yōu)點(diǎn)。但是對(duì)于結(jié)構(gòu)復(fù)雜的元件,所抽象出的元件拓?fù)湟?guī)模變大,在進(jìn)行圖元的同構(gòu)判別是會(huì)帶來(lái)很大的計(jì)算量,識(shí)別速度明顯下降,同時(shí)這種方法只能識(shí)別單個(gè)獨(dú)立的原件,無(wú)法在整幅圖紙上進(jìn)行識(shí)別,較難進(jìn)行實(shí)際應(yīng)用。文獻(xiàn)[5-6]則提出了另外一種不同的思路,采用計(jì)算機(jī)視覺中所用的一種局部特征描述子HOG來(lái)進(jìn)行電氣元件的判別。HOG特征是通過(guò)計(jì)算局部在各個(gè)方向上的梯度來(lái)提取局部信息構(gòu)建成特征向量,采用SVM對(duì)特征進(jìn)行分類。文獻(xiàn)[7]則采用了分層梯度方向直方圖PHOG(pyramid histogram of oriented gradient)來(lái)提取局部特征,主體方法是利用Canny算子提取圖像的邊緣信息,在提取到的邊緣區(qū)域來(lái)提取HOG特征。這種方法預(yù)選對(duì)提取特征的區(qū)域進(jìn)行了篩選,集中注意到邊緣區(qū)域,既減少了無(wú)關(guān)區(qū)域的特征提取,減少了計(jì)算量,同時(shí)融入了邊緣信息,增強(qiáng)了空間表示能力。但HOG和PHOG描述子提取的特征向量維度較大,在識(shí)別大尺寸圖片是時(shí)間成本高,同時(shí)在多尺度上的識(shí)別能力較弱。

      文獻(xiàn)[11]考慮到手寫符號(hào)圖像具有缺乏色彩特征和紋理特征的特性,在淺層卷積中使用了大尺寸的卷積核來(lái)提取結(jié)構(gòu)特征,相比于原有的小尺寸卷積核,減少了卷積過(guò)程中的信息損失;文獻(xiàn)[12]則對(duì)比了多種主流的卷積神經(jīng)網(wǎng)絡(luò),驗(yàn)證了其在手寫字符分類任務(wù)上的可行性。雖然文獻(xiàn)[11-12]只針對(duì)于手寫符號(hào)的分類任務(wù),但電氣符號(hào)與手寫符號(hào)類似,同樣缺乏色彩和紋理特征,因此對(duì)于本文所針對(duì)的電氣符號(hào)識(shí)別具有借鑒意義。

      1.2 YOLOv3目標(biāo)檢測(cè)算法

      相比于第1.1節(jié)中所提到的傳統(tǒng)方法,基于深度卷積神經(jīng)網(wǎng)絡(luò)的YOLOv3在特征提取和多尺度檢測(cè)上具有很大的優(yōu)勢(shì)。YOLOv3是在YOLOv2的基礎(chǔ)上進(jìn)行改進(jìn)的單階段目標(biāo)檢測(cè)算法,使用了Darknet-53作為骨干網(wǎng)絡(luò)。應(yīng)用了大量3×3和1×1的卷積層來(lái)代替原有的全連接層和池化層,有效減少了參數(shù)規(guī)模,同時(shí)為了避免過(guò)深的網(wǎng)絡(luò)結(jié)構(gòu)會(huì)產(chǎn)生梯度爆炸的現(xiàn)象,在網(wǎng)絡(luò)中添加了大量的殘差塊,網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。

      圖1 Darknet-53網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 Structure of Darknet-53 network

      為了提升在多尺度目標(biāo)上的檢測(cè)精確度,YOLOv3在生成特征圖進(jìn)行預(yù)測(cè)時(shí)吸取了特征金字塔網(wǎng)絡(luò)FPN(feature pyramid network)[19]的思想來(lái)實(shí)現(xiàn)多尺度檢測(cè),在大、中、小3種尺度(P1:52×52,P2:26×26,P3:13×13)的特征圖上進(jìn)行預(yù)測(cè),能夠兼顧大尺寸特征圖中的低層語(yǔ)義信息和小尺寸特征圖中的高層語(yǔ)義信息,其網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。同時(shí)在每個(gè)特征圖上都預(yù)選設(shè)置3種不同的錨框,共9種不同的尺寸匹配可能出現(xiàn)的各種大小的目標(biāo)。

      圖2 特征金字塔網(wǎng)絡(luò)Fig.2 Feature pyramid network

      YOLOv3算法會(huì)將輸入的圖像劃分為S×S的網(wǎng)格,每個(gè)網(wǎng)格預(yù)測(cè)B個(gè)邊界框來(lái)對(duì)C類目標(biāo)進(jìn)行預(yù)測(cè),網(wǎng)絡(luò)會(huì)對(duì)預(yù)測(cè)出每一個(gè)邊界框置信度,置信度由網(wǎng)格中包含目標(biāo)的概率和邊界框的準(zhǔn)確度兩部分組成,表示為

      式中:rconf為邊界框的置信度;Pr(obj)為網(wǎng)格中包含目標(biāo)的概率;為邊界框的準(zhǔn)確度,即預(yù)測(cè)邊界與真實(shí)邊界的交并比。

      每一個(gè)網(wǎng)格中預(yù)測(cè)的類別置信度為

      式中,i=1,2,…,t,t為檢測(cè)類別數(shù)。

      在經(jīng)過(guò)設(shè)定閾值過(guò)濾和非極大值抑制后,預(yù)測(cè)網(wǎng)絡(luò)最終輸出預(yù)測(cè)框的5個(gè)預(yù)測(cè)參數(shù)中心點(diǎn)坐標(biāo)(x,y)、預(yù)測(cè)框的寬高(w,h)和rconf,以及C個(gè)類別標(biāo)簽,因此網(wǎng)絡(luò)的輸出大小為SSB(5+C)。

      YOLOv3的損失函數(shù)主要由3部分組成,分別為位置坐標(biāo)損失、置信度損失和類別損失,計(jì)算公式為

      2 基于YOLOv3的電氣符號(hào)識(shí)別算法

      相比于傳統(tǒng)電氣符號(hào)識(shí)別算法,基于深度神經(jīng)網(wǎng)絡(luò)的方法提取特征的能力優(yōu)勢(shì)明顯,但針對(duì)本文所提出的場(chǎng)景,YOLOv3在網(wǎng)絡(luò)超參數(shù)的設(shè)置、特征融合網(wǎng)絡(luò)以及數(shù)據(jù)預(yù)處理方面仍有不足。因此,對(duì)于基準(zhǔn)算法存在的這些問題,本文做出了針對(duì)性改進(jìn),包括對(duì)訓(xùn)練數(shù)據(jù)標(biāo)簽進(jìn)行聚類來(lái)優(yōu)化訓(xùn)練過(guò)程,構(gòu)建了新的特征融合網(wǎng)絡(luò),基于數(shù)據(jù)冗余的圖片預(yù)處理算法,以及與之相應(yīng)的改進(jìn)NMS篩選算法。

      2.1 錨框尺寸先驗(yàn)值聚類

      在YOLOv3中,F(xiàn)PN會(huì)輸出3種不同尺寸的特征圖,每一種特征圖設(shè)置3種錨框,共設(shè)置了9種不同尺寸和比例的錨框來(lái)預(yù)測(cè)目標(biāo)的位置,為了使網(wǎng)絡(luò)在訓(xùn)練時(shí)能夠平穩(wěn)快速地收斂,需要為錨框的尺寸設(shè)置一個(gè)初始值,初始值設(shè)置的與實(shí)際識(shí)別目標(biāo)的尺寸吻合程度越高,網(wǎng)絡(luò)訓(xùn)練的效果就會(huì)越好。YOLOv3中原有的錨框是根據(jù)公開數(shù)據(jù)集VOC Pascal來(lái)設(shè)置的,并不適合本文中所針對(duì)的電氣符號(hào)數(shù)據(jù)集。因此本文采用K-means++聚類算法[20]對(duì)訓(xùn)練集標(biāo)簽進(jìn)行聚類的辦法來(lái)確定網(wǎng)絡(luò)中錨框的尺寸。

      原有的K-means聚類算法隨機(jī)選取9個(gè)點(diǎn)作為聚類中心,這種方法存在較大的偶然性,無(wú)法保證得到的聚類結(jié)果是最優(yōu)解。K-means++聚類算法在聚類中心的選取上進(jìn)行了優(yōu)化,降低了聚類結(jié)果的隨機(jī)性,選取方法步驟如下。

      步驟1從候選數(shù)據(jù)集中隨機(jī)選取1個(gè)數(shù)據(jù)點(diǎn)作為第一個(gè)初始聚類中心c1。

      步驟2計(jì)算其他每一個(gè)樣本點(diǎn)(xi,yi)與聚類中心(xc,yc)的歐氏距離D(x)和每一個(gè)樣本點(diǎn)被選為聚類中心的概率P(x),即

      選取概率最大的點(diǎn)作為下一個(gè)聚類中心。

      步驟3重復(fù)步驟2,直到選擇出9個(gè)初始聚類中心。

      步驟4選取初始聚類中心后的過(guò)程與K-means聚類算法一致,將每一個(gè)樣本點(diǎn)分配給距其最近的聚類中心,劃分成初始簇,之后重新計(jì)算每個(gè)簇的質(zhì)心作為新的聚類中心,不斷迭代,直到簇不再發(fā)生變化或者達(dá)到最大迭代次數(shù)為止。

      經(jīng)過(guò)K-means++聚類算法得到9個(gè)聚類中心點(diǎn)后,按照聚類中心點(diǎn)長(zhǎng)和寬的乘積從小到大進(jìn)行排序,并按照大小分為3組,分別對(duì)應(yīng)FPN中、大、小不同的3種特征圖。

      2.2 自下而上的特征融合網(wǎng)絡(luò)

      在電氣符號(hào)數(shù)據(jù)集中,很多不同類型的符號(hào)具有相似的邊緣輪廓特征,但內(nèi)部細(xì)節(jié)特征存在差異,一些典型的電氣符號(hào)如圖3所示。以電流互感器、電壓互感器以及變壓器為例,這3類符號(hào)都是有多個(gè)圓形部分組成,在排列方式以及內(nèi)部特征上略有不同。所以在這類元件中存在部分誤識(shí)別的情況。

      圖3 電氣符號(hào)示例Fig.3 Examples of electrical symbols

      在YOLOv3中,應(yīng)用了特征金字塔網(wǎng)絡(luò)來(lái)實(shí)現(xiàn)多尺度特征融合,構(gòu)建了“自下而上”和“自上而下”2條路徑的網(wǎng)絡(luò)結(jié)構(gòu),將深層特征經(jīng)過(guò)上采樣與淺層特征進(jìn)行融合,豐富淺層特征的語(yǔ)義信息。對(duì)P1、P2、P3所輸出預(yù)測(cè)框的數(shù)量進(jìn)行統(tǒng)計(jì),P2和P3分別貢獻(xiàn)了32%和42%的預(yù)測(cè)框。但P3只包含C3的特征,P2只包含P3和C2的特征,沒有使用到C1中所包含的淺層細(xì)節(jié)信息,無(wú)法考慮到不同類別的元件之間產(chǎn)生誤識(shí)別的情況。

      針對(duì)原有模型中存在的問題,本文提出了一種全新的特征金字塔網(wǎng)絡(luò),構(gòu)建了2條“自下而上”的路徑,網(wǎng)絡(luò)結(jié)構(gòu)如圖4所示。

      圖4 自下而上的特征金字塔網(wǎng)絡(luò)Fig.4 Feature pyramid network with bottom-up pathway

      自下而上的路線將包含更多細(xì)節(jié)信息的淺層特征圖進(jìn)行下采樣,然后與深層特征圖進(jìn)行合并,來(lái)豐富深層特征中的細(xì)節(jié)信息,強(qiáng)化深層特征中的細(xì)節(jié)信息,有利于提升網(wǎng)絡(luò)的分類精度。具體來(lái)說(shuō),首先使用3×3、步長(zhǎng)為2的卷積操作來(lái)實(shí)現(xiàn)下采樣,再使用1×1卷積進(jìn)行通道對(duì)齊。特征圖合并則是采用像素點(diǎn)相加的方式,即

      式中:down(Pi-1,size)為下采樣函數(shù);size為輸出尺寸;conv(Ci)中卷積核大小為1×1、步長(zhǎng)為1;θ為特征圖的權(quán)重因子,一般情況下取0.5[19]。

      2.3 基于數(shù)據(jù)冗余的圖像分割算法

      深度神經(jīng)網(wǎng)絡(luò)對(duì)于輸入數(shù)據(jù)的尺寸有固定限制,雖然可以通過(guò)圖像的放縮和比例修正使圖片的尺寸滿足網(wǎng)絡(luò)的輸入要求,但會(huì)引起原有圖像比例的改變和數(shù)據(jù)損失。本文所使用的電氣元件數(shù)據(jù)集與傳統(tǒng)的圖像數(shù)據(jù)集不同,電氣元件在圖紙上不存在由于透視導(dǎo)致的形態(tài)變化和遮擋重疊等特殊情況,而圖像比例的改變可能會(huì)對(duì)目標(biāo)的識(shí)別和類別判斷產(chǎn)生影響。

      為了解決大尺寸圖紙的識(shí)別問題,本文提出了一種基于數(shù)據(jù)冗余的圖片切割算法[21],在不改變網(wǎng)絡(luò)輸入且不改變圖片原有比例的條件下,將輸入圖片切割成多張子圖,分別進(jìn)行識(shí)別以提升檢測(cè)器的識(shí)別精度。而簡(jiǎn)單的切割圖片容易將識(shí)別目標(biāo)切割成兩部分,不完整的元件有可能會(huì)造成誤識(shí)別、漏識(shí)別或重復(fù)識(shí)別,因此采用冗余分割的方法對(duì)輸入數(shù)據(jù)進(jìn)行預(yù)處理,可以保證任何一個(gè)目標(biāo)元件都至少完整地出現(xiàn)在一張子圖中。

      算法實(shí)現(xiàn)細(xì)節(jié)如下。原圖片尺寸為W×H,子圖尺寸等于網(wǎng)絡(luò)輸入尺度為w×h,在本文所提出方法中為512×512。對(duì)于橫向切割次數(shù)Cx(Cx>0)、縱向切割次數(shù)Cy(Cy>0)和冗余寬度Rw、冗余高度Rh,為了盡可能保證每一個(gè)目標(biāo)元件都被完整地分割到一張子圖中,Rw、Rh需要盡可能地大于所有目標(biāo)的尺寸,因此本文應(yīng)用到第2.1節(jié)中的標(biāo)簽聚類結(jié)果,取聚類得到的9個(gè)錨框中尺寸最大值(Aw,Ah),冗余切割方式如圖5所示。

      冗余寬度和冗余高度的取值范圍滿足

      式中,Cx和Cy分別為橫向切割次數(shù)和縱向切割次數(shù)。計(jì)算流程如下。

      (1)以橫向切割次數(shù)Cx為例,Cx的初值取,代入式(9)求得 Rw。若 Rw滿足式(7),則輸出Cx和Rw;若不滿足式(7),則Cx=Cx+1,再次代入式(9),直到 Rw滿足式(7)。

      (3)將每一張子圖分別輸入到網(wǎng)絡(luò)中進(jìn)行識(shí)別,得到初始識(shí)別結(jié)果集

      對(duì)于從各子圖得到的檢測(cè)結(jié)果集合S,還需要篩選其中重復(fù)的檢測(cè)框,本文使用改進(jìn)的非極大值抑制算法來(lái)篩選的重復(fù)檢測(cè)框。傳統(tǒng)的非極大值抑制算法只需要計(jì)算兩個(gè)候選框的交并比IOU(intersection over union),計(jì)算公式為

      當(dāng)兩候選框的IOU大于閾值y1(y1=0.7) 時(shí),保留其中得分較高的候選框,但在本文所使用的基于冗余的數(shù)據(jù)分割預(yù)處理算法中,會(huì)出現(xiàn)如圖6所示的情況。

      圖6 篩選候選框Fig.6 Filter bounding box

      在圖6所示的情況中,顯然候選框a與候選框b的IOU小于閾值y1,但實(shí)際上,兩候選框只應(yīng)保留候選框a,因此在計(jì)算兩候選框IOU符合條件y1>IOU>0時(shí),進(jìn)一步計(jì)算其IOE(intersection over each),即

      設(shè)置閾值y2(y2=0.8) ,若 IOUa>y2,則剔除候選框a;若IOUb>y2,則剔除候選框b,如圖5所示的情況,IOU≈0.3,IOEa≈0.3,IOEb=1,那么根據(jù)本文提出的改進(jìn)NMS算法,候選框b將會(huì)被剔除。

      3 實(shí)驗(yàn)結(jié)果分析

      3.1 數(shù)據(jù)預(yù)處理

      在使用實(shí)驗(yàn)數(shù)據(jù)進(jìn)行模型訓(xùn)練之前,首先要對(duì)數(shù)據(jù)集進(jìn)行預(yù)處理,避免無(wú)關(guān)因素對(duì)于模型訓(xùn)練的干擾。由于在識(shí)別電氣符號(hào)時(shí),只需考慮符號(hào)的形態(tài)特征,而不關(guān)心其色彩特征,因此為了消除色彩特征的干擾,本文首先將彩色圖轉(zhuǎn)化成灰度圖,再采用二值化的方式對(duì)原始數(shù)據(jù)進(jìn)行去噪,設(shè)置閾值C=155,將灰度值小于閾值的像素點(diǎn)都置為0,灰度值大于閾值的像素點(diǎn)都置為255。

      3.2 數(shù)據(jù)及實(shí)驗(yàn)參數(shù)設(shè)置

      在使用基于深度學(xué)習(xí)的算法來(lái)解決目標(biāo)檢測(cè)問題的過(guò)程中,訓(xùn)練集的選擇與標(biāo)簽的制作對(duì)于模型的訓(xùn)練效果影響巨大。本文在實(shí)驗(yàn)中所使用的數(shù)據(jù)來(lái)自于國(guó)網(wǎng)某地區(qū)部分變電站的電氣圖紙。數(shù)據(jù)集中包含原始圖紙共276張,共提取到圖片3 453張,其中3 108張作為訓(xùn)練集,345張作為測(cè)試集。

      本文所述實(shí)驗(yàn)的實(shí)驗(yàn)環(huán)境使用Intel Xeon(R)E5 2678 v3處理器、NVIDIA GeForce RTX 2080Ti顯卡,在Ubuntu 18.04系統(tǒng)下進(jìn)行實(shí)驗(yàn),使用CUDA10.0、cuDNN7.2調(diào)用顯卡進(jìn)行加速。

      模型的輸數(shù)據(jù)尺寸設(shè)置為640×640;訓(xùn)練時(shí)將16個(gè)樣本作為一個(gè)batch,在每一次更新權(quán)重時(shí)使用BN(batch normalization)進(jìn)行正則化,降低模型訓(xùn)練的復(fù)雜度,模型訓(xùn)練初始學(xué)習(xí)率設(shè)置為0.000 1。

      3.3 實(shí)驗(yàn)評(píng)價(jià)指標(biāo)

      本文采用客觀實(shí)驗(yàn)指標(biāo)來(lái)評(píng)估算法的性能,使用準(zhǔn)確率(precision)和召回率(recall)以及平均AP值mAP(mean average precision)來(lái)評(píng)估實(shí)驗(yàn)結(jié)果。另外對(duì)于不同聚類方法采用輸出正確預(yù)測(cè)框與真實(shí)標(biāo)簽的平均交并比TPAIOU(true positive average intersection over union)來(lái)進(jìn)行評(píng)估,計(jì)算公式為

      式中:TP為識(shí)別正確的預(yù)測(cè)框數(shù)量;IOU(pi,G) 為識(shí)別正確的預(yù)測(cè)框pi與其對(duì)應(yīng)的真實(shí)標(biāo)簽的交并比,用于衡量預(yù)測(cè)框與真實(shí)標(biāo)簽的吻合程度。

      3.4 實(shí)驗(yàn)結(jié)果對(duì)比

      為進(jìn)一步驗(yàn)證本文提出方法的有效性,需要在對(duì)比實(shí)驗(yàn)結(jié)果的基礎(chǔ)上分析。首先對(duì)先驗(yàn)錨框的聚類結(jié)果進(jìn)行實(shí)驗(yàn),在相同的訓(xùn)練參數(shù)下,分別采用機(jī)器學(xué)習(xí)中常用的譜聚類(spectral clustering)[22]、層次聚類(hierarchical clustering)[23],利用層次方法的平衡迭代規(guī)約和聚類(BIRCH clustering)[24]、混合高斯模型聚類(Gaussian mixture model clustering)、K-means聚類算法與本文所使用的K-means++聚類算法的聚類結(jié)果進(jìn)行對(duì)比。使用不同聚類方法得到的錨框作為預(yù)測(cè)框回歸時(shí)的初始大小,分別計(jì)算準(zhǔn)確率、召回率和TPAIOU,結(jié)果如表1所示。

      表1 不同聚類方法的實(shí)驗(yàn)結(jié)果Tab.1 Experimental results of different clustering methods

      通過(guò)對(duì)比不同聚類算法的實(shí)驗(yàn)結(jié)果分析,錨框的優(yōu)化可以在一定程度上提升檢測(cè)算法的精度,而更加重要的貢獻(xiàn)在于有效地提升了預(yù)測(cè)框與真實(shí)標(biāo)簽的吻合程度。

      本文統(tǒng)計(jì)了改進(jìn)特征融合網(wǎng)絡(luò)中各層特征圖所提供的預(yù)測(cè)框的占比,與原始FPN的對(duì)比結(jié)果如表2所示。

      表2 FPN中各層提供的預(yù)測(cè)框比例Tab.2 Proportion of prediction boxes provided by each layer in FPN

      從統(tǒng)計(jì)結(jié)果可知,P2和P3層對(duì)于網(wǎng)絡(luò)的預(yù)測(cè)起到主要作用,將淺層特征圖中的信息融合到深層特征中后,能夠有效地提升P2和P3層中所提取到的特征質(zhì)量,相比于原始FPN,P2和P3所提供預(yù)測(cè)框的比例分別提高5%和7%,mAP提升了2%,這一結(jié)果印證了深層特征在融合淺層信息之后具有更強(qiáng)的特征提取能力。

      表3對(duì)比了不進(jìn)行圖片分割、無(wú)冗余分割以及冗余分割的識(shí)別結(jié)果。不進(jìn)行分割的識(shí)別結(jié)果明顯低于圖片分割的識(shí)別精度,原因是直接將原始圖片下采樣到網(wǎng)絡(luò)輸入的尺度,會(huì)損失原圖中很多信息。而在進(jìn)行冗余分割之后,會(huì)避免因?yàn)槟繕?biāo)被分割所引起的誤識(shí)別、漏識(shí)別以及重復(fù)識(shí)別的出現(xiàn)。

      表3 不同分割方式的實(shí)驗(yàn)結(jié)果Tab.3 Experimental results of different segmentation methods

      本文還對(duì)比了一些傳統(tǒng)方法以及主流的單階段方法,如表4所示,可見在不同指標(biāo)上都有所提升。

      從表4中的結(jié)果可以看出,傳統(tǒng)圖像識(shí)別算法在這項(xiàng)工作的表現(xiàn)上存在較大缺陷,尤其是在識(shí)別準(zhǔn)確率上,難以達(dá)到一個(gè)較高的水平。這一問題的原因主要在于目標(biāo)數(shù)據(jù)集中的圖片主要由單色線條組成,而且圖片中存在大量空白區(qū)域,基于局部特征的傳統(tǒng)方法無(wú)法提取到足夠的特征,提取到的特征向量也不具有足夠的區(qū)分度,因此才會(huì)有較多誤識(shí)別出現(xiàn)。而本文提出的算法具有更加優(yōu)秀的特征提取能力,彌補(bǔ)了傳統(tǒng)方法在這方面的不足,同時(shí),傳統(tǒng)圖像識(shí)別算法通過(guò)滑動(dòng)窗口的方式遍歷整張圖片,只能在單一尺度上檢測(cè)目標(biāo),因此對(duì)于目標(biāo)的回歸精度較低,而本文提出的方法應(yīng)用了錨框機(jī)制以及特征金字塔網(wǎng)絡(luò),因此在多尺度預(yù)測(cè)上具有很大的改進(jìn)。也可以看到與SSD、YOLOv3等基準(zhǔn)模型相比,本文所提出的模型針對(duì)于數(shù)據(jù)集優(yōu)化了模型超參數(shù),使得預(yù)測(cè)框的回歸精度要高于基準(zhǔn)模型的預(yù)測(cè)精度。而針對(duì)數(shù)據(jù)的特性以及基準(zhǔn)模型的上的表現(xiàn),重構(gòu)了特征融合網(wǎng)絡(luò),并針對(duì)性地進(jìn)行了數(shù)據(jù)預(yù)處理,進(jìn)一步提升了網(wǎng)絡(luò)的性能。

      表4 本文方法與其他方法對(duì)比Tab.4 Comparison between the proposed method and other methods

      4 結(jié)語(yǔ)

      本文針對(duì)于傳統(tǒng)圖像識(shí)別算法對(duì)于電氣元件符號(hào)的魯棒性差的缺點(diǎn),提出了一種基于深度卷積神經(jīng)網(wǎng)絡(luò)的電氣符號(hào)識(shí)別算法,在對(duì)訓(xùn)練標(biāo)簽進(jìn)行聚類來(lái)優(yōu)化訓(xùn)練過(guò)程、構(gòu)建了新的特征融合網(wǎng)絡(luò)、基于數(shù)據(jù)冗余的圖片預(yù)處理算法三個(gè)方面進(jìn)行了針對(duì)性的改進(jìn),在仿真實(shí)驗(yàn)中,本文提出的算法取得了遠(yuǎn)優(yōu)于傳統(tǒng)方法和基準(zhǔn)方法的效果,具有很大的應(yīng)用價(jià)值。目前文中提到的仿真的實(shí)驗(yàn)還只針對(duì)于幾類有代表性的元件,在以后的工作中還會(huì)在有更多數(shù)據(jù)的支撐下實(shí)現(xiàn)更多元件類型的識(shí)別。

      猜你喜歡
      元件卷積聚類
      基于3D-Winograd的快速卷積算法設(shè)計(jì)及FPGA實(shí)現(xiàn)
      從濾波器理解卷積
      電子制作(2019年11期)2019-07-04 00:34:38
      基于傅里葉域卷積表示的目標(biāo)跟蹤算法
      基于DBSACN聚類算法的XML文檔聚類
      QFN元件的返工指南
      基于改進(jìn)的遺傳算法的模糊聚類算法
      在新興產(chǎn)業(yè)看小元件如何發(fā)揮大作用
      寶馬i3高電壓元件介紹(上)
      一種層次初始的聚類個(gè)數(shù)自適應(yīng)的聚類方法研究
      一種基于卷積神經(jīng)網(wǎng)絡(luò)的性別識(shí)別方法
      丹棱县| 阳山县| 泰宁县| 麻城市| 类乌齐县| 伊宁县| 景洪市| 涿州市| 阳朔县| 屏山县| 菏泽市| 盐源县| 尉犁县| 台南县| 延庆县| 天全县| 游戏| 广州市| 望谟县| 张掖市| 印江| 南投县| 西吉县| 大城县| 九寨沟县| 福州市| 白河县| 竹溪县| 集安市| 新河县| 松溪县| 南江县| 喀喇沁旗| 和静县| 洪泽县| 黔西县| 鞍山市| 巧家县| 亳州市| 万宁市| 南宫市|