羅浩天 羅 錦 嚴(yán)智敏 宋曉雪
(1.西華大學(xué) 計(jì)算機(jī)與軟件工程學(xué)院,四川 成都 610039;2.西華大學(xué) 電氣與電子信息學(xué)院,四川 成都 610039)
在輸電系統(tǒng)中,輸電塔和高壓線是其中主要的部分。在輸電塔上,絕緣子是維修的關(guān)鍵部位。絕緣體通常由陶瓷或玻璃制成,以支撐導(dǎo)體并防止電流返回地面。然而,由于野外環(huán)境的多變,絕緣子極易損壞,常見的原因有污穢,高溫,濕潤,塵土等。若發(fā)生故障則不能保證電力系統(tǒng)的正常運(yùn)轉(zhuǎn)。
通過深度學(xué)習(xí)技術(shù)的應(yīng)用,可以實(shí)現(xiàn)在復(fù)雜背景下針對絕緣子串的識別分割及絕緣子自爆故障的檢測,有利于保證電力系統(tǒng)的安全穩(wěn)定的運(yùn)轉(zhuǎn)。
1.2.1 研究內(nèi)容
電力系統(tǒng)中的傳輸鏈路主要由架空輸電線路實(shí)現(xiàn)。輸電塔由若干部件組成:桿塔、電線、絕緣子、避雷針、開關(guān)、電纜、及其連接裝置。內(nèi)容繁多,過程復(fù)雜。為了有效完成對電力系統(tǒng)的檢查,采用無人機(jī)設(shè)備對其進(jìn)行全方位的拍攝。以完成絕緣子自爆的檢測。利用深度學(xué)習(xí)技術(shù)對無人機(jī)采集到的圖像進(jìn)行分析處理,完成相應(yīng)的任務(wù)要求。
1.2.2 技術(shù)路線
本文通過無人機(jī)拍攝到的絕緣子圖片,依據(jù)現(xiàn)有國內(nèi)外對絕緣子的檢測和自爆缺陷的識別發(fā)展現(xiàn)狀,基于深度學(xué)習(xí)技術(shù)對獲得的圖片進(jìn)行預(yù)處理、分割和識別,并檢測出自爆絕緣子的位置。其中分為:
a) 數(shù)據(jù)集的生成。本文使用官方的測試數(shù)據(jù)和Github公開的數(shù)據(jù)集作為絕緣子圖像數(shù)據(jù)集。
b) 絕緣子圖像預(yù)處理。為增加數(shù)據(jù)集的圖片量,采用旋轉(zhuǎn)的方式將現(xiàn)有圖片進(jìn)行變形。為保證圖片的大小一致,通過縮放方式將圖片統(tǒng)一大小,為之后的深度學(xué)習(xí)提供數(shù)據(jù)集。
c) 絕緣子的分割。利用FCN算法,利用制作好的數(shù)據(jù)集,訓(xùn)練網(wǎng)絡(luò)。用測試數(shù)據(jù)生成的測試集進(jìn)行測試,最后通過調(diào)參提高分割的成功率。
d) 絕緣子連通域檢測。
e) 絕緣子自爆的識別。通過Yolov3對絕緣子的自爆故障進(jìn)行定位,流程圖如下:(如圖1)
因?yàn)殡娐分械慕^緣子通常建立在環(huán)境惡劣的地方,沒有工具很難到達(dá)。大部分由無人機(jī)捕獲和存儲。無人機(jī)的任務(wù)包括自主設(shè)定計(jì)劃、執(zhí)行任務(wù)、對地面的監(jiān)控,并且要對無人機(jī)的圖像進(jìn)行處理。無人機(jī)自動總要目標(biāo)的檢查、飛行控制、圖像捕獲和存儲等一系列操作,最終獲得較好的絕緣子狀況。
對圖像進(jìn)行一定的提取準(zhǔn)備,可以減少噪聲,使圖像特征更明顯,使得圖像蘊(yùn)含的信息得到較好的保存,從而提高后續(xù)處理的準(zhǔn)確度。[1]
2.2.1 圖像切分
現(xiàn)有原始圖片分辨率大致為7360×4912-3632×2624,每張圖片大小大約都在7MB上。這些數(shù)據(jù)保存會耗費(fèi)一定的儲存空間,并且現(xiàn)有分辨率對進(jìn)行圖像處理和深度學(xué)習(xí)都過大,會大大增加計(jì)算的時間。因此本文采取先將采集到的750張圖片切分為640×480大小,并打亂順序,隨機(jī)分布,減少原圖過大帶來的存儲空間和后期計(jì)算耗時問題。
2.2.2 基于Keras的圖像變換
Keras封裝了很多高層的神經(jīng)網(wǎng)絡(luò)模塊,例如全連接層(Dense),卷積層(Conv2D),長短時記憶模型(LSTM)等等。利用Keras框架進(jìn)行數(shù)據(jù)增強(qiáng),進(jìn)行上下,鏡像翻轉(zhuǎn),以及隨機(jī)修剪、色彩抖動、平移變換、尺寸變換,新增樣本圖片,將這些圖片作為后續(xù)語義分割的訓(xùn)練集。
圖1 總流程圖
圖2 RCN結(jié)構(gòu)流程圖
3.1.1 R-CNN算法
CNN是Region-CNN的縮寫。AlexNet 是卷積神經(jīng)網(wǎng)絡(luò)的一種,主要包含8層,其中前五層為卷積層,后三層為全連接層。雖然R-CNN有著較高的準(zhǔn)確度,但是它的識別效率較低,主要原因是它要提取說以的特征,計(jì)算的冗余量很大。所以將采用Fast-RCNN模型。Fast-RCNN在原來的基礎(chǔ)上新增了回歸性,將融合的地方化成一個模型。
下方為Faster RCNN結(jié)構(gòu)流程圖:(如圖2)
3.1.2 FCN算法
FCN是SHELHAMER等在現(xiàn)有用于分類的CNN結(jié)構(gòu)基礎(chǔ)上改造而成的,即將CNN原有的全 連接層改成卷積層。FCN是由卷積和反卷積組成,通過卷積和反卷積的過程,基于端到端學(xué)習(xí),完成了對圖像每個像素的分類,從而實(shí)現(xiàn)對整個輸入圖片的分割。卷積層(convolution layers)在FCN中主要承擔(dān)著特征提取的功能。卷積輸出的圖像大小為其中,W為輸入圖片的維度;F為卷積核的維度;S為步長;p為padding 填充的像素?cái)?shù)。使用激活函數(shù)來使得模型擺脫線性化。運(yùn)算為:
3.1.3 BoxSup算法
BoxSup算法是指基于Box Supervision的弱監(jiān)督圖像語義分割。
3.1.4 模型建立
RCNN基本步驟為:
(1)通過對顯著性進(jìn)行校驗(yàn)獲得2000個較為重要的位置ROI;
(2)將圖片變化為合適的大小讓它上面小,下面大,再使用卷積層獲得特征;
(3)對于金字塔每個尺度的每個ROI,求圖像在特征圖中的映射,并且統(tǒng)一到相同的尺度;
(4)將結(jié)果輸入到并行的兩個全連接層,第一個層針對每個ROI區(qū)域的分類進(jìn)行概率預(yù)測,第二個層針對每個ROI區(qū)域進(jìn)行位置的偏移優(yōu)化。經(jīng)過Fast-RCNN對RCNN的優(yōu)化,將分類和窗口放在了統(tǒng)一的框架里面,極大的較少了模型訓(xùn)練和圖片測試的時間。
FCN的建立:
(1)在上文預(yù)處理中分好訓(xùn)練集和驗(yàn)證集后,對形成學(xué)習(xí)機(jī)進(jìn)行如下步驟;
(2)構(gòu)建FCN-8s模型:根據(jù)全卷積神經(jīng)網(wǎng)絡(luò)原理,在VGG-19(Visual Geometry Group,VGG)網(wǎng)絡(luò)模型的基礎(chǔ)上構(gòu)建FCN-8s模型;
(3)訓(xùn)練FCN-8s模型:同時將訓(xùn)練集和驗(yàn)證集放入構(gòu)建好的模型進(jìn)行訓(xùn)練及驗(yàn)證,通過參數(shù)對比調(diào)優(yōu),完成模型的訓(xùn)練;
(4)FCN-8s模型預(yù)識別:將測試集輸入訓(xùn)練好的模型,經(jīng)計(jì)算后輸出FCN-8s梯田影像預(yù)識別結(jié)果;
(5)DenseCRF模型:輸入梯田預(yù)識別結(jié)果,構(gòu)造Dense CRF模型二階勢函數(shù),計(jì)算后輸出本文方法的最終識別結(jié)果;
流程圖如下圖所示:(如圖3)
BoxSup的訓(xùn)練流程:
圖3 FCN模型建立流程圖
(1)對圖片的bounding box ground-truth使用,Multiscale Combinatorial Grouping (MCG)生成分割mask的候選,并優(yōu)化label選一個與bounding box平均交集最大的mask作為監(jiān)督信息。
(2)利用上述標(biāo)簽信息更新分割網(wǎng)絡(luò)(FCN)的參數(shù)。
(3)基于訓(xùn)練出的語義分割網(wǎng)絡(luò)對物體框中的前景區(qū)域進(jìn)行預(yù)測,提升前景mask 的準(zhǔn)確度,再循環(huán)訓(xùn)練FCN。
FCN是由模型RCN改進(jìn)而得到,用卷積替換了全連接,相比于R-CNN提高了10%左右;BoxSup的核心就在不斷迭代,迭代次數(shù)越多越準(zhǔn)確,但是耗時過長。所以最后選定使用FCN算法。下面為由FCN算法得到部分掩模圖結(jié)果如下:
圖4 掩模圖一
圖5 掩模圖二
圖6 掩模圖三
4.1.1 基于Tow-Pass算法位置識別
Two-pass就是兩邊掃描,通過將圖片進(jìn)行兩次掃描,就可以查找得到連通域并且標(biāo)記它。在第一次掃描的時候,賦予每一個像素位置一個標(biāo)簽,掃描途中同一個連通區(qū)域的像素可能被賦予一個或者多個標(biāo)簽,因此需要將這些屬于同一個連通區(qū)域但具有不同的標(biāo)簽的像素進(jìn)行合并,記錄其中相等的關(guān)系。在第二遍掃描中,將相等關(guān)系的標(biāo)記像素歸為一個連通區(qū)域并賦予相同的標(biāo)簽。
4.1.2 基于Seed-Filling算法位置識別
結(jié)合京港澳高速公路涿州(京冀界)—石家莊段改擴(kuò)建工程,分析了地基處理前后,新老路堤表面工后沉降和橫坡度的變化規(guī)律,研究了工后沉降作用下的路面結(jié)構(gòu)層附加應(yīng)力響應(yīng),計(jì)算了路面結(jié)構(gòu)層的強(qiáng)度發(fā)揮率,并確定了應(yīng)力控制層,制定了合理的差異沉降控制標(biāo)準(zhǔn)和經(jīng)濟(jì)有效的地基處理措施。主要結(jié)論如下:
種子填充法來源于計(jì)算機(jī)圖形學(xué),對于某個圖形進(jìn)行填充。選取一個前景像素作為種子,根據(jù)連通區(qū)域的兩個基本條件將和種子相鄰的前景像素合并到同一個像素集合中,最后得到該像素集合就是一個連通區(qū)域。
本文利用的是二值圖像的連通域標(biāo)記法。二值圖像是指只有黑和白兩個狀態(tài)的圖像,由于其簡單的模式,像素可以在空間上有很強(qiáng)的表現(xiàn)力。所以利用二值圖像來分析連通域標(biāo)記是非常方便的。根據(jù)現(xiàn)有的算法思路,對圖片進(jìn)行逐行的掃描,把每一行中連續(xù)的白色像素組成一個序列并進(jìn)行標(biāo)記,記下其中的起始點(diǎn)和終止點(diǎn)以及所在的行號。對于除了第一行中連續(xù)的標(biāo)記以外,如果其他行的標(biāo)記都沒有于其之前的標(biāo)記重合就標(biāo)定為一個新的標(biāo)號,如果僅與上一行中的一個標(biāo)記有重合,則將上一行的標(biāo)記賦予給它,如果與上一行的2個以上的標(biāo)記區(qū)域有重疊的部分,則給當(dāng)前的標(biāo)記標(biāo)上最小的標(biāo)號,并將上一行這幾個標(biāo)記寫入等價的對,說明是屬于一個類型。將等價對轉(zhuǎn)換為等價序列,每一個序列需要給一個相同的標(biāo)號。將每個標(biāo)號填入標(biāo)記的圖像中。
通過對連通域進(jìn)行標(biāo)定,就可以得到不同的區(qū)域,并將其標(biāo)定出來。通過程序?qū)⒉煌念伾畛涞讲煌倪B通區(qū)域??梢詫D像進(jìn)行快速的標(biāo)定。
玻璃絕緣子自爆的原因可分為產(chǎn)品自身質(zhì)量原因與外部運(yùn)行環(huán)境原因兩類。其發(fā)生自爆的特征為:放射狀,魚鱗狀,混合狀。
5.2.1 基于YOLO算法
Yolo V3作為最優(yōu)秀的目標(biāo)檢測框架之一,與之前的RCNN、SPP-Net、Fast-RCNN、Faster-RCNN相比有了很大的進(jìn)步。[3]Yolo的核心思想是使用整個畫面作為輸出,直接返回輸出層中邊界框的位置和類別。首先將一幅圖像劃分為7×7個網(wǎng)格單元,然后檢測目標(biāo)。如果目標(biāo)中心落在網(wǎng)格中,網(wǎng)格負(fù)責(zé)預(yù)測目標(biāo)。預(yù)測的候選框還需要預(yù)測一個置信度值,以確定目標(biāo)是否存在。
如果有目標(biāo)落在一個網(wǎng)格里,那么Pr(Object)值取1,否則取0。是預(yù)測的 bounding box 和實(shí)際的groundtruth之間的交并比。
在預(yù)測時,每個候選框的分類置信分?jǐn)?shù)為預(yù)測目標(biāo)的類別概率和bounding box預(yù)測的 confidence 信息相乘。
得到每個分類置信分?jǐn)?shù)之后,設(shè)置閾值將得分低的boxes篩除掉,就得到最終的檢測結(jié)果。
5.2.2 基于YOLO算法的改進(jìn)
目前,大多數(shù)神經(jīng)網(wǎng)絡(luò)的改進(jìn)趨勢是向更大、更深層次的網(wǎng)絡(luò)發(fā)展。一般來說,層次性更強(qiáng)的神經(jīng)網(wǎng)絡(luò)傾向于在現(xiàn)實(shí)世界中學(xué)習(xí)更多的細(xì)節(jié)以獲得更好的結(jié)果。YOLO v2沒有專注于加深神經(jīng)網(wǎng)絡(luò)的層次,而是采用了批量歸一化、高分辨率分類器、多尺度訓(xùn)練等方法,在保持原有速度的同時提高了精度。整個網(wǎng)絡(luò)采用Darknet-19網(wǎng)絡(luò)結(jié)構(gòu),包括19個卷積層和5個最大池層,與YOLO相比,卷積運(yùn)算量大大減少。YOLO v3采用 Darknet-53的基礎(chǔ)網(wǎng)絡(luò)結(jié)構(gòu),確保了速度并再次大大提高了精確度。
5.2.3 改進(jìn)SSD算法
經(jīng)典 SSD 算法的模型參數(shù)運(yùn)算繁多,運(yùn)行時占用內(nèi)存大,為了在有限的計(jì)算資源平臺上完成圖像識別任務(wù)并做出及時的反應(yīng),對 SSD 算法進(jìn)行“減重”勢在必行。提出改進(jìn)的深度可分離卷積網(wǎng)絡(luò)作為 SSD 前端特征提取的基礎(chǔ)網(wǎng)絡(luò),避免卷積運(yùn)算過程所帶來的過大消耗,降低算法運(yùn)算復(fù)雜度,適應(yīng)未來實(shí)時識別車型的應(yīng)用需求。[4]
(1)深度可分離卷積。深度可分離卷積(depthwise sep arable convolution,DSC)公式如式(5)所示
式(5)中,G為輸出特征圖;K為卷積核;F為輸入特征圖;i,j為特征圖像素位置;k,l為輸出特征圖分辨率;m為通道數(shù).
深度可分離卷積把卷積分為深度卷積DW和點(diǎn)卷積PW兩個階段。DW是深度可分離卷積的濾波階段,每個通道對應(yīng)卷積核進(jìn)行卷積操作;PW是深度可分離卷積的組合階段,整合多個特征圖信息,串聯(lián)輸出。
模型訓(xùn)練中,輸入M通道大小為DF×DF的圖像,經(jīng)過DK×DK大小的卷積核進(jìn)行卷積操作后,輸出大小為DI×DI的N通道特征圖。
對于一般卷積來說,濾波器大小為DK×DK,輸入大小DF×DF為的M通道圖像,參數(shù)運(yùn)算量為DF×DF×DK×DK×M×N。而深度可分離卷積中特征提取只用了一個大小為DK×DK×1卷積核,運(yùn)算量為DF×DF×M×DK×DK,組合階段用了N個點(diǎn)卷積,運(yùn)算量為DF×DF×M×N,因此總計(jì)算量為DF×DF×M×N×DF×DF×M×DK×DK。
式(6)中,深度可分離卷積使用3×3的卷積核,即DK取值為3。深度可分離卷積在準(zhǔn)確率較小下降的情況下運(yùn)算量減少近8到9倍。在對模型輕量化過程中,引入了寬度參數(shù)α壓縮輸入輸出通道為計(jì)算量為:
(2)反殘差模塊。寬度參數(shù)通過壓縮通道數(shù)進(jìn)一步減少模型參數(shù)量,但是也造成了特征壓縮的問題。而修正線性單元(ReLU)對于負(fù)輸入,全部輸出為零,會導(dǎo)致更多的特征信息丟失,深度卷積DW無法改變輸入通道,這種情況下,特征提取效果不理想會導(dǎo)致目標(biāo)檢測準(zhǔn)確率降低。
研究在 DW 之前引入反殘差(inverted residuals,IR)模塊,輸入為h×w的k維特征圖,將 ReLU 改為 ReLU6 以限制輸出范圍,輸出h/s×w/s的k’維特征圖。s 是步長,t 為擴(kuò)張系數(shù)。首先用一個大小為1×1的擴(kuò)展核把輸入的低維特征圖擴(kuò)展到高維,在高維空間進(jìn)行深度卷積,最后使用點(diǎn)卷積將特征提取結(jié)果降維映射到低維空間并用線性激活函數(shù)(linear)進(jìn)行輸出。對通道數(shù)擴(kuò)增之后再收縮,提高了模型特征提取的能力,有效防止由于通道數(shù)較小時因非線性激活導(dǎo)致特征信息丟失的情況,可以提高目標(biāo)檢測準(zhǔn)確率。結(jié)合反殘差模塊的深度可分離卷積SSD結(jié)構(gòu).
特征提取部分除第一層之外全部為結(jié)合反殘差模塊的深度可分離卷積,擴(kuò)張系數(shù)t為6,并且在conv1,conv3,conv6,conv11中采用步長s為2的卷積,在 conv2,conv4,conv5,conv7,conv8,conv9,conv10 中步長 s 為 1,進(jìn)行殘差信息傳遞。
(3)區(qū)域候選框重構(gòu)。對候選框與真實(shí)框做匹配來進(jìn)行位置損失的計(jì)算。區(qū)域候選框與目標(biāo)真實(shí)位置交并比大小是區(qū)分正負(fù)樣本的條件,訓(xùn)練效果是由區(qū)域候選框決定的。
區(qū)域候選框參數(shù)公式如式(8)所示。
式(8)中,SK是第k個特征圖的minsize參數(shù),Smin是設(shè)計(jì)好的最小歸一化尺寸,取值為0.2;Smax為設(shè)計(jì)好的最大歸一化尺寸,取值為0.9;m是特征圖的總數(shù)。
SSD區(qū)域候選框有不同的寬高比ar(aspect ratio),候選框的寬和高分別為對于寬高比為 1 的情況添加一個縮放為的候選框,使得每個特征圖有6個。候選框,設(shè)定默認(rèn)框中心為為第k個正方形特征圖大小。SSD采用6個特征層來生成不同尺寸大小的候選框,假設(shè)特征圖大小為n×n,在每單元點(diǎn)設(shè)置k個候選框,則單層特征圖生成候選框的個數(shù)為n×n×k。本研究在SSD 中使用反殘差模塊的深度可分離卷積進(jìn)行特征提取,并且刪除了寬高比例為2和3的框。由上述可以看出,經(jīng)典SSD選取6個特征圖的k值分別為4,6,6,6,4和4,計(jì)算可以得到8732個候選框;改進(jìn)后的SSD選取6個特征圖的k值均為4,計(jì)算可以得到候選框2000個,與原SSD的區(qū)域候選框生成總數(shù)相比減少了約3/4。
5.2.4 GMM模型
(1)GMM 是一種預(yù)測概率密度的方法,利用多個高斯模型來表征圖像的特點(diǎn),尤其是像素點(diǎn)的特點(diǎn)。通過對特征進(jìn)行及時的矯正,使其適應(yīng)環(huán)境的變化。圖片中的像素X=(x0,y0)不斷的變?yōu)橐粋€于像素相關(guān)的變化,那么假定t時間圖像的像素為Xt,那么像素概率密度就是多個高斯模型概率密度乘以權(quán)重之后的和P(Xt):
將t時刻每一個新的像素值Xt與多個高斯分布根據(jù)式(1)配對:
若滿足式(11),即值在高斯分布的2.5個標(biāo)準(zhǔn)差范圍內(nèi),就是匹配,將其認(rèn)定為背景,同時已經(jīng)匹配的高斯分布更具公式(10)進(jìn)行刷新。若不滿足公式(11)則判定為不匹配,并且認(rèn)定為前景中的目標(biāo),那么便更新權(quán)值
如果像素與多個分布都不滿足條件的話,再對期望、方差和權(quán)進(jìn)行更新,將多個高斯分布中最小的模型參數(shù)更新為:
式中:α作為學(xué)習(xí)效率;若t時刻Xt與分布進(jìn)行配對,否則為0.
(2)GMM模型的改進(jìn):
i.GMM模型的自適應(yīng)改進(jìn)
在對運(yùn)動的物體進(jìn)行檢測時,以往的GMM里K值是不發(fā)生變化的,這樣就約束了算法在不同環(huán)境中的魯棒性。如果環(huán)境中沒有移動的物品時,那么不需要以往那么多的資源,只要觀察一個最為重要的分布就可以觀測到全局的分布。當(dāng)環(huán)境中出現(xiàn)目標(biāo)物體后,考慮的值會明顯增多,這便需要利用較多的高斯分布來計(jì)算。在此基礎(chǔ)上,改進(jìn)出了不斷適應(yīng)環(huán)境的高斯算法。過程如下:
(1)先加入穩(wěn)定數(shù)ρ來修改權(quán)和協(xié)方差的分布,并且0<ρ<1。當(dāng)新得到的權(quán)很大、方差很小時,分布會變的更加重要,變得容易成為用于背景構(gòu)造的元素之一,造成整個模型的質(zhì)量下降,可能會影響對結(jié)果的準(zhǔn)確率。為了讓分布更加符合實(shí)際情況,所以添加了一個穩(wěn)定系數(shù)ρ,如果檢測圖像的像素點(diǎn)與多個分布都不同時,則按以下規(guī)則重新產(chǎn)生下一個分布:
(2)當(dāng)像素變得平穩(wěn)時,說明沒有運(yùn)動物體,那么就不需要多的分布,因此可以于重要級較低的分布進(jìn)行合并。在得到新的數(shù)據(jù)后,如果同一像素點(diǎn)的2分布i和j的均值之差小于閾值T時,說明此時2個分布重要性較低,產(chǎn)生了多余,可以把這2個分布融合,并且再次進(jìn)行參數(shù)更新:
將重要性低的分布進(jìn)行融合,達(dá)到提升運(yùn)算速度,并且不降低準(zhǔn)確率。
ii.GMM模型學(xué)習(xí)率的改進(jìn)
當(dāng)圖像有變化時,模型進(jìn)行更新的速度α對背景的更新有著較大的影響,表達(dá)了模型對當(dāng)環(huán)境的適應(yīng)度。通常根據(jù)學(xué)習(xí)的經(jīng)驗(yàn)來調(diào)整學(xué)習(xí)率α,當(dāng)α太大時,背景模型的變化速度比較快,結(jié)果會出現(xiàn)許多異常點(diǎn);當(dāng)α太小時,則圖像中匹配的點(diǎn)很少,背景變化的速度會變慢。以往GMM設(shè)置單個學(xué)習(xí)率,無法使背景得到較快的跟新,所以提出在原來GMM的格式增加一個來達(dá)到控制效果。
依據(jù)學(xué)習(xí)率對結(jié)果的影響,設(shè)置了2級學(xué)習(xí)率。在圖背景變化明顯的位置設(shè)定一個較高的學(xué)習(xí)率,讓模型加快收斂,并消除殘留,就是對特點(diǎn)的區(qū)域設(shè)置學(xué)習(xí)率。在變化較慢的地方設(shè)定較低的學(xué)習(xí)率,就是對背景設(shè)置學(xué)習(xí)率,則背景更新率可分段設(shè)置為:
對于SSD模型來說,它的速度一般,準(zhǔn)確度較高,但需人為預(yù)設(shè)默認(rèn)邊框的最小值,最大值和縱橫比例值。模型中最初的默認(rèn)邊框基礎(chǔ)的大小和形狀都不能直接通過模型學(xué)習(xí)得到也無特定的初始值,必須要人為手工設(shè)置。且卷積神經(jīng)網(wǎng)絡(luò)每個卷積層的特征圖使用的默認(rèn)邊框各類參數(shù)不一,以至于調(diào)試參數(shù)過程需要長期積累經(jīng)驗(yàn)。
即使pyramdial feature hierarchy這樣的思路,對較小的特征RECALL效果還是不好,并沒有達(dá)可以完全替代Faster RCNN。這是由于SSD使用conv4_3低級特征去檢測小目標(biāo),而它的卷積層數(shù)少,特征提取也不完整。所以它的使用復(fù)雜,不適合在講求效率的工程領(lǐng)域使用。
GMM和K-means還是有很大的相同點(diǎn)的。GMM中數(shù)據(jù)對高斯分量的響應(yīng)度就相當(dāng)于K-means中的距離計(jì)算,GMM中的根據(jù)響應(yīng)度計(jì)算高斯分量參數(shù)就相當(dāng)于K-means中計(jì)算分類點(diǎn)的位置。然后它們都通過不斷迭代達(dá)到最優(yōu)。不同的是:GMM模型給出的是每一個觀測點(diǎn)由哪個高斯分量生成的概率,而K-means直接給出一個觀測點(diǎn)屬于哪一類。所以GMM的模型的迭代次數(shù)多效率低。同樣不適合使用工程領(lǐng)域,同時它的準(zhǔn)確度也不具有穩(wěn)定性,在幾次實(shí)驗(yàn)中忽高忽低,使它的數(shù)據(jù)充滿可疑性。
對比以上三個模型,經(jīng)過各項(xiàng)技術(shù)參數(shù)的比對,在對YOLOv3 進(jìn)行 channel pruning 之后,模型的參數(shù)量、模型大小減少 80%,F(xiàn)LOPs 降低 70%,前向推斷的速度可以達(dá)到原來的 200%,同時可以保持 mAP 基本不變(這個效果只是針對該數(shù)據(jù)集的,不一定能保證在其他數(shù)據(jù)集上也有同樣的效果)。到此為止,YOLO算法的準(zhǔn)確度已經(jīng)達(dá)到70%遠(yuǎn)高于其他兩個模型。YOLO3借鑒了殘差網(wǎng)絡(luò)結(jié)構(gòu),形成更深的網(wǎng)絡(luò)層次,以及多尺度檢測,提升了mAP及小物體檢測效果。如果采用COCO mAP50做評估指標(biāo)(不是太介意預(yù)測框的準(zhǔn)確性的話),YOLO3的表現(xiàn)相當(dāng)驚人,如下圖所示,在精確度相當(dāng)?shù)那闆r下,YOLOv3的速度是其它模型的3、4倍。
本文主要基于絕緣子圖像數(shù)據(jù)研究不同的方法實(shí)現(xiàn)絕緣子“自爆”缺陷的檢測。本文基于國家電網(wǎng)查找給出的圖像,主要以無人機(jī)航拍的絕緣子圖像數(shù)據(jù)為研究基本對象,將檢測絕緣子“自爆”作為目標(biāo),對其中圖像處理深度學(xué)習(xí)進(jìn)行建立模型,結(jié)果比對,得出實(shí)驗(yàn)結(jié)果。對本文的研究內(nèi)容和取得成果總結(jié)如下:
本文通過使用官方給出的數(shù)據(jù)以及在GitHub公開的數(shù)據(jù)集作為了圖像的基礎(chǔ)數(shù)據(jù)集,最早通過圖像的預(yù)處理,將圖片旋轉(zhuǎn)幾個角度以此來提高識別的準(zhǔn)確度,在已有的基礎(chǔ)上擴(kuò)展數(shù)據(jù)集。
本文使用深度學(xué)習(xí),利用FCN算法分割絕緣子,并用已有的數(shù)據(jù)集進(jìn)行訓(xùn)練。然后在對連通區(qū)域進(jìn)行檢查得到較為客觀的掩模圖。最后通過基于Python平臺的YoloV3算法對得到的自爆故障進(jìn)行定位。在得到的結(jié)果中可以發(fā)現(xiàn)模型已經(jīng)具有較好的效果,可以準(zhǔn)確的識別出已經(jīng)自爆的絕緣子。
本文值得注意的是,本文每一個步驟都選用了多個方法進(jìn)行比較,保證了結(jié)果的準(zhǔn)確性,并且同時也帶來的更多的解決方案,以此來適應(yīng)不同的環(huán)境。
本文從圖像處理和深度學(xué)習(xí)兩個角度出發(fā)研究了航拍中絕緣子串的識別和絕緣子“自爆”點(diǎn)的位置識別。由于深度學(xué)習(xí)繼續(xù)迅速,研究不斷深入,新的模型和算法的提出,在今后的時間針對本文不足進(jìn)行完善,可完善的地方主要有以下方面:
(1)數(shù)據(jù)的不充足性。由于電力圖像獲取難度大,本文所使用航拍圖像有限?;竟┯谠瓐D應(yīng)是2000張左右,但是由于獲取數(shù)據(jù)有限,在處理后才剛剛達(dá)到深度自主學(xué)習(xí)所需訓(xùn)練集,后期可以通過無人機(jī)拍攝更多圖像進(jìn)行加強(qiáng)。
(2)基于深度學(xué)習(xí)的檢測算法在未來探索更合適的網(wǎng)絡(luò)模型,降低網(wǎng)絡(luò)復(fù)雜度。以期實(shí)現(xiàn)絕緣子檢測的智能化和自動化。
另外在從當(dāng)下時期來看我國電網(wǎng)面臨著嚴(yán)峻挑戰(zhàn),主要包括:西電東送距離遙遠(yuǎn)和線路走廊的限制,要實(shí)現(xiàn)大規(guī)模的輸電面臨著諸多技術(shù)難題:大區(qū)電網(wǎng)強(qiáng)互聯(lián)的格局尚未形成,因而全局的電力資源優(yōu)化配置,優(yōu)化調(diào)度還難以實(shí)施,南北互供的電量還很少,電網(wǎng)建設(shè)滯后,電網(wǎng)中輸電瓶頸增多,其中,電網(wǎng)絕緣子安全可靠性成為電網(wǎng)安全的重要因素。因?yàn)?電力網(wǎng)輸配電線路大多建設(shè)在野外,長期在惡劣氣候條件下工作,強(qiáng)化輸配電絕緣子安全可靠性,對于線路安全起到重要的作用,輸電網(wǎng)安全運(yùn)行強(qiáng)調(diào)輸電網(wǎng)絕緣子的重要性。更應(yīng)該加快速度,將商業(yè)化的無人機(jī)識別技術(shù)投入到電網(wǎng)中。
可以預(yù)見在將來本文的技術(shù)可以被應(yīng)用在各個多個領(lǐng)域,并且也具有較大的提升空間,和較好的可塑性。以本文的YoloV3模型為例,本次由于訓(xùn)練數(shù)據(jù)較少的原因,使識別的精度差強(qiáng)人意,如果可以收集更多的數(shù)據(jù),多模型進(jìn)行更多的訓(xùn)練,那么準(zhǔn)確度會有一個質(zhì)的飛躍。