黃肖為+吳健兒+倪曉璐+周銘權(quán)+孟慶銘+陳靜怡
摘 要:文章針對(duì)電力現(xiàn)場(chǎng)自動(dòng)巡檢領(lǐng)域,提出了一種基于機(jī)器視覺的電力線路桿塔標(biāo)牌自動(dòng)識(shí)別方法,實(shí)現(xiàn)了圖像灰度化處理、標(biāo)牌定位、字符提取與識(shí)別,尤其在邊緣檢測(cè)算法等方面進(jìn)行詳細(xì)比對(duì)與選擇,最終取得了比較好的實(shí)際效果。
關(guān)鍵詞:電力線路;機(jī)器視覺;標(biāo)牌;自動(dòng)識(shí)別
中圖分類號(hào):TM769 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):2095-2945(2018)03-0084-02
Abstract: In this paper, an automatic recognition method of power line tower and tower sign based on machine vision is proposed, which realizes image grayscale processing, sign location, character extraction and recognition, especially in the edge detection algorithm and other aspects of detailed comparison and selection, and has finally achieved better practical results.
Keywords: power line; machine vision; sign; automatic recognition
1 概述
電力線路桿塔是架設(shè)輸電導(dǎo)線的剛性支撐結(jié)構(gòu),是電網(wǎng)的線路節(jié)點(diǎn),在桿塔周圍建有重要的電力設(shè)施,因此定期檢測(cè)桿塔本身的穩(wěn)固狀態(tài)、電力設(shè)備的狀況及周邊環(huán)境是電網(wǎng)巡檢的主要任務(wù)。
傳統(tǒng)的人工巡檢方式無法準(zhǔn)確把握電力線路的狀態(tài),只能在發(fā)生嚴(yán)重電網(wǎng)故障時(shí)才會(huì)發(fā)現(xiàn),這將嚴(yán)重影響電網(wǎng)的穩(wěn)定性。因此以自動(dòng)識(shí)別技術(shù)為核心的自動(dòng)巡檢成為了當(dāng)前電力巡檢的新方式。
當(dāng)前基于RFID的電子標(biāo)簽與基于二維碼識(shí)別的自動(dòng)識(shí)別技術(shù)已經(jīng)應(yīng)用到電力自動(dòng)巡檢中,但這二種方式都存在必須要對(duì)現(xiàn)有設(shè)備進(jìn)行改造,從而會(huì)增加較高成本。考慮到電力線路桿塔都具有標(biāo)牌,利用桿塔牌照的唯一性編號(hào),通過機(jī)器視覺技術(shù)進(jìn)行圖像分割與字符提取以獲得查詢現(xiàn)場(chǎng)巡檢關(guān)鍵信息,具有很好的實(shí)際價(jià)值。
2 自動(dòng)識(shí)別算法原理
自然場(chǎng)景中的文字提取目前最為廣泛的應(yīng)用場(chǎng)景是車牌識(shí)別,其作為車輛檢測(cè)系統(tǒng)和交通自動(dòng)化管理的重要環(huán)節(jié),是開發(fā)智能交通系統(tǒng)的關(guān)鍵技術(shù)。桿塔標(biāo)牌圖片的字符提取與車牌識(shí)別同屬于圖像字符識(shí)別算法的范疇,圖像字符識(shí)別算法并不是一個(gè)單一的算法,而是多個(gè)過程的集合,每個(gè)過程由不同的算法實(shí)現(xiàn),每一部分的算法實(shí)現(xiàn)都關(guān)系著整體的準(zhǔn)確性與效率,下面是各個(gè)部分的主要功能:
(1)標(biāo)牌定位:對(duì)目標(biāo)區(qū)域進(jìn)行分析,找出能夠區(qū)分牌照與背景的特征信息,按照一定的算法流程,分割出牌照區(qū)域。
(2)字符分割:將得到的牌照?qǐng)D像進(jìn)行字符分割和歸一化處理,把分割出的單個(gè)字符送到后續(xù)模塊進(jìn)行識(shí)別。
(3)字符識(shí)別:對(duì)分割出的字符,與標(biāo)準(zhǔn)字符模板進(jìn)行匹配,求得一個(gè)匹配值,最終將最佳匹配結(jié)果作為該字符圖片代表的文字。
桿塔標(biāo)牌與車牌都拍攝于自然場(chǎng)景下,文字區(qū)域相對(duì)較小,背景復(fù)雜,受光照天氣等影響較大,基于以上相同點(diǎn),在算法實(shí)現(xiàn)流程上大體相似,但兩者又存在差異:
(1)桿塔標(biāo)牌分為兩行文字,中間由分隔符隔開,上下文本字體間距不同,上行文本易膨脹粘連,下行文本在相同膨脹系數(shù)下不易粘連,而車牌文字排列整齊,字體間距較小只有固定一行。
(2)桿塔標(biāo)牌旁邊有一塊提示標(biāo)牌,同樣含有文本信息,在提取文字時(shí)易與有效信息混淆,無法正確區(qū)分篩選。
(3)桿塔標(biāo)牌背景為邊緣清晰、面積較大的鐵塔塔桿,使用邊緣提取算法時(shí)將含有大量無用邊緣信息。
分析可得,桿塔標(biāo)牌字符提取無法直接使用車牌識(shí)別算法,需要針對(duì)圖片的差異,在車牌識(shí)別算法的基礎(chǔ)上進(jìn)行改進(jìn)和調(diào)整。
3 自動(dòng)識(shí)別算法實(shí)現(xiàn)過程
3.1 灰度化處理
圖像的灰度化是指將彩色圖像轉(zhuǎn)化為灰度圖像。彩色圖像每個(gè)像素的顏色由R、G、B三個(gè)分量組成,即紅、綠、藍(lán)三種顏色。對(duì)RGB進(jìn)行灰度化,就是對(duì)圖像的RGB三個(gè)分量進(jìn)行加權(quán)平均得到最終的灰度值。本文采用加權(quán)平均法,即 Gray=0.11B+0.59G+0.3R。
3.2 標(biāo)牌定位
(1)邊緣檢測(cè)算法
邊緣檢測(cè)方法是指提取圖像局部變化最顯著的部分,局部變化則是以某個(gè)鄰域內(nèi)灰度變化為情況為標(biāo)準(zhǔn),來標(biāo)識(shí)圖像中的邊緣信息。獲取圖像中的邊緣信息,就是根據(jù)二維灰度矩陣梯度向量,用離散化梯度逼近函數(shù)來尋找圖像灰度矩陣的灰度躍變像素位置,將這些像素點(diǎn)連接起來就構(gòu)成了圖像邊緣。圖像邊緣檢測(cè)是目標(biāo)提取、紋理特征和形狀特征提取的重要基礎(chǔ),它主要存在于目標(biāo)與背景之間,是圖像中的基礎(chǔ)特征之一。邊緣檢測(cè)的目的是為了提取感興趣區(qū)域,摒棄那些并不重要的信息,保存圖像的結(jié)構(gòu)屬性。
在實(shí)際情況中,受噪聲、光線的影響,很少有理想的灰度階躍和線條清晰的邊緣,同時(shí),傳感器的低頻濾波特性使得階躍邊緣變?yōu)樾逼?,看起來其中的?qiáng)度變化不是瞬間的,而是有時(shí)間差的。這就使得濾波是進(jìn)行邊緣檢測(cè)的首要工作。
a.濾波:邊緣檢測(cè)利用邊緣的灰度變化特點(diǎn),對(duì)圖像各個(gè)像素點(diǎn)求微分或二階微分來定位邊緣,但微分通常對(duì)噪聲很敏感,因此為了改善邊緣檢測(cè)器的性能,必須采用合適的濾波器減少噪聲影響。常見的濾波方法主要有高斯濾波,即采用離散化的高斯函數(shù)產(chǎn)生一組歸一化的高斯核,然后基于高斯核函數(shù)對(duì)圖像灰度矩陣的每一點(diǎn)進(jìn)行加權(quán)求和。
b.增強(qiáng):濾波器在降低噪聲時(shí),也導(dǎo)致邊緣強(qiáng)度的損失。增強(qiáng)算法是將圖像鄰域中灰度有顯著變化的點(diǎn)凸顯出來。邊緣增強(qiáng)的基礎(chǔ)是計(jì)算圖像像素點(diǎn)鄰域的灰度強(qiáng)度變化值,編程時(shí)通過計(jì)算梯度幅值。endprint
c.檢測(cè):經(jīng)過增強(qiáng)的圖像,往往存在較多梯度值大的像素點(diǎn),這些點(diǎn)并不都是邊緣點(diǎn),所以在實(shí)際工程中,采用某種方法來對(duì)這些點(diǎn)進(jìn)行取舍。常用的方法是梯度幅值閾值判定。
在邊緣檢測(cè)過程中,一般采用Canny算法、Sobel算法與Roberts算法。其中Canny算法由于精確度較高,對(duì)于桿塔上的污點(diǎn)及結(jié)構(gòu)褶皺也能檢測(cè)出細(xì)小的邊緣,檢測(cè)出的文字輪廓清晰且連續(xù),但是背景存在過多無用細(xì)節(jié);Sobel邊緣檢測(cè)比較清晰,無用邊緣細(xì)節(jié)較少,已經(jīng)實(shí)現(xiàn)了較好的效果,但是和Roberts邊緣檢測(cè)結(jié)果相比,Roberts算法輪廓更加連續(xù),線條更簡(jiǎn)潔清晰,因此通過比較分析,本文選取Roberts算子進(jìn)行邊緣檢測(cè)。
(2)圖像二值化
桿塔標(biāo)牌經(jīng)邊緣檢測(cè)之后,標(biāo)牌上的字符邊緣已經(jīng)顯現(xiàn)出來,為了加強(qiáng)邊緣與背景的對(duì)比度,減少噪聲的影響,需要對(duì)桿塔圖像進(jìn)行二值化處理。圖像的二值化就是將像素點(diǎn)的灰度值設(shè)置為0或255,這樣使整個(gè)圖像呈現(xiàn)出明顯的黑白效果。二值化方法有很多,主要包括迭代閾值法、最大類間方法(OTSU)、自適應(yīng)閾值法等、最大熵閾值法,本文采取OTSU算法,主要是求得最佳門限閾值,利用此閾值將圖像灰度分割成黑白兩部分,使得兩部分類間方差取得最大值,并使類內(nèi)方差值最小,也即類間分離性最大,類內(nèi)的相似性最大。
(3)膨脹與腐蝕算法
膨脹是指將圖像中的一部分區(qū)域A與核B進(jìn)行卷積,即計(jì)算核B覆蓋的區(qū)域的像素點(diǎn)最大值,并把得到的最大值付給參考點(diǎn)指定像素。膨脹使得圖像較亮區(qū)域的面積增大,在通常情況下,目標(biāo)區(qū)域會(huì)被背景、陰影、噪聲分割成多個(gè)部分,通過膨脹算法可以使得相鄰區(qū)域連通起來。腐蝕是膨脹算法的對(duì)偶運(yùn)算,腐蝕操作,是將核B劃過圖像,將核B覆蓋的區(qū)域最小像素值提取,并替代錨點(diǎn)位置的像素。腐蝕算法可以去除圖像中較小的孤立色塊、噪聲和細(xì)小邊緣。
(4)矩形輪廓查找與篩選
通過對(duì)桿塔圖像的形態(tài)學(xué)運(yùn)算,圖中保留了大塊連通區(qū)域和小塊的獨(dú)立區(qū)域,這些區(qū)域與桿塔牌照混合在一起,為此,需要根據(jù)標(biāo)牌特點(diǎn)的先驗(yàn)知識(shí)進(jìn)行形狀篩選,以最終定位到桿塔標(biāo)牌所在的矩形區(qū)域。
本文經(jīng)過多次實(shí)驗(yàn)對(duì)大量樣本進(jìn)行對(duì)比分析,發(fā)現(xiàn)標(biāo)牌文字區(qū)域經(jīng)過腐蝕膨脹算法后,有以下顯著特點(diǎn):文字區(qū)域的第一行為連通矩形區(qū)域;提示標(biāo)語經(jīng)過膨脹算法,與上部圓形區(qū)域連通,形成面積較大的連通區(qū);桿塔部分邊緣已經(jīng)剔除,剩下的是不規(guī)則的高度較大連通色塊;經(jīng)過篩選后的剩余區(qū)域,文字區(qū)域?qū)挾茸畲?;文字部分第一行高度近似為文字區(qū)域?qū)挾鹊?/2。
3.3 字符提取與識(shí)別
定位出標(biāo)牌位置后,要進(jìn)一步進(jìn)行文字分割提取,但無需再做形態(tài)學(xué)處理,過程依然與標(biāo)牌定位流程相同,依次是灰度化、輪廓檢測(cè)、二值化、膨脹腐蝕、自定義篩選、定位。
提取出干凈的文字塊并二值化后,接下來需要進(jìn)行光學(xué)字符識(shí)別。進(jìn)行識(shí)別之前首先要有一套標(biāo)準(zhǔn)字庫模板作為參考,然后將提取出來的字符圖片與每個(gè)模板進(jìn)行某種算法的匹配,求得一個(gè)匹配值,最終將最佳匹配結(jié)果作為該字符圖片所代表的字符。本文將采用Tesserac-Ocr作為字符識(shí)別庫,Tesserac-Ocr是Google支持的開源項(xiàng)目,支持多種語言的識(shí)別,并且識(shí)別率非常高。
4 結(jié)束語
本文針對(duì)電力線路桿塔標(biāo)牌這一特殊對(duì)象,提出了基于機(jī)器視覺的自動(dòng)識(shí)別方法,并通過大量的實(shí)際圖片采集、處理與分析,選取了合適的圖像分割與字符識(shí)別方法,已經(jīng)取得了比較好的實(shí)際應(yīng)用效果。
參考文獻(xiàn):
[1]陳靜怡.基于桿塔圖像識(shí)別查詢的電網(wǎng)巡檢系統(tǒng)[D].杭州:浙江大學(xué),2017.
[2]魏武,張起森,王明俊,等.一種基于模板匹配的車牌識(shí)別方法[J].中國公路學(xué)報(bào),2001,14(1):104-106.
[3]顧勝蘭.自然場(chǎng)景下的文本定位與提取[D].上海:上海交通大學(xué),2009.
[4]晉瑾,平西建,張濤,等.圖像中的文本定位技術(shù)研究綜述[J].計(jì)算機(jī)應(yīng)用研究,2007,24(6):8-11.
[5]郭志紅.基于機(jī)器視覺的組培苗自動(dòng)化識(shí)別方法研究[J].科技創(chuàng)新與應(yīng)用,2017(19):20+22.
[6]王茂盛.TFDS圖像自動(dòng)識(shí)別系統(tǒng)框架設(shè)計(jì)與實(shí)現(xiàn)[J].科技創(chuàng)新與應(yīng)用,2013(06):23-24.endprint