李 巖
青藏鐵路公司,西寧供電段,西寧 810006
絕緣子是接觸網支持及懸掛裝置的關鍵部件之一,起著懸掛裝置中帶電部分與絕緣部分的電氣隔離及對懸掛裝置的支撐作用。由于工作時間長,工作環(huán)境惡劣,絕緣子易出現(xiàn)由雷電、污穢等引起的閃絡放電而導致的破損及夾雜異物等不良狀態(tài)。當瓷瓶出現(xiàn)破損或受到一定程度的污染時,其絕緣性能可能降低,嚴重時甚至會發(fā)生閃絡,造成跳閘事故,嚴重影響行車運營安全。
隨著高速數(shù)字圖像采樣技術和數(shù)字圖像處理技術的發(fā)展,具有對行車影響小且能實現(xiàn)實時檢測的圖像處理、智能識別技術開始應用在鐵路系統(tǒng)中。該類方法已能實現(xiàn)接觸網幾何參數(shù)的檢測[1]、接觸線定位器定位坡度檢測[2]、受電弓磨耗檢測[3]、受電弓裂紋檢測[4]、受電弓定位等[5]。在絕緣子檢測方面,楊紅梅等提出基于仿射不變矩的絕緣子片間夾雜異物檢測方法[6],韓志偉等利用二代曲波系數(shù)形態(tài)學條帶能量法檢測絕緣子故障[7]。然而,上述方法在復雜背景和日間工況下對絕緣子的識別與定位仍有局限性。
本文針對復雜的接觸網圖片背景下絕緣子瓷瓶識別、定位的困難,采用近年來在目標檢測研究[8,9]中應用較廣的梯度方向直方圖(histograms of oriented gradient,HOG)[10]提取絕緣子特征,較大程度上消除了光照變化和絕緣子角度變化對于識別效果的影響,使用支持向量機(support vector machine,SVM)作為機器學習工具,得到了較好的識別及定位效果。
HOG(Histograms of Oriented Gradients)最早由Dalal于2005年提出[10],并被用于行人檢測中,且取得了很好的效果。它依據圖像中局部目標的表象和形狀能夠被梯度或邊緣的方向密度分布很好的描述的原理,通過統(tǒng)計圖像局部區(qū)域的梯度方向信息作為該局部圖像區(qū)域的表征。與很多的圖像幾何特征不同,HOG不從圖像的整體上考察特征,而是將圖像細分為多個小的細胞單元(cell),然后采集細胞單元中各像素點的梯度或邊緣的方向直方圖,因此對圖像幾何的和光學的形變都能保持很好的不變性。
在基于計算機視覺的絕緣子識別方法中,絕緣子特征是指包含了絕緣子圖像的特征。一般圖像特征分為幾何特征、灰度統(tǒng)計特征、變換系數(shù)與代數(shù)特征四類。幾何特征由于其穩(wěn)定系數(shù)較高,因而應用范圍較廣。
在幾何特征中,存在較多的特征方法能夠適應目標小范圍的旋轉和平移,稱為圖像的幾何不變距,如Hu不變矩、歸一化轉動慣量等。而對于光照變化的適應,目前的方法一般需要在前期處理過程中將光照因素過濾掉(如通過色彩空間變換),通過實驗得到的閾值提取出絕緣子區(qū)域并轉化為二值圖,再進行特征提取,其過程較為復雜,且在復雜背景下適用度不高。
而 HOG,既擁有幾何不變矩的特性,又能夠直接適應光照的變化,適合應用于復雜背景下的絕緣子識別。它既能夠對單通道圖像進行特征提取,也能夠對多通道圖像中的各通道分別進行特征提取,較為靈活。
絕緣子HOG特征提取流程如下:
Step l 標準化Γ空間。為了減少光照因素的影響,需要將整個圖像進行規(guī)范化,這種處理能夠有效地降低圖像局部的陰影和光照變化。Γ壓縮公式如下:
本文取Γ=1/2。
Step 2 計算梯度值。使用一維離散微分模板同時在水平和垂直兩個方向上計算每個像素的梯度。該操作不僅能夠捕獲輪廓和一些紋理信息,還能進一步弱化光照的影響。
本文算法采用中心對稱梯度算子[-1,0,1]進行卷積計算,分別算出x方向梯度Gx與y方向梯度Gy。然后利用公式(2)、(3)分別計算梯度大小和向量:
Step 3 為細胞構建梯度方向直方圖。將整個圖像窗口分割為多個8×8的細胞,每4個細胞組成一個塊(見圖 1),細胞中的每個像素點為直方圖通道進行加權投票,其權值根據像素點的梯度幅值進行高斯加權計算而來。
圖1 塊與細胞結構圖解Fig.1 The structure chart of block and cell
Step 4 在塊中進行梯度歸一化。在文獻[10]中,Dalal分別使用了 L1、L2、L2-Hys三種方法進行了歸一化操作,通過對比論證L2-Hys在復雜背景下塊歸一化效果明顯優(yōu)于L1、L2。因此本文選用L2-Hys方法進行歸一化處理,即先用特征向量的L2范數(shù)歸一化,然后把歸一化后的結果限幅到0.2,重新用L2范數(shù)歸一化:
式中:x為標準化前的特征向量;e為一個很小的標準化量以防止除數(shù)為0。
歸一化進一步對光照、陰影和邊緣進行壓縮。由于每個單元格由多個不同的塊共享,一個單元格的特征會以不同的結果多次出現(xiàn)在最后的向量中,我們將歸一化之后的塊描述符稱為HOG描述符。
Step 5 獲得區(qū)域特征向量。圖像的梯度方向向量數(shù)由圖像大小、細胞大小、每個細胞所取梯度維數(shù)等因素所決定。其計算方法為:
式中,Dc表示細胞維數(shù);Sb表示塊大小;Sc表示細胞大小;lb表示塊移動步長;w與h分別表示圖像的寬與高。
本文中進行HOG特征提取時,參數(shù)設置如下:輸入圖像大小為64×128,細胞大小為8×8,塊大小為16×16,塊的步進為8個像素,梯度方向將360°分為9個區(qū)間。
將一個塊中 4個細胞的梯度直方圖數(shù)據串聯(lián)起來,再將所有塊的特征向量組合,由計算可得輸出 9×4×105=3780維向量,即該區(qū)域的 HOG特征向量。
本文提出的絕緣子識別與定位方法選取了武廣高鐵、石武高鐵、京哈線、京九線、京廣線等7條客專、普速線路中的15個區(qū)段不同時段、不同天氣下拍攝的不同型號絕緣子作為訓練集與測試集樣本。其中,訓練樣本每區(qū)段采用10~15張(不同時段、不同天氣情況)含有絕緣子的圖片并將絕緣子提取出來作為正樣本,選取20~30張不含絕緣子的圖片作為負樣本。測試集則由各區(qū)段中不同于訓練樣本的具有不同特點的圖片構成。
在機器學習方面,本文采用支持向量機(Support Vector Machine,SVM)作為識別工具,它是一種由統(tǒng)計學發(fā)展而來的機器學習方法。其主要思想為從原空間Rn通過變換Φ轉換到高維的特征空間H,在高維空間H中尋找最優(yōu)超平面進行分類。因此它能很好地解決非線性、小樣本、高維數(shù)等模式識別領域挑戰(zhàn)性問題[11]。在訓練分類器之前,需要制作訓練集中的正樣本并進行裁剪縮放等預處理。該預處理是計算HOG特征的需要,裁剪的窗口根據樣本圖像中絕緣子的大小設定。由于圖像中絕緣子多以矩形形式存在,為了能更好地保留絕緣子整體的HOG特征,裁剪后的圖像統(tǒng)一縮放至檢測窗口(64×128)大小,圖2給出了幾組正樣本制作示例。
圖2 正樣本制作Fig.2 Positive sample making
為驗證算法的有效性以及各種參數(shù)配置對識別結果的影響,本文針對SVM核函數(shù)參數(shù)、誤差懲罰因子C以及HOG檢測窗口增長系數(shù)、塊移動步長展開研究。
Vapnik等人的研究表明,不同核參數(shù)對于一般分類都能達到很好的效果,核函數(shù)和誤差懲罰因子C才是影響SVM性能的關鍵因素[12]。本文選取較常用的徑向基(RBF)函數(shù)作為SVM核函數(shù)展開研究。RBF函數(shù)如下:
式中,γ為RBF核函數(shù)的參數(shù)。
本文選取了 315個正樣本和 708個負樣本進行HOG特征學習,選取了樣本集外的500張圖片作為測試集。在確定最優(yōu)SVM參數(shù)時,首先采用網格搜索法取值,然后對該組參數(shù)進行K交叉驗證,計算精確值(交叉驗證的準確率等于能夠被正確分類的數(shù)量百分比),尋求最優(yōu)參數(shù)。由于訓練集內樣本并非取自公開的標準樣本集,且識別問題的準確性不同于簡單分類,而是以人的意識判斷為基準,因而采用該方法時,并沒有達到理想的效果。所以,本文在不同樣本容量下用網格搜索法+K交叉驗證進行參數(shù)粗選獲得γ推薦值為0.03后確定誤差懲罰因子C(見表1),然后結合經驗選擇法確定(C,γ)參數(shù)組合(見表2),并得到其變化趨勢。
圖3 不同背景下的識別效果Fig.3 The recognition effect under different backgrounds
表1、2中“誤識別”指錯將不是絕緣子的物體識別定位,“漏識別”指沒有識別出圖中絕緣子,“簡單背景”表示除絕緣子外背景單一(見圖3(a)),“復雜背景”表示除絕緣子外背景雜亂(見圖3(b)),“綜合背景”包含簡單、復雜背景及缺失絕緣子的圖片,最符合現(xiàn)場工況。表中誤識別率、漏識別率、識別率分別由誤識別圖片數(shù)、漏識別圖片數(shù)、識別圖片數(shù)分別除以簡單背景、復雜背景、綜合背景圖片總數(shù)求得。值得提出的是,由于在漏識別的情況下依然可能出現(xiàn)誤識別,所以識別率并不等于 100%與誤識別、漏識別率的差值。圖 4為γ=0.03時誤識別率和漏識別率隨C的變化趨勢。
表1γ=0.03時改變誤差懲罰因子C在不同背景下的識別結果
Tab.1 Recognition results in different backgrounds with the change of parameterCwhenγ=0.03
簡單背景 復雜背景 綜合背景C 支持向量 誤識別率/(%)漏識別率/(%)識別率/(%)誤識別率/(%)漏識別率/(%)識別率/(%)誤識別率/(%)漏識別率/(%)識別率/(%)0.1 564 3.09 12.37 82.68 7.96 12.39 78.76 5.93 9.51 83.85 0.3 444 8.25 3.09 89.69 23.89 1.77 78.76 15.74 2.09 84.90 0.5 426 10.31 1.03 90.52 31.86 0.00 74.51 20.76 0.57 82.71 0.7 418 10.31 1.03 90.52 37.17 0.00 70.27 22.36 0.57 81.43 1 419 10.31 0.00 91.75 40.71 0.00 67.43 23.27 0.00 81.38 2.5 418 11.34 0.00 90.93 40.71 0.00 67.43 23.95 0.00 80.84
表2 C=0.5時改變核參數(shù)γ在不同背景下的識別結果Tab.2 Recognition results in different backgrounds with the change of parameter γ when C=0.5
圖4 γ=0.03時誤識別率和漏識別率隨C的變化趨勢Fig.4 The fault and omit recognition rate change trendence with parameter C when γ=0.03
從表1和圖4實驗結果可以得知,當固定網格搜索法+K交叉驗證推薦的γ值時,隨C的變化誤識別率與漏識別率成反比趨勢:C較小時,漏識別率比較高;當C增加時急劇降低,即性能得到迅速的提高;當增加到一定值時,漏識別率基本不再變化,即此時C變化幾乎不影響SVM的泛化能力。但由于泛化能力的迅速提高,誤識別率也在增大。由于誤識別可以通過添加規(guī)則排除,實際情況中更不希望漏識別的出現(xiàn),在對比三種背景數(shù)據后,選取0.5作為誤差懲罰因子C的最優(yōu)參數(shù)。
從表2和圖5中可以看出在固定誤差懲罰因子C時,隨γ的增加,三種背景下的識別率逐漸增長到峰值后回落,峰值時 γ=0.07,也就是說此時可以得到SVM 的最優(yōu)值。我們通過參數(shù)(C,γ)的變化,選取最優(yōu)參數(shù)組合來得到最終SVM的最優(yōu)值,即此時具有最佳識別率。
圖5 C=0.5時三種背景識別率隨γ變化趨勢Fig.5 Recognition rate change trendence with parameter γin different backgrounds when C=0.5
本文實驗所有數(shù)據來自于自采集,用Visual Studio 2008+OpenCV 2.4.3編程實現(xiàn),在進行HOG特征采集時,默認遍歷整張正樣本圖片,但對負樣本只隨機抽取10個塊做特征計算,因此輸入正負樣本比例并不平衡。本文通過改變樣本容量及樣本比例研究其對識別率的影響,實驗結果及分析如表 3所示。
表3 正負樣本比例改變時不同背景下的識別結果Tab.3 Recognition results in different backgrounds with the change of sample proportions
表 3是在正樣本數(shù) 300張,(C,γ)參數(shù)組合為(0.5,0.07)下得出的實驗數(shù)據,綜合圖 6、7可知,正負樣本比例在1:2~1:2.5間有最好識別效果。在增加正樣本數(shù)時,最優(yōu)樣本比例會有所下降,但仍大于1。當樣本容量足夠大時,將無限逼近于1。
圖6 不同樣本比例下誤識別率與漏識別率變化趨勢Fig.6 The fault and omit recognition rate change trendence with different sample proportions
圖7 不同樣本比例在不同景背下識別率變化趨勢Fig.7 Recognition rate change trendence in different backgrounds with different sample proportions
在盡可能降低漏識別率時,誤識別率也在增加,為了使誤識別率降低以提高識別效果,可以對 HOG檢測參數(shù)中的檢測窗口增長比例Ss進行優(yōu)化,該參數(shù)的優(yōu)化能同時提高識別速度。
從表4和圖8可以看出,Ss的增大會使誤識別率降低而提高漏識別率,當Ss在1.03~1.09間變化時,誤識別率降低較漏識別率提高明顯,當Ss繼續(xù)增大時,誤識別率與漏識別率趨于穩(wěn)定。
圖8 不同Ss誤識別率和漏識別率變化趨勢Fig.8 The fault and omit recognition rate change trendence with different Ss
表4 Ss對識別率與識別速度的影響Tab.4 The influence of Ss on recognition rate and speed
圖9顯示,隨著Ss增大,識別率有小幅提升,而識別用時大幅下降,當Ss大于1.5時,識別率與識別用時趨于穩(wěn)定。本文實驗所用的機器配置為CPU Core2 T6600 2.20GHz,內存4GB,處理圖像大小為2448×2050像素,綜合考慮識別率與識別時間關系,本文選取2.5為Ss最優(yōu)值。此時識別率為90.21%,識別平均用時為72.1ms,基本達到實時要求,可以為后期絕緣子故障檢測提供足夠時間。
圖9 不同Ss識別用時與識別率變化趨勢Fig.9 The recognition rate and speed trendence with different Ss
本文針對復雜的接觸網圖片背景下絕緣子識別、定位的困難,通過借鑒目前廣泛應用于行人檢測研究中的HOG特征,提出了一種新的絕緣子識別方法。通過對不同背景環(huán)境下絕緣子識別效果的分析,針對復雜的現(xiàn)場綜合環(huán)境優(yōu)化了 HOG算子及SVM參數(shù),在樣本量較小的情況下達到了較好的識別效果,并在一定程度上優(yōu)化了識別速度。由于樣本容量與誤識別排除算法的限制,該方法仍有很大的提升空間。
[1] 牛大鵬. 非接觸式接觸網幾何參數(shù)檢測系統(tǒng)研究[D]. 成都:西南交通大學,2008.
[2] 范虎偉,卞春華,朱挺,馬千里. 非接觸式接觸網定位器坡度自動檢測技術[J]. 計算機應用,2010(2):102-103+128.
[3] YANG Kai,WANG Li,GAO Xiao-rong,et al.Applica-tion of CCD Measurement Technique for Wear on Panto-graph Sliding Plates[C].4thInternational Symposium on Advanced Optical Manufacturing and Testing Technolo-gies:Optical Test and Measurement Technology and E-quipment.2009
[4] 韓志偉,劉志剛,陳坤峰等. 基于二代曲波系數(shù)定向映射的受電弓滑板裂紋檢測技術[J]. 鐵道學報,2011,33(11):63-69.
[5] 馬莉,王澤勇,高曉蓉,等. 圖像處理技術在受電弓滑板檢測中的應用[J]. 機車電傳動,2009,32(05):47-48,52.
[6] 楊紅梅,劉志剛,韓志偉,韓燁. 基于仿射不變矩的電氣化鐵路絕緣子片間夾雜異物檢測[J]. 鐵道學報,2013,35(4):30-36.
[7] 韓志偉,劉志剛,楊紅梅,韓燁. 基于二代曲波系數(shù)形態(tài)學條帶能量法的絕緣子故障檢測[J]. 鐵道學報,2013,35(3):36-40.
[8] 曾春,李曉華,周激流. 基于感興趣區(qū)梯度方向直方圖的行人檢測[J]. 計算機工程,2009,35(24):182-184.
[9] 常向魁,葉齊祥,劉先省,焦建彬,韓振軍. 基于綜合色度和梯度方向直方圖的運動目標跟蹤算法[J]. 河南大學學報(自然科學版),2007(6):629-634.
[10] Dalal N,Triggs B. Histograms of oriented gradients for human detection[C].Computer Vision and Pattern Recognition, CVPR, IEEE Computer Society Conference on. 2005
[11] 張學工. 關于統(tǒng)計學習理論與支持向量機[J]. 自動化學報,2000,01:36-46.
[12] 鄧乃揚,田英杰. 數(shù)據挖掘中的新方法:支持向量機[M]. 北京:科學出版社,2004