李遠(yuǎn)江 張 華 王 姮 張 靜
(西南科技大學(xué)特殊環(huán)境機(jī)器人技術(shù)四川省重點(diǎn)實(shí)驗(yàn)室 四川 綿陽621010)
?
基于支持向量機(jī)的磁粉探傷智能識(shí)別算法
李遠(yuǎn)江 張 華 王 姮 張 靜
(西南科技大學(xué)特殊環(huán)境機(jī)器人技術(shù)四川省重點(diǎn)實(shí)驗(yàn)室 四川 綿陽621010)
磁痕圖像的自動(dòng)分類方法是磁粉探傷智能化的關(guān)鍵技術(shù)之一。針對(duì)目前磁粉探傷自動(dòng)識(shí)別漏識(shí)率和虛警率高的問題,提出采用支持向量機(jī)算法后驗(yàn)概率輸出的判斷方式對(duì)磁痕圖像進(jìn)行分類。對(duì)采集到的圖像進(jìn)行預(yù)處理和特征提取,然后使用支持向量機(jī)對(duì)特征數(shù)據(jù)處理得到后驗(yàn)概率,利用此后驗(yàn)概率得到分類信息將結(jié)果映射為有無裂紋與類別模糊區(qū)三類,實(shí)現(xiàn)智能識(shí)別。實(shí)驗(yàn)證明算法的有效識(shí)別率高,在漏檢率和虛警率上取得了較好的平衡。
磁粉探傷 支持向量機(jī) 類別模糊區(qū) 漏檢率 虛警率
磁粉探傷又叫磁粉檢測,是無損檢測五大常規(guī)方法之一,工業(yè)應(yīng)用十分廣泛。缺陷判別技術(shù)是磁粉檢測中關(guān)鍵技術(shù)之一,傳統(tǒng)的缺陷判別主要采用人工判別方式,存在著檢測速度慢、效率低,容易因疲勞導(dǎo)致漏判、檢測質(zhì)量一致性難以保證等問題[1]。圍繞磁粉探傷的智能化、自動(dòng)化技術(shù)國內(nèi)外相關(guān)專家學(xué)者展開了深入研究[1-3],并取得了一定的成果,但由于工件缺陷的多樣性和復(fù)雜性,目前的磁粉探傷自動(dòng)化系統(tǒng)均存在著漏識(shí)率和虛警率高而無法實(shí)際投入使用的問題。目前大多數(shù)的研究都是基于圖像處理技術(shù)。文獻(xiàn)[4]對(duì)磁痕圖像的分割算法進(jìn)行了研究;文獻(xiàn)[5]利用二維直方圖結(jié)合Fisher判別方法進(jìn)行的缺陷識(shí)別研究,主要對(duì)裂紋提取進(jìn)行了研究,對(duì)判別結(jié)果分析較少;文獻(xiàn)[6]引入了智能算法支持向量機(jī)(SVM)對(duì)磁粉圖像進(jìn)行分類,文中使用的是SVM硬分類,誤識(shí)率較高;文獻(xiàn)[7-8]對(duì)支持向量機(jī)的后驗(yàn)概率進(jìn)行了研究,擴(kuò)展了SVM的使用范圍。
針對(duì)智能分類算法存在錯(cuò)分類的事實(shí)和磁粉檢測對(duì)漏檢的高要求,本文使用智能分類算法即利用支持向量機(jī)算法的后驗(yàn)概率輸出,同時(shí)結(jié)合閾值參數(shù),將判別結(jié)果映射為三類:有裂紋、無裂紋、模糊區(qū)。支持向量機(jī)適用于小樣本分類的特點(diǎn)[9],很適合在磁粉檢測領(lǐng)域中運(yùn)用,同時(shí)使用后驗(yàn)概率輸出結(jié)合參數(shù)調(diào)整將輸出結(jié)果映射為3種情況,這種改進(jìn)能夠解決當(dāng)樣本特征模糊時(shí)的錯(cuò)分類,同時(shí)通過參數(shù)適當(dāng)?shù)恼{(diào)節(jié)能夠讓漏檢率下降為接近于0,使算法更貼近實(shí)際應(yīng)用。
磁粉探傷是利用鐵磁性材料磁化后會(huì)產(chǎn)生剩磁,然后在裂縫處形成漏磁而吸附熒光磁粉,當(dāng)紫外光照射時(shí)熒光磁粉會(huì)發(fā)出黃綠色亮光,在圖像中呈現(xiàn)出高亮特征(圖2),判斷裂紋時(shí)主要是根據(jù)高亮區(qū)域的特點(diǎn)。因此,本系統(tǒng)是建立在前期圖像處理結(jié)果之上的一個(gè)典型的模式分類系統(tǒng),系統(tǒng)框圖如圖1所示。讀取圖像后首先進(jìn)行圖像預(yù)處理,分離疑似裂紋部分再進(jìn)一步進(jìn)行特征提取,然后輸入SVM分類器得到后驗(yàn)概率,再與訓(xùn)練集得到的閾值進(jìn)行比較判斷是否為模糊區(qū)域,得到判斷結(jié)果。
圖1 系統(tǒng)框圖Fig.1 System block diagram
在圖像預(yù)處理步驟中主要是根據(jù)裂紋圖像區(qū)域高亮、連續(xù)、暫變的特點(diǎn),通過圖像平滑和增強(qiáng)將目標(biāo)圖像中的疑似裂紋部分突出并與背景圖像分離,然后對(duì)圖像進(jìn)行連通域標(biāo)記處理,將互相鄰接(本文采用8鄰域) 的疑似裂紋部分的像素集合提取出來,并為圖像中不同的連通域記錄不等的數(shù)字標(biāo)記,為下一步特征提取做準(zhǔn)備。圖3是熒光磁粉圖像處理后的典型結(jié)果圖像。
圖2 熒光磁粉圖像Fig.2 Image of fluorescent magnetic particle
圖3 熒光磁粉圖像預(yù)處理結(jié)果Fig.3 Pretreatment image of fluorescent magnetic particle
1.1 特征提取研究
選取適當(dāng)?shù)奶卣鲗?duì)分類算法有十分重要的意義,根據(jù)磁粉檢測工藝過程以及裂紋在圖像中所呈現(xiàn)的特點(diǎn),選取了典型的5種特征。這里的特征提取是針對(duì)圖像預(yù)處理后的圖片(即圖3)中的連通區(qū)域部分,此部分即為可能的裂紋區(qū)域。
(1)面積特征:統(tǒng)計(jì)連通區(qū)域的像素個(gè)數(shù)作為面積Area特征的量化代表。
(2)周長特征:圍成各連通區(qū)域的邊緣像素個(gè)數(shù)作為周長Peri特征。
(4)圓形度特征:R=(4π*Area)/Peri2,圓形度是由面積與周長的平方比值得到,主要反映目標(biāo)區(qū)域的緊湊程度以及與圓的相似程度。
(5)矩形度:R=Area/(H*W);其中H為區(qū)域高度,W為區(qū)域?qū)挾?。矩形度反映了目?biāo)區(qū)域?qū)ζ渥钚⊥饨泳匦蔚某錆M程度,對(duì)任意區(qū)域R的取值在R∈(0,1),當(dāng)區(qū)域?yàn)榫匦螘r(shí)R將取得最大值1。
這5種特征有效描述了裂紋的特點(diǎn),基本能夠代表圖像中有關(guān)裂紋的信息,對(duì)每一幅預(yù)處理過后的圖像進(jìn)行特征提取處理就得到了支持向量機(jī)訓(xùn)練和分類測試的數(shù)據(jù)。
1.2 支持向量機(jī)分類
磁痕圖像分類的特點(diǎn)是樣本量少,對(duì)錯(cuò)分類要求較高,基于統(tǒng)計(jì)學(xué)習(xí)的支持向量機(jī)是針對(duì)小樣本情況最佳的智能分類算法,相對(duì)于其他分類算法保持了較好的性能[10]。支持向量機(jī)的基本思想是假定已知觀測樣本集:Z={(xi,yi)|xi∈Rn,yi∈(-1,+1),i=1,2,…m}(其中xi是n維空間中的向量,yi是xi所屬類的標(biāo)識(shí))能夠被超平面(w,x)-b=0分類,這個(gè)超平面稱為最優(yōu)超平面,為了尋找這個(gè)最優(yōu)超平面需要求解下面的二次優(yōu)化問題[11-12]:
s.tyi(
εi≥0
(1)
其中w是超平面的法向量,b是超平面的偏移量,C是指定的懲罰因子,
s.t. 0≤ai≤C,i=1,2…m,
(2)
其中ai是Lagrange算子。求解此對(duì)偶問題得
(3)
由此得到最終的判別函數(shù)為
(4)
式中yi是類別標(biāo)簽,k(xi,x)為核函數(shù),ai和b是利用SVM方法在樣本訓(xùn)練集中訓(xùn)練的參數(shù)。此處的支持向量機(jī)是由Vapnik提出的一種標(biāo)準(zhǔn)支持向量機(jī),是各種基于支持向量機(jī)分類的基礎(chǔ)。由于這種標(biāo)準(zhǔn)支持向量機(jī)的輸出是硬輸出,即輸出只有待預(yù)測樣本的所屬類別,在這個(gè)過程中本質(zhì)上是對(duì)分類信息進(jìn)行了模糊化處理,丟棄部分細(xì)節(jié)以得到分類結(jié)果,在磁粉檢測的裂紋圖像識(shí)別中這部分細(xì)節(jié)即為有無裂紋的判別概率,是一個(gè)十分重要的信息,所以本文在標(biāo)準(zhǔn)支持向量機(jī)的基礎(chǔ)之上結(jié)合了后驗(yàn)概率輸出的方法來進(jìn)行磁粉檢測目標(biāo)圖像的分類。
2 基于支持向量機(jī)后驗(yàn)概率輸出的映射方法
對(duì)SVM后驗(yàn)概率輸出已有不少研究,Vapnik研究了SVM與Logistic回歸之間的關(guān)系,提出了一種將SVM的離散輸出映射為概率的方法。此方法雖能得到樣本的后驗(yàn)概率,缺點(diǎn)是對(duì)每個(gè)樣本都需要求解一個(gè)線性方程組,影響了求解速度。Wahha和Platt先后對(duì)此方法進(jìn)行了改進(jìn),本文基于platt提出的Sigmoid函數(shù)模型將支持向量機(jī)決策函數(shù)的輸出映射為類后驗(yàn)概率的算法。其目標(biāo)函數(shù)形式如下[13]:
f=f(x)
(5)
其中,f是相應(yīng)樣本的函數(shù)值,A,B是Sigmoid函數(shù)形態(tài)參數(shù),通過以下最大似然函數(shù)問題求解得到參數(shù)值:
(6)
其中:pi=1/exp(Afi+B),ti由下式確定:
(7)
其中,N+,N-分別為正負(fù)樣本數(shù)。
由式(4)得到樣本的SVM分類結(jié)果,在此基礎(chǔ)上由式(5)得到樣本是有裂紋或無裂紋類別的概率P(xi|+1),P(xi|-1),其中+1表示有裂紋,-1表示無裂紋。針對(duì)磁粉檢測領(lǐng)域應(yīng)用的特點(diǎn),本文在得到后驗(yàn)概率后對(duì)二者做差得到:
Pbi=|P(xi|+1)-P(xi|-1)|
(8)
其中 Pbi∈(0,1)
這里根據(jù)Pbi的值將結(jié)果分為三類,即有裂紋,無裂紋、模糊區(qū)域。這個(gè)過程中增加了一個(gè)與Pbi進(jìn)行比較的模糊區(qū)域判斷的閾值mt(mt∈(0,1)),它所代表的含義是在實(shí)際應(yīng)用中分類器輸出兩類的接近率,當(dāng)mt值較大時(shí)表示在這個(gè)區(qū)間以內(nèi)的接近率都屬于類別模糊區(qū)域,也即對(duì)錯(cuò)分類代價(jià)更大,當(dāng)mt值較小時(shí)表示更小的接近率才屬于類別模糊區(qū)域,則表示錯(cuò)分類代價(jià)更小,同時(shí)若把類別模糊區(qū)域和有裂紋都稱之為報(bào)警,那么通過對(duì)mt的調(diào)節(jié)還能夠表示漏檢率和虛警率之間的調(diào)節(jié),當(dāng)mt較小時(shí)表示允許漏檢率更大虛警率就更小,當(dāng)mt更大時(shí)表示允許漏檢率更小,則虛警率更大。
為搭建實(shí)驗(yàn)平臺(tái),此處選用臺(tái)灣林智仁教授及其團(tuán)隊(duì)實(shí)現(xiàn)的開源libSVM[14],在其基礎(chǔ)上進(jìn)行實(shí)驗(yàn)驗(yàn)證。在對(duì)樣本圖片進(jìn)行預(yù)處理后對(duì)圖像進(jìn)行特征提取,部分樣本特征如表1所示。
表1 部分樣本特征Table 1 Part of the sample characteristics
表1記錄了對(duì)樣本圖片的連通域進(jìn)行特征描述的特征值。特征值的計(jì)算方式已在1.1節(jié)中有詳述。由于樣本量太大表中只列出了部分樣本。
此處選取962個(gè)訓(xùn)練樣本,兩組測試樣本:第一組623個(gè)測試樣本,第二組700個(gè)測試樣本。得到樣本的特征數(shù)據(jù)后,先將這些特征數(shù)據(jù)轉(zhuǎn)換為滿足libSVM的數(shù)據(jù)格式,然后利用其中的訓(xùn)練函數(shù)進(jìn)行樣本訓(xùn)練。這里選用的核函數(shù)為徑向基函數(shù),為了能夠得到較好的分類效果,需要仔細(xì)選擇SVM的參數(shù),即懲罰因子和徑向基核函數(shù)的參數(shù),采用交叉驗(yàn)證法進(jìn)行參數(shù)尋優(yōu),當(dāng)C=3,g=0.266 393時(shí)是較好的參數(shù),得到分類的正確率為82.925 7%,并且很容易得到錯(cuò)誤樣本的編號(hào):19,20,43,46,49,50,58,63,73…。在libSVM基礎(chǔ)上利用公式(5)得到測試樣本的后驗(yàn)概率,前70個(gè)測試樣本的兩類概率折線對(duì)比分布圖如圖4所示。
由圖4和錯(cuò)分類樣本的編號(hào)容易發(fā)現(xiàn),錯(cuò)分類樣本的地方基本是在兩類樣本概率接近和有交叉的地方,由此可以得出模糊區(qū)域樣本即為出現(xiàn)類似情況的樣本。由圖5中的上水平線和下線水平線做差就得到了模糊區(qū)域判斷的經(jīng)驗(yàn)閾值mt,當(dāng)?shù)玫綐颖緦?duì)兩類的概率后由式(8)得到概率之差Pbi,當(dāng)Pbi>mt時(shí)就相信SVM的判別結(jié)果,將其類別輸出作為判別結(jié)果:有裂紋或無裂紋,當(dāng)Pbi 圖4 測試樣本兩類概率對(duì)比圖Fig.4 Two types of probability of test samples 圖5 類別模糊區(qū)域Fig.5 Fuzzy region of categories 表2 分類測試結(jié)果Table 2 Classified test results 在系統(tǒng)中加入閾值mt后,當(dāng)判別程序執(zhí)行碰到處于模糊區(qū)域樣本時(shí)就暫停并報(bào)警,由此判別正確率達(dá)到了99.5%,漏檢率為0,即沒有將有裂紋判別為無裂紋。實(shí)驗(yàn)證明加入模糊區(qū)域判斷的閾值mt后在虛警率較低的情況下有效地減少了錯(cuò)分類,降低了漏檢率,并且通過調(diào)節(jié)這個(gè)值的大小能夠調(diào)節(jié)報(bào)警與錯(cuò)分類率的關(guān)系,同時(shí)達(dá)到了接近于0的漏檢率。 本文針對(duì)磁痕圖像的智能分類采用了支持向量機(jī)后驗(yàn)概率輸出映射方法,實(shí)現(xiàn)了智能分類算法。對(duì)預(yù)處理后的磁痕圖像進(jìn)行特征提取,通過訓(xùn)練集得到判別模型和模糊區(qū)域閾值參數(shù),然后對(duì)樣本進(jìn)行預(yù)測分類,綜合考慮了系統(tǒng)對(duì)漏檢率和虛警率的要求。實(shí)驗(yàn)表明本算法有效降低了錯(cuò)分類率,在漏檢率和虛警率之間取得了較好平衡。模糊區(qū)域閾值參數(shù)的優(yōu)化選取和進(jìn)一步降低虛警率是下一步的研究工作。 [1] 吳海濱,張杰,陳軍,等.基于CCD成像的綸箍表面熒光磁粉探傷方法及缺陷圖像處理研究[J].大氣與環(huán)境光學(xué)學(xué)報(bào),2006,(1):155-160. [2] 朱凌云,曹長修.基于支持向量機(jī)的缺陷識(shí)別方法[J].重慶大學(xué)學(xué)報(bào):自然科學(xué)版,2002,25(6):42-45. [3] 周軍,彭培欣.自動(dòng)磁粉探傷系統(tǒng)中的圖像技術(shù)[J].儀器儀表學(xué)報(bào),2003,24(4):461-463. [4] 陸寶春,李建文,王婧,等.基于特征差異性的熒光磁粉探傷圖像分割算法[J].南京理工大學(xué)學(xué)報(bào),2011,35(6):797-800. [5] 吳海超,曾奇夫,查蘇倩.熒光磁粉探傷裂紋智能識(shí)別圖像處理研究[J].鐵道技術(shù)監(jiān)督,2010,38(10):6-10. [6] 黃濤.全自動(dòng)熒光磁粉探傷中目標(biāo)識(shí)別圖像處理技術(shù)研究[D].南京,南京理工大學(xué),2012. [7] 張翔,肖小玲,徐光.支持向量機(jī)方法中加權(quán)后驗(yàn)概率建模方法[J].清華大學(xué)學(xué)報(bào):自然科學(xué)版,2007,(47)10:1689-1691. [8] 吳高巍,陶卿,王玨.基于后驗(yàn)概率的支持向量機(jī)[J].計(jì)算機(jī)研究與發(fā)展,2005,42(2):196-202. [9] GAO Yang,WANG Xue-song,CHENG Yu-hu. Fault diagnosis using a probability least squares support vector classification machine[J].Mining Science and Technology,2010,20(6):917-921. [10] DUDA R O, HART P E, STORK D G. Pattern Classification[M].Second Edition. New York:John Wiley&Sons,2001.220-231. [11] VAPNIK V. The Nature of Statistical Learning Theory[M].Springer-Verlag,1995.244-249. [12] LI Wei-jun, LIU Zhen-yu. A method of SVM with Normalization in Intrusion Detection [J]. Procedia Environmental Sciences, 2011, (11), 256-262. [13] PLATT J C. Probabilistic output for support vector machines and comparisons to regularized likelihood methods[C]. In Advances in Large Margin Classifies. Cambridge, MA: MIT Press. 1999 . [14] 朱培根,梅衛(wèi)江,石秀鋒,等.基于LibSVM代用燃料有效功率增量預(yù)測方法的研究[J].石河子大學(xué)學(xué)報(bào):自然科學(xué)版,2012,30(5):657-660. Intelligent Recognition Algorithm Based on Support Vector Machine Magnetic Particle Detection LI Yuan-jiang, ZHANG Hua, WANG Heng, ZHANG Jing (KeyLaboratoriesforSpecialEnvironmentRobotTechnologyofSichuanProvince,SouthwestUniversityofScienceandTechnology,Mianyang621010,Sichuan,China) The automatic classification method for magnetic images is one of the key technologies of intelligent magnetic particle inspection. Aiming at the problem of identifying both leakage recognition rate and false alarm rate by the magnetic particle detector automatically, a method using support vector machine algorithm outputs to posterior probabilities to classify the magnetic images is proposed. After pre-processing the collected images and extracting their feature accordingly, the support vector machine was used to process characteristic data to get a posteriori probability, which was then used to obtain the classified information of the following three categories: cracks, no cracks and a fuzzy area, and finally an intelligent recognition system was achieved. The experimental system was established to prove the effective recognition rate of the algorithm and a better balance between the leakage recognition rate and false alarm rate was obtained. Magnetic particle detector; Support vector machine; Fuzzy zone of categories; Leakage recognition rate; False alarm rate 2014-10-08 四川省科技支撐計(jì)劃項(xiàng)目(2013GZX0152);四川省科技廳科技支撐計(jì)劃項(xiàng)目(2014RZ0049)。 李遠(yuǎn)江(1988—)男,碩士,研究方向?yàn)闄C(jī)器學(xué)習(xí),智能控制。E-mail:lyjliyuan@sina.com TP181 A 1671-8755(2015)01-0066-054 結(jié)束語