王偵倪,高煒欣,湯 楠
(1.西安石油大學(xué) 陜西省油氣井測控技術(shù)重點實驗室,陜西 西安 710065;2.西安石油大學(xué) 光電油氣測井與檢測教育部重點實驗室,陜西 西安 710065)
焊縫檢測的方法有很多,其中,基于X射線圖像的缺陷檢測是目前應(yīng)用最為廣泛的無損檢測方法[1]。多數(shù)算法都是先提取焊縫圖像,根據(jù)圖像處理的方法判別缺陷圖像類型。在已有的研究中,文獻[2]使用一種基于水平集[3]的主動輪廓模型 Chan-Vese模型[4]對焊縫缺陷進行分割,這種方法對對比度明顯的缺陷圖像有較好的判斷效果,但不能準確判斷不明顯的缺陷。文獻[5]提出先確定焊縫圖像位置,然后利用形態(tài)學(xué)對焊縫圖像進行缺陷檢測的方法,提高了判別的準確性。文獻[6]指出利用部分缺陷的方法,在觀察到存在缺陷的位置采取分水嶺變換和子束變換分割出焊縫缺陷。文獻[7]在檢查較厚的器件時發(fā)現(xiàn)器件不能及時同步且存在噪聲較大等干擾因素,利用消除法和波形分析法檢測出焊縫缺陷。文獻[8]在對缺陷類型識別之前,對采集到的圖像首先處理模糊邊緣,采用了傳統(tǒng)的圖像分割方法(如邊緣檢測法和閾值分割法)。文獻[9]指出文獻[8]提取真實邊沿比較困難,基于文獻[8]的問題,文獻[9]提出基于支持向量機的焊縫缺陷檢測方法,這種方法是先對樣本進行訓(xùn)練,針對所得模型分割缺陷圖像。
從現(xiàn)有的研究可以看出,大多數(shù)缺陷識別都要首先將缺陷進行分割,根據(jù)分割后缺陷幾何或紋理特征判斷缺陷的類別。但焊縫圖像具有較高的噪聲,缺陷對比度較差,清晰度較低,為實現(xiàn)缺陷的準確分割帶來困難進而影響到缺陷特征的準確求取。針對以上問題,許多學(xué)者提出了很多解決方法。Zapata[10]等人提出一種基于自適應(yīng)網(wǎng)絡(luò)的模糊推理系統(tǒng)(ANFIS)。利用缺陷形狀與主方向特征等12個幾何特征并使用ANFIS進行缺陷分類。Zhao[11]等人對缺陷提取了隨機分布三角形特征,并使用稀疏表示分類器(SRC)進行缺陷分類,相比SVM,有更好的識別率。這些方法在一定程度上可以從缺陷圖像中檢測出缺陷,但這些方法幾乎都是對焊縫缺陷圖像進行分割,獲得閾值判斷缺陷類型。因為現(xiàn)場提取的 X射線焊縫圖像本身辨別度不高、灰度較為分散,焊縫缺陷邊沿不明確,而且由于噪聲的干擾,這些都增大了閾值準確分割的難度。為了避免缺陷圖像的分割,簡化識別過程,提高判別的精確度,本文基于稀疏描述的原理[12],提出一種缺陷識別的方法,通過模式識別,將現(xiàn)場提取的原始圖像分為有、無缺陷圖像并作為樣本,對待檢測圖像進行線性組合,通過系數(shù)向量分析直接判斷缺陷和噪聲,避免了特征值計算,達到良好的識別效果。
現(xiàn)場提取的實際焊縫圖像及焊縫整體灰度直方圖如圖1所示。通常情況下,原始焊縫圖像主要存在圖像較小和噪聲影響兩方面的問題。造成這類問題通常有2個原因:第一,檢測的焊縫圖像是制件的焊縫經(jīng)過 X射線透視后,在膠卷上感受光產(chǎn)生陰影,轉(zhuǎn)化為數(shù)字圖像文件后,存在灰度較為聚集、對比度不高且缺陷特征被淹沒等問題。第二,處理圖像的每一個過程及處理結(jié)果都要受到噪聲的影響。由圖像的灰度直方圖可以看出圖像是否清晰,由圖1可知,完整的焊縫圖像灰度直方圖偏向于右邊一側(cè),圖像較為明亮,且直方圖較為集中,說明圖像本身對比度不高,存在的缺陷將難以被肉眼識別。基于以上問題,本文引用疑似局部圖像的概念,如圖2所示為疑似缺陷外切矩形。圖3為分割出的SDR及灰度直方圖,該直方圖相比于圖1灰度勻稱分布,圖像清晰,易于判斷。本文采用模式識別的方法,通過研究模板圖像,根據(jù)“疑似局部圖像”判別,增大了判斷的準確率,避免了缺陷圖像的準確分割和特征值的計算。
圖1 X射線焊縫圖像及灰度直方圖Fig.1 X-ray weld image and grayscale histogram
圖2 疑似局部圖像定義Fig.2 Suspected local image definition
圖3 缺陷圖像及灰度直方圖Fig.3 Defect image and grayscale histogram
基于小波分析理論,Mallat 和 Zhang 在1993年首次解釋了信號在過完備基上分解的構(gòu)想[13]。在現(xiàn)場提取未經(jīng)處理的圖像數(shù)據(jù)較大,而將圖像進行稀疏表示能夠壓縮圖像,加快計算過程,所以在圖像處理領(lǐng)域得到了廣泛應(yīng)用。
圖像信號主要包括兩種稀疏模型(合成稀疏模型和分析稀疏模型),本文中圖像信號模型為合成稀疏模型,這種模型是指對于給定的一組信號都可以在過完備字典的基元張成的空間下表示,其系數(shù)只有少數(shù)的非零元素,大部分系數(shù)值都相對較小,接近為零,這樣可以認為信號在該字典下能夠稀疏表示。未經(jīng)處理的自然信號一般情況下在時域內(nèi)都是非稀疏的,數(shù)據(jù)量大,增加了圖像處理的難度,但是這些信號可以通過某些變換域成為稀疏信號,通過稀疏表示原始圖像的信息,降低了計算的難度。由調(diào)和理論可知,用向量f表示一維離散時間信號,它的長度為N,用一組標準正交基的線性組合可以表示f:
(1)
圖像識別是先將訓(xùn)練樣本進行k類標記,將采集到的原始圖像與訓(xùn)練樣本比對,然后判斷待檢圖像是否符合樣本的所屬類型。設(shè)待檢測圖像和樣本圖像的分辨率為h×w,將每幅圖像的像素點按照列優(yōu)先的原則變換成為一個列向量f∈Rm,m=h×w,那么n個訓(xùn)練圖像組成字典矩陣(也稱基矩陣)
A=[f1,f2,…fn] ∈Rm×n。
在壓縮傳感理論中,矩陣A被稱為字典矩陣。假定字典矩陣A對應(yīng)的合成矩陣為ψ,則超完備稀疏表示就是從所有表示中找出分解系數(shù)最為稀疏的一個,即:
(2)
在稀疏表示的框架下,當有足夠多的樣本圖像時,焊縫圖可由樣本圖像線性組合。設(shè)y為待檢測圖像,則將y表示為
y=a1f1+a2f2+…+anfn。
(3)
其中,ai∈R為實系數(shù)。
本文從數(shù)據(jù)庫中采集了部分管道焊縫的SDR圖像,將圖像分類為圓形缺陷樣本、線形缺陷樣本和噪聲樣本,如圖4所示。從圖4可以看出,X射線檢測出的焊縫圖像無論缺陷或是噪聲都具有一定的相似性。本文將樣本圖像進行分類排列,分為“正?!焙汀叭毕荨眱深?。設(shè)“正?!眻D像有k個,“缺陷”圖像有n-k個,則將A向量按照下式重新排列。
A={f1,f2,…fk,fk+1,…fn}。
(4)
該分解過程借助字典A,對于一組給定的圖像向量化信號y,考慮其為字典A中少數(shù)基元的線性組合,其線性方程為:
y=A·x。
(5)
圖4 缺陷及噪聲樣本Fig.4 Defect and noise samples
為了獲取較好的重建結(jié)果,本文提出了通過學(xué)習(xí)獲得字典矩陣實現(xiàn)優(yōu)化。在基于過完備稀疏表示的圖像處理中,刪除相關(guān)性較大的SDR圖像,由某種特定字典稀疏表示特定種類的SDR圖像。利用字典矩陣向量的相關(guān)性,即通過求解
(6)
構(gòu)建焊縫缺陷字典矩陣學(xué)習(xí)模型。式中,ψi為字典矩陣ψ第i列元素。式(6)的求解式目標是通過求解各列的相關(guān)性,以相關(guān)性最小為原則構(gòu)造字典矩陣模型。
圖5 SDR相關(guān)性統(tǒng)計曲線Fig.5 SDR correlation statistic curve
由圖5拐點位置可知,總樣本數(shù)量在40~100之間即可滿足要求。本文提出利用貪心算法確定最佳的樣本數(shù)量及對應(yīng)的字典矩陣。即通過求解式(6)完成樣本選擇。
貪心求解策略描述如下:
(1)將每個圓形SDR、線形SDR、噪聲SDR依次掃描,將圖像的像素點按照列優(yōu)先的原則逐個變換成一個列向量,最后生成3個樣本矩陣;
(3)首先選取相關(guān)性最小的兩列為局部最優(yōu)解,然后由小到大依次選取,重復(fù)此過程,刪除重復(fù)選取列,直到滿足最優(yōu)樣本數(shù)量組成全局最優(yōu)解,算法結(jié)束。
若將大部分的信號進行變換,則信號可以稀疏表示,所以為了得到信號y在A上的稀疏系數(shù)向量,求解該問題可以化為零范數(shù)最小化問題。即有
(7)
零范數(shù)問題可以看成是線性規(guī)劃問題,近期的研究理論表明只要信號是稀疏的,可以采用凸-凹優(yōu)化技術(shù)實現(xiàn)對優(yōu)化問題的求解,即可以通過求解凸優(yōu)化問題準確地表示信號。零范數(shù)最小化問題是非凸問題,很難求解,因此本文引入如下g(x)函數(shù):
(8)
其中Δ為歸一化系數(shù)。式(8)的曲線如圖6所示。
由于凸優(yōu)化的良好性能,所以判斷函數(shù)是否為凸函數(shù)成為解決優(yōu)化問題的關(guān)鍵。通過計算可知,g(x)為下凸函數(shù)。
判定算法的流程圖如圖7所示。
圖6 g(x)函數(shù)值Fig.6 g(x) function
圖7 g(x)判定算法的過程流程Fig.7 Process of g(x) decision algorithm
g(x)為光滑連續(xù)函數(shù),可以求導(dǎo)。因此,可以通過引入g(x),將式(7)轉(zhuǎn)化為
(9)
其中,K為懲罰項系數(shù),求解式(9)可以方便地獲得系數(shù)向量。
采用最速下降法求解式(9),步驟如下:
Step1: 選取初始點x0∈Rn,允許誤差0<ε<1,令迭代次數(shù)p=200。
Step3:令αp=0.000 1,計算xp+1=xp+αpdp,轉(zhuǎn)Step2。
實驗從數(shù)據(jù)庫一共選取缺陷SDR和噪聲SDR各60張,再另選100張真實缺陷和100張噪聲SDR作為待檢測圖像,如圖8所示。首先將樣本圖像轉(zhuǎn)化為灰度圖,由于圖像大小不一樣,實驗通過選擇不同的歸一化尺寸將圖像大小統(tǒng)一化,然后采用列首尾相接方式把每副圖像重排為列向量,再將所有列向量組合為樣本矩陣A,按上述方法待檢測圖像組成列向量。本文與傳統(tǒng)算法不同,直接研究樣本圖像判斷缺陷。
在進行實驗前,首先建立混淆矩陣,格式見表1。
圖8 100組缺陷圖像和100組噪聲圖像Fig.8 Images of 100 groups of defects and noise
檢測為有缺陷檢測為無缺陷存在缺陷圖片(真正,true positive,TP)(假負,false negative,FN)未存在缺陷圖片(假正,false positive,FP)(真負,true negative,TN)
由混淆矩陣得出敏感度和特異度公式如下:
(10)
(11)
由于噪聲圖像和缺陷圖像的大小不同,不能直接運用到求解過程。而且圖像的大小影響缺陷特征的清晰度、對比度,當尺寸選擇較小時,圖像特征不明顯,尺寸選擇較大會導(dǎo)致缺陷邊緣模糊,選擇合適的尺寸對提高焊縫缺陷識別的準確率具有重要意義。因而在對焊縫缺陷圖像進行檢測與識別之前,對圖像大小歸一化是必不可少的步驟。圖9為經(jīng)過不同的歸一化的圖像對比。實驗首先研究了取不同歸一化圖像尺寸對識別結(jié)果的影響,然后在分析尺寸影響的基礎(chǔ)上,選擇最優(yōu)尺寸建立樣本矩陣與測試矩陣完成識別過程。其次選取不同的懲罰項系數(shù)K,在分析其對識別結(jié)果的影響的基礎(chǔ)上,確定最優(yōu)系數(shù)。綜上,可以通過減少樣本數(shù)量,簡化計算過程,在確定最優(yōu)尺寸及最優(yōu)系數(shù)后,分析不同的樣本數(shù)量對分類準確性的影響。
圖9 樣本歸一化圖像Fig.9 Normalized images of sample
(1) 尺度歸一化影響
實驗選取了5組尺寸數(shù)據(jù)對圖像歸一化,所得的混淆矩陣如表2所示。由表選取20*20是最佳歸一化尺寸。
表2 歸一化計算結(jié)果Tab.2 Normalized calculation result
(2)懲罰項系數(shù)K的影響
實驗確定歸一化大小為20*20,隨機選取5組懲罰系數(shù),判斷懲罰系數(shù)的大小是否會對缺陷的識別產(chǎn)生影響。識別準確率見表3。
表3 K值計算結(jié)果Tab.3 Calculation results of K
由表3可見,懲罰項系數(shù)對焊縫缺陷識別的準確率沒有影響。
(3)樣本數(shù)量的影響
根據(jù)上述實驗結(jié)果,本文將SDR歸一化為20*20的模板,確定懲罰項系數(shù)K=5。在原有的樣本的基礎(chǔ)上,通過貪心算法把樣本數(shù)量分別減少為40,60,80,100,識別效果見表4。
表4 樣本數(shù)計算結(jié)果Tab.4 Sample number calculation result
由表4可知,當選擇樣本總數(shù)為80,即包括20張圓形缺陷,20張線形缺陷,40張噪聲SDR時,識別準確率達到最高。所以減少樣本數(shù)量不僅能夠簡化算法,還能提高判斷的準確率。故本文最終選用80張SDR構(gòu)成字典矩陣。
本文提出了基于稀疏描述的焊縫缺陷識別的方法,首先通過壓縮感知傳感技術(shù)對圖像進行處理,采用罰函數(shù)法求解零范數(shù),求解結(jié)果為一組系數(shù),分析系數(shù)組合判斷缺陷。相比于其他識別方法而言,避免了特征值的計算,通過貪心算法選取最優(yōu)樣本數(shù)量既簡化了計算過程,又提高了識別的準確性。