, , ,運(yùn)杰
(山東科技大學(xué) 電子通信與物理學(xué)院,山東 青島 266590)
我國(guó)礦產(chǎn)資源豐富,煤炭作為最重要的戰(zhàn)略資源在經(jīng)濟(jì)發(fā)展中有著舉足輕重的作用。煤炭開采過(guò)程中矸石的混入極大地影響了煤的使用效率,煤與矸石的分選是煤炭利用過(guò)程中不可或缺的環(huán)節(jié)[1]。機(jī)器視覺技術(shù)[2]具有通用性強(qiáng)且易于實(shí)施的特點(diǎn),可以實(shí)現(xiàn)非接觸式的檢測(cè),利于環(huán)境保護(hù),適用于煤炭開采這種重復(fù)性的工業(yè)生產(chǎn),煤與矸石識(shí)別的關(guān)鍵在于如何有效地表達(dá)煤與矸石圖像特征,特征提取的好壞將會(huì)直接影響分類識(shí)別的結(jié)果。于國(guó)防等[3]提出了利用灰度值進(jìn)行煤和矸石圖像識(shí)別的方法,但需要一定輔助條件,并且過(guò)程比較復(fù)雜;王祥瑞[4]提出的煤與矸石圖像特征提取方法較為簡(jiǎn)單,但基于灰度值的特征提取方式單一,在煤礦特定環(huán)境下影響識(shí)別的準(zhǔn)確度,不能滿足實(shí)際需求;何敏等[5]采用了灰度共生矩陣的特征提取方法,由于提取到的特征參數(shù)比較少,容易影響識(shí)別的結(jié)果;廖陽(yáng)陽(yáng)等[6]采用BP網(wǎng)絡(luò)的識(shí)別方法,因受到實(shí)驗(yàn)樣本差異的影響,其識(shí)別精度不高。而且上述特征提取方法難以適應(yīng)在實(shí)際環(huán)境情況下的分類識(shí)別,準(zhǔn)確率也有待提高,因此需要研究可以精確描述煤與矸石圖像的特征提取方法。
近年來(lái),字典學(xué)習(xí)算法[7-8]在圖像去噪、面部識(shí)別、圖像修復(fù)、圖像超分辨率以及圖像分類等領(lǐng)域有著廣泛的應(yīng)用。字典學(xué)習(xí)算法因其稀疏的表示方式使學(xué)習(xí)得到的字典原子數(shù)量增加、形態(tài)豐富,可以與信號(hào)或者圖像本身的結(jié)構(gòu)進(jìn)行更好的匹配。本文將采用字典學(xué)習(xí)中的K-SVD算法提取煤與矸石的圖像特征,隨機(jī)選擇煤與矸石的樣本圖像作為字典原子后,將學(xué)習(xí)字典按列的順序隨機(jī)進(jìn)行更新,以最大限度地將煤與矸石的圖像特征有效表達(dá)出來(lái),提高識(shí)別的效率。
隨著稀疏表示理論的不斷成熟,字典學(xué)習(xí)理論被提出并應(yīng)用于信號(hào)處理和圖像信息領(lǐng)域,其中信號(hào)的“簡(jiǎn)單性”是目前研究的熱點(diǎn),尤其是信號(hào)的稀疏性表示,即稀疏表示。字典學(xué)習(xí)方法通過(guò)優(yōu)化相應(yīng)的字典學(xué)習(xí)代價(jià)函數(shù),獲得對(duì)信號(hào)進(jìn)行稀疏表示的字典[9]。稀疏表示的模型為:給定字典D=d1,d2,…,dq∈Rp×q,字典D中的每一列dq∈Rp表示為一個(gè)原子,信號(hào)Y=y1,y2,…,ys∈Rp×s表示為字典D中若干原子的線性組合:Y≈DX,其中X=x1,x2,…,xs∈Rq×s為信號(hào)Y在字典D下的表示系數(shù),由于X矩陣內(nèi)有大量的零元素向量導(dǎo)致每個(gè)列向量都是稀疏的,因此X為稀疏矩陣。本文使用的是K-SVD字典學(xué)習(xí)算法[10-11],與其他字典學(xué)習(xí)算法相比,該算法時(shí)間復(fù)雜度較低,計(jì)算量小,適用性強(qiáng),并且已經(jīng)趨于成熟。
為了將字典學(xué)習(xí)算法融于煤與矸石的圖像特征提取與識(shí)別中,把信號(hào)Y看作是煤與矸石的圖像信號(hào),字典D通過(guò)煤與矸石的樣本圖像學(xué)習(xí)得到,X為煤與矸石的圖像信號(hào)Y在學(xué)習(xí)字典D下的表示系數(shù)。求解Y≈DX式中的D和X的過(guò)程便為字典學(xué)習(xí)的過(guò)程,所對(duì)應(yīng)字典學(xué)習(xí)的優(yōu)化問(wèn)題可表示為:
(1)
式中:Y為煤與矸石的圖像信號(hào)矩陣;xi為稀疏矩陣X中某一列向量;‖·‖F(xiàn)為F范數(shù);‖·‖0為L(zhǎng)0范數(shù);T0為設(shè)定的初始值,與稀疏度相關(guān)。為求解學(xué)習(xí)過(guò)程中的優(yōu)化問(wèn)題,K-SVD字典學(xué)習(xí)利用稀疏編碼和字典更新兩步的迭代學(xué)習(xí)算法求解固定字典D和稀疏矩陣X,直到所求變量收斂或者達(dá)到設(shè)定的迭代次數(shù)。在稀疏編碼階段,稀疏矩陣X用OMP追蹤算法[12-13]進(jìn)行求解,具體運(yùn)算過(guò)程如圖1所示,其中步驟(3)表示的是求殘差r的最相關(guān)列標(biāo)號(hào),步驟(4)是通過(guò)最小二乘法獲得關(guān)于每個(gè)樣本圖像的稀疏系數(shù)X,步驟(5)更新殘差r,步驟(6)表示達(dá)到了設(shè)定的迭代次數(shù),迭代終止。第二步是字典更新階段,利用求解到的稀疏矩陣X對(duì)字典D進(jìn)行逐列更新,若需要更新字典中的第kk=1,2,…,K列dk,目標(biāo)方程可表示為:
(2)
為提高煤與矸石的識(shí)別率,本文在字典初始化時(shí)從煤與矸石圖像的訓(xùn)練樣本中隨機(jī)選擇不同的樣本作為字典原子,與順序選擇樣本相比可以降低運(yùn)算復(fù)雜度,提高算法收斂的速度。然后按照列的順序隨機(jī)進(jìn)行字典原子的更新,最后經(jīng)過(guò)多次迭代來(lái)選擇最優(yōu)的字典D。
輸入:樣本矩陣Y=[y1,y2,…,ys]∈RP×S,字典D=[d1,d2,…,dq]∈Rp×q
輸出:稀疏矩陣X=[x1,x2,…,xs]∈Rq×s
(1)i=1;
(2)r0=yi,Ω0=?,k=1;
(3)jk=arg max|〈rk-1,dj〉|,j=1,2,…,q,Ωk=Ωk-1∪{jk};
(5)rk=yi-DΩkxk;
圖1稀疏編碼的算法流程
Fig.1 Process of sparse coding algorithm
選取來(lái)自山西大同煤礦的大小形狀各異的煤與矸石樣本圖像800幅,其中煤與矸石兩類各400幅,每幅圖像的像素大小均為100×100,灰度級(jí)為256,格式為jpg。圖像經(jīng)過(guò)預(yù)處理后,隨機(jī)從每類抽取340幅圖像放入訓(xùn)練集,剩下的60幅圖像作為測(cè)試集。由于煤與矸石的開采處在地下,采集到的圖像容易受到周圍環(huán)境的影響,本研究只考慮了在相同光照強(qiáng)度因素下的煤與矸石圖像識(shí)別,如圖2所示。
圖2 同一光照強(qiáng)度下的煤與矸石樣本圖像Fig.2 Coal and gangue sample images under different illumination conditions
本文的實(shí)驗(yàn)數(shù)據(jù)是在Matlab 7.14.0(R2012a)上測(cè)試得到。
為了更好地對(duì)煤與矸石的圖像進(jìn)行特征提取,將拍攝到的含有大量干擾信息的彩色圖像轉(zhuǎn)換為灰度圖像,利用PCA算法降維[14-15]。PCA算法是一種常用的數(shù)據(jù)降維方法,是在盡可能代表原始數(shù)據(jù)的前提下,通過(guò)線性變換將高維空間中的樣本數(shù)據(jù)投影到低維空間,以去掉圖像中大量的冗余信息,從而提高K-SVD算法的特征提取效率。首先將放入訓(xùn)練集的每一幅樣本圖像隨機(jī)相連形成訓(xùn)練樣本矩陣,經(jīng)PCA算法進(jìn)行降維處理后,對(duì)降維后的樣本圖像進(jìn)行歸一化處理,使訓(xùn)練樣本矩陣中每一個(gè)列向量的模都為1。降維處理的投影公式為
B=ETA-M,M=m,m,……,m。
(3)
式中,A為所需要處理的樣本矩陣,E為特征空間,m為樣本圖像的均值向量,將矩陣B進(jìn)行歸一化處理得到的矩陣Y便是所求的煤與矸石的圖像信號(hào)矩陣。
預(yù)處理后,利用K-SVD字典學(xué)習(xí)算法將歸一化后的信號(hào)矩陣Y進(jìn)行學(xué)習(xí),經(jīng)過(guò)兩步的迭代學(xué)習(xí)算法求解出字典D與稀疏矩陣X。字典D實(shí)質(zhì)為經(jīng)過(guò)不斷的學(xué)習(xí)與優(yōu)化找到合適的變換空間,而稀疏矩陣X則是信號(hào)矩陣Y在變換空間D下的投影。于是信號(hào)矩陣Y的每一列向量對(duì)應(yīng)著稀疏矩陣X的每一列向量,稀疏矩陣X便作為樣本圖像的特征向量對(duì)應(yīng)著訓(xùn)練集的每一幅樣本圖像,故求解稀疏矩陣X的過(guò)程即為煤與矸石的圖像特征提取過(guò)程。
支持向量機(jī)(SVM)[16]兼顧訓(xùn)練誤差與測(cè)試誤差的最小化,具有良好的適應(yīng)性和泛化能力,是識(shí)別率最好的二分類器,所以本研究選用SVM對(duì)煤與矸石的圖像進(jìn)行二分類。
經(jīng)測(cè)試,影響煤與矸石識(shí)別率的因素主要有兩個(gè):字典D和分類器的選擇。將著重研究字典D對(duì)識(shí)別率的影響,通過(guò)調(diào)整參數(shù)選擇最優(yōu)的字典D來(lái)提高煤與矸石的識(shí)別率。
在字典D的列數(shù)為45,稀疏誤差ε=0.045,稀疏度α=0.45情況下,首先進(jìn)行不同字典初始化,在更新方法下經(jīng)過(guò)連續(xù)10次測(cè)試得到煤與矸石的識(shí)別率(圖3)??煽闯?,第6次的識(shí)別率最高,選擇這次的識(shí)別率作為該參數(shù)條件下煤與矸石圖像的識(shí)別率,同時(shí)圖中表現(xiàn)出的識(shí)別率波動(dòng)差距較大,表明字典的初始化與更新對(duì)識(shí)別效率有較大影響。
圖4則表示在ε=0.039,α=0.27情況下,不同字典列數(shù)對(duì)煤與矸石的識(shí)別率影響曲線。從圖中可以看出,在字典列數(shù)大于50以后,煤與矸石的識(shí)別率隨著字典列數(shù)的不斷增加逐漸下降,而在小于50時(shí)識(shí)別率是不斷提高的。同時(shí)隨著字典列數(shù)的增加,程序運(yùn)行時(shí)間也會(huì)越長(zhǎng),相應(yīng)地也增大了識(shí)別時(shí)間,空間代價(jià)也越大。
圖5給出了字典列數(shù)為40,稀疏度為0.33的條件下,不同稀疏誤差對(duì)煤與矸石識(shí)別率的影響曲線??煽闯?,煤與矸石的識(shí)別率在稀疏誤差為0.035之前一直呈上升趨勢(shì),之后不斷下降,表明稀疏誤差在0.035時(shí)識(shí)別效率最高。
圖3 不同字典初始化與更新下的識(shí)別率Fig.3 Recognition rate under different dictionary initialization and update
圖4 不同字典列數(shù)下的識(shí)別率Fig.4 Recognition rate under different number of dictionaries
圖5 不同稀疏誤差下的識(shí)別率Fig.5 Recognition rate under different sparse error
圖6 不同稀疏度下的識(shí)別率Fig.6 Recognition rate under different sparsity
圖6給出了在字典列數(shù)為41和稀疏誤差為0.035的情況下,稀疏度對(duì)煤與矸石識(shí)別率的影響曲線。從圖中可知在稀疏范圍內(nèi),識(shí)別率在0.2~0.4間保持平穩(wěn)狀態(tài),在0.35左右達(dá)到峰值,在0.4以后不斷下降。
為了判斷字典參數(shù)的優(yōu)劣對(duì)煤與矸石識(shí)別率的影響,本文通過(guò)調(diào)節(jié)字典參數(shù)測(cè)得煤與矸石的樣本識(shí)別率以及識(shí)別時(shí)間(表1)可以看出,實(shí)驗(yàn)測(cè)試的樣本識(shí)別率最高可達(dá)97.5%,錯(cuò)誤樣本僅為3,其中識(shí)別時(shí)間為2.9 s,字典的初始化與更新、字典列、稀疏誤差和稀疏度對(duì)識(shí)別率都有較大的影響。表2給出使用字典學(xué)習(xí)和不使用字典學(xué)習(xí)對(duì)煤與矸石識(shí)別率的影響情況對(duì)比,可知使用字典學(xué)習(xí)將煤與矸石的識(shí)別率從81.6%提高到97.5%,有效地提取出煤與矸石的圖像特征,達(dá)到更佳的分類識(shí)別效果。
為了驗(yàn)證本論文所提方法的效果,在相同樣本情況下與已有幾種方法的最高識(shí)別率進(jìn)行了對(duì)比測(cè)試,基于灰度值的特征提取方式、基于小波變換的特征提取方式和基于灰度共生矩陣的特征提取方式的最高識(shí)別率分別為92.5%、94.1%和95.8%,而本文識(shí)別方法的最高識(shí)別率為97.5%。此外,煤礦中采煤機(jī)平均切割線速度一般約為7 cm/s,2.6 s的識(shí)別反應(yīng)時(shí)間滿足實(shí)際煤與矸石的自動(dòng)分選要求。
表1 不同字典參數(shù)影響下的識(shí)別率Tab.1 Recognition rate under different dictionary parameters
表2 是否使用字典學(xué)習(xí)對(duì)識(shí)別率的影響Tab.2 The effect of dictionary learning on recognition rate
研究了基于字典學(xué)習(xí)的煤與矸石圖像特征識(shí)別方法,得到結(jié)論如下:
1) 基于K-SVD字典學(xué)習(xí)算法可以有效地表達(dá)煤與矸石的圖像特征,具有較好的稀疏性,可適用于規(guī)模較大的圖像信息采集;
2) 字典學(xué)習(xí)算法中的字典初始化與更新、字典的列數(shù)、稀疏誤差和稀疏度均會(huì)影響煤與矸石的識(shí)別率,調(diào)節(jié)好字典中的最優(yōu)參數(shù)可有效提高煤與矸石的識(shí)別率;
3) 與其他煤與矸石的圖像特征提取方法相比,基于字典學(xué)習(xí)的紋理特征提取方法有著特征維數(shù)較少,計(jì)算量小的優(yōu)勢(shì),時(shí)間和空間代價(jià)較小,為煤與矸石的自動(dòng)識(shí)別分選提供了一種新的思路和方式,為后續(xù)的分類識(shí)別打下良好基礎(chǔ)。
由于條件有限,本文只考慮了同一光照強(qiáng)度對(duì)識(shí)別效果的影響,下一步將著重研究在實(shí)際開采過(guò)程中,受到更多噪聲影響下的煤與矸石識(shí)別率提高的問(wèn)題。
參考文獻(xiàn):
[1]石煥,程宏志,劉萬(wàn)超.我國(guó)選煤技術(shù)現(xiàn)狀及發(fā)展趨勢(shì)[J].煤炭科學(xué)技術(shù), 2016,44(6):169-174.
SHI Huan,CHENG Hongzhi,LIU Wanchao.Present status and development trend of China’s coal preparation technology[J].Coal Science and Technology,2016,44(6):169-174.
[2]田原.淺談機(jī)器視覺技術(shù)在煤礦中的應(yīng)用前景[J].工礦自動(dòng)化,2010,36(5):30-33.
TIAN Yuan.Brief discussion of application prospect of technology of machine vision in coal mine[J].Industry and Mine Automation,2010,36(5):30-33.
[3]于國(guó)防,鄒士威,秦聰.圖像灰度信息在煤矸石自動(dòng)分選中的應(yīng)用研究[J].工礦自動(dòng)化,2012,38(2):36-39.
YU Guofang,ZOU Shiwei,QIN Cong.Application research of image gray information in automatic separation of coal and tangue[J].Industry and Mine Automation,2012,38(2):36-39.
[4]王祥瑞.煤礦矸石自動(dòng)分選中圖像處理與識(shí)別技術(shù)的應(yīng)用[J].煤炭技術(shù),2012,31(8):120-121.
WANG Xiangrui.Application of image processing and recognition technology in waste automatic separation of coal mine[J].Coal Technology,2012,31(8):120-121.
[5]何敏,王培培,蔣慧慧.基于SVM和紋理的煤和煤矸石自動(dòng)識(shí)別[J].計(jì)算機(jī)工程與設(shè)計(jì),2012,33(3):1117-1121.
HE Min,WANG Peipei,JIANG Huihui.Recognition of coal and stone based on SVM and texture[J].Computer Engineering and Design,2012,33(3):1117-1121.
[6]廖陽(yáng)陽(yáng).基于BP網(wǎng)絡(luò)和圖像處理的煤矸石的動(dòng)態(tài)識(shí)別[J].工業(yè)控制計(jì)算機(jī),2015(7):119-122.
LIAO Yangyang.Recognition of coal and stone based on BP[J].Industrial Control Computer,2015(7):119-122.
[7]WEI C,MIGUEL R D R.Dictionary learning with optimized projection design for compressive sensing applications[J].IEEE Signal Processing Letters,2013,20(10):992-995.
[8]SHI J,WANG X H.Image super-resolution reconstruction based on improved K-SVD dictionary-learning[J]. Acta Electronica Sinica,2013,41(5):997-1000.
[9]練秋生,石保順,陳書貞.字典學(xué)習(xí)模型、算法及其應(yīng)用研究進(jìn)展[J].自動(dòng)化學(xué)報(bào),2015,41(2):240-260.
LIAN Qiusheng,SHI Baoshun,CHEN Shunzhen.Research advances on dictionary learning models,algorithms and applications[J]. Acta Auto matica Sinica,2015,41(2):240-260.
[10]JIANG Z L,LIN Z,DAVIS L S.Label consistent K-SVD:Learning a discriminative dictionary for recognition[J].IEEE Transaction on Pattern Analysis and Machine Intelligence,2013,35(11):2651-2664.
[11]劉雅莉,馬杰,王曉云,等.一種改進(jìn)的K-SVD字典學(xué)習(xí)算法[J].河北工業(yè)大學(xué)學(xué)報(bào),2016,45(2):1-8.
LIU Yali,MA Jie,WANG Xiaoyun,et al.An improved K-SVD dictionary learning algorithm[J].Journal of Hebei University of Technology,2016,45(2):1-8.
[12]LI J,WANG Q,SHEN Y.Near optimal condition of OMP algorithm in recovering sparse signal from noisy measurement[J].Journal of Systems Engineering and Electronics,2014,25(4):547-553.
[13]李少東,裴文炯,楊軍,等.貝葉斯模型下的OMP重構(gòu)算法及應(yīng)用[J].系統(tǒng)工程與電子技術(shù),2015,37(2):246-252.
LI Shaodong,PEI Wenjiong,YANG Jun,et al.OMP reconstruction algorithm via Bayesian model and its application[J].Systems Engineering and Electronics,2015,37(2):246-252.
[14]FOUZI H,MOHAMED N N,HAZEM N N. Enhanced monitoring using PCA-based GLR fault detection and multiscale filtering[C]//IEEE Symposium on Computational Intelligence in Control and Automation.2013:1-8.
[15]胡嘉良,高玉超,余繼峰, 等.基于PCA-BP神經(jīng)網(wǎng)絡(luò)的非常規(guī)儲(chǔ)層巖性識(shí)別研究[J].山東科技大學(xué)學(xué)報(bào)(自然科學(xué)版),2016,35(5):9-16.
HU Jialiang,GAO Yuchao,YU Jifeng,et al.Lithology identification of unconventional reservoirs based on PCA-BP neural network[J].Journal of Shandong University of Science and Technology(Natural Science),2016,35(5):9-16.
[16]丁世飛,齊丙娟,譚紅艷.支持向量機(jī)理論與算法研究綜述[J].電子科技大學(xué)學(xué)報(bào),2011,40(1):2-10.
DING Shifei,QI Bingjuan,TAN Hongyan.An overview on theory and algorithm of support vector machines[J].Journal of University of Electronic Science and Technology of China,2011,40(1):2-10.