吳開興,范亭亭,李麗宏,張 琳
(1.河北工程大學 信息與電氣工程學院,河北 邯鄲 056038;2.河北工程大學 煤礦綜合信息化河北省工程實驗室,河北 邯鄲 056038)
現(xiàn)在國內(nèi)外關于回收塑料瓶分類研究主要是顏色和化學成分方面[1],而且數(shù)量較少,因此現(xiàn)在塑料瓶分類人工多于智能機械化。在智能處理回收塑料瓶的過程中,圖像處理技術是其核心[2],本文就針對回收塑料瓶顏色分類中的圖像處理部分的算法進行研究。
顏色分類時,首先要選定合適的顏色模型,在結合了已有的塑料瓶顏色分類算法[3-5]和其它研究方向顏色分類[6]的顏色模型,選用了適合用于計算機對物體的顏色做定量分析和檢測的HSI顏色模型。在處理圖像數(shù)據(jù)時,因其維數(shù)度過高,需要進行降維處理,因此使用快速主成分分析(fast principal component analysis,F(xiàn)PCA),相比較PCA能降低計算復雜度,使處理速度加快。借鑒于前人的工作經(jīng)驗,選用支持向量機(support vector machine,SVM)作為分類器。雖然SVM的分類方法已經(jīng)較為成熟,在圖像分類上也可以有效運用[7,8],但其參數(shù)選取的不確定性,給分類造成了困難,因此采用粒子群算法(particle swarm optimization,PSO)來優(yōu)化支持向量機參數(shù)[9],因粒子群算法易陷入局部極值中,引入慣性權重和收斂因子,以獲得最優(yōu)參數(shù),提高分類結果的穩(wěn)定性,最終實現(xiàn)提高識別率的目的。因此,文中提出一種基于FPCA和PSOSVM的回收塑料瓶顏色分類算法,以達到進一步提高分類識別率的目的。
文中處理的圖像均為彩色圖像,直接處理彩色圖像得到樣本矩陣,此時將樣本用于計算,因其維數(shù)較高,最終造成計算量大且復雜度高的結果。所以,為減少計算量同時降低計算的復雜度,本文用FPCA法進行降維處理,獲取少量且有效的特征向量用于分類識別。
主成分分析(PCA)的最終目的是為了獲得樣本協(xié)方差矩陣的本征值和本征向量。設樣本X是n×d(n個d維樣本特征向量)的矩陣,則對應的散布矩陣(協(xié)方差矩陣)S是d×d的方陣,因此所處理的樣本維數(shù)較大時會增加計算復雜度。而本文所用的FPCA法降維處理的過程如下。
(1)
在式(1)兩邊同時左乘ZT,則有
(2)
通過上述原理步驟得到協(xié)方差矩陣S,之后計算協(xié)方差矩陣的P個特征值λ1,λ2,…,λp,并按照大小進行排序。
根據(jù)式(3)計算第i個主成分分量的貢獻率
(3)
通過貢獻率計算樣本的累計貢獻率,當累計貢獻率達到85%以上,就可以使用前n個主成分作為輸入變量,以避免“維數(shù)災難”引起的數(shù)據(jù)冗余。
支持向量機因其高泛化性被廣泛使用,文中也將采用徑向基核函數(shù)的SVM作為分類器,其性能依賴于懲罰因子C和核函數(shù)參數(shù)σ[10],選取合適的參數(shù),其訓練速度和訓練精度均可提高。以下面SVM原理進行分類器模型構建。
假設(xi,yi),i=1,…,N是一組訓練樣本,其中xi∈Rd,d是輸入空間的維數(shù),yi∈{-1,1}。支持向量機的目的是將訓練樣本按照類別完全分開,最終使相同的樣本處于所定義的超平面的同一側。其約束條件為
yi(w·xi+b)>0,i=1,…,N
(4)
(5)
約束條件為
yi(w·xi+b)≥1,i=1,…,N
(6)
利用Lagrange優(yōu)化方法可以將最優(yōu)分離超平面問題轉化為其對偶問題,即約束條件為
在此條件下求解下列函數(shù)的最大值
(7)
其中,α=(α1,…,αN)是Lagrange乘子,由上述方法得到的最優(yōu)分類函數(shù)為
f(x)=sgn{(w·x)+b}
(8)
當數(shù)據(jù)線性不可分時,支持向量機引入一個松弛項ξi≥0和懲罰因子C,此時的目標函數(shù)變?yōu)?/p>
(9)
其約束條件為
yi[(w·xi)+b]-1+ξi≥0,i=1,…,N
(10)
令K(xi,xj)=φ(xi)·φ(xj)。
最終得到的分類函數(shù)為
(11)
K(x,y)為徑向基核函數(shù)。
根據(jù)式(4)~式(11)構建本文所需的基本的徑向基核函數(shù)的SVM模型。在此基礎上進行參數(shù)的優(yōu)化和分類識別。
文中為得到適合的懲罰因子C和核函數(shù)參數(shù)σ,采用粒子群算法進行參數(shù)優(yōu)化。粒子群算法是一種采用“速度-位移”模式理論,并且時刻關注個體的蹤跡進行迭代遞推的算法,而且其具有較快的收斂速度[11]。
設群體數(shù)目為M,其個體i在p維空間的位置表示為xi=(xi1,xi2,xi3,…,xip),其中i=1,2,3,…,M,速度表示為vi=(vi1,vi2,vi3,…,vip)。其中粒子的速度和位置會根據(jù)式(12)和式(13)不斷的更新
vip=vip+c1rand1()(pbestip-xip)+
c2rand2()(gbestp-xip)
(12)
xip=xip+vip
(13)
vip=ωvip+c1rand1()(pbestip-xip)+
c2rand2()(gbestp-xip)
(14)
(15)
經(jīng)由上述的計算過程,通過反復的迭代運算,最終獲得最優(yōu)且適合的懲罰因子C和核函數(shù)參數(shù)σ。將結果用于SVM分類識別,以達到提高分類穩(wěn)定性和準確率的目的。
對所使用的算法進行分析后,將算法進行結合對回收塑料瓶進行分類處理,整體的處理流程如圖1所示的分類流程。
圖1 FPCA和PSOSVM分類流程
整個處理流程的步驟介紹如下:
步驟1 獲取回收塑料的圖像,將圖像轉換到HSI模型下,對圖像進行去噪、分割等預處理,并獲得圖像的H和S分量。
步驟2 對圖像的H和S分量,使用FPCA進行降維處理,獲得特征值,之后對數(shù)據(jù)進行歸一化處理,將歸一化獲得的數(shù)據(jù)分為訓練樣本和測試樣本。
步驟3 用訓練樣本作為數(shù)據(jù)進行PSO參數(shù)優(yōu)化,用優(yōu)化后的懲罰因子和徑向基核函數(shù)參數(shù)進行SVM模型訓練。
步驟4 對訓練后的結果進行計算適應度是否達到最優(yōu),如果沒有,則重復進行步驟3;如果達到最優(yōu),則進行下一步。
步驟5 使用測試樣本,進行分類識別的測試,獲得整體的識別率。
實驗中對常見的藍色、綠色、白色(文中提到的均為無色透明)塑料瓶進行了分類算法的研究。鑒于HSI顏色模型適合用于計算機對物體的顏色做定量分析和檢測,而實驗最終的目的是將塑料瓶按顏色進行分類,因此在HSI顏色模型的基礎上對預處理后的圖像進一步處理。
實驗使用的是320*240的彩色圖像,維數(shù)較高,因此在HSI模型下采用FPCA進行降維處理,得到其前6個主成分分量,如圖2所示其累計貢獻率可以達到85%以上,完全可以作為特征值使用。由圖3可以顯示出3個顏色的塑料瓶其特征量有較明顯的區(qū)別,因此聯(lián)合H和S分量獲得有效特征值進行分類識別。
圖2 主成分累計貢獻率
圖3 HSI模型與快速PCA提取特征
實驗數(shù)據(jù)為3種顏色,每種30個樣本,對其進行上述的處理獲得特征值后,數(shù)據(jù)分為訓練集和測試集,使用SVM分類器進行分類識別。文中使用PSO對SVM的懲罰因子C和核函數(shù)參數(shù)σ進行參數(shù)尋優(yōu),圖4可以看出初始時識別率并不是最優(yōu),隨著迭代次數(shù)的增加,識別率有所提高,當?shù)螖?shù)達到55左右時,整體的識別率達到93.4%,并且在之后隨著迭代次數(shù)的增加趨于穩(wěn)定。
圖4 迭代次數(shù)與識別率關系
實驗使用測試集對文中所提算法進行測試,最終用PSO進行參數(shù)尋優(yōu)和未進行參數(shù)尋優(yōu)的實驗結果見表1,結果顯示文中所用算法整體的識別率有較顯著提高。
表1 實驗對比結果
文中提出了FPCA和PSOSVM算法用于回收塑料瓶顏色分類識別研究,其分類的識別率相對于未使用PSO進行參數(shù)尋優(yōu)提高了5.8%左右,可以達到93.4%,比以前的研究也有所提高,因此,達到了提高分類識別率的目的,對于回收塑料瓶的分類研究具有一定的推動作用??焖僦鞒煞址治龇ㄓ行У慕档土藰颖镜木S數(shù),減少了輸入量,去除了原始數(shù)據(jù)的相關性,為分類識別提供了有效的特征值,降低了計算的復雜度。采用PSO優(yōu)化SVM的參數(shù),降低了參數(shù)選擇的隨機性,使實驗結果更為穩(wěn)定,下一步的實驗可以用數(shù)據(jù)進一步驗證此結果,以期進一步優(yōu)化參數(shù),提高分類識別率。