張壯暑,蔡曉東,張學敏
(桂林電子科技大學信息與通信學院,廣西 桂林 541004)
責任編輯:任健男
隨著交通智能監(jiān)控系統(tǒng)的快速發(fā)展,對監(jiān)控視頻運動目標的分類越來越受到重視,目標分類是對目標分析理解的基礎。目前智能交通系統(tǒng)主要的監(jiān)控目標是行人和車輛,例如車輛的類型、大小、速度等。目標快速準確分類可以進行實時交通數(shù)據(jù)統(tǒng)計,例如交通事故統(tǒng)計、人車流量統(tǒng)計、停車統(tǒng)計、行人穿馬路等。目標分類主要包含目標的特征提取和分類器的選擇兩個方面[1]。特征提取的主要任務就是找到一組對分類可靠有效的特征。目前常用的特征有幾何特征和運動特征,目標的形狀特征主要有輪廓、面積、長寬比、離散度、質(zhì)心、外接矩形等,基于運動的特征主要包括運動方向、速度等[2-3]。
不變矩是提取具有平移、旋轉(zhuǎn)、縮放不變性的圖像特征,已被廣泛應用于圖像識別中的字符識別、遙感圖像匹配等領域。目前被應用于圖像識別的矩特征主要有Hu矩、Zerniker矩等。M.K.Hu在1961年首先提出不變矩的概念,并將幾何矩(Geometric Moments,GMg)用于圖像描述。圖像低階幾何矩與圖像的整體特征有關,不包含太多的圖像細節(jié)信息,而高階幾何矩易受噪聲影響。Zerniker矩是根據(jù)多項式正交理論提出的,與Hu矩相比,Zerniker矩在抗噪聲能力,信息靈敏度以及圖像描述能力都優(yōu)于Hu 矩[4-5]。
本文以背景差分方法進行目標檢測,充分利用矩的不變特性,提取運動目標的Zerniker高階矩、長寬比和占空比組成特征向量,構(gòu)造支持向量機(SVM)分類器進行人車分類識別,實驗結(jié)果證明,本文方法具有較高的運動目標識別分類準確率。
Zerniker矩是基于Zerniker多項式的正交復數(shù)矩,其中Zerniker多項式是定義在極坐標中單位圓內(nèi)的正交函數(shù)集合,公式為
n階Zerniker矩定義為
對于一幅數(shù)字圖像,離散形式表示方式為
由以上公式可以計算出一幅圖像的Zerniker矩特征集:根據(jù)n的變化計算不同階數(shù)的Zerniker矩;也可以在n值一定的情況下,計算m階Zerniker矩特征值。提取的各階矩之間成正交關系,對噪聲的抵抗能力強,冗余性小,同時低階Zerniker矩可以描述圖像的整體形狀,高階矩可以描述圖像的細節(jié)特征。
傳統(tǒng)模式識別分類器的設計只考慮對訓練樣本的擬合情況,通過提供足夠的訓練樣本以提高分類器的預測識別率,減少分類誤差。相反,對于訓練樣本過少情況下,不能保證對訓練樣本具有高正確率的分類器能以同樣的準確率對測試樣本進行預測。而支持向量機[6-8](SVM)同時兼顧訓練誤差與測試誤差最小化,即結(jié)構(gòu)誤差最小化為原則,其主要思想就是尋找能夠?qū)深悩颖境晒Ψ蛛x開并且具有最大間隔的最優(yōu)超平面,如圖1和圖2所示。
對于樣本線性可分的情況,假設線性超平面的方程式為
由點到平面的公式可以得出,樣本x到最優(yōu)超平面(w,b)的距離為
規(guī)范化超平面,選擇w和b使得與超平面最近的樣本x滿足wTx+b=1。
此時的分類間隔為
變換得到
根據(jù)上式可以得一個全局最小值,計算不會陷入像神經(jīng)網(wǎng)絡優(yōu)化過程中的局部最小值。除點x之外的其他樣本點到超平面的距離則大于d,因此存在約束條件為
式中:i為正整數(shù)。由以上條件求出最優(yōu)解w*,b*后,得出最優(yōu)超平面函數(shù)為
對于非線性可分,引入松弛變量εi和附加懲罰參數(shù)C后,仍然利用二次規(guī)劃求出最優(yōu)w*和b*,得出與上式相同的決策函數(shù)。
在大多數(shù)情況下,需要借助核函數(shù)映射,通過非線性變換將樣本轉(zhuǎn)化為某個高維空間中,映射后的樣本在新特征空間中線性可分,這樣就避免了非線性問題放寬約束條件導致大量樣本錯分。
分類系統(tǒng)結(jié)構(gòu)流程如圖3所示。
圖3 分類系統(tǒng)結(jié)構(gòu)流程圖
目標檢測是目標識別與分類的重要環(huán)節(jié),而交通監(jiān)控場景目標運動比較復雜,準確完整地進行目標檢測是非常困難的。視頻中運動目標的檢測一般有幀間差分、光流法和背景差分法。本文采用混合高斯模型進行背景重建,背景差分進行運動目標檢測。
支持向量機(SVM)分類器設計主要有分類訓練和測試兩個階段。訓練過程是利用樣本去學習和估計分類器的未知參數(shù)。本實驗主要對人和車進行分類,用于分類器訓練和測試所用的人和車的樣本圖片序列都來自固定的單攝像機,即對特定場景中獲取的樣本進行訓練,以提高訓練和分類識別的準確率。選取目標樣本Zernike矩的7個高階矩、長寬比、占空比等共9個特征作為訓練分類器的特征向量。最后把測試樣本輸入分類器對分類器的識別率進行測試。
用于實驗的行人圖片和車輛圖片各220張,110張用于分類器訓練,110張用于對分類器測試,假設A類為行人圖片,B類為車輛圖片。行人的檢測效果如圖4所示,車輛的檢測效果如圖5所示,多目標檢測效果如圖6所示。檢測視頻背景圖片如圖7所示,目標分類效果如圖8所示。
圖8 目標分類效果
計算目標 Zernike 矩的 7 個高階 (Z60,Z71,Z80,Z91,Z100,Z111,Z120)、長寬比和占空比,如表1 所示。
表1 運動目標特征集
由表1可以看出人和車的Zernike矩的高階特征值有明顯的區(qū)別,能很好地區(qū)分出人和車目標。經(jīng)過測試支持向量機分類器選擇徑向基核函數(shù),懲罰因子C為0.349 929,核參數(shù)gamma值為0.007 812 5,測試數(shù)據(jù)進行分類器測試。
如表2所示采用Zerniker高階矩進分類的正確率達到99.1%,比由Hu矩進行分類的正確率高0.19%。實驗結(jié)果證明了本文算法的有效性。
表2 運動目標分類正確率
視頻序列中運動目標的檢測是近年來研究熱點,本文通過背景差分方法檢測運動目標提取運動目標的Zernike高階矩、長寬比和占空比組成特征向量集,采用支持向量機優(yōu)秀分類算法進行目標識別分類。實驗結(jié)果表明,本算法對監(jiān)控視頻中人車運動目標識別分類正確率高達99.1%,與提取目標的Hu矩及其他形狀特征對目標分類方法相比,運用Zernike高階矩的分類方法對目標的分類正確率高于運用Hu矩的方法。
[1] WANG Xiaojing,YUAN Da,LI Daokai.Moving target classification technique in video sequence[C]//Proc.International Conference of Information Technology.[S.l.]:IEEE Press,2011:362-365.
[2]王吉林,趙力.數(shù)字圖像形狀特征提取的研究[J].微電子學與計算機,2010,27(5):118-125.
[3]謝菲,陳雷霆,邱航.基于紋理特征提取的圖像分類方法研究及系統(tǒng)實現(xiàn)[J].計算機應用研究,2009,26(7):2767-2770.
[4]姚軍,蔣曉瑜,黃應清.目標識別中Hu矩、Zerniker矩和小波矩的比較[J].裝甲兵工程學院學報,2006,20(3):34-36.
[5]劉茂福,何炎祥,胡慧君.圖像挖掘中基于Zernike矩的形狀特征描述與評價[J].計算機工程,2006,32(22):178-180.
[6]張建飛,陳樹越,劉會明,等.基于支持向量機的交通視頻人車識別研究[J].電視技術,2011,35(15):1-3.
[7]王亮申,朱玉才,陳少華.利用 SVM 進行車型識別[J].計算機工程與設計,2005,26(9):2453-2454.
[8]劉麗麗,鄒北驥,劉相濱,等.視頻監(jiān)控系統(tǒng)中的運動目標分類技術研究[J].工程圖學學報,2007(6):79-84.