趙莉蘋,邱秀榮
(1.鄭州科技學院 信息工程學院,鄭州 450064;2.商丘工學院 信息與電子工程學院,河南 商丘 476000)
高速運動圖像的目標自動識別技術是計算機視覺圖像處理領域極具挑戰(zhàn)性的研究課題之一[1],在航空航天、軍事公安等領域具有良好的應用前景.但目前高速運動圖像的自動識別技術仍存在較多問題未得到有效解決,現(xiàn)階段目標圖像數(shù)據(jù)顯著上升,如何解決目標自動識別的精度問題已經(jīng)成為高速運動圖像目標自動識別技術研究的關鍵.
目前眾多學者對高速運動圖像自動識別模型[2-3]進行了研究,并取得了一定的研究成果.吳志攀等[4]提出了基于深度學習的高速運動圖像自動識別模型,該模型采用維納濾波對采集到的高速運動圖像進行復原處理,運用深度學習算法,將復原后的高速運動圖像進行識別,該模型具有一定的識別速度,但是識別效果不太理想.李江等[5]提出了基于主成分分析的高速運動圖像自動識別模型,該模型通過智能攝像機采集高速運動圖像,采用主成分分析法提取高速運動圖像特征,根據(jù)處理后的特征構建多個分類器,采用Adaboost方法將較弱的分類器構建成相對較強的分類器,利用該分類器完成對高速運動圖像的自動識別,該模型具有較高的識別效率,但是識別誤差較高.
針對上述問題,本文提出了基于射頻技術的高速運動圖像自動識別模型.結合射頻讀取采集得到的高速運動圖像編碼,對高速運動圖像進行分析.分析結果表明,所提基于射頻技術的高速運動圖像自動識別模型在識別過程中誤差較低且用時短,具備一定的應用價值.
高速運動圖像采集處理平臺能夠?qū)Ω咚龠\動圖像進行采集,并對其進行處理,該平臺所選用的攝像頭是PIPER智能攝像頭.本文設計的高速運動圖像處理結構圖如圖1所示.
圖1 高速運動圖像處理結構圖Fig.1 Structure diagram of high-speed moving image processing
通過圖1可以看出,高速運動圖像處理平臺是由采集端、處理端和顯示端三個結構組成.由圖像采集端攝像頭將采集到的二維高速運動圖像壓縮變換為三維視覺,并將高速運動圖像進行A/D轉(zhuǎn)換后發(fā)送給圖像處理端;對高速運動圖像進行增強和拆分處理后,再將處理后的圖像發(fā)送給顯示端,通過某些指令和終端顯示器顯示出來,完成高速運動圖像的處理.其中將二維高速運動圖像向三維高速運動圖像進行轉(zhuǎn)換的過程稱為逆向映射,該映射方法可以對高速運動圖像進行圖像增強,將增強后的高速運動圖像傳輸?shù)礁咚龠\動圖像識別平臺中[6].
高速運動圖像自動識別平臺是根據(jù)射頻技術所構建的,該平臺能夠?qū)Ω咚龠\動圖像進行自動識別.射頻技術主要采用射頻通信來實現(xiàn)高速運動圖像自動識別,具有很強的抗干擾能力,在任何天氣條件下都具有較好的識別精度且操作也較為簡單.射頻技術硬件結構如圖2所示.
圖2 射頻技術硬件結構圖Fig.2 Hardware structure diagram of RF technology
由圖2可知,射頻技術硬件是由電子標簽、rg-rap220-e-v2.0天線、ZK-RFID102R讀寫器、FM1108識別芯片及Pasternack射頻耦合器構成的.其中電子標簽與讀寫器之間通過耦合器實現(xiàn)射頻信號的空間耦合,由此來完成能量的傳遞和數(shù)據(jù)交換.電子標簽將編碼信息通過天線發(fā)射出去,天線接收電子標簽發(fā)送來的調(diào)制信號,再經(jīng)天線的調(diào)制器傳送到讀寫器處理模塊,經(jīng)解調(diào)和解碼后將有效信息傳送到后臺主機系統(tǒng)進行相關處理[7].高速運動圖像自動識別對天線傳輸效率和穩(wěn)定性要求極為嚴格,為此必須要選擇性能較好的323 m射頻天線.讀寫器主要功能是獲取通過電子標簽得到的高速運動圖像編碼,并對其進行及時的語音播報[8-10],其中讀寫器分為兩種:便捷式與安裝式,本文選擇了安裝式讀寫器進行設計.
在上述射頻技術分析的基礎上,對高速運動圖像進行分析,建立目標動圖像尺度空間模型.本文利用高速運動圖像特征向量來描述其特征點,并對其進行匹配,在目標圖像特征點匹配時加入幾何區(qū)域限定來完成識別.目標圖像的尺度空間模型表達式為
(1)
式中:Lxx為不同分析度下的目標圖像;G(t)為高斯核;I(X)為高速運動圖像;X=(x,y)為像素點(x,y)的卷積.利用核函數(shù)與卷積函數(shù)計算高速運動圖像的高斯核,并將其作為目標圖像.
求取高速運動圖像中像素矩陣H的行列式?jīng)Q策值,利用該值來確定興趣點.為了簡化應用,可以引入卷積計算、濾波器Fxy及權值w等對準確值和相似值兩者間存在的誤差進行平衡,計算表達式為
det(H)=LxxFxy-(wFxy)2
(2)
采用高斯核的卷積原理可以實現(xiàn)在不同分析角度下高速運動圖像的描述,一般來說,高斯標準差能夠體現(xiàn)出高速運動圖像的尺度大小[11].假設,濾波器選取3×3正方形的像素區(qū)域,將其計作9個高速運動圖像像素點,在其中隨機選取像素點.在尺度層從上到下將其與所有高速運動圖像像素點進行比較,當高速運動圖像中的像素點比附近其他像素大時,選取像素點為正值,這時就可以將這個點當成這個區(qū)域的特征點[12].
將高速運動圖像特征點當作中心,將其主要方向設定成x軸方向,選取4×4正方形區(qū)域,并對所有區(qū)域內(nèi)小波影響值進行運算,得到高速運動圖像的一個四維向量,最后利用高速運動圖像64維特征向量來代表高速運動圖像的特征點.在目標圖像采集時會出現(xiàn)很多不確定因素,在時間發(fā)生變化時高速運動圖像的特征點也會發(fā)生一定的變化,為此本文將對兩幀高速運動圖像匹配識別時特征點的跟蹤匹配進行分析.
為了提高該識別模型的精度,文中在高速運動圖像特征點匹配時加入幾何區(qū)域限定,以運動圖像點(xi,yi)、(xj,yj)為中心畫一個矩形區(qū)域當作高速運動圖像識別幾何限定區(qū)域,使用模型進行高速運動圖像識別時不能超出該區(qū)域.
為了驗證所提出的基于射頻技術的高速運動圖像自動識別模型的綜合有效性,需要對其模型進行測試.本次測試的操作系統(tǒng)為Windows7,內(nèi)存容量為24 GB,采用i-SPEED 210/211超高速視頻攝像機在某限速為129 km/h的路段采集600組高速行駛車輛圖像,圖像采集速度為300 000幀/s,分辨率為4 096×2 440,400萬像素.將基于神經(jīng)網(wǎng)絡的高速運動圖像自動識別模型、基于主成分分析的高速運動圖像自動識別模型與所提模型的識別效果進行對比,結果如圖3所示.
圖3 不同模型高速運動圖像識別效果對比Fig.3 Comparison of recognition effects for high-speed moving images by different models
通過圖3可以看出,所提模型對高速運動圖像識別效果最好,圖像較為清晰;而其他兩種算法對高速運動圖像識別效果比較模糊,識別效果不太理想.選取50塊車牌(高速運動圖像)作為測試數(shù)據(jù),將所提模型(模型1)與基于神經(jīng)網(wǎng)絡的高速運動圖像自動識別模型(模型2)和基于主成分分析的高速運動圖像自動識別模型(模型3)進行車牌誤檢測數(shù)量對比實驗,實驗結果表明,三個模型的誤檢測數(shù)量分別為3、8、10.所提模型識別的車牌誤檢測數(shù)量明顯低于其他兩種模型,具有較高的識別精度.實驗采集圖像600組,信息采樣的初始像素為1 200×1 200,使用三種模型分別對600組圖像進行識別,用時對比測試結果如表1所示.
表1 不同模型識別用時對比測試Tab.1 Comparison test for recognization time of different models ms
通過表1可以看出,所提識別模型對高速運動圖像的預處理時間和識別時間都明顯低于其他兩種模型,并且三個模型的傳輸時間相同.整體而言,所提模型的識別效率最高,驗證了文中所提識別模型的高效性.
為解決當前高速運動圖像自動識別方法普遍存在的識別誤差較高、用時長、效率低等問題,本文提出基于射頻技術的高速運動圖像自動識別模型.在智能攝像頭對高速運動圖像采集后,結合射頻讀取采集得到的高速運動圖像編碼,對高速運動圖像進行分析,再建立目標動圖像尺度空間模型,利用高速運動圖像特征向量描述、匹配特征點.在高速運動圖像特征點匹配過程中,加入幾何區(qū)域限定來完成識別.將所提方法模型與基于神經(jīng)網(wǎng)絡的高速運動圖像自動識別模型和基于主成分分析的高速運動圖像自動識別模型進行實驗對比,證明了所提方法模型的有效性.所提方法為未來高速圖像識別領域的研究與發(fā)展提供了一定的學術依據(jù),但由于所提方法并未經(jīng)過長時間、大面積使用,所以該方法的穩(wěn)定性仍需進一步驗證、改進,這也是未來研究的主要目標.