舒亞海,賈倩茜,張 超,周 元
(1.海軍裝備部駐上海地區(qū)第一軍事代表室,上海 201000;2.中國(guó)船舶集團(tuán)有限公司第八研究院,南京 211153)
空中目標(biāo)的識(shí)別在近代軍事戰(zhàn)場(chǎng)具有重大意義和廣泛應(yīng)用前景,是戰(zhàn)場(chǎng)態(tài)勢(shì)評(píng)估和威脅估計(jì)的基礎(chǔ),也是指揮自動(dòng)化系統(tǒng)的重要組成部分。對(duì)于紅外圖像的目標(biāo)識(shí)別,主要難點(diǎn)在于:一是如何使提取的特征具有很好的目標(biāo)表征能力;二是特征向量的提取和模式識(shí)別的方法。
近年來,隨著小波理論的逐漸成熟,小波變換也越來越多地被應(yīng)用在目標(biāo)識(shí)別領(lǐng)域。但是,小波變換反映的是信號(hào)的點(diǎn)奇異性,無法精確描述圖像邊緣的方向,也無法實(shí)現(xiàn)對(duì)圖像的稀疏表示,從而影響識(shí)別精度。而多尺度幾何分析方法正是為了克服小波這一局限性而產(chǎn)生的。該方法對(duì)圖像中的幾何特征的表達(dá)更加優(yōu)于小波,并且能隨尺度變化,對(duì)圖像進(jìn)行連續(xù)逼近。因此,本文采用了該分析方法中的Contourlet變換提取圖像的特征向量。它能夠在任意尺度上實(shí)現(xiàn)任意方向的分解,擅長(zhǎng)描述圖像中的輪廓信息,故其分解后的低頻系數(shù)能很好地表征目標(biāo)的基本特征,而高頻系數(shù)可以表征目標(biāo)的細(xì)節(jié)信息,彌補(bǔ)了小波變換不足。
目前,目標(biāo)識(shí)別的方法很多,有的應(yīng)用角點(diǎn)特征和核聚類算法,有的基于閉合輪廓特征,有的采用模板匹配等等。神經(jīng)網(wǎng)絡(luò)具有自組織、自適應(yīng)學(xué)習(xí)功能,由具有非線性映射能量的神經(jīng)元組成。神經(jīng)元之間同通過權(quán)值系數(shù)相連,能夠并行計(jì)算,因而具有速度快的優(yōu)點(diǎn)。同時(shí),由于信息分布存儲(chǔ)于連接權(quán)系數(shù)中,使得神經(jīng)網(wǎng)絡(luò)對(duì)圖像光照變換、像素部分損失、飛行目標(biāo)姿態(tài)變化等問題不敏感,能高辨識(shí)率地完成圖像識(shí)別。
Contourlet變換是一種基于非分離型濾波器組實(shí)現(xiàn)的圖像多尺度幾何分析工具,其思想是通過類似于輪廓段(Contoursegment)的基結(jié)構(gòu)來逼近圖像,其算法繼承了小波的多分辨和時(shí)頻局部化特性,同時(shí)又兼具良好的方向性和各向異性。而二維小波是由一維小波張量積構(gòu)建得到,它的基缺乏方向性,不具有各向異性,只能限于用正方形支撐區(qū)間描述輪廓,不同大小的正方形對(duì)應(yīng)小波的多分辨率結(jié)構(gòu)。[1]
對(duì)于一個(gè)二次連續(xù)可微的目標(biāo)函數(shù)f,如果是其重構(gòu)函數(shù),而m是其系數(shù)重量,則Contourlet變換時(shí)誤差逼近滿足
而采用小波變換時(shí)誤差逼近滿足
由此可看出,Contourlet變換比小波變換具有更好的逼近能量,對(duì)圖像中的曲線、直線具有更“稀疏”的表達(dá),更有利于對(duì)紅外圖像進(jìn)行預(yù)處理提取特征信息。
如圖1所示,Contourlet分解是由拉普拉斯金字塔式分解和方向?yàn)V波器組實(shí)現(xiàn)。對(duì)目標(biāo)圖像進(jìn)行Contourlet變換可以利用其優(yōu)良特性更好地提取原始圖像中的幾何特征,從而得到一個(gè)低頻子帶系數(shù)和各尺度各方向的高頻子帶系數(shù)。
在工程研究中通常會(huì)遇到一些復(fù)雜的非線性系統(tǒng)。這些系統(tǒng)狀態(tài)方程復(fù)雜,難以用數(shù)學(xué)方程準(zhǔn)確建模,而適用于神經(jīng)網(wǎng)絡(luò)表達(dá)這些非線性系統(tǒng)。該方法把系統(tǒng)看成是一個(gè)黑箱,用系統(tǒng)輸入輸出數(shù)據(jù)訓(xùn)練神
圖1 Contourlet分解示意圖
經(jīng)網(wǎng)絡(luò),使神經(jīng)網(wǎng)絡(luò)能夠擬合輸入?yún)?shù)和輸出參數(shù)的關(guān)系,其實(shí)質(zhì)是一個(gè)隱含的數(shù)學(xué)表達(dá)式,即f(y)=f(x1,x2, …)。輸入?yún)?shù)和輸出參數(shù)直接聯(lián)系,改變輸入?yún)?shù)的數(shù)值,就能得到相應(yīng)的輸出,而模型的結(jié)構(gòu)不會(huì)發(fā)生改變。[2]
由于BP神經(jīng)網(wǎng)絡(luò)具有處理非線性輸入輸出關(guān)系的能力,并能不斷學(xué)習(xí),利用BP網(wǎng)絡(luò)可以實(shí)現(xiàn)離線數(shù)據(jù)的在線修正。輸入數(shù)據(jù)通過BP神經(jīng)網(wǎng)絡(luò)的各層到達(dá)輸出層后比較輸入輸出的差值是否達(dá)到,如果沒有達(dá)到則返回各層不間斷調(diào)整各層權(quán)值,以達(dá)到期望的輸出。
BP神經(jīng)網(wǎng)絡(luò)具有一層或多層的前饋網(wǎng)絡(luò)[3],對(duì)實(shí)例訓(xùn)練是通過利用輸出層誤差沿著與輸入信號(hào)相反的方向逐級(jí)反向傳遞來自動(dòng)獲取知識(shí)。一般有輸入層、中間層、輸出層,各層順次連接,結(jié)構(gòu)示意圖如圖2所示。
圖2 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖
前饋型神經(jīng)網(wǎng)絡(luò)的中間層一般可包含有一至多個(gè)隱藏層。隱藏層的非線性傳遞函數(shù)神經(jīng)元可以學(xué)習(xí)輸入輸出之間的線性和非線性關(guān)系,采用多個(gè)隱藏層數(shù)或增加隱藏層的節(jié)點(diǎn)數(shù)均可提高網(wǎng)絡(luò)精度。但是,隱藏層增多或隱藏層節(jié)點(diǎn)數(shù)增多都會(huì)增加網(wǎng)絡(luò)自學(xué)習(xí)的時(shí)間,影響效率,不利于識(shí)別方法的推廣。[4]若隱藏層節(jié)點(diǎn)數(shù)太少,訓(xùn)練時(shí)間雖然變短,但可能訓(xùn)練不出來或容錯(cuò)性大。調(diào)整隱藏層節(jié)點(diǎn)的個(gè)數(shù)可用來達(dá)到目的。
本理論模型目的在于提供一種機(jī)動(dòng)目標(biāo)識(shí)別方法。該方法對(duì)紅外圖片庫(kù)中機(jī)動(dòng)目標(biāo)圖像進(jìn)行幾何重構(gòu),再使用Contourlet變換的多尺度分析方法提取圖像低頻特征向量和高頻特征向量,以低頻特征為原始輸入?yún)?shù),通過BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練以高頻特征向量修正模型,快速有效地實(shí)現(xiàn)對(duì)不同機(jī)型、多種飛行姿態(tài)、不同光照明暗變化下的飛行目標(biāo)進(jìn)行識(shí)別。
圖像的幾何重構(gòu)主要包括圖像預(yù)處理和對(duì)飛行目標(biāo)姿態(tài)的重構(gòu)。圖像預(yù)處理是提高識(shí)別精度的重要一步,目的是將圖片進(jìn)行歸一化處理,并去除圖像中不相關(guān)背景環(huán)境的影響,凸顯待識(shí)別的目標(biāo)區(qū)域。分為兩步,第1步進(jìn)行圖片幾何標(biāo)準(zhǔn)化處理。由于目標(biāo)在整個(gè)紅外圖像中的位置、大小不同,因此會(huì)影響識(shí)別效果,需要通過校準(zhǔn)、定位等方法對(duì)目標(biāo)圖像進(jìn)行矯正。本文將待識(shí)別目標(biāo)的區(qū)域放大并將圖像校準(zhǔn)為像素為64×64,使得目標(biāo)特征更為明顯;第2步進(jìn)行灰度歸一化處理,由于不同圖像受環(huán)境影響較大,需要對(duì)不同光照條件、光線方向下得到的圖像進(jìn)行補(bǔ)償,以減弱不同環(huán)境條件下拍攝的圖像信號(hào)變化,方便后續(xù)特征向量的提取。
其中,f(x′,y′)為圖像函數(shù),當(dāng)(x′,y′)屬于目標(biāo)區(qū)時(shí)f(x′,y′) = 1,當(dāng)(x′,y′)不屬于目標(biāo)區(qū)時(shí)f(x′,y′)= 0;a、b、c、d為跟蹤窗口邊界坐標(biāo)。
獲得圓點(diǎn)后,以0°~360°向周圍做直線,在該直線上尋找飛機(jī)圖像的邊緣點(diǎn)。邊緣點(diǎn)到中心的距離最長(zhǎng)線段對(duì)應(yīng)的角度α即為飛機(jī)圖像軸線方向。該邊緣點(diǎn)所在位置即機(jī)頭位置。同樣,由機(jī)頭經(jīng)中心向機(jī)尾搜索目標(biāo)邊緣點(diǎn),可找到機(jī)尾坐標(biāo)。將軸線方向沿角度α旋轉(zhuǎn)可將飛行目標(biāo)圖像轉(zhuǎn)為機(jī)頭向上的標(biāo)準(zhǔn)圖像。
本文示例了直升飛機(jī)、民航客機(jī)、戰(zhàn)斗機(jī)3種機(jī)型圖片幾何重構(gòu)前后對(duì)比圖,如圖3所示。
圖3 紅外圖像預(yù)處理對(duì)比圖
目標(biāo)圖像的特征提取是識(shí)別過程中關(guān)鍵的環(huán)節(jié),通過提取特征量來刻畫目標(biāo)圖像的輪廓特征,為BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練提供輸入?yún)?shù)。采用Contourlet變換分別提取出低頻特征和高頻能量特征。
低頻特征向量包含了大部分能量信息,能平滑逼近圖像的輪廓信息。該部分分量可以作為BP識(shí)別中的基礎(chǔ)特征向量。但是,在實(shí)際采集的圖片中不同光線下拍攝的目標(biāo)圖像包含高頻噪聲,Contourlet變換的低頻分量對(duì)光線變換并不敏感。
高頻系數(shù)能反映目標(biāo)各個(gè)方向的邊緣、細(xì)節(jié)等信息,是具有較高識(shí)別效率的特征,故本方法選取高頻特征向量作為BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練的修正向量,利用BP神經(jīng)網(wǎng)絡(luò)的修正思想可以對(duì)低頻特征訓(xùn)練進(jìn)行修正。圖4為某幅直升飛機(jī)紅外圖像進(jìn)行Contourlet變換提取出的16個(gè)方向高頻特征,為分解出來的目標(biāo)邊緣和輪廓信息在各個(gè)方向、各個(gè)位置的分布情況。
圖4 某幅目標(biāo)圖像的高頻特征16個(gè)方向分布圖
本文采用紅外飛行數(shù)據(jù)庫(kù)作為樣本集。庫(kù)中包含直升機(jī)、戰(zhàn)斗機(jī)、民航客機(jī)不同姿態(tài)、不同環(huán)境下的紅外圖片,訓(xùn)練圖片和測(cè)試圖片互不重疊。對(duì)訓(xùn)練集目標(biāo)圖像預(yù)處理后進(jìn)行2層Contourlet分解,提取得到16維特征向量,作為輸入目標(biāo)集[x1,x2,x3,…,x16],輸出目標(biāo)集設(shè)定為[y1,y2,y3]=[1,0,0]、[0,1,0]、[0,0,1]。[5]
將測(cè)試集目標(biāo)圖像預(yù)處理后進(jìn)行2層Contourlet分解,同樣提取16維高頻特征向量,將其作為測(cè)試數(shù)據(jù)送入訓(xùn)練好的BP網(wǎng)絡(luò)模型進(jìn)行辨識(shí),并計(jì)算仿真結(jié)果的誤差值。為了便于觀察和調(diào)整,本文采用3層網(wǎng)絡(luò),即1層隱藏層,再通過調(diào)節(jié)隱藏層結(jié)點(diǎn)個(gè)數(shù)來達(dá)到網(wǎng)絡(luò)精度和訓(xùn)練時(shí)間的平衡最優(yōu)化化。[6]識(shí)別模型流程圖如圖5所示。
圖5 識(shí)別模型流程圖
本文對(duì)機(jī)動(dòng)目標(biāo)庫(kù)中不同機(jī)型飛行圖像進(jìn)行圖像預(yù)處理、特征提取和BP網(wǎng)絡(luò)訓(xùn)練,并對(duì)戰(zhàn)斗機(jī)、直升機(jī)、民航客機(jī)的每種機(jī)型隨機(jī)選取圖像用于測(cè)試。神經(jīng)網(wǎng)絡(luò)采用的中間層的傳遞函數(shù)為tan-sigmoid,輸出層傳遞函數(shù)為log-sigmoid,訓(xùn)練采用Levenberg-Marquardt算法,收斂準(zhǔn)則為訓(xùn)練的誤差≤0.001。構(gòu)建過程包括訓(xùn)練原始數(shù)據(jù)歸一化、網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化和數(shù)據(jù)反歸一化等幾個(gè)過程。考慮到訓(xùn)練時(shí)間,設(shè)定迭代次數(shù)小于10 000,超過則退出程序。
訓(xùn)練過程中,訓(xùn)練函數(shù)會(huì)根據(jù)設(shè)定的顯示訓(xùn)練結(jié)果的間隔步數(shù)值自動(dòng)顯示當(dāng)前訓(xùn)練結(jié)果信息,并給出網(wǎng)絡(luò)誤差實(shí)時(shí)變化曲線。當(dāng)訓(xùn)練步數(shù)大于訓(xùn)練設(shè)定步數(shù)、訓(xùn)練誤差小于訓(xùn)練目標(biāo)誤差、訓(xùn)練時(shí)間超過訓(xùn)練允許時(shí)間或誤差梯度值小于訓(xùn)練中最小允許梯度值時(shí),訓(xùn)練都將被終止,并返回訓(xùn)練后的神經(jīng)網(wǎng)絡(luò)對(duì)象。
本文提出了一種基于多尺度分析和神經(jīng)網(wǎng)絡(luò)相結(jié)合的圖像目標(biāo)識(shí)別方法,通過2層Contourlet變換得到多維高頻特征向量,充分利用了BP神經(jīng)網(wǎng)絡(luò)并行處理能力強(qiáng)、識(shí)別預(yù)測(cè)準(zhǔn)確、穩(wěn)健性好的優(yōu)勢(shì),對(duì)特征向量進(jìn)行網(wǎng)絡(luò)訓(xùn)練。網(wǎng)絡(luò)測(cè)試結(jié)果表明,本方法目標(biāo)識(shí)別率高,精確性好,能滿足不同類型空中目標(biāo)的準(zhǔn)確識(shí)別要求。同時(shí),該方法對(duì)于紅外圖像明暗光照變化、目標(biāo)姿態(tài)變換均具有良好的魯棒性。