劉 飛, 何明浩, 韓 俊
(1.空軍預(yù)警學(xué)院, 湖北 武漢 430019; 2. 中國(guó)人民解放軍95174部隊(duì), 湖北 武漢 430040)
隨著數(shù)據(jù)采集、存儲(chǔ)、傳輸技術(shù)的快速發(fā)展,雷達(dá)輻射源信號(hào)(radar emitter signal,RES)識(shí)別方法逐漸從傳統(tǒng)的信號(hào)脈沖描述字轉(zhuǎn)向了基于脈沖波形數(shù)據(jù)的脈內(nèi)特征參數(shù)[1-2]。因此,挖掘和提取更能表征RES的脈內(nèi)特征參數(shù)成為研究熱點(diǎn),如:頻譜特征[3-4]、時(shí)頻特征[5-9]、雙譜特征[10]、模糊函數(shù)特征[11-12]、相像系數(shù)特征[13]、熵特征[14-17]、復(fù)雜度特征[18]等出現(xiàn)在各文獻(xiàn)研究中。各種脈內(nèi)特征參數(shù)的挖掘應(yīng)用一定程度上解決了傳統(tǒng)識(shí)別方法中的錯(cuò)分誤判問題,提高了雷達(dá)輻射源識(shí)別的準(zhǔn)確率。
然而,脈內(nèi)特征參數(shù)在工程應(yīng)用中的一些局限性也慢慢涌現(xiàn)出來[19-20]。一個(gè)常見的局限性就是大多特征僅對(duì)限定調(diào)制類型的RES具有較好的識(shí)別性能,而難以識(shí)別其他調(diào)制類型的RES[21-22]。例如,時(shí)頻特征對(duì)單載頻信號(hào)、線性調(diào)頻信號(hào)、非線性調(diào)頻信號(hào)有很好的識(shí)別效果,但對(duì)頻率編碼信號(hào)和頻率分集信號(hào)卻無能為力;再如,模糊函數(shù)特征對(duì)頻率編碼信號(hào)和頻率分集信號(hào)有很好的識(shí)別效果,但對(duì)非線性調(diào)頻信號(hào)和線性調(diào)頻加二相編碼信號(hào)的識(shí)別率卻并不高。另一個(gè)局限性是單個(gè)特征的識(shí)別率隨仿真條件的變優(yōu)而有趨于“邊緣效應(yīng)”的現(xiàn)象,不能突破自身識(shí)別率的“瓶頸”[23-24]。在特征提取仿真試驗(yàn)中,當(dāng)特征維數(shù)達(dá)到一定值后,增加特征維數(shù)并沒有帶來明顯的識(shí)別率收益,相反,提取較高維數(shù)的特征會(huì)顯著提高識(shí)別時(shí)間成本。
針對(duì)上述問題,本文擬通過組合不同種類的特征,構(gòu)建特征參數(shù)集,集聚各特征參數(shù)在不同調(diào)制類型RES中的識(shí)別優(yōu)勢(shì),提升基于特征參數(shù)集的識(shí)別方法的通用性和準(zhǔn)確性。
特征組合是指將兩種及以上不同特征參數(shù),通過特征數(shù)據(jù)的連接,變?yōu)橐环N新的特征的過程。給定兩種分別為m維和n維的特征,即A={a1,a2,…,am}和B={b1,b2,…,bn},則他們可以按以下方式組合,即
[A,B]={a1,a2,…,am,b1,b2,…,bn}
(1)
或:
[B,A]={b1,b2,…,bn,a1,a2,…,am}
(2)
上面2種組合方式,僅是2種特征參數(shù)特征數(shù)據(jù)連接順序的不同。由式可知,特征組合后的維數(shù)為2種對(duì)應(yīng)特征的維數(shù)之和,即A和B的特征組合維數(shù)為m+n。
討論不同類型的特征參數(shù)組合對(duì)識(shí)別性能的影響。對(duì)引言中提及的7種特征進(jìn)行仿真分析,仿真條件為:訓(xùn)練數(shù)據(jù)的樣本量為3 500(每種特征500個(gè)),測(cè)試數(shù)據(jù)的樣本量為700(每種特征100個(gè)),分類器為支持向量機(jī)(support vector machine,SVM),SVM核函數(shù)為徑向基函數(shù)(radial basis function,RBF),RBF參數(shù)γ=0.200 0,懲罰系數(shù)C=0.100 0。
分別以每種特征為對(duì)象,與其他特征進(jìn)行組合,特征組合性能仿真結(jié)果如圖1所示,圖1中,橫坐標(biāo)“1”至“6”分別代表其他特征,次序與頻譜特征、時(shí)頻特征、雙譜特征、模糊函數(shù)特征、相像系數(shù)特征、熵值特征、復(fù)雜度特征一致。
圖1 各種特征與其他特征組合識(shí)別性能Fig.1 Recognition performance of various characteristics combined with other characteristics
由圖可知,特征組合對(duì)識(shí)別性能的影響有以下3種情況:
(1) 組合特征識(shí)別率同時(shí)高于對(duì)象特征和其他特征,如雙譜特征、模糊函數(shù)特征、相像系數(shù)特征,說明此類特征與其他特征的組合對(duì)雙方均是有益的,屬于互利型特征;
(2) 組合特征識(shí)別率高于對(duì)象特征而部分低于其他特征,如時(shí)頻特征、復(fù)雜度特征,說明此類特征與其他特征的組合對(duì)自身是有益的,而對(duì)其他特征并不一定有益,屬于利己型特征;
(3) 組合特征識(shí)別率高于其他特征而部分低于對(duì)象特征,如頻譜特征、熵值特征,說明此類特征與其他特征的組合對(duì)其他特征是有益的,而對(duì)自身并不一定有益,屬于利它型特征。
總體來說,組合特征的識(shí)別性能與單個(gè)特征相比是提升的,在仿真中沒有出現(xiàn)組合特征識(shí)別率同時(shí)低于對(duì)象特征和其他特征的情況。
討論特征分別按照式(1)與式(2)進(jìn)行組合對(duì)識(shí)別性能的影響。將7種特征按頻譜特征、時(shí)頻特征、雙譜特征、模糊函數(shù)特征、相像系數(shù)特征、熵值特征、復(fù)雜度特征的次序兩兩進(jìn)行組合,由此得到的特征組合稱為順序組合;將上述組合的次序進(jìn)行交換,由此得到的特征組合稱為反序組合。在第1.1節(jié)的仿真條件下,各特征組合的順序和反序識(shí)別率如圖2所示。
圖2 特征組合順序?qū)ψR(shí)別性能的影響Fig.2 Effect of characteristic combination order on recognition performance
由圖2可知,各特征組合的反序識(shí)別率與順序識(shí)別率完全一致,說明特征組合排列次序的改變對(duì)識(shí)別性能是沒有影響的。通過對(duì)其他特征組合方式的仿真驗(yàn)證,均有此結(jié)論。因此,特征組合式(1)和式(2)是等效的。
討論不同個(gè)數(shù)的特征參數(shù)組合對(duì)識(shí)別性能的影響。為討論問題的完備性,將單個(gè)特征作為特征個(gè)數(shù)為1的情況納入對(duì)比分析。根據(jù)特征組合公式,對(duì)于N種不同類型的特征參數(shù),特征組合方式的總數(shù)為
(3)
在對(duì)7種特征所有組合方式的性能分析中發(fā)現(xiàn),特征組合可分為2種情況:
(1)優(yōu)型組合,如i=2、i=3、i=5時(shí),識(shí)別率排名第1的組合方式等,他們的識(shí)別率高于對(duì)應(yīng)特征的其他所有組合情況,定義該類組合為優(yōu)型組合。優(yōu)型組合實(shí)現(xiàn)了特征參數(shù)識(shí)別率的提高,是在進(jìn)行組合時(shí)最希望得到的結(jié)果。
以i=5中排名第一的組合為例,其對(duì)應(yīng)特征為時(shí)頻特征、雙譜特征、模糊函數(shù)特征、相像系數(shù)特征、熵值特征,對(duì)應(yīng)特征的其他所有組合與該組合的識(shí)別率對(duì)比情況如圖3所示,圖3中橫坐標(biāo)為其他組合序號(hào),虛線為該組合識(shí)別率參考線98.43%。
圖3 優(yōu)型組合示例圖Fig.3 Example diagram of optimal combination
由圖3可知,其他組合的識(shí)別率均低于該組合識(shí)別率,圖3中接近虛線的3個(gè)識(shí)別率分別為98.29%、98.14%、98.29%,故該組合為優(yōu)型組合。
(2)非優(yōu)型組合,如i=2至i=7時(shí),識(shí)別率排名倒數(shù)第一的組合方式等,他們的識(shí)別率低于對(duì)應(yīng)特征的所有組合中的部分組合情況,定義該類組合為非優(yōu)型組合。非優(yōu)型組合并沒有實(shí)現(xiàn)相對(duì)所有特征參數(shù)識(shí)別率的提高,所以在實(shí)際應(yīng)用中往往舍棄這類組合。
以i=5中排名倒數(shù)第1的組合為例,其對(duì)應(yīng)特征為頻譜特征、時(shí)頻特征、雙譜特征、模糊函數(shù)特征、復(fù)雜度特征,對(duì)應(yīng)特征的其他所有組合與該組合的識(shí)別率對(duì)比情況如圖4所示,圖4中橫坐標(biāo)為其他組合序號(hào),虛線為該組合識(shí)別率參考線77.57%。
圖4 非優(yōu)型組合示例圖Fig.4 Example diagram of non-optimal combination
由圖4可知,其他組合的識(shí)別率有低于該組合識(shí)別率的情況,也有高于該組合識(shí)別率的情況,故該類組合為非優(yōu)型組合。
特征參數(shù)集是特征組合(含單特征)中優(yōu)型組合的一種,若記某特征參數(shù)集為Θ,所有特征參數(shù)組合構(gòu)成的集合為Ω,則{Θ}為Ω的一個(gè)子集,即:{Θ}?Ω。所有特征參數(shù)集構(gòu)成的集合Ψ,Ψ是對(duì)Ω的精簡(jiǎn),即:Ψ?Ω,在識(shí)別率上Ψ和Ω是等效完備的。
根據(jù)第1.3節(jié)對(duì)優(yōu)型組合的定義,優(yōu)型組合的識(shí)別率高于對(duì)應(yīng)特征的其他所有組合情況,同樣,特征參數(shù)集的識(shí)別率應(yīng)高于組成參數(shù)集對(duì)應(yīng)特征的其他所有組合情況。設(shè)某特征參數(shù)集Θ={Θ1,Θ2,…,Θn},由對(duì)應(yīng)特征Θ1、Θ2、…、Θn的其他組合構(gòu)成的集合記為Λ,由Θ1、Θ2、…、Θn組成的特征參數(shù)集全集記為Ψ,則關(guān)于特征參數(shù)集Θ有以下結(jié)論成立:
(1)Θ的識(shí)別率高于Λ中所有元素的識(shí)別率,即
p(Θ)>p(κ|Λ)
(4)
式中,p(·)為識(shí)別率函數(shù),κ為Λ中的元素。
(2)Θ為Ψ中含特征參數(shù)個(gè)數(shù)最多的集合,當(dāng)θ為全特征參數(shù)集時(shí),與Λ互為補(bǔ)集,即
(5)
式中,Φ為空集。
(3) 當(dāng)Θ為單特征參數(shù)集時(shí),{Θ}=Ψ,Λ=Φ。
(4) 所有單特征構(gòu)成的組合{Θ1},{Θ2},…,均為特征參數(shù)集。
(5) 對(duì)于特征個(gè)數(shù)分別為n、n+1的特征參數(shù)集Θn和Θn+1,若滿足Θn?Θn+1,則稱Θn和Θn+1為同源特征參數(shù)集。同源特征參數(shù)集的最大識(shí)別率是隨特征個(gè)數(shù)遞增的,即
max(p(Θn+1(Θ1,Θ2,…,Θn)))>
max(p(Θn(Θ1,Θ2,…,Θn)))
(6)
因此,對(duì)于從特征參數(shù)組合中找出所有的特征參數(shù)集,可根據(jù)其構(gòu)建規(guī)則,按特征個(gè)數(shù)遞增的步驟進(jìn)行標(biāo)記。
步驟1標(biāo)記所有單特征組合為特征參數(shù)集;
步驟2對(duì)所有的兩個(gè)特征組合,與對(duì)應(yīng)的單特征組合進(jìn)行比較,若某組合識(shí)別率均高于單特征,則標(biāo)記該組合為特征參數(shù)集;
步驟3對(duì)所有的3個(gè)特征組合,與步驟1、步驟2中對(duì)應(yīng)的特征參數(shù)集進(jìn)行比較,若某組合識(shí)別率均高于已標(biāo)記的對(duì)應(yīng)特征參數(shù)集,則標(biāo)記該組合為特征參數(shù)集;
步驟4后續(xù)個(gè)數(shù)的特征組合,可類似步驟3,與之前所有已標(biāo)記的對(duì)應(yīng)特征參數(shù)集進(jìn)行比較,依次標(biāo)記是否為特征參數(shù)集。
對(duì)于同源特征參數(shù)集,特征個(gè)數(shù)越多識(shí)別率越高,然而,高的識(shí)別率有可能耗費(fèi)較高的時(shí)間成本。在RES識(shí)別中,由于SVM屬于基于統(tǒng)計(jì)學(xué)習(xí)的分類器[25-28],其分類模型可提前通過學(xué)習(xí)訓(xùn)練獲得,因此,參數(shù)集的時(shí)間成本主要由識(shí)別過程的2個(gè)環(huán)節(jié)產(chǎn)生,一是特征提取環(huán)節(jié)產(chǎn)生的特征提取時(shí)間,另一是分類識(shí)別環(huán)節(jié)產(chǎn)生的分類識(shí)別時(shí)間。
計(jì)算算法時(shí)間的常用方法有2種,一種是計(jì)算該算法中所有語句的頻度之和[29],另一種是計(jì)算算法執(zhí)行時(shí)用到的加減乘除等運(yùn)算的次數(shù)[30-31]。這2種方法通過對(duì)算法的詳細(xì)分析均能準(zhǔn)確地定量計(jì)算出算法的時(shí)間,但是,隨著算法開發(fā)平臺(tái)和對(duì)應(yīng)計(jì)算機(jī)語言的發(fā)展,大量使用各種算法包和隱性封裝各種函數(shù),使準(zhǔn)確分析出算法的步驟變得十分困難。因此,本文采用工程應(yīng)用中常用到的統(tǒng)計(jì)分析方法,來獲取特征提取時(shí)間和分類識(shí)別時(shí)間。
由于特征參數(shù)的提取時(shí)間和原始波形數(shù)據(jù)的長(zhǎng)度有關(guān),而原始波形數(shù)據(jù)的長(zhǎng)度與信號(hào)采樣率和脈沖寬度有關(guān),對(duì)于未知信號(hào),信號(hào)的脈沖寬度是不能事先獲得的,所以,原始波形數(shù)據(jù)的長(zhǎng)度也無法事先確定。但是,為便于統(tǒng)一決策參考,這里將原始波形數(shù)據(jù)的基準(zhǔn)長(zhǎng)度定義為2 048(采樣頻率為120 MHz時(shí),脈寬范圍為8.54~17.06 μs)。
分別根據(jù)特征提取算法,對(duì)隨機(jī)產(chǎn)生的不同調(diào)制類型的原始波形數(shù)據(jù)做特征提取實(shí)驗(yàn),記錄每次實(shí)驗(yàn)耗費(fèi)時(shí)間,如此進(jìn)行200次蒙特卡羅實(shí)驗(yàn),將實(shí)驗(yàn)時(shí)間均值作為特征提取時(shí)間。表1所示為各特征參數(shù)的提取時(shí)間,實(shí)驗(yàn)平臺(tái)參數(shù)為:英特爾i3雙核CPU,主頻1.70 GHz,內(nèi)存4.00 GB,Windows 8.1中文版64位操作系統(tǒng)。
表1 特征參數(shù)提取時(shí)間
SVM在進(jìn)行RES識(shí)別時(shí),分類識(shí)別時(shí)間主要與樣本的維數(shù)有關(guān),在7種特征參數(shù)中,頻譜特征、時(shí)頻特征、雙譜特征、模糊函數(shù)特征的維數(shù)為256維,記為一次變換特征,相像系數(shù)特征、熵值特征、復(fù)雜度特征的維數(shù)為2維,記為二次變換特征。由于一次變換特征與二次變化特征在維數(shù)上相差較大,多次仿真實(shí)驗(yàn)表明,當(dāng)一次變換特征與二次變換特征組合時(shí),二次變換特征的維數(shù)對(duì)分類識(shí)別時(shí)間的影響較小。0~4個(gè)一次變換特征及其分別與1~3個(gè)二次變換特征組合的分類識(shí)別時(shí)間如圖5所示,圖5中橫坐標(biāo)依次為1個(gè)二次變換特征的組合、2個(gè)二次變換特征的組合、3個(gè)二次變換特征的組合、1個(gè)一次變換特征的組合、1個(gè)一次變化特征與1個(gè)二次變換特征的組合、1個(gè)一次變化特征與2個(gè)二次變換特征的組合、……、2個(gè)一次變換特征的組合、2個(gè)一次變化特征與1個(gè)二次變換特征的組合、……、4個(gè)一次變化特征與3個(gè)二次變換特征的組合。
圖5 特征組合分類識(shí)別時(shí)間圖Fig.5 Time map of characteristic combination classification and recognition
由圖5可知,特征組合分類識(shí)別時(shí)間隨一次變換特征個(gè)數(shù)的增加呈階梯狀遞增,因此,按照一次變換特征的個(gè)數(shù),可將分類識(shí)別時(shí)間分為5個(gè)等級(jí),分別對(duì)應(yīng)0~4個(gè)一次變換特征及其與二次變換特征組合方式。通過多次蒙特卡羅實(shí)驗(yàn),獲得不同等級(jí)的分類識(shí)別時(shí)間如表2所示(實(shí)驗(yàn)平臺(tái)參數(shù)同上)。
表2 特征組合分類識(shí)別時(shí)間
在RES識(shí)別中,特征提取環(huán)節(jié)和分類識(shí)別環(huán)節(jié)之間為串聯(lián)關(guān)系。因此,特征參數(shù)集的總時(shí)間成本為特征提取時(shí)間和分類識(shí)別時(shí)間之和,即
T=Tc+Ts
(7)
式中,T為參數(shù)集的總時(shí)間成本;Tc為特征提取時(shí)間;Ts為分類識(shí)別時(shí)間。
(8)
若Θ={Θ1,Θ2,…,Θn}中屬于一次變換特征的個(gè)數(shù)為m,則參數(shù)集分類識(shí)別時(shí)間為
(9)
根據(jù)上述特征參數(shù)集的構(gòu)建規(guī)則和時(shí)間成本計(jì)算方法,得出7種特征的所有參數(shù)集的識(shí)別率和時(shí)間成本如表3所示,表中,fft、stft、bi、amb、cr、en、cp分別代表頻譜特征、時(shí)頻特征、雙譜特征、模糊函數(shù)特征、相像系數(shù)特征、熵值特征、復(fù)雜度特征。
表3 特征參數(shù)集的識(shí)別率和時(shí)間成本
各特征參數(shù)集的對(duì)應(yīng)識(shí)別率和時(shí)間成本數(shù)據(jù)按式(10)進(jìn)行歸一化。
(10)
式中,dmax、dmin分別為數(shù)據(jù)序列{d1,d2,…,dn}中的最大值和最小值。
歸一化后的特征參數(shù)集識(shí)別率與時(shí)間成本之間的關(guān)系如圖6所示。
由圖6可知,特征參數(shù)集的識(shí)別率和時(shí)間成本之間并沒有出現(xiàn)嚴(yán)格一致的變化關(guān)系,也就是說特征參數(shù)集特征組成情況與識(shí)別率、時(shí)間成本之間沒有恒定的單調(diào)關(guān)系,因此,需要根據(jù)實(shí)際需求做出最優(yōu)的決策——在獲得較高識(shí)別率的同時(shí)消耗較小時(shí)間成本。
圖6 特征參數(shù)集識(shí)別率與時(shí)間成本對(duì)應(yīng)關(guān)系Fig.6 Relationship between recognition rate and time cost of characteristics parameters
在RES識(shí)別中,有2種情況是經(jīng)常遇見的,一是現(xiàn)場(chǎng)采集波形數(shù)據(jù),實(shí)時(shí)識(shí)別RES;二是采集存儲(chǔ)波形數(shù)據(jù),事后識(shí)別RES。對(duì)于第1種情況,最優(yōu)決策是在限定識(shí)別率條件下,選擇時(shí)間成本最小的特征參數(shù)集,該特征參數(shù)集定義為時(shí)效集;對(duì)于第2種情況,最優(yōu)決策是在限定時(shí)間成本條件下,選擇識(shí)別率最高的特征參數(shù)集,該特征參數(shù)集定義為精準(zhǔn)集。
記特征參數(shù)集為Θ,所有特征參數(shù)集構(gòu)成的集合為Ψ,則時(shí)效集為
ΘAE=
Θ|(Θ∈Ψ,min(T(Θ))|p(Θ)≥p0)
(11)
式中,T(Θ)為特征參數(shù)集的時(shí)間成本;p(Θ)為特征參數(shù)集的識(shí)別率;p0為限定識(shí)別率。
根據(jù)定義式(11),構(gòu)建特征參數(shù)時(shí)效集的方法步驟如下:
步驟1將所有特征參數(shù)集的識(shí)別率表和時(shí)間成本表按特征參數(shù)集的構(gòu)建方式進(jìn)行對(duì)應(yīng)合并整合;
步驟2找出所有識(shí)別率高于限定識(shí)別率的特征參數(shù)集;
步驟3找出步驟2中時(shí)間成本最小的特征參數(shù)集。
例如,某實(shí)時(shí)識(shí)別場(chǎng)合,給定最低識(shí)別率為85%,根據(jù)合并整合的特征參數(shù)集表(表3),篩選出特征參數(shù)集有序號(hào)1、4、8、9、10、……,上述特征參數(shù)集中,時(shí)間成本最小為10.58 ms,對(duì)應(yīng)序號(hào)1,特征參數(shù)集構(gòu)成為頻譜特征,此即為滿足需求的時(shí)效集。
記特征參數(shù)集為Θ,所有特征參數(shù)集構(gòu)成的集合為Ψ,則精準(zhǔn)集為
ΘCP=Θ|(Θ∈Ψ,max(p(Θ))|T(Θ)≤T0)
(12)
式中,p(Θ)為特征參數(shù)集的識(shí)別率;T(Θ)為特征參數(shù)集的時(shí)間成本;T0為限定時(shí)間成本。
根據(jù)定義式(12),構(gòu)建特征參數(shù)精準(zhǔn)集的方法步驟如下:
步驟1將所有特征參數(shù)集的識(shí)別率和時(shí)間成本按特征參數(shù)集的構(gòu)成方式進(jìn)行對(duì)應(yīng)合并整合;
步驟2找出所有時(shí)間成本小于限定時(shí)間的特征參數(shù)集;
步驟3找出步驟2中識(shí)別率最高的特征參數(shù)集。
例如,某實(shí)時(shí)識(shí)別場(chǎng)合,給定最低每次識(shí)別時(shí)間在1 s以內(nèi),根據(jù)合并整合的特征參數(shù)集表(見表3),篩選出特征參數(shù)集有序號(hào)1、2、3、……、27、……,上述特征參數(shù)集中,識(shí)別率最高為95.86%,對(duì)應(yīng)序號(hào)27,特征參數(shù)集構(gòu)成為頻譜特征、模糊函數(shù)特征、復(fù)雜度特征,此即為滿足需求的精準(zhǔn)集。
為突破單個(gè)脈內(nèi)特征參數(shù)識(shí)別性能的“邊緣效應(yīng)”,獲得更高的識(shí)別率,從特征參數(shù)的組合入手,提出特征組合的方式和相關(guān)約定,并重點(diǎn)研究了特征種類、特征個(gè)數(shù)、信號(hào)環(huán)境對(duì)特征組合識(shí)別性能的影響。在此基礎(chǔ)上,進(jìn)一步對(duì)特征組合中的優(yōu)型組合進(jìn)行研究討論,提出特征參數(shù)集的構(gòu)建規(guī)則和生成方法,并就特征參數(shù)集的時(shí)間成本進(jìn)行了分析。最后,根據(jù)識(shí)別率和時(shí)間成本因素,構(gòu)建了2種典型的特征參數(shù)集——時(shí)效集和精準(zhǔn)集,為脈內(nèi)特征參數(shù)集在RES監(jiān)測(cè)、偵察、分析等工程應(yīng)用方面奠定了良好的理論基礎(chǔ)。