顧 鵬,張 瑞,黃黔川,張明陽,顧陽陽
(1.電子信息控制重點實驗室,四川 成都610036;2.中國航天科工集團8511研究所,江蘇 南京210007)
雷達輻射源信號關聯(lián),特別是復雜電磁環(huán)境下未知參數的雷達輻射源信號關聯(lián)是無源偵察的關鍵技術之一。在無源偵察情報融合處理時,面對單個或多個偵察設備不同時刻上報的偵察數據,首先要進行的就是輻射源信號關聯(lián),即確定不同時刻、不同設備偵收的信號是否來自同一個輻射源。實際偵收目標的位置、參數的不確定性,以及各平臺的偵察設備偵收能力的不同,為不同平臺的數據關聯(lián)增加了難度[1-3]。
傳統(tǒng)的雷達輻射源關聯(lián)方法是基于EDW(Emitter Discreption Word)的數據關聯(lián)方法,即利用射頻、脈沖重復間隔、脈寬、輻射源到達角等雷達輻射源脈間特征以及脈內特征通過參數模板匹配法進行關聯(lián)判決[4],該方法的特點是原理簡單、運算量小,但需要人工預設關聯(lián)門限和權值,經驗性和隨意性較強,而且往往只適用于常規(guī)體制雷達,對參數類型捷變或脈組滑變等相控陣體制雷達關聯(lián)時增批嚴重??紤]上述方法的不足,本文提出了一種基于決策樹的雷達輻射源關聯(lián)方法,首先根據雷達輻射源特征構建決策樹進行輻射源粗關聯(lián),再根據粗關聯(lián)結果獲取相應的關聯(lián)規(guī)則進行精細化關聯(lián),從而提升關聯(lián)正確率,該方法相比于傳統(tǒng)的雷達輻射源關聯(lián)方法關聯(lián)正確率高,且運算量較小。
決策樹是一種基本的分類方法,屬于監(jiān)督學習中的一種。決策樹學習的關鍵在于如何選擇最優(yōu)的劃分屬性,所謂的最優(yōu)劃分屬性,對于二元分類而言,就是盡量使劃分的樣本屬于同一類別,即“純度”最高的屬性。那么如何來度量特征(features)的純度,這時候就要用到“信息熵(information entropy)”。信息熵的定義為假如當前樣本集D中第k類樣本所占的比例為pk(k=1,2,3,…,|K|),K為類別的總數(對于二元分類來說,K=2)。則樣本集的信息熵為:
Ent(D)的值越小,則D的純度越高。
假定離散屬性a有V個可能的取值{a1,a2,…,aV},如果使用特征a來對數據集D進行劃分,則會產生V個分支結點,其中第v個結點包含了數據集D中所有在特征a上取值為aV的樣本總數,記為Dv。因此可以根據上面信息熵的公式計算出信息熵,再考慮到不同的分支結點所包含的樣本數量不同,給分支節(jié)點賦予權重|Dv|/|D|,即樣本數越多的分支節(jié)點的影響越大,因此,能夠計算出特征a對樣本集D進行劃分所獲得的“信息增益”:
一般而言,信息增益越大,則表示使用特征a對數據集劃分所獲得的“純度提升”越大。
決策樹是一種構建分類模型的非參數方法,不要求任何先驗假設,即使訓練量非常大,也可以快速構建模型。決策樹一旦建立,對未知樣本分類就非常快,對噪聲干擾具有很好的魯棒性[5]。考慮當前面臨的輻射源信號數據量大、信號復雜,而對關聯(lián)準確性、實時性又有較高要求,結合決策樹分類能力強、實時性好以及易于集成等特點,在傳統(tǒng)雷達輻射源關聯(lián)方法上進行改進,本文研究了一種基于決策樹的雷達輻射源關聯(lián)方法。流程如圖1所示。
圖1 基于決策樹的雷達輻射源關聯(lián)方法
在雷達信號關聯(lián)過程中,選擇合適的參數關聯(lián)權重及門限至關重要。參數門限設置過小會導致增批,設置過大又會導致不同信號合批錯誤,參數關聯(lián)權重直接影響關聯(lián)相似度計算的準確性?;跊Q策樹進行粗關聯(lián)主要考慮參數關聯(lián)權重及門限應該動態(tài)變化:雷達信號參數類別不同,則參數權重及門限不同;同一部雷達信號偵收設備型號不同,則參數權重及門限不同;同一偵收設備對不同波段的信號測量精度差異也會導致參數門限不同。因此,在設置參數關聯(lián)權重及門限時應綜合考慮上述因素,提升關聯(lián)正確率。
本文利用數據庫中先驗知識信息,計算各特征對分類的信息增益,選擇信息增益最大的射頻類型、重復間隔類型、脈寬類型、射頻均值等作為特征集構建決策樹模型。參數特征表如表1—4所示,數據集實例如表5所示。
表1 射頻特征
表2 重復間隔特征
表3 脈寬特征
表4 射頻均值(波段)
表5 數據集示例
通過訓練數據集和分類屬性標簽,存儲選擇最優(yōu)特征標簽創(chuàng)建決策樹,如圖2所示。通過決策樹對未知雷達輻射源信號樣本進行分類預測,獲取粗關聯(lián)結果。
圖2 基于輻射源特征構建決策樹
假設射頻類型特征集為C1={C10,C11,C12,…,C1n},相應的射頻類型權重為W1={ω10,ω11,ω12,…,ω1n},射頻類型門限為T1={T10,T11,T12,…,T1n},n表示射頻特征的個數;重復間隔類型特征集為C2={C20,C21,C22,…,C2m},相應的重復間隔類型權重為W2={ω20,ω21,ω22,…,ω2m},重 復 間 隔 門 限 為T2={T20,T21,T22,…,T2m},m表示重復間隔特征的個數;脈寬類型特征集為C3={C30,C31,C32,…,C3k},相應的脈寬類型權重為W3={ω30,ω31,ω32,…,ω3k},脈寬門限為T3={T30,T31,T32,…,T3k},k表示脈寬特征的個數;射頻均值特征集為C4={C40,C41,C42,…,C4p},不同波段下參數測量精度影響因子為T4={ΔT40,ΔT41,ΔT42,…,ΔT4p},p表示射頻均值特征的個數。
基于關聯(lián)規(guī)則進行精細化關聯(lián)時首先根據粗關聯(lián)結果獲取相應特征參數向量權重及關聯(lián)門限,得到不同類別雷達的特征參數向量關聯(lián)規(guī)則。然后根據不同的關聯(lián)規(guī)則進行精細化關聯(lián)處理提升關聯(lián)正確率。具體為:假設雷達信號參數特征向量為R1=(C11,C20,C32,C41),則根據預分類結果獲取相應的關聯(lián)規(guī)則為W1=ω11,T1=T11,W2=ω20,T2=T20,W3=ω32,T3=T32,T4=ΔT41。
為了驗證基于決策樹的雷達輻射源關聯(lián)方法有效性及關聯(lián)正確率,現(xiàn)模擬生成5部雷達輻射源作為已知先驗知識庫,見表6。
表6 模擬5部雷達輻射源EDW參數
測試數據集選擇射頻類型、重復間隔類型、脈寬類型以及射頻均值等特征作為分類特征構建決策樹對輻射源信號進行粗關聯(lián)。
根據公式(2)計算分類屬性特征的信息增益,見表7。信息增益最大的特征依次為波段(1.447)、重頻類型(1.252)、射頻類型(1.000)和脈寬類型(0.764),選擇最優(yōu)特征標簽創(chuàng)建決策樹。
表7 分類特征信息增益
仿真場景:每部雷達模擬開機200 s,偵收設備每秒上報一次分選結果,共計上報200個雷達信號分選結果。后一秒信號和前一秒信號進行關聯(lián),關聯(lián)上則進行參數融合,關聯(lián)相似度門限設為0.95,分別采用固定權重門限方法、按參數類型調整門限方法和基于決策樹的雷達輻射源關聯(lián)方法進行關聯(lián)。其中,固定權重門限方法中射頻、重復間隔和脈寬門限分別為5 MHz、20μs、5μs,權重分別為0.75、0.1、0.15;按參數類型調整門限方法中射頻、重復間隔和脈寬初始門限分別為5 MHz、20μs、5μs,但根據參數類型對門限放大,權重仍為0.75、0.1、0.15;基于決策樹的雷達輻射源關聯(lián)方法中射頻、重復間隔和脈寬初始門限分別為4 MHz、15μs、4μs,權重分別為0.75、0.1、0.15,門限和權重根據參數類型適應性變化,統(tǒng)計關聯(lián)正確率,如圖3所示。
圖3 關聯(lián)正確率對比
仿真結果表明:固定權重門限方法受參數類型和變化范圍影響最大,只有參數類型都為固定,且門限大于參數變化范圍,正確率才高于0.6;按參數類型調整門限方法相對固定權重門限方法正確率大大提高,但輻射源1和4關聯(lián)正確率較低,是因為該方法門限仍然相對固定,所以還是受參數類型和變化范圍影響;而基于決策樹的雷達輻射源關聯(lián)方法關聯(lián)正確率較高,超過0.9,而且表現(xiàn)穩(wěn)定,在參數關聯(lián)初始門限小于前兩者的情況下仍然有較高正確率,對參數類型和變化范圍不敏感,證明了該方法的有效性。
本文研究了一種基于決策樹的雷達輻射源關聯(lián)方法,關聯(lián)規(guī)則能夠根據未知雷達輻射源類別、不同波段的信號測量精度差異等影響因子動態(tài)變化,因此關聯(lián)正確率高,且魯棒性好。下一步將基于決策樹提取多維特征對雷達輻射源進行分類識別,并進一步研究精細化關聯(lián)識別策略,提升關聯(lián)識別正確率。