宋 楠,陳韜偉,趙 昆,余益民
(1.云南財經(jīng)大學(xué) 信息學(xué)院,云南 昆明 650221;2.云南財經(jīng)大學(xué) 信息中心,云南 昆明 650221)
在高維度的雷達(dá)輻射源信號識別中,脈內(nèi)特征數(shù)據(jù)由于受多種因素的影響,不易發(fā)現(xiàn)具有重要影響的特征,其分選識別的處理速度和可靠性都大大降低[1].無論是傳統(tǒng)的特征選擇算法還是改進(jìn)算法都是對原始項集中的每個項進(jìn)行獨立評估,計算每個項的權(quán)值,并按權(quán)值大小進(jìn)行降序排序,根據(jù)給定閾值或給定數(shù)目選取權(quán)值最高的若干項,形成新的特征集,因此易融入主觀性影響特征選擇的質(zhì)量[2].目前關(guān)于新體制雷達(dá)信號特征的研究工作,主要集中在基于時域、頻域、時頻域、調(diào)制域以及多種變換域等角度進(jìn)行特征分析和細(xì)微特征的研究上,提出的雷達(dá)輻射源信號特征參數(shù)已達(dá)數(shù)十種[3].但在復(fù)雜體制雷達(dá)共存以及高密度信號環(huán)境下,隨著融合特征維數(shù)不斷增加或雷達(dá)輻射源信號經(jīng)特征提取后的初始特征集維數(shù)可能變高,則特征之間必然存在信息冗余,分類的效果變差、特征無效的現(xiàn)象.因此需要采取有效的特征選擇算法對信號特征進(jìn)行分析,實現(xiàn)特征選擇和優(yōu)化.
特征選擇本質(zhì)上是一個組合優(yōu)化問題[4-5].當(dāng)特征維數(shù)過高時,窮舉的方法難以在多項式時間內(nèi)找到最優(yōu)解.因此,許多學(xué)者利用貪婪搜索[6]或智能優(yōu)化的方法搜索最優(yōu)解,但通常是以單個目標(biāo)作為優(yōu)化對象,且?guī)в休^強主觀性,從而影響特征選擇的效果.粒子群算法作為典型的優(yōu)化算法之一,通過速度和位置公式來更新粒子方向,由于具有易于理解和實現(xiàn)等優(yōu)勢,受到了科學(xué)與工程領(lǐng)域的廣泛關(guān)注,但其搜索策略較為單一,導(dǎo)致算法很難獲得 Pareto前沿且容易陷入局部最優(yōu)和無限迭代,在全局搜索和收斂性方面還有一定的不足.針對上述的問題,本文引入膜粒子群多目標(biāo)優(yōu)化算法從多個角度評價特征子集的質(zhì)量.在雷達(dá)輻射源信號脈內(nèi)特征選擇實驗過程中,采用1階差分自相關(guān)函數(shù)提取信號包絡(luò),利用樣本間的距離構(gòu)建相關(guān)度和冗余度作為目標(biāo)適應(yīng)度函數(shù),以此考察特征子集的質(zhì)量,有利于在非合作的點子對抗環(huán)境中無監(jiān)督的完成特征子集的選取.
圖1中的膜結(jié)構(gòu)由6層膜組成,最外層膜稱為表層膜,它將細(xì)胞內(nèi)部結(jié)構(gòu)與外界環(huán)境隔開.不包含其他膜結(jié)構(gòu)的稱為基本膜,每個膜所包圍的部分稱為區(qū)域.多目標(biāo)對象用大小寫字母表示,常見的進(jìn)化規(guī)則類型有多重集重寫規(guī)則(例如d→dy,y→c)和運輸規(guī)則等[1].膜結(jié)構(gòu)可等價表示為:={V,T,C,μ,ω1,ω2,…,ωm,R1,R1,…,Rm}.
膜結(jié)構(gòu)主要包括以下幾點:
1)V是目標(biāo)對象的字母表,其包含的元素為字符對象;
2)T?V是輸出字母表;
3)C?V是催化劑;
4)μ是一個由m個膜組成的膜結(jié)構(gòu),各個膜及其所圍的區(qū)域用標(biāo)號集H表示H={1,2,3,…,m},其中m稱為膜系統(tǒng)的度;
5)ωi∈V*(1≤i≤m)表示膜結(jié)構(gòu)μ中區(qū)域i包含的對象多重集;
6)Ri(1≤i≤m)是關(guān)于膜系統(tǒng)和區(qū)域μ的進(jìn)化規(guī)則的有限集.
粒子群算法(PSO)是1種解決多目標(biāo)優(yōu)化問題的群智能算法[5],具有結(jié)構(gòu)簡單、調(diào)整參數(shù)較少、魯棒性好等特點,其優(yōu)化問題的每一個解都被看作是搜索空間中的一只鳥,我們稱之為“粒子”.每個粒子根據(jù)自己的最佳位置和全局粒子的最佳位置在n維空間內(nèi)調(diào)整自己的方向和速度以搜索最優(yōu)解.為避免粒子陷入局部最優(yōu)和無限迭代,需平衡粒子的全局和局布搜索能力,因此在標(biāo)準(zhǔn)粒子群算法中引入了慣性權(quán)重的概念[4].鳥群中的鳥(即粒子)第t+1次飛行的速度和飛行后的位置根據(jù)如下公式確定:
Vt+1=ω×Vt+c1×rand()×(pBest-Xt)+c2×rand()×(gBest-Xt),
Xt+1=Xt+Vt+1.
(1)
Vt和Vt+1分別是第t和第t+1次飛行的速度;Xt和Xt+1分別是經(jīng)過第t和t+1次飛行后粒子落在的位置;ω為慣性權(quán)重(inertia weight),描述粒子的慣性對當(dāng)前速度的影響,其大小用來平衡局部和全局的搜索能力;c1和c2為個體最優(yōu)和全局最優(yōu)的學(xué)習(xí)因子;rand()是[0,1]上相互獨立的隨機數(shù);pBest是該粒子歷次飛行中“最好”的位置;gBest是種群中“最好”的粒子位置.經(jīng)過多次迭代,種群中的粒子會逐漸向“更好”的位置飛行,最終求得最優(yōu)解[16-17].
受膜系統(tǒng)功能和在分層結(jié)構(gòu)中處理化合物方式的啟發(fā),結(jié)合粒子群算法提出基于膜結(jié)構(gòu)的粒子群多目標(biāo)優(yōu)化算法(particle swarm multi-objective optimization algorithm based on membrane structure, PSOMM).PSOMM中采用具有層次結(jié)構(gòu)的細(xì)胞型P系統(tǒng),用字符對象表示優(yōu)化問題的可行解,由字符對象組成的解集構(gòu)成多重集.根據(jù)膜系統(tǒng)的分層結(jié)構(gòu),利用粒子群優(yōu)化的個體最優(yōu)和全局最優(yōu)概念,在基本膜中采用粒子群算法實現(xiàn)多搜尋策略并行更新解[18-19],通過進(jìn)化規(guī)則保持搜索解的多樣性.在表層膜中,利用外部檔案使用非支配解集和擁擠距離機制[20]提高非支配解的多樣性和算法收斂速度,使解集近似于Pareto前沿.
利用相關(guān)度和冗余度定義一組最小化的目標(biāo)函數(shù),用以評價雷達(dá)輻射源信號特征子集的質(zhì)量.其中相關(guān)度傾向保留所有與數(shù)據(jù)結(jié)構(gòu)關(guān)聯(lián)緊密的特征,而冗余度則會排除與已選特征相關(guān)度高的特征.二者作為膜粒子群算法的適應(yīng)度函數(shù).
相關(guān)度目標(biāo)將采用熵度量指標(biāo),定義如下:
(2)
其中,N是雷達(dá)信號數(shù)據(jù)樣本的個數(shù),a是權(quán)重系數(shù);Dij是樣本i和樣本j在x所表示的特征子集下的歐式距離,Da表示所有樣本在全空間下歐式距離的平均值;Sij的取值歸一化到[0,1].當(dāng)選擇的特征子集合理時,樣本i和樣本j若屬于同類,則Sij的取值很小,反之越大.從而f1(x)選取最小值.
冗余度目標(biāo)則利用相關(guān)系數(shù),當(dāng)相關(guān)系數(shù)絕對值越小,特征子集所包含的冗余越小,定義如下:
(3)
其中,nx表示雷達(dá)信號特征子集的個數(shù);d是總的特征個數(shù);xj和xk分別表示x中第j個和第k個元素的取值;bij表示第i個樣本在第j個特征上的取值,baj表示所有樣本在第j個特征上的均值.因此,在特征子集規(guī)模確定時,冗余度小的特征子集對應(yīng)的目標(biāo)函數(shù)值越小.
步驟1 將雷達(dá)輻射信號源的特征向量作為粒子(個體)隨機平均分配至每個基本膜中.
步驟2 計算Pareto前沿點.根據(jù)相關(guān)度和冗余度目標(biāo)函數(shù)計算雷達(dá)信號特征個體的適應(yīng)度,并求出當(dāng)前粒子的Pareto前沿點.
步驟3 初始化外部檔案.當(dāng)Pareto前沿點數(shù)量小于預(yù)設(shè)數(shù)值R時,直接將所有點存入外部檔案中.若Pareto前沿點數(shù)量大于預(yù)設(shè)數(shù)值,根據(jù)公式(4)計算所有Pareto前沿點的擁擠距離,從擁擠距離最小的點開始逐一刪除,直至備選存入外部檔案的Pareto前沿點數(shù)量與預(yù)設(shè)數(shù)值相等.然后將這些前沿點存放在外部檔案中.
(4)
步驟4 調(diào)用分裂規(guī)則創(chuàng)建基本膜.完成之前的準(zhǔn)備工作后,表層膜內(nèi)開始分裂生成M個基本膜.分裂基本膜數(shù)量M與外部檔案的Pareto前沿點數(shù)量相等.然后將這些存檔的Pareto前沿點作為該基本膜內(nèi)種群的最優(yōu)個體.最后,將其余各個粒子個體放入距離自身最近的Pareto前沿點所在基本膜中.
步驟5 基本膜內(nèi)獨立執(zhí)行膜粒子群算法.各個基本膜內(nèi),以最先存入外部檔案內(nèi)的Pareto前沿點為種群“最優(yōu)”個體,根據(jù)公式(1)計算新的個體速度和位置.并根據(jù)最新的位置重新計算適應(yīng)度.
步驟6 溶解.完成各自的粒子群算法后,各個基本膜破裂,將新產(chǎn)生的粒子重新釋放到表層膜內(nèi).
步驟7 計算前沿點,放入外部檔案.計算步驟6中所有被釋放到表層膜字符的Pareto前沿點.并將這些點存入外部檔案中.
步驟8 計算非支配排序,更新外部檔案.判斷外部檔案字符數(shù)量是否超出限制,如果超出限制,重新檔案內(nèi)所有字符的擁擠距離.從擁擠距離最小的點開始逐一刪除,直至外部檔案內(nèi)字符數(shù)量與預(yù)設(shè)數(shù)值相等.
步驟9 迭代.判斷當(dāng)前狀態(tài)是否滿足結(jié)束循環(huán)的條件.如果不滿足,則繼續(xù)執(zhí)行步驟4;如果滿足,執(zhí)行步驟10.
步驟10 輸出外部存檔內(nèi)的所有粒子.最終得到的Pareto前沿點,通過Pareto前沿即可獲得對應(yīng)的特征子集,統(tǒng)計所有的特征子集所選中的次數(shù),獲得所有特征重要度排序.
由于雷達(dá)輻射源信號的時域波形分布寬廣、隨機性強,在復(fù)雜、密集的電磁環(huán)境下存在較大的不確定性,為了在時域上突出雷達(dá)信號的調(diào)制特征,能夠識別更多的調(diào)制信號,本文采用文獻(xiàn)[2]所提出的一階差分運算方法,通過提取雷達(dá)信號的包絡(luò)統(tǒng)計特征,既可保留差分后的包絡(luò)差異,也可以使噪聲得到很好的抑制.有關(guān)一階差分自相關(guān)包絡(luò)特征提取步驟如下:
假設(shè)雷達(dá)偵察機接收到的含噪聲解析中頻信號為.
x(m)=s(m)+n(m),1≤m≤N,
(5)
其中,n(m)為離散高斯白噪聲,N為采樣的脈沖寬度,s(m)雷達(dá)輻射源信號.
步驟1 計算雷達(dá)輻射源信號的瞬時自相關(guān)函數(shù):
(6)
其中,k為相關(guān)時延,且k>0;A為信號幅度;f(m)和φ(m)分別為頻率和相位調(diào)制函數(shù);fs為采樣頻率.
步驟2 為解決噪聲信號對區(qū)分調(diào)制特征的影響,更直觀的闡述去噪過程,而不涉及具體的信號類型,采用以下的形式進(jìn)行一階差分自相關(guān)推導(dǎo):
y(m)=x(m)-x(m-1),m=1,2,…N.
(7)
步驟3 對差分y(m)求出自相關(guān)函數(shù)Ry(k),對所有k存在:
(8)
Ry(k)=E{y*(m)y(m+k)}=
E{[x*(m)-x*(m-1)][x(m+k)-x(m+k-1)]}=
E{x*(m)x(m+k)-x*(m)x(m+k-1)-x*(m-1)x(m+k)+x*(m-1)x(m+k-1)}
由公式(6)和公式(7)可得出:
Ry(k)≈E{rs(m,k)-rs(m,k-1)-rs(m-1,k+1)+rs(m-1,k)}.
(9)
由公式(9)可見,差分自相關(guān)函數(shù)Ry(k)與頻率、相位調(diào)制以及延遲k有關(guān),因此Ry(k)的包絡(luò)分量定義為:
U(k)=Re[Ry(k)]2+lm(Ry(k))2.
(10)
步驟4 利用基于距離的可分性判據(jù)對包絡(luò)進(jìn)行特征選擇,從而得到最能表征信號調(diào)制特性的特征向量.
仿真實驗采用的參數(shù)為:采樣頻率fs= 200 MHz、信號載頻f0= 50 MHz;脈沖寬度PW= 10 us;相關(guān)時延k=[1,200]的常規(guī)雷達(dá)輻射源信號(CW)、線性調(diào)頻信號(LFM)、非線性調(diào)頻信號(NLFM)、二頻率編碼信號(BFSK)、二項編碼信號(BPSK)、四項編碼信號(QPSK)和多項編碼信號(MPSK)提取差分自相關(guān)包絡(luò)特征后,獲得雷達(dá)輻射源信號包絡(luò)特征序列.使信噪比SNR從 0 dB 每隔 1 dB 變化到 5 dB,在每一SNR下,每種信號各隨機產(chǎn)生20個不同初相的樣本,7種典型信號則組成了樣本容量為840的數(shù)據(jù)集1;使SNR從 5 dB 每隔 5 dB 變化到 30 dB,在每一SNR下,每種信號各隨機產(chǎn)生20個不同初相的樣本,組成樣本容量為840的數(shù)據(jù)集2.根據(jù)提取出的差分自相關(guān)包絡(luò)特征,在特征集合延遲集合中選取出與其對應(yīng)的二維和三維最強包絡(luò)作為特征分量.
采用3.2所述的膜粒子群算法對雷達(dá)信號的包絡(luò)進(jìn)行多目標(biāo)特征選擇,獲得對雷達(dá)信號的包絡(luò)特征子集序列排序?qū)嶒灲Y(jié)果如下:
表1 算法對不同數(shù)據(jù)集所得到的維數(shù)重要性排序
圖4和圖5為選取前4個k值所對應(yīng)的包絡(luò)特征分別構(gòu)成7種雷達(dá)信號的2維和3維特征分布圖.由圖4可知,膜粒子群算法多目標(biāo)特征選擇所提取的重要特征子集在信噪比SNR為 0 dB 至 5 dB 時,小部分信號之間有交叉重合,但多數(shù)信號的分選性較好.從圖5中可知,特征子集在SNR=5 dB 以上表現(xiàn)出良好的可聚類性,信號之間明顯可分,邊界清晰無交疊,故可以簡化分選器的設(shè)計,提高分選識別率,有利于工程應(yīng)用.
最后采用傳統(tǒng)的FCM聚類算法對信號特征子集(選取最重要的前5個)進(jìn)行獨立100次測試,算法獲得的特征選擇平均誤識率如圖6所示.在5維以上的特征子集中,誤識率會隨維度的降低而減小.當(dāng)SNR變化為 0 dB 至 5 dB 時,特征子集維度為5的誤識率最??;當(dāng)SNR變化為 5 dB 至 200 dB 時,特征子集維度為3的誤識率為7.61%,達(dá)到最小值.但在2維與3維中有小部分信號會重疊,誤差率增大.總體來說,實驗結(jié)果表明算法所提取的重要特征子集具有良好的可聚類性,平均誤識率較低,分選識別率較高,驗證了算法的可行性與準(zhǔn)確性.
針對于雷達(dá)輻射源信號特征選擇方法中亟待解決的問題,本文提出了1種膜粒子群多目標(biāo)優(yōu)化算法.該算法利用膜系統(tǒng)的分層結(jié)構(gòu),在基本膜中采用粒子群算法實現(xiàn)多搜尋策略來更新解,并通過進(jìn)化規(guī)則保持搜索解的多樣性.采用相關(guān)度和冗余度兩個目標(biāo)函數(shù)優(yōu)化數(shù)據(jù)對象,既可保留相關(guān)特征,又剔除了冗余特征,從而以多個角度評價雷達(dá)輻射源信號特征子集的質(zhì)量,避免過早的陷入局部最優(yōu).
通過對雷達(dá)輻射源信號一階差分自相關(guān)運算所提取出雷達(dá)包絡(luò)統(tǒng)計特征數(shù)據(jù)集進(jìn)行的仿真實驗,驗證了此特征選擇算法的可行性和有效性.由于本文采用的是單層膜結(jié)構(gòu),在各個基本膜內(nèi)分別采用粒子群算法尋優(yōu),也存在計算代價高和算法穩(wěn)定性等方面的問題.因此,后續(xù)的研究將進(jìn)一步對膜框架結(jié)構(gòu)(固定簡單或動態(tài)變化)和交流規(guī)則(運輸,融合,分裂等)進(jìn)行設(shè)計,充分考察膜算法的能力.