尚佳棟,張文婧,楊春景
(中國(guó)航天科工集團(tuán)第二研究院 北京遙感設(shè)備研究所,北京 100854)
跳頻通信具有良好的組網(wǎng)能力,通過(guò)組網(wǎng)可以達(dá)到擴(kuò)展通信覆蓋范圍和增大通信容量的目的,同時(shí)能夠增強(qiáng)通信系統(tǒng)的存活能力。目前組網(wǎng)通信已經(jīng)成為跳頻通信系統(tǒng)具有的基本功能[1],因此對(duì)跳頻通信網(wǎng)內(nèi)各電臺(tái)的信號(hào)進(jìn)行分選成為跳頻通信偵察中的一項(xiàng)重要任務(wù)[2]。在實(shí)際應(yīng)用中,跳頻電臺(tái)多采用組網(wǎng)的方式進(jìn)行通信和數(shù)據(jù)信息傳輸,提高電臺(tái)的通信容量,同時(shí)提高整個(gè)系統(tǒng)的抗干擾能力。在跳頻網(wǎng)絡(luò)中多個(gè)電臺(tái)同時(shí)發(fā)送數(shù)據(jù),偵察接收機(jī)的截獲信號(hào)即為多個(gè)跳頻信號(hào)的時(shí)域混疊信號(hào)。時(shí)頻分析方法能夠?qū)殳B信號(hào)進(jìn)行處理,通過(guò)時(shí)頻分析得到每跳信號(hào)的參數(shù)估計(jì)值。然而僅利用每跳的參數(shù)值,無(wú)法得到信號(hào)完整的跳頻圖案,也就無(wú)法對(duì)網(wǎng)絡(luò)內(nèi)每個(gè)跳頻電臺(tái)進(jìn)行盲接收和信息提取。因此,為完成對(duì)跳頻信號(hào)的偵察,需要將相互混疊的多個(gè)跳頻信號(hào)分離,分別進(jìn)行單獨(dú)處理。此外,利用跳頻信號(hào)的分選結(jié)果可以獲取敵方電臺(tái)的數(shù)量和分布的大致范圍,利用此信息可以進(jìn)一步得到敵方的通信裝備水平、作戰(zhàn)意圖、布防陣容以及指揮隸屬關(guān)系等重要戰(zhàn)略情報(bào)。
根據(jù)分選時(shí)是否需要信號(hào)參數(shù)信息,分選方法分為非盲的分選方法和盲分選方法兩類(lèi)。非盲的分選方法以參數(shù)估計(jì)結(jié)果為基礎(chǔ),利用跳頻電臺(tái)在功率、到達(dá)方向(Direction of Arrival,DOA)、到達(dá)時(shí)間(跳時(shí))、跳頻周期以及載波頻率等特征的不同,采用聚類(lèi)分析算法對(duì)信號(hào)進(jìn)行分選;盲分選方法是在盲源分離理論的基礎(chǔ)上發(fā)展而來(lái),利用信號(hào)之間的統(tǒng)計(jì)獨(dú)立特性,在信號(hào)參數(shù)未知的條件下實(shí)現(xiàn)信號(hào)的有效分離。
考慮到跳頻信號(hào)具有非平穩(wěn)特性,目前部分研究采用時(shí)頻分析相關(guān)算法估計(jì)跳頻信號(hào)參數(shù)。例如,文獻(xiàn)[3-5]在短時(shí)傅里葉變換的基礎(chǔ)上,設(shè)定合適的閾值辨別信號(hào)并提取跳頻信號(hào)的時(shí)頻脊線估計(jì)信號(hào)參數(shù),采用 Gabor 變換、小波變換、譜圖、魏格納威爾分布及其改進(jìn)算法處理跳頻信號(hào),提取時(shí)頻脊線估計(jì)跳頻參數(shù)。各類(lèi)時(shí)頻分析方法優(yōu)缺點(diǎn)各有不同,但提取時(shí)頻脊線的方法依舊僅適用于單跳頻信號(hào)的參數(shù)估計(jì)。文獻(xiàn)[6]提出一種基于跳頻中心時(shí)刻的跳頻信號(hào)參數(shù)估計(jì)方法,解決多網(wǎng)臺(tái)混合跳頻信號(hào)參數(shù)估計(jì)的問(wèn)題。首先通過(guò)設(shè)定門(mén)限和聚類(lèi)算法提取每跳信號(hào)的中心時(shí)刻,再利用脈沖重復(fù)間隔變換得到跳頻周期。文獻(xiàn)[7]將時(shí)頻分析得到的二維矩陣轉(zhuǎn)化為灰度圖像,結(jié)合圖像處理領(lǐng)域中的經(jīng)典算法分析跳頻信號(hào)并估計(jì)相關(guān)參數(shù),該方法給跳頻信號(hào)參數(shù)估計(jì)領(lǐng)域帶來(lái)新的啟示。根據(jù)以上思路,文獻(xiàn)[8]利用時(shí)頻圖的紋理特征將有用信號(hào)和底噪分離,并通過(guò)聚類(lèi)去除各類(lèi)干擾,通過(guò)圖像處理中的開(kāi)閉運(yùn)算處理跳頻信號(hào)時(shí)頻圖像,將像素點(diǎn)位置與信號(hào)參數(shù)對(duì)應(yīng)得到估計(jì)結(jié)果。
在非盲的跳頻信號(hào)分選方法研究方面,文獻(xiàn)[9]提出一種基于優(yōu)化K-Means算法的跳頻信號(hào)分選方法,將信號(hào)的載頻、跳周期、跳時(shí)、功率以及DOA的估計(jì)值作為特征矢量參數(shù),通過(guò)搜索參數(shù)統(tǒng)計(jì)直方圖的峰值預(yù)估計(jì)聚類(lèi)數(shù),然后根據(jù)峰值的中心點(diǎn)位置對(duì)信號(hào)進(jìn)行聚類(lèi)分選。與傳統(tǒng)的聚類(lèi)分選方法相比,該方法有效減少了迭代次數(shù),并且能夠避免聚類(lèi)過(guò)程陷入局部最小。然而,優(yōu)化K-Means分選方法沒(méi)有考慮聚類(lèi)數(shù)估計(jì)誤差對(duì)聚類(lèi)結(jié)果的影響,在參數(shù)估計(jì)方差較大時(shí)會(huì)出現(xiàn)聚類(lèi)錯(cuò)誤。文獻(xiàn)[10]分別對(duì)優(yōu)化K-Means分選方法進(jìn)行改進(jìn),通過(guò)聚類(lèi)合并消除虛假的類(lèi),降低了聚類(lèi)數(shù)估計(jì)值對(duì)聚類(lèi)結(jié)果的影響,提高了對(duì)跳頻信號(hào)的正確分選概率。在盲分選方法研究方面,文獻(xiàn)[11]在陣列天線接收的基礎(chǔ)上,分別采用獨(dú)立分量分析(Independent Component Analysis,ICA)算法和聯(lián)合特征矩陣對(duì)角化(Joint Approximate Diagonalization of Eigenmatrixex,JADE)算法估計(jì)跳頻信號(hào)的混合矩陣,通過(guò)矩陣求逆完成了對(duì)跳頻信號(hào)的盲分選。由于盲分選方法假設(shè)各跳頻電臺(tái)信號(hào)的相互獨(dú)立,而沒(méi)有利用信號(hào)自身的特征參數(shù)信息,因此其分選性能弱于基于聚類(lèi)的分選方法。此外,參數(shù)估計(jì)是跳頻信號(hào)偵察中不可缺少的環(huán)節(jié),因此基于聚類(lèi)分析的跳頻分選方法在工程應(yīng)用方面具有更好的潛能。
新型跳頻信號(hào)組網(wǎng)通信的機(jī)理和傳統(tǒng)的跳頻信號(hào)完全相同,只要能夠獲得足夠精度的參數(shù)估計(jì)值,采用相同分選方法即可實(shí)現(xiàn)對(duì)新型跳頻信號(hào)的分選,但目前專門(mén)針對(duì)直接序列擴(kuò)頻(Direct Sequence Spread Spectrum,即DS)通信/跳頻(Frequency Hopping,即FH)信號(hào)和差分跳頻(Differential Frequency Hopping,即DFH)信號(hào)分選方法的研究較少。文獻(xiàn)[12]提出采用JADE算法對(duì)DFH信號(hào)進(jìn)行盲分離。
針對(duì)在參數(shù)估計(jì)誤差較大條件下,跳頻分選存在的問(wèn)題,本文同時(shí)從優(yōu)化聚類(lèi)中心和確定最優(yōu)聚類(lèi)數(shù)的角度出發(fā),將直方圖統(tǒng)計(jì)和有效性指標(biāo)相結(jié)合對(duì)現(xiàn)有的KHM聚類(lèi)算法進(jìn)行改進(jìn),提高聚類(lèi)分選正確的概率,從而實(shí)現(xiàn)對(duì)跳頻信號(hào)的有效分選。
跳頻信號(hào)聚類(lèi)分選方法的基本原理結(jié)構(gòu)如圖1所示。在該結(jié)構(gòu)中不僅包含了信號(hào)的分選內(nèi)容,還包括了信號(hào)檢測(cè)和參數(shù)估計(jì)的內(nèi)容,即在跳頻通信的偵察研究中信號(hào)檢測(cè)、參數(shù)估計(jì)和信號(hào)分選三者缺一不可,它們相互協(xié)作構(gòu)成一個(gè)完整的跳頻信號(hào)偵察流程。
圖1 跳頻信號(hào)聚類(lèi)分選方法的基體原理結(jié)構(gòu)框圖
(1)
其中:xi為數(shù)據(jù)樣本的特征矢量;N為待分類(lèi)樣本的個(gè)數(shù),在本文中表示截獲信號(hào)中所包含的跳數(shù);每個(gè)樣本矢量xi的維數(shù)為L(zhǎng)=3。系統(tǒng)無(wú)論采用同步還是異步的方式進(jìn)行跳頻通信組網(wǎng),每個(gè)跳頻電臺(tái)的HWD中的元素均存在較大差異,將式(1)輸入到聚類(lèi)算法中處理,可以將每個(gè)xi所代表的跳區(qū)分開(kāi),實(shí)現(xiàn)多個(gè)跳頻信號(hào)的有效分選。
聚類(lèi)分析是一種無(wú)監(jiān)督的學(xué)習(xí)過(guò)程,利用樣本自身的特征屬性來(lái)識(shí)別數(shù)據(jù)集合內(nèi)部的自然分組,將待分類(lèi)的數(shù)據(jù)樣本劃分到不同類(lèi)內(nèi),使得每個(gè)類(lèi)的數(shù)據(jù)相似性最大。
聚類(lèi)分析的過(guò)程由數(shù)據(jù)特征提取、相似度計(jì)算和聚類(lèi)分組3部分組成。其中,數(shù)據(jù)特征提取是指選擇最能代表數(shù)據(jù)樣本特征的參數(shù)作為聚類(lèi)算法的輸入,本文中采用的數(shù)據(jù)特征為式(1)中的HWD;相似度計(jì)算是指利用度量函數(shù)來(lái)計(jì)算不同數(shù)據(jù)樣本之間的相似性,為聚類(lèi)分組提供依據(jù);根據(jù)相似度計(jì)算結(jié)果,聚類(lèi)分組采用一定的聚類(lèi)準(zhǔn)則將樣本劃分到不同類(lèi)內(nèi)。由以上的聚類(lèi)過(guò)程可以看出,數(shù)據(jù)的相似性度量函數(shù)和聚類(lèi)準(zhǔn)則函數(shù)是算法的兩個(gè)關(guān)鍵函數(shù)。
不同樣本之間的相似程度是對(duì)數(shù)據(jù)進(jìn)行聚類(lèi)分組的基礎(chǔ),最常用的相似性度量為距離測(cè)度,其值為任意兩個(gè)樣本的特征矢量xi和xj之差,包括明氏(Minkowski)距離、歐式(Euclidean)距離、絕對(duì)值距離和馬氏(Mahalanobis)距離等。
Minkowski距離的定義為
(2)
Mahalanobis距離的定義為
d(xi,xj)=[(xi-xj)TΣ-1(xi-xj)]1/2,(i,j=1,…,N)
(3)
其中:Σ為特征矢量的協(xié)方差矩陣
(4)
1.1.2 聚類(lèi)準(zhǔn)則函數(shù)
聚類(lèi)準(zhǔn)則函數(shù)又被稱為代價(jià)函數(shù),用于指導(dǎo)聚類(lèi)的迭代過(guò)程,并判斷當(dāng)前的聚類(lèi)結(jié)果是否滿足分選的要求,以此決定是否結(jié)束迭代。準(zhǔn)則函數(shù)的選擇直接決定了聚類(lèi)結(jié)果的質(zhì)量,采用合適的準(zhǔn)則函數(shù)可以得到更優(yōu)的聚類(lèi)效果,目前常用的準(zhǔn)則函數(shù)為誤差平方和(Sum of Squared Error, SSE)函數(shù)。假設(shè)待分?jǐn)?shù)據(jù){xi|i=1,…,N}被劃分到K個(gè)類(lèi)內(nèi)ωk={xi,i=1,…,nk},則SSE函數(shù)的定義如式(5)所示
(5)
(6)
目前已經(jīng)出現(xiàn)了多種聚類(lèi)算法,主要包括:層次算法、劃分算法、基于密度的算法以及基于模型的算法等[13-14]。其中,劃分算法的基本思想是通過(guò)最優(yōu)化代價(jià)函數(shù)將N個(gè)樣本劃分到k個(gè)類(lèi)內(nèi),在聚類(lèi)過(guò)程中能夠動(dòng)態(tài)調(diào)整聚類(lèi)中心和類(lèi)內(nèi)樣本,具有較好的聚類(lèi)效果。K-Means算法為典型的劃分算法,具有理論聚類(lèi)效果好、執(zhí)行效率高的優(yōu)點(diǎn),已經(jīng)被廣泛應(yīng)用于各種與數(shù)據(jù)分類(lèi)相關(guān)的領(lǐng)域,并且也是目前跳頻信號(hào)聚類(lèi)分選中采用最多的聚類(lèi)算法。但是K-Means算法對(duì)中心點(diǎn)的初始值敏感,且容易收斂到局部最優(yōu)值,在跳頻參數(shù)估計(jì)誤差較大的情況下,采用K-Means及其改進(jìn)算法得到的分選結(jié)果不理想。在K-Means算法的基礎(chǔ)上,文獻(xiàn)[15]提出了一種KHM(K-Harmonic Means)聚類(lèi)算法,采用調(diào)和平均數(shù)(Harmonic Aveage,HA)取代樣本點(diǎn)到中心點(diǎn)之間的距離來(lái)構(gòu)造目標(biāo)函數(shù)JW,降低了聚類(lèi)結(jié)果對(duì)聚類(lèi)中心初始值的敏感度,提高了算法的聚類(lèi)性能。
(7)
其中:K為聚類(lèi)個(gè)數(shù);N為樣本個(gè)數(shù);μk為第k類(lèi)的中心點(diǎn);xi∈RL則表示第i個(gè)樣本的特征矢量,由L個(gè)特征參數(shù)估計(jì)值組成。
新的代價(jià)函數(shù)對(duì)聚類(lèi)中心初始值魯棒,與K-Means算法相比,KHM聚類(lèi)算法可以得到更高的正確分選概率。為進(jìn)一步改善算法,可采用直方圖統(tǒng)計(jì)方法初始化聚類(lèi)中心并預(yù)估計(jì)聚類(lèi)個(gè)數(shù)。基于直方圖統(tǒng)計(jì)KHM算法詳細(xì)步驟如下:
步驟(1) 聚類(lèi)初始化
步驟(2)更新聚類(lèi)中心
(8)
(9)
為避免式(8)出現(xiàn)分母為零的情況,在di,m=0時(shí)為di,m賦予極小值ε=10-6。
步驟(3) 終止迭代和聚類(lèi)分組
將前后兩次迭代得到的類(lèi)中心進(jìn)行比較,當(dāng)最大值的均方誤差滿足一定精度時(shí),停止迭代并對(duì)所有樣本點(diǎn)進(jìn)行聚類(lèi)分組
(10)
其中:ki表示xi所屬的類(lèi)標(biāo)識(shí)。否則,令s=s+1,返回步驟(2)繼續(xù)執(zhí)行。
直方圖濾波處理的過(guò)程為:首先,計(jì)算濾波峰值門(mén)限η和鄰域半徑eps;然后,將峰值小于門(mén)限η的類(lèi)舍棄,將峰值間距小于eps的類(lèi)合并,以大的峰值作為合并后類(lèi)的初始中心點(diǎn)。其中,門(mén)限η和鄰域半徑eps計(jì)算公式分別如式(11)所示
(11)
定義1:平均類(lèi)內(nèi)距。第k個(gè)聚類(lèi)的第i個(gè)樣本的類(lèi)內(nèi)距為xi到ωk內(nèi)其他樣本的平均距離,即
(12)
定義2:最小類(lèi)間距。第k個(gè)聚類(lèi)的第i個(gè)樣本的最小類(lèi)間距為xi到其他類(lèi)樣本平均距離的最小值,即
(13)
定義3:Sil-CVI。Sil-CVI定義為最小類(lèi)間距和類(lèi)內(nèi)距的差值與兩者之間最大值的比值,即
(14)
根據(jù)以上定義,平均類(lèi)內(nèi)距dI(xi,ωk)越小,表示類(lèi)內(nèi)樣本的相似性越好;最小類(lèi)間距dB-min(xi,ωk)越大,則表示不同類(lèi)之間的分離程度越好;兩者之間的差值dB-min(xi,ωk)-dI(xi,ωk)對(duì)類(lèi)內(nèi)樣本的相似度和不同類(lèi)間樣本的分離度進(jìn)行線性平衡,該值越大表示聚類(lèi)效果越好。為避免有效性指標(biāo)受量綱的影響,采用了dI(xi,ωk)和dB-min(xi,ωk)的最大值歸一化,使Sil-CVI的取值在[-1,1]內(nèi)。由此,最優(yōu)的聚類(lèi)數(shù)可以通過(guò)式(15)得到。
(15)
本文給出一種改進(jìn)的KHM聚類(lèi)算法,其詳細(xì)步驟如表1所示。為便于描述,將該聚類(lèi)算法稱為Sil-KHM算法,對(duì)應(yīng)的跳頻分選方法稱為Sil-KHM方法。
表1 Sil-KHM聚類(lèi)算法的步驟
圖2 基于分級(jí)策略和Sil-HKM算法的跳頻信號(hào)分選方法流程
通過(guò)設(shè)置兩組實(shí)驗(yàn)對(duì)基于Sil-KHM的跳頻分選方法進(jìn)行仿真,并將該方法與現(xiàn)有的K-Means方法和KHM方法相對(duì)比。實(shí)驗(yàn)1為基于TH和IH的混合跳頻信號(hào)的跳頻網(wǎng)絡(luò)分選,實(shí)驗(yàn)2為基于T0、θ和PA的網(wǎng)內(nèi)電臺(tái)分選,實(shí)驗(yàn)參數(shù)見(jiàn)表2所示。每組實(shí)驗(yàn)的仿真次數(shù)NR=100,采用平均正確分選概率來(lái)衡量分選的性能。
(16)
表2 跳頻信號(hào)網(wǎng)絡(luò)和電臺(tái)分選實(shí)驗(yàn)的仿真參數(shù)
本文采用跳周期和跳頻方式二維參數(shù)進(jìn)行跳頻網(wǎng)絡(luò)分選,在一定程度上可以提高分選性能??紤]到循環(huán)譜檢測(cè)在跳頻識(shí)別方面的良好性能(信噪比大于-10 dB時(shí),跳頻識(shí)別的正確概率可以達(dá)到100%,可假設(shè)IH的方差為一個(gè)極小值),直接采用直方圖統(tǒng)計(jì)值來(lái)初始化聚類(lèi)中心和確定聚類(lèi)數(shù)。圖3給出了跳周期估計(jì)誤差為1的情況下,跳頻網(wǎng)絡(luò)分選中的特征參數(shù)的直方圖統(tǒng)計(jì)結(jié)果。由圖3可以看出,僅采用直方圖統(tǒng)計(jì)結(jié)果無(wú)法有效地確定真實(shí)的聚類(lèi)個(gè)數(shù)。在引入跳頻方式的信息以后,跳頻網(wǎng)絡(luò)的統(tǒng)計(jì)直方圖非常清晰,很容易就能確定正確的聚類(lèi)個(gè)數(shù)。
圖3 跳頻網(wǎng)絡(luò)分選的特征參數(shù)的直方圖統(tǒng)計(jì)結(jié)果
表3給出不同的跳周期估計(jì)誤差條件下,分別采用K-Means方法、KHM方法和Sil-KHM方法得到的網(wǎng)絡(luò)個(gè)數(shù)和平均正確分選概率。在跳周期的估計(jì)誤差大于0.1 ms時(shí),K-Means方法和KHM方法得到錯(cuò)誤的聚類(lèi)數(shù)所對(duì)應(yīng)的平均正確分選概率遠(yuǎn)低于Sil-KHM方法,這是因?yàn)榍皟煞N方法利用圖3a的統(tǒng)計(jì)結(jié)果來(lái)估計(jì)聚類(lèi)數(shù)和初始化聚類(lèi)中心,而后者采用的是圖3b中的統(tǒng)計(jì)結(jié)果。在估計(jì)誤差小于0.01 ms的條件下,3種方法均能得到正確的聚類(lèi)數(shù)。由于KHM方法對(duì)聚類(lèi)中心初始值的敏感度較低,因此可以獲得比K-Means方法更高的正確分選概率。而由于Sil-KHM方法采用了識(shí)別精度高的IH作為特征矢量,可以獲得100%的正確分選概率。
表3 跳頻網(wǎng)絡(luò)分選的結(jié)果
在對(duì)網(wǎng)絡(luò)內(nèi)的跳頻電臺(tái)進(jìn)行聚類(lèi)分選時(shí),跳頻方式不再作為特征矢量的參數(shù),為提高聚類(lèi)的質(zhì)量,本文的方法需要采用有效指標(biāo)來(lái)確定最優(yōu)的聚類(lèi)個(gè)數(shù)。表4給出了3種分選方法在不同估計(jì)方差下的聚類(lèi)數(shù)估計(jì)結(jié)果,圖4則給出了正確分選概率隨參數(shù)估計(jì)方差變化的曲線。
由表4可以看出,由于Sil-KHM方法在初始化聚類(lèi)中心的同時(shí)能夠利用有效性指標(biāo)對(duì)聚類(lèi)個(gè)數(shù)進(jìn)行優(yōu)化,其得到的正確聚類(lèi)的統(tǒng)計(jì)值大于其他兩種方法。從圖4中可以看出,由于Sil-KHM方法能夠獲得更為精確的聚類(lèi)個(gè)數(shù)估計(jì)結(jié)果,因此其正確分選概率也優(yōu)于其他兩種跳頻分選方法,分選概率均高于K-Means分選方法和KHM分選方法。
表4 3種分選方法聚類(lèi)數(shù)估計(jì)結(jié)果
本文將直方圖統(tǒng)計(jì)方法與聚類(lèi)有效性指標(biāo)相結(jié)合,改進(jìn)傳統(tǒng)的KHM聚類(lèi)算法,提出了一種新的Sil-KHM聚類(lèi)算法。該算法利用聚類(lèi)有效性指標(biāo)對(duì)聚類(lèi)個(gè)數(shù)進(jìn)行優(yōu)化,并且能夠在分選的過(guò)程中確定最優(yōu)的聚類(lèi)個(gè)數(shù),以增加較小的計(jì)算量為代價(jià),有效提高了聚類(lèi)分選的正確概率。仿真實(shí)驗(yàn)表明,在參數(shù)估計(jì)誤差較大的條件下,與現(xiàn)有的跳頻信號(hào)分選方法相比,基于Sil-KHM的跳頻信號(hào)分選方法可以獲得更高的正確分選概率,有效改善了跳頻信號(hào)分選的性能。
圖4 正確分選概率隨參數(shù)估計(jì)方差變化曲線