周建宇,位寅生,許榮慶
(哈爾濱工業(yè)大學(xué) 電子與信息工程學(xué)院,黑龍江 哈爾濱 150001)
高頻地波超視距雷達(dá)是我國重要的海洋狀態(tài)監(jiān)測雷達(dá)與海洋預(yù)警雷達(dá),其工作所在的高頻波段(3~30 MHz)具有探測距離遠(yuǎn)、反隱身、可全天候全時(shí)段工作的優(yōu)勢[1]。鑒于高頻波段日益復(fù)雜的電磁環(huán)境,雷達(dá)的回波信號往往會(huì)被多種雜波和干擾所影響,這些雜波與干擾的存在極大地降低了目標(biāo)的被檢測概率,限制了高頻地波雷達(dá)的探測性能。特別是電離層雜波,它是雷達(dá)發(fā)射信號到達(dá)高空中的電離層時(shí),受電離層的復(fù)雜調(diào)制與反射后被雷達(dá)接收機(jī)接收所形成[2-3],其具有特性復(fù)雜多變且全天時(shí)、全天候存在的特點(diǎn),是制約高頻地波雷達(dá)探測性能的最主要因素[4]。在面對復(fù)雜多變的電離層雜波時(shí),目前尚不存在一種有效的雜波抑制算法,可以適用于處理全部種類的電離層雜波。針對不同種類的電離層雜波使用不同的雜波抑制算法,是當(dāng)前一種有效的電離層雜波抑制方案[5],而如何將電離層雜波進(jìn)行合理的分類,使得每種類型的電離層雜波均可匹配到有效的雜波抑制算法,則成為了電離層雜波處理過程中的重點(diǎn)研究內(nèi)容之一。
在高頻地波雷達(dá)的電離層雜波分類研究中,加拿大的CHAN[6]通過對電離層雜波的傳播路徑的分析,結(jié)合實(shí)測數(shù)據(jù)對電離層雜波進(jìn)行了分類;但由于電離層存在時(shí)變與非均勻的特性,相同回波路徑的雜波同樣存在不同的雜波特性,其分類結(jié)果難以和雜波抑制算法相匹配。田文龍[7]在其研究中提出以電離層雜波在距離多普勒(Range-Doppler,RD) 譜中所呈現(xiàn)的形態(tài)進(jìn)行分類,僅利用雜波的功率特性進(jìn)行識別,導(dǎo)致其分類結(jié)果中其他物理特性不統(tǒng)一,難以獲取同質(zhì)的雜波樣本。LI等[8]通過構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)完成了對高頻地波雷達(dá)回波數(shù)據(jù)的分類,研究中使用遺傳算法從多維特征庫中選取出適用于雜波分類的回波特征,同時(shí)利用人工標(biāo)注的方式獲取部分有監(jiān)督的樣本進(jìn)行網(wǎng)絡(luò)訓(xùn)練,完成了對雷達(dá)回波信號中目標(biāo)、海雜波、弱電離層雜波與強(qiáng)電離層雜波的分類識別。由于其在電離層雜波的分類過程中,僅使用了功率特征進(jìn)行強(qiáng)弱電離層雜波分類,導(dǎo)致分類結(jié)果物理意義不明確,無法對雜波抑制算法起到輔助作用。此外,由于該方法依賴人工標(biāo)注監(jiān)督樣本,因此存在監(jiān)督樣本難以獲取、樣本標(biāo)注誤差、樣本數(shù)不足等問題[9],進(jìn)而使得算法容易產(chǎn)生過擬合、模型泛化能力差、分類精度下降。位寅生等[5]在其研究中提出利用有限的監(jiān)督樣本采用k均值聚類的方法對電離層雜波進(jìn)行半監(jiān)督聚類,其方法可以有效減少對監(jiān)督樣本數(shù)量的依賴,但該方法是在雜波的特征空間中進(jìn)行的,缺乏對雜波空間鄰域信息的考慮,其聚類結(jié)果在距離多普勒譜中會(huì)呈現(xiàn)出“離散化”的形態(tài),同一距離門中具有多種電離層雜波類型且同一類型雜波樣本分散在不同多普勒分辨單元中,這將使后續(xù)的電離層雜波抑制方法難以選取,增加電離層雜波的抑制難度。
通過對電離層雜波的成因與特征的分析,筆者提出了一種改進(jìn)的模糊C均值聚類電離層雜波分類方法。在傳統(tǒng)模糊C均值聚類方法的基礎(chǔ)上,利用專家知識構(gòu)建典型的電離層雜波類型作為初始聚類中心,結(jié)合電離層雜波的鄰域空間信息進(jìn)行算法改進(jìn),從而提升電離層雜波分類準(zhǔn)確率并降低聚類后電離層雜波在距離多普勒譜中的離散化。經(jīng)過仿真與實(shí)測數(shù)據(jù)分析,該方法在不降低聚類性能的情況下,具有更符合實(shí)際物理意義的聚類結(jié)果,并具有更高的分類精度。
電離層雜波是由雷達(dá)所發(fā)射的高頻信號到達(dá)高空中的電離層時(shí),受電離層中不規(guī)則等離子體的復(fù)雜調(diào)制與反射后被雷達(dá)接收機(jī)接收所形成[10-13]的。這種復(fù)雜而又隨機(jī)的調(diào)制會(huì)引起回波信號的波前相位擾動(dòng)與脈間相位擾動(dòng),使得回波信號在空間譜與多普勒譜上產(chǎn)生展寬[14]。電離層的復(fù)雜多變使得電離層雜波種類多樣,特性不同,通過提取電離層雜波的功率特征[15-16]、圖像小波尺度特征[17]、方向性特征[18]、空域同質(zhì)性特征[19]和距離域平穩(wěn)性特征[20]構(gòu)建電離層雜波的特征空間,對電離層雜波進(jìn)行分析。
通過對實(shí)測數(shù)據(jù)中電離層雜波的分析,結(jié)合雜波特征空間特性,按照樣本密度最大化原作,筆者提出了構(gòu)建5種典型的電離層雜波樣本作為監(jiān)督樣本集,其雜波特性如表1所示。
表1 典型電離層雜波監(jiān)督樣本特性
表1中,能量聚集型強(qiáng)方向性雜波往往出現(xiàn)在偶發(fā)E層與F層中,它是由電離層中粒子濃度較大且運(yùn)動(dòng)較為劇烈的不規(guī)則體對高頻雷達(dá)信號的反射所形成的,其在距離多普勒譜中表現(xiàn)為聚集的形態(tài)且功率較強(qiáng),樣本方向性集中且具有同質(zhì)的空域分布,在距離域上相關(guān)性較強(qiáng);點(diǎn)狀電離層雜波一般是由擴(kuò)展E層或F層反射所形成的,其在距離多普勒譜中呈現(xiàn)出集中分布的點(diǎn)狀并具有較強(qiáng)的功率,往往占據(jù)多個(gè)距離單元與幾乎全部的多普勒單元,樣本方向性分散且空域分布不統(tǒng)一,在距離上相關(guān)性較弱;空域同分布雜波在距離多普勒譜中表現(xiàn)為分布在較高多普勒頻率處的分散的片狀雜波,往往占據(jù)多個(gè)距離單元與多普勒單元,樣本方向性雖然分散,但在空域的分布上是統(tǒng)一的,在距離上的相關(guān)性較弱,一般是由電子濃度變化較快的E層或F層反射所形成的;距離域相關(guān)雜波在距離多普勒譜中表現(xiàn)為分布在零多普勒頻率附近的團(tuán)狀雜波,往往占據(jù)多個(gè)距離單元與多普勒單元,樣本方向性分散且空域分布不統(tǒng)一,其在距離域上的相關(guān)性較強(qiáng),一般是由電子濃度變化較慢的E層或F層反射所形成的;類目標(biāo)雜波是一種與目標(biāo)特性相似的雜波,這類雜波在距離多普勒譜中功率分布較為分散,由于雜波的方向性較為集中且功率較強(qiáng),因此在空域?qū)ο惴ㄌ幚淼倪^程中會(huì)消耗大量的算法自由度,造成雜波抑制算法性能下降。圖1給出了典型雜波的示意圖。
(a) 功率集中型強(qiáng)方向性雜波 (b) 點(diǎn)狀電離層雜波 (c) 空域同分布雜波
(1)
其中,
(2)
μij是第j個(gè)樣本對于第i類的隸屬度函數(shù),vi是第i類的聚類中心,k是類別數(shù)目,N為樣本總數(shù),b為控制聚類結(jié)果模糊程度的常數(shù)。當(dāng)b=1時(shí),算法將成為確定性聚類劃分的C均值算法。利用拉格朗日乘數(shù)法可以計(jì)算出隸屬度函數(shù)與聚類中心的迭代公式:
(3)
(4)
由于文中所提出的電離層雜波特征屬性的定義域?yàn)橐环N抽象概念,無法通過計(jì)算兩個(gè)特征向量之間的歐氏距離的方式衡量兩個(gè)樣本的特征差異,因此使用值差分度量[21]計(jì)算樣本間距離dij。定義屬性u上的兩個(gè)離散值a與b之間的距離為
(5)
其中,mu,a為屬性u上取值為a的樣本數(shù),mu,a,i為第i個(gè)樣本簇中在屬性u上取值為a的樣本數(shù)。兩個(gè)電離層雜波樣本xi與xj之間的距離dij可以表示為
(6)
在基于模糊C均值聚類的電離層雜波分類方法中,由于聚類是在雜波的特征空間中進(jìn)行的,缺乏對雜波所處空間位置的考慮,其聚類結(jié)果在距離多普勒譜中會(huì)呈現(xiàn)出“離散化”的形態(tài),即同一距離門中具有多種電離層雜波類型且同一類型雜波樣本分散在不同多普勒分辨單元中,這不利于后續(xù)的雜波抑制方法匹配與訓(xùn)練樣本選取,進(jìn)而降低雜波抑制方法的性能。通過對大量實(shí)測數(shù)據(jù)的統(tǒng)計(jì)分析,電離層雜波往往是區(qū)域性呈現(xiàn)在距離多普勒譜中,相鄰的距離與多普勒分辨單元的電離層雜波的雜波特性一般是相近的,可以劃分為同一雜波類型,因此在雜波特征空間的聚類過程中額外引入雜波的鄰域空間約束,可以有效地降低聚類在距離多普勒譜中“離散化”的問題。將鄰域信息引入到式(1)中的最小化準(zhǔn)則函數(shù)中:
(7)
依照拉格朗日乘數(shù)法可以計(jì)算出改進(jìn)的隸屬度函數(shù)與聚類中心的迭代公式:
(8)
(9)
圖2 鄰域選取示意圖
通過迭代計(jì)算,當(dāng)算法收斂到一定閾值時(shí)終止迭代。依照隸屬度矩陣和聚類中心,確定電離層雜波所屬分類。算法的處理流程可以總結(jié)如下:
步驟1 初始化模糊因子b、迭代終止條件ε和最大迭代次數(shù)T,設(shè)定聚類數(shù)目k。
步驟2 利用典型電離層雜波監(jiān)督樣本集設(shè)定初始的電離層雜波聚類中心V0,并初始化樣本標(biāo)簽值。
步驟3 根據(jù)式(8)與式(9)計(jì)算改進(jìn)的隸屬度函數(shù)μij與聚類中心vi。
步驟4 重復(fù)步驟3,直到前后兩次迭代的隸屬度函數(shù)誤差小于迭代終止條件ε,或迭代次數(shù)大于最大迭代次數(shù)T。
步驟5 對得到的最優(yōu)隸屬度矩陣U進(jìn)行去模糊化處理,得到電離層雜波的分類結(jié)果。
考慮到在實(shí)際數(shù)據(jù)處理中,無法獲取到電離層雜波的準(zhǔn)確分類結(jié)果用以判斷電離層雜波分類算法的準(zhǔn)確率,為衡量電離層雜波的分類性能,采用計(jì)算分類內(nèi)部指標(biāo)的形式來評價(jià)電離層雜波分類結(jié)果。
分類適確性指標(biāo)是一種描述樣本聚類性能的參數(shù),又稱為戴維森堡丁指數(shù)(Davies-Bouldin Index,DBI)[22]。對于電離層雜波的簇劃分結(jié)果C,其DBI指數(shù)為
(10)
其中,
(11)
dcen(Ci,Cj)=dist(μi,μj) ,
(12)
dist(?)為不同樣本間的距離,dcen(?)為兩個(gè)不同簇之間聚類中心的距離,davg(?)為簇內(nèi)樣本的平均距離。DBI指數(shù)越小,類內(nèi)樣本聚集性越好,類與類之間的區(qū)分性越高,聚類性能越好。
仿真實(shí)驗(yàn)的參數(shù)如下:電離層雜波樣本個(gè)數(shù)為40 000個(gè),分布在200個(gè)距離分辨單元與200個(gè)多普勒分辨單元所組成的距離多普勒譜中,樣本分為5種類型且不同種類的樣本在距離多普勒中呈現(xiàn)聚集狀態(tài)。分別隨機(jī)替換總樣本數(shù)量5%、7%和10%的樣本特征子空間,以模擬電離層雜波的時(shí)變、非平穩(wěn)、非均勻性,每個(gè)替換樣本的特征子空間均為隨機(jī)生成。算法選取的樣本特性個(gè)數(shù)為5,聚類簇?cái)?shù)k為6個(gè)簇,算法最大迭代次數(shù)為1 000次,鄰域半徑r=2,模糊度常數(shù)b=2,算法選取5種典型電離層雜波樣本與1種不具有任何筆者所提出特征的雜波樣本構(gòu)成初始聚類中心。這里對比了基于模糊C均值聚類的電離層雜波分類方法(Fuzzy C-Means,F(xiàn)CM)與筆者提出的改進(jìn)方法的聚類性能。圖3給出了不同算法處理后各類別電離層雜波在距離-多普勒譜中的分布情況。
對比圖3中的處理結(jié)果,在模糊C均值算法分類中,由于分類是在樣本的特征空間中進(jìn)行的,在分類過程中僅將特征相近的雜波樣本劃分為同一類別,缺乏對雜波空間鄰域信息的考慮,其聚類結(jié)果在距離多普勒譜中會(huì)呈現(xiàn)出“離散化”的形態(tài),同一距離門中具有多種電離層雜波類型且同一類型雜波樣本分散在不同距離多普勒分辨單元中,這將使后續(xù)的電離層雜波抑制方法難以選取,增加電離層雜波的抑制難度。筆者提出的方法中,加入了對電離層雜波空間鄰域信息的約束,可以有效地提升分類后電離層雜波類型在多普勒距離空間上的連續(xù)性,有利于電離層雜波抑制算法的匹配處理與訓(xùn)練樣本的選取。表2給出了兩種電離層雜波分類方法的性能對比。
(a) FCM分類后的RD譜(5%樣本替換) (b) 文中方法分類后的RD譜(5%樣本替換) (c) FCM分類后的RD譜(7%樣本替換)
表2 算法分類性能對比
從表2中可以看出,隨著替換樣本數(shù)量的增加,電離層雜波的非均勻性逐漸增強(qiáng),模糊C均值算法的分類準(zhǔn)確率逐漸下降且下降速度較快,而文中算法的分類準(zhǔn)確率略有下降但始終保持在99%以上。對比兩種算法的DBI系數(shù),在相同替換樣本數(shù)量的情況下,兩種方法的DBI系數(shù)相近。由于引入了電離層雜波的空間鄰域信息,為確保電離層雜波在多普勒距離譜上的連通性,降低了特征空間對分類結(jié)果的權(quán)重,因此文中算法在特征空間上的DBI系數(shù)要略高于模糊C均值算法的,即在特征空間上文中算法的聚類性能要略低于模糊C均值算法。
為進(jìn)一步驗(yàn)證筆者所提出方法的分類性能,這里采用高頻地波雷達(dá)的實(shí)測數(shù)據(jù)進(jìn)行電離層雜波分類,并計(jì)算其聚類有效性。實(shí)驗(yàn)的具體參數(shù)如下:天線陣列為均勻分布的線陣,雷達(dá)載頻為5.9 MHz,波束指向θ=-9°,雜波的樣本個(gè)數(shù)為27 642,聚類簇?cái)?shù)k為6,構(gòu)成雜波特征空間的特征個(gè)數(shù)為5,鄰域半徑r=2,模糊度常數(shù)b=2,算法使用典型電離層雜波數(shù)據(jù)作為初始聚類中心,算法最大迭代次數(shù)為1 000次。圖4(a)中給出了實(shí)測數(shù)據(jù)的距離-多普勒譜,可以看出在50距離門以上區(qū)域,電離層雜波覆蓋了大量的距離-多普勒譜,目標(biāo)很容易被湮沒其中,電離層雜波的存在極大地影響了雷達(dá)的目標(biāo)檢測。
(a) 實(shí)測數(shù)據(jù)RD譜 (b) FCM方法分類結(jié)果 (c) 文中方法
圖4給出了實(shí)測數(shù)據(jù)經(jīng)過分類后不同種類雜波在多普勒距離譜中的分布情況??梢钥闯觯瑑煞N方法都能夠完成對電離層雜波的分類識別。模糊C均值方法的分類結(jié)果在距離多普勒譜中呈現(xiàn)出離散化的形態(tài),在雜波區(qū)域缺乏連通性。在空域同分布雜波區(qū)域中,內(nèi)部存在孤立的被分類為類目標(biāo)雜波樣本,邊緣處存在部分被分類為距離域相關(guān)雜波樣本,分類結(jié)果明顯與實(shí)際情況不相符。由于引入了電離層雜波的鄰域空間信息,筆者提出算法的分類結(jié)果符合相鄰分辨單元的雜波具有相似性這一理論,算法的分類準(zhǔn)確率要高于模糊C均值方法。分別計(jì)算兩種算法聚類性能,模糊C均值方法的DBI系數(shù)為0.832 4,筆者提出的方法DBI系數(shù)為0.843 1,兩者聚類性能相近。在不降低聚類性能的情況下,筆者提出的算法具有更符合實(shí)際物理意義的聚類結(jié)果,并具有更高的分類精度。
通過對電離層雜波的特征分析,指出了基于模糊C均值聚類的電離層雜波分類方法的聚類結(jié)果在距離多普勒譜中會(huì)呈現(xiàn)出離散化的問題,并在其基礎(chǔ)上提出了一種改進(jìn)的模糊C均值聚類電離層雜波分類方法。通過引入電離層雜波的鄰域空間約束,使相鄰分辨單元的電離層雜波具有相同的雜波類別,降低了聚類后電離層雜波在距離多普勒譜中的離散化。經(jīng)過仿真與實(shí)測數(shù)據(jù)分析表明,該方法在不降低聚類性能的情況下,具有更符合實(shí)際物理意義的聚類結(jié)果并具有更高的分類精度。