吳連慧,秦長(zhǎng)海,宋新超
(中國(guó)船舶重工集團(tuán)公司第七二三研究所,江蘇 揚(yáng)州 225001)
基于加權(quán)SVC和K-Mediods聯(lián)合聚類的雷達(dá)信號(hào)分選方法
吳連慧,秦長(zhǎng)海,宋新超
(中國(guó)船舶重工集團(tuán)公司第七二三研究所,江蘇 揚(yáng)州 225001)
為了提高復(fù)雜體制雷達(dá)信號(hào)分選的正確率,提出了加權(quán)SVC和K-Mediods聯(lián)合聚類算法,針對(duì)雷達(dá)參數(shù)特點(diǎn),對(duì)SVC算法的核函數(shù)內(nèi)積和K-Mediods算法的歐氏距離進(jìn)行加權(quán)計(jì)算,從而避免聚類結(jié)果被弱相關(guān)的特征所支配。與SVC與K-Means聯(lián)合聚類算法相比,SVC與K-Mediods聯(lián)合聚類算法有效降低了"離群點(diǎn)"的影響。結(jié)果表明,該算法能夠提高復(fù)雜體制雷達(dá)信號(hào)分選的正確率,存在部分"離群點(diǎn)"時(shí)分選正確率較高。
雷達(dá)信號(hào)分選;支持向量聚類;K-中心點(diǎn);權(quán)值
雷達(dá)信號(hào)分選是從多部隨機(jī)交錯(cuò)的脈沖信號(hào)流中分離出各單部雷達(dá)輻射源脈沖的過程,它是電子情報(bào)偵察(ELINT)系統(tǒng)和電子支援措施(ESM)系統(tǒng)的重要組成部分[1]。常規(guī)的雷達(dá)信號(hào)分選算法有基于設(shè)定參數(shù)量化容差的多參數(shù)聚類算法[2]和基于脈沖重復(fù)間隔(PRI)的去交錯(cuò)算法[3]等,這些算法對(duì)常規(guī)雷達(dá)信號(hào)簡(jiǎn)單有效。但隨著雷達(dá)信號(hào)環(huán)境日益復(fù)雜,各參數(shù)域相互交疊,常規(guī)分選算法的分選效果不佳,容易產(chǎn)生增批和漏批現(xiàn)象。
支持向量聚類(SVC)是一種以支持向量機(jī)(SVM)為工具的無監(jiān)督的聚類算法[4]。與常規(guī)分選算法相比,SVC存在以下優(yōu)勢(shì):(1) 不受容差值的限制,能夠產(chǎn)生任意形狀的簇邊界;(2) 能夠進(jìn)行噪聲數(shù)據(jù)點(diǎn)分析,分離相互交疊的簇。
文獻(xiàn)[5]~[7]為SVC算法在雷達(dá)信號(hào)分選領(lǐng)域的研究,一定程度上利用了支持向量聚類分選的優(yōu)勢(shì),通過與其他算法相結(jié)合,克服了支持向量聚類對(duì)大樣本的計(jì)算復(fù)雜性。但也存在一些問題:
(1) 沒有充分考慮雷達(dá)信號(hào)自身各參數(shù)特點(diǎn),將各參數(shù)同等權(quán)重對(duì)待;
(2) 沒有考慮真實(shí)接收到的雷達(dá)信號(hào)需要具有一定的容錯(cuò)能力。
本文結(jié)合雷達(dá)信號(hào)本身各參數(shù)的特點(diǎn),對(duì)SVC算法和K-Mediods算法的數(shù)據(jù)樣本的各參數(shù)進(jìn)行加權(quán)處理;將SVC和K-Mediods算法聯(lián)合聚類,在提高聚類速度的同時(shí)降低“離群點(diǎn)”的影響。
設(shè)脈沖數(shù)據(jù)集{vi},i=1,2,…,N,N為總脈沖樣本個(gè)數(shù)。雷達(dá)脈沖描述向量vi是由脈沖描述字(PDW)中載頻(RF)、到達(dá)角(AOA)、脈寬(PW)構(gòu)成的三維空間,即vi的數(shù)據(jù)空間V?R3。
1.1 SVC算法
SVC是Ben-Hur等人在2001年提出的一種基于支持向量機(jī)的聚類算法[8],基本思想是:將數(shù)據(jù)空間的數(shù)據(jù)樣本通過非線性變換映射到高維特征空間中,使得高維特征空間中能找到一個(gè)包圍所有樣本點(diǎn)的最小半徑超球面;該超球面映射回原數(shù)據(jù)空間時(shí)能將樣本分割成任意形狀的幾個(gè)簇。
基于支持向量聚類的雷達(dá)信號(hào)分選過程如下:
通過非線性變化φ(Gaussian核函數(shù))把脈沖流從V空間映射到高維特征空間,使得同一雷達(dá)的脈沖聚類更加緊湊。在特征空間中,存在最小半徑為R的閉凸超球體,對(duì)應(yīng)的SVC模型如下:
(1)
式中:φ(vi)為數(shù)據(jù)空間樣本點(diǎn)vi在特征空間的映像;‖ · ‖為Euclidean范數(shù);a為球心;R為球半徑;ξi為松弛量,它使得聚類集合變緊,從而更能有效分離。
式(1)中約束條件的Lagrange算式為:
(2)
式中:βi≥0,μi≥0,為L(zhǎng)agrange系數(shù);常數(shù)C為懲罰因子。
對(duì)L關(guān)于R,a,βi分別求偏導(dǎo),并令各自的偏導(dǎo)值為0,同時(shí)結(jié)合Karush-Kuhn-Tucker(KKT)條件,可推導(dǎo)出式(2)的Wolfe對(duì)偶形式為:
(3)
引入Gaussian核函數(shù):
(4)
式中:q為Gaussian核的寬度參數(shù);exp指以自然常數(shù)e為底的指數(shù)函數(shù)。
將式(3)代入式(4)可得:
(5)
因此,每個(gè)數(shù)據(jù)點(diǎn)v映射到特征空間的像到球心的距離為:
(6)
式中:當(dāng){v|R(v)=R}時(shí),v稱為支持向量(SV)。
由SV組成的面稱為等高面,能確定屬于同一類雷達(dá)輻射源參數(shù)的聚類邊界。此后需要建立關(guān)聯(lián)矩陣,并通過深度優(yōu)先搜索(DFS)算法對(duì)關(guān)聯(lián)矩陣進(jìn)行聚類分配。
1.2 改進(jìn)的SVC算法
為了排除各參數(shù)變量之間的不同度量對(duì)分類結(jié)果的影響,常規(guī)SVC算法應(yīng)用于雷達(dá)信號(hào)分選時(shí),需要先對(duì)各參數(shù)進(jìn)行歸一化處理,使各參數(shù)值分布在相同的區(qū)間[0,1]內(nèi),以相同的數(shù)量級(jí)參與聚類,3個(gè)參數(shù)對(duì)聚類同等作用。由于雷達(dá)各參數(shù)的可靠性和穩(wěn)定性不同,因此SVC計(jì)算時(shí),考慮對(duì)各參數(shù)加權(quán)。
以脈寬參數(shù)為例,在窄脈寬時(shí),脈寬的測(cè)量值容易受到多徑效應(yīng)的影響,被認(rèn)為是一個(gè)不太可靠的分選參數(shù),需要降低權(quán)系數(shù);但在寬脈寬時(shí),由于寬脈寬區(qū)分度較好,脈寬變成一個(gè)重要的分選信息,可以增加權(quán)系數(shù)。
SVC算法加權(quán)主要體現(xiàn)在核函數(shù)的計(jì)算。針對(duì)雷達(dá)信號(hào)各參數(shù)的特點(diǎn),SVC算法核函數(shù)的加權(quán)計(jì)算公式如下:
(7)
式中:vi,vj為脈沖描述向量;W為雷達(dá)信號(hào)參數(shù)的加權(quán)矩陣。
設(shè)雷達(dá)信號(hào)參數(shù)誤差向量Δ=vi-vj,具體化到三參數(shù)描述時(shí),誤差向量ΔT=[ΔRF,ΔAOA,ΔPW]。
設(shè)加權(quán)矩陣為:
(8)
式中:w1,w2,w3分別為體現(xiàn)fRF、θAOA、τPW參數(shù)重要程度的加權(quán)系數(shù)。
式(7)可轉(zhuǎn)變?yōu)椋?/p>
(9)
進(jìn)一步簡(jiǎn)化可得:
(10)
加權(quán)SVC算法通過各參數(shù)權(quán)值來體現(xiàn)其在聚類過程中不同程度的作用,從而避免核函數(shù)被弱相關(guān)的特征所支配。針對(duì)雷達(dá)信號(hào)分選,加權(quán)SVC比常規(guī)的SVC具有更好的魯棒性和分類能力。
SVC算法具有很好的聚類效果,但隨著樣本數(shù)目的增加,計(jì)算復(fù)雜度也增加,因此一般考慮與復(fù)雜度相對(duì)較低的算法聯(lián)合使用。
將SVC與K-均值(K-Means)算法聯(lián)合使用是一種常見的聯(lián)合聚類算法[5,9](簡(jiǎn)稱KSVC算法),能夠有效提高聚類速度。但由于雷達(dá)前端測(cè)量等原因,雷達(dá)數(shù)據(jù)的測(cè)量值存在錯(cuò)點(diǎn)(又稱為“離群點(diǎn)”)。K-Means算法采用相同簇中所有對(duì)象的平均值作為聚類中心,易受到“離群點(diǎn)”的影響,從而導(dǎo)致簇“畸變”。K-中心點(diǎn)(K-Mediods)算法能夠克服這種缺點(diǎn)。
2.1 K-Mediods聚類算法
K-Mediods算法是一種基于中心點(diǎn)劃分的聚類算法[10]。設(shè)雷達(dá)脈沖描述向量的數(shù)據(jù)樣本集合V={v1,v2,…,vi,…,vN},其中i=1,2,…,N,N為總脈沖樣本個(gè)數(shù)。K-Mediods聚類的目的是:找到V的一個(gè)劃分Vk={C1,C2,…,Ck},將脈沖流劃分成k個(gè)簇,使目標(biāo)函數(shù)f(Vk)值收斂最小,f(Vk)為:
(11)
式中:mi為第i個(gè)聚類的聚類中心位置;d(vj,mi)為第i個(gè)聚類中樣本值vj與mi的歐氏距離。
K-Mediods算法與K-Means算法相比,最大的區(qū)別在于聚類中心位置的選擇。K-Mediods算法第i個(gè)聚類中心計(jì)算公式如式(11),即若第i個(gè)簇中所有點(diǎn)到某點(diǎn)(mi)的距離之和最小,則該點(diǎn)(mi)為聚類中心,因此不易受“離群點(diǎn)”的影響,則:
(12)
2.2 改進(jìn)的K-Mediods聚類算法
與SVC算法相同,K-Mediods算法也可以通過參數(shù)加權(quán)來優(yōu)化各參數(shù)對(duì)聚類的影響。主要體現(xiàn)在歐氏距離的計(jì)算。加權(quán)歐氏距離為:
(13)
式中:v為脈沖參數(shù)的樣本值;m為聚類中心;W為雷達(dá)信號(hào)參數(shù)的加權(quán)矩陣。
設(shè)雷達(dá)信號(hào)參數(shù)誤差向量Δ=v-m,具體化到三參數(shù)描述時(shí),誤差向量ΔT=[ΔRF,ΔAOA,ΔPW];w1,w2,w3為各參數(shù)的加權(quán)系數(shù)。加權(quán)歐氏距離越小表示脈沖信號(hào)參數(shù)之間的相似程度越高。式(13)可轉(zhuǎn)變?yōu)椋?/p>
(14)
SVC算法適用于小樣本情況,能夠較為準(zhǔn)確地分類出聚類數(shù)目和聚類中心;但當(dāng)樣本數(shù)量增加時(shí),處理速度會(huì)急劇下降。K-Mediods聚類算法處理大量數(shù)據(jù)的時(shí)間復(fù)雜度比SVC算法低,且能夠克服“離群點(diǎn)”的影響;但需要事先確定聚類的數(shù)目和初始聚類中心。因此將SVC算法和K-Mediods算法聯(lián)合使用, 可以克服各自的缺點(diǎn),取長(zhǎng)補(bǔ)短。
加權(quán)SVC和K-Mediods聯(lián)合聚類框圖如圖1所示,先通過加權(quán)SVC對(duì)小樣本的脈沖數(shù)據(jù)聚類;再對(duì)剩余的數(shù)據(jù)樣本進(jìn)行加權(quán)K-Mediods聚類分析。其中,加權(quán)K-Mediods聚類的基本步驟如下:
(1) 根據(jù)加權(quán)SVC的聚類結(jié)果計(jì)算出聚類數(shù)目k和初始聚類中心值(m1,m2,…,mi,…,mk),每個(gè)中心值對(duì)應(yīng)一個(gè)簇分類。
(2) 對(duì)每個(gè)樣本計(jì)算與各聚類中心值距離,將樣本賦給離它最近的中心點(diǎn)所代表的簇。
(3) 重新計(jì)算各個(gè)簇的中心值,即找出各簇中到簇內(nèi)所有樣本點(diǎn)距離(加權(quán)歐氏距離)之和最小的點(diǎn)。
(4) 若目標(biāo)函數(shù)f(Vk)值收斂最小,則算法停止;否則,返回(2)。
為了驗(yàn)證聚類算法的有效性,本文進(jìn)行了仿真實(shí)驗(yàn)。雷達(dá)參數(shù)設(shè)置如表1所示。
表1 雷達(dá)參數(shù)信息表
從表1可以看出,4部雷達(dá)在不同屬性維度上都相互混疊,特別是脈寬嚴(yán)重混疊。采用常規(guī)SVC不能將各信號(hào)完全分開,因此采用加權(quán)SVC處理,通過加權(quán)值降低PW對(duì)聚類的影響。圖2為加權(quán)SVC對(duì)表1的200個(gè)數(shù)據(jù)樣本聚類得到的二維屬性參數(shù)分布圖,其中,由支持向量可以清楚看出樣本數(shù)據(jù)聚類的邊界輪廓。
從圖3可以看出,加權(quán)SVC將混合數(shù)據(jù)準(zhǔn)確地分成了4類,且每類都有正確的分選脈沖數(shù)。
根據(jù)表1的輻射源參數(shù)產(chǎn)生雷達(dá)脈沖數(shù)據(jù)流,將前5 000個(gè)脈沖先進(jìn)行參數(shù)歸一化處理;再利用常規(guī)SVC和加權(quán)SVC算法分別對(duì)前200個(gè)脈沖進(jìn)行聚類分選,得到聚類數(shù)目k和各初始聚類中心值;最后利用常規(guī)K-Means、常規(guī)K-Mediods和加權(quán)K-Mediods算法分別對(duì)剩余脈沖進(jìn)行聚類分選,比較當(dāng)輸入脈沖“離群點(diǎn)”數(shù)目增加時(shí)各自分選1234567正確率的變化情況。
從表2可以看出,當(dāng)輸入“離群點(diǎn)”增加時(shí),K-Mediods算法受離群點(diǎn)的影響比K-Means算法?。患訖?quán)SVC+加權(quán)K-Mediods算法有更好的分選效果。
表2 雷達(dá)參數(shù)信息表
本文結(jié)合雷達(dá)信號(hào)本身各參數(shù)特點(diǎn),對(duì)SVC算法中的核函數(shù)內(nèi)積和K-Mediods算法中的歐氏距離進(jìn)行加權(quán)計(jì)算,通過權(quán)值來體現(xiàn)各參數(shù)在聚類過程中不同程度的作用,從而避免被弱相關(guān)的特征所支配。仿真結(jié)果表明,根據(jù)雷達(dá)信號(hào)參數(shù)特點(diǎn)進(jìn)行參數(shù)加權(quán)能夠進(jìn)一步提高分選正確率;將SVC算法和K-Mediods算法相結(jié)合,與SVC算法和K-Means算法相結(jié)合相比,有效降低了“離群點(diǎn)”的影響。本文的方法還有待完善,比如如何提高聯(lián)合算法的運(yùn)算速度還有待進(jìn)一步研究。
[1]WILEYRG.ELINT:TheInterceptionandAnalysisofRadarSignals[M].SecondEdition,Boston,MA:ArtechHouse,2006.
[2] 易波.雷達(dá)信號(hào)分選算法研究[D].長(zhǎng)沙:國(guó)防科學(xué)技術(shù)大學(xué),2012.
[3] 李睿,李相平,李尚生,等.反艦導(dǎo)彈被動(dòng)雷達(dá)導(dǎo)引頭信號(hào)分選算法研究[J].艦船電子工程,2014,34(1):41- 43.
[4]MORSIERDF,TUIAD,GASSV,etal.Unsupervisedchangedetectionviahierarchicalsupportvectorclustering[C]//IAPRWorkshoponPatternRecognitioninRemoteSensing,2012:1-4.
[5] 趙貴喜,穆成新,劉永波,等.改進(jìn)SVC算法在雷達(dá)信號(hào)分選中的應(yīng)用[J].艦船電子對(duì)抗,2012,35(3):6- 9.
[6] 黎蓉,劉以安.基于支持向量聚類改進(jìn)的雷達(dá)信號(hào)分選方法[J].電子信息對(duì)抗技術(shù),2014,29(5):40-43.
[7] 王世強(qiáng),張登福,畢篤彥,等.基于快速支持向量聚類和相似熵的多參雷達(dá)信號(hào)分選方法[J].電子與信息學(xué)報(bào),2011,33(11):2735-2741.
[8]BENHA,HORND,SIEGELMANNHT,etal.Supportvectorclustering[J].JournalofMachineLearningResearch,2001(2):125-137.
[9]GUOQ,ZHANGX,LIZ.SVC&k-meansandtype-entropybasedde-interleaving/recognitionsystemofradarpulses[C]//IEEEInternationalConferenceonInformationAcquisition,2006:742-747.
[10]朱曄,馮萬興,郭鈞天,等.一種改進(jìn)的K-中心點(diǎn)聚類算法及在雷暴聚類中的應(yīng)用[J].武漢大學(xué)學(xué)報(bào)(理學(xué)版),2015(5):497-502.
Radar Signal Sorting Method Based on Weighting SVC and K-Mediods Combined Clustering
WU Lian-hui,QIN Chang-hai,SONG Xin-chao
(The 723 Institute of CSIC,Yangzhou 225001,China)
To improve the accuracy of complex system radar signal sorting,this paper presents the algorithm of weighting SVC and K-Mediods combined clustering,performs the weighting calculation to kernel function inner product of SVC algorithm and Euclidean distance of K-Mediods algorithm aiming at the characteristics of radar parameters,accordingly avoids the clustering result is dominated by the characteristic of weak correlation,compares SVC and K-Mediods combined clustering algorithm with SVC and K-Means combined clustering algorithm,and the former decreases the influence of outlier effectively.Results indicate that this algorithm can improve the accuracy of complex system radar signal sorting,the sorting accuracy is relatively higher when part outliers exist.
radar signal sorting;support vector clustering;K-center;weight value
2016-08-03
TN971.1
A
CN32-1413(2017)01-0013-05
10.16426/j.cnki.jcdzdk.2017.01.003