馬 潮,陸志灃,余海鳴,洪澤華,楊 杰,喬 宇
(1.上海交通大學(xué) 電子信息與電氣工程學(xué)院,上海,200240;2.上海機(jī)電工程研究所,上海201109)
在現(xiàn)代戰(zhàn)場(chǎng)上,紅外導(dǎo)彈發(fā)揮著重要的作用,它的優(yōu)點(diǎn)包括高精度制導(dǎo)、強(qiáng)抗干擾能力、高隱蔽性、高效費(fèi)比、結(jié)構(gòu)緊湊、機(jī)動(dòng)靈活等,已經(jīng)逐漸成為現(xiàn)代戰(zhàn)爭(zhēng)中首選的精確制導(dǎo)武器之一,在多次局部戰(zhàn)爭(zhēng)中均發(fā)揮了強(qiáng)大的作用[1]。近年來(lái),由于大量使用紅外制導(dǎo)武器,對(duì)紅外干擾技術(shù)的研究迅速發(fā)展。為了削弱紅外制導(dǎo)導(dǎo)彈在空中對(duì)己方目標(biāo)的威脅,降低紅外制導(dǎo)武器的作戰(zhàn)效能,各國(guó)都在積極進(jìn)行各種人工干擾方法的研究[1-4]。經(jīng)過(guò)幾十年的研究,紅外干擾技術(shù)也在飛速發(fā)展,這在一定程度上削弱了紅外制導(dǎo)導(dǎo)彈的性能。在這樣的情況下,如果紅外導(dǎo)彈的抗干擾能力弱,將很難在未來(lái)的戰(zhàn)爭(zhēng)中發(fā)揮作用,因此,導(dǎo)彈的抗干擾性能試驗(yàn)和評(píng)估被廣泛關(guān)注[5-8]?,F(xiàn)階段,紅外制導(dǎo)導(dǎo)彈的作戰(zhàn)條件不斷惡化,在如此惡劣的作戰(zhàn)環(huán)境中,要求導(dǎo)彈依然能發(fā)揮效能,在其研制時(shí)就要明確提出導(dǎo)引頭抗人工干擾的性能指標(biāo)。當(dāng)導(dǎo)彈的抗干擾能力滿足一定條件時(shí),就可以在目標(biāo)飛行器釋放多種干擾的情況下,仍能大概率擊中目標(biāo),該型號(hào)導(dǎo)彈在滿足此條件時(shí),才具備批量生產(chǎn)的資格。因此,在批量生產(chǎn)紅外制導(dǎo)導(dǎo)彈之前,需要根據(jù)研發(fā)階段的各項(xiàng)性能指標(biāo),采取適當(dāng)?shù)姆椒ㄔu(píng)估其整體的抗干擾性能。
建立合適的紅外導(dǎo)彈抗干擾性能的評(píng)估方法和評(píng)估指標(biāo)體系,能夠給紅外導(dǎo)彈武器系統(tǒng)全壽命周期的各階段重大決策提供技術(shù)上的支持,對(duì)增強(qiáng)導(dǎo)彈武器系統(tǒng)規(guī)劃的研究、作戰(zhàn)運(yùn)用的科學(xué)性、配套裝備的完善、進(jìn)一步提升導(dǎo)彈武器作戰(zhàn)理論研究,及全面開(kāi)展各項(xiàng)基礎(chǔ)方面的研究工作都具有重要意義。
目前,對(duì)于評(píng)價(jià)紅外制導(dǎo)導(dǎo)引系統(tǒng)的抗干擾能力,現(xiàn)實(shí)中有著一對(duì)矛盾問(wèn)題。一方面,由于外場(chǎng)靶試需要耗費(fèi)大量的人力、物力,每枚導(dǎo)彈昂貴的價(jià)格也使大量地進(jìn)行實(shí)彈測(cè)驗(yàn)變得十分困難,因此在實(shí)際中無(wú)法得到足夠的數(shù)據(jù)樣本來(lái)實(shí)現(xiàn)統(tǒng)計(jì)評(píng)估;另一方面,在紅外導(dǎo)彈研發(fā)階段,各個(gè)過(guò)程中都有大量的實(shí)驗(yàn)數(shù)據(jù)無(wú)法被充分利用。因此,怎樣驗(yàn)證紅外導(dǎo)引系統(tǒng)的抗干擾性能,如何建立一整套科學(xué)的、實(shí)用的抗干擾性能的評(píng)估指標(biāo)體系及有效易行的評(píng)價(jià)方法,已然成為目前紅外導(dǎo)引體系的評(píng)估工作中一項(xiàng)重要的課題。
本文提出一種基于隨機(jī)森林算法的紅外成像導(dǎo)引頭抗干擾性能評(píng)估方法,能夠定量地評(píng)估各項(xiàng)抗干擾指標(biāo)和導(dǎo)引頭抗干擾綜合性能值之間的定量關(guān)系,為紅外成像導(dǎo)引頭抗干擾性能評(píng)估提供新的思路。
隨機(jī)森林方法(Random Forest,簡(jiǎn)稱RF)是一種基于決策樹(shù)的機(jī)器學(xué)習(xí)算法,主要通過(guò)模擬和迭代來(lái)進(jìn)行數(shù)據(jù)擬合和分類(lèi)。上世紀(jì)八十年代Breiman等人提出了分類(lèi)和回歸樹(shù)(Classification and Regression Tree,簡(jiǎn)稱CART)的算法,該算法通過(guò)對(duì)數(shù)據(jù)進(jìn)行反復(fù)二分從而實(shí)現(xiàn)分類(lèi)或回歸,使得樹(shù)算法的計(jì)算量大大降低[9]。2001年,Breiman和Cutler借鑒了貝爾實(shí)驗(yàn)室的 Ho提出的隨機(jī)決策森林(Random Decision Forests)算法,將分類(lèi)樹(shù)組合成隨機(jī)森林,也就是在數(shù)據(jù)和變量的使用上進(jìn)行了隨機(jī)化,生成多個(gè)分類(lèi)樹(shù),再匯總分類(lèi)樹(shù)的結(jié)果,形成了隨機(jī)森林算法[9]。隨機(jī)森林算法能夠在不顯著提高運(yùn)算量的前提下,提高預(yù)測(cè)精度,并且該算法對(duì)多元共線性不敏感,其學(xué)習(xí)結(jié)果對(duì)缺失數(shù)據(jù)和非平衡的數(shù)據(jù)比較穩(wěn)健。由于該算法的高效性和準(zhǔn)確性,隨機(jī)森林算法在各行各業(yè)得到越來(lái)越多的應(yīng)用。
RF方法結(jié)合了Bagging算法的想法以及完全生長(zhǎng)的分類(lèi)回歸決策樹(shù),使用Bagging算法構(gòu)建數(shù)個(gè)分類(lèi)模型或回歸模型,最終的預(yù)測(cè)值可使用投票法或平均值,這樣做的好處是能夠一定程度上降低過(guò)擬合風(fēng)險(xiǎn)。其表達(dá)式為
其中,對(duì)訓(xùn)練樣本采用M輪的boostrap采樣,每一輪分別建立決策樹(shù),然后對(duì)每一輪決策樹(shù)的結(jié)果進(jìn)行平均。因?yàn)橥ㄟ^(guò)boostrap使用的采樣樣本子集大部分是不相同的,所以每一輪訓(xùn)練得到的模型之間的相關(guān)性會(huì)有所減弱。除此之外,為了進(jìn)一步減小模型之間的關(guān)聯(lián)程度,每次訓(xùn)練之前,可以依據(jù)訓(xùn)練數(shù)據(jù)的特征,對(duì)其進(jìn)行隨機(jī)采樣,或者在決策樹(shù)各分支上實(shí)施隨機(jī)的特征選擇。
決策樹(shù)模型是樹(shù)形結(jié)構(gòu)之一,該方法是在特征的基礎(chǔ)上,對(duì)樣本進(jìn)行分類(lèi)或者回歸預(yù)測(cè),即基于某個(gè)特征,把樣本歸類(lèi)至數(shù)個(gè)子區(qū)域(子樹(shù)),再對(duì)每個(gè)子區(qū)域(子樹(shù))進(jìn)行遞歸劃分,直至滿足迭代條件時(shí)停止子區(qū)域劃分并將其視作葉子節(jié)點(diǎn)。建立一個(gè)決策樹(shù)模型大體有三個(gè)階段:特征選擇、決策樹(shù)的生成、決策樹(shù)的修剪。以下將分別進(jìn)行介紹。
2.1.1 特征選擇
不同的特征選擇順序會(huì)導(dǎo)致建立不同的決策樹(shù),使用較優(yōu)的特征可以使不同子樹(shù)的意義更加明確,從而建立更優(yōu)的決策樹(shù)。因此,有必要對(duì)特征的好壞進(jìn)行度量。常用度量特征對(duì)于子集好壞的指標(biāo)包括誤差率、信息增益、信息增益比和基尼指數(shù)等。
1)誤差率
假設(shè)特征A將訓(xùn)練數(shù)據(jù)D歸類(lèi)在若干子節(jié)點(diǎn)之后,選擇子節(jié)點(diǎn)中出現(xiàn)次數(shù)最多的類(lèi)標(biāo)簽作為此節(jié)點(diǎn)的返回值,記為yc。則誤差率定義為
2)信息增益
“信息熵”是度量樣本集合純度最常用的一種指標(biāo),假定當(dāng)前樣本集合D中第k類(lèi)樣本所占的比例為pk,則D的信息熵定義為
假設(shè)離散特征a有V個(gè)可能的取值,若使用a來(lái)劃分樣本集D,那么,V個(gè)分支節(jié)點(diǎn)將會(huì)出現(xiàn),而這里面的第v個(gè)分支節(jié)點(diǎn)蘊(yùn)涵了D中所有在特征a上取值為av的樣本,記為Dv。根據(jù)上式,計(jì)算出Dv的信息熵,此外,由于不同的分支節(jié)點(diǎn)所包含的樣本數(shù)不同,給不同的分支節(jié)點(diǎn)賦予權(quán)重值|Dv|/|D|,使得樣本數(shù)多的分支節(jié)點(diǎn)可以產(chǎn)生較大影響,這樣,可計(jì)算出使用特征a將樣本集D劃分時(shí)所得到的“信息增益”為
通常,信息增益越大,代表依據(jù)特征a進(jìn)行劃分時(shí)實(shí)現(xiàn)的提高越大。所以,信息增益能夠用來(lái)決定決策樹(shù)的劃分特征。著名的ID3決策樹(shù)學(xué)習(xí)算法就是用信息增益作為準(zhǔn)則。
3)增益率
在實(shí)際應(yīng)用中發(fā)現(xiàn),使用信息增益準(zhǔn)則時(shí),會(huì)傾向于選擇那些可選數(shù)目較多的特征,為了降低這種趨勢(shì)所帶來(lái)的劣勢(shì),可以采用增益率來(lái)決定較優(yōu)劃分特征。增益率的定義為
其中,
值得注意的是,增益率準(zhǔn)則可能對(duì)于可取值數(shù)目較小的屬性有所偏好,因此不是直接選擇增益率最大的候選劃分屬性,而是使用一個(gè)啟發(fā)式的算法,即在候選的劃分特征里,首先選擇那些信息增益值高于平均水平的特征,然后在這些特征中挑選增益率最高的特征。
4)基尼指數(shù)
當(dāng)分類(lèi)回歸決策樹(shù)采取基尼指數(shù)作為指標(biāo)來(lái)挑選劃分屬性時(shí),數(shù)據(jù)集D的純度可用基尼值定義為
直觀來(lái)說(shuō),基尼指數(shù)反應(yīng)了從所有樣本中隨機(jī)采樣得到兩個(gè)樣本時(shí),其類(lèi)別標(biāo)記相異的概率。
所以,特征a的基尼指數(shù)可定義如下:
2.2.2 決策樹(shù)的生成
決策樹(shù)生成的算法如下:
1)從根節(jié)點(diǎn)起,依次計(jì)算全樣本集D上全部可能取到的屬性A的信息增益值。
2)將信息增益最大的屬性選為分類(lèi)依據(jù),對(duì)于與該屬性值相異的其他取值,依次構(gòu)建其子集作為子節(jié)點(diǎn)。
3)采用遞歸方法,依次對(duì)各個(gè)子節(jié)點(diǎn)使用以上算法重復(fù)上述過(guò)程,直至無(wú)可選屬性或信息增益小于設(shè)定的閾值即停止。
隨機(jī)森林作為Bagging算法的變體,該算法是在以決策樹(shù)為基學(xué)習(xí)器的基礎(chǔ)上,在決策樹(shù)的訓(xùn)練過(guò)程中進(jìn)一步引入隨機(jī)屬性選擇[10]。進(jìn)一步講,傳統(tǒng)的決策樹(shù)算法,在劃分最優(yōu)特征的過(guò)程中,通常采用的方法是在當(dāng)前節(jié)點(diǎn)的所有特征中找出一個(gè)最佳特征。與此不同的是,在隨機(jī)森林中,對(duì)基決策樹(shù)的每一個(gè)節(jié)點(diǎn),首先,從此節(jié)點(diǎn)的特征集合中隨機(jī)挑選某個(gè)包含k個(gè)特征的子集,此后,從該子集中找出一個(gè)最佳特征進(jìn)行劃分。這里的參數(shù)k控制了隨機(jī)性的引入程度[11]。可以看出,隨機(jī)森林與Bagging中基學(xué)習(xí)器的“多樣性”是通過(guò)樣本擾動(dòng)(通過(guò)對(duì)初始訓(xùn)練集采樣)而不同,通過(guò)對(duì)Bagging算法的改進(jìn),隨機(jī)森林中基學(xué)習(xí)器的多樣性不僅來(lái)自于樣本擾動(dòng),還來(lái)自于特征擾動(dòng)。上述優(yōu)化導(dǎo)致了最終集成的泛化性能可以利用個(gè)體學(xué)習(xí)器之間的差異度的增加而得到進(jìn)一步提升。隨機(jī)森林算法實(shí)現(xiàn)簡(jiǎn)單,計(jì)算開(kāi)銷(xiāo)比較小,在現(xiàn)實(shí)的應(yīng)用問(wèn)題中展現(xiàn)了強(qiáng)大的性能。
我們通過(guò)實(shí)驗(yàn)驗(yàn)證基于隨機(jī)森林的紅外成像導(dǎo)引頭抗干擾性能評(píng)估方法的有效性。本章將首先介紹相關(guān)數(shù)據(jù)以及實(shí)驗(yàn)結(jié)果,隨后進(jìn)行相應(yīng)的實(shí)驗(yàn),并分析了實(shí)驗(yàn)結(jié)果。
通過(guò)仿真實(shí)驗(yàn)得到了兩組不同背景的仿真序列,一組為單一顏色背景,一組為海雜波背景。通過(guò)兩種不同的紅外導(dǎo)引頭抗干擾算法,測(cè)量了如表1所示的12組指標(biāo)。
表1 兩組仿真數(shù)據(jù)在兩種不同抗干擾算法下的性能指標(biāo)Tab.1 Performance of two sets of data under two different anti-jamming algorithms
(續(xù)表1)
首先對(duì)于上述數(shù)據(jù)運(yùn)用層次分析法進(jìn)行初始的評(píng)估。由于層次分析法要求指標(biāo)結(jié)果屬于[0,1],因此,我們首先對(duì)上述數(shù)據(jù)進(jìn)行了歸一化處理,得到的結(jié)果如表2所示。
表2 兩組仿真數(shù)據(jù)在兩種不同抗干擾算法下的性能指標(biāo)(歸一化后)Tab.2 Performance of two sets of data under two different anti-jamming algorithms(after normalization)
對(duì)歸一化的數(shù)據(jù)進(jìn)行層次分析法的評(píng)估,得到紅外成像導(dǎo)引頭的抗干擾性能指數(shù)如表3所示:
表3 層次分析法的評(píng)估結(jié)果Tab.3 Results of analytic hierarchy process
利用本文提出的隨機(jī)森林算法,使用MATLAB 2017a軟件進(jìn)行了代碼實(shí)現(xiàn)。我們將層次分析法所得的結(jié)果作為接下來(lái)進(jìn)行機(jī)器學(xué)習(xí)的標(biāo)簽值,對(duì)原始數(shù)據(jù)增加信噪比32 dB高斯白噪聲的方法,對(duì)原始數(shù)據(jù)進(jìn)行擴(kuò)充,標(biāo)簽值仍然保持原始值。訓(xùn)練后,通過(guò)得到的隨機(jī)森林模型對(duì)上述4組數(shù)據(jù)進(jìn)行測(cè)試,得到的紅外成像導(dǎo)引頭的抗干擾性能指數(shù)如表4所示。
表4 隨機(jī)森林算法的評(píng)估結(jié)果Tab.4 Results of random forest
對(duì)比上述結(jié)果和層次分析法的結(jié)果,我們可以發(fā)現(xiàn):1)4組數(shù)據(jù)的平均誤差為4.20%,小于5%,誤差范圍較小,說(shuō)明隨機(jī)森林算法能夠很好的吻合層次分析法的評(píng)估結(jié)果;2)進(jìn)行相關(guān)系數(shù)分析,計(jì)算得到相關(guān)系數(shù)為r=0.999 989,進(jìn)一步說(shuō)明了本文提出的基于隨機(jī)森林的抗干擾算法的有效性。
考慮到研究紅外成像導(dǎo)引頭抗干擾性能評(píng)估方法研究的重要性,本文提出了一種基于隨機(jī)森林的抗干擾性能評(píng)估方法,為紅外成像導(dǎo)引頭抗干擾性能評(píng)估提供了新的思路。通過(guò)不同的抗干擾算法對(duì)不同仿真數(shù)據(jù)的評(píng)估,結(jié)果表明,本方法能夠有效準(zhǔn)確地評(píng)估紅外成像導(dǎo)引頭的抗干擾性能。