王贊程,賀筱媛
(國(guó)防大學(xué),北京 100091)
聯(lián)合火力打擊是聯(lián)合作戰(zhàn)的重要環(huán)節(jié),如何科學(xué)、精準(zhǔn)、高效地優(yōu)化聯(lián)合火力打擊方案,是聯(lián)合作戰(zhàn)籌劃中的重難點(diǎn)問(wèn)題之一[1]。聯(lián)合火力打擊方案優(yōu)化問(wèn)題的核心在于合理組織火力打擊力量、有效進(jìn)行武器—目標(biāo)分配[2],該問(wèn)題在軍事運(yùn)籌領(lǐng)域?qū)儆诨鹆Ψ峙?Weapon-Target Assignment,WTA)問(wèn)題,是典型的NP完全問(wèn)題[3-4]。
隨著信息技術(shù)與人工智能的不斷發(fā)展,智能優(yōu)化算法逐步取代傳統(tǒng)的手工作業(yè)方法,成為解決火力分配問(wèn)題的有效方法。目前,該問(wèn)題常用的智能方法包括:果蠅算法、遺傳算法、蛙跳算法、蟻群算法、布谷鳥(niǎo)算法、模擬退火算法等[5-10],上述算法各具優(yōu)勢(shì),但也都存在著如參數(shù)調(diào)節(jié)復(fù)雜困難,運(yùn)算效率低下,易陷入局部最優(yōu)等問(wèn)題。相比之下,粒子群算法因其運(yùn)算規(guī)模小,收斂速度快等優(yōu)點(diǎn),在火力分配問(wèn)題中廣泛應(yīng)用,效果顯著[11-13]。
由于聯(lián)合火力打擊方案優(yōu)化問(wèn)題涉及目標(biāo)數(shù)量、武器彈藥類(lèi)型繁多,問(wèn)題規(guī)模和復(fù)雜度遠(yuǎn)高于以單一兵種為主的火力分配問(wèn)題[14],而標(biāo)準(zhǔn)粒子群算法也存在著易陷入局部最優(yōu),對(duì)高維復(fù)雜模型尋優(yōu)精度差等問(wèn)題。因此,本文在構(gòu)建聯(lián)合火力分配模型、設(shè)計(jì)方案評(píng)價(jià)指標(biāo)的基礎(chǔ)上,提出了交叉熵-量子粒子群優(yōu)化(CE-QPSO)算法,結(jié)合交叉熵算法良好的全局尋優(yōu)能力和量子粒子群優(yōu)化算法高效運(yùn)行的特點(diǎn),提升對(duì)高維復(fù)雜函數(shù)的優(yōu)化效果與優(yōu)化效率。通過(guò)仿真實(shí)驗(yàn),驗(yàn)證了CE-QPSO算法解決火力打擊方案優(yōu)化問(wèn)題的有效性。
聯(lián)合火力打擊方案優(yōu)化問(wèn)題,即在限定的目標(biāo)毀傷要求、武器種類(lèi)、彈藥量等條件下,綜合考慮目標(biāo)價(jià)值、毀傷效能和彈量消耗等影響因素,重構(gòu)現(xiàn)有聯(lián)合火力打擊方案中武器彈藥與目標(biāo)間的匹配關(guān)系,實(shí)現(xiàn)毀傷效果的優(yōu)化和打擊成本的降低。
在某次聯(lián)合火力打擊行動(dòng)中,有n個(gè)需要打擊的目標(biāo),表示為T(mén)={T1,T2,…,Tn};有m類(lèi)武器,表示為W={W1,W2,…,Wm},其中,第i類(lèi)武器的可用彈藥量為ci。定義二值決策變量xij,xij=1表示選用第i類(lèi)武器打擊第j個(gè)目標(biāo),否則xij=0,則可以將聯(lián)合火力打擊方案形式化描述為決策變量矩陣X=(xij)m×n。
從影響因素、約束條件、優(yōu)化目標(biāo)三方面,建立聯(lián)合火力分配模型。
1)影響因素。聯(lián)合火力打擊方案的優(yōu)化,受到目標(biāo)價(jià)值、毀傷概率、耗彈量等多種因素影響。定義第j個(gè)目標(biāo)的打擊價(jià)值為vj;第i類(lèi)武器打擊第j個(gè)目標(biāo)的毀傷概率和耗彈量分別為pij、qij。
2)約束條件。聯(lián)合火力打擊方案的優(yōu)化,受到目標(biāo)毀傷要求、彈藥量等條件的約束。首先,應(yīng)保證每個(gè)目標(biāo)均被打擊,即
(1)
此外,每類(lèi)武器的耗彈量不能超過(guò)其可用彈藥量,即
(2)
3)優(yōu)化目標(biāo)。從毀傷效果和打擊成本兩方面,考慮聯(lián)合火力打擊方案的優(yōu)化目標(biāo),定義目標(biāo)毀傷率指標(biāo)D和彈藥消耗率指標(biāo)E:
(3)
(4)
為實(shí)現(xiàn)聯(lián)合火力打擊方案的綜合評(píng)價(jià),將上述指標(biāo)通過(guò)線性加權(quán)的方法轉(zhuǎn)化為單目標(biāo)評(píng)價(jià)函數(shù):
S(X)=αD(X)+β(1-E(X))
(5)
其中,權(quán)重參數(shù)α、β大于0,且α+β=1。
綜上,建立聯(lián)合火力分配模型:
(6)
聯(lián)合火力打擊方案智能優(yōu)化方法,可分為數(shù)據(jù)獲取、方案轉(zhuǎn)錄、智能優(yōu)化三個(gè)步驟,其基本流程如圖1所示。
圖1 聯(lián)合火力打擊方案智能優(yōu)化方法流程圖Fig.1 Intelligent optimization method flow chart of joint firepower strike plan
1)數(shù)據(jù)獲取部分。依托戰(zhàn)場(chǎng)實(shí)時(shí)態(tài)勢(shì)數(shù)據(jù),生成目標(biāo)價(jià)值表;通過(guò)大樣本作戰(zhàn)實(shí)驗(yàn),對(duì)各類(lèi)武器彈藥的毀傷效能進(jìn)行預(yù)測(cè)和修正,生成武器-目標(biāo)一一對(duì)應(yīng)的毀傷概率矩陣、耗彈量矩陣。最后通過(guò)清洗、轉(zhuǎn)換操作對(duì)上述數(shù)據(jù)進(jìn)行格式上的統(tǒng)一和規(guī)范。
2)方案轉(zhuǎn)錄部分。基于已經(jīng)構(gòu)建完成的聯(lián)合火力分配模型,對(duì)現(xiàn)有聯(lián)合火力打擊方案進(jìn)行形式化描述和格式化編碼,將自然語(yǔ)言轉(zhuǎn)化為程序語(yǔ)言。
3)智能優(yōu)化部分?;谠O(shè)計(jì)好的方案評(píng)價(jià)指標(biāo)和評(píng)價(jià)函數(shù),對(duì)現(xiàn)有方案進(jìn)行綜合評(píng)估,并以此為優(yōu)化目標(biāo),采用智能優(yōu)化算法迭代運(yùn)算,將優(yōu)化結(jié)果轉(zhuǎn)化為格式化方案輸出。
聯(lián)合火力打擊方案智能優(yōu)化的關(guān)鍵在于采用合適的智能算法,進(jìn)行聯(lián)合火力打擊方案優(yōu)化問(wèn)題的求解。本文提出CE-QPSO算法,結(jié)合交叉熵算法的離散概率估計(jì)和量子粒子群優(yōu)化算法的隨機(jī)更新策略,實(shí)現(xiàn)優(yōu)化效果和優(yōu)化效率的提升。
交叉熵(CE)算法是一種可靠性分析與隨機(jī)優(yōu)化設(shè)計(jì)的統(tǒng)一方法,其本質(zhì)是將優(yōu)化問(wèn)題轉(zhuǎn)化為概率估計(jì)問(wèn)題[16]。
一般情況下,假設(shè)S是有限狀態(tài)集χ上的實(shí)值函數(shù),CE算法將尋找該函數(shù)最大值的優(yōu)化問(wèn)題轉(zhuǎn)化為概率估計(jì)問(wèn)題:
(7)
l(γ)=Pβ(S(X)≥γ)=EβI{S(X)≥γ}
(8)
其中,式(7)表示原始的優(yōu)化問(wèn)題,即在統(tǒng)計(jì)樣本集X中,找到函數(shù)S的最大值γ*,以及能使S取到γ*的狀態(tài)X*。式(8)表示轉(zhuǎn)化后的估計(jì)問(wèn)題,γ為接近γ*的值,在參數(shù)β下,S(X)取最大的概率,即為示性函數(shù)I{S(X)≥γ}對(duì)應(yīng)的期望。
為求解該問(wèn)題,需要對(duì)l(γ)進(jìn)行無(wú)偏估計(jì):
(9)
(10)
(11)
合并式(10)、(11),得到如下最大值優(yōu)化問(wèn)題:
(12)
CE算法構(gòu)造閾值序列{γk,k≥0},用以不斷逼近γ*;同時(shí)構(gòu)造參數(shù)序列{βk,k≥0},用以表征g*(X)中的參數(shù)。在每一次迭代中,根據(jù)概率密度函數(shù),隨機(jī)生成N個(gè)樣本,并依據(jù)目標(biāo)函數(shù)值,選取前θN個(gè)優(yōu)秀樣本,進(jìn)行γk和βk的更新。經(jīng)過(guò)T次迭代求解之后,所求得的γT接近最大值γ*[17]。
量子粒子群優(yōu)化(QPSO)算法基于量子力學(xué),對(duì)經(jīng)典粒子群算法進(jìn)行改進(jìn)[15]。QPSO算法認(rèn)為,粒子遵循量子的不確定性原理,通過(guò)隨機(jī)產(chǎn)生多個(gè)概率,利用蒙特卡洛思想進(jìn)行觀測(cè),得到更新后的粒子位置。QPSO算法引入平均最優(yōu)位置(mbest),并在此其基礎(chǔ)上進(jìn)行粒子位置的更新:
(13)
Pi=Φpbesti+(1-Φ)gbest
(14)
(15)
其中,pbesti表示第i個(gè)粒子的個(gè)體最優(yōu)位置,gbest表示全局最優(yōu)位置,xi表示第i個(gè)粒子的位置,Φ和u為(0,1)上的均勻分布數(shù)值,取正負(fù)的概率各為0.5,只有一個(gè)待調(diào)節(jié)參數(shù)η,一般不大于1。
本文提出的CE-QPSO算法,首先以CE算法構(gòu)建離散概率分布函數(shù),隨機(jī)生成QPSO算法的初始粒子群;而后通過(guò)QPSO算法的量子隨機(jī)游走和迭代優(yōu)化,產(chǎn)生用以更新離散概率分布函數(shù)的優(yōu)秀樣本,并不斷重復(fù)上述過(guò)程,算法整體流程圖如圖2所示。
圖2 CE-QPSO算法流程圖Fig.2 CE-QPSO algorithm flow chart
為了優(yōu)化本文構(gòu)建的聯(lián)合火力分配模型,將模型中的決策變量矩陣X=(xij)m×n轉(zhuǎn)化為離散概率分布矩陣M=(mij)m×n。mij不再是0-1二值變量,而表示選用第i類(lèi)武器打擊第j個(gè)目標(biāo)的概率。顯然,當(dāng)所有mij的值均為0或1時(shí),M還原為X,即可確定最終的聯(lián)合火力打擊方案。由于毀傷效果是選用不同武器的最優(yōu)先考量因素,根據(jù)毀傷概率pij對(duì)M進(jìn)行初始化:
(16)
根據(jù)矩陣M,可得概率分布函數(shù)f(X,M):
(17)
(18)
根據(jù)式(15)、(17)、(18),可得到如下凸優(yōu)化問(wèn)題及其拉格朗日函數(shù):
(19)
(20)
根據(jù)Karush-Kuhn-Tucker(KKT)條件,可推導(dǎo)得到離散概率分布矩陣M的更新公式:
(21)
因此,CE-QPSO算法步驟如下:
1)根據(jù)毀傷概率pij對(duì)離散概率分布矩陣M進(jìn)行初始化;
2)根據(jù)M隨機(jī)生成X1,X2,…,XN共N個(gè)樣本,將其作為QPSO算法的初始粒子;
3)按照QPSO算法的粒子位置更新公式,對(duì)N個(gè)粒子進(jìn)行多輪迭代更新;
4)計(jì)算更新后N個(gè)粒子的評(píng)價(jià)函數(shù)S,根據(jù)S值將粒子進(jìn)行降序排序,取前H=θN個(gè)粒子作為優(yōu)秀樣本;
5)根據(jù)式(21),用H個(gè)優(yōu)秀樣本更新離散概率分布矩陣M;
6)重復(fù)步驟1)—步驟5),直至M中的元素全部變?yōu)?或1,或者達(dá)到了設(shè)定的迭代次數(shù)。此時(shí),可認(rèn)為最優(yōu)秀的樣本即為優(yōu)化后的聯(lián)合火力打擊方案。
實(shí)驗(yàn)以某次聯(lián)合火力打擊行動(dòng)為背景,計(jì)劃使用25類(lèi)武器彈藥對(duì)191個(gè)目標(biāo)進(jìn)行打擊。各目標(biāo)價(jià)值、各類(lèi)武器對(duì)各類(lèi)目標(biāo)的典型耗彈量和毀傷概率已通過(guò)態(tài)勢(shì)數(shù)據(jù)分析和作戰(zhàn)實(shí)驗(yàn)得到。初始方案由參謀人員根據(jù)上述數(shù)據(jù),手工作業(yè)得到,并轉(zhuǎn)錄為計(jì)算機(jī)可識(shí)別的編碼格式。
仿真實(shí)驗(yàn)計(jì)算機(jī)配置為Intel酷睿八核處理器i5-8300H 2.30GHz,16 G內(nèi)存,Window10×6操作系統(tǒng),Pycharm(Python3.7)編程平臺(tái)。
模型參數(shù)主要包括評(píng)價(jià)函數(shù)中的權(quán)重參數(shù)α和β,依據(jù)指揮員對(duì)毀傷效果和打擊成本的權(quán)衡,設(shè)計(jì)α=0.7,β=0.3。
算法參數(shù)通過(guò)以下實(shí)驗(yàn)確定:在一定的取值范圍內(nèi),每次調(diào)整一個(gè)參數(shù)的值,并通過(guò)CE-QPSO算法多輪迭代得到的最優(yōu)評(píng)價(jià)函數(shù)值為參考條件,確定參數(shù)的最佳取值,如此反復(fù),直至所有參數(shù)均設(shè)置完畢。參數(shù)的取值范圍和最終確定值如表1所示。
表1 參數(shù)設(shè)置Tab. 1 Parameter setting
為了驗(yàn)證CE-QPSO算法對(duì)聯(lián)合火力打擊方案的優(yōu)化效果,本文采用標(biāo)準(zhǔn)CE算法、標(biāo)準(zhǔn)QPSO算法作為對(duì)比算法。優(yōu)化前后方案的各項(xiàng)指標(biāo)和綜合評(píng)分?jǐn)?shù)據(jù)如表2所示,其中,綜合評(píng)分值和目標(biāo)毀傷率指標(biāo)數(shù)值越大,彈藥消耗率指標(biāo)數(shù)值越小,表示方案優(yōu)化效果越好。
表2 實(shí)驗(yàn)數(shù)據(jù)Tab.2 Experimental data
為了直觀體現(xiàn)初始方案與各算法優(yōu)化后方案的優(yōu)劣差別,根據(jù)表2數(shù)據(jù),繪制優(yōu)化前后聯(lián)合火力打擊方案的指標(biāo)柱狀圖,如圖3所示。
圖3 方案優(yōu)化前后的指標(biāo)柱狀圖Fig.3 Index histogram before and after scheme optimization
根據(jù)表2與圖3可知,三種智能算法均能實(shí)現(xiàn)對(duì)聯(lián)合火力打擊方案各項(xiàng)指標(biāo)的有效優(yōu)化。其中,CE-QPSO算法優(yōu)化后方案的各項(xiàng)指標(biāo),均明顯優(yōu)于標(biāo)準(zhǔn)QPSO算法的優(yōu)化結(jié)果,與標(biāo)準(zhǔn)CE算法的優(yōu)化結(jié)果基本持平。證明引入CE算法,能夠改善QPSO算法易陷入局部最優(yōu)的缺陷,提升算法對(duì)于高維復(fù)雜模型的全局尋優(yōu)能力和優(yōu)化效果。
圖4和圖5分別給出了三種算法優(yōu)化過(guò)程中,評(píng)價(jià)函數(shù)值的收斂情況,以及算法迭代運(yùn)算的時(shí)間消耗。
圖4 評(píng)價(jià)函數(shù)值迭代曲線Fig.4 Evaluation function value iteration curve
圖5 三種算法的時(shí)間消耗Fig.5 Time consumption of three algorithms
根據(jù)圖4與圖5可知,盡管從優(yōu)化效果上看,CE-QPSO算法與標(biāo)準(zhǔn)CE算法相比沒(méi)有大的提升,但CE-QPSO算法的收斂速度和時(shí)間消耗均遠(yuǎn)勝于標(biāo)準(zhǔn)CE算法。證明利用QPSO算法得到用于更新CE算法參數(shù)的優(yōu)秀樣本,能夠加快收斂速度,提升優(yōu)化效率。
實(shí)驗(yàn)結(jié)果表明,綜合考慮優(yōu)化效果和優(yōu)化效率,CE-QPSO算法的表現(xiàn)明顯優(yōu)于標(biāo)準(zhǔn)CE算法和標(biāo)準(zhǔn)QPSO算法,能夠有效應(yīng)用于聯(lián)合火力打擊方案的高效優(yōu)化。
本文研究了聯(lián)合火力打擊方案優(yōu)化問(wèn)題,綜合考慮目標(biāo)價(jià)值、毀傷效果和打擊成本,建立了聯(lián)合火力分配模型,設(shè)計(jì)了聯(lián)合火力打擊方案評(píng)價(jià)指標(biāo)。在此基礎(chǔ)上,提出了CE-QPSO算法,重構(gòu)了CE算法更新概率分布函數(shù)的方式和QPSO算法隨機(jī)產(chǎn)生初始粒子的方式,充分結(jié)合兩種算法各自優(yōu)勢(shì),有效提升了算法針對(duì)高維復(fù)雜模型的運(yùn)行效率和全局尋優(yōu)能力。通過(guò)仿真實(shí)驗(yàn),驗(yàn)證了該算法對(duì)于提升聯(lián)合火力打擊方案優(yōu)化效果和優(yōu)化效率的有效性。