褚凱軒, 常天慶, 張雷
(1.陸軍裝甲兵學院 兵器與控制系, 北京 100072; 2.63963部隊, 北京 100072)
武器目標分配(WTA)的核心是優(yōu)化配置打擊資源,實現(xiàn)對目標打擊收益最大化。WTA模型已經(jīng)運用到防空火力分配、導彈攔截、艦船火力優(yōu)化、突擊武器和支援武器協(xié)同火力等研究中,取得了一系列研究成果[1-2]。傳統(tǒng)WTA模型以毀傷概率最大為優(yōu)化目標,以盡可能多地消滅目標。地面作戰(zhàn)的WTA研究不成熟,模型一般仿用防空反導WTA模型,而防空作戰(zhàn)的WTA模型側(cè)重于毀傷驅(qū)動,追求毀傷效果最大化,這種模型在對保護陣地這種作戰(zhàn)任務中符合實際[3-5]。地面作戰(zhàn)情況比防空作戰(zhàn)復雜得多,需要面臨多變的戰(zhàn)場環(huán)境、復雜的作戰(zhàn)任務、諸多不確定因素并配合不同的戰(zhàn)法,而且地面作戰(zhàn)中的火力分配不是對導彈的攔截而是對敵作戰(zhàn)單位的打擊,武器對目標進行打擊的同時目標還會對武器進行打擊,這決定了地面作戰(zhàn)對抗性和持久性。因此,如果WTA模型片面追求毀傷最大卻忽略了打擊的成本,則可能造成打擊資源浪費甚至暴露武器的地理位置和作戰(zhàn)意圖,給戰(zhàn)局帶來不利影響。
文獻[6]提出了基于打擊效果的WTA方法,將給定的目標打擊效果作為優(yōu)化目標,解決了打擊資源浪費的問題。文獻[7]提出了基于期望殺傷概率的WTA方法,以期望殺傷概率與實際火力分配方案產(chǎn)生的殺傷概率偏差為優(yōu)化目標,從而實現(xiàn)對各個目標的期望毀傷,并減少過度殺傷的出現(xiàn)。文獻[8]提出了“附帶毀傷”的概念,將我方武器平臺打擊目標時可能對非目標造成的毀傷予以量化考慮,但是對增加目標毀傷和減少附帶毀傷的優(yōu)先權(quán)重問題未能給出定量的計算方法。文獻[9]建立了一種面向裝甲分隊戰(zhàn)法運用的兩階段WTA模型,以避免對單目標過度打擊,從而實現(xiàn)分火射擊,但是這種方法只是避免了對個別目標的過度集火,火力分配方案仍是所有武器參與射擊。文獻[10]提出了一種基于火力適度裝甲分隊WTA模型,一定程度上避免了過度集火、造成火力浪費。文獻[11]提出一種以資源消耗最小為優(yōu)化目標、以最小毀傷概率為約束的WTA模型。
多目標WTA模型試圖考慮更多影響火力分配的因素,是當前研究的熱點。文獻[12]針對戰(zhàn)斗機對敵打擊戰(zhàn)例,考慮博弈過程建立多目標WTA模型,優(yōu)化目標包括對敵毀傷、彈藥消耗和己方損傷。文獻[13]指出一個合適的WTA方案不應該僅僅滿足打擊效能最大化的要求,也要考慮打擊的代價,并構(gòu)建了雙優(yōu)化目標WTA模型。文獻[14] 提出了敵方毀傷最大化和我方導彈消耗成本最低的多目標WTA模型。但是,多目標WTA模型的文獻中,更多是關(guān)注于提升多目標優(yōu)化算法的性能,以找到擁擠度更適宜、多樣性更強的Pareto解集,而對優(yōu)化函數(shù)和各種指標的實際作戰(zhàn)意義討論較少。
WTA模型的求解是一個NP-hard問題[15],人工蜂群(ABC)算法良好的搜索方向性,避免了解空間爆炸的困擾,能夠在有限的時間內(nèi)求得滿意解,尤其是偵查蜂搜索策略,可以適時跳出當前最優(yōu)解,提高了算法的全局尋優(yōu)能力。文獻[16]用ABC算法求解基于分組約束的多對多攔截WTA。文獻[17]針對不可靠環(huán)境下的WTA問題,提出了一種基于分散點對點結(jié)構(gòu)和自適應ABC優(yōu)化算法的方案。文獻[18]提出了一種基于罰函數(shù)的分組約束多對多WTA模型,并以ABC算法為基礎,給出了求解這類分組約束WTA問題的一般步驟。文獻[19]針對ABC算法求解WTA問題收斂速度慢、搜索效率低的問題,提出了一種改進ABC算法,搜索過程中采用排序選擇和精英引導策略來提高搜索效率,同時提出一種啟發(fā)式種群初始化方法,顯著提高了初始解質(zhì)量。對WTA模型求解算法的改進主要是融合多種算法算子或提出新的算子來提高種群的搜索能力。另外,可以充分利用WTA問題的先驗知識,發(fā)揮基于規(guī)則的啟發(fā)式解的作用。隨著計算能力的提升和對啟發(fā)式智能算法的深入研究,對小規(guī)模戰(zhàn)例WTA問題,算法能夠在有限次迭代內(nèi)以接近100%的概率搜索到最優(yōu)解,但是對大規(guī)模的戰(zhàn)例,算法的收斂精度和收斂速度不能保證。
本文構(gòu)建基于打擊效益的地面作戰(zhàn)WTA模型,針對戰(zhàn)場上打擊決策的收益和代價,制定合理的優(yōu)化目標。通過對目標的威脅評估,判定打擊的迫切性和必要性;通過對目標的戰(zhàn)場價值判斷,計算毀傷價值收益;通過目標對武器的毀傷概率,預估我方武器的損失;通過分析敵我兵力對比和彈藥儲備情況,量化彈藥的價值;通過分析敵我雙方的戰(zhàn)術(shù)意圖,衡量打擊的必要性和戰(zhàn)術(shù)意圖暴露的代價。綜合權(quán)衡多種影響因素,設置合理的優(yōu)化函數(shù),旨在提高打擊決策的科學性。
本文提出一種改進ABC算法,以提高算法的搜索方向性和迭代后期跳出局部最優(yōu)能力,同時采用武器目標組合(WTP)庫種群初始化策略,提高了算法初期種群質(zhì)量。
地面作戰(zhàn)的WTA不同于防空反導類作戰(zhàn)。首先,地面作戰(zhàn)中,目標不是敵導彈而是敵作戰(zhàn)單元,在對抗不劇烈的情況下,對目標打擊的迫切性不如防空反導類任務強。而且,地面作戰(zhàn)是持續(xù)性的對抗,火力分配時必須考慮持續(xù)作戰(zhàn)能力和當前決策在整體戰(zhàn)術(shù)任務中的意義。另外,地面作戰(zhàn)經(jīng)常出現(xiàn)“非對稱”現(xiàn)象,如果調(diào)用大量火力打擊少量的目標,會造成打擊資源浪費?;谝陨戏治?本文提出針對地面作戰(zhàn)的基于打擊效益的WTA模型,旨在全面權(quán)衡打擊的收益和代價,做出科學的火力分配決策??紤]有m個可用武器,n個待打擊目標。武器對目標的毀傷概率矩陣P=[pij]m×n,目標對武器的毀傷概率為Q=[qji]n×m。
1) 減少目標威脅值
(1)
式中:u1為減少目標威脅值;Thj表示目標j的威脅度;xij為打擊決策變量,是打擊決策矩陣X中的元素,xij=1表示武器i對目標j實施打擊,xij=0表示武器i對目標j不實施打擊。目標威脅度的確定需要對目標進行威脅評估,通過分析目標的作戰(zhàn)能力和作戰(zhàn)意圖,確定目標威脅程度的定量描述[20]。
2) 毀傷目標價值
(2)
式中:u2為毀傷目標價值;Vtj表示目標j的戰(zhàn)場價值。此處的目標戰(zhàn)場價值不是指敵作戰(zhàn)單位的實際價值,而是在戰(zhàn)局中發(fā)揮作用的能力。對于指揮機構(gòu)這類關(guān)鍵節(jié)點需設置較高的目標價值,對于一般節(jié)點設置較低的目標價值。通過為不同目標單位設定不同價值,可以影響打擊策略。例如,當為敵重要節(jié)點設置極高的戰(zhàn)場價值時,可以生成對關(guān)鍵節(jié)點集火打擊的方案;相反,如果給關(guān)鍵節(jié)點設置的戰(zhàn)場價值不夠高,則生成的WTA方案可能傾向于分火射擊,先消滅防御節(jié)點,后對關(guān)鍵節(jié)點進行集中打擊。
1) 目標對武器的毀傷價值
(3)
步驟2計算單目標對單武器的毀傷價值q′jiVwi,j=1, 2,…,n,i=1, 2,…,m。
步驟3將毀傷武器價值最大的目標v和武器u組合配對,并將該目標v從目標集中刪除。
步驟4按下式更新武器價值。
Vw′u=(1-q′vu)Vwu。
步驟5如果所有目標均被分配打擊的武器,則算法結(jié)束,否則轉(zhuǎn)步驟2。
2)彈藥消耗
(4)
式中:c2為彈藥消耗量;vi表示武器i彈藥的價值,此處的彈藥價值不是彈藥成本,而是結(jié)合戰(zhàn)場形式、作戰(zhàn)任務、剩余彈量和戰(zhàn)場補給能力等因素決定的。例如,當坦克彈藥儲備充足或彈藥補給保障充分時,彈藥價值較低。本文作戰(zhàn)想定中不存在彈藥補給車,彈藥價值僅由彈藥儲備和雙方兵力決定,設定
(5)
式中:bi為武器i的剩余彈藥數(shù)量。
3) 武器位置和戰(zhàn)略意圖暴露
(6)
式中:c3為武器位置和戰(zhàn)略意圖暴露值;ε∈(0,1)為武器暴露的代價系數(shù),可根據(jù)戰(zhàn)場態(tài)勢決定。承擔主攻任務的單位暴露代價系數(shù)較低,“隱蔽前出”、“穿插迂回”的單位暴露代價系數(shù)較高;作戰(zhàn)初期武器多處于潛伏階段時,暴露代價系數(shù)較大,而作戰(zhàn)中后期,雙方態(tài)勢信息透明時,暴露代價系數(shù)取值接近0。
綜上所述的打擊收益和代價,可得到基于打擊效益的WTA模型為
(7)
式中:α1、α2為減少目標威脅值和毀傷目標價值的權(quán)重系數(shù);β1、β2、β3為目標對武器的毀傷價值、彈藥消耗、武器位置和戰(zhàn)略意圖暴露代價權(quán)重系數(shù)。
ABC算法是模擬蜜蜂采蜜行為的群智能算法,具有收斂良好、參數(shù)少、實現(xiàn)流程簡單等優(yōu)點,本文在ABC算法的基礎上針對本文WTA模型特點進行特定的設計和應用。
2.1.1 種群初始化
對于一個m維問題,每個蜜源的位置向量可表示為Xi=[xi1,xi2,…,xim],i=1,2,…,SN,SN表示種群個數(shù)。蜜源初始位置隨機產(chǎn)生,解空間上限ub=[ub1,ub2,…,ubd,…,ubm],下限lb=[lb1,lb2,…,lbd,…,lbm],初始蜜源位置(即初始解)為
xid=lbd+(ubd-lbd)·rand(0,1)
(8)
式中:xid為向量xi的第d維變量,d=1,2,…,m;rand是[0,1]上的隨機數(shù)。
2.1.2 雇傭蜂
每一個蜜源xi對應一個雇傭蜂,蜜源xi處的雇傭蜂隨機選擇另一只蜜源xk(k∈{1,2,…,SN},且k≠i)處的蜜蜂進行鄰域搜索并更新位置,獲得新的蜜源vi
vid=xid+(xid-xkd)·rand(-1,1)
(9)
式中:vid為向量vi的第d維變量;rand(-1,1)為[-1,1]上均勻分布的隨機數(shù)。獲得新的蜜源后,按照貪婪選擇的方式更新蜜源。如果新的蜜源vi的質(zhì)量高于原蜜源xi的質(zhì)量,則vi取代xi;否則xi保持不變,迭代重復值triali加1,迭代重復值triali表示經(jīng)過多次搜索,蜜源質(zhì)量仍沒有得到改善。
2.1.3 觀察蜂
雇傭蜂更新一輪后,將蜜源信息分享給觀察蜂,觀察蜂根據(jù)蜜源的質(zhì)量進行概率選擇。第i個蜜源被觀察蜂選擇的概率為
(10)
式中:j為蜜蜂索引;fiti為適應度值,
(11)
fi為第i個蜜源的評價值,由所求解問題的優(yōu)化函數(shù)計算得到。
觀察蜂依據(jù)概率選擇蜜源,與雇傭蜂相同,按照式(9)進行搜索。
2.1.4 偵查蜂
當雇傭蜂和觀察蜂多次搜索未發(fā)生更新,即triali>limit時,則放棄該蜜源,變?yōu)閭刹榉?偵查蜂按照式(8)隨機初始化一個新的蜜源代替。
2.2.1 WTP庫種群初始化策略
針對第1節(jié)提出的基于打擊效益的WTA模型,利用模型中的先驗知識指導種群初始化。首先計算所有單武器對單目標的打擊收益和打擊代價。
(12)
(13)
(14)
(15)
(16)
火力分配是多對多問題,以上打擊收益、打擊代價都是針對單對單的打擊效果,但是在多對多的火力分配方案中,更理想的WTP會有更大的概率出現(xiàn)在最優(yōu)的火力分配方案中。利用單對單的矩陣信息,可以指導生成初始解?;谝陨戏治?本文提出一種WTP庫種群初始化策略。
首先構(gòu)建WTP庫,包括武器主體的WTP庫和目標主體的WTP庫。
武器主體的WTP庫:彈藥消耗代價和武器暴露代價與選擇的目標無關(guān),與武器是否射擊有關(guān)。選擇彈藥消耗代價和暴露代價前10%的武器,將該武器與0(不分配目標)配對,存入WTP庫;針對每個武器,選擇在該武器打擊下目標威脅值降低量前10%的目標,將武器和目標配對,存入WTP庫;選擇在該武器打擊下目標價值降低量前10%的目標,將武器與目標配對,存入WTP庫。
目標主體的WTP庫:針對每個目標,選擇對其打擊降低其威脅值前10%的武器,將武器和目標配對,存入WTP庫;選擇對其打擊降低其戰(zhàn)場價值前10%的武器,將武器和目標配對,存入WTP庫;選擇對其打擊后其對武器毀傷價值降低量前10%的武器,將武器和目標配對,存入WTP庫。
建立好WTP庫后,種群初始化可以直接從WTP庫中提取WTP,從而得到高質(zhì)量的初始解。
2.2.2 改進ABC算法
ABC算法中,雇傭蜂對相鄰蜜蜂進行鄰域搜索,是一種兼顧探索和開發(fā)的搜索方式,觀察蜂以高概率選擇高質(zhì)量蜜源的蜜蜂進行鄰域搜索,是一種更傾向于開發(fā)的搜索方式,偵查蜂直接放棄前期的蜜源,重新隨機選擇蜜源,是一種純粹的探索式搜索。ABC算法兼顧探索和開發(fā),具有較好的收斂效果,且能夠及時跳出局部最優(yōu)解,是求解WTA問題的一種有效方法。但是對于大規(guī)模WTA問題,解空間呈指數(shù)規(guī)律爆炸,算法的收斂速度和收斂精度仍有待提高。另外,動態(tài)武器目標分配(DWTA)這類高實時性、高更新幀率的動態(tài)問題,對算法的求解速度和魯棒性提出了挑戰(zhàn)。本文針對WTA模型對ABC算法進行特定的設計和應用。
標準ABC算法中,雇傭蜂和觀察蜂都采用式(9)進行搜索,雇傭蜂是盲目搜索,沒有任何方向性,只在進行貪婪選擇時確保優(yōu)質(zhì)解被保留,觀察蜂在選擇鄰居時,傾向于選擇適應度高的個體作為鄰居,有一定的方向性,但是針對WTA這類整數(shù)規(guī)劃問題,收斂性不強;另外,在WTA的決策變量中,解向量中元素值代表的是目標編號,不具有數(shù)字的意義。例如,當某武器打擊目標9獲得高打擊效益,而該武器打擊目標1獲得低打擊效益時,采用式(9)進行優(yōu)質(zhì)解引導,可能會產(chǎn)生該武器對目標5進行打擊的決策,但是1、5、9僅是編號,這種引導沒有實際意義?;谝陨戏治?本文對搜索策略進行如下改進:
1)編碼方式
圖1 整數(shù)編碼示意圖
2)雇傭蜂鄰域最優(yōu)解引導策略[22]
雇傭蜂階段應側(cè)重探索能力,提高發(fā)現(xiàn)優(yōu)良區(qū)域的概率。在雇傭蜂之間建立信息交互機制,每只雇傭蜂擁有各自的局部視野,能夠發(fā)現(xiàn)局部視野內(nèi)的最優(yōu)解,并飛向局部最優(yōu)解。通過這種方式,在雇傭蜂之間建立起了協(xié)作機制,雇傭蜂進化策略有了方向性。
定義雇傭蜂xi與xj的距離公式為
(17)
式中:bool為邏輯判斷函數(shù),括號中內(nèi)容為true時bool值為1,括號中內(nèi)容為false時bool值為0。
定義雇傭蜂視野范圍為
(18)
由于解向量中的元素值不具備數(shù)字意義,摒棄式(9)搜索方式,采取鄰域最優(yōu)解相應元素直接替代策略。雇傭蜂搜索方程為
(19)
3)觀察蜂全局精英引導策略
觀察蜂擁有全局視野,能夠發(fā)現(xiàn)全局的精英解,并飛向精英解所在位置。選擇種群中適應度值最高的一部分群體組成精英群體,觀察蜂隨機選擇精英解并接受引導。精英的數(shù)量
T=ceil(ρ·SN)
(20)
式中:ρ為精英解比例;ceil(·)表示向上取整函數(shù)。隨機選擇全局精英xgelite進行引導搜索,觀察蜂搜索方程為
vid=xgelite,d
(21)
4)ε-貪心選擇策略
采用貪婪算法對雇傭蜂和觀察蜂搜索之后的新舊解進行選擇,該策略會造成過收斂,陷入局部最優(yōu),為了提高找到全局最優(yōu)解的概率,有時需要先接受適應度比當前解低的解,如圖2所示。
圖2 跳出局部最優(yōu)解示意圖
本文提出ε-貪心策略,更新過程中當新解適應度值低于舊解時,以ε的概率選擇新解,以1-ε的概率維持舊解。
ε貪心選擇策略公式為
(22)
2.2.3 本文算法流程
本節(jié)以偽代碼形式展示本文改進算法的流程。圖3所示為本文改進算法偽代碼,其中maxCycle為算法的最大評價次數(shù),FES表示當前評價次數(shù),SN表示種群個數(shù),limit表示蜜源最大開發(fā)次數(shù),triali表示當前蜜源開發(fā)次數(shù)。
圖3 本文改進ABC算法偽代碼
本節(jié)共設置兩組仿真實驗,3.1節(jié)分別展示了本文WTA模型在1對1、多對1和多對多三種戰(zhàn)例情形下的打擊決策,表明本文提出WTA模型的實用性。3.2節(jié)隨機生成不同數(shù)量規(guī)模的戰(zhàn)例,以驗證WTP庫種群初始化方法和本文改進ABC算法求解WTA模型的優(yōu)勢。
3.1.1 1對1戰(zhàn)例
當?shù)孛孀鲬?zhàn)單元分散執(zhí)行任務時,可能會出現(xiàn)單武器單目標的打擊決策問題,需要決定立刻開火消滅還是等待。由于1對1戰(zhàn)例中武器的決策只有開火和等待兩種,只需計算兩種方案的效益值即可,無需調(diào)用智能算法。表1所示為隨機生成的7組 1對1戰(zhàn)例及其打擊決策。由表1可以看出,本文模型可以為不同戰(zhàn)場態(tài)勢下的1對1戰(zhàn)例提供打擊決策:當打擊效益大于等待效益時,采取打擊策略,否則必須等待適宜的時機再摧毀或者報告友方單位進行打擊。戰(zhàn)例5中,由于目標價值和威脅均不大,對目標的毀傷概率偏低,而且武器的彈藥儲備不足,此時打擊目標效益極低,故采取等待策略;戰(zhàn)例6中,武器的暴露代價系數(shù)較大,也采取等待策略。這種基于打擊效益的WTA模型考慮因素更加全面,提高了打擊決策的科學性。
表1 1對1戰(zhàn)例WTA參數(shù)及打擊決策
3.1.2 多對1戰(zhàn)例
在未知的戰(zhàn)場環(huán)境中,作戰(zhàn)分隊對目標是逐個發(fā)現(xiàn)的,經(jīng)常會出現(xiàn)多對1的情況,如果讓所有武器均對1個目標實施射擊,則雖然能夠得到最大的毀傷概率,但是必然會浪費不必要的打擊資源。本節(jié)通過實驗驗證本文模型在多對1戰(zhàn)例中的應用。
考慮5個可用武器,1個待打擊目標。WTA參數(shù)如下:
P=[0.76 0.18 0.49 0.39 0.71]T;Q=[0.61 0.37 0.20 0.66 0.36];Vw=[5 7 8 6 2];b=[10 10 5 9 1];Vt=5;Th=2.05;ε=[0.10 0.30 0.15 0.10 0]。
該戰(zhàn)例中,打擊決策的解空間為2m,本文實驗共有5個武器,有32種可能的打擊方案,直接用窮舉法計算最優(yōu)方案x=[1,0,0,0,1],對目標的毀傷概率為93%,打擊效益值為4.68。如果采用追求毀傷最大的WTA策略,全部武器參與射擊,則對目標的毀傷概率為98%,打擊效益值為0.94,這就出現(xiàn)了大炮打蚊子現(xiàn)象,明顯浪費了火力資源。
3.1.3 多對多戰(zhàn)例
考慮有8個武器和4個待打擊目標,參數(shù)設置如下:
為了討論本文提出的基于打擊效益WTA模型的效果,引入文獻[7]、文獻[9]、文獻[11]的火力分配模型以及追求毀傷最大化的標準WTA模型進行比較。
文獻[7]以目標期望毀傷概率和實際毀傷概率偏差最小化為優(yōu)化目標,即
(23)
式中:Kj表示目標Tj的期望毀傷概率。
文獻[9]通過設立隸屬度函數(shù),以實現(xiàn)對目標毀傷概率的控制,優(yōu)化模型為
(24)
式中:L(·)為隸屬度函數(shù),
(25)
ξ為標準毀傷概率,ε1為標準毀傷概率左閾值,ε2為標準毀傷概率右閾值。
文獻[7]、文獻[9]的WTA模型都面臨單武器對單目標毀傷概率過大而不被配對的問題,為解決這一問題,首先找出單武器對目標毀傷概率大于標準毀傷概率的武器-目標組合,將其直接配對,并將它們從武器集和目標集中刪除,然后對剩余的武器目標進行分配。
文獻[11]以對目標的毀傷概率為約束條件,以資源消耗最小為優(yōu)化目標建立模型,表達式為
(26)
式中:vi表示武器i的彈藥價值;Dj為對目標Tj的最小毀傷概率。
標準WTA模型以最大毀傷為優(yōu)化目標,優(yōu)化模型為
(27)
不同WTA模型的實驗數(shù)據(jù)統(tǒng)計如表2所示。由表2可以看出,標準WTA模型追求毀傷最大化,所有可用武器參與作戰(zhàn),容易造成不必要的浪費,本文算例中,目標3的威脅值偏小,而武器7僅剩余3發(fā)炮彈,在武器2已經(jīng)對目標3進行打擊的情況下,其預期毀傷概率已經(jīng)達到73%,再用武器7對目標3集火打擊是沒有必要的。文獻[7]、文獻[9]、文獻[11]的WTA模型在設置不同的參數(shù)情況下,可以得到不同的火力分配方案,當期望毀傷概率設置較小時,不需要所有的武器參與射擊,滿足火力適度的要求。但是,文獻[7]模型中設置預期毀傷概率K為0.7以及文獻[9]模型中設置ξ為0.7時,得到了不合理的打擊方案,方案中讓武器3、6、8均打擊目標4,獲得了對該目標0.717 8的毀傷概率,而事實上只需要武器4、8對目標4進行打擊,即可得到0.792 0的毀傷概率。產(chǎn)生這種不合理的打擊方案的原因是優(yōu)化模型以毀傷概率接近0.7為優(yōu),最終選擇了用3個命中概率偏低的組合而不是兩個高命中概率的組合。模型中雖然采用將高毀傷概率組合提前配對的方法解決單武器對單目標命中概率過高而不配對的問題,但是“雙武器”組合的命中概率過高問題沒有被解決。同理,更大規(guī)模的WTA問題中,“三武器”、“四武器”組合的命中概率過高問題會更加復雜。文獻[11]以毀傷概率為約束條件而不是優(yōu)化目標,當毀傷概率過高時不會出現(xiàn)懲罰機制,避免了文獻[7]、文獻[9]的問題,但是當毀傷概率設置過高時會出現(xiàn)無解的情況,因此該模型適用于武器遠遠多于目標的非對稱情況,當武器和目標數(shù)量差別不大時,最小毀傷概率需要謹慎設定。
表2 不同WTA模型實驗數(shù)據(jù)統(tǒng)計
由此可見,本文模型綜合權(quán)衡了多種利弊因素,可以獨立分析單武器射擊的收益和代價,便于得到合理的火力分配方案,且各因素已被量化,便于依據(jù)實際情況修改具體參數(shù)和權(quán)重,適用性更強。
3.2.1 實驗參數(shù)設置
為了驗證本文算法的性能,設置小、中、大規(guī)模戰(zhàn)例,對算法進行測試。每一規(guī)模下設置武器數(shù)量大于和小于目標數(shù)量的情況。武器和目標的數(shù)目列于表3,5W-3T表示武器數(shù)量為5、目標數(shù)量為3,后續(xù)同此。不失一般性,武器對目標毀傷概率矩陣P,目標對武器的毀傷概率矩陣Q,武器價值Vw,目標價值Vt,目標威脅值Th,暴露代價系數(shù)ε和彈藥儲備b隨機生成。
表3 戰(zhàn)例參數(shù)設置
3.2.2 算法對比實驗
為了驗證本文ABC算法在求解WTA模型方面的優(yōu)勢,引入ABC算法、qABC[23]算法、DFSABC_elitte[24]算法、IABC[19](無初始化策略)算法作為對比。算法參數(shù)設置如表4所示。
表4 算法參數(shù)設置
每種算法獨立運行30次并求平均值,得到算法收斂曲線對比如圖4所示。由圖4可以看出,各種改進ABC算法相比標準ABC算法的收斂速度和收斂精度都有顯著提高:小規(guī)模戰(zhàn)例中,各種改進算法的收斂曲線差別不大;中規(guī)模戰(zhàn)例中,迭代初期qABC算法的收斂速度最快,本文ABC算法收斂速度略遜,而迭代后期本文ABC算法收斂精度超過qABC算法,表明本文ABC算法后期的全局尋優(yōu)能力更強;大規(guī)模戰(zhàn)例中,本文方法在各個階段收斂速度和收斂精度均優(yōu)于對比方法;當采用本文ABC算法+WTP庫種群初始化方法時,初代解質(zhì)量顯著提高,收斂曲線優(yōu)勢更加明顯。
圖4 算法收斂曲線對比
為了更直觀地比較各種算法的收斂精度和算法魯棒性,將30次尋優(yōu)實驗的最終尋優(yōu)值畫成盒形圖,如圖5所示。由圖5可以看出:小規(guī)模戰(zhàn)例中,所有算法都能得到最優(yōu)值,尤其是5W-3T戰(zhàn)例和3W-5T戰(zhàn)例中所有算法30次尋優(yōu)實驗都獲得了最優(yōu)值;隨著戰(zhàn)例規(guī)模的增大,本文算法的收斂精度和穩(wěn)定性優(yōu)勢逐漸明顯。
圖5 最優(yōu)解盒形圖
3.2.3 種群初始化方法對比實驗
3.2.2節(jié)實驗已經(jīng)表明本文提出的WTP庫初始化方法可以顯著提高初始解的質(zhì)量,使算法在初代即已經(jīng)占據(jù)優(yōu)勢。文獻[19]也提出了TRcCl/TRc種群初始化方法,具體操步驟為:先打亂目標的編號順序,依次為目標分配打擊效益最大的武器,如果目標數(shù)不大于武器數(shù),則初始解生成完畢;如果武器數(shù)大于目標數(shù),則按照目標的存活概率從大到小依次為目標分配下一個武器。
下面比較在大規(guī)模戰(zhàn)例中本文ABC+WTP庫算法和IABC+TRcCl/TRc算法的性能。同樣進行30次實驗,本文ABC+WTP庫算法的尋優(yōu)實驗結(jié)果直接取自3.2.2節(jié)。兩種方法在大規(guī)模戰(zhàn)例下的平均收斂曲線如圖6所示。由圖6可以看出,TRcCl/TRc種群初始化方法得到的初始種群質(zhì)量明顯優(yōu)于WTP庫種群初始化方法生成的初始種群質(zhì)量,但是算法迭代后期本文WTP庫初始化法的收斂精度高于對比方法。原因在于,TRcCl/TRc種群初始化方法是一種分火射擊策略,依據(jù)毀傷目標概率公式可知,分火射擊更有利于得到理想的打擊效果,而本文WTP庫方法生成的初始種群,更傾向于選擇單武器對單目標取得良好的打擊效果WTP。算法后期本文ABC+WTP庫算法的收斂效果要好于IABC+TRcCl/TRc算法,原因是TRcCl/TRc種群初始化方法得到的種群更容易陷入局部最優(yōu)。以一個2W-2T戰(zhàn)例為例,以毀傷目標期望最大為目標,武器對目標的毀傷概率矩陣為
圖6 初始化方法收斂曲線對比
在該目標序列下,TRcCl/TRc方法會得到x=[1,2]的打擊決策,毀傷目標期望值為1.3。本文WTP庫種群初始化方法可能會生成x=[1,1]的打擊決策,毀傷目標期望值為0.94。WTP庫方法生成的解質(zhì)量劣于TRcCl/TRc方法生成的解質(zhì)量。而本文戰(zhàn)例的最優(yōu)打擊決策為x=[2,1],毀傷目標期望為1.5。雖然打擊方案[1,1]的評價值低,但是該方案最少只需要一次搜索就可以得到最優(yōu)方案,方案[2,1]至少需要兩次搜索才能得到最優(yōu)解,而且如果按照IABC算法每次僅搜索一個維度并遵循貪婪選擇規(guī)則,將永遠無法跳出該局部最優(yōu)解。因此,非最優(yōu)的分火射擊方案容易陷入局部最優(yōu),這在大規(guī)模的戰(zhàn)例中尤為明顯。而WTP庫方法,雖然生成的初始解質(zhì)量不高,但是較大的隨機性有利于后續(xù)迭代收斂。
本文針對地面作戰(zhàn)的特點建立了基于打擊效益的WTA模型,模型充分考慮戰(zhàn)場態(tài)勢、戰(zhàn)術(shù)戰(zhàn)法以及地面作戰(zhàn)對抗性和持續(xù)性特點,綜合權(quán)衡利弊因素,確定打擊優(yōu)化函數(shù)。仿真實驗結(jié)果表明,本文模型能夠得到理想的打擊方案,對指導地面作戰(zhàn)分隊的火力分配有意義。
針對WTA模型的求解,本文在ABC算法的基礎上進行了具體的設計和應用,主要針對算法前期的收斂速度和算法后期跳出能力進行改進,以及針對特定問題提出的WTP庫種群初始化方法。對比實驗結(jié)果表明本文改進算法在收斂速度、收斂精度和魯棒性方面具有優(yōu)勢。