王春光,許 樂,蔡立言,徐 勇
(1. 31002部隊, 北京 100041; 2.哈爾濱工業(yè)大學(深圳)計算機科學與技術(shù)學院, 廣東 深圳 518055)
火力分配[1-4]是交戰(zhàn)對抗規(guī)劃的經(jīng)典內(nèi)容之一。根據(jù)敵我雙方兵力兵器的相互作戰(zhàn)效能,優(yōu)化兵力分配和火力分配,可以在消滅敵人的同時最大限度地保存自己。隨著世界各國的作戰(zhàn)裝備類型增多,部隊單位的合成化日益增強,不同裝備之間的作戰(zhàn)機理和毀傷效能復雜多樣,如何智能化地根據(jù)作戰(zhàn)場景進行兵力調(diào)度和火力分配,成為各級指戰(zhàn)員的嚴峻挑戰(zhàn)。近年來,美國著名智庫戰(zhàn)略與預算評估中心提出的“決策中心戰(zhàn)”已成為美軍智能化戰(zhàn)爭設計的一個風向標。俄烏戰(zhàn)爭已顯現(xiàn)出智能化戰(zhàn)爭的端倪。烏方結(jié)合GIS Arta系統(tǒng)[5],基于火力部署和定位技術(shù),在識別和定位俄軍目標的基礎上,能迅速選擇射程內(nèi)的作戰(zhàn)力量進行合成火力分配和打擊,給俄軍造成了較大傷亡。因此,智能化的兵力分配和火力分配對于戰(zhàn)爭的勝利至關(guān)重要。
基于以上背景和動機,以典型合成作戰(zhàn)為例,開展對抗策略設計及建模,研究合成火力分配算法。合成火力分配的核心是在對多兵力綜合對戰(zhàn)能力的基礎上,進行合理的火力(兵力)的組合式配置。現(xiàn)有的合成火力(兵力)分配方法主要包括啟發(fā)式方法和精確算法。啟發(fā)式方法通過簡單的規(guī)則、經(jīng)驗或者啟示,以期望得到一個近似最優(yōu)解。例如,馬也等[6]提出了一種深度強化學習的自適應遺傳算法,用于無人機群兵力分配問題。王君等[7]提出將遺傳算法用于兵力分配問題,實驗證明了該方法的有效性。潘偉[8]提出了一種面向雷達干擾系統(tǒng)兵力分配問題的自適應遺傳算法。曹鑫等[9]提出了一種免疫遺傳算法,并用于海上編隊雷達網(wǎng)干擾問題。溫包謙等[10]提出了一種針對末端防御兵力分配問題的PSO-GA混合算法,實驗驗證了該方法的可行性。路建偉等[11]提出了一種面向空襲兵力分配優(yōu)化問題的遺傳模擬退火算法。總的來說,啟發(fā)式算法可以在一定程度上解決大規(guī)模問題,但其存在早收斂和易陷入局部最優(yōu)等問題,導致兵力分配不合理。
精確方法是一類能求得最優(yōu)解的算法,其將兵力分配中的整數(shù)條件進行松弛,改變問題的搜索空間,同時采用不同的搜索策略以節(jié)省計算量,并借助線性規(guī)劃理論基礎,提升解的質(zhì)量,逐步找到問題的最優(yōu)解。例如,路建偉等[11]使用了多目標數(shù)學線性規(guī)劃方法求解空襲兵力分配問題。陳向勇等[12-13]使用了Lanchester方程理論的非線性整數(shù)規(guī)劃方法求解兵力分配問題。高尚[14]提出了一種關(guān)于兵力分配的線性規(guī)劃方法。王金山等[15]利用了分支定界法求解特拉法爾加海戰(zhàn)案例的兵力分配問題??偟膩碚f,精確方法能給出全局最優(yōu)解,且求出的解質(zhì)量較高,但是時間復雜度較高,其時間開銷為指數(shù)級。
合成火力分配方法與策略也被廣泛用于戰(zhàn)爭模擬場景。相應方法主要分為3類:1)由隨機算法[16]決定戰(zhàn)斗目標,雙方隨機選擇敵方目標并派兵力進行戰(zhàn)斗;2)集中全部力量去打敗敵方,但僅考慮敵方損失最大化,未考慮自身損失;3)集中全部力量去打敗敵方并考慮自身損失,但將敵方單位威脅程度視為均等,并未考慮敵方的優(yōu)先級程度,導致作戰(zhàn)失敗。因此,僅僅依靠隨機算法或簡單判斷雙方兵力損失程度無法最優(yōu)地規(guī)劃作戰(zhàn)方案。正確的模型和算法既應考慮最大化敵方損失,還應考慮敵方的優(yōu)先級程度以及最小化自身損失。此外,實際的多輪次對戰(zhàn)中,還應考慮到多輪戰(zhàn)斗中戰(zhàn)力的逐次合理化投入。例如,在穩(wěn)中求進地消耗對方戰(zhàn)力的同時,應逐漸拉大對方的戰(zhàn)力差距直至完全消滅對方,此方法為一個較優(yōu)的兵力分配方法[17-18]。
綜上所述,通過對合成單位的火力分配方法和數(shù)學模型特點進行分析,針對性地提出了一種新的回合制對抗策略及博弈模型,并進行了求解算法的對比分析與實驗驗證。本研究的主要創(chuàng)新點如下:
1) 首先,針對性地設計了一種新的回合制對抗策略及博弈模型。以回合制戰(zhàn)爭策略為例,考慮特定環(huán)境下的某一戰(zhàn)場中,紅方首先對兵力進行部署,隨后派出兵力對藍方進攻。在建模過程中考慮到了最大化藍方損失,且最小化藍方反擊時對紅方造成的損失。同時還對藍方的不同兵力引入了權(quán)重系數(shù)來表示藍方不同兵力的優(yōu)先打擊程度。其值越高表示該藍方兵力越應該被重點打擊。譬如,藍方擁有對紅方威脅大的兵力或者藍方中殺傷力強的兵力均應被列為重點打擊對象。
2) 其次,由于紅方和藍方每次交戰(zhàn)時,應盡可能最大化藍方損失并最小化紅方自身的損失。這2個目標互相矛盾,為綜合考慮兩目標的重要程度,首次引入超參數(shù)αk(αk≥0)來衡量第k輪交戰(zhàn)中紅方自身的損失敏感程度。超參數(shù)的值越小說明對自身損失越不敏感,紅方在戰(zhàn)術(shù)上更加激進,即派出大量兵力進行交戰(zhàn);超參數(shù)的值越大說明對自身損失越敏感,紅方在戰(zhàn)術(shù)上更加保守,即派出少量兵力進行交戰(zhàn)。
3) 最后,將策略與問題歸納為一個巧妙的整數(shù)線性規(guī)劃問題模型,并針對性地設計了關(guān)于該NP-Complete 問題的分支定價方法。實驗測試中不僅可以得到精確解,而且實驗結(jié)果具有很好的可解釋性。
以回合制戰(zhàn)斗對抗策略為例,考慮在特定環(huán)境下的某一戰(zhàn)場,紅方首先進行兵力的部署,隨后派出兵力進攻藍方。不同的兵力具有不同的作戰(zhàn)能力,并且存在克制與被克制的關(guān)系。對抗中不考慮戰(zhàn)爭迷霧,即雙方的配置完全透明。在發(fā)動進攻時,紅方可以根據(jù)藍方兵力的權(quán)重值進行打擊,權(quán)重值越高代表該藍方兵力越應該被重點打擊。在每一輪進攻結(jié)束后,紅方會對藍方造成一定的兵力損失,但也會受到藍方的反擊,隨后紅方將根據(jù)實際情況重新規(guī)劃進攻目標并再次發(fā)起進攻,如此反復直到藍方兵力被全部消滅。
假設紅方擁有m類兵力,記為RG1,RG2,…,RGm,每類兵力對應的數(shù)量分別為X1,X2,…,Xm;藍方擁有n類兵力,記為BG1,BG2,…,BGn,每類兵力對應的數(shù)量分別為Y1,Y2,…,Yn。定義紅方對藍方的戰(zhàn)斗格局為二元組(R,B),滿足:
R=(rij)m×n
(1)
B=(bij)m×n
(2)
式中,rij表示在交戰(zhàn)過程中紅方兵力RGi對藍方兵力BGj的殺傷力,即每個單位的紅方兵力RGi可以造成藍方rij個BGj的損失。同理,在交戰(zhàn)過程中紅方兵力受到藍方的反擊,bij表示在交戰(zhàn)中藍方兵力BGj對紅方兵力RGi的殺傷力。在每一輪交戰(zhàn)中,定義戰(zhàn)斗規(guī)劃矩陣:
X=(xij)m×n
(3)
式中,xij表示紅方派出的對藍方兵力BGj進行攻擊的兵力RGi的單位數(shù)量。紅方派出的兵力個體不可超過部署后的可用兵力池限制,即有:
同時,為避免紅方派出過量兵力造成資源浪費,設定一個限制最大打擊效能的超參數(shù)β(β>1),限定紅方只能派出比恰好完成打擊目標數(shù)量的β倍數(shù)量的兵力進行打擊:
如前文所述,紅藍兩方會有多次沖突。在確定每次作戰(zhàn)規(guī)劃方案時,應盡可能最大化藍方損失和最小化紅方損失。顯而易見的是,這兩個目標互相矛盾,當己方派出的戰(zhàn)力資源更多時,對方的損失會更大,但同時己方遭受的戰(zhàn)斗損失也會增大。此外,在真實的戰(zhàn)爭場景中,任務的執(zhí)行需要一定時間,當派出過多的戰(zhàn)力資源后,在對方突襲的情況下,己方可能存在所剩戰(zhàn)力資源難以應對的情況。
為了綜合考慮上述情況,紅方引入對自身的損失敏感程度概念,并用超參數(shù)αk衡量第k輪交戰(zhàn)中紅方對自身的損失敏感程度。其值越小說明對損失越不敏感,即在戰(zhàn)術(shù)上更加激進;其值越大說明對于損失越敏感,在戰(zhàn)術(shù)上更加保守。
經(jīng)過加權(quán)后,紅方兵力可以針對不同的藍方目標進行不同優(yōu)先度打擊。在計算藍方權(quán)重時,應當考慮該藍方兵力的殺傷效能,以及紅方使用各種兵力進行打擊時受到的反擊效能。采用如下公式計算參數(shù)wj:
綜合以上的目標函數(shù)和約束條件,可以將回合制戰(zhàn)爭策略場景中單輪戰(zhàn)斗的兵力規(guī)劃模型表述為:
同理,對于紅方的兵力RGi,其初始數(shù)量為Xi,更新公式為:
更新完畢后,規(guī)劃第二次交戰(zhàn)問題P2的行動方案,其數(shù)學建模與上述建模一致,但相關(guān)參數(shù)Xi,Yj已經(jīng)改變。若第二次交戰(zhàn)發(fā)生前交戰(zhàn)環(huán)境也有所改變,則對效用參數(shù)rij,bij也進行更新。第二次交戰(zhàn)以后,再次更新系數(shù)。后續(xù)交戰(zhàn)中的參數(shù)推演和作戰(zhàn)規(guī)劃以此類推,直到藍方兵力被全部殲滅或達到最大沖突次數(shù)K。
所述數(shù)學模型是一類單目標最大化的整數(shù)線性規(guī)劃模型,其目標是在線性約束下將一個線性目標最大化,且全部決策變量只能取整數(shù)值。不難證明該問題在復雜度理論下是一個NP-Complete問題[19]。針對這一問題,采用分支定價法來求解該數(shù)學模型。在決策變量為萬級以下時,分支定價法能在分鐘級或小時級的時間內(nèi)計算出一個精確解,該算法由分支定界法和列生成法[20]組成,且適用于求解大規(guī)模整數(shù)規(guī)劃問題[21]。分支定價法的原理:由內(nèi)外兩層組成,首先使用外層的分支定界法將搜索樹上的每個節(jié)點對應的整數(shù)規(guī)劃問題松弛為線性規(guī)劃問題,并對出現(xiàn)的分數(shù)解進行分支搜索;其次采用內(nèi)層的列生成法求解定價子問題,從而生成針對當前線性松弛解主問題的新列,進而求解當前線性松弛問題。分支定價法的求解步驟如下:
步驟3:節(jié)點終止條件1 若松弛問題MPk無解,則終止對節(jié)點Pk搜索,令k←k+1,并轉(zhuǎn)到步驟1。
步驟6:分支選擇分支變量,創(chuàng)建兩個新的活躍節(jié)點Pj+1和Pj+2,構(gòu)建Pj+1和Pj+2對應的Dantzig-Wolfe分解模型的松弛問題,令
Sk←Sk∪{Pj+1,Pj+2},j←j+1,k←k+1
并轉(zhuǎn)步驟1。分支定價法的執(zhí)行流程如圖1所示。
圖1 分支定價法的執(zhí)行流程
為驗證數(shù)學模型和算法的可行性,首先對超參數(shù)αk進行測試;其次,將遺傳算法和分支定價法進行對比實驗,還基于紅藍雙方力量分析對損失敏感程度進行自動設置的測試;最后,對傳統(tǒng)模型進行驗證分析,進一步驗證數(shù)學模型的可行性。
表1 紅藍雙方的兵力類型、數(shù)量及權(quán)重
表2 紅方兵力對藍方兵力的殺傷力
表3 藍方兵力對紅方兵力的殺傷力
表4 紅藍雙方的兵力類型、數(shù)量及權(quán)重
表5 紅方兵力對藍方兵力的殺傷力
表6 藍方兵力對紅方兵力的殺傷力
為對超參數(shù)αk進行測試,此處將其分為兩組進行實驗測試:
1) 在戰(zhàn)斗開始時,αk的值較大,紅方在戰(zhàn)術(shù)上采用保守策略,即派出少量兵力進行交戰(zhàn);隨著交戰(zhàn)的進行,αk的值變小,紅方在戰(zhàn)術(shù)上采用激進策略,即派出大量兵力進行交戰(zhàn),直至消滅藍方全部兵力。其更新公式為:αk=αk×0.5(初始值α1=2,也就是第一次交戰(zhàn)時的初始值,k為交戰(zhàn)次數(shù)),如第1次交戰(zhàn)時,α1=2,其值較大,紅方在戰(zhàn)術(shù)上采用保守策略;第6次交戰(zhàn)時,α6=0.062 5,其值較小,紅方在戰(zhàn)術(shù)上采用激進策略。
2) 在戰(zhàn)斗開始時,αk的值較小,紅方在戰(zhàn)術(shù)上采用激進策略,即派出大量兵力進行交戰(zhàn);隨著交戰(zhàn)的進行,αk的值變大,紅方在戰(zhàn)術(shù)上采用保守策略,即派出少量兵力進行交戰(zhàn)。其更新公式為:αk=0.3×k(k為交戰(zhàn)次數(shù)),如第1次交戰(zhàn)時,α1=0.3,其值較小,紅方在戰(zhàn)術(shù)上采用激進策略;第10次交戰(zhàn)時,α10=3,其值較大,紅方在戰(zhàn)術(shù)上采用保守策略。
使用分支定價法結(jié)合數(shù)據(jù)集1對兩組不同的超參數(shù)αk進行實驗測試(最大交戰(zhàn)次數(shù)設為25次)。圖2和圖3分別為分支定價法在兩組測試中紅方和藍方在每次交戰(zhàn)中的總兵力變化趨勢。如圖2所示,隨著交戰(zhàn)次數(shù)的增加,此時超參數(shù)αk逐漸減小,紅方逐漸采取激進策略對藍方進行打擊,即紅方逐漸派出大量兵力對藍方進行打擊,當進行至第4次交戰(zhàn)時,藍方兵力被全部消滅。故第一組測試實現(xiàn)了在戰(zhàn)斗開始時紅方采用保守策略對藍方進行打擊,隨著交戰(zhàn)的進行,紅方采用激進策略對藍方進行打擊。如圖3所示,隨著交戰(zhàn)次數(shù)的增加,此時超參數(shù)αk逐漸增大,紅方逐漸采取保守策略對藍方進行打擊,即紅方派出少量兵力對藍方進行打擊,如在第3次交戰(zhàn)以后,紅藍雙方的總兵力不在明顯變化,說明紅方采取保守策略,即派出少量兵力對藍方進行打擊。
圖2 每次交戰(zhàn)中紅藍兵力的變化趨勢(第一組)
圖3 每次交戰(zhàn)中紅藍兵力的變化趨勢(第二組)
為驗證所提出模型和算法的可行性,使用遺傳算法和分支定價法在數(shù)據(jù)集1和數(shù)據(jù)集2進行實驗測試(最大交戰(zhàn)次數(shù)設為25次,每種算法分別進行10次實驗)。實驗參數(shù)c1為1,c2為30。同時,通過第3.2節(jié)對超參數(shù)αk的測試,此處采用公式αk=αk×0.5(初始值α1=2)對超參數(shù)αk進行更新,即在戰(zhàn)斗開始時紅方在戰(zhàn)術(shù)上采用保守策略,隨著交戰(zhàn)次數(shù)增加,此時紅方在戰(zhàn)術(shù)上采用激進策略。數(shù)據(jù)集1測試結(jié)果說明:圖2和圖4分別為2種算法在每次交戰(zhàn)中紅藍雙方總兵力變化圖。
圖4 在每次交戰(zhàn)中紅藍兵力的變化趨勢(遺傳算法)
圖5—圖8分別為2種算法在每次交戰(zhàn)中藍方和紅方不同兵力的數(shù)量變化情況。數(shù)據(jù)集2測試結(jié)果說明:圖9和圖10分別為2種算法在每次交戰(zhàn)中紅藍雙方總兵力變化圖。圖11—圖14分別為2種算法在每次交戰(zhàn)中藍方和紅方不同兵力的數(shù)量變化情況。
圖5 在每次交戰(zhàn)中藍方兵力變化趨勢(遺傳算法)
數(shù)據(jù)集1的結(jié)果分析:如圖2和圖4所示,隨著交戰(zhàn)次數(shù)增加,雙方的總兵力呈現(xiàn)遞減趨勢,這是因為交戰(zhàn)造成了兵力損失。在第4次交戰(zhàn)時,分支定價法和遺傳算法的藍方剩余總兵力均為0,且紅方兵力均有保留,驗證了模型的可行性,即最大化藍方損失,且最大程度減小藍方對紅方造成的損失。從紅方剩余總兵力來看,分支定價法為37,而遺傳算法為35,表明分支定價法的尋優(yōu)性能優(yōu)于遺傳算法。
如圖5和圖6所示,隨著雙方交戰(zhàn)次數(shù)的增加,權(quán)重系數(shù)較大的藍方兵力會被優(yōu)先打擊。如藍方BG4兵力的權(quán)重值最高,在接下來的交戰(zhàn)中,其會被優(yōu)先打擊,且分支定價法和遺傳算法在第4次戰(zhàn)斗中將其全部殲滅。同時,2種算法都成功將藍方兵力全部消滅。故模型得以驗證,即最大化藍方的損失、且最大程度減小藍方對紅方造成的損失,同時實現(xiàn)了優(yōu)先打擊權(quán)重系數(shù)較大的藍方兵力。從圖7和圖8可以看出,遺傳算法的紅方剩余總兵力比分支定價法少,故分支定價法的尋優(yōu)性能優(yōu)于遺傳算法。
圖6 在每次交戰(zhàn)中藍方兵力變化趨勢(分支定價法)
圖7 在每次交戰(zhàn)中紅方兵力變化趨勢(遺傳算法)
圖8 在每次交戰(zhàn)中紅方兵力變化趨勢(分支定價法)
數(shù)據(jù)集2的結(jié)果分析:如圖9和圖10所示,隨著紅藍雙方的交戰(zhàn)次數(shù)增加,雙方的總兵力呈現(xiàn)遞減趨勢。其中,圖10中的分支定價法在第22次交戰(zhàn)時,藍方剩余總兵力為0,且紅方剩余總兵力為73,驗證了數(shù)學模型的可行性,即最大化藍方損失,且最大程度減小藍方對紅方造成的損失。相反,圖9中的遺傳算法在第12次交戰(zhàn)以后,紅藍總兵力均沒有顯著變化,說明遺傳算法陷入了局部最優(yōu),并未實現(xiàn)最大化藍方損失和最大程度減小藍方對紅方造成的損失,體現(xiàn)了分支定價法更加優(yōu)越的尋優(yōu)性能。
圖9 在每次交戰(zhàn)中紅藍兵力的變化趨勢(遺傳算法)
圖10 在每次交戰(zhàn)中紅藍兵力的變化趨勢(分支定價法)
如圖11和圖12所示,隨著雙方交戰(zhàn)次數(shù)的增加,權(quán)重系數(shù)較大的藍方兵力將被優(yōu)先打擊。如藍方BG4兵力的權(quán)重值最高,在接下來的戰(zhàn)斗中,BG4兵力會被優(yōu)先打擊,分支定價法在第15次交戰(zhàn)時將BG4兵力全部殲滅,且將所有藍方兵力消滅。相反,遺傳算法在最大交戰(zhàn)次數(shù)結(jié)束以后未完成對權(quán)重系數(shù)最高的藍方BG4兵力全部殲滅,且藍方仍有殘余的兵力。因此,分支定價法求解所提出模型的合理性和優(yōu)越性得以驗證,即最大化藍方的損失、且最大程度減小藍方對紅方造成的損失,同時實現(xiàn)了優(yōu)先打擊權(quán)重系數(shù)較大的藍方兵力,而遺傳算法的優(yōu)化效果不如分支定價法。同時,從圖13和圖14可以看出,雖然遺傳算法的紅方剩余總兵力比分支定價法多,但其尋優(yōu)性能和打擊效果都低于分支定價法。
圖11 在每次交戰(zhàn)中藍方兵力變化趨勢(遺傳算法)
圖12 在每次交戰(zhàn)中藍方兵力變化趨勢(分支定價法)
圖13 每次交戰(zhàn)中紅方兵力變化趨勢(遺傳算法)
圖14 在每次交戰(zhàn)中紅方兵力變化趨勢(分支定價法)
綜上所述,本文中所提出的數(shù)學模型在小規(guī)模數(shù)據(jù)集1和大規(guī)模數(shù)據(jù)集2中都得到了有效驗證。同時,在交戰(zhàn)結(jié)束以后,綜合紅藍雙方的剩余總兵力和不同類型兵力的數(shù)量變化來看,分支定價法在尋優(yōu)性能和打擊效果上明顯優(yōu)于遺傳算法。該新穎的數(shù)學模型表現(xiàn)出了與傳統(tǒng)蘭徹斯特作戰(zhàn)模型的一致性,即最大化敵方損失的同時最小化自身的損失。
損失敏感程度的設置是一個重要創(chuàng)新點,其允許根據(jù)雙方力量對比,并進行最佳戰(zhàn)斗策略的選擇。具體損失敏感程度參數(shù)αk大小的確定,應與交戰(zhàn)前雙方兵力力量對比及殺傷力相關(guān)聯(lián)。紅方的初始總兵力越占優(yōu),越可以對損失不敏感,αk可設置為一個較小的值,此種情況下紅方實現(xiàn)以較少的交戰(zhàn)輪次消滅對方全部力量。相反,紅方的初始總兵力處于劣勢時,紅方對自身的損失敏感,αk可設置為一個較大的值,做到在盡力消耗藍方的同時保存自身實力。據(jù)此設計的方案如下:首先計算出紅方每種類型兵力對藍方兵力的殺傷力之和,并將殺傷力之和乘以相應類型的紅方初始兵力數(shù)量,記為紅方相應類型兵力的戰(zhàn)斗強度RWi;其次,計算出藍方每種類型兵力對紅方兵力的殺傷力之和,并將殺傷力之和乘以相應類型的藍方初始兵力數(shù)量,記為藍方相應類型兵力的戰(zhàn)斗強度BWj。則初始值α1的計算公式如下所示:
本節(jié)將數(shù)據(jù)集2中的紅方總兵力減少(紅方總兵力為540,藍方總兵力為570),記為數(shù)據(jù)集3,見表7。為形成實驗對比,使用分支定價法在數(shù)據(jù)集2和數(shù)據(jù)集3上進行實驗測試。如圖15所示,當紅方總兵力優(yōu)于藍方總兵力時,在第28次交戰(zhàn)結(jié)束以后,藍方剩余總兵力為0,紅方剩余總兵力為55,即實現(xiàn)了最大化藍方損失和最大程度減小了藍方對紅方造成的損失。驗證了紅方總兵力明顯占優(yōu)時,可以對損失不敏感,從而可以每次派出更強的戰(zhàn)力并以較少的交戰(zhàn)輪次消滅藍方全部力量。如圖16所示,當紅方總兵力少于藍方總兵力時,在第42次交戰(zhàn)以后,藍方剩余總兵力為0,紅方剩余總兵力為36。從而驗證了紅方總兵力處于劣勢時,紅方的損失敏感程度越低,做到了在成功消耗藍方的同時保存了自身實力。
表7 紅藍雙方的兵力類型、數(shù)量及權(quán)重
圖15 分支定價法在數(shù)據(jù)集2中的結(jié)果
圖16 分支定價法在數(shù)據(jù)集3中的結(jié)果
通過測試分析,當紅方總兵力明顯占優(yōu)時,紅方可以派出更強的力量去擊敗藍方;而當紅方總兵力處于劣勢時,紅方可以在消耗藍方力量的同時保存自身實力。因此,該數(shù)學模型能夠根據(jù)實際情況制定靈活的作戰(zhàn)策略,提高作戰(zhàn)效能,且體現(xiàn)出了與傳統(tǒng)蘭徹斯特作戰(zhàn)模型的一致性。
為進一步驗證數(shù)學模型的可行性,引入了傳統(tǒng)模型進行對比分析,此處使用引言中戰(zhàn)爭模擬模型的第二類策略,即集中全部力量去打敗敵方,但僅考慮最大化敵方損失,而不考慮自身損失。同時,使用分支定價法結(jié)合數(shù)據(jù)集2求解傳統(tǒng)模型。傳統(tǒng)模型的目標函數(shù)可描述為:紅方集中兵力去打擊藍方,僅考慮最大化藍方損失,不考慮自身損失。其數(shù)學模型如下:
如圖17所示,在交戰(zhàn)結(jié)束后,傳統(tǒng)模型中藍方剩余總兵力為9,并未實現(xiàn)最大化藍方損失,且紅方剩余總兵力為60,而圖10中紅方剩余總兵力73,這是因為傳統(tǒng)模型僅考慮最大化藍方損失,而未考慮自身損失。從測試結(jié)果來看,所提出的數(shù)學模型實現(xiàn)了最大化藍方損失,且最大程度減小了藍方對紅方造成的損失,進一步體現(xiàn)了所提出的數(shù)學模型與傳統(tǒng)蘭徹斯特作戰(zhàn)模型的一致性,且驗證了其優(yōu)于傳統(tǒng)模型。
圖17 傳統(tǒng)模型中紅藍兵力的變化趨勢
根據(jù)合成火力分配的特點,針對性地提出了一種新的回合制對抗策略及博弈模型。其具有如下顯著優(yōu)點:① 在每一回合交戰(zhàn)中,通過合理的火力分配,實現(xiàn)了最大化藍方損失,且最小化紅方損失;② 通過設置合理的權(quán)重系數(shù),實現(xiàn)了對藍方重要兵力的優(yōu)先打擊和對紅方重要兵力的優(yōu)先保護;③ 首次引入了“損失敏感程度”的概念,并設計了相應的超參數(shù)衡量方案,其更好地反映了紅方在戰(zhàn)斗中對自身的損失敏感程度;④ 針對性地設計了一種分支定價法來求解博弈模型。實驗結(jié)果表明,基于多個數(shù)據(jù)集的實驗驗證了所提出的數(shù)學模型和分支定價法的有效性,且該數(shù)學模型表現(xiàn)出了與傳統(tǒng)蘭徹斯特作戰(zhàn)模型的一致性。實驗還表明了該數(shù)學模型優(yōu)于傳統(tǒng)模型。此外,該數(shù)學模型還具備基于紅藍雙方力量分析進行對策優(yōu)化的能力,因此在實際應用中具有審時度勢的決策靈活性的優(yōu)勢。