王曉光,雷曉犇,杜 軍,王小平,馬彩東,姚 欣
(1.空軍工程大學(xué)航空工程學(xué)院,西安 710038;2.西北工業(yè)大學(xué)自動(dòng)化學(xué)院,西安 710072;3.陜西師范大學(xué)大興新區(qū)小學(xué),西安 710016)
隨著無(wú)人機(jī)相關(guān)技術(shù)的逐漸發(fā)展成熟,無(wú)人機(jī)在現(xiàn)代戰(zhàn)場(chǎng)上出現(xiàn)的頻率越來(lái)越高。近年來(lái),無(wú)人機(jī)已成功地用于各種對(duì)地攻擊任務(wù)。在可預(yù)見(jiàn)的未來(lái),無(wú)人機(jī)將應(yīng)用于直接對(duì)空作戰(zhàn)。因此,國(guó)內(nèi)外相關(guān)研究人員開(kāi)展了大量無(wú)人機(jī)空戰(zhàn)決策方面的相關(guān)研究。
一些研究人員對(duì)空戰(zhàn)戰(zhàn)術(shù)機(jī)動(dòng)中的作戰(zhàn)決策問(wèn)題展開(kāi)研究。Dong 采用試驗(yàn)輸入法(trial input method)對(duì)空戰(zhàn)中飛機(jī)的自主決策問(wèn)題進(jìn)行了研究,并用該方法完成了對(duì)飛機(jī)狀態(tài)的預(yù)測(cè)。McGrew用近似動(dòng)態(tài)規(guī)劃方法研究了一對(duì)一空戰(zhàn)中的實(shí)時(shí)機(jī)動(dòng)決策問(wèn)題,完成了最優(yōu)空戰(zhàn)策略的有效逼近,并且通過(guò)作戰(zhàn)仿真驗(yàn)證了算法在各種攻守態(tài)勢(shì)下的魯棒性。Goodrich 提出了一種被稱為戰(zhàn)術(shù)機(jī)動(dòng)仿真(tactical maneuvering simulator,TMS)的批量空戰(zhàn)仿真環(huán)境,TMS 可以用來(lái)評(píng)估和修正空戰(zhàn)決策邏輯,在這種方法中,Goodrich 結(jié)合飛機(jī)的六自由度方程、控制律、氣動(dòng)特性和推力特性來(lái)獲得高逼真度的空戰(zhàn)仿真。
一些研究人員則開(kāi)展了多機(jī)協(xié)同空戰(zhàn)中的空戰(zhàn)決策問(wèn)題研究。這些研究的大體思路分為兩步:首先對(duì)多機(jī)協(xié)同的空戰(zhàn)態(tài)勢(shì)進(jìn)行評(píng)估,然后根據(jù)態(tài)勢(shì)評(píng)估結(jié)果,采用啟發(fā)式算法進(jìn)行火力協(xié)同優(yōu)化分配。在這些研究結(jié)果中,王曉光等人用兩步裁定法來(lái)模擬空戰(zhàn)雙方的相互攻擊,實(shí)現(xiàn)超視距空戰(zhàn)中的損耗裁定。為了減少空戰(zhàn)中的冗余信息,滿足實(shí)時(shí)作戰(zhàn)決策的要求,Gao 將粗糙集理論引入到協(xié)同空戰(zhàn)火力分配決策分析中。
以上研究都是基于作戰(zhàn)信息完全已知的假設(shè)。然而,在實(shí)際作戰(zhàn)中由于敵方的刻意干擾和作戰(zhàn)環(huán)境未知等原因,戰(zhàn)場(chǎng)上總是不可避免地存在不確定因素,從而導(dǎo)致空戰(zhàn)決策所需的各種信息并不被完全掌握。因此,為貼近實(shí)際作戰(zhàn)需求,有必要對(duì)不確定條件下的無(wú)人機(jī)空戰(zhàn)決策問(wèn)題展開(kāi)研究。文獻(xiàn)[10]探討了空戰(zhàn)中敵方誘餌干擾所造成的不確定性,并給出了一對(duì)一攻擊策略。文獻(xiàn)[11]研究了紅外干擾條件下飛機(jī)命中概率的計(jì)算方法。文獻(xiàn)[12-14]分析了假目標(biāo)影響下的無(wú)人機(jī)對(duì)地攻擊作戰(zhàn)決策問(wèn)題。
在上述不確定條件下的作戰(zhàn)決策問(wèn)題研究中,研究對(duì)象大多為一架或多架飛機(jī)。對(duì)于幾十架甚至數(shù)百架飛機(jī)來(lái)說(shuō),這些方法會(huì)導(dǎo)致異常復(fù)雜的計(jì)算。因此,對(duì)于大規(guī)??諔?zhàn)問(wèn)題而言,往往采用系統(tǒng)方法來(lái)進(jìn)行作戰(zhàn)決策問(wèn)題研究,而蘭徹斯特方程法正是系統(tǒng)描述作戰(zhàn)過(guò)程的一種典型方法,其廣泛應(yīng)用于集群作戰(zhàn)問(wèn)題研究中。文獻(xiàn)[15-16]采用蘭徹斯特方程對(duì)大規(guī)??諔?zhàn)的效能和成本效益進(jìn)行了分析,但未給出最優(yōu)攻擊策略。文獻(xiàn)[17]研究了數(shù)據(jù)鏈路支持下飛機(jī)的作戰(zhàn)效能問(wèn)題,并以此為基礎(chǔ)進(jìn)行了航空作戰(zhàn)進(jìn)程預(yù)測(cè)。
本文對(duì)誘餌干擾下無(wú)人機(jī)集群空戰(zhàn)的攻擊閾值控制問(wèn)題展開(kāi)研究。首先,結(jié)合無(wú)人機(jī)機(jī)載傳感器的探測(cè)性能,利用蘭徹斯特方程建立無(wú)人機(jī)空戰(zhàn)模型;然后,在彈藥約束下,將攻擊閾值控制問(wèn)題轉(zhuǎn)化為最優(yōu)控制問(wèn)題;最后,利用直接凸優(yōu)化法求解最優(yōu)控制問(wèn)題,以獲得最優(yōu)攻擊閾值控制策略。
空戰(zhàn)想定如下:空戰(zhàn)雙方分別為紅方和藍(lán)方,當(dāng)雙方在空中相遇時(shí),藍(lán)方無(wú)人機(jī)立即發(fā)射誘餌,以干擾紅方無(wú)人機(jī)的攻擊決策。因此,紅方無(wú)人機(jī)在開(kāi)始攻擊之前,首先需要利用機(jī)載傳感器信息來(lái)識(shí)別該目標(biāo)是否為藍(lán)方無(wú)人機(jī)。由于誘餌很難完全模仿無(wú)人機(jī)目標(biāo)特性,所以對(duì)于紅方無(wú)人機(jī)來(lái)說(shuō)目標(biāo)不是不可分辨的。
如果紅方的一架無(wú)人機(jī)遇到一個(gè)藍(lán)方目標(biāo),一共會(huì)產(chǎn)生以下4 種結(jié)果:
1)遇到真目標(biāo)(無(wú)人機(jī)),并且傳感器正確識(shí)別,其概率為P;
2)遇到真目標(biāo),但傳感器錯(cuò)誤識(shí)別為假目標(biāo)(誘餌),其概率為1-P;
3)遇到假目標(biāo),并且傳感器正確識(shí)別,其概率為P;
4)遇到假目標(biāo),但傳感器錯(cuò)誤識(shí)別為真目標(biāo),其概率為1-P;
概率P和P兩者并不獨(dú)立,其關(guān)系為:
求解非線性最優(yōu)控制的方法可分為兩大類:間接法和直接法。間接法利用變分法來(lái)求解非線性最優(yōu)控制問(wèn)題,求解過(guò)程中不可避免地要解決兩點(diǎn)邊值問(wèn)題,這將導(dǎo)致復(fù)雜的運(yùn)算。直接法則將非線性最優(yōu)控制問(wèn)題轉(zhuǎn)化為非線性規(guī)劃問(wèn)題,然后再進(jìn)行求解,隨著計(jì)算機(jī)技術(shù)的發(fā)展,直接法成為求解非線性最優(yōu)控制問(wèn)題的主流方法。直接凸優(yōu)化法是直接法的一種,因其局部最優(yōu)解與全局最優(yōu)解的一致性而受到廣泛的關(guān)注,同時(shí)直接凸優(yōu)化法具有求解計(jì)算速度較快、全局收斂性好的特點(diǎn),因此,可以采用此方法求解建模得到的最優(yōu)控制問(wèn)題。
表1 作戰(zhàn)雙方的參數(shù)設(shè)置
作戰(zhàn)雙方兵力變化情況如圖2 所示。
圖2 紅藍(lán)雙方的兵力隨時(shí)間變化情況
如圖1 和圖2 所示,整個(gè)戰(zhàn)斗過(guò)程可以分為兩個(gè)階段。在第1 階段,藍(lán)方擁有大量的無(wú)人機(jī)和誘餌。對(duì)于紅方來(lái)說(shuō),此時(shí)很難從大量的目標(biāo)中識(shí)別出藍(lán)方的無(wú)人機(jī),這時(shí)紅方集群的最優(yōu)策略是攻擊遇到的每一個(gè)藍(lán)方目標(biāo),從而使藍(lán)方的無(wú)人機(jī)和誘餌數(shù)量迅速減少;在戰(zhàn)斗的第2 階段,藍(lán)方的兵力損耗已經(jīng)達(dá)到一定程度,此時(shí),紅方無(wú)人機(jī)開(kāi)始逐漸降低攻擊閾值,從而盡可能地將導(dǎo)彈用于殺傷藍(lán)方的無(wú)人機(jī)。在此階段,藍(lán)方的無(wú)人機(jī)數(shù)量持續(xù)減少,但藍(lán)方的誘餌數(shù)量變化緩慢,說(shuō)明此時(shí)紅方的攻擊閾值控制策略能夠保證對(duì)藍(lán)方無(wú)人機(jī)的有效殺傷,并能夠在一定程度上有效避免對(duì)藍(lán)方誘餌的殺傷。同時(shí)隨著紅藍(lán)雙方兵力的損耗和紅方攻擊閾值的逐漸降低,紅藍(lán)雙方的兵力變化速度逐漸降低。
圖1 紅方的最優(yōu)攻擊閾值控制策略曲線
在空戰(zhàn)過(guò)程中,傳感器性能參數(shù)c 對(duì)作戰(zhàn)結(jié)果的影響如表2 所示。
表2 傳感器性能參數(shù)對(duì)作戰(zhàn)結(jié)果的影響
本文對(duì)誘餌干擾下無(wú)人機(jī)集群作戰(zhàn)中的攻擊閾值控制問(wèn)題展開(kāi)研究,主要工作以及得到的結(jié)論如下:
1)建立了誘餌干擾下無(wú)人機(jī)作戰(zhàn)模型。以無(wú)人機(jī)的機(jī)載傳感器性能分析為基礎(chǔ),得到真目標(biāo)與假目標(biāo)識(shí)別概率之間的關(guān)系。并以此為基礎(chǔ),建立誘餌干擾下無(wú)人機(jī)集群空戰(zhàn)的蘭徹斯特方程。
2)將無(wú)人機(jī)集群作戰(zhàn)中的攻擊閾值控制問(wèn)題轉(zhuǎn)化成為最優(yōu)控制問(wèn)題。首先,給出彈藥約束條件下作戰(zhàn)雙方的兵力損耗約束;然后,建立了無(wú)人機(jī)集群作戰(zhàn)的最優(yōu)控制模型,并且證明了一方兵力的最大化等價(jià)于另一方兵力的最小化。
3)得到了誘餌干擾下紅方無(wú)人機(jī)集群的最優(yōu)攻擊閾值控制策略。仿真結(jié)果表明,紅方無(wú)人機(jī)集群的最優(yōu)攻擊閾值控制策略是在開(kāi)始時(shí)攻擊每一個(gè)藍(lán)方目標(biāo),待藍(lán)方的兵力損耗達(dá)到一定程度時(shí),紅方無(wú)人機(jī)集群應(yīng)逐漸降低攻擊閾值,從而盡可能地將火力集中在藍(lán)方的無(wú)人機(jī)上,完成對(duì)藍(lán)方無(wú)人機(jī)的最大殺傷。
4)探討了傳感器性能參數(shù)c 對(duì)作戰(zhàn)結(jié)果的影響。仿真結(jié)果表明,c 值越大,對(duì)應(yīng)紅方無(wú)人機(jī)集群的作戰(zhàn)效果越好。同時(shí),隨著c 的增加,作戰(zhàn)結(jié)果對(duì)其變化敏感程度下降。